炼数成金 商业智能
订阅

商业智能

AutoML-调参迈入蒸汽时代
AutoML-调参迈入蒸汽时代
抽象,再抽象。 AutoML体验有感。抽象这个词我真的是越来越喜欢了。小时候把看不懂的文字或者画叫抽象,虽然那些东西我现在依然不懂,但是现在对于抽象这两个字多少有点认识。本科的时候老师说“数学是自然科学的抽 ...
分类:   
人工智能与人类智能的竞赛:人机对抗智能技术全梳理
人工智能与人类智能的竞赛:人机对抗智能技术全梳理
人工智能从诞生之始就以对抗人类智能为衡量准则(著名的图灵测试) 。作为人工智能研究的前沿方向,人机对抗技术一直是国内外人工智能研究的热点,以人机对抗为主要形式的人工智能研究为探寻机器智能的内在生长机制和关 ...
分类:   
周志华:Boosting学习理论的探索 —— 一个跨越30年的故事
周志华:Boosting学习理论的探索 —— 一个跨越30年的故事
AdaBoost的算法流程非常简单,用夏柏尔自己的话说,它仅需“十来行代码(just 10 lines of code)”。但这个算法非常有效,并且经修改推广能应用于诸多类型的任务。例如,在人脸识别领域被誉为“第一个实时人脸检测器 ...
分类:   
ResNet最强改进版来了!ResNeSt:Split-Attention Networks
ResNet最强改进版来了!ResNeSt:Split-Attention Networks
ResNeSt 的全称是:Split-Attention Networks,也就是特别引入了Split-Attention模块。如果没有猜错,ResNeSt 的 S 应该就是 Split。GoogleNet 采用了Multi-path机制,其中每个网络块均由不同的卷积kernels组成。Res ...
分类:   
超全!19 种损失函数,你能认识几个?
超全!19 种损失函数,你能认识几个?
当训练有 C 个类别的分类问题时很有效. 可选参数 weight 必须是一个1维 Tensor, 权重将被分配给各个类别. 对于不平衡的训练集非常有效。在多分类任务中,经常采用 softmax 激活函数+交叉熵损失函数,因为交叉熵描述 ...
分类:   
关于人工智能在数据质量管理中的应用
关于人工智能在数据质量管理中的应用
说实在的,人工智能这个概念有些过于高大上,从大的方面包括深度学习、机器学习、强化学习等等,而深度学习又包括图像识别、语音识别、自然语言处理、预测分析;机器学习则包括监督学习、无监督学习、半监督学习,监 ...
分类:   
计算所山世光:AI方法论需升级,疫后 AI 将如何发展?
计算所山世光:AI方法论需升级,疫后 AI 将如何发展?
曾被誉为人工智能的三驾马车——算法、算力、数据,到了需要反思的时刻。特别是深度学习在学术前沿的后续发展乏力,恐难支撑AI能力继续升级。步入新的十年后,如今 AI 可能已经到了一个拐点时刻。那么接下来,AI 技 ...
分类:   
LSTM 为何如此有效?这五个秘密是你要知道的
LSTM 为何如此有效?这五个秘密是你要知道的
长短期记忆网络(LSTM),作为一种改进之后的循环神经网络,不仅能够解决 RNN无法处理长距离的依赖的问题,还能够解决神经网络中常见的梯度爆炸或梯度消失等问题,在处理序列数据方面非常有效。有效背后的根本原因有 ...
分类:   
AU R-CNN: Encoding Expert Prior Knowledge into R-CNN for action unit detection
AU R-CNN: Encoding Expert Prior Knowledge into R-CNN for action unit detection
FACS(Facial Action Coding System)是人脸国际标准组织定义的44种人脸运动单元(AU),这些运动单元可以组合表示人脸表情所有可能的表情(包含皱眉,抿嘴等),AU是组成人脸表情的基石。本论文中所谓的人脸AU检测的任 ...
分类:   
记“渣硕”的一篇SCI写作历程(SLAM方向)
记“渣硕”的一篇SCI写作历程(SLAM方向)
SLAM是强实战的交叉学科,在SLAM知识星球经常收到很多同学的提问,大家对于发表SLAM方向的论文一脸懵逼,在论文、项目和就业三座大山下鸭梨山大。幼时好清净,常闷家门里,却有学者梦,附庸风雅也,叶公好龙罢,总是 ...
分类:   
LDA主题模型 | 原理详解与代码实战
LDA主题模型 | 原理详解与代码实战
在机器学习领域,关于LDA有两种含义,一是「线性判别分析(Linear Discriminant Analysis)」,是一种经典的降维学习方法;一是本文要讲的「隐含狄利克雷分布(Latent Dirichlet Allocation)」,是一种概率主题模型 ...
分类:   
剑桥量子自然语言处理实验记录
剑桥量子自然语言处理实验记录
剑桥量子计算执行世界上第一个量子自然语言处理实验:剑桥量子计算公司(CQC)宣布,他们已使用自然语言的“本机量子”结构,通过将语法语句翻译成量子电路,然后在量子计算机上实现所得程序,并实际执行问题解答, ...
分类:   
使用大batch优化深度学习:训练BERT仅需76分钟
使用大batch优化深度学习:训练BERT仅需76分钟
在海量数据集上训练大型深度神经网络,是非常具有挑战性的。最近,有许多研究均使用大batch随机优化方法来解决此问题。在该研究领域中,目前最杰出的算法是LARS,它通过采用分层自适应学习率,可以在几分钟内在Image ...
分类:   
PyTorch trick 集锦
PyTorch trick 集锦
Keras有一个简洁的API来查看模型的每一层输出尺寸,这在调试网络时非常有用。现在在PyTorch中也可以实现这个功能。在PyTorch中使用交叉熵损失函数的时候会自动把label转化成onehot,所以不用手动转化,而使用MSE需要 ...
分类:   
NLP的12种后BERT预训练方法
NLP的12种后BERT预训练方法
使用NLP的工具来识别短语和实体,包括3种层级的Masking:基本、phrase和entity。依次对基于基本级别、短语级别、实体级别分别进行mask训练。对于对话数据,还训练了Dialogue LM。使用Q和R标记query和response。
分类:   
NLP,吹爆与落地
NLP,吹爆与落地
机器翻译。可以用独立的方式提供服务,比如提供在线实时多语种的翻译功能。比如翻译专用的硬件产品。对话系统。智能客服,对话机器人(用软的方式呈现能力),智能音箱类(用硬的方式呈现能力)。但是,你真的需要一 ...
分类:   
挑战 11 种 GAN的图像真伪,DeepFake鉴别一点都不难
挑战 11 种 GAN的图像真伪,DeepFake鉴别一点都不难
近年来,图像合成技术日趋进步,GAN在给我们带来艺术体验的同时也埋下了很多隐患。Deepfake(AI换脸)技术让很多事情的真实性变得扑朔迷离,甚至会产生极大的政治影响。比如加蓬共和国总统的一段录像被反对派声称是 ...
分类:   
全国180所高校成功申报人工智能专业 教育部公布名单(2020年)
全国180所高校成功申报人工智能专业 教育部公布名单(2020年)
近日,根据《普通高等学校本科专业设置管理规定》(教高〔2012〕9号),教育部组织开展了2019年度普通高等学校本科专业设置和调整工作。经申报、公示、审核等程序,根据普通高等学校专业设置与教学指导委员会评议结 ...
分类:   
全国249所高校成功申报机器人工程专业 教育部公布名单(2020年)
全国249所高校成功申报机器人工程专业 教育部公布名单(2020年)
近日,根据《教育部关于公布2019年度普通高等学校本科专业备案和审批结果的通知》,2019年全国62所高校获批“机器人工程”专业,专业代码080803T,专业修学四年,颁发工学学士学位。2018年101所高校获批“机器人工程 ...
分类:   
Manning大神牵头,斯坦福开源Python版NLP库Stanza:涵盖66种语言
Manning大神牵头,斯坦福开源Python版NLP库Stanza:涵盖66种语言
对于斯坦福 NLP 库,我们一定不会陌生,但是这一库主要基于 Java。近日,Christopher Manning 所在的斯坦福 NLP 组开源了 Python 版的工具包——Stanza,让 Python 生态系统又增添了一员 NLP 大将。我们都知道斯坦福 ...
分类:   
一个故事讲完CPU的工作原理
一个故事讲完CPU的工作原理
上二年级的小明正坐在教室里。现在是数学课,下午第一节,窗外的蝉鸣、缓缓旋转的吊扇让同学们昏昏欲睡。此时,刘老师在黑板上写下一个问题:6324 + 244675 = ?小明抬头看了一眼,觉得这两个数字挺眼熟。他昨天翘课 ...
分类:   
树莓派“听”咳嗽就能判断是否得新冠,便携式AI设备神预测大规模流行病
树莓派“听”咳嗽就能判断是否得新冠,便携式AI设备神预测大规模流行病
最近马萨诸塞州大学的研究人员发明了一个名叫 Flusense 的便携式设备,这个新的边缘计算设备可能会用于预测季节性流感和其他病毒性呼吸道疾病爆发(如 COVID-19大流行病或 SARS)的健康监测。根据设想,该平台将用于医 ...
分类:   
YouTube深度学习推荐模型最全总结
YouTube深度学习推荐模型最全总结
作为全球最大的视频分享网站,YouTube 平台中几乎所有的视频都来自 UGC(User-Generated Content),这样的内容产生模式有两个特点:(1)商业模式不同。国外的 Netflix 和国内的爱奇艺等流媒体,它们的大部分内容都 ...
分类:   
DRAM的架构历史和未来
DRAM的架构历史和未来
内存是计算机系统设计中的重要主题。在IMEC,我们为独立以及嵌入式应用程序开发了多种新兴的内存技术。包括用于高速缓存级应用的MRAM技术,改进DRAM设备的新方法,填补了DRAM和NAND技术之间空白的新兴存储器,用于改 ...
分类:   
新冠病毒A型血更易感,O型血风险较低:首个新冠血型感染研究发布
新冠病毒A型血更易感,O型血风险较低:首个新冠血型感染研究发布
结论:A型血患者更易感染,O型血相对风险较低。这就是国内8所科研机构联合完成的最新新冠病毒研究。既有南方科技大学、上海交大和华东师范等高校,也有深圳市第三人民医院(南方科技大学第二附属医院)、武汉市金银 ...
分类:   
传小米放弃应用芯片研发!造芯梦醒?最近两月密集投资8家公司
传小米放弃应用芯片研发!造芯梦醒?最近两月密集投资8家公司
据业内相关人士在社交平台上爆料,小米在松果电子自研芯片失败后,已经放弃了应用芯片(Application Processor,简称AP)的研发,转而通过研发技术门槛较低的蓝牙、射频芯片等元器件,以进一步扩大对自身产品的技术 ...
分类:   
关于自然语言处理系列-文本摘要提取进阶
关于自然语言处理系列-文本摘要提取进阶
关于自然语言处理重要的一个部分是文本摘要,文本摘要的提取涉及到分词、断句、文本权重问题;分词前文已述,断句通过正则表达式完成;文本权重又包括句子的tfidf权重、文本相似度权重和句子的位置权重;关于权重又 ...
分类:   
关于自然语言处理系列-基于gensim的简易聊天机器人
关于自然语言处理系列-基于gensim的简易聊天机器人
下载了一个微信聊天的语料库,大概11万条记录,采用问答方式,中间以“|”分割,用gensim做了个简单的检索聊天机器人,目前基本可用。还有个地方需要进一步优化,1万语料生成的模型库通过自动应答效率还可以,11万语 ...
分类:   
广告算法在阿里文娱用户增长中的实践
广告算法在阿里文娱用户增长中的实践
从2019年开始,优酷使用DSP在今日头条、阿里妈妈等平台投放视频广告,实现用户的稳定增长。我们将用户增长领域与广告竞价领域结合,借鉴推荐领域的实践,基于特有的业务背景,开发落地了一系列算法。在成本及预算可 ...
分类:   
二值神经网络(Binary Neural Networks)最新综述
二值神经网络(Binary Neural Networks)最新综述
神经网络二值化能够最大程度地降低模型的存储占用和模型的计算量,将神经网络中原本 32 位浮点数参数量化至 1 位定点数,降低了模型部署的存储资源消耗,同时极大加速了神经网络的推断过程。但二值化会不可避免地导 ...
分类:   

热门频道

  • 大数据
  • 商业智能
  • 量化投资
  • 科学探索
  • 创业

热门文章

     

    GMT+8, 2020-10-29 06:30 , Processed in 0.171463 second(s), 19 queries .