摘要:今日,在第届神经信息处理系统大会中,百度首席科学家吴恩达教授发表演讲利用深度学习开发人工智能应用的基本要点。为了方便读者学习和收藏,雷锋网特地把吴恩达教授的做为中文版。吴恩达先讲述了常见的深度学习模型,然后再着分析端到端学习的具体应用。
今日,在第 30 届神经信息处理系统大会(NIPS 2016)中,百度首席科学家吴恩达教授发表演讲:《利用深度学习开发人工智能应用的基本要点(Nuts and Bolts of Building Applications using Deep Learning)》。
为了方便读者学习和收藏,雷锋网特地把吴恩达教授的PPT 做为中文版。
此外,吴恩达教授曾在今年 9 月 24/25 日也发表过同为《Nuts and Bolts of Applying Deep Learning》的演讲(1小时20分钟),以下是 YouTube 链接:
https://www.youtube.com/watch?v=F1ka6a13S9I
一、深度学习为何崛起
吴恩达在开场提到:深度学习为何这么火?
答案很简单:
第一是因为规模正在推动深度学习的进步。
从传统算法到小型神经网络、中型神经网络最后演化为现在的大型神经网络。
第二:端到端学习的崛起
从下图中的上半部分可以看出,传统端到端学习是把实体数据表达成数字数据,输出数字值作为结果。如退昂识别最后以整数标签输出为结果。
而现在的端对端学习更为直接纯粹,如机器翻译:输入英语文本,输出法语文本;语音识别:输入音频,输出文本。但端对端学习需要大量的训练集。
吴恩达先讲述了常见的深度学习模型,然后再着分析端到端学习的具体应用。
二、主要的深度学习模型
普通神经网络
顺序模型 (1D 顺序) RNN, GRU, LSTM, CTC, 注意力模型
图像模型 2D 和 3D 卷积神经网络
先进/未来 技术:无监督学习(稀疏编码 ICA, SFA,)增强学习
三、端到端学习应用案例:
语音识别
传统模型:语音→运算特征—(人工设计的 MFCC 特征)→音素识别器—(音素识别)→最终识别器→输出。
端到端学习:音频→学习算法→转录结果;在给定了足够的有标注数据(音频、转录结果)时,这种方法的效果会很好。
自动驾驶
传统模型:摄像头图像→检测汽车+检测行人→路径规划→方向控制。
端到端学习:摄像头图像→学习算法→方向控制。
自动驾驶对安全有极高要求,因此需要极高的较精确度。采取纯粹的端到端学习十分有挑战性。只在有足够(x,y)的数据,来学习足够复杂的函数的情况下,端到端学习才有效果。
四、机器学习策略
你经常有很多改进 AI 系统的主意,应该怎么做?好的战略能避免浪费数月精力做无用的事。
以语音识别为例,可以把原语音数据分割成:
60% 训练集(训练模型)
20% 开发集(开发过程中用于调参、验证等步骤的数据集)
20% 测试集(测试时所使用的数据集)
这里面普及几个概念:
人类水平的误差与训练集的误差之间的差距是可避免的偏差,这部分误差可以通过进一步的学习/模型调整优化来避免。
训练集和开发集之间的差距称为方差,其因为跑了不同的数据从而导致误差率变化。
上述两种偏差合在一起,就是偏差-方差权衡(bias-variance trade-off)。
机器学习的基本方案
自动数据合成示例
不同训练、测试集的分布
假设你想要为一个汽车后视镜产品,开发语音识别系统。你有 5000 小时的普通语音数据,还有 10 小时的车内数据。你怎么对数据分组呢?这是一个不恰当的方式:
不同训练和测试集分配
更好的方式:让开发和测试集来自同样的分配机制。
五、机器学习新方案
普通人类、偏差、方差分析
人类的表现水平
当机器学习在处理某项任务上比人类表现还差时,你经常会看到最快的进步。
机器学习超越人后,很快就会靠近贝叶斯最优误差线。
可以依靠人类的直觉:(i)人类提供加标签的数据。(ii)进行错误分析,来理解人是怎么对样本正确处理的(iii)预估偏差/方差。比如,一项图像识别任务的训练误差 8%, 开发误差 10%,你应该怎么处理?
六、人工智能产品管理
新的监督DL算法的存在,意味着对使用 DL开发应用的团队合作,我们在重新思考工作流程。产品经理能帮助 AI 团队,优先进行最出成果的机器学习任务。比如,对于汽车噪音、咖啡馆的谈话声、低带宽音频、带口音的语音,你是应该提高语音效果呢,还是改善延迟,缩小二进制,还是做别的什么?
今天的人工智能能做什么呢?这里给产品经理一些启发:
如果一个普通人完成一项智力任务只需不到一秒的思考时间,我们很可能现在,或者不远的将来,用 AI 把该任务自动化。
对于我们观察到的具体的、重复性的事件(比如用户点击广告;快递花费的时间),我们可以合理地预测下一个事件的结果(用户是否点击下一个此类广告)。
产品经理和研究员、工程师该如何分工
欢迎加入本站公开兴趣群商业智能与数据分析群
兴趣范围包括各种让数据产生价值的办法,实际应用案例分享与讨论,分析工具,ETL工具,数据仓库,数据挖掘工具,报表系统等全方位知识
QQ群:81035754
文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。
转载请注明本文地址:https://www.ucloud.cn/yun/4425.html
摘要:是你学习从入门到专家必备的学习路线和优质学习资源。的数学基础最主要是高等数学线性代数概率论与数理统计三门课程,这三门课程是本科必修的。其作为机器学习的入门和进阶资料非常适合。书籍介绍深度学习通常又被称为花书,深度学习领域最经典的畅销书。 showImg(https://segmentfault.com/img/remote/1460000019011569); 【导读】本文由知名开源平...
摘要:值得一提的是每篇文章都是我用心整理的,编者一贯坚持使用通俗形象的语言给我的读者朋友们讲解机器学习深度学习的各个知识点。今天,红色石头特此将以前所有的原创文章整理出来,组成一个比较合理完整的机器学习深度学习的学习路线图,希望能够帮助到大家。 一年多来,公众号【AI有道】已经发布了 140+ 的原创文章了。内容涉及林轩田机器学习课程笔记、吴恩达 deeplearning.ai 课程笔记、机...
摘要:在最近的会议上,吴恩达分享了关于深度学习的一些看法。深度学习较大的优势在于它的规模,从吴恩达总结的下图可以看出当数据量增加时,深度学习模型性能更好。深度学习模型如此强大的另一个原因,是端到端的学习方式。然而,深度学习却使它有了一点变化。 在最近的 NIPS 2016 会议上,吴恩达分享了关于深度学习的一些看法。我们在此做一个整理。 深度学习较大的优势在于它的规模,从吴恩达总结的下图可以看出:...
摘要:的研究兴趣涵盖大多数深度学习主题,特别是生成模型以及机器学习的安全和隐私。与以及教授一起造就了年始的深度学习复兴。目前他是仅存的几个仍然全身心投入在学术界的深度学习教授之一。 Andrej Karpathy特斯拉 AI 主管Andrej Karpathy 拥有斯坦福大学计算机视觉博士学位,读博期间师从现任 Google AI 首席科学家李飞飞,研究卷积神经网络在计算机视觉、自然语言处理上的应...
摘要:年月在主办的的演讲,谈数据科学家需要知道的深度学习知识。当时还演示了机器看图说话,机器问答,,的效果。其中就是个,能实时对人脸做建模,替换其他的鬼脸,他开玩笑说赶在万圣节之前上线,以后都不要买道具,一秒变鬼畜。 2015年12月 Andrew Ng在Import IO主办的ExtractConf的演讲,谈数据科学家需要知道的深度学习知识。当时还演示了机器看图说话,机器问答,Dulight,F...
阅读 2814·2021-10-13 09:48
阅读 3775·2021-10-13 09:39
阅读 3584·2021-09-22 16:04
阅读 1815·2021-09-03 10:48
阅读 837·2021-08-03 14:04
阅读 2357·2019-08-29 15:18
阅读 3399·2019-08-26 12:19
阅读 2868·2019-08-26 12:08