ICML 2015压轴讨论总结：6大神畅谈深度学习的未来

netScorpion 发布于2019-04-25 18:01 / 3230人阅读

摘要：年的深度学习研讨会，压轴大戏是关于深度学习未来的讨论。他认为，有潜力成为深度学习的下一个重点。认为这样的人工智能恐惧和奇点的讨论是一个巨大的牵引。

2015年ICML的深度学习研讨会，压轴大戏是关于深度学习未来的讨论。基于平衡考虑，组织方分别邀请了来自工业界和学术界的六位专家开展这次圆桌讨论。组织者之一Kyunghyun Cho（Bengio的博士后）在飞机上凭记忆写下本文总结了讨论的内容，他谨慎地表示一些转述不够准确，欢迎大家评论补充。但这篇总结仍然不失借鉴意义。

六位专家包括：Yoshua Bengio（蒙特利尔大学），Neil Lawrence（谢菲尔德大学），Juergen Schmidhuber（IDSIA），Demis Hassabis（Google DeepMind），Yann LeCun（Facebook，NYU）和Kevin Murphy（Google）。Max Welling（阿姆斯特丹大学）主持了讨论。

深度学习的现状与未来

Bengio首先指出，虽然在过去的一年已经取得巨大的进步，自然语言处理（NLP）尚未通过深度学习来革命。他认为，NLP有潜力成为深度学习的下一个重点。此外，他希望更多的努力投资到无监督学习，这与LeCun，Hassabis和Schmidhuber产生共鸣。

有趣的是，六位圆桌嘉宾中的四位，LeCun，Hassabis，Lawrence和Murphy，都认为医药医疗健康是深度机器学习的下一个大的事件。他们表示有兴趣的有些领域是医学图像分析（LeCun）和药物研发（Hassabis）。对此，我认为Lawrence已经推入了这个方向（他当天的演讲谈到DeepHealth），并且将他的方法与Google DeepMind和Facebook的方法相比较会很有意思。

LeCun和Hassabis都选择了问答和自然语言对话系统作为下一个重点。尤其是，我喜欢LeCun如何在知识、其收购和神经网络（或作为实际，任何机器学习模型）规划的基础上和在结合推理的背景下推出这些。这被Hassabis和Schmidhuber所呼应。

Schmidhuber和Hassabis认为顺序决策应该是下一个重要的研究课题。Schmidhuber的卷尾猴例子是令人振奋并且有趣的（这不仅是因为他错误地把它宣布成一个卡布奇诺猴）。为了在一棵树的顶端挑选水果，卷尾猴毫不费力地规划了一个子目标序列（例如，步行到树下，爬上树，抢水果，…）。Schmidhuber认为，我们将在10年内使机器拥有动物的智力水平（如Capuchin智能手机？）。

与其他嘉宾略有不同，Lawrence和Murphy更感兴趣的是将深度学习的成果转化到人类不能很好解决的任务/数据集（现在，让我把这些类型的任务称为“非认知”任务）。Lawrence指出，到目前为止，深度学习的成果已经很大程度上被限制于人类毫不费力的任务上，但未来可能是非认知（non-cognitive）任务。当谈到这些非认知任务，Murphy认为训练模型的解释性将变得更有价值。

Murphy和Schmidhuber解释到，分层规划、知识获取和执行非认知任务的能力自然引起了自动化实验室的想法。在这种自动化实验室，一台机器将积极规划其目标来拓展其世界的知识（通过观察和实验），并且可以深入了解世界（解释性）。

产业 vs. 学术

LeCun有一个令人惊讶的观点，认为工业实验室和学术实验室在基础设施之间的差距会随着时间的推移缩小，而不是扩大。这很好，但我比他更悲观。

LeCun继续解释在Facebook AI Research（FAIR）的开放性的研究工作。他表示，产业（不是特指FAIR）应该促进开放性科学有三个原因：（1）这是研究水平整体提升的方式，（2）这使得公司对未来的雇员、研究员更具吸引力，（3）不同公司在研究方面有竞争，这是保持领先他人的方式。

令我惊讶的是，Hassabis表示，Google DeepMind和FAIR已经同意共享基于Torch的软件框架的研究。我依稀记得听到这个正在讨论是在这几个星期或几个月前，但显然它已经发生了。我相信，这将进一步加快FAIR和DeepMind的研究。然而，它对其他研究机构（如大学）对于拥有世界上最集中的深度学习的两地共享和使用相同的代码库是否有益还有待观察。

Hassabis，Lawrence，Murphy和Bengio都认为工业实验室提供的巨大资源对于学术实验室不一定是个问题。Lawrence指出，相比其他那些数据驱动的公司（想想Google和Facebook），世界上的大多数公司忍受着大量数据的痛苦，而不是在享受它，这将为学术实验室的研究人员打开一个大的机会。Murphy近期比较了美俄太空竞赛时期两国的学术研究。资源的缺乏证明可能是有用的，甚至对于算法突破是有必要的，Bengio和Hassabis发现它依然重要。此外，Hassabis建议寻找那些人们可以很容易制造人为数据的任务或问题，比如游戏。

Schmidhuber的回答是这里最独特的一个。他认为，真正运行AI代理的代码是非常简短的，甚至高中生都能玩转它。换句话说，不用有任何担心会有行业垄断AI及其研究。

炒作和可能的第二个NN冬天

曾多次被记者问到过度炒作的问题，LeCun提到，过度炒作是危险的，有四个因素：（1）需要资金的自欺欺人的学者，（2）需要资金的创业者，（3）资助机构管理资金的项目经理以及（4）失败的新闻界（可能也需要资金、工资）。最近，在深度学习领域，第四因素起到了重要的作用，而奇怪的是，并非所有的新闻报道都是Google和Facebook公关机器的结果。相反，如果记者们在写潜在的废话之前呼唤研究员的话，LeCun会更喜欢。

LeCun和Bengio认为，一个既避免过度炒作、又加快研究进度的潜在的解决方案是开放的审查制度，其中，（真正的）科学家、研究人员把自己的成果放在网上并且公开发表评论，以便让人们看到文章的两面（以及为什么单文本不会造成奇异性）。进一步推动它，Murphy指出了开源软件研究的重要性，使用它，其他人可以更容易地理解论文中新提出方法的软弱性和局限性。不过，他指出，当写文章时，作者自己清楚地说明自己方法的局限性是非常重要的。当然，这需要Leon Bottou在他的全体会议演讲上提到的（评审应鼓励局限性的讨论，而不是因为局限性而抹杀这些文章）。

同样，Lawrence建议，研究人员和科学家应缓慢但稳步地多接近公众。如果我们不能相信记者的话，我们可能需要自己动手。他指出的一个很好的例子是由Ryan Adams和Katherine Gorman展示的“Talking Machines”。

Hassabis赞同过度炒作是危险的，但也认为不会再有第三个AI/NN冬天了。因为我们现在知道了什么导致以前的AI/NN冬天，并且我们已经在不过度承诺方面做得更好。如果我可以在这里补充我自己的观点，我同意Hassabis，尤其是因为神经网络现在被广泛部署于商业应用（想想Google Voice），这将更加难以再有另一个NN冬季（我的意思是，它起作用！）。

Schmidhuber也同意所有其他嘉宾，认为不会再有任何更多的AI/NN冬天，但是因为另一个原因：硬件技术的进步。他听起来好像他相信所有必要的算法组件已经开发并且一定程度上在目前形式的数码电脑上得到了验证。他认为这是一时机：从在发展通用AI方面取得更大进步，转移到不适合神经网络、更具体的回归神经网络的硬件技术上。

Murphy的一个评论是我最喜欢的：“这简直是人类的天性。”

人工智能恐惧和奇点

显然DeepMind的Hassabis近期已经从知名人士如Elon Musk，Stephen Hawking和Bill Gates中脱颖而出，成为的人工智能恐惧（AI fear）的核心。Hassabis向Musk介绍了AI，这可能让他感到震惊。然而，在最近几个月，Hassabis已经说服了Musk，并且和Hawking就这一点也有三个小时的长聊。据他介绍，Hawking现在不太担心。不过，他强调，我们必须为未来做好准备，不要害怕。

Murphy认为这样的人工智能恐惧和奇点的讨论是一个巨大的牵引。目前，世界上许多其他重大的问题需要立即得到更多的关注，如气候变化和传播的不平等现象。这种人工智能恐惧是一个简单的超跌的炒作，需要停下来，直到Bengio和LeCun同意。同样，Lawrence没有找到人工智能恐惧真正担心的问题。相反，他更关注的是数字寡头和数据的不平等问题。

LeCun的一个有趣的评论是，我们必须要小心区分智能和素质（quality）。大多数有问题的人类行为，由于许多担心类似人类的人工智能，是由人类素质而不是智能造成的。任何智能机不需要继承人的素质。

Schmidhuber对此事有非常独特的观点。他认为，我们将看到人工智能代理商社区由聪明的人和糊涂的人组成。他们会对彼此更感兴趣（正如十岁的女孩对其他十岁的女孩更感兴趣并且一起闲逛，以及卷尾猴对其他卷尾猴有兴趣并一起出行），并且对人类不怎么感兴趣。此外，他认为人工智能代理商会比人类（或者说他自己）显著聪明，没有这些人类的素质，他不像是自己，这与LeCun的言论一致。

听众提问

不幸的是，Q&A时间我拿着麦克风到处跑，无法针对好问题和专家回复进行记录和注释。

我记得一个来自Tieleman的问题。他询问了嘉宾有关他们在主动学习、探索方面的观点，作为有效监督学习的一个选择。Schmidhuber和Murphy进行了回答，在我透露他们的答复之前，我真的很喜欢它。总而言之（或我尽可能肯定我的记忆），积极探索会自然而然的发生，作为奖励更好解释世界的结果。周围世界的知识和它的积累应该得到回报，并较大限度该奖励，代理人或算法将积极探索周边地区（甚至没有监督）。Murphy表示，这可能反映婴儿如何在没有太多的监督信号，甚至没有太多的无监督信号的情况下（他们积极探索的方式通过允许婴儿收集高质量的无监督例子来弥补无监督例子的缺乏）这么快就学会。

我很荣幸可以直接向Hassabis，LeCun和Murphy询问最后的问题：如果他们（有意或无意）建立了一个真正工作的AI代理（不管什么意思），公司会怎么做？他们会掩盖它，认为世界还没有为此做好准备吗？他们会因为商业的潜在机会而保密吗？

他们都表示，不会发生这样的情况（一次事故导致有思维的机器）。而且，正因为如此，LeCun没有找到它相关的，因为这将逐渐发生，这是许多工业界和学术界的科学家都加入进来共同努力的结果。Hassabis认同LeCun的做法，也无法想象，这样的发现既然已经发生了，就可以被容纳（可能是人类历史上较好的漏洞）。不过，他主张为未来做好准备：我们，人类，将有机会使用真正有思维的机器，它们拥有我们分享的情绪。Murphy同意LeCun和Hassabis。他连同LeCun做了关于最近发布电影的评论，Ex-Machina（顺便说一下，这是今年到目前为止我的最爱）：这是一个美丽的拍摄电影，但不会在现实中发生。

我同意他们所提出的观点。不过，在我的问题背后还有另外一个原因，很不幸的是没有被他们讨论（无疑是由于时间的限制）。也就是说，一旦我们有正在“思考”的算法或机器，而且说出几个商业公司开发的最重要的几个部分（像Hassabis，LeCun和Murphy那样的），我们就在这些关键部件上有权利，这些至关重要的组件属于这些公司还是个人？他们将不得不做出公开（像人工智能的普遍权利）吗？以及最重要的是谁将决定所有这些？

结论？

很显然，目前还没有定论。这是一个持续的努力，而我或者我们的组织者，希望这个圆桌讨论会可以成功落地，至少给深度学习及一般人工智能的未来路径带来些许光明（然而，Lawrence通过引用Zoubin Ghahramani的话“如果鸟的飞行称为飞行，那么飞机的飞行称为人造飞行？”来指出这个词的荒谬）。

但是，让我指出我已经找到的个人觉得非常有趣的、令人振奋的几件事情：

无监督学习作为强化学习和自动化实验室：不用只是考虑每一个多带带的、未标记的例子，我们应该让一个模型选择性的考虑未标记示例的一个子集，以较大化限定于积累知识量的奖励。

过度炒作可以在很大程度上避免研究人员在发布成果和理念方面的积极参与，而不是让非专业人士向非专业人士解释。播客、开放的审查和博客有一定帮助，但也有可能是没有一个正确的答案。

我不认为工业界与学术界之间有任何的协议。不过，我觉得所有的三位学术专家以及其他产业专家都赞同，他们每个人都有自己的角色（有时是重叠的），朝着一个宏伟目标。

深度学习已经在人类擅长的领域（例如视觉和语音）获得了成功，并且未来我们作为研究者还应该探索人类并不擅长（或者在一年又一年的专门培训后变得擅长）的任务、数据集。在这个意义上，医药、保健似乎是大部分专家感兴趣并且愿意投资的一个领域。

云服务器 GPU云服务器深度学习讨论组深度学习未来云服务器销售6月总结深度学习的深度

文章版权归作者所有，未经允许请勿转载,若此文章存在违规行为，您可以联系管理员删除。

转载请注明本文地址：https://www.ucloud.cn/yun/4334.html

共享相关任务表征，一文读懂深度神经网络多任务学习

摘要：为了使的思想更具体化，现在我们来看一下在深度神经网络中执行多任务学习的两种最常用的方法。图深度神经网络多任务学习的参数共享共享参数大大降低了过拟合的风险。目录1.介绍2.动机3.两种深度学习 MTL 方法Hard 参数共享Soft 参数共享4.为什么 MTL 有效隐式数据增加注意力机制窃听表征偏置正则化5.非神经模型中的 MTL块稀疏正则化学习任务的关系6.最近 MTL 的深度学习研究深度...

developerworks 2019-04-25 18:14 评论0 收藏0
神经网络和深度学习简史第四部分：深度学习终迎伟大复兴

摘要：主流机器学习社区对神经网络兴趣寡然。对于深度学习的社区形成有着巨大的影响。然而，至少有两个不同的方法对此都很有效应用于卷积神经网络的简单梯度下降适用于信号和图像，以及近期的逐层非监督式学习之后的梯度下降。我们终于来到简史的最后一部分。这一部分，我们会来到故事的尾声并一睹神经网络如何在上世纪九十年代末摆脱颓势并找回自己，也会看到自此以后它获得的惊人先进成果。「试问机器学习领域的任何一人，是什...

Simon_Zhou 2019-04-25 18:01 评论0 收藏0
128篇论文，21大领域，深度学习最值得看的资源全在这了

摘要：对于大多数想上手深度学习的小伙伴来说，我应当从那篇论文开始读起这是一个亘古不变的话题。接下来的论文将带你深入理解深度学习方法深度学习在前沿领域的不同应用。对于大多数想上手深度学习的小伙伴来说，我应当从那篇论文开始读起？这是一个亘古不变的话题。而对那些已经入门的同学来说，了解一下不同方向的论文，也是不时之需。有没有一份完整的深度学习论文导引，让所有人都可以在里面找到想要的内容呢？有！今天就给...

tracymac7 2019-04-25 18:18 评论0 收藏0
深度学习在NLP领域成绩斐然，计算语言学家该不该惊慌？

摘要：深度学习浪潮这些年来，深度学习浪潮一直冲击着计算语言学，而看起来年是这波浪潮全力冲击自然语言处理会议的一年。深度学习的成功过去几年，深度学习无疑开辟了惊人的技术进展。机器翻译、聊天机器人等自然语言处理应用正随着深度学习技术的进展而得到更广泛和更实际的应用，甚至会让人认为深度学习可能就是自然语言处理的终极解决方案，但斯坦福大学计算机科学和语言学教授 Christopher D. Mannin...

newsning 2019-04-25 18:12 评论0 收藏0
和 Hinton 一起发明了深度信念网络，他们选择加入 DeepMind

摘要：取得博士学位后，他加入的团队，在多伦多大学攻读博士后，在年跟和合著了提出深度信念网络的论文。只有充分了解，才能做出强有力的战略决策。这带来的一个重大问题是，个人隐私数据被其他人控制。机器学习是数据驱动的，与统计数据紧密相关。昨天，谷歌 DeepMind 联合创始人 Demis Hassabis 发布了这样一条消息：很高兴 Yee Whye Teh 和 Simon Osindero 加入团队...

oneasp 2019-04-25 18:04 评论0 收藏0