Keras之父：大多数深度学习论文都是垃圾，炒作AI危害很大

RyanHoo 发布于2019-04-25 18:22 / 1582人阅读

摘要：问深度学习社区现在面临的主要挑战是什么答打击炒作发展伦理意识获得科学严谨性。深度学习简直是科学的重灾区。

Keras之父、谷歌大脑人工智能和深度学习研究员François Chollet撰写了一本深度学习Python教程实战书籍《Python深度学习》，书中介绍了深度学习使用Python语言和强大Keras库，详实新颖。

近日，François Chollet接受了采访，就“深度学习到底是什么”、“Python为何如此广受欢迎”、“目前深度学习面临的主要挑战”等议题进行了回答。他认为，目前很多深度学习领域的论文都是无意义的，因为这些研究使用了不科学、不规范的研究方法。以下是采访全文编译。

关于本人

问：您主要的工作内容是什么？

答：我在谷歌大脑团队工作，花了很多时间开发Keras。我也参加TensorFlow的工作。最近我主要在写机器学习、计算机视觉、将深度学习应用于定理证明等方面的论文。我的主要研究兴趣是理解AI中的抽象和推理问题，如何从感知得到抽象的、高度概括的模型。

深度学习的本质、挑战、和未来

问：深度学习到底是什么？

答：深度学习是机器学习的一种具体方法。与以前的方法相比，它更加强大和灵活。在大多数应用程序中，我们所说的“深度学习”是指一种把大量由人类注释的数据转换为以与人类相似的方式自动注释新数据的软件。您可以通过这种方式自动完成很多不同的任务。深度学习尤其擅长理解“感知”数据，如图像、视频或声音。

我来举例说明。假设有很多图片都带有相关联标签（如“猫”、“狗”）。深度学习可以让你自动将数据转换到一个“了解”如何把图片映射到标签的系统，只需从示例中学习，无需任何手动调整或自定义工程。然后这种系统可以被应用到新的数据，将标记图片任务有效自动化。

同样，你可以将深度学习应用于机器翻译、语音识别、文本到语音转换，光学字符识别等问题。

问：深度学习社区现在面临的主要挑战是什么？

答：打击炒作、发展伦理意识、获得科学严谨性。

炒作：对人工智能的大肆炒作正在危害这个领域。一些人正荒谬地夸大目前AI取得的进展，还说人工智能已把人类逼到了绝境。但事实并非如此。如果我们把目标设得极高，却又不能实现，就是逼着公众站在我们的对立面上。而且，炒作AI这件事，本质上是不诚实的，对公众讨论也产生了危害。

伦理：现在部署人工智能系统的大多数人来自单一背景，他们往往没有意识到自己所构建的系统给人们带来了道德影响和副作用。这将成为一个问题，因为这个群体所拥有的权力会越来越大。我们需要更多地讨论这些问题，并提高人们对不道德使用AI的潜在行为的觉察力，例如具有偏见性的预测模型会影响公众生活，或以危险的方式操纵AI。

科学：每天都有大量的深度学习论文发表，其中大多数并没有真正产生任何有意义的新知识，因为这些论文没有遵循科学的研究方法。他们以模糊的方式“评估”模型，或者在他们的训练数据上测试过度拟合模型（尤其是生成模型和强化学习，这是深度学习研究中发展最快的两个主题），仅在MNIST上评估模型等。深度学习简直是科学的重灾区。同行评审通常不会以有意义的方式解决这些问题，也许部分原因是大多数同行评审员进入这个领域最多才一两年。如果想要取得更快的进展，那么当涉及研究可重复性、基线、模型评估和统计显著性时，我们需要更加严谨。我们目前的激励机制是与科学相对立的：发表论文是被鼓励的。如果你的研究听起来既复杂又神秘，很难被正确评估研究重要性，那么发表论文就容易多了。

问：你认为深度学习的未来是什么？

答：我期望AI未来能把“直观的”模式识别模块与正式推理模块相结合。我也希望AI能够演变得更像自动化软件开发的形式，借用目前软件工程中的很多模式和实践。

写书动机

问：你出版了一本新书《Python深度学习》。为什么要写这本书呢？

答：写这本书的原因是，我想推出一个课程，来教那些已有Python编程能力，但没有机器学习背景的人。

Python为何广受欢迎

问：Python应该是目前发展最快的编程语言，至少在高收入国家是这样。为什么Python如此受欢迎？

答：我爱Python。学习Python很容易上手，当你习惯使用它之后，会越来越高效。与我使用过的大多数其他语言相比，Python非常直观和优雅。但是Python真正的杀手锏并不在于语言本身，而是周围的生态系统和社区。无论你需要做什么，比如解析特定的文件格式或与特定系统连接，几乎有一个Python库在做这件事，你不必花时间去做。在数据科学和机器学习方面尤其如此，有很多很棒的工具：numpy，pandas，scikit-learn，plotting libraries等，这使得Python成为一种非常高效的语言。

我喜欢Python的另一个原因是，它并不是一个领域特定的语言，而是多领域的交叉点，从网站开发到数据科学和系统管理。这意味着无需切换到新语言来将Keras模型部署为Web API。无论你需要做什么，无论是启动一个web应用程序，查询一个REST API，还是解析一些文件，训练较先进的深度学习模型，Python通常都会是一个很好的选择。

给初学者的建议

问：有些声音认为进入机器学习有壁垒。您如何看待？

答：我不同意。在过去的5年中，进入机器学习领域变得非常容易。当然，5-7年前这很艰难。你可能需要研究生教育。你需要用C ++或Matlab来编写大量的低级算法。我经历过这些。而现在不一样了。你只需要Python，很容易上手，你有权限访问高级和易于使用的工具（如Keras）。另外，你可以在网上学到很多非常高质量的资源，你可以在Kaggle上练习现实世界的问题。学习从未如此简单。

问：对于初学者来说，最重要的是什么？

答：最重要的是要深刻了解深度学习能做什么，不能做什么。去感受一些best practice，比如如何正确评估模型，如何防止过度拟合。这需要把正式解释（formal explanations）和对现实问题的广泛实践结合起来。

原文地址：https://www.datacamp.com/community/blog/interview-francois-chollet

欢迎加入本站公开兴趣群

商业智能与数据分析群

兴趣范围包括各种让数据产生价值的办法，实际应用案例分享与讨论，分析工具，ETL工具，数据仓库，数据挖掘工具，报表系统等全方位知识

QQ群：81035754

云服务器 GPU云服务器大多数深度学习深度学习深度深度学习学习深度强化学习和深度学习

文章版权归作者所有，未经允许请勿转载,若此文章存在违规行为，您可以联系管理员删除。

转载请注明本文地址：https://www.ucloud.cn/yun/4702.html

两年AI研究经验(教训)总结，进来看看吧！

摘要：摘要本文以过来人的身份将自身年的研究经验做了一下分享，希望本文对于即将开始从事人工智能研究的朋友有所帮助。此外，还有各种会议也值得关注。三大会议分别是以及。此外，当演讲者向现场观众演讲时，他们往往优先考虑的是清晰度而不是简洁性。摘要：本文以过来人的身份将自身2年的研究经验做了一下分享，希望本文对于即将开始从事人工智能研究的朋友有所帮助。人工智能研究这个领域是有一定门槛的。对于初学...

baihe 2019-06-26 18:24 评论0 收藏0
深度学习 vs 概率图模型 vs 逻辑学

摘要：在上个月发表博客文章深度学习机器学习模式识别之后，博士博士后及联合创始人这一次带领我们回顾年来人工智能领域三大范式逻辑学概率方法和深度学习的演变历程。最令人兴奋的，后来的频率论与贝叶斯之争，是一些被称为概率图模型的东西。在上个月发表博客文章《深度学习vs机器学习vs模式识别》之后，CMU博士、MIT博士后及vision.ai联合创始人Tomasz Malisiewicz这一次带领我们回顾5...

susheng 2019-04-25 18:00 评论0 收藏0
ICML 2015压轴讨论总结：6大神畅谈深度学习的未来

摘要：年的深度学习研讨会，压轴大戏是关于深度学习未来的讨论。他认为，有潜力成为深度学习的下一个重点。认为这样的人工智能恐惧和奇点的讨论是一个巨大的牵引。 2015年ICML的深度学习研讨会，压轴大戏是关于深度学习未来的讨论。基于平衡考虑，组织方分别邀请了来自工业界和学术界的六位专家开展这次圆桌讨论。组织者之一Kyunghyun Cho（Bengio的博士后）在飞机上凭记忆写下本文总结了讨论的内容，...

netScorpion 2019-04-25 18:01 评论0 收藏0