资讯专栏INFORMATION COLUMN

AI 框架使用排行:TensorFlow、Scikit Learn、IBM Watson

dackel / 2860人阅读

摘要:虽然这些都是机器学习工具集,但它们并不是完全取代对方,这意味着像和这样一两种流行框架不会淘汰其他框架。事实上,由于四处收购技术公司具体来说指和,英特尔有多款加速器上榜。

作者简介:Dan Olds是技术趋势和客户情绪方面的权威人士,他也是经常被知名行业和商业出版物频频引用的专家,比如《华尔街日报》、彭博新闻社、《Computerworld》、《eWeek》、《CIO》和《PCWorld》等。

 

AI软件界在迅速发展。新的应用几乎每天都在层出不穷,现在正好可以趁机了解人们到底在用机器学习和其他AI技术做什么、这些技术可能何去何从。

我们在之前的两篇文章中探讨了实际用户在如何对待AI,以及如何利用AI来解决问题、优化企业。我们在本文中将深入了解数据中心的AI角落,看看公司在使用什么样的软硬件。

为此我们OrionX.net开展了一项调查,向用户展示了二十几种AI框架,询问他们是否打算使用某框架、是否已经在使用某框架,或者是否认为自己是专家。

很少有人自称是任何一种框架方面的专家,平均比例在2%左右。TensorFlow和Scikit Learn是两种更受欢迎的框架,分别有9%和12%的人自称是这种框架方面的专家。然而如上图所示,客户熟悉大量的AI框架,不过他们不认为自己是专家。

IBM Watson是使用率排名第三的AI框架,Spark-MLib名列第四。我们惊讶地发现,所有24种框架都有各自的粉丝和拥趸。你将这样一份列表拿给调查用户看时,通常会看到四五种大受欢迎的选择,其余沦为默默无闻。AI框架方面无疑不是这种情况。

虽然这些都是机器学习工具集,但它们并不是完全取代对方,这意味着像TensorFlow和Sciket Learn这样一两种流行框架不会淘汰其他框架。

AI硬件:更进一步的观察

那么,这些项目有多庞大?它们用于处理AI的集群又有多庞大?这是我们的发现结果。

对调查对象如今从事的所有AI项目而言,平均数据量为442 TB,较大单个项目的平均数据量为235 TB。因此,从下面的平均数据量来看,调查中的典型企业似乎在从事一些很大的项目。

然而,这些统计数据有点欺骗性。如果你看一下中位数而不是平均数,真实情况变得明朗化。AI项目的合并总数据量中位数仅为17TB,而较大单个项目的数据量只有5TB。

平均数和中位数之间差异这么大,合理的解释就是,有一小部分的大型项目让数值出现了很大程度的偏差。AI趋势仍处于起步阶段,目前鲜有企业在开展极其庞大的AI项目。

如果看一下调查对象用于其AI项目的平均集群大小,就可以证明这一点。如图所示,60%以上的调查对象拥有节点数量不到128个的集群,一大批调查对象使用节点数量不到32个的集群。另一方面,一小批调查对象拥有超过2048个节点的集群,仅20%的调查对象声称集群的节点数量在512个到1024个之间。

这也证实了我们处于AI时代的较早时期。随着我们进一步发展,可能会看到AI集群的规模会迅速变大。

广阔的加速器世界

在本次调查的硬件部分,我们询问了关于GPU和FPGA等计算加速器的几个问题。众所周知,这些便捷的设备可以加快数字处理,还可以显著加快深度学习任务,尤其是在机器学习训练模型方面。GPU已成为大多数用户的推荐加速器,但随着用户对专门定制的AI FPGA越来越熟悉,我们预计这类加速器的使用量会逐渐增加。

我们询问了客户他们对于特定的GPU和FPGA加速器有多熟悉,为此给他们看了一份列有众多候选者的长长列表,询问他们是否熟悉该设备或目前是否在使用该设备。

下表代表了我们在2017年春夏期间所能找到的每一款加速器。到目前为止,可能还有更多的加速器即出现在市面上,或者更大的玩家会收购本文列表上的更多加速器。

看到80%的调查对象使用英伟达GPU加速器或熟悉英伟达GPU加速器,这不足为奇。 

AMD GPU和谷歌TPU的熟悉度/使用率不相上下,都是60%多一点,而英特尔的Altera FPGA排在第四位。事实上,由于四处收购FPGA技术公司(具体来说指Altera和Movidius),英特尔有多款GPU加速器上榜。

我们没有料想到的一个方面是,调查对象很熟悉或在使用榜单上不大知名的技术。就连榜单上知名度/使用量最小的硬件(来自Krtkl,这是一家设计嵌入式FPGA等产品的小公司)也被我们25%的调查对象所认可。

结束语

在第一篇文章中,我们的数据显示,虽然几乎所有的调查对象都在开展AI项目,但很少有人(约7%)真正在生产环境下搞AI项目。在第二篇文章中,我们发现大多数实际的AI项目旨在推进和简化典型应用,比如预测性维护和分析大数据。虽然图像、语音和视频AI分析似乎备受媒体的关注,但大多数客户在使用AI来分析数字和文本。

我们在本文中了解到,虽然有几个非常大的AI项目(至少由我们的300多个调查对象来判断是这样),但就数据量而言,中位数项目还是相当小(约5TB)。我们还发现,说到GPU和FPGA之类的AI加速器,实际的客户熟悉行情,他们知道这个市场的大小玩家。我们还再次证实了自己的假设:AI的发展处于早期阶段;对于这个激动人心的细分市场而言,真正的发展还未到来。

报告全文:

欢迎加入本站公开兴趣群

商业智能与数据分析群

兴趣范围包括各种让数据产生价值的办法,实际应用案例分享与讨论,分析工具,ETL工具,数据仓库,数据挖掘工具,报表系统等全方位知识

QQ群:81035754

文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。

转载请注明本文地址:https://www.ucloud.cn/yun/4760.html

相关文章

  • 基于云计算上的人工智能服务

    摘要:全球主要的云计算提供商现在提供基于云计算的人工智能产品。显然,由于从头开始构建这样一个系统的费用高昂,人工智能作为一项服务仍然一直位于行业巨头所在的领域。在用于人工智能服务的品牌下,公司提供不少于项服务。如今,采用人工智能的企业遇到了一个主要障碍,那就是在内部开发人工智能产品成本高昂,因此有了外包人工智能产品的需求。而对于从中小企业到预算受限的大型企业来说,通过云计算来采用人工智能的成本要低...

    Leo_chen 评论0 收藏0
  • ApacheCN 人工智能知识树 v1.0

    摘要:贡献者飞龙版本最近总是有人问我,把这些资料看完一遍要用多长时间,如果你一本书一本书看的话,的确要用很长时间。为了方便大家,我就把每本书的章节拆开,再按照知识点合并,手动整理了这个知识树。 Special Sponsors showImg(https://segmentfault.com/img/remote/1460000018907426?w=1760&h=200); 贡献者:飞龙版...

    刘厚水 评论0 收藏0
  • 在哪能找到顶级的 AI 速成课

    摘要:想机器学习这样的技术是当今许多工具的基础,并不容易掌握。机器学习让计算机听懂我们说的话,认识我们的行为。后续也提供了一些更难得课程,如结构机器学习项目。 showImg(https://segmentfault.com/img/bV1L7s?w=948&h=546); 简评:NVIDIA 官方推荐了一些 AI 课程。现在课程确实太多,乱花渐欲迷人眼,择其优者而从之。 人工智能这个概念已...

    番茄西红柿 评论0 收藏0
  • 组成 TensorFlow 核心的六篇论文

    摘要:下载地址点击这里这篇特定的论文描述了的数据流模型,与所有现有的系统相比,系统表现出了令人瞩目的性能。 作者:chen_h微信号 & QQ:862251340微信公众号:coderpai简书地址:http://www.jianshu.com/p/10aa... showImg(https://segmentfault.com/img/bV0rYD?w=700&h=467); 众所周知,...

    Carbs 评论0 收藏0
  • 重磅 | 完备的 AI 学习路线,最详细的资源整理!

    摘要:是你学习从入门到专家必备的学习路线和优质学习资源。的数学基础最主要是高等数学线性代数概率论与数理统计三门课程,这三门课程是本科必修的。其作为机器学习的入门和进阶资料非常适合。书籍介绍深度学习通常又被称为花书,深度学习领域最经典的畅销书。 showImg(https://segmentfault.com/img/remote/1460000019011569); 【导读】本文由知名开源平...

    荆兆峰 评论0 收藏0

发表评论

0条评论

最新活动
阅读需要支付1元查看
<