摘要:虽然这些都是机器学习工具集,但它们并不是完全取代对方,这意味着像和这样一两种流行框架不会淘汰其他框架。事实上,由于四处收购技术公司具体来说指和,英特尔有多款加速器上榜。
作者简介:Dan Olds是技术趋势和客户情绪方面的权威人士,他也是经常被知名行业和商业出版物频频引用的专家,比如《华尔街日报》、彭博新闻社、《Computerworld》、《eWeek》、《CIO》和《PCWorld》等。
AI软件界在迅速发展。新的应用几乎每天都在层出不穷,现在正好可以趁机了解人们到底在用机器学习和其他AI技术做什么、这些技术可能何去何从。
我们在之前的两篇文章中探讨了实际用户在如何对待AI,以及如何利用AI来解决问题、优化企业。我们在本文中将深入了解数据中心的AI角落,看看公司在使用什么样的软硬件。
为此我们OrionX.net开展了一项调查,向用户展示了二十几种AI框架,询问他们是否打算使用某框架、是否已经在使用某框架,或者是否认为自己是专家。
很少有人自称是任何一种框架方面的专家,平均比例在2%左右。TensorFlow和Scikit Learn是两种更受欢迎的框架,分别有9%和12%的人自称是这种框架方面的专家。然而如上图所示,客户熟悉大量的AI框架,不过他们不认为自己是专家。
IBM Watson是使用率排名第三的AI框架,Spark-MLib名列第四。我们惊讶地发现,所有24种框架都有各自的粉丝和拥趸。你将这样一份列表拿给调查用户看时,通常会看到四五种大受欢迎的选择,其余沦为默默无闻。AI框架方面无疑不是这种情况。
虽然这些都是机器学习工具集,但它们并不是完全取代对方,这意味着像TensorFlow和Sciket Learn这样一两种流行框架不会淘汰其他框架。
AI硬件:更进一步的观察
那么,这些项目有多庞大?它们用于处理AI的集群又有多庞大?这是我们的发现结果。
对调查对象如今从事的所有AI项目而言,平均数据量为442 TB,较大单个项目的平均数据量为235 TB。因此,从下面的平均数据量来看,调查中的典型企业似乎在从事一些很大的项目。
然而,这些统计数据有点欺骗性。如果你看一下中位数而不是平均数,真实情况变得明朗化。AI项目的合并总数据量中位数仅为17TB,而较大单个项目的数据量只有5TB。
平均数和中位数之间差异这么大,合理的解释就是,有一小部分的大型项目让数值出现了很大程度的偏差。AI趋势仍处于起步阶段,目前鲜有企业在开展极其庞大的AI项目。
如果看一下调查对象用于其AI项目的平均集群大小,就可以证明这一点。如图所示,60%以上的调查对象拥有节点数量不到128个的集群,一大批调查对象使用节点数量不到32个的集群。另一方面,一小批调查对象拥有超过2048个节点的集群,仅20%的调查对象声称集群的节点数量在512个到1024个之间。
这也证实了我们处于AI时代的较早时期。随着我们进一步发展,可能会看到AI集群的规模会迅速变大。
广阔的加速器世界
在本次调查的硬件部分,我们询问了关于GPU和FPGA等计算加速器的几个问题。众所周知,这些便捷的设备可以加快数字处理,还可以显著加快深度学习任务,尤其是在机器学习训练模型方面。GPU已成为大多数用户的推荐加速器,但随着用户对专门定制的AI FPGA越来越熟悉,我们预计这类加速器的使用量会逐渐增加。
我们询问了客户他们对于特定的GPU和FPGA加速器有多熟悉,为此给他们看了一份列有众多候选者的长长列表,询问他们是否熟悉该设备或目前是否在使用该设备。
下表代表了我们在2017年春夏期间所能找到的每一款加速器。到目前为止,可能还有更多的加速器即出现在市面上,或者更大的玩家会收购本文列表上的更多加速器。
看到80%的调查对象使用英伟达GPU加速器或熟悉英伟达GPU加速器,这不足为奇。
AMD GPU和谷歌TPU的熟悉度/使用率不相上下,都是60%多一点,而英特尔的Altera FPGA排在第四位。事实上,由于四处收购FPGA技术公司(具体来说指Altera和Movidius),英特尔有多款GPU加速器上榜。
我们没有料想到的一个方面是,调查对象很熟悉或在使用榜单上不大知名的技术。就连榜单上知名度/使用量最小的硬件(来自Krtkl,这是一家设计嵌入式FPGA等产品的小公司)也被我们25%的调查对象所认可。
结束语
在第一篇文章中,我们的数据显示,虽然几乎所有的调查对象都在开展AI项目,但很少有人(约7%)真正在生产环境下搞AI项目。在第二篇文章中,我们发现大多数实际的AI项目旨在推进和简化典型应用,比如预测性维护和分析大数据。虽然图像、语音和视频AI分析似乎备受媒体的关注,但大多数客户在使用AI来分析数字和文本。
我们在本文中了解到,虽然有几个非常大的AI项目(至少由我们的300多个调查对象来判断是这样),但就数据量而言,中位数项目还是相当小(约5TB)。我们还发现,说到GPU和FPGA之类的AI加速器,实际的客户熟悉行情,他们知道这个市场的大小玩家。我们还再次证实了自己的假设:AI的发展处于早期阶段;对于这个激动人心的细分市场而言,真正的发展还未到来。
报告全文:
欢迎加入本站公开兴趣群
商业智能与数据分析群
兴趣范围包括各种让数据产生价值的办法,实际应用案例分享与讨论,分析工具,ETL工具,数据仓库,数据挖掘工具,报表系统等全方位知识
QQ群:81035754
文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。
转载请注明本文地址:https://www.ucloud.cn/yun/4760.html
摘要:全球主要的云计算提供商现在提供基于云计算的人工智能产品。显然,由于从头开始构建这样一个系统的费用高昂,人工智能作为一项服务仍然一直位于行业巨头所在的领域。在用于人工智能服务的品牌下,公司提供不少于项服务。如今,采用人工智能的企业遇到了一个主要障碍,那就是在内部开发人工智能产品成本高昂,因此有了外包人工智能产品的需求。而对于从中小企业到预算受限的大型企业来说,通过云计算来采用人工智能的成本要低...
摘要:贡献者飞龙版本最近总是有人问我,把这些资料看完一遍要用多长时间,如果你一本书一本书看的话,的确要用很长时间。为了方便大家,我就把每本书的章节拆开,再按照知识点合并,手动整理了这个知识树。 Special Sponsors showImg(https://segmentfault.com/img/remote/1460000018907426?w=1760&h=200); 贡献者:飞龙版...
摘要:想机器学习这样的技术是当今许多工具的基础,并不容易掌握。机器学习让计算机听懂我们说的话,认识我们的行为。后续也提供了一些更难得课程,如结构机器学习项目。 showImg(https://segmentfault.com/img/bV1L7s?w=948&h=546); 简评:NVIDIA 官方推荐了一些 AI 课程。现在课程确实太多,乱花渐欲迷人眼,择其优者而从之。 人工智能这个概念已...
摘要:下载地址点击这里这篇特定的论文描述了的数据流模型,与所有现有的系统相比,系统表现出了令人瞩目的性能。 作者:chen_h微信号 & QQ:862251340微信公众号:coderpai简书地址:http://www.jianshu.com/p/10aa... showImg(https://segmentfault.com/img/bV0rYD?w=700&h=467); 众所周知,...
摘要:是你学习从入门到专家必备的学习路线和优质学习资源。的数学基础最主要是高等数学线性代数概率论与数理统计三门课程,这三门课程是本科必修的。其作为机器学习的入门和进阶资料非常适合。书籍介绍深度学习通常又被称为花书,深度学习领域最经典的畅销书。 showImg(https://segmentfault.com/img/remote/1460000019011569); 【导读】本文由知名开源平...
阅读 1148·2021-10-20 13:48
阅读 2112·2021-09-30 09:47
阅读 3090·2021-09-28 09:36
阅读 2309·2019-08-30 15:56
阅读 1135·2019-08-30 15:52
阅读 2002·2019-08-30 10:48
阅读 583·2019-08-29 15:04
阅读 550·2019-08-29 12:54