资讯专栏INFORMATION COLUMN

深度学习三大硬件+四大学习库基准测试对比,指标全面呈现

YacaToy / 3662人阅读

摘要:基准测试我们比较了和三款,使用的深度学习库是和,深度学习网络是和。深度学习库基准测试同样,所有基准测试都使用位系统,每个结果是次迭代计算的平均时间。

购买用于运行深度学习算法的硬件时,我们常常找不到任何有用的基准,的选择是买一个GPU然后用它来测试。现在市面上性能较好的GPU几乎都来自英伟达,但其中也有很多选择:是买一个新出的TITAN X Pascal还是便宜些的TITAN X Maxwell,又或是GTX 1080?本文中我们对几个最常见的英伟达GPU以及最常用的一些深度学习算法进行了基准测试。软件方面,我们比较了最近发布的四个开源深度学习库:Tensorflow v0.10.0、Neon v1.6.0、Caffe rc3以及caffe的英伟达版本NVcaffe v0.15.10。

GPU基准测试:GeForce GTX 1080 vs Titan X(Maxwell) vs Titan X (Pascal)

我们比较了GeForce GTX 1080、Titan X Maxwell和Titan X Pascal三款GPU,使用的深度学习库是Neon、Tensorflow和Caffe,深度学习网络是AlexNet、GoogleNet、OverFeat和VGG-A。

 

所有基准测试都使用64位系统,每个结果是100次迭代计算的平均时间。

基于库的测试结果

训练基准测试

使用四种库(Tensorflow,NVcaffe,Caffe,Neon)进行一次前向迭代和反向迭代的总时间[ms](越少越好)。结果如下:

 

推论基准测试

使用四种库(Tensorflow,NVcaffe,Caffe,Neon)进行一次前向迭代的总时间[ms](越少越好)。结果如下:

基于神经网络的测试结果

 

训练基准测试

使用四种神经网络(VGG-A, OverFeat,AlexNet, GoogLeNet)进行一次前向迭代和反向迭代的总时间(越少越好)。结果如下:

 

推论基准测试

使用四种神经网络(VGG-A, OverFeat,AlexNet, GoogLeNet)进行一次前向迭代的总时间(越少越好)。结果如下:

配置

基准测试工具

在Neon上进行基准测试使用的是neon库中的脚本neon/tests/run_benchmarks.py,在Tensorflow上使用的是convnet-benchmarks和不加修改的脚本convnet-benchmarks/tensorflow/benchmark_alexnet.py, convnet-benchmarks/tensorflow/benchmark_googlnet.py, convnet-benchmarks/tensorflow/benchmark_overfeat.py 以及 convnet-benchmarks/tensorflow/benchmark_vgg.py。Caffe使用的也是convnet-benchmarks,但对脚本convnet-benchmarks/caffe/run_imagenet.sh作了修改以指向我们的caffe安装。

深度学习库基准测试:Caffe vs Neon vsNVcaffe vs Tensorflow

同样,所有基准测试都使用64位系统,每个结果是100次迭代计算的平均时间。

 

基于GPU的测试结果

 

训练基准测试

使用四种GPU(Titan X Pascal, Titan X Maxwell, GeForce GTX 1080)进行一次前向迭代和反向迭代的总时间(越少越好)。结果如下:

推论基准测试

使用四种GPU(Titan X Pascal, Titan X Maxwell, GeForce GTX 1080)进行一次前向迭代的总时间(越少越好)。结果如下:

基于神经网络的测试结果

训练基准测试

使用四种神经网络(VGG-A, OverFeat,AlexNet, GoogLeNet)进行一次前向迭代和反向迭代的总时间(越少越好)。结果如下:

推论基准测试

使用四种神经网络(VGG-A, OverFeat, AlexNet,GoogLeNet)进行一次前向迭代的总时间(越少越好)。结果如下:

 

配置

基准测试工具

 

在Neon上进行基准测试使用的是neon库中的脚本neon/tests/run_benchmarks.py,在Tensorflow上使用的是convnet-benchmarks和不加修改的脚本convnet-benchmarks/tensorflow/benchmark_alexnet.py, convnet-benchmarks/tensorflow/benchmark_googlnet.py, convnet-benchmarks/tensorflow/benchmark_overfeat.py 以及 convnet-benchmarks/tensorflow/benchmark_vgg.py。Caffe使用的也是convnet-benchmarks,但对脚本convnet-benchmarks/caffe/run_imagenet.sh作了修改以指向我们的caffe安装。

欢迎加入本站公开兴趣群

商业智能与数据分析群

兴趣范围包括各种让数据产生价值的办法,实际应用案例分享与讨论,分析工具,ETL工具,数据仓库,数据挖掘工具,报表系统等全方位知识

QQ群:81035754

文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。

转载请注明本文地址:https://www.ucloud.cn/yun/4411.html

相关文章

  • 深度神经网络全面概述:从基本概念到实际模型和硬件基础

    摘要:深度神经网络所代表的人工智能技术被认为是这一次技术变革的基石之一。导语深度神经网络目前是许多人工智能应用的基础。深度神经网络概述根据应用情况不同,深度神经网络的形态和大小也各异。 深度神经网络(DNN)所代表的人工智能技术被认为是这一次技术变革的基石(之一)。近日,由 IEEE Fellow Joel Emer 领导的一个团队发布了一篇题为《深度神经网络的有效处理:教程和调研(Efficie...

    Sanchi 评论0 收藏0
  • 基准评测TensorFlow、Caffe等在三类流行深度神经网络上的表现

    摘要:在两个平台三个平台下,比较这五个深度学习库在三类流行深度神经网络上的性能表现。深度学习的成功,归因于许多层人工神经元对输入数据的高表征能力。在年月,官方报道了一个基准性能测试结果,针对一个层全连接神经网络,与和对比,速度要快上倍。 在2016年推出深度学习工具评测的褚晓文团队,赶在猴年最后一天,在arXiv.org上发布了的评测版本。这份评测的初版,通过国内AI自媒体的传播,在国内业界影响很...

    canopus4u 评论0 收藏0
  • 深度学习这么多年还不会挑GPU?这儿有份选购全攻略

    摘要:深度学习是一个对算力要求很高的领域。这一早期优势与英伟达强大的社区支持相结合,迅速增加了社区的规模。对他们的深度学习软件投入很少,因此不能指望英伟达和之间的软件差距将在未来缩小。 深度学习是一个对算力要求很高的领域。GPU的选择将从根本上决定你的深度学习体验。一个好的GPU可以让你快速获得实践经验,而这些经验是正是建立专业知识的关键。如果没有这种快速的反馈,你会花费过多时间,从错误中吸取教训...

    JohnLui 评论0 收藏0

发表评论

0条评论

最新活动
阅读需要支付1元查看
<