格灵深瞳

格灵深瞳

厂商: 格灵深瞳

格灵深瞳成立于2013年4月,是一家同时具备计算机视觉和深度学习技术以及嵌入式硬件研发能力的人工智能公司,作为一家视频大数据产品和方案提供商,在人和车的检测、跟踪与识别等技术坚持自主研发,主要关注的领域包括公共安全、智能交通、金融安防等,同时在无人驾驶、机器人和智能医疗方面也进行了深入的布局。

背景介绍

2016年,Alpha Go和人类围棋大师的两轮对决刷新了大众对人工智能的认知,也让人工智能成为舆论焦点。今年7月20日,国务院颁布《新一代人工智能发展规划》,明确将人工智能作为未来国家重要的发展战略。UCloud作为国内中立云计算公司,2017年初提出了“CBA”三位一体发展战略,其中人工智能随着云计算、大数据、深度学习等技术实现了快速发展。

客户介绍

人工智能的五大核心技术包括计算机视觉、机器学习、自然语言处理、机器人和语音识别。格灵深瞳是一家同时具备计算机视觉、深度学习技术以及嵌入式硬件研发能力的人工智能公司,拥有三维视觉感知技术,帮助计算机理解人的行为轨迹,也是一家将人工智能应用于金融安防、智能交通等领域的公司。

项目背景及业务挑战

经过多年技术积累和沉淀,格灵深瞳在金融安防、智能交通等行业累积大量了数据,通过深度学习技术,进一步将计算机视觉性能提高。接下来,格灵深瞳将开拓商场、超市等连锁企业,为他们提供智能视频监控解决方案,实现真正的商业化。
随着业务拓展,格灵深瞳很需要GPU做在线服务的计算支持,部署客户前端的智能摄像机会进行画面抓拍,同时把画面传回云端,由云端的GPU集群来进行计算,并且可以快速将返回的结果提供给用户。

UCloud解决方案

一直以来,UCloud都走在科技发展前沿。在人工智能兴起之初,公司便积极与国内人工智能公司接触,共同探讨人工智能与云计算的结合点。因此,在与格灵深瞳接触中,UCloud深入挖掘客户痛点,运用强大技术实力和良好服务,成功拿下人工智能领域的标杆客户。
通过与客户一系列的接洽,UCloud总结出此类客户以往的IT架构,并拿出了针对AI客户的解决方案。

格灵深瞳等传统AI客户的IT架构以自建机房为主


软件架构:
  • 需要维护多套深度学习框架,如:Tensorflow、Caffe;
  • 很难进行框架层面优化以实现较好的训练性能;
  • 需要自己维护一套驱动仓库,不同GPU卡对应不同的显卡驱动;
  • 训练数据种类繁多,数据量较大,管理起来较复杂,包括热数据备份和冷数据归档、存储容量扩展性、IOPS和带宽吞吐量等,都是复杂的工程性问题。
硬件资源:
  • 需要自己购买机柜、X86服务器、GPU显卡、UPS电源、交换机、路由器,维护成本高;
  • 需要维护一个X86服务器的备件库,保证GPU服务器的较高的训练效率;
  • 服务器、GPU卡属于固定资源,无法做到资源快速扩展,重新采购周期较长;
  • 训练数据的周期性迭代,使得硬件资源使用率存在高低峰值。
资金投入:
  • 硬件资源购买需一次性投入大量资金;
  • 电费开销巨大,一般还需要涉及电路改造;
  • 需要专业的硬件和操作系统运维工程师。

UCloud软硬件并行,提供完善的解决方案

硬件资源:

UCloud提供NVIDIA Tesla系列GPU卡P40。P40是NVIDIA推出的专门用于深度学习训练和推理的GPU卡,提供比CPU服务器快40倍的深度学习推理速度,采用NVIDIA新的PascalTM 架构和16纳米制造工艺,具有3840个流处理器,核心主频高达1303~1531MHz,24GB GPU显存;高达12 TFLOPS单精度浮点运算和47TFLOPS整数运算能力(INT8)让深度学习的速度飙升。
UCloud提供单机4卡P40物理机:


UCloud提供基于P40云主机:

UCloud解决方案

格灵深瞳云端架构:

格灵深瞳原先自建的机房深度学习训练平台使用单机8卡(GTX 1080Ti)的GPU物理机。迁移到UCloud云上之后,选择UCloud的单机4卡(P40)GPU物理机+单机4卡(P40)GPU云主机,训练数据三副本存放在UCloud提供的3台万兆网络环境的SSD物理机上,最终实现资源层弹性伸缩和存储层可靠性。

软件架构(PaaS):

UCloud最近刚发布了AI-Train在线训练产品,解决包括代码管理、运行环境维护、GPU管理维护、数据管理等模型训练过程中的每个环节,提供一站式Paas解决方案。下一步,我们将了解格灵深瞳的软件架构,为其解决模型训练场景所带来的一系列工程性难题。

客户收益

通过使用UCloud的服务,帮助格灵深瞳解决硬件成本以及人力成本,大幅度降低了格灵深瞳的成本投入。
资金投入前后对比:
前:硬件资源购买需一次性投入大量资金。
后:UCloud所有产品都可以提供按需付费模式,不需要一次性付费,提高了客户资金的利用率。

前:电费开销巨大,一般还需要涉及电路改造。
后:UCloud所有GPU资源都不收取产品费用以外的任何费用。

前:需要专业硬件和操作系统运维工程师。
后:UCloud所有GPU产品有专业的团队运营维护,发生硬件故障后,可以快速从备件库更换新硬件,或者开启新的GPU资源,删除故障机器。

现在,格灵深瞳已经成为UCloud在人工智能领域的标杆客户。在摸索探寻人工智能的道路上,我们发现“中立性”是人工智能公司对云计算厂商重要评估标准之一。此次UCloud成功将人工智能技术与云计算服务结合,从中带来的经验和可复制性,将为UCloud进军人工智能领域打下坚实的基础。