资讯专栏INFORMATION COLUMN

云上战“疫”背后:快杰云主机的技术担当

AJie / 872人阅读

摘要:宋体在这场战疫中,快杰云主机历经了多项考验,在计算网络存储各方面均具备优异性能。宋体宋体宋体快杰云主机的优异表现依托于产品的技术优化,来看一组快杰云主机的配置参数搭载最新硬盘网络,并通过最新的智能网卡提供硬件卸载。

新冠肺炎催生了办公、医疗、教育等行业的“线上解决”,加速了各行业与“云”的结合,也对不少服务企业提出了新的考验:持续攀登的高并发、多连接,需要更加高性能稳定的云平台支撑,确保不宕机、不卡断以及流畅稳定的云上体验。

在这场战“疫”中,UCloud快杰云主机历经了多项考验,在计算、网络、存储各方面均具备优异性能。其中,为了响应“停课不停学”的号召,快杰云主机为小禾科技线上教育直播平台提供了高性能稳定的云资源支持,同时UCloud还免费提供直播带宽和流量等资源,保障高并发场景下直播平台及课程的顺利进行。

 

快杰云主机的优异表现依托于产品的技术优化,来看一组快杰云主机的配置参数:搭载Intel最新Cascade Lake CPU、NVMe SSD硬盘、25G RDMA网络,并通过最新的智能网卡提供硬件卸载。在这其中,每一项参数优化均经历了诸多思路重建、革旧换新的技术更迭。

下面我们就来聊聊快杰云主机的“破局”之路。

一、存储“破局”

快杰云主机搭载的NVMe SSD硬盘,采用64层3DNAND,支持8TB/s高速TRIM。支持性能出色的同时,NVMe SSD硬盘通过动态精确能耗控制,能源效率也比前代提升38%。

国内专业云资源选型服务平台 CloudBest 实验室的报告中(阿里云、腾讯云、UCloud 、华为云云主机对比测试报告),关于“磁盘性能”的测试结果如下:

图:队列深度7*16的【随机读写】&【平均时延】

可以看到,快杰云主机的I/O读写能力对比其他云厂商最高可达到10倍的差距,平均时延可降低近6倍,磁盘性能的优势非常出众。

磁盘性能对于云主机来讲是非常重要的一个参数,快杰云主机在云盘优化方面做了很多工作,我们将这些工作用六个字来总结:要致富、先修路。

1、更高效的存储架构:NVMe筑基

要修路,先筑基。从泥泞路径到柏油马路,决定的是道路的基础质量保障,并且基础架构设施的质量提升足以促进产品性能产生大幅度的飞跃。

同理,在快杰云主机云硬盘的基础架构上,采用的便是行业内最优的NVMe存储架构

与传统的SATA架构不同的是,NVMe传输协议在诞生之初就充分利用了PCIe SSD的低延时以及并行性优势,成为计算存储行业的大热趋势。

NVMe SSD比SATA快在哪里呢?举个例子,市面上性能不错的SATA SSD,在队列深度上可以达到32,然而这也是AHCI所能做到的极限罢了。而PCIe SSD下的队列深度则需达到128,甚至是256才能够发挥出最高的IOPS性能,NVMe解决了这个问题——在NVMe下,最大的队列深度可达64K,此外,NVMe的队列数量也从AHCI的1提高到了64K。

图:NVME&AHCI队列深度对比

同时,PCIe主控与CPU直接相连,对比SATA主控通过控制器中转再连接CPU的方式, PCIe SSD因此具备更低的时延。可以看到,对比SATA,PCIe接口本身在性能上具备更高的优势,再加上NVMe具有比AHCI更深、更宽的命令队列,NVMe SSD成为行业技术大势也就不足为奇了。

这便是快杰云主机云盘优化工作的第一步,NVME筑基。

2、 更宽阔的通信道路:25G以太网加速

道路基础修建好后,还有一个问题:如何最大化地提升道路通行速率呢?从单行道变为八车道绝对是捷径之一。

同样,在快杰云主机云盘优化的工作中,我们采用了25G以太网络替代传统10G以太网,大大提升了存储数据传输的速率。

目前大部分数据中心主要是基于10G以太网架构,随着互联网下数据的爆发式增长,数据中心必须通过增加与现有基础设施并行的带宽能力实现扩展,从而有能力处理不断增大的数据负载。而25G便是下一代数据中心网络带宽和信道容量扩展的新方向。

相比10G,25G以太网具有增强计算和存储效率的优点,能够提供带宽更高、速度更快的连接,我们可以把它看做加速2.5倍的10G以太网。此外,可以运行两个25G通道实现50G,或运行四个通道实现100G,并且25G完全兼容10G以太网的相关物理标准,可以实现新旧应用的平滑迁移。

图:25G以太网&10G以太网对比

25G以太网之于10G以太网便是单行道到八车道的飞跃,网络带宽能力的大幅提升帮助快杰云主机实现数据传输的加速,从而助力磁盘性能提升。

3、更轻量级的传输路径:RDMA降低延迟

近两年国家大力普及高速公路ETC取代传统的人工收费站模式,司机无需停车便可实现快速感应过车。与传统收费模式相比,ETC耗时不到两秒,通行能力是人工收费通道的5至10倍。可以预见到,一辆车可提高5-10倍的效率,那么对整条高速路而言,就会是极大的通行速率提升。

我们这里说到的RDMA便具备类似的功能。RDMA是一类通信协议,也是近几年在云计算/大数据领域非常火的一项新技术,它的全称为远程直接数据存取,就是为了解决网络传输中服务器端数据处理的延迟而产生的。

在详细介绍RDMA功能之前,先来了解下传统TCP/IP通信模式的瓶颈。

传统的TCP/IP网络通信通过内核发送/接收消息,数据发送方需要将数据从用户应用空间Buffer拷贝到内核空间的Socket Buffer中,并在内核空间中进行添加数据包头、数据封装等一系列操作。同样,数据接收方也需要在内核进行大量数据包解析工作,并第二次拷贝到相应位置的用户空间Buffer。

图:TCP/IP&RDMA传输原理对比示意

在这样复杂的传输过程中,内核承担了极大的压力,一旦遇到大量数据传输的情况,势必会造成硬盘I/O读写能力的延迟。

RDMA则通过网络把资料直接传入计算机的存储区,将数据从一个系统快速移动到远程系统存储器中,不会对内核造成太大影响。RDMA消除了外部存储器复制和上下文切换的开销,因而能解放内存带宽和CPU周期用于改进应用系统性能。RDMA作为快杰云主机后端存储的通信协议,实现收发包卸载到硬件,使得RSSD云盘的延迟降低到0.1毫秒,从而大幅度降低数据处理的延时。

简单来讲,RDMA好比是ETC,省去了停车、沟通、缴费等复杂的步骤,避免成为数据传输中的瓶颈,形成一个更轻量级的传输路径。

除此之外,针对虚拟化IO路径的性能瓶颈问题,我们使用SPDK VHost代替QEMU,实现虚机到存储客户端的数据零拷贝;在存储引擎方面由SPDK代替libaio,高并发场景下依然可以保持较低的时延。

总的来说,通过一系列技术革新手段,使得快杰云主机NVMe-SSD云盘的磁盘性能达到最佳状态。

二、网络增强2.0的“破局”

当我们搭建好一个超高性能的云硬盘,云主机的优化工作就结束了吗?

答案是,远远不够。事实上,此时还会出现一个问题,那就是云主机日益增长的高性能需求与落后的核心配置之间的矛盾。

而这个矛盾就是由传统的内核CPU处理模式所带来的。

1、CPU的局限性

早期,服务器的功能较为简单,需要处理的数据运算量也不大,因而所有的应用处理均是由CPU内核完成的,此时的CPU作为核心大脑是绰绰有余的。

但是,随着云计算和大数据时代的来临,云主机的计算需求越来越高。举个例子,云主机会附加VNF的安全功能,而此类安全应用的处理与网络传输不同的是,往往需要将数据包一一拆开做解析,对CPU的处理能力带来极大的负担。这时的CPU可以看作是拆东墙、补西墙的状态,计算能力的大幅度消耗,势必会带来对其他应用的效率影响,从而造成云主机整体性能的下降。

在这样的背景下,网络与计算的高效融合势在必行。

2、网络增强2.0:基于OpenvSwitch卸载的智能网卡方案

一开始,为了解决云主机的计算性能问题,产生了TOE技术(TCP offload engine),即将TCP连接过程中的相关计算工作转移到专用硬件上,从而释放CPU资源,而这个专用硬件就是早先的普通网卡。

不过,随着Iaas的云计算服务模式出现,云主机需要承担更丰富的网络功能来满足云租户的需求,例如任意配置IP的虚拟私有网络、可扩展的4层负载均衡器、访问控制列表等等。这便意味着网卡需要具备更高性能以备网络性能的增强。

此时,

文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。

转载请注明本文地址:https://www.ucloud.cn/yun/117617.html

相关文章

  • UCloud AMD杰云主机助力蓝威加速HPC场景落地

    摘要:旗下产品有蓝威仿真云计算平台蓝威风场规划智能决策平台电子可靠性分析云平台。而快杰云主机采用了第二代处理器,主频高达另外,云主机采用的网络增强技术使得内网的最大包量可达万,同步配置的云盘带来的存储性能高达万。过去,高性能计算(HPC)因其高昂的成本和复杂的编程,长期只能被应用于军事、科研等高精尖领域。随着工业制造、生物医药、基因检测、影视渲染等行业的数字化转型,各领域对于高性能芯片、存储和内网...

    shleyZ 评论0 收藏0
  • 为科研量身定制,UCloud推出“云极”高性能计算EPC

    摘要:为了满足在更多复杂场景科研攻坚时,对于超高性能算力高速网络传输海量数据存储的更高需求,再次发力,于近日推出了为科研量身定制的新一代超算产品,并将正式更名为云极高性能计算以下简称。科研是科技创新的基础,而高性能计算则是科研的基石。随着数字化走向纵深,科研教育进入信息化时代。在科研项目的推进过程中,往往会面对复杂的数据密集型计算任务,例如仿真、数据建模、渲染等大量运算场景。此时如果使用单一的通用...

    Tecode 评论0 收藏0
  • 为科研量身定制,UCloud推出“云极”高性能计算EPC

    摘要:为了满足在更多复杂场景科研攻坚时,对于超高性能算力高速网络传输海量数据存储的更高需求,再次发力,于近日推出了为科研量身定制的新一代超算产品,并将正式更名为云极高性能计算以下简称。科研是科技创新的基础,而高性能计算则是科研的基石。随着数字化走向纵深,科研教育进入信息化时代。在科研项目的推进过程中,往往会面对复杂的数据密集型计算任务,例如仿真、数据建模、渲染等大量运算场景。此时如果使用单一的通用...

    Tecode 评论0 收藏0
  • UCloud怪兽主机再升级 新快杰3+1让超强算力即刻可得

    摘要:快杰云主机发布款全新机型在去年大会上,云主机团队推出了万网络性能万存储性能的快杰云主机。但同时价格则与上一代快杰持平,升频不加价。其中在的跑分中,快杰与上代快杰相比算力提升。除了上述三款性能主机外,上还发布了采用处理器的快杰型预览版。10月23日以构建·创见|为主题的UCloud用户大会暨Think in Cloud 2020(以下简称TIC)在上海召开。在本次大会上,UCloud推出了历经...

    Tecode 评论0 收藏0
  • 最新云主机性能测评:AWS、阿里云、华为云、腾讯云、UCloud

    摘要:上周,一篇云主机测评文章云服务器哪家强阿里云腾讯云华为云深度评测在朋友圈引发了热议。机型选择通用实例阿里云通用平衡增强型,华为云通用计算增强型,以及腾讯云标准型。上周,一篇云主机测评文章《云服务器哪家强?AWS、Azure、阿里云、腾讯云、华为云深度评测》在朋友圈引发了热议。然而其中,云主机性能一直颇为优秀,甚至在多次其它公开测评中位列第一的UCloud却在此次测评中缺席,因此,测评的结果不...

    Tecode 评论0 收藏0

发表评论

0条评论

最新活动
阅读需要支付1元查看
<