您的位置:首页> 科技 >鲲鹏云服务器实战:华为云鲲鹏KC1实例 vs. 阿里云G5实

鲲鹏云服务器实战:华为云鲲鹏KC1实例 vs. 阿里云G5实

2019-11-11 14:02:03
[摘要] 今年1月,华为正式发布昆鹏920数据中心高性能处理器。作为市场上为数不多的基于arm架构的云服务器之一,华为云基于鲲鹏920处理器的通用计算增强型kc1实例已经在各个方面与阿利云的企业级通用g5实例进

今年1月,华为正式发布昆鹏920数据中心高性能处理器。该处理器与arm架构兼容,制造于7纳米,最多支持64个内核,主频为2.6ghz,支持8通道ddr4、pcie 4.0和100g roce网络。

作为市场上为数不多的基于arm架构的云服务器之一,华为云基于鲲鹏920处理器的通用计算增强型kc1实例已经在各个方面与阿利云的企业级通用g5实例进行了比较。

一、处理器和内存性能

我们这次测试的云服务器产品是华为云彭坤通用计算增强kc1实例和阿里云企业通用g5实例,各三个。所有服务器都有4个内核和16gb内存,运行centos 7.4操作系统,位于北京。

华为云kc1的例子是华为开发的昆鹏920处理器,主频为2.6ghz。ariyun g5的一个例子是基于英特尔skylake架构的至强白金8163处理器,主频为2.5ghz。我们使用unixbench来划分这两台服务器的性能。应该指出,由于两个服务器的架构不同,相关的执行指令会略有不同。

华为云kc1实例需要在用完点之前为unixbench重新编译。如果直接编译,将报告错误。以下三条说明专门针对采用arm架构的服务器:

修改后,unixbench可用于拆分两台服务器。

Cpu多核整数分割指令:

Cpu多核浮点分割指令:

这里,我们分别在华为云kc1实例和ariyun g5实例上运行了六次,结果如下:

通过平均分数的比较,我们发现华为云kc1实例的多核整数分数远高于ariyun g5实例,多核浮点分数相同。由此可见,鲲鹏920处理器在性能性能上并不落后于x86架构处理器,在整数计算方面有着更加明显的优势,即可以更好地处理基因测序、图像渲染、大数据等大规模、高强度的数据处理任务。

让我们来看看这两种内存性能的表现。在内存方面,不同的制造商也选择不同的内存。为了节约成本,云服务器制造商通常很少公布内存的频率和型号。这里我们用流工具测试它。

流是内存带宽中最流行的综合实用性能测量工具之一。它支持四种操作:复制、缩放、添加和三元组。

拷贝首先访问一个存储单元以读取其值,然后将该值写入另一个存储单元。缩放操作首先从存储单元读取值,执行乘法操作,然后将结果写入另一个存储单元。加法操作从存储单元读出两个值,执行加法操作,然后将结果写入另一个存储单元。三元组的表示结合了复制、缩放和添加到测试中。

相应的四个操作如下:

在测试之前,您应该解压缩并编译流文件。具体编译代码如下:

在这里的内存测试中,我们还对测试服务器进行了十次平均,具体测试数据如下:

*以上数据单位均为mb/s

通过比较平均值,我们可以看出,在相同配置下,华为云kc1实例使用的内存优于ariyun g5实例。这种快速的数据传输也为服务器的数据处理能力提供了更好的保证。

此外,内存延迟也对整个服务器的数据处理能力有很大影响。这里的内存延迟是指3级缓存的延迟。

目前,处理器通常有三级高速缓存。提取数据时,处理器将首先从最近的缓存开始,当它不能提取数据时,它将进入内存提取数据。离处理器越近,获取数据的速度就越快。通过lmbench和其他工具,我们可以准确地描述读取延迟,这就是我们所说的内存延迟。不同缓存的延迟呈指数增长。在相应的缓存中,延迟是稳定的。

内存延迟以纳秒为单位,而我们的实际业务需求通常以毫秒为单位。通过lmbench,我们获得了两台服务器的延迟:

其中,华为云kc1的平均内存延迟为100.9纳秒,标准偏差为0.74。Ariyun g5的平均内存延迟为125.1纳秒,标准偏差为1.20。从这组数据中,我们可以看到华为云kc1的内存延迟级别更低、更稳定。与Ariyun g5相比,它在时间上压缩了近20%,能够更好地为处理器提供稳定高速的数据处理能力。

我们已经看到,作为新产品,华为云彭坤云服务器kc1在处理器内存性能上甚至可以超过同等水平的x86服务器。据信,对于x86阵营的云服务制造商来说,是时候直面强大的对手鲲鹏云服务器了。

二.网路性能

一般来说,每个云服务制造商都允许用户申请多台服务器,以便在同一个机房中构建各种服务。这项服务被称为虚拟私有云。用户可以在这些服务器之间自由配置ip地址段、子网、安全组和其他子服务,也可以申请灵活的带宽和灵活的ip来构建业务系统。

这里,我们首先使用netperf工具来测试两个服务器运营商内部网之间的tcp带宽性能。在这里,我们需要在每台主机上打开两台拳击机。netperf安装在测试机和2台备用机器上。测试机器是服务器,拳击机器是负责流式传输的客户机。

测试端口顺序如下:

客户端密码如下:

然后通过sar命令检查流数据的平均值,测试结果如下:

测试结果显示,华为云kc1实例的内部带宽约为4936000 kb/s,阿里云g5实例的内部带宽约为18800 kb/s,但阿里云g5实例的内部网最大带宽为20gbps(16核64gb),4核16gb版本的峰值速度约为1.5gbps,基本相当于测试级别。然而,总体而言,华为云kc1在内网带宽方面更具优势,适合由多个数据量相对较大的服务器组成的内网服务器集群。

当然,除了内部网的带宽之外,延迟也是一个重要参数。延迟决定了系统每秒处理的最大请求数,而带宽决定了可以支持的最大负载。

Qperf与iperf/netperf一样,可以评估两个节点之间的带宽和延迟。可以测试Tcp/ip协议和rdma传输。然而,与netperf和iperf相比,rdma支持是qperf工具的一个独特特性。在centos中安装qperf相对简单,可以使用yum工具直接安装。

为了通过qperf测试服务器的延迟和带宽,需要两台服务器,一台服务器和另一台服务器,来完成客户单个流。服务器直接运行qperf,没有任何参数。

服务器在没有任何参数的情况下直接运行qperf,默认情况下,端口19765将被打开。客户端在操作过程中不需要指定端口号来获得带宽和延迟,只需要指定主机名或ip地址。在这里,我们观察服务器和客户端之间的延迟,平均进行五次测试。测试结果如下:

我们可以看到华为云kc1实例的内部延迟是35.92微秒,而ariyun g5实例的平均延迟是41.70微秒。华为云的内部延迟更短,使得内部网络之间的数据交换越来越快,比ariyun g5服务器提高了15%。

就内部网的带宽和延迟而言,我们可以看到华为云kc1比ariyun g5更具优势,这使得构建大规模内部网服务器集群成为可能。

三、存储性能和价格

在此阶段,不同的云服务器供应商将提供不同的存储解决方案来应对各种使用场景。这种存储解决方案通常被称为云硬盘。它为ecs和bms等计算服务提供持久块存储服务,并通过数据冗余和缓存加速等多种技术提供高可用性、持久性和稳定的低延迟性能。用户可以格式化云硬盘、创建文件系统和持久存储数据。

目前,云服务供应商基本上提供三种存储解决方案,即普通云盘、高速云盘和ssd云盘。在这里,我们通过安装不同种类的云盘来测试测试仪的存储容量。

这次我们测试了两家制造商的超高io云磁盘/固态硬盘。测试中使用的工具是fio。测试项目包括随机读写iops和顺序读写吞吐量。测试磁盘的大小是1000gb。

在4k随机读写测试中,华为云超高io云盘达到33000 iops,顺序读写吞吐量达到350 MB/s,云盘速度远高于阿里云。

从固态硬盘云盘的比较来看,华为云更具领先优势,阿里云固态硬盘云盘的性能是可以接受的。不久前,华为云发布了云存储全闪存战略,我们也预计华为云将继续在存储领域取得突破。

在价格方面,ariyun g5服务器的4核16gb价格目前为每年4732.8元。除了4核16gb配置之外,最多还有64核可用。然而,华为的云kc1服务器目前处于公开测试阶段,支持多达60个内核,用户可以在测试期间申请免费使用。

摘要

目前,大多数云服务供应商主要基于x86架构服务器,大多数客户对arm架构服务器持观望态度。然而,通过这次评估,我们发现鲲鹏云服务器在计算、网络、存储等方面已经成熟,在大数据和基因测序等整数计算场景中比x86更具优势。我相信昆鹏新计算能力的增加可以为各种应用提供新的计算能力选择。

早些时候,作者与同行讨论了一个问题。英特尔应该害怕服务器市场上的amd吗?显然,英特尔和amd都是x86阵营中的服务器制造商,而威胁x86架构服务器的恰恰是系统之外的ARM。redis的创始人Salvatore sanfilippo此前也表示,他正在使用arm作为redis的主要架构。然而,微软也开发了对视窗10应用arm的支持。简而言之,arm的未来是可以预见的。

当然,arm服务器要成为云的主流还有很长的路要走。虽然华为基于鲲鹏处理器的云服务向业界释放了鲲鹏的新计算能力,但这也向我们展示了华为在这一领域的坚定决心。

正文已结束,您可以按alt+4进行评论

北京赛车pk10官网 上海11选5投注 500彩票 快开彩票平台

时事