移动版

主页 > 电子游艺 >

阿里云发布的神龙云服务器究竟是什么?

马云用“达摩院”这三个字描绘了未来,打动了互联网另一端数亿人。但我却注意到另一个可以描绘未来的东西,那就是随后阿里云总裁胡晓明发布的“神龙云服务器”。

因为技术的阻隔,普通人一看到“服务器”的字眼,就觉得索然无味。不过,我觉得“神龙”这招棋真的挺热血的,不懂技术的普通人也不应该错过。

阿里云发布的神龙云服务器究竟是什么?

1、云计算就像组球队

粗浅地理解,阿里云对外提供服务,基本的单位就是“服务器”。

如果把每个服务器看成是人的话,那么阿里云就是一支拥有数百万队员的足球队。

在其他方面,云计算和组球队也很像,我们不妨参考现代足球发展史:

1)最开始,足球运动只是一群人聚在一起玩的娱乐游戏,他们的本职工作可能是牙医,可能是企业职员。那时候所有的选手都是“业余球员”,不靠这个赚钱。

2)随着足球运动发展,全世界很多大城市都有了自己的足球队,也有了世界杯、欧洲杯等等赛事,足协通过广告之类的商业运作把这项运动变成了赚钱的“生意”,随之而来出现一个新物种——“职业球员”。也就是他们除了踢球,不做别的。

这个过程就叫做专业化。

回到云计算上来。

云计算的发展其实和足球运动的发展非常相似,也正在经历从“通用化”到“专业化”的转变。只不过现代足球从诞生到进入专业化用了五十年,而云计算只用了五年。

阿里云发布的神龙云服务器究竟是什么?

图为31年前的世界杯,马拉多纳上帝之手。

2、云计算的“专业球员”就是神龙

云计算怎么区分“业余”和“专业”呢?

其实,最开始云计算服务器所用的“材料”,包括 CPU、内存、机架等等都只能采用和传统服务器一样的型号,没得挑。受制于这些硬件架构,就连调度系统和传输逻辑也非常拧巴。这些零件凑成的云计算服务器倒是能用,但只能算“业余选手”。

阿里云发布的神龙云服务器究竟是什么?

阿里云事业群虚拟化平台研发总监 张献涛

当时的云计算服务器有多业余呢?阿里云事业群虚拟化平台研发总监张献涛给我做了个科普:

云计算的基础技术叫做虚拟化,就是在一台“物理机”上用代码搭建出一台“虚拟机”,这样这台虚拟机通过软件就能被方便地伸缩,按需分配。

举个例子:传统服务器上的 Intel CPU,有四个特权级,0、1、2、3,默认操作系统跑在0级,而应用跑在3级。这种情况下, 实际上没有资源预留给虚拟化系统,如果硬要在这样的 CPU 上实现虚拟化,就要写非常复杂的代码。虚拟出来的机器,性能还不到物理机的一半。

阿里云发布的神龙云服务器究竟是什么?

传统服务器

他说的情况发生在云计算的早期,随着发展,各个方面都在慢慢变得“专业化”:

1)Intel 最先在芯片里面加入了支持虚拟化的“VT-x”技术,这样之后虚拟化性能就大幅提升了。

2)但这些 CPU 的进步都算是小小的改良,随着各大云计算厂商生意越做越大,他们觉得,这么小修小改还是不过瘾,于是干脆直接向 Intel 订货。最开始是亚马逊和阿里云两家,后来几乎所有有规模的云计算公司都开始向 Intel 购买定制化的芯片。

3)然而,最近两年阿里云的市场又发生了爆炸式的增长,只定制 CPU 芯片也不过瘾了。进一步提升虚拟化技术要靠整体架构的改进。

说白了,现在的云计算迫切需要一批正经的“职业球员”了——神龙云服务器就是在这个背景下开发出来的。

之所以说神龙云服务器是一种新的云计算架构,是因为它从调度的芯片,到虚拟化的机构、软件系统、资源调度方式都发生了巨大的变化。

通用服务器可以做云服务器,也可以做 IDC 机房的服务器,甚至可以拆下来当做个人电脑;而神龙云服务器只能用作阿里云的服务器,代价是用情专一,换来的是性能优异。

3、“专业球员”是被逼出来的

张献涛形容了一下“神龙”的性能:

物理机的处理能力+云主机的可扩展性

这句话的意思相当于:我的这辆车,有公共汽车那么宽敞,还有保时捷的速度和灵敏。听起来还是挺厉害的。

阿里云发布的神龙云服务器究竟是什么?

在迪拜还真有这样一种“超级巴士” orz

果真如此厉害的话,他们就把云计算推入了一个新的时代:

1)因为这个架构拥有物理机的性质,不仅性能高,而且还能在虚拟机之上还可以进行一次虚拟化,这就让以前只存在于想象中的网络架构成为现实,进而能适应更复杂的业务。

2)因为这个架构具有虚拟机的优势,所以仍然可以“用1核就交1核的钱,用1秒就交一秒的钱”,保证了互联网时代的用户体验。

在云计算领域(其实其它领域也差不多)有这样一个规律。看哪家企业发展得大,就看它遇到了什么坑:

1)有的技术门槛在十万用户的时候会遇到,有的坑会在百万用户级别的时候才会出现,有的问题要等用户增加到五百万才能显露出来。

2)当你克服了一个坑之后,客观上说明你已经“打怪升级”了。当你遇到的”Boss“是所有竞争对手都还没遇到的时候,恭喜你,在这个商业游戏里你的”进度“可能是最靠前的了。换句话说,你已经是老大了。

这次,阿里云好像就遇到了别人还没有遇到的坑。

张献涛说得很实际:某种程度上说,并不是阿里云主动要开发一个新架构的服务器,而是在阿里云上的一些大企业,已经遇到了性能的瓶颈,阿里云如果不“被逼”改进技术,就没办法服务他们了。

之前的虚拟化技术有什么瓶颈呢?

首先,由虚拟化技术生成的虚拟机有一些特性的损失,这是无法避免的。

其次,就性能而言,如果仅看跑分,虚拟机的性能大概在物理机的90%左右,这个理论数据并不低,但这是一个上下波动的平均性能值,并且这种波动是虚拟化无法避免的。但是在实际应用中,这种波动还是会造成不小的业务性能下降,例如:业务访问的延时。

一个研究表明,比如谷歌这样的广告系统,150毫秒出结果,和300毫秒出结果,对于用户来说几乎感受不到差别,但是就是这样的差距,会直接把谷歌的广告收入拉低 20%。

张献涛给出这样的数据。

也就是说,对于谷歌这样的客户来说,一旦有新技术能解决云计算的虚拟化的性能问题,他们一定会在第一时间买单。实际上,阿里云的部分大客户也是类似。他们手里攥着钱,“逼”阿里云开发“神龙”这样的服务器出来。

当我问到神龙具体技术细节的时候,张献涛不肯透露。他只是说:为了开发这个技术,团队新招聘了几十名服务器软硬件方面的专家,从团队磨合到开发成功用了一年半的时间,研究的花费在千万元级别。

其实,不能透露技术细节的原因很容易理解。毕竟阿里云是全球第一个推出自研架构云服务器的厂商,而且性能指标完全碾压传统架构,就连现在公认的云计算老大亚马逊也还没有走到这一步。前两天阿里巴巴的股价刚刚追平亚马逊,正是暗中较劲的关键时刻。从大历史的角度看,神龙有可能成为打破平衡的“神器”,国之重器,自然不可示人。

阿里云发布的神龙云服务器究竟是什么?

神龙云服务器和普通云主机的架构区别

4、“神龙”仍待完美

就在几年前,原创在中国都是一个奢侈品。最近,我们习惯了从中国兴起的商业模式的原创,例如共享单车。不过在技术方面革命式的创新,已经很久没有发生了。

从这个角度说,神龙算是一个标志。

如果这个架构继续完善,阿里云应该会触摸到下一代云计算的第一个权杖。

当然,这些都是建立在假设之上的。现在刚刚推出的神龙并不完美。自研一套完整的云服务器架构,这件事情的难度怎么高估都不过分。不过无论对谁来说,要想成为行业第一,这就是应该付出的代价。

如果每天就是买服务器卖云计算,机械化地赚钱,我自己一定会觉得无聊。正是因为每天都挑战新的东西,我们的工作才有意义。

张献涛说。

第一代神龙的有待完美,却让我想到了一个故事:

1831年,法拉第在一次会议上展示了人类的第一台发电机,一位贵妇人起身问道:先生,你的发电机唯一的功能就是让旁边的电流表指针轻轻摆动,这东西有什么用呢?

法拉第回答道:夫人,一个刚刚出生的婴儿又有什么用呢?

阿里云发布的神龙云服务器究竟是什么?