天翼云发布了新一代V5云主机,基于intel 最新发布的Intel? Xeon Skylake V5 CPU的物理机及KVM虚拟化提供的全新云主机系列。计算性能较上一代(V4 CPU+Xen虚拟化)提升15%左右,可以更高效的进行单、双精度浮点运算,适用于对计算性能有强需求的各种场景。
这里重点要提的是采用了虚拟化平台KVM!曾经的真爱!
记得2012年刚到云公司的时候,领导布置安排了在自己的笔记本上部署KVM虚拟化平台的活,于是,按照网上的教程一步一步的完成了部署,并开通了虚拟机。
那时候,一切都是刚起步,阿里云依然在默默的埋头研发自己的公有云平台,而我们的资源池已然上线,采用的是cloudstack+vmware/xen相对成熟的商用平台。
但采用openstack作为云操作系统,大规模部署KVM虚拟化平台,提供低成本的云服务,是我们当时的梦想。
KVM开源代码用c语言编写,读懂不太容易,为此公司还招聘了c语言高手和有kvm测试经验的测试人员。
可一切都是在美好中开始,也在美好中快速结束。
时光飞逝!云计算以超乎人们想象的速度高速发展!
今天,似乎又回到了起点,华为的合营资源池采用的正是6年前我们构想的openstack+kvm的架构。
废话少说,现在的问题是为何华为、阿里、还有aws将经过十几年运行检验的成熟可靠的xen架构转向kvm架构?
新旧架构的更替往往比我们想想的要快!
让我们来扒一扒xen为何而死掉?
为什么Xen会死掉?
新10年来,CPU已经从单核逐步走向了双核、四核、甚至是几十核心。NUMA技术,TB级内存也基本成为现代服务器的标配,众多厂商和Linux社区在内存和CPU调度和管理上做了大量的工作,而Xen Hypervisor采用独立的CPU和内存调度管理、核心实现还停留在Linux 2.4时代。经过了10年的发展后,根本无力去同步这么多的更新,我们今天会发现Xen已经落后的太多了,比如:
1.Xen只能提供2M物理页面,而DPDK需要1G的连续物理内存,这是DPDK不能支持Xen的最主要原因。
2.KSM是内核中的一种内存共享机制,在2.6.36版本的内核中开始引入,说白了就是一种内存共享机制,有助于腾出更多的可用物理内存,提高物理内存的使用率,Xen显然不支持。
3.多核(>128 CPU)调度: 虽然宣称能支持最大192+ core, 但是实际我们发现如果在128 core的4P服务器上创建大规格虚拟机并在其中使用高精度时钟,导致虚拟机频繁陷入陷出调度cpu,Xen就会出现严重问题,这显然是Xen没有经过大规模商业实践的表现。
4.我们再来看看数据中心的情况,AWS新一代的C5已经进入25GE核心交换时代了。Xen其实在处理10GE转发的时候就已经惨不忍睹,而且更重要的是,没有进一步的技术优化空间,Xen社区其实10年前就知道相关问题了,一直都在做些不痛不痒的优化,不去从根本上解决问题,一副好牌在手,最终却出局了......
Xen何去何从
AWS转用KVM后Xen项目计划进军嵌入式应用程序思杰(Citrix)高级技术总监表示:甲骨文都已经走KVM路线了,Xen如果能圈住甲骨文和亚马逊的话,还是可行的。而现在,Xen已经被逼上绝境了。但Xen是一个可重用技术组件,很高兴地看到Xen在新领域里成长,例如边缘计算、汽车、航空和航天等新使用案例。
Xen具灵活性、小巧体积和独立于操作系统等特征,Xen非常适合上述不断发展的领域。即将上线的边缘设备达数十亿,管理程序的寿命可能还是很长的,管理程序的未来也可能是美好的。
科普一下什么是DPDK?
【天翼云新一代V5云主机,Kvm之生,Xen之死!】简单说,DPDK在网卡驱动之上,socket接口之下,提供了一种应用直接访问网卡的接口。基于DPDK实现用户态网络协议栈,就成为可能。并且用户态协议栈可以避免中断,避免不必要的上下文切换,可以作到真正的zero-copy。这些在云计算,大数据场景下越发重要。