阿里云研究员祝顺民(因云而生的云原生网络)

阿里云研究员祝顺民(因云而生的云原生网络)
文章图片

注:本文作者祝顺民(花名江鹤),阿里云智能事业群研究员、网络产品负责人,在软件定义网络(SDN)和网络功能虚拟化(NFV)领域有多年技术研发和管理经验。带领团队从无到有,打造了业内最丰富的云网络产品线,并研发了阿里云飞天系统的云网络平台-洛神,历经10年双十一考验。
云计算的广泛使用正在改变云原生的定义,云原生正从狭义的云原生定义,即“微服务+容器+持续交付+DevOps”,向广义的云原生定义转变,即“因云而生的软件、硬件、架构就是真正的云原生”。云网络作为云计算标配的IaaS核心产品线,第一天就是依云而生,更是生而为云的,是真正云原生的网络。
当中年的网络遇见牙牙学语的云计算 阿里云研究员祝顺民(因云而生的云原生网络)
文章图片

1969年,美国国防部高级研究计划管理局建立了一个名为ARPAnet的网络,这被普遍认为是网络的开端。ARPAnet形成的TCP/IP体系结构和协议到今天还是网络世界的基础。随后的几十年里,网络在快速发展,到2009年,移动网络从1G、2G已经发展到了3G,我们使用的应用也从最早的电话、短信发展到图形、聊天、购物。这些应用的发展都离不开网络,可以说网络的发展驱动了应用的变革。同年,工信部正式为三大运营商发放了第三代移动通信(3G)牌照,从这一刻起,中国正式进入了3G时代。
2009年数据中心服务器的网卡大都还是1000M,到了2010年5月10日,阿里云对外发布第一个商业化的产品-云服务器ECS,正式提供公共云服务,标志着中国云计算公共云服务的开篇。
彼时,网络已经发展了40年,已经步入中年,而云计算刚刚诞生,还是牙牙学语的新生儿,中年网络遇见新生云计算会碰撞出怎样的火花呢?那时候,可能很多人都没有想到,云计算对网络的影响会如此之大。
2012年底,随着虚拟化技术的发展,单物理机的虚拟比在逐步提高,对网络设备提出了非常高的要求,当时全世界都已经找不到满足业务虚拟比的网络设备了。除此之外,当时的网络架构还存在成本、稳定性、性能等多方面的问题,这些问题极大地影响了云业务的开展。与此同时,随着更多用户上云,尤其是大型互联网企业和传统企业的上云,用户对云上网络管理需求也与日俱增。比如,用户在云上多地域部署业务,需要多地域内网互通,或者用户需要把云下IDC和云上网络互通,构建混合云等等,而这些网络管理能力,当时云上的传统网络架构都难以满足。
中年网络和新生云计算发生了激烈的冲突,已到中年的网络必须创新才能满足新生儿“云计算”的快速发展需要。
2012年,阿里云率先放弃传统的大二层传统网络架构,设计新的网络虚拟化(Overlay)技术方案。2014年阿里云虚拟专有网络VPC产品正式上线,VPC是中年网络和新生云计算结合的产物,VPC也是云网络的标志性产品,验证了“网络+云计算=云网络”公式的成立。因此,从第一天起,云网络就是因云而生的。
云网络是天生具备云特征的网络 阿里云研究员祝顺民(因云而生的云原生网络)
文章图片

云网络因云而生,天生具备云的特征。
首先是资源共享。通过将网络资源虚拟化,使用Overlay技术实现多租户共享网络资源,但租户间又是安全隔离的。Overlay技术让每个用户都可以像使用虚拟机一样使用云网络,包括使用虚拟交换机/虚拟路由器/虚拟负载均衡等等。
其次是弹性伸缩。对于传统设备来说,设备买回来,处理性能就确定了,难以弹性伸缩。云网络为了应对弹性伸缩的,将控制面与转发平面进行分离部署,并且采用集群的方式支持扩展,结合网络虚拟化技术为每个用户提供了弹性网络能力。
再次是自助服务。这是从用户视角看到的云网络与传统网络的最大区别。传统网络需要专业网络管理员敲CLI(Command Line)命令行进行配置,而云网络API和控制台,用户可以很轻松完成云网络搭建。
最后是按需付费。企业使用传统网络设备,即使利用率不到30%,为了一定的弹性,也只能超额购买,而云网络采用按需付费,企业根据实际使用量进行收费,用多少付多少钱,这也是传统网络所不具备的。
云网络的发展历程 阿里云研究员祝顺民(因云而生的云原生网络)
文章图片

云网络发展经历三个阶段,2009年的云网络1.0,即云数据中心网络;2016到2020年的云网络2.0,是云广域网络,再到2020年开始的云网络3.0,是应用-云边一体网络。在不同的阶段,云网络给用户提供了不同的产品能力,满足用户的网络需求。
阿里云研究员祝顺民(因云而生的云原生网络)
文章图片

云网络1.0是云数据中心网络,是为用户在云上提供构建数据中心网络的产品能力。用户可以通过点点鼠标,创建VPC、虚拟交换机、虚拟路由器,构建数据中心网络环境,再通过EIP,负载均衡SLB,NAT网关等产品实现互联网访问。
云网络2.0的核心是云广域网络,用户在云上多地域部署业务系统后,很自然的需求就是多地域内网互通,另外,用户还有云下IDC和云上VPC互通的需求,云广域网络可以很好的满足用户这两个业务场景的需求。2017年,阿里云在业内率先发布云企业网CEN,用户可以非常简单快速的构建一张全球化网络。2018年,阿里云还发布了云原生SD-WAN产品-智能接入网关SAG,方便用户快速上云。云网络2.0让用户轻松构建一张云上云下一体的全球网络。
2020年,5G/IoT/边缘计算技术的发展,社会进入万物互联和产业互联网时代,云计算已经成为整个数字社会的基础设施,云网络也开启了3.0时代。云网络作为数字化社会的高速公路,将会拓展到边缘,并和应用产生更好的协同,让万物互联,助力产业互联网的发展。
基于云原生的洛神云网络技术 阿里云研究员祝顺民(因云而生的云原生网络)
文章图片

云网络因云而生,依云而建,第一天就采用全自研的方式,走出了一条基于云原生特有的云网络技术之路。包括大规模SDN控制技术、Sailfish软硬件一体转发技术、CyberStar弹性网元技术等。
自研大规模SDN控制器,让用户不再担心规模和复杂度
阿里云研究员祝顺民(因云而生的云原生网络)
文章图片

SDN控制器是规模和管理效率的关键。云原生趋势下,大量用户基于云使用Docker和K8s,这对云网络的规模和密度提出了很大的挑战。SDN控制器可以满足用户每VPC容纳100万实例的超大规模需求,也可以满足用户对单个ECS的高密度弹性网卡需求。此外,在公共云大规模背景下,管理效率也非常关键。包括用户配置变更的实时性、易用性等,这些都是基于云原生构建的SDN控制器优势所在,让用户不用再担心规模和复杂度问题。
自研软硬一体的Sailfish转发平台,让用户不再担心性能问题
Sailfish硬件转发平台基于专用可编程芯片、智能网卡等高性能转发组件,通过软硬件一体架构设计,构建主机和基础网关高性能转发能力。包括软硬件一体高性能网关XGW、MOC卡、ALI-LB等核心模块,目前广泛应用在云网络的各个场景。如下图所示:
阿里云研究员祝顺民(因云而生的云原生网络)
文章图片

XGW网关负责公网、专线和跨Region流量的汇聚和分发。MOC卡是服务器内部网络核心组件,负责服务器内部ECS流量的转发和交换。XGW网关和MOC卡一起为客户搭建一张虚拟专用网络。在这张虚拟专用网络中,典型场景如下:
1)用户经internet(公网)访问阿里云,使用的典型产品有EIP和共享带宽;
2)用户IDC访问阿里云,使用的典型产品有高速通道(专线);
3)云上跨地域通信,如北京地域ECS访问深圳地域ECS,典型产品有CEN;
网络设备的演进始终呈螺旋式发展态势,围绕着灵活性和高性能,软件和硬件在相互融合、相互促进。从最开始的硬件转发设备,到软件转发设备,再到目前硬件卸载的软硬一体化转发设备以及大行其道的可编程转发设备。灵活性和高性能就像一只无形的手,引导着技术的持续发展。
而在这方面,云计算服务商的驱动力更大,促使云网络的研发走在了业界的前面。以阿里云自研软硬件一体高性能网关XGW为例。有客户提出通过高速通道(专线)构建混合云,对专线带宽的需求是10Tbps!如果采用原有的x86服务器构建,即使采用高性能服务器,考虑一定的冗余性,也需要近百台服务器,不管是成本还是运营效率都是服务接受的,这促使云网络研发出软硬件一体的高性能网关XGW。
阿里云研究员祝顺民(因云而生的云原生网络)
文章图片

阿里云自研软硬件一体高性能网关XGW
XGW乍一看像一台2U的服务器,主要部件有负责大流量转发的P4可编程交换芯片,负责大表项转发的自研网卡芯片,负责业务编排和智能调度的CPU模块。目前单机可以支持3.2Tbps,已经在线上规模使用,让用户不用再担心性能问题。
CyberStar弹性网元平台,让用户真正按需弹性,让投资更有效。
随着更多大型企业用户上云,用户对弹性的要求越来越高,特别是视频直播、电商大促等业务场景,经常提出突增百倍甚至千倍的弹性需求。此外,用户对新功能的交付时间也有很高的期望,平台也希望能尽快满足用户需求。在这样的背景下,原有的基于x86服务器构建的技术架构就不能满足业务需求了。在电商大促场景,公共云用户众多,平台也不知道到底多少用户会进行大促,一旦用户弹性需求出现,需要用大量负载均衡SLB,此时再去购买和部署x86服务器,扩容SLB集群就为时已晚。
【阿里云研究员祝顺民(因云而生的云原生网络)】因此,基于云原生的ECS构建弹性就是自然选择。CyberStar弹性网元平台最大的特点是网元不再直接部署在裸金属服务器或专用计算资源池内,而是基于公共云上ECS部署,基于ECS构建意味着资源“无限”,弹性“无限”,让业务网元不再依赖传统x86物理服务器部署,解决了采用物理服务器部署扩容长、弹性扩展困难等问题。目前,CyberStar弹性网元平台广泛应用在应用负载均衡ALB,NAT网关,PrivateLink,CEN-TR,全球加速GA,VPN网关等核心产品。应用负载均衡ALB提供每实例100万QPS能力,并可“无限”弹性,真正做到让用户按需弹性。
未来展望
阿里云研究员祝顺民(因云而生的云原生网络)
文章图片

2020年,IDC FutureScape认为云专用设备化是一大趋势, IDC预测到2024年,公共云上超过25%的新工作负载将使用服务商的专用基础架构组件。然而,在云网络领域,这一趋势更快,使用软硬件一体技术研发的云原生的专用设备已经成为云网络业务场景的主流,使用基于云原生的ECS构建的CyberStar弹性网元平台也正在大规模使用。
未来云网络技术会持续向这两个方向演进,依赖云原生构建技术架构,是云网络的核心优势所在。云网络,依云而生,生而为云,是真正云原生的网络。(完)
说明:本文为「凌云时刻」原创文章,转载请遵守转载要求,并务必保留作者和出处。

    推荐阅读