联合解决方案系列|DeepCooling——面向可持续经济发展的碳中和计算技术
近年来,中国正在快速发展新一轮的新型基础建设。作为新基建的重要组成部分,大数据中心为应对 5G、人工智能、工业互联网的大数据需求而生,可以说,大数据中心是新基建的根本。作为数据收集、处理和交互的中心,大数据中心直接决定了企业未来的核心数字化竞争力。
由于数字经济需求的快速增长,数据中心计算本身带来的碳排放也越加收到关注。2019 年,中国建造的数据中心数量大幅增长。随着新冠疫情加速各行各业的数字化步伐,美国和欧洲也纷纷大规模建设数据中心。但在如此大的用电规模之下,我国数据中心的能耗利用率却差强人意,总体能效与国际先进水平相比仍有差距。所以,提高数据中心能效,不仅是企业降本增效的重要手段,更是中国实现碳达峰、碳中和目标的不可缺的重要路径之一。
通过碳中和计算技术实现以 AI 和数据驱动的数据中心碳中和
用计算来解决由计算本身扩能所造成的碳排放问题,是计算领域的衍生创新,我们称之为碳中和计算技术。碳中和计算革命正在席卷全球,在全球数据需求不断增长的形势下,大规模建设新一代以碳计算技术辅助的绿色数据中心势在必行。
VMware 作为领先的云基础架构厂商,对可持续性有着长期的承诺。在中国,VMware 和英特尔也在聚合生态,推动碳中和计算的创新。VMware、英特尔和Quarkdata(云创远景)合作开发了联合解决方案 DeepCooling,以加速推动在中国乃至全球数据中心规模化采用可持续的碳中和计算技术;并一道在2021年底共同发布了数据中心提高运维效率、节能减排的联合白皮书:《面向可持续经济发展的碳中和计算技术—数据中心新基建背景下的减排创新》,通过在数据中心内部综合利用物联网/边缘计算、人工智能/深度学习、和融合运维管理等技术节省能源、减少碳排放。
DeepCooling可持续的碳中和计算技术通过持续的边缘 AI 干预和实时控制,帮助企业优化数据中心的整套制冷体系的能耗表现。这套方案已经在三方的联合推动下,在国内数个大型数据中心落地,帮助客户显著改善了PUE,降低了碳排放。在已经生产性部署的环境里全面验证了显著减少制冷系统能耗和碳排放的效果。
1. DeepCooling 解决方案
DeepCooling 概述
【联合解决方案系列|DeepCooling——面向可持续经济发展的碳中和计算技术】DeepCooling 基于 AI 和大数据技术,采集数据中心制冷链关键设备的运行指标,结合动环和能源监控数据,利用机器学习建模,精准预测匹配数据中心制冷的最优参数组合,并且通过动态调节制冷系统各个环节参数,提高制冷效果、降低制冷开销。
DeepCooling 主要通过历史数据对整个数据中心负载、发热以及制冷等各个物理系统进行建模,在此基础上基于负载的预测结果,对于制冷系统进行优化控制,将制冷系统传统的基于反馈的控制提升为基于建模的前馈控制。DeepCooling 能效优化是一个动态循环过程,每个循环周期包括的主要步骤如下:
- 数据采集:通过智能传感器和网关设备,采集动环数据、机房空调数据、机房物理空间数据、人工数据等,进行初步汇总,生成机房空调冗余度、机房热力图等中间数据。
- 分析建模:建立各类热平衡模型,为制冷系统各个部件,如末端空调、水冷机组、水路等进行建模,同时建立热负载、制冷系统以及温度之间的关系。
- 优化控制:通过训练好的机器学习模型求解每个时刻各个系统的参数,并通过程序下发进行,根据负载精确匹配制冷系统的输出,从而实现制冷设备的能耗节省。
通过对接数据中心现有 DCIM 和制冷系统,搜集了来自各个机房的温湿度、电量、空调负载以及连带的水路等数据。在这个基础之上 系统提供了一套强大的数据展示和可视化系统,对机房的冷热设备温度差、热力图有直观的图形化展示。产品将机柜和风道的热力分布、能耗直观展现,可对异常设备和设置做快速的发现和处理。一般的,可以对机房内部的热负载做分析和制冷输出进行分析和可视化,同时支持对每个装备和传感器细节进行可视化:
文章图片
文章图片
系统同时提供了丰富的报警和策略审计能力,以更好地支持数据中心的运维工作。
模拟物理模型与优化控制
基于对于整体系统搜集的数据,分两步来对数据中心的制冷系统机型建模,首先是每个机房,即实际冷量的使用端,同时基于建立的模型,对于末端风机进行优化控制。
文章图片
第二步将基于所有机房的负载,对于数据中心整体负载进行建模,从而更好的控制集中冷源:
文章图片
通过对于数据中心整体物理系统的建模,系统实现了一个基于建模的前馈优化控制,来改善传统的基于反馈的制冷系统控制体系,从而实现了更经济的能耗表现,以及更加稳定的温度控制。
2. 具体实施 部署拓扑结构
系统通过一个分布式的基于边缘推理的计算体系,来实现对于数据中心整体制冷体系的优化控制。一个典型的部署拓扑如下:
文章图片
每个机房都有独立的控制节点,以实现边缘侧的模型推理以及优化控制的计算,并完成对于所有空调的控制。同理,对于冷源侧,也将会有配套的边缘控制节点实现相关的优化控制。
效果及投入回报率
系统能够提供 18%-25% 的制冷电量节省,对应的会带来大约 0.1-0.15 的 PUE 改善。对于数据中心的硬件改动较小,实施过程中一般不会对正常生产带来负面的影响。因此 DeepCooling的ROI 是传统基于硬件改造的能耗方案一倍以上。
商业案例
末端空调能耗优化 该数据中心由于布局等问题,存在温度方差大,温度均值分布不均匀的问题,单个空调空度控制存在较大波动。
DeepCooling 通过 11 个机房精密空调运行状态的调整,并累计 14 天机房内精密空调及 IT 设备能耗数据,经过与前期累计数据对比,平均节能率 30% 以上,最高可达近 70%。
文章图片
水冷机组能耗优化 该数据中心水路设计负荷和实际负荷差距较大,一般实际负荷远低于设计负荷,原有一次定频泵设计导致低进回水温差,大流量,导致浪费; 同时整体水冷机组负载偏低,该数据中心 4 台水冷机组,每个水冷机组两个压缩机开启的前提下,平均负载一般为25%- 35%,远低于最优 COP 负载区间(一般为 60%-80%)。
DeepCooling 基于海量历史数据以及强化学习模型的动态控制,实现在机柜和背板空调机理建模的基础上,动态调整 300 余组背板 空调的运行参数(实时转速等),进一步通过背板空调群控系统下发动态指令控制背板空调功耗,并动态控制冷水机组,获得更好节能效果。
文章图片
文章图片
3. 关键技术 边缘侧——EdgeX Foundry 开源项目
EdgeX Foundry 是由Linux 基金会运营的、厂商中立的开放源码项目,旨在为物联网/边缘计算创建公共开放的软件框架。该项目的核心是基于与硬件平台(x86 或 ARM)、编程语言、操作系统、云平台无关/中立的参考软件平台建立的互操作框架,赋能即插即用的组件化生态系统,统一边缘计算软件生态/市场,加速物联网方案的广泛部署。EdgeX Foundry 使有意参与的各方在开放与互操作的物联网方案中自由协作,无论他们是使用公开标准或私有方案。
文章图片
云侧
Flowgate 融合数据中心内动环/IT 数据 Flowgate 项目是由 VMware 发起并维护的开源项目,它将赋能企业,帮助他们将数据中心内的动力环境和 IT 系统的数据融合起来形成统一的数据平台,打造辅助云和数据中心运维团队制定决策的整体视图。现实情况下,企业数据中心这样的 “信息工厂”,经常由IT、后勤/资产、安全、财务等部门分头管理其中的一部分。没有一个完整的、集成的、从供电/用电到负载部署的视图。这导致管理中的分立系统和运维方式,在动环系统(管理供电、制冷、安全和温度、湿度等环境状态)和 IT 技术栈(监控机架上的计算、网络、存储等 IT 资产)之间巨大的信息鸿沟。通过将这两大类不同的数据集融合成统一的视图,再结合增强现实、巡检机器人和深度学习等先进技术,数据中心的管理者将能更好地优化运维,更明智地作出部署应用的选择。
文章图片
vRealize Operations 数据中心运维管理平台 VMware vRealize Operations 是一个面向私有云、混合云和多云环境的自动驾驶式运维管理平台,整合了 AI 和预测性分析,使云和数据中心运维团队变得更加主动和敏捷。利用 vRealize Operations 自动化并简化运维管理,可以从数据中心动力环境、物理、虚拟和云计算基础架构(包括虚拟机(VM)和容器)到支持的应用,vRealize Operations 具有全栈可见性,可提供持续的性能优化、应用感知型智能修复和集成式合规性。它可以本地部署,也可以作为服务使用。企业在采用混合云的历程中,经常会遇到有关应用移动性以及不同工作负载对云的适用性等问题。负责解决这些问题的开发人员通常会面临监管方面的阻碍。VMware 通过云市场,发现经过验证的第三方解决方案、开源解决方案和第一方工具并将其部署到 VMware 环境中。VMware 提供受到监管、经过验证、易于部署的解决方案来源,让客户的混合云之旅一帆风顺。本技术方案中数据可视化及仪表盘组件就是以 vRealize Operations 管理包的形式实现,并可通过 VMware 云市场上获得。
通过结合来自 Intel 的至强处理器和 OpenVINO 套件,来自 VMware 的 vRealize Operations 和开源项目 Flowgate,由 Linux 基金会运营的开源项目 EdgeX Foundry,以及 Quarkdata 的先进算法,我们共同打造的数据中心节能解决方案 Deep Cooling 能够大幅度(最高 30%)减少制冷系统的能源使用并减少二氧化碳排放。
来源|公众号:VMware中国研发中心
推荐阅读
- netty系列之:在netty中处理CORS
- netty系列之:epoll传输协议详解
- 服务启动过程性能波动的分析与解决方案
- SCCM2013系列,OSD OEM 硬盘格式化操作系统系统分区指定工具参数简介
- WebGL|Three.js系列: 造个海洋球池来学习物理引擎
- IOS应用开发|IOS应用在iPhone5和iPhone5s上不能全屏显示,应用画面上下各有1条黑色的解决方案
- linux系列之:告诉他,他根本不懂kill
- 测试平台系列(51) 编写数据库连接相关方法
- Kibana系列--安装与配置
- 测试平台系列(52)改造异步数据库连接方案