查看: 205|回复: 0

AI推理时代：算力能耗瓶颈下的“密钥”何在？ [复制链接]

tayun

军衔等级：

三级军士长

注册：2015-11-14 点赞数

1

电梯直达

1^# 大中小

发表于 2024-11-15 19:25:29 |只看该作者 |倒序浏览

智东西（公众号：zhidxcom）

作者 | 程茜

编辑 | 漠影

2024年，千行百业对AI推理的需求将呈现出爆发式增长，行业对算力的需求远远超越以往。在这样的形势下，如何突破能耗瓶颈，进而获取更充足的算力，已经成为每个企业迫在眉睫且亟待解决的关键问题。

然而，当前的现实情况是有效算力供给已无法满足算力需求：一方面，从储备到应用的算力需求都愈发旺盛，OpenAI CEO召集全球投资者组建联盟为大模型构建基础设施，马斯克的无人驾驶出租车Cybercab为科技行业描绘了未来感十足的面面，还有性能愈发强大的GPT-o1等模型层出不穷。

另一方面，数据中心的算力潜能尚未被完全挖掘出来。数据中心常被认为是“耗电怪兽”，因为服务器运行伴随着热量释放，温度一旦超过极限值，服务器性能就会显著降低，限制数据中心算力发挥。于是各类创新技术涌现，试图让数据中心再次突破能效瓶颈，释放出被束缚的算力潜能。

这背后的关键变量就是冷却技术，液冷技术作为推手帮助数据中心一次次突破制约。就在联想集团Tech World上，联想集团董事长兼CEO杨元庆与NVIDIA创始人兼CEO黄仁勋，这两大全球科技行业顶尖企业的领军者同台，联合发布全新液冷AI服务器，勇闯“最大工业革命”。

今天，伴随2024/2025财年Q2财报，联想集团发布《Game of AI》系列知识科普视频的第二集《数据中心：如何与世界交换算力》。

视频延续桌面电影形式，通过《权力的游戏》风格的开场片头，复刻北境冰雪气候变化，打造亦真亦幻的三维沙盘动画，以此紧扣液冷主线。

同时，视频还以两条科技树线索，介绍了数据中心和能效的角逐演进历程，采用冰雪白为主的配色方案与模拟芯片的三维结构，融入液冷主题。

视频中以第一人称桌面电影的创新手法，让观众跟随存在于2100年未来时空，以科技历史学家李约瑟为原型的智能体，并通过它的主观视角展开了一场算力史与能源技术史的探究，如何通过计算重构世界，以及其中的可持续发展路径，发现液冷技术在释放数据中心算力中的关键作用。

一、提升能效、维持功耗，数据中心效率革命正当时

联想集团最新发布的第六代Neptune海神液冷解决方案，可以为生成式AI高效计算提供动力。这在当下对于数据中心算力效率提升的重要性不言而喻。

通过视频中联想集团梳理的数据中心百年发展历史，我们发现，数据中心的算力与能效密切相关，二者共同掌握着能量密码。

人类对算力的利用由来已久，但随着信息技术革命到来，算力的性能和规模迎来爆发，算力需求逐渐多元化，深入汽车、大模型等各种应用场景。

2024年，算力提升的关键已经从狂堆硬件转向提升效率，如今数据中心需要的革命是基建效率的角力。目标是在充分利用数据中心已有硬件设备的基础上，使其发挥出更高能耗并提供更强大的算力。视频以桌面电影第一视角，通过网页、文件等多样化载体提取信息，给观众带来更多操控互动感受。

在明确数据中心效率这一概念的同时，需要先搞清楚一个指标——TDP热设计功耗。这指的就是当芯片达到最大负荷时热量释放的指标，也是冷却系统要面对的重大挑战。

一旦超过这一极限值，处理器的温度继续升高，就会导致数据中心的性能降低，让芯片发挥计算能力的前提就是，处理器运行过程中产生的热量和冷却技术的散热能力达到平衡。

因此提升基建能效，将其从能耗制约下拯救出来的关键就是冷却技术。二者相互制约又相互关联，共同决定了数据中心的稳定运行和能源利用效率。

数据中心和能效两条技术路线交织前进的同时，一步步助推AI产业的技术创新与应用落地加速实现，加速智能时代到来。

二、冷却技术：算力历史长河中的关键脉络

算力工具从仅凭大脑运算到机械计算机、电子计算机，形态几经变迁，已经从数据中心的无限扩张转移到基建效率的角力上。

联想集团以桌面电影的形式，让我们亲身体验了计算的百年历史。视频中通过更契合冷却与算力主题模拟芯片三维结构，展现出数据中心变迁的关键环节。最初图灵机理论出现，奠定计算的设计理念，由虚拟机器替代人类进行数学运算。再到1946年运算速度达到了手工计算20万倍的ENIAC出现，1951年第一台商用计算机UNIVAC I首次拥有存储能力，为现代计算机的体系结构奠定了基础。

再到后面，20世纪60年代分时操作系统使得计算开始通用，计算机的处理器占用被切分，可以让多人同时使用计算机。

计算性能的大幅提升，随之而来的就是散热系统的工作负荷急剧增加。视频以水上、水下逐步揭示数据中心明线与能效暗线，通过水中浮起等细节动画，让人沉浸其中。

早期风冷技术是数据中心散热的主要方式之一，20世纪90年代出现的机架式服务器就是数据中心的初始形态，但因为空间紧凑、设备密度较高，风冷无法再满足散热需求。

机械冷却登上历史舞台，空调通过压缩机、冷凝器、蒸发器等核心部件的协同工作，产生低温冷风带走热量。从而使冷却技术在互联网首次蔓延，第一次拯救了算力。

冷却技术拯救算力的第二大节点，就是高性能计算集群的出现。高性能计算集群将单机柜功耗直线拉升百倍，达到50kW，冷却技术再遇瓶颈，空调无法满足如此快速、高效散热的需求。

其中的标志性事件就是联想集团2012年推出的海神Neptune温水水冷技术。其率先提出了适用于高密度计算环境的温水水冷技术，使用45℃~50℃的温水在冷却板和循环水路中循环，达到降温的效果。视频通过对温水水冷服务器进行首次全方位拆解，结合图表、动画，深入浅出展现了温水水冷技术。

该技术通过全水冷无风扇设计，使服务器散热效率达98%，并实现90%的余热回收再利用，降低42%的能耗，数据中心PUE可降至1.1，同时其总体成本低于风冷。

这之后，液冷技术全面爆发，成为高性能计算的主流选择。

液冷技术的发展为数据中心能效提升，开辟了一条行之有效的路线，并为大模型时代的算力注入了新的动力。

三、液冷——AI时代释放澎湃算力的 “动力源泉”

AI时代下半场，百模大战落下帷幕，GPU、CPU、TPU、服务器演化出千百种形态，AI军备竞赛的焦点，正从模型向数据中心转移。

AI训练和推理的算力需求激增，对数据中心的需求水涨船高。一张GPU的功率飙升至1000W，单机柜功率密度增至100kW。

随之而来的就是对冷却系统的又一次严峻考验。这是因为在高功率密度的环境下，设备单位体积内产生的热量会大幅增加，就需要散热系统的工作效率更高，才能快速带走热量保证设备持续运转。

联想集团2024 Tech World大会上发布的全新液冷AI服务器，搭载第六代海神液冷系统，具备突破性的垂直液冷设计方案。视频通过三维动画直接对该系统进行了拆解，更为直接的呈现了其内部构造。

凭借ThinkSystem N1380 Neptune和新的ThinkSystem SC777 V4 Neptune，联想集团率先在不需要专用数据中心空调的情况下就可以运行100kW以上的服务器机架，这一设备就是专为大模型而打造。

在优化部署方面，液冷服务器可竖直放置，能在提升空间利用效率的同时，进一步增强散热效果，这在此前的液冷系统中并不多见。

其还采用精巧封装设计，包含8个托盘槽、4个15kW功率转换站以及Neptune水流分配系统。

基于这样的优化设计，第六代海神技术使得数据中心的PUE趋近于1.0的极限，这也意味着整个数据中心设备对能源的利用率接近100%。

视频画面穿越数据中心的服务器，看到了海神液冷系统为解决数据中心能耗问题带来的希望。

但这并不是液冷技术的终场战局。如今，算力需求汹涌向前，联想集团通过颠覆机柜、机房固有格局，用全面液冷的超大型AI集群解决方案——液冷集群微模块，为AI产业的突破装载了推进器。

视频中通过逼真写实风格的服务器形态切换三维动画，再辅以鼠标手动操作方式，让观众直观感受了从服务器模块到机柜再到液冷微模块的重构过程。

液冷集群微模块的出现，成为数据中心的最优解之一，液冷技术第三次释放了数据中心的算力能耗限制。

从高性能计算时代，到AI时代的下半场，联想集团持续引领液冷解决方案设计，加速算力的释放。液冷技术的革命日益受到广泛而密切的关注，并对数据中心产业链、供应链产生革命性影响。

结语：液冷成可持续算力保障，AI加速向实

算力已经成为人工智能进入真实的产业环境中不可或缺的核心要素，液冷技术更高效地带走高温，使算力可持续，让数据中心源源不断与世界交换算力。

黄仁勋在与杨元庆对话时提到：“现在，我们正在以前所未有的规模重塑计算领域的整个架构。现在，速度就是可持续性，速度就是表现力，速度就是能源利用率。”

如今，AI重塑整个世界运行逻辑，算力正是其坚实的底座。正如联想集团打造的视频结尾所说，“服务器与数据中心作为千行百业的基础设施建设，将重新定义AI作为生产力的能量源泉，并以世界之力再造世界”。

来源：智东西

本主题由版主或管理员于 2024-11-15 19:42 审核通过

0 举报本楼

返回列表

手机版|C114 ( 沪ICP备12002291号-1 )|联系我们 |网站地图

GMT+8, 2024-11-21 19:04 , Processed in 0.209463 second(s), 16 queries , Gzip On.

Discuz Licensed

		自动登录	找回密码
密码			注册