算力供需难匹配 高能耗仍具挑战 如何破解算力难题?

当在讨论ChatGPT时,绕不开大数据和算力。

红星资本局注意到,有关数据显示,截至到2022年底,我国5G基站数超过了231万个,算力总规模达到了180EFLOPS,增速超过了25%,算力规模排名全球第二。

工信部新闻宣传中心总编辑王保平表示,工信部相继发布《新型数据中心发展三年行动计划》《十四五信息通信行业发展规划》等政策文件,提出算力基础设施高质量发展的重要方向,引导算力基础设施向高效协同、绿色智能方向发展,在政策持续支持和产业界的共同努力下,我国算力基础设施布局持续优化,规模稳步增长,能效逐步提升,运维模式不断演进,数网、数云、云边协同效应初步显现,有力支撑了数字经济的快速发展。


(资料图片)

6月8日到9日,由工业和信息化部新闻宣传中心(人民邮电报社)、中国信息通信研究院联合组织的“算力中国行”大型调研采访活动走进广东。红星资本局跟随调研深入广东,与当地运营商、企业、有关专家探讨关于算力保障、供需失衡、算力国产化及中小企业算力应用等问题。

(一)

“看不见摸不到”的算力

如何更可靠

从军工、航天、工业、能源到寻常百姓的生活,算力隐藏在我们耳熟能详的名词背后:智能驾驶系统、AI、云计算、IoT、区块链、元宇宙、智慧城市、智慧农业、健康码、疫苗……这一切都离不开算力的支持。

算力“看不见摸不着”,它“隐藏”在数据中心里、基础设施中。相关专家对红星资本局表示,数据中心本质属于机电行业,并不是新行业,跟楼宇工厂的机电设施没有什么区别。但它对安全性可靠性要求更高。

保持业务连续性是数据中心的首要目标。机房火灾、服务器长时间宕机对数据中心来说都是重大灾难。“安全”是数据中心的立命之本,比如机房制冷就是其中关键一项。

在中国联通互联网应用创新基地的IT机房中,红星资本局感受到了明显的低温凉爽。据工作人员介绍,机房创新使用UPS系统ECO旁路模式和封闭“热通道”技术,实现IDC机楼设计PUE(即评价数据中心能源效率的指标,PUE=数据中心总能耗/IT设备能耗)小于1.3。

“传统的大型数据机房基本使用冷通道模式。热量会带到外部,导致外部是热的。我们的热通道模式,冷气分布在外面更大的空间。这样比如空调停了30秒或1分钟,整个机房里拥有更大的后备能量。”相关工作人员对红星资本局表示。

工作人员表示,该模式的另一个优势就是节能。“这种技术可以让出更高温度的风,但能达到同样的散热效果。空调每高一度就能节能很多。”这也使得该机房的PUE可以达到1.3以下。

PUE小于1.3在国内多个政策中均有提及。2021年11月,国家发改委联合网信办、工信部、能源局共同发布《贯彻落实碳达峰碳中和目标要求推动数据中心和5G等新型基础设施绿色高质量发展实施方案》中提到,全国新建大型、超大型数据中心平均电能利用效率降到1.3以下,国家枢纽节点进一步降到1.25以下;工信部印发《新型数据中心发展三年行动计划(2021—2023年)》提出,到2023年底,新建大型及以上数据中心PUE降到1.3以下。

而在采访过程中,红星资本局了解到,在广东省高温条件下,PUE达到1.3以下并非易事。多家广东运营商表示,降低能耗是当前比较大的挑战。甚至有运营商建议,希望能对通讯机楼和数据中心的能耗管控加以区别。

(二)

“东数”为何不能完全西迁

去年6月,“东数西算”工程正式全面启动。国家发改委等部门同意在京津冀、长三角、粤港澳大湾区、成渝、内蒙古、贵州、甘肃、宁夏启动建设国家算力枢纽节点,并规划了10个国家数据中心集群。

“东数西算”最直观的优势便是节约成本。可以减少电能的传输距离,在西部发的电供给到数据中心,能够降低电网功耗传输的损耗,降低成本同时有利于西部地区拉动产业发展。

这一点体现在PUE上也很明显。有数据中心企业告诉红星资本局,数据中心总能耗包括IT设备能耗和制冷、配电等系统的能耗,PUE差值主要体现在制冷环节,比如在宁夏的数据中心,PUE达到1.2很正常,但在广东非常难,单从这个方面来讲,南方建设数据中心并不具备优势。

西部还具有低廉电价优势,那么数据中心实现西迁是否可以解决这些问题?答案是否定的。“为什么不能完全把数据中心建在西部,我们要考虑的是用户需求、网络情况、以及综合成本,不光是电价。目前我们来看,训练数据适合去西部,大数据推理并不适合。”浩云长盛COO王海峰表示,当前东部数据中心整体情况好些,西部数据中心个体差距仍比较大。

“‘东数’还是集中在一线城市,同时很多场景确实也需要放在一线城市。”浩云长盛董事长助理杨俊告诉红星资本局,低延时的“热数据”场景,比如像证券交易,如果数据中心离终端很远,就会受到影响。反之高延时的冷数据就可以放在西部。

从全国范围看,北上广及周边省份市场需求旺盛,算力、存力、运力和环境整体处于较高水平,产业发展势头良好,综合算力指数总体较高。

作为通信大省、网络大省、算力大省的广东,其互联网企业数、网站数、网民数等指标全国领先。

根据中国信通院发布的《中国综合算力指数(2022年)》显示,2022年,广东省综合算力指数、存力指数均排名全国第一。

红星资本局从广东省通管局获悉,广东省大中型数据中心机架规模已达62.5万个标准机架,平均上架率超过65%,在建大型、超大型数据中心的总建设规模超过16.9万个标准机架。

(三)

算力市场供需失衡怎么办

对于数据中心有各种衡量指标,机柜的“上架率”也是备受关注。一定程度反映了数据中心利用率。

《2021年中国数据中心市场报告》提出,目前全国数据中心整体上架率为50.1%。人民网发布的《“东数西算”数据中心建设研究报告》中指出,数据中心上架率有待提升。导致高空置率的原因集中在三方面,从算力需求侧来说,目前跨区域算力的需求并未得到充分调动。从算力供给侧来说,西部地区的许多机柜尚无法得到充分利用,此外从统筹建设出发,数据中心建设的驱动是供给走在需求前,导致大数据中心上架率低。

采访过程中,多家运营商也提到了“供需失衡”的问题。有运营商告诉红星资本局,运营5-10年以上的数据中心上架率偏高,但近两三年新投运的数据中心,上架率确实面临挑战。

这与区域发展也有一定关联,广东移动相关负责人介绍时指出,在珠三角地区上架率整体偏高,特别是广州、深圳,上架率均超80%,但是在汕头、湛江的上架率就在40%-50%左右。

有业内分析认为,近年来新基建政策提升了数据中心产业热度,市场供给快速增加。而在需求侧,公有云客户前期资源池部署告一段落,互联网行业创新业务发展仍需时日,传统行业需求尚未得到释放,上架率短期内出现一定下降。

数据中心如何应对市场供大于求?浩云长盛首席运营官王海峰强调还是要打造“更有为”的数据中心。比如在业务模式上加强技术和商业创新,提前进行业务判断。制定长期目标,进行重点城市核心布局等。

“近年来数据中心的消化速度非常快,长期来看基于我们国家数字经济发展跟数字化转型的需求,数据中心发展还是有非常好的前景。”中国信息通信研究院云大所副主任王少鹏认为,今天可能看局部有些供给过剩,但实际上也存在着需求不能得到满足的情况,而产业过剩不是靠产业升级去解决。“还是要看数据中基础设施的提供更匹配,IT设备的提供更匹配,上层技术以及技术上面的服务更匹配。”

(四)

算力国产化应加速

中小企业依赖算力是趋势

红星资本局从某数据中心企业了解到,目前对算力需求多的还是互联网大企业,从行业来看,金融、银行、证券公司、保险公司等需求也比较多。但中小企业大部分仍是靠“上云”或买移动硬盘解决算力需求。

中国信通院云计算与大数据研究所副总工程师郭亮在接受红星资本局采访时表示,中小企业使用算力跟其发展状态有关。“现在他们生产过程中也会用到算力,已经慢慢过渡到必须依赖算力去改进生产效率、提升生产价值。”他认为,未来中小企业也会越来越依赖算力。

郭亮举例,此前走访的中小企业,如果对算力需求不是很大的话,会自建小型机房,机型也非常先进,或者使用云厂商解决算力使用。

在调研过程中,也有专家强调,“算力”产业的国产化依然难行。最重要的服务器芯片领域,无论是通用处理器还是加速处理器,英特尔(Intel)、AMD和英伟达占据国内85%以上的服务器芯片市场,国产处理器及关键零部件份额较低。

广电研究院有限公司董事长兼院长邓家青坦言,技术生态不完整的情况下,用国产,意味着大家的熟悉程度比较低;社会上产业链的配套比较不完善;市场化推广也会有难度。“对很多企业来说,开发技术的时间成本、各种迁移的时间成本,包括培训成本都很大,企业很难承受。”但在当前国际大环境下,邓家青指出,推进国产化技术路径是必然,也应该加速。

邓家青认为,各地对人工智能算力中心缺少统筹规划,应该集约化建设,降低成本的同时避免重复投资。他提到应该注意的一个误区,就是在ChatGPT火爆之后,各地均出现跟风建设数据中心的情况。

“作为企业投入产出是要匹配的,都希望可以市场化运营,但是现在都在建,国企民营都自己建的话,要考虑后面我们面对的客户还有谁呢?”

(文章来源:红星资本局)

关键词: