浪潮云海首席科学家张东:要降低算力使用门槛真正发挥智算中心引擎价值
8月18日至19日,由工业和信息化部、宁夏回族自治区人民政府共同主办的2023中国算力大会在宁夏银川举行。
在大会主论坛上,浪潮云海首席科学家张东以《一云多芯创领算力高质量发展》为题发表演讲。
各行各业的用户对算力的需求多种多样,怎样降低算力的使用门槛?大模型蓬勃发展的背景下,智算中心是否会出现泡沫?在数据中心的绿色低碳化方面,目前行业内有哪些新进展?
(资料图)
围绕这些问题,《每日经济新闻》记者在大会期间采访了张东。
要推动算力基建化
NBD:各行各业的用户对算力的需求多种多样,存在明显差异。您认为怎样降低算力的使用门槛?
张东:算力的使用门槛主要体现在几个层面:一是成本问题,用户有可能会用不起;二是用起来不方便;三是结构性短缺,也就是可能用户想用的没有,不想用的倒有不少。
首先,要让用户用得起,我认为要从两个方面来解决:一方面是算力基建化,就是说能有人为这个事来兜底,来给大家提供一个相对便宜的算力,就像公路或者手机网络一样。
另一方面,还是要有一些技术上的突破,能够不断地往前去创新、去迭代。这些年其实AI算力的发展还算比较快的,只是没有应用发展那么快,所以就会造成用户要去做同样的事情,所需要的算力规模、成本越来越大。正常来讲,经济成本应该慢慢能下降的,但现在离下降还有距离,这需要做技术的人继续去努力。
所以,一方面搞技术、搞产业的把成本降下来,另一方面是说能够有些资本进来,有人去做基建化、去推广,这两方面结合起来能够让算力用起来便宜一点。
其次,要让用户使用起来很方便,要构建一个更好的生态,需要有人去做开发平台,那些其实是一些挺枯燥的事情,但能够让开发门槛降下来,能够让人人都能学会用这个东西,会的人多了、用的人多了,然后提供很方便的工具,在软件层面做很多创新,大家才能把它用上。
第三,对于结构化不平衡问题,其实在过去几年,我们也看到了一些智算中心在有些地方可能盲目地追求创新,再加上一些企业对外宣称做出了很厉害的AI芯片,但到真的应用以后,发现并不好用,用户最后还得去买原来已经用得比较成熟的产品或服务。
所以在算力中心的建设方面,大家还是要知道什么样的算力是最需要的,把有限的资金投在效率最高的地方。当然不是说不鼓励创新,有些新产品该用还是要用,但是注意要有一个平衡。
合理发展布局智算中心
NBD:您提到智算中心是一个非常重要的新基建,尤其是现在随着大模型涌现出来,智算中心是不是会出现一些泡沫?
张东:从经济学角度来讲,一个东西如果不出现泡沫的话,它很难发展起来,就跟当年的云计算中心一样,或者说中国其实投资过很多别的东西,多多少少都有些泡沫。如果一个东西彻底没有泡沫的话,就说明大家都不看好它,实际上发展不起来。所以客观来讲,目前智算中心建设方面投了不用、投了用不起来,或者投资效率不高的现象显然还是有的。
但是我们认为这是一个事物,特别是这种大规模发展的事物发展过程中必然要经历的,不仅仅是在智算中心的建设上面,也包括在AI的技术上面。这就一个产业兴旺起来的一个合理的过程,设想只靠一个厂商、一个用户就能把这个产业一下子发展起来,这基本上不存在。
当然,还是要适当地去发展,但是确实要理性看待这个事情,怎么能够让它更合理地去发展,更合理地去布局,而不是被蛊惑一下,或者头脑一热。
NBD:作为中国的算力企业,如果想要在全球竞争中占有一席之地,应该往哪个方向发力?
张东:我认为,这些年IT产业是站在全球的巨人的肩膀上发展起来的,中国过去这些年其实也是在全球大产业链里面发展,现在我们还是要讲“双循环”,而不是单循环,至少在IT领域,大家还是要站在全球的更大的产业视角上去作创新,去和全球最领先的企业合作,就是说一个企业要有真正的全球竞争力,首先要有全球视角。
其次,就浪潮信息而言,一方面我们的产业还在往外走,也在往美国、欧洲加速发展,我们在国外也在设研发中心、建工厂,全球化还是要坚持。另一方面,我倒觉得确实中国是一个很好的大市场,中国有很多的应用,在国外没有那么大规模的试验场,因此怎么把中国的应用跟市场结合起来,从应用的角度来设计,作技术创新,来满足用户需要,这也很重要。比如,过去这些年,浪潮信息的服务器能够做到全球第二,在国内做到第一,其实很核心的一点就是和国内的互联网厂商合作,按照用户需求来作定制化的服务器。
进一步提升算力利用效率
NBD:数据中心是算力产业链中的一个突出环节,在数据中心的绿色低碳化方面,目前行业内有哪些新进展?
张东:行业内应该说全面的液冷化算是这几年比较大的方向,但是从底层的技术上来讲,液冷也分不同的路径,一种路径是比较冒进的、领先的,把所有机器全都泡在液体里面,但这可能离真正的产业化、程式化还有一点距离,它从全生命周期来讲是不是真的特别好,还有待验证。当然,从更远的未来来看,也可能那是必然的,最后大家都采用这种路径。
那么在中间的这一段时间,可能就是传统的冷板式路径,就是看起来还是一个传统的机柜,但是机柜本身是液冷的,通过冷却液进来把能量带走,我认为在一段时间内,可能新建的机房都会采用这种路径。
再宏观一点,现在还有各种各样的新技术。比如新能源的液冷,新能源的进一步使用,包括配合市电来对输入电路做一些改造;包括把数据中心里的余热回收利用,进而提升整体利用率等。
目前最领先的数据中心基本上都能达到PUE1.1,就是把90%以上的电都用在IT设备上,我认为在未来几年新建的数据中心里基本上都可以做得到。但是也要注意,即使PUE是1.1,这些电都用到IT设备上,但IT设备本身的利用率也不能忽视,现在大量的数据中心里虽然机器在运行,但是也有可能不是满载的,可能也就运行30%~50%。所以下一步还是要进一步提升算力的利用效率,进而降低整个数据中心的功耗。
当然,这其中一个最根本的就是芯片的功耗,目前还没有看到新的技术能给它降下来。业内也在说摩尔定律面临一些挑战,一个很明显的表现就是芯片的制程是降下来了、密度是更大了、性能是上去了,但是功耗也跟着上去了。而在过去很长一段时间里,摩尔定律比较有效的时候,性能提升之后它的功耗基本上可以保持不怎么变,所以确实节能在未来一定的时间内会是不能忽视的一个问题。
NBD:液冷的成本目前有没有下降?
张东:应该说随着产业化规模上来,它的成本一定会下降。
NBD:现在业内也有商用的海底数据中心,您怎么看?
张东:想象一下,现在在机房里把一个机柜范围的板子泡起来,大家面临的维护问题就比较大了,浸没式液冷要解决的一个很重要的问题就是怎么维护,要维护就得把机柜从制冷液里带出来,带出来就会造成泄漏或者液蒸发等问题。
要把整个数据中心泡在海底下,确实是很创新,我们觉得也挺好,但我个人不认为它能够特别大规模地拓展起来,因为它面临着维护的问题,面临着怎么布海底光缆、把电送进去等问题。包括以前说把数据中心都挪到格陵兰去,都挪到北极去,或者就中国而言,都送到青藏高原上是不是就好了,但实际上真送到青藏高原上又会面临数据传输等方面的新问题。
(文章来源:每日经济新闻)
关键词: