“随着人工智能从单一智能向通用智能迈进,并快速融入科学、政务、金融、工业、健康等各领域,我国智能算力需求激增,算力缺口大,供需矛盾凸显。”今年两会,全国政协委员、天娱数科副总经理贺晗重点关注智能算力中心的建设与运营。
2022年2月,我国正式启动“东数西算”工程,规划建设8个算力网络国家枢纽节点以及10个国家数据中心集群。全国多地也掀起了智算中心建设热潮,截至2023年末,国内有超过50个城市正在建设或提出建设智算中心。
“众多城市集中建设智算中心,有效激发了数据产业的活力。与此同时,一些突出存在的问题也不容忽视。”贺晗表示,一些城市建设智算中心时存在重建设轻服务、重投资轻运营的情况,致使持续增长的算力需求和较高的机架空置率并存。目前部分城市对数算力需求总量和类型不清晰,对智算中心运营模式、盈利模式认识不足,缺乏产业资源,多偏重实体建筑建设和硬件部署。还有些城市对于建成成效的衡量指标偏重于人工智能服务器部署量、智能算力规模等,并未从满足市场实际需求、提供多元普惠算力服务等角度进行前瞻规划和产业导入,存在智算资源建成后难以触达需求的情况。值得注意的是,一些城市的智算中心存在算力资源利用率不高的问题。例如,在网络层面的算力控制、接入,在算力层面的多元异构算力度量、调度以及在应用层面的算力可信认证、运行监管等方面缺乏统一标准和规范,由此带来了算力度量不准确、算力感知不完善、算力编排不智能等问题,使得算力资源难以实现协同优化,统一管理调度效率低,导致智算资源使用率不高。
“各城市智算中心的算力孤岛问题尤为突出。”贺晗说,由于各智算中心之间缺乏互通互用机制,导致算力节点通过网络灵活高效调配算力资源的能力不足,算力负载动态调度不够,多源异构算力之间的壁垒现象愈发严重,导致存量资源无法最大化利用。与此同时,由于各智算中心间缺乏安全高效的算力资源交易体系,使得供需双方无法精准对接,闲置算力资源难以有效流通配置。
鉴于当前智算中心建设过程中存在的一些问题,贺晗认为,相关政府部门应该鼓励建设智算聚合服务平台、建立健全算力调度标准规范体系、制定推广面向通用人工智能时代的智算基础设施评价体系。应该对智算中心基础设施建立科学合理的评估评价指标体系,以评促建、以评促优,提升智算中心服务水平。除了资源供给、网络时延、能效碳效等传统指标,还应将智算中心的使用效率、平台服务、场景赋能、生态建设、用户体验等纳入评价指标。
“有关部门应该鼓励研究机构、行业协会等第三方机构围绕智算基础设施开展经常性评估评测。通过加强宣传推广,匡正智算中心不仅要‘建好’,更要‘用好’的导向。”贺晗说。