《科创板日报》4月25日讯(记者 黄心怡)算力每投入1元钱,就将带动3-4元的经济产出。这是《中国算力发展指数白皮书(2023年)》的预测。作为数字时代的先进生产力,算力决定了人工智能技术创新的上限,已成为科技角逐的主赛场。

根据上海市通信管理局等11个部门联合印发的《上海市智能算力基础设施高质量发展“算力浦江”智算行动实施方案(2024-2025年)》(以下简称“实施方案”),至2025年,上海市智能算力规模将超过30EFlops,占比达到总算力的50%以上。

《科创板日报》记者获悉,目前,上海在临港、青浦、松江等重点区域均已有大型智算中心持续布局建设。预计到2025年,上海具备大规模应用赋能价值的智算中心数量达到10家,智能算力典型应用场景超过50个,争取5个以上智算中心纳入国家级算力基础设施典型案例名单。

▍临港加快构建算力产业生态

根据《临港新片区加快构建算力产业生态行动方案》,到2025年,上海临港新片区将形成以智算算力为主、基础算力和超算算力协同的多元算力供给体系,总算力超过5EFLOPS(FP32);AI算力占比达到80%,算力产业总体规模(含相关硬件、软件、应用、服务等)突破100亿元。

作为亚洲最大人工智能计算中心之一,商汤科技人工智能计算中心(AIDC)已在临港投入运营,是服务上海建设“具有全球影响力的科创中心”战略目标的标杆项目。该项目占地87亩,整体规划建筑面积13万平方米,一期投资56亿元,已经建成7万平方米。

商汤科技大装置事业群智算中心总经理林海对《科创板日报》记者表示,上海临港AIDC的算力规模仍在持续增加,迄今已达到8400 petaFLOPS,远远超出立项规划的3740 petaFLOPS。上海临港AIDC二期也在逐步规划当中,会继续进行算力的提升。

在支持商汤自身大模型研发的同时,上海临港AIDC也支持外部客户训练大模型和应用部署,其算力可支撑超过20个千亿超大模型同时训练,并在2023年实现了对万亿参数大模型的全生命周期生成。

除商汤科技外,上海电信倾力打造的临港算力园区也在如火如荼地建设中。今年3月,国内首个国产单池万卡液冷算力集群正式投入运营,是业内领先的全国产化云智一体公共智算中心。

中国电信临港算力园区

《科创板日报》记者从上海电信获悉,天翼云上海临港国产单池万卡液冷算力集群采用网络中置、算力分层的“魔方”型,实现了单一集群内万卡高速互联,满足万亿级参数大模型训练所需的多机多卡并行、高吞吐无损通信等需求。同时,为了实现绿色低碳的目标,全面采用融合液冷服务和IDC基础设施的新一代智算液冷DC舱,实现了数据中心的能效和智算集群的算效双提升,为“人工智能+”提供智能、弹性的绿色算力。

未来,随着算力需求的急剧增长,中国电信临港园区规划建成总用地面积约300亩,总建筑面积约40万平方米,总计折合提供约4万个8KW机架能力的超大型算力中心。

▍青浦发力长三角国家枢纽节点建设

作为“东数西算”国家算力网络东部枢纽长三角起步区,青浦全力加码算力布局,正推进中国电信、中国移动和优刻得等3个项目。

上海电信方面告诉《科创板日报》记者,青浦云湖数据中心于去年8月正式开工。今年年底,将建成交付。

作为长三角国家算力枢纽节点的重要组件及骨干网络核心,以及国家"东数西算"战略的核心节点之一,青浦云湖总用地面积近36亩,总建筑面积超过4万平方米,提供约4000个机柜能力。建成后的青浦节点与临港节点将依托中国电信“2+3+7+N+M”的算力中心布局,在上海形成“东西两翼”的双AZ智算布局,与西部跨域集群、长三角域内集群高速直连,并利用落地青浦的全国一体化算力算网调度平台,让算力可管、可控、可调度,实现东数西算的算力调度示范,为丰富上海智能算力供给和生态做出贡献。

而优刻得上海青浦数据中心坐落于上海市青浦工业园区,将成为其在华东地区的云计算核心基地,立足青浦、辐射长三角、服务全国,打造助力经济社会发展的数字底座。

“上海青浦数据中心总计可容纳6000个机柜。一期交付一栋数据中心及办公楼,已于2023年1月投入商用,机柜数量1000个,机柜为高电机柜,电力支持30A、40A,可定制更高功率的机柜。计划2024年下半年交付二期,机柜数量1000个。”优刻得数据中心产品线总经理赵雪飞向《科创板日报》记者介绍。

优刻得上海青浦数据中心

在优刻得数据中心内的智能巡检机器人

▍松江打造全国最大的GPU计算集群

除了临港、青浦外,松江也在加快算力产业发展。松江拥有10个大数据中心、算力中心项目,已批复约3.4万个机柜,交付的机柜数量达到2.5万个,落地了腾讯长三角人工智能先进计算中心、上海仪电智算中心、华东电脑金融AK云以及北斗博阳·华为上海空间信息算力中心等一批重大项目。

《科创板日报》记者从世纪华通处了解到,公司通过投资深度参与了“腾讯长三角人工智能先进计算中心及产业基地”项目。该项目于2020年开工,2021年上半年进入电气安装阶段,至今已累计交付近数千个机柜并逐步投入运营。

腾讯长三角人工智能先进计算中心及产业基地

根据规划,腾讯长三角人工智能先进计算中心项目总投资达450亿元,机柜数量规划近4万架,占地236亩,总建筑面积50万,由16栋数据中心集群组成。项目单栋算力达1400千万亿次浮点运算,未来将承担各种大规模AI算法计算、机器学习、图像处理、科学计算和工程计算任务。项目建成后,将成为长三角最大、全国前三、亚洲领先的人工智能计算中心和全国最大的GPU计算集群,聚焦“存算一体,以算为主”,服务AI加速器与实验室、5G生态计划、WeCity未来城市和产业互联网四大功能。

▍智能算力赋能产业发展 激活新质生产力

人工智能是推进新质生产力发展的代表性技术,当把“人工智能+”赋予到各产业后,就形成了典型的新质生产力,并产生巨大推动作用。

“算力、算法、数据,是AI和核心要素。”林海向《科创板日报》记者分析,“而AI‘新基建’通过重构算力、算法、数据的供给或服务模式,实现了AI生产要素的创新性配置,大幅提高了AI技术的生产效率和质量,因此可以称为‘新质生产力’。”

比如,在算力层面,AI“新基建”重构了算力的供给体系。它通过提供规模化、高效率、集约化的算力基础设施服务,能够大幅提高各行各业算力的利用能力,降低传统自建算力方式的使用成本,实现了算力这一要素供给效率的提高。

在算法层面,AI新基建重构了算法的供给模式。它通过提供领先的基础模型,让各行各业的用户只需要在基础模型上进行微调或增量训练,就可以高效率地开发出符合自己需求的高质量行业模型,这在本质上就是算法的基础设施化,实现了算法供给效率的提高。

随着大模型掀起新一轮智能化热潮,人工智能正加快赋能千行百业。上海电信打造了“科研+智算、金融+智算、医疗+智算“等多个典型应用场景,通过提供GPU物理机、GPU云主机等智算产品,配套HPFS并行文件服务、对象存储、弹性算网服务,上海电信支撑各行业进行垂直行业模型上的训练、调优和推理,推动行业应用快速落地。

目前,模速空间的人工智能企业已使用上海电信弹性算网进行大模型数据传输,训练初期,企业通过高速率带宽上传大量TB级训练数据到算力池中,待完成一次性任务后,企业再降至基础低速率带宽。后续在进行定期数据更新和备份时,企业可通过自主操作,发起小时级的弹性带宽升速,实现突发任务的快速传输。

优刻得则推出了“孔明”智算平台,在大模型分布式训练、自动驾驶、生物医药、工业制造、城市治理等领域具有广泛的应用。通过智能算力推动人工智能技术的突破、促进数据资源的充分利用以及带动相关产业的升级和转型等方式,激活了新质生产力。

▍以“绿色发展”理念夯实算力底座

如何提升低碳节能的绿色智算水平,是上海推进算力建设基础设施建设发展的重点。根据《实施方案》,到2025年,上海的目标是新建智算中心PUE值达到1.25以下,存量改造智算中心PUE值达到1.4以下。智算中心内绿色能源使用占比超过20%,液冷机柜数量占比超过50%。

林海向《科创板日报》记者介绍,商汤积极推动前沿的节能技术与设计方式,满足海量算力需求的同时降低数据中心能耗,推进绿色低碳数据中心的建设。目前,商汤已从能源、技术和管理等层面,为AIDC采取了多种能源优化措施,让AIDC的年均PUE从1.3优化至1.28,仅2023一年便节约了超过143万千瓦时能耗,在上海市排名位居前列。

优刻得上海数据中心机房则采用了封闭热通道方式,空调水平弥散式送风。考虑到上海地区土地、电力资源紧张,但水资源相对充足的特点,选择间接蒸发冷却方案以可以提升获得较好的制冷效率。与传统间接蒸发冷却方案不同的是,优刻得重构了间接蒸发冷却流程,自主研发了“白露”间接蒸发冷却技术,利用室外空气的不饱和性,通过新风和循环喷淋水相互促进降温,不断迭代,最终将送风稳定至室外露点温度。

在数据中心屋面,优刻得部署了冷却塔、柴油发电机和优刻得自研的间接蒸发冷却机组。该技术使得数据中心送风极限由室外湿球温度调整为室外露点温度,湿球效率从主流产品的70%提升至100%以上,制冷效率提高10~25%,减少机械补冷能耗,可以大幅降低数据中心PUE和整体运行TCO。

随着AIGC技术的持续演进,为了满足AI算力的需求,除了高功率机柜定制,优刻得青浦数据中心内也做了一系列的优化。譬如机柜腰部可穿线,可有效节省InfiniBand等高速线缆的长度。GPU集群的互联密度大、带宽高,光模块与线缆成本甚至可能超过网络设备本身。对于冷板式液冷机柜,功率可定制到130kW,有力支持了多GPU服务器的部署密度,提高大模型企业对推理算力的利用效率。

而上海电信临港智算中心在设计之初,已考虑绿色低碳概念的融入。除了浸没式液冷以及冷板式液冷设备的应用以外,在配电侧,通过分布式电源系统、一体化电力模块配合小母线,在实现弹性供电的同时,最大程度的减少输配电系统损耗。目前同步建设的青浦云湖数据中心,同样秉承该设计理念,同时加入了全生命周期碳管理,从建设开始便对全流程的碳排放进行管控,最终的目标是成为长三角绿色算力枢纽。

服务器下液冷池

过去这一年来,我国算力产业爆发式增长,算力基础设施建设加速提质并向智能算力布局,正成为经济增长的新引擎。在上海,“算赋百业”生态初具规模,上海正持续夯实算力基础设施建设,助力城市数字化转型,也通过推动“算力浦江”计划演进升级,助力构建全国一体化算力网。