人工智能时代,算力作为新时代的核心“引擎”,成为推动全产业发展的重点。如同水、电、气一样,算力被普遍认为是AI时代的通用刚需资源,伴随着新基建的大力推进,数据中心、超大型智算中心的建设热潮也随之涌起。
近两年来,继上海、深圳等地人工智能计算中心的落成,不少其他地方政府也在积极推进城市级人工智能计算中心的建设,并且动辄超100P、300P的AI算力,不断刷新着城市级计算中心的算力规模。
算力中心建设热潮涌现
建设大型人工智能计算中心,有着多方面的意义,一是为了推进算力资源的普适普惠,向千行百业赋能;二是通过算力中心的建设,实现产、学、研、用多位一体,打造AI产业集群,拉动城市科技产业及经济的双向发展。
而围绕着人工智能计算中心的建设,也涌现出了不少热词,包括 “大数据中心”、“云计算数据中心”、 “超级计算中心”以及“智能计算中心”。叫法不一,指向的都是人工智能计算中心,即以智算中心为代表,面向人工智能场景,提供所需算力服务、数据服务和算法服务的公共算力基础设施。
▲部分城市算力中心项目算力统计
从目前已公开的部分城市人工智能计算中心项目相关信息来看,100P AI 算力是算力中心的起步建设目标,大多数城市的算力中心建设分为多期逐步推进,像深圳目前已进入到“鹏城云脑”的二期规划中,并且规划在一期100P基础上实现10倍算力能力的飞越,以1000P为目标。如此强大的算力能力,可广泛服务于自动驾驶、智慧医疗、智慧城市、智慧交通、智慧金融、智慧教育、智能制造等多行业领域。
就在近日,工业信息安全发展研究中心发布了《新一代人工智能算力基础设施发展研究报告》(以下简称“报告”)。报告对目前国内人工智能算力基础设施的建设现状、存在的问题都进行了梳理,同时也明确提出了新一代AI算力基础设施的建设方向,具有实际的参考意义。
AI算力中心建设痛点
据报告提到,目前国内大型人工智能计算中心正进入“落地潮”,政企参与建设的积极性都很高,但仍然存在一些亟待解决的显性问题,主要包括:
◆顶层制度建设和标准体系不统一。目前国内尚未有较为统一的相关行业标准和政策出台,各地围绕着算力基础设施的建设,基本都以政企合作自发建设为主,缺乏统一的标准体系,对于后期需进行跨区域算力资源调度、整合就会比较困难。
◆建设方向和建设需求错位。我国大多数计算中心在建设思路上采取了算力性能发展优先,再拉动应用发展的策略,忽视了上层应用迁移及兼容程度,导致算力系统的初期应用效率偏低,无法完全支撑全面的智能化应用场景需求。
◆算力基础设施建设定价混乱。由于标准并未统一,市场不透明,各地同等规模项目的价格相差巨大,容易滋生灰色产业链。
此外,算力基础设施软硬件核心技术受制国外、重复建设、高能耗等问题,也亟待突围。
新一代人工智能算力基础设施建设方向
鉴于国内人工智能产业仍处于早中期发展阶段,建立人工智能计算中心也处在经验积累阶段,试错不可避免。一边借鉴先行落地的算力中心建设经验,一边摸索适合本地AI产业生态需求的算力中心建设方向,是目前各地政府在建设算力基础设施方面的普遍态度。
上述报告也为新一代人工智能算力中心的建设提出了多项具有参考性的意见和方向。
比如报告提到,新一代人工智能算力基础设施应考虑其包容性、普惠性、安全性、共享性及节能性。应成为能够覆盖多元算力的创新融合型算力平台、能够兼容行业主流软件的开放包容型算力平台、能够确保自主可信和持续升级的安全可信型算力平台、能够实现资源跨区域流动的快速灵活型算力平台,以及低能耗、高效能的绿色节能型算力平台。
某人工智能计算中心建设方案架构
报告预计;新一代人工智能算力基础设施未来需支持80%以上的主流人工智能应用软件;因此,未来的智算中心建设应采用多元开放的架构,兼容成熟主流的软件生态,支持主流的AI框架、算法模型、数据处理技术、广泛的行业应用等,以提高平台的适用度,构筑可以适配多元化场景的生态。