国内运营商最大单集群智算中心投产使用
8月30日,海内经营商最年夜单集群智算核心——中国挪动智算核心(哈尔滨)建立实现并正式投产应用。该智算核心单集群领有超越1.8万卡的丰盛资本,可供给6.9EFlops(每秒690亿亿次浮点运算)智能算力,融会分级存储达150P,存在单集群算力范围最年夜、国产化收集装备组网范围最年夜等特色。所谓单集群智算核心,就是把全部AI减速卡打形成1个集群,用以支撑万万亿级参数的年夜模子停止练习。集群智算核心经由过程进步的智算收集技巧把上万块GPU芯片像“积木”一样拼接在一同,年夜幅晋升GPU节点间的通讯效力,能够将数据练习实现时光收缩20%,是应答年夜模子海量数据练习、放慢年夜模子利用落地的利器。领有1.8万张AI减速卡的中国挪动智算核心(哈尔滨)能够支撑万亿参数的年夜模子练习。中国挪动智算核心(哈尔滨)是业内首个年夜范围利用融会存储的集群,也是首个落地中国挪动原创智算收集全调理以太网(GSE1.0)的万卡集群。恰是在GSE1.0的支撑下,中国挪动智算核心(哈尔滨)才年夜幅进步了GPU节点间的通讯效力,增加了数据练习义务的时光跟本钱。点评:AI年夜模子的研发须要基于大批GPU的集群算力来支持,平日参数范围越年夜、练习数据越多,对智算集群的请求就越高。不外跟着集群中挪用的GPU卡数目越来越多,盘算义务的调理、旁边数据跟成果的通报与保留等,也会变得越来越庞杂。中国挪动在智算万卡集群研发中,采取了多项翻新技巧确保年夜模子运转的低时延、高带宽数据处置跟存储才能,另有系列主动化、数智化技巧确保算力集群的高效、稳固运转,无疑是中国ICT科技翻新才能、工业化气力的会合表现。
申明:新浪网独家稿件,未经受权制止转载。 -->