Arm Neoverse 赋能 AWS Graviton4 处理器,加速云计算创新

作者: [db:作者] 分类: 奇闻 发布时间: 2024-12-24 17:09
跟着人工智能 (AI) 技巧的迅猛开展,云盘算范畴正在阅历明显变更。愈发庞杂的 AI 利用对盘算处理计划的机能、效力跟本钱效益提出了更高请求。在云端安排任务负载的客户正在从新评价其所需的基本设备,以满意古代任务负载需要,此中不只包含进步机能跟下降本钱,还涵盖了需合乎羁系请求或可连续开展目的的新能效基准。Arm 与亚马逊云科技 (AWS) 临时配合,为实现机能更微弱、更高效跟可连续的云盘算供给公用芯片跟盘算技巧。在近期举办的 AWS re:Invent 2024 年夜会上,AWS 进一步展现了 AWS Graviton4 所获得的明显停顿,使开辟者跟企业可能充足施展其云任务负载的机能潜力。出色的机能表示相较于上一代 Graviton3 处置器,基于 Arm Neoverse V2 平台的 AWS Graviton4 处置器在盘算机能上晋升了 30%,中心数增添了 50%,内存带宽进步了 75%。凭仗这些技巧上风,AWS Graviton 处置器在生态体系跟客户群体中失掉了普遍利用。Arm Neoverse V2 平台涵盖 Armv9 架构的新特征,包含高机能浮点跟向量指令支撑,以及 SVE/SVE2、Bfloat16 跟 INT8 MatMul 等特征。这些特征为 AI/呆板进修 (ML) 以及高机能盘算 (HPC) 任务负载供给了出色机能。AI/ML 任务负载往年早些时间,Arm 与主流的 AI 框架跟软件生态体系配合,推出了 Arm Kleidi 软件,以确保Arm 平台上开机即用的推感性能优化能惠及全部 ML 栈,开辟者无需控制额定的 Arm 专业常识即可构建其任务负载,从而进一步推进 AI 任务负载的普遍利用。此前,Arm 已展现了 PyTorch 中的这些优化怎样赋能 AWS Graviton4 上运转年夜言语模子(LLM),如 Llama 3 70B 跟 Llama 3.1 8B,并明显改良了每秒天生词元 (token) 数跟词元初次呼应时光的表示指标。HPC 跟 EDA 任务负载对 HPC 任务负载,Graviton4 相较于 Graviton3E 在功效上实现了明显晋升。每个中心的主内存带宽增添了 16%,每个 vCPU 的 L2 缓存容量翻倍。这些改良对 HPC 利用的机能至关主要,由于 HPC利用平日受限于内存带宽。AWS 曾经在这些范畴获得了明显上风,如下所示。依据 Arm 工程团队现实运转 EDA 任务负载所得出的成果,Graviton4 供给的 RTL 仿真任务负载机能比 Graviton3 超过 37%。图:AWS Graviton4 上的 HPC 跟 EDA 任务负载上风生态体系普遍采取比年来,跟着云盘算用户将种种云任务负载安排在 AWS Graviton 处置器上,其软件生态体系连续扩大。如斯一来,客户不只节俭了用度,播种了机能的晋升,还能优化其碳脚印跟可连续开展脚印。以下是局部示例:图:采取基于 Arm Neoverse 的 AWS Graviton3 所获得的生态上风动手应用 Graviton 的强盛机能Arm 将在云盘算的将来中施展要害感化,并将持续支撑 AWS Graviton 破于技巧翻新的前沿。Arm 将持续投入并进一步强化软件生态体系,从而使开辟者可能愈加轻松地在 Arm 平台上构建其利用,并充足应用 Arm 盘算平台所供给的出色机能跟效力上风。   申明:新浪网独家稿件,未经受权制止转载。 -->

如果觉得我的文章对您有用,请随意打赏。您的支持将鼓励我继续创作!