11 月 12 日消息,英国知名媒体《金融时报》在当地时间今日发布了一则令科技界瞩目的消息。据悉,亚马逊有望于 12 月对外宣布其第二代自研 AI 模型训练芯片 Trainium2 的 “广泛可用”(widespread availability)状态。这一消息预示着 AI 芯片领域又将迎来新的重要发展节点。
Trainium2 芯片早在去年末的 AWS 2023 re:Invent 全球大会上就已经亮相。亚马逊方面宣称,这款芯片与第一代产品相比有着显著的性能提升。其训练速度大幅提升,多达第一代产品的 4 倍,这意味着使用 Trainium2 芯片能够在更短的时间内完成复杂的模型训练任务。同时,芯片的能效也得到了极大优化,提升多达 2 倍,在环保和成本控制方面有着重要意义。更为突出的是,Trainium2 的内存容量达到了第一代芯片的 3 倍,为处理大规模数据提供了更强大的支持。而且,它能在 EC2 UltraClusters 中扩展至多达 10 万个芯片,这种强大的扩展性使得它可以在极短的时间内训练基础模型和大语言模型,为 AI 技术的快速发展提供了有力的硬件保障。
在当前的科技发展趋势下,不仅仅是亚马逊在积极投身于 AI 芯片的研发。像微软、谷歌、Meta 等大型科技企业也都在自行开发各类 AI 推理或训练芯片。它们这么做的目的很明确,就是为了减少对于英伟达硬件方案的依赖,从而在日益激烈的 AI 竞争中掌握更多的主动权,建立起属于自己的技术壁垒,推动自身 AI 业务的独立发展。