联系电话

13517270458

新闻中心

News Center

谷歌硬刚英伟达:TPU首度拆分“训练”与“推理”双芯

4月23日消息,美国时间周三,谷歌正式宣布其第八代张量处理单元(TPU)迎来重大战略调整:首次将AI模型的“训练”与“推理”任务剥离,交由两款相互独立的专有芯片处理。这两款新一代处理器预计于今年晚些时候推向市场。此举标志着谷歌在AI硬件领域对英伟达发起的新一轮竞争。

当前,AI推理速度正成为大厂博弈的核心战场。今年3月,英伟达大力宣传了即将推出的一款新芯片,该芯片能够让模型快速响应用户提问,而这主要归功于英伟达在斥资200亿美元收购芯片初创公司Groq的交易中所获得的技术。在此背景下,尽管谷歌仍是英伟达的主要客户,但其正通过向云服务企业提供TPU,构建替代性的算力方案。

在这场“造芯运动”中,谷歌堪称先驱。该公司于2015年开始部署自研AI处理器,并自2018年起通过云平台向外部客户提供算力服务。作为对比,亚马逊AWS于2018年和2020年分别推出了专用于推理的Inferentia芯片与专用于训练的Trainium处理器。

目前,英伟达在AI算力市场仍占据绝对主导权。谷歌在此次发布中未直接对标英伟达的同类产品,但披露了自身的性能迭代数据:在同等成本下,新款训练芯片的性能是去年11月发布的第七代TPU(代号Ironwood)的2.8倍,新款推理芯片的性能则提升了80%。

在线客服
联系电话

13517270458

微信

扫一扫 联系我