谷歌云于周三宣布,其第八代定制AI芯片——张量处理单元(TPU)将分化为两款独立产品:一款名为TPU 8t,专为模型训练设计;另一款名为TPU 8i,则主要面向推理场景。
所谓推理,指的是模型在部署后持续运行的过程,即用户提交提示词后系统所执行的操作。
与前几代产品相比,谷歌为这两款新TPU列出了一系列亮眼的性能指标:AI模型训练速度最高提升3倍,每美元算力性能提升80%,并且支持超过100万块TPU在单一集群中协同工作。总体来看,新款芯片在能耗和客户使用成本上均有望大幅低于前代产品。谷歌将这类芯片命名为TPU而非GPU,是因为其最初专为张量运算设计的低功耗芯片就沿用了Tensor这一命名。
不过,谷歌的芯片并不构成对英伟达的全面冲击,至少目前还不是。与微软、亚马逊等其他云计算巨头一样,谷歌推出这些芯片的目的是补充其基础设施中现有的英伟达体系,而非直接取而代之。事实上,谷歌承诺将在今年晚些时候在其云平台上提供英伟达最新款芯片Vera Rubin。
从长远来看,随着企业将AI需求迁移至云端、并将应用程序移植到自研芯片上,亚马逊、微软、谷歌等超大规模云服务商对英伟达的依赖程度或许会逐渐降低。
但就眼下而言,押注英伟达失势并不是明智之举。知名芯片市场分析师帕特里克·摩尔曾在X平台上半开玩笑地提到,他早在2016年谷歌推出第一款TPU时就预测该芯片将对英伟达和英特尔构成威胁。然而如今,英伟达的市值已接近5万亿美元,足以说明当年那个预测经不起时间的检验。
如果一切按照英伟达的计划推进,谷歌作为AI云服务提供商的成长反而会为这家芯片巨头带来更多业务,而非削减——即便众多工作负载运行在谷歌自家芯片上,这一趋势也不会逆转。
值得一提的是,谷歌还宣布将与英伟达展开合作,共同优化计算机网络技术,使基于英伟达芯片的系统在谷歌云中运行得更加高效。两家科技巨头具体合作的方向,是进一步强化名为Falcon的软件定义网络技术。该技术由谷歌自主研发,并于2023年通过开源数据中心硬件领域的权威组织——开放计算项目(Open Compute Project)对外开源。
A:TPU 8t是谷歌第八代AI芯片中专为模型训练设计的版本,追求高吞吐量的计算性能;TPU 8i则专注于推理场景,即模型部署后响应用户请求的过程。两款芯片针对不同的使用阶段进行了定向优化,与前代产品相比,整体训练速度提升最高达3倍,每美元性能提升80%,并支持超过100万块TPU组成单一集群。
A:目前不会。谷歌推出TPU 8t和TPU 8i的目的是补充现有的英伟达基础设施,而非直接替代。谷歌甚至承诺今年晚些时候将在云平台上提供英伟达最新款芯片Vera Rubin,并与英伟达合作优化网络技术。从市场角度看,英伟达市值已接近5万亿美元,其地位短期内难以撼动。
A:Falcon是谷歌自主研发的一种软件定义网络技术,于2023年通过开放计算项目(Open Compute Project)正式开源。谷歌与英伟达合作的目标是在此基础上进一步升级优化,使英伟达芯片在谷歌云基础设施中的运行效率得到显著提升,实现两家公司在AI基础设施层面的协同。
