Trillium(TPU v6e)是谷歌第6代TPU。相比上一代产品,其训练性能提升超4倍,推理吞吐量提升3倍;单颗芯片峰值计算能力(Int8)提升4.7倍,达到1836TOPs;HBM容量及带宽各提升1倍,分别达到32GB和1640GBps;芯片间互联带宽提高1倍,达到3584Gbps;能源效率提升67%。Trillium支持最多256个v6e芯片训练,以及最多8个芯片的单主机推理。在扩展能力方面,使用由3072个v6e芯片组成的12个计算模块进行部署时,Trillium实现了99%的扩展效率。在跨数据中心网络环境下,使用由6144个芯片组成的24个计算模块对gpt3-175b进行预训练,Trillium展现出了94%的扩展效率。