移至主要內容
台灣官方部落格

Google Cloud 隆重推出 TPU v5p 及 AI Hypercomputer:支援下一代 AI 工作負載



資料來源:Google 內部資料,截至 2023 年 11 月, GPT3-175B的所有數據均以晶片為單位完成標準化作業

Image 1: 資料來源:Google 內部資料,截至 2023 年 11 月, GPT3-175B的所有數據均以晶片為單位完成標準化作業

資料來源:TPU v5e 資料來自 MLPerf™ 3.1 Training Closed 的 v5e 結果;TPU v5p 及 v4 數據來自 Google 內部執行的訓練作業。截至 2023 年 11 月,GPT-3 1750 億參數模型的所有數據均以每晶片 seq-len=2048 為單位完成標準化,並以 TPU v4:$3.22 美元/晶片/小時、TPU v5e: $1.2 美元/晶片/小時、以及 TPU v5p:$4.2 美元/晶片/小時的公開定價顯示每美元相對的效能。

Image 2: 資料來源:TPU v5e 資料來自 MLPerf™ 3.1 Training Closed 的 v5e 結果;TPU v5p 及 v4 數據來自 Google 內部執行的訓練作業截至 2023 年 11 月,GPT-3 1750 億參數模型的所有數據均以每晶片 seq-len=2048 為單位完成標準化,並以 TPU v4:$3.22 美元/晶片/小時、TPU v5e: $1.2 美元/晶片/小時、以及 TPU v5p:$4.2 美元/晶片/小時的公開定價顯示每美元相對的效能
Image 3: 一個表格,比較 Google Cloud TPU v4、v5e 和 v5p 版本的技術規格,包括每 Pod 的晶片數量、晶片性能指標(BF16 TFLOPS 和 Int8 TOPS)、HBM 記憶體和 ICI 頻寬
Image 4: 一個圖表,概述了 AI 超級電腦的組成部分,展示了其靈活的消費選項、開放的軟體支持和性能優化的硬體基礎