移至主要內容
台灣官方部落格
Google Cloud 宣布推出 Ironwood TPU 以及全新虛擬機器 Axion,為 AI 推論時代注入動能

Google Cloud 宣布推出 Ironwood TPU 以及全新虛擬機器 Axion,為 AI 推論時代注入動能

Google Cloud 宣布推出 Ironwood TPU 以及全新虛擬機器 Axion,為 AI 推論時代注入動能

圖一:Ironwood 電路板搭載三組連接到液冷系統的 Ironwood TPUs

圖一:Ironwood 電路板搭載三組連接到液冷系統的 Ironwood TPUs

圖二:第三代冷卻分配裝置(Cooling Distribution Units),為 Ironwood superpod 提供液冷

圖二:第三代冷卻分配裝置(Cooling Distribution Units),為 Ironwood superpod 提供液冷

Anthropic 運算主管 James Bradbury:「我們的客戶,從《財星》(Fortune)世界五百強企業到新創公司,都仰賴 Claude 來處理他們最重要的工作。隨著需求持續指數型成長,我們在推動 AI 研究和產品開發的邊界擴展時,也在增加我們的運算資源。Ironwood 在推論效能和訓練可擴展性上的提升,將幫助我們高效擴展,同時滿足客戶期望的速度和可靠性。」

Anthropic logo

Lightricks 研究團隊總監 Yoav HaCohen:「Lightricks 的使命是定義開放式創意的尖端,而這需要能在大規模上消除摩擦與成本的 AI 基礎架構。我們利用 Google Cloud 的 TPU 及其龐大的晶片間互連網路(Interchip Interconnect, ICI),為我們領先的開源多模態生成模型 LTX-2 實現了突破性的訓練效率。現在,隨著進入推論時代,這個早期測試讓我們對 Ironwood 充滿期待。我們相信 Ironwood 將使我們能夠為全球數百萬客戶創造更細膩、更精確、更高擬真度的圖像和影片生成。」

Lightricks logo

Essential AI 基礎架構負責人 Philip Monk:「在 Essential AI,我們的使命是打造強大且開放的頂尖模型。我們需要大規模且高效的擴展能力,而 Google Cloud 的 Ironwood TPU 正好滿足了這一需求。這個平台極易上手,讓我們的工程師能立即發揮其強大能力,並專注於加速 AI 的突破。」

Essential AI logo

圖三:Ironwood superpod 在單一網域中直接連接 9,216 個 Ironwood TPU。

圖三:Ironwood superpod 在單一網域中直接連接 9,216 個 Ironwood TPU。

圖四:Jupiter 資料中心網路技術能將多個 Ironwood superpods 串連成數十萬個 TPU 的叢集。

圖四:Jupiter 資料中心網路技術能將多個 Ironwood superpods 串連成數十萬個 TPU 的叢集。
圖五:Axion 透過客製化、基於 Arm Neoverse® 的 CPU,為工作負載提供卓越的效能、成本效益和能源效率。
Axion 產品三大的選項:N4A、C4A 和 C4A metal

Vimeo 託管與交付營運資深總監 Joe Peled:「在 Vimeo,我們長期仰賴自訂機器類型(Custom Machine Types)來有效管理我們龐大的影片轉檔平台。我們在新型 Axion N4A 執行個體上的初步測試結果令人非常驚豔,解鎖了新的效率水平。與同等級的 x86 VM 相比,我們的核心轉檔工作負載效能提高了 30%。這意味著我們能在無需改變營運模式的情況下,改善我們的單位經濟效益,並以更高的利潤擴展服務。」

vimeo logo

ZoomInfo 基礎架構首席架構師 Sergei Kore:「在 ZoomInfo,我們營運著一個效率至上的龐大的數據智慧平台。我們的核心資料處理流程,對於向客戶提供即時洞察至關重要,這些流程廣泛運行在 GKE 中的 Dataflow 和 Java 服務上。在我們對 N4A 執行個體的預覽測試中,測得這些關鍵工作負載的性價比相較於 x86 的同類產品提升了 60%。這使我們能夠更有效率地擴展平台,並更快地為客戶提供更多價值。」

ZoomInfo logo

Rise 雲端與軟體架構師 Or Ben Dahan:「遷移到 Google Cloud 的 Axion 產品組合為我們帶來了關鍵的競爭優勢。我們將運算消耗降低了 20%,同時透過 C4A 執行個體(例如我們的供應方平台 SSP 後端服務)保持低延遲和穩定性。此外,C4A 使我們能夠利用 Hyperdisk,為我們的狀態性工作負載(stateful workloads) 提供精確所需的 IOPS,而不受執行個體大小的限制。這種靈活性為我們帶來兩全其美的優勢──能為客戶贏得更多廣告競價,同時顯著提高我們的利潤。我們正在測試 N4A 系列,運行例如 API 轉送服務等一些需要最高靈活性的關鍵工作負載。我們很高興分享,目前在生產環境中運行的數個應用程式,其 CPU 消耗量比我們先前的基礎架構減少了 15%,進一步降低了成本,同時確保合適的執行個體能支援所需的工作負載特性。」

Rise logo