《路透社》週一 (2 日) 引述多名消息人士報導,該公司已自去年起低調接觸 AMD、Cerebras 及 Groq 等多家晶片業者,評估輝達以外的人工智慧 (AI) 推論晶片替代方案。
多名熟悉內情的消息人士透露,OpenAI 的策略調整,源於其對 AI「推論」運算的重視程度快速升高。推論是指 AI 模型在實際回應用戶提問與指令時的運算過程,與模型訓練不同。儘管輝達在大型 AI 模型訓練晶片市場仍具壓倒性優勢,但推論晶片正逐漸成為新一輪競爭焦點。
多名消息人士指出,OpenAI 對輝達硬體在特定應用情境下的回應速度並不滿意,尤其是在軟體開發及 AI 與其他系統互動等需求上。
據其中一人透露,OpenAI 未來希望有新硬體可支撐約一成的推論運算需求。
OpenAI 尋找替代方案的同時,正與輝達進行投資談判。
輝達去年 9 月曾表示,計畫向 OpenAI 投入高達 1,000 億美元,藉此取得股權,並協助 OpenAI 籌措購買先進晶片的資金。該交易原預期數週內完成,但至今談判已延宕數月。
消息人士表示,OpenAI 產品路線的持續調整,也改變了其對運算資源的需求,進而影響與輝達的協商進度。
輝達執行長黃仁勳近日否認雙方存在緊張關係,稱相關說法毫無根據,並重申輝達仍計畫對 OpenAI 進行大規模投資。輝達聲明稱,公司產品在大規模推論運算下仍具備最佳效能與整體成本優勢。
OpenAI 方面也表示,目前其推論運算叢集的絕大多數仍由輝達提供支援。
OpenAI 在評估替代方案過程中,曾與 AMD 、Cerebras 及 Groq 等公司進行接觸,評估可與輝達 GPU 競爭的方案。
消息指出,OpenAI 近一年評估的替代方案,聚焦於採用大量內嵌 SRAM 記憶體的晶片架構,這類設計在推論運算中可降低資料存取延遲,提升回應速度。相較之下,現行 GPU 架構多依賴外部記憶體,可能影響即時互動表現。這一限制在 OpenAI 的程式碼生成產品 Codex 上尤為明顯,內部評估認為硬體架構是影響效能的因素之一。
OpenAI 執行長阿特曼 (Sam Altman) 1 月底對外表示,程式開發用戶對回應速度極為重視,OpenAI 將透過與 Cerebras 的合作來滿足相關需求。不過他也指出,對一般 ChatGPT 使用者而言,速度的重要性相對較低。
華爾街分析,競爭對手如 Anthropic 與 Google,因較多採用自家開發、專為推論設計的晶片架構,在部分應用上具備效能優勢。
隨著 OpenAI 對現有技術表達保留,消息人士透露,輝達也曾接觸 Cerebras 與 Groq 等業者,評估收購或合作可能性。最終 Cerebras 選擇與 OpenAI 建立商業合作,而輝達則在去年底以非獨家方式取得 Groq 技術授權,並延攬其部分晶片設計人才。
業界人士認為,OpenAI 對推論晶片的重新布局,顯示 AI 發展正逐步從訓練階段,邁向更強調即時回應與實際應用效能的新階段,相關動向也將持續牽動輝達在 AI 產業中的主導地位。
新聞來源 (不包括新聞圖片): 鉅亨網