Sakana AI 推出多代理協作系統「Fugu」,單一 API 動態調度前沿模型



日本 AI 公司 Sakana AI 近日正式對外公布其旗艦商業產品 Sakana Fugu,這是一套將多代理協作技術整合為基礎模型的系統。使用者只需透過單一 API 發送請求,系統便會自動從多個前沿大型語言模型中動態選擇並協調,完成任務分配、執行與結果整合。


Sakana AI 表示,Fugu 最初是公司內部研究人員與工程師使用的工具,經過實務驗證後,現在開放早期測試者申請使用。

Fugu 的技術核心來自 Sakana AI 於 ICLR 2026 發表的两篇論文:

  • TRINITY:演化式 LLM 協調器
  • Conductor:以強化學習訓練模型使用自然語言協調代理
在商業化版本中,Sakana AI 對這些方法進行了進一步優化。Fugu 能夠動態組建代理團隊、決定協作拓撲結構、分配角色與子任務,而非依賴固定規則。它甚至能在推理過程中呼叫自身,實現「測試時擴展」(test-time scaling),透過自我迭代來提升輸出品質。

這套系統採用標準 OpenAI 相容 API,使用者無需管理多組 API 金鑰,即可享受多模型協作帶來的效能優勢。

Sakana Fugu 提供兩個版本:

  • Fugu Mini:以低延遲為優先,適合一般用途。
  • Fugu Ultra:強調最高效能,適合需要高準確度的複雜任務。
根據官方公布的測試結果,Fugu Ultra 在多項基準上超越或接近個別前沿模型:
  • GPQA-D:Fugu Ultra 達到 95.1,高於 Gemini 3.1(高階版)的 94.4。
  • LiveCodeBench v6:Fugu Ultra 取得 93.2,優於 GPT-5.4(高階版)的 92.1。
  • SWE-Bench Pro:Fugu Ultra 拿到 54.2,高於多數單一模型表現。
Sakana AI 強調,這種動態協作機制讓 Fugu 在需要多步驟推理與複雜協作的任務上,展現出明顯優勢。


Fugu 特別適合以下使用情境:

  • 程式設計助理工具(如 OpenCode、Codex 等)
  • 工程與商業專案中的複雜問題解決
  • 科學推理與數學相關的高難度任務
目前 Sakana AI 正開放 早期測試者申請,目標對象為各領域的研究人員與工程師。公司表示,希望透過實際使用回饋,進一步了解產品的優勢、限制與使用者需求。

Fugu 的推出,代表 AI 應用正從「選擇單一最佳模型」轉向「有效指揮多模型協作」的新階段。Sakana AI 認為,未來的高效能 AI 系統,將越來越依賴動態編排與集體智慧,而非單純追求單一模型規模。

參考來源:
Sakana AI 官方公告頁面:https://sakana.ai/fugu-beta/