LM Studio 與 Apple 合作,4 台 Mac Studio 成功運行 1 兆參數(1000B) Kimi 模型
分類: AI 新品報導 發布時間:
在 2026 年 WWDC 大會上,LM Studio 與 Apple 合作展示了一項令人矚目的技術成果:使用 4 台頂規 Mac Studio,成功運行 Moonshot AI(Kimi)最新推出的 1 兆參數(1T)MoE 模型 Kimi K2.6。這項展示被視為本地 AI 運算領域的重要里程碑,顯示 Apple Silicon 在大型模型推理上的效率,已讓「本地部署超大規模 AI 模型」的成本門檻大幅改寫。

Kimi K2.6 是 Moonshot AI 推出的旗艦級開放權重模型,採用 Mixture-of-Experts(MoE) 架構,總參數量高達 1 兆,但每次推理僅激活約 320 億 參數。這類設計讓模型在保持強大能力的同時,推理成本相對可控。
該模型在長上下文程式碼生成、複雜 Agent 任務,以及多模態理解上表現突出,被視為目前開源陣營中少數能與頂尖閉源模型競爭的選擇。
此次展示最受關注的地方在於硬體成本與部署門檻的變化。
過去,運行接近 1 兆參數規模的模型,通常需要搭配多張 NVIDIA H100 或 Blackwell 等高階 GPU 伺服器,單一機架的硬體成本動輒數百萬至上千萬台幣。而 LM Studio 與 Apple 在 WWDC 展示的方案,僅使用 4 台高階 Mac Studio 即可實現。
這背後的主要原因包括:
- Apple Silicon 的統一記憶體架構:高階 Mac Studio(M 系列 Ultra)可搭載高達 192GB 以上的統一記憶體,讓大型模型的權重載入更有效率。
- MLX 框架的優化:Apple 自行開發的 MLX 框架針對 Apple Silicon 進行深度優化,在大型模型推理上表現出色。
- LM Studio 的叢集支援:LM Studio 在此次展示中扮演關鍵角色,負責模型分片(model sharding)、跨裝置協調與推理排程,讓 4 台 Mac Studio 能像單一叢集般運作。
以往若要穩定運行 1T 級模型,本地部署的硬體與電力成本往往高於雲端方案。但隨著 Apple Silicon 效能提升,加上 LM Studio 等工具的成熟,現在用相對親民的 Mac Studio 組成小型叢集,已能達到過去需要昂貴 GPU 伺服器才能達到的規模。
這對注重資料隱私、需要低延遲推理,或希望長期控制運算成本的組織來說,具有相當大的吸引力。
LM Studio 原本就以操作友善、支援多種後端引擎(包含 MLX)聞名,此次與 Apple 合作展示叢集能力,顯示其正從單機工具朝向企業級本地 AI 平台發展。
分析師認為,隨著更多開發者與企業開始評估「本地 + 混合雲」的 AI 部署策略,像 LM Studio 這類同時支援單機與叢集運作的工具,將扮演越來越重要的角色。


