Google 正式釋出 Gemma 4 12B-it 多模態模型適合本地部署



Google DeepMind 於 2026 年 6 月 3 日正式在 Hugging Face 釋出 Gemma 4 12B-it(Unified 版本),這是 Gemma 4 系列中備受期待的中型多模態模型。該模型採用 encoder-free(無編碼器)統一架構,能直接處理文字、圖像與音頻,具備 256K 超長上下文,並在多項基準測試中展現強勁實力,特別適合本地部署與開發者使用。


Gemma 4 12B-it 主要特色

  • 參數規模:11.95B(約 120 億)參數
  • 多模態能力:原生支援文字、圖像、音頻(Audio),可處理可變長寬比與解析度的圖像,以及音頻波形
  • 統一架構:捨棄傳統獨立編碼器,直接將圖像 patch 與音頻波形透過輕量線性層投影至模型嵌入空間,大幅降低延遲並提升整合性
  • 上下文長度:最高支援 256K tokens
  • 多語言支援:超過 140 種語言
  • 授權方式:Apache 2.0(商業友好)
根據官方基準測試,Gemma 4 12B-it 在多項重要評測中表現出色:
  • GPQA Diamond:78.8%
  • MMMU Pro(多模態推理):69.0%
  • LiveCodeBench v6(程式碼能力):72.0%
  • AIME 2026(數學):77.5%
  • 長上下文測試(128K 8-needle):43.4%
整體效能已逼近更大規模的模型,特別在程式碼生成與多模態理解上表現優異。

適合本地部署的設計
Gemma 4 12B 被定位為「工作站級」甜蜜點模型。量化後(Q4_K_M)檔案大小僅約 6.7 GB,適合具備 16GB 以上記憶體的筆電或工作站運行。這也讓它成為目前最強大的「可本地高效運行」的多模態開源模型之一。
使用方式

開發者可透過 Transformers 輕鬆載入:

from transformers import AutoProcessor, AutoModelForMultimodalLM 
model_id = "google/gemma-4-12B-it" 
processor = AutoProcessor.from_pretrained(model_id) 
model = AutoModelForMultimodalLM.from_pretrained(model_id, device_map="auto") 

目前已支援 Ollama、LM Studio 等本地工具,可快速體驗。

Gemma 4 12B-it 的推出,顯示 Google 持續推動開源多模態模型的民主化策略。它在效能、效率與易用性之間取得良好平衡,尤其適合開發者、研究人員與企業在本地環境部署多模態 AI 應用。


相關文章:

《隨機鸚鵡的危險》論文與 Timnit Gebru 被 Google 解雇事件  [6/10/2026]
Google 推出 Agentic RAG 框架 提升企業 AI 回答準確度  [6/7/2026]
Google 鼓勵開發者善用 AI 加速 PostgreSQL 貢獻  [5/30/2026]
Google I/O 2026:Chrome 推出 15 項更新,邁向代理式網路時代  [5/20/2026]
[「擇法善思林之蘭室藏津」的緣起]
中職》比梅達斯還早的「梅達斯完封勝」兄弟元年「萬能球員」還曾投打二刀流
房價負擔減輕1》台北市降最多!房價所得比連5季減輕
網球》英國希望拉杜卡努單日連勝! 首闖倫敦女王草地冠軍戰
NBA冠軍賽》力拚複製騎士2016年奇蹟 溫班亞瑪:相信我們辦得到
向「一代戰神」致敬 金門舉辦「胡璉將軍逝世49週年紀念音樂會」
傅子純血癌驟逝逢頭七!賴芊合淚揭12年前戎祥急救陰影:世界瞬間就變了
射箭世界盃》黃逸柔/張正韋決勝局超神準逆轉丹麥 奪複合弓混雙金牌
野獸派演出受肯定 男星《藍色亞馬遜》提名橫掃巴西影壇
澎湖海上花火節七美離島場 無人機秀小台灣、雙心石滬
吳建豪抱病「奪命三搖」麥克風架也出事 白安變身辣DJ
廁激戰10分鐘多回一句 約完炮變性侵!
世足》怎麼做到的?遭瑞士狂轟猛炸仍爆冷逼和 卡達透露關鍵
SJ東海喊話打破209週紀錄 記者助攻:恰信一搜↗
南橫公路松濤隧道口邊坡坍方 估上午9點搶通
中職》生涯首次單場5安 陳傑憲:沒能打第6次很可惜
[擇法善思林之蘭室藏津]