一、背景與定位
- OpenAI 於 2025 年 8 月 5 日 正式發布兩款 open‑weight(開放權重)語言模型:gpt‑oss‑120b 與 gpt‑oss‑20b,這係 OpenAI 自 GPT‑2(2019 年) 之後首次公開開放權重嘅模型,代表咗一大轉折,朝向更加開放與民主化嘅 AI 發展路線邁進 Windows Blog+15WIRED+15WIRED+15。
- 模型採用 Apache 2.0 授權,允許商業及非商業用途使用、修改及再發佈,強化開發者同研究者嘅創新自由 WIRED+1。
二、架構與硬體需求
模型名稱 | 參數總量 | 每個 token 激活參數 | 硬體需求 |
---|---|---|---|
gpt‑oss‑120b | 約 117B | 約 5.1B | 能於單張 80 GB GPU(如 NVIDIA H100 或 AMD MI300X)上運行 Reddit+15OpenAI+15OpenAI+15 |
gpt-oss-20b | 約 21B | 約 3.6B | 僅需 16 GB 記憶體即可於消費級硬體(如筆電或 Snapdragon 裝置)本地運行 OpenAIWindows CentralTom’s Hardware |
兩款模型皆採用 Mixture‑of‑Experts(MoE)Transformer 架構,並結合 alternating dense 與 locally banded sparse attention,以及 grouped multi‑query attention(group size = 8),進一步提升推理效率與推理能力 維基百科+11OpenAI+11Tom’s Hardware+11。
佢地支援極長上下文長度—達 128 k tokens,係目前本地推理支持中最高之一 OpenAI+15Tom’s Hardware+15Cinco Días+15。
三、推理能力與效能表現
- gpt‑oss‑120b 在多項 reasoning benchmark 上達到或超越 OpenAI 自家嘅 o4‑mini 模型,包括:
- 程式競賽(Codeforces)
- 一般問題解答(MMLU、HLE)
- 工具調用能力(TauBench)
- 尤其在 醫療 (HealthBench)及 數學比賽 (AIME 2024 & 2025)上甚至超越 o4‑mini Windows Blog+15OpenAI+15Tom’s Hardware+15。
- gpt‑oss‑20b 性能接近或略勝於 o3‑mini,在上述多項 benchmark 上表現穩定,尤其在競賽數學與醫療領域上亦有優勢 Tom’s Hardware+1。
- 模型支援 chain‑of‑thought(思路鏈)推理,能將複雜問題拆解成多步推理,提升可解釋性與推理過程透明度 Windows CentralWIREDOpenAI+1。
四、工具整合與生態支援
- 模型支援 工具調用(tool use) —— 包括 Web browsing、Python code execution、structured output generation 同 function calling,強化 agentic 能力 OpenAI+1。
- 開源技術整合平台廣泛,包括 Hugging Face、Azure、AWS、ONNX Runtime、vLLM、Ollama 等,可於多平台便利部署與開發 Tom’s Hardware+2Windows Central+2。
- Windows 平台透過 Windows AI Foundry、Foundry Local 或 AI Toolkit for VS Code (AITK) 等工具,讓 gpt‑oss‑20b 可直接於具備 16GB VRAM 擴展嘅 Windows PC 上運作 GroqCloud+15Windows Blog+15TechCrunch+15。
五、總結概覽(簡短版)
- gpt-oss-120b:
- 參數量約 117B、MoE 架構、每 token 激活 5.1B
- 表現媲美甚至超越 o4-mini
- 可於單張 80 GB GPU 運行
- 支援長上下文、chain-of-thought、工具調用
- Apache 2.0 授權,開源可商用
- gpt-oss-20b:
- 參數量約 21B、MoE 架構、每 token 激活 3.6B
- 效能相似於 o3-mini
- 能夠在 16 GB 設備上運行(如筆電、Snapdragon 機器)
- 同樣支援 chain-of-thought 與工具整合
- 同樣授權開放,適合 edge 或 on-device 應用
📌 官方介紹與文件
- OpenAI 官方介紹頁:
https://openai.com/index/introducing-gpt-oss - OpenAI Model Card(技術與安全文件):
https://openai.com/index/gpt-oss-model-card
📌 模型下載與社群資源
- Hugging Face(gpt-oss-120b):
https://huggingface.co/openai/gpt-oss-120b - Hugging Face(gpt-oss-20b):
https://huggingface.co/openai/gpt-oss-20b
📌 雲端部署
- AWS 官方公告(Bedrock / SageMaker JumpStart 支援):
https://aws.amazon.com/blogs/aws/openai-open-weight-models-now-available-on-aws - OpenAI 幫助中心(部署與使用 FAQ):
https://help.openai.com/en/articles/11870455-openai-open-weight-models-gpt-oss