《OpenAI 公開權重大作:GPT-OSS-120B 與 GPT-OSS-20B 模型全解析》

一、背景與定位

  • OpenAI2025 年 8 月 5 日 正式發布兩款 open‑weight(開放權重)語言模型gpt‑oss‑120bgpt‑oss‑20b,這係 OpenAI 自 GPT‑2(2019 年) 之後首次公開開放權重嘅模型,代表咗一大轉折,朝向更加開放與民主化嘅 AI 發展路線邁進 Windows Blog+15WIRED+15WIRED+15
  • 模型採用 Apache 2.0 授權,允許商業及非商業用途使用、修改及再發佈,強化開發者同研究者嘅創新自由 WIRED+1

二、架構與硬體需求

模型名稱參數總量每個 token 激活參數硬體需求
gpt‑oss‑120b約 117B約 5.1B能於單張 80 GB GPU(如 NVIDIA H100 或 AMD MI300X)上運行 Reddit+15OpenAI+15OpenAI+15
gpt-oss-20b約 21B約 3.6B僅需 16 GB 記憶體即可於消費級硬體(如筆電或 Snapdragon 裝置)本地運行 OpenAIWindows CentralTom’s Hardware

兩款模型皆採用 Mixture‑of‑Experts(MoE)Transformer 架構,並結合 alternating dense 與 locally banded sparse attention,以及 grouped multi‑query attention(group size = 8),進一步提升推理效率與推理能力 維基百科+11OpenAI+11Tom’s Hardware+11

佢地支援極長上下文長度—達 128 k tokens,係目前本地推理支持中最高之一 OpenAI+15Tom’s Hardware+15Cinco Días+15


三、推理能力與效能表現

  • gpt‑oss‑120b 在多項 reasoning benchmark 上達到或超越 OpenAI 自家嘅 o4‑mini 模型,包括:
    • 程式競賽(Codeforces)
    • 一般問題解答(MMLU、HLE)
    • 工具調用能力(TauBench)
    • 尤其在 醫療 (HealthBench)及 數學比賽 (AIME 2024 & 2025)上甚至超越 o4‑mini Windows Blog+15OpenAI+15Tom’s Hardware+15
  • gpt‑oss‑20b 性能接近或略勝於 o3‑mini,在上述多項 benchmark 上表現穩定,尤其在競賽數學與醫療領域上亦有優勢 Tom’s Hardware+1
  • 模型支援 chain‑of‑thought(思路鏈)推理,能將複雜問題拆解成多步推理,提升可解釋性與推理過程透明度 Windows CentralWIREDOpenAI+1

四、工具整合與生態支援

  • 模型支援 工具調用(tool use) —— 包括 Web browsing、Python code execution、structured output generation 同 function calling,強化 agentic 能力 OpenAI+1
  • 開源技術整合平台廣泛,包括 Hugging FaceAzureAWSONNX RuntimevLLMOllama 等,可於多平台便利部署與開發 Tom’s Hardware+2Windows Central+2
  • Windows 平台透過 Windows AI FoundryFoundry LocalAI Toolkit for VS Code (AITK) 等工具,讓 gpt‑oss‑20b 可直接於具備 16GB VRAM 擴展嘅 Windows PC 上運作 GroqCloud+15Windows Blog+15TechCrunch+15

五、總結概覽(簡短版)

  • gpt-oss-120b
    • 參數量約 117B、MoE 架構、每 token 激活 5.1B
    • 表現媲美甚至超越 o4-mini
    • 可於單張 80 GB GPU 運行
    • 支援長上下文、chain-of-thought、工具調用
    • Apache 2.0 授權,開源可商用
  • gpt-oss-20b
    • 參數量約 21B、MoE 架構、每 token 激活 3.6B
    • 效能相似於 o3-mini
    • 能夠在 16 GB 設備上運行(如筆電、Snapdragon 機器)
    • 同樣支援 chain-of-thought 與工具整合
    • 同樣授權開放,適合 edge 或 on-device 應用

📌 官方介紹與文件


📌 模型下載與社群資源


📌 雲端部署

Leave a Reply

Your email address will not be published. Required fields are marked *