《OpenAI 公開權重大作:GPT-OSS-120B 與 GPT-OSS-20B 模型全解析》
一、背景與定位 二、架構與硬體需求 模型名稱 參數總量 每個 token 激活參數 硬體需求 gpt‑oss‑120b 約 117B 約 5.1B 能於單張 80 GB GPU(如 NVIDIA H100 或 AMD MI300X)上運行 Reddit+15OpenAI+15OpenAI+15 gpt-oss-20b 約 21B 約 3.6B 僅需 16 GB 記憶體即可於消費級硬體(如筆電或 Snapdragon 裝置)本地運行 OpenAIWindows CentralTom’s Hardware 兩款模型皆採用 Mixture‑of‑Experts(MoE)Transformer 架構,並結合 alternating…