GPT-OSS：OpenAI 开源模型，只需要 16GB 显存，目前可在线试用 - 巴巴小站

GPT-OSS：OpenAI 开源模型，只需要 16GB 显存，目前可在线试用

2个月前更新

019728

OpenAI 开源模型 gpt-oss，只需要 16GB 显存。目前可在线试用 1

这是两款 Apache 2.0 许可证下的轻量级语言模型，可商用。均基于 Transformer 架构，采用专家混合（MoE）技术，gpt-oss-120b 约有 1170 亿参数，每个 token 激活约 51 亿参数；gpt-oss-20b 有 210 亿参数，激活约 36 亿参数。支持最长 128k 的上下文长度。

性能方面，gpt-oss-120b 在核心推理测试中几乎与 OpenAI 的闭源 o4-mini 模型持平，且能高效运行于单个 80GB GPU；gpt-oss-20b 性能接近 o3-mini 模型，仅需 16GB 内存，适合边缘设备和本地推理应用。

模型	层数	总参数	每个令牌的活跃参数	总专家数	每个令牌的活跃专家数	上下文长度
gpt-oss-120b	36	117b	5.1b	128	4	128k
gpt-oss-20b	24	21b	3.6b	32	4	128k

gpt-oss 使用了主要为英文的纯文本数据集对模型进行了训练，重点关注 STEM、编程和通用知识领域。并且使用了 OpenAI o4-mini 和 GPT‑4o 所用令牌化器的超集进行数据令牌化，即 ‘o200k_harmony’，该令牌化器我们今日也一并开源。

如何部署

目前 gpt-oss-120b 和 gpt-oss-20b 两个模型已经可以在 huggingface 下载：

建议个人用户尝试 20b 模型，仅需16GB显存。毕竟不是几个人有 80G 显存来部署 120b 🐶

Ollama 安装

123	`# gpt-oss-20bollama pull gpt-oss:20bollama run gpt-oss:20b`

下载量大约 14GB，然后就可以使用 Ollama 对话了。

在线试用

目前可以直接在线试用这两个模型：

https://gpt-oss.com/

OpenAI 开源模型 gpt-oss，只需要 16GB 显存。目前可在线试用 2

并且支持联网。

© 版权声明

1、本站内容均来自网络，著作权归原作者所有，如果侵犯了您的合法权益，请联系我们删除，并向所持版权者致最深歉意！

2、本站所发布的一切学习教程、软件等资料仅限用于学习体验和研究目的，请自觉下载后24小时内删除，如果您喜欢该资料请支持正版；

3、本站大部分资源收集于网络，不保证其完整性以及安全性，不提供服务支持，请下载后自行研究；

4、本站项目如教程相关均需要自学，无相关指导，项目如有涉及其他付费环节，请自行判断谨防受骗，本站不负责项目的真伪；

THE END

OpenAI 科技前沿
# OpenAI # 开源模型 # GPT-OSS

喜欢就支持一下吧

相关推荐

评论抢沙发

请登录后发表评论

暂无评论内容