开源大模型 DeepSeek 开放了哪些内容？

开源大模型 DeepSeek 到底开放了什么？

DeepSeek：开源大模型的崛起与影响

当全球科技界热议 DeepSeek 为何能引发广泛关注并被各大厂商和平台集成时，"开源" 成为了讨论中的核心关键词之一。图灵奖得主 Yann LeCun 称其为 "开源的胜利"。本文将深入探讨 DeepSeek 的开源之道，分析其开放的内容及其开放程度。

DeepSeek 的演进与性能表现

DeepSeek 经历了多个版本的迭代，包括 V2、V2.5、V3、R1-Zero 和 R1 等。特别是在 V3 版本中，DeepSeek 在 MMLU、MMLU-Redux、MMLU-Pro、C-Eval、CMMLU、IFEval、FRAMES、GPQA Diamond、SimpleQA、C-SimpleQA、SWE-Bench Verified、Aider、LiveCodeBench、Codeforces、中国全国中学生数学奥林匹克竞赛（CMO）以及美国数学邀请赛（AIME）等基准测试中表现出色，成为性能最佳的开源模型之一，并在某些方面与前沿闭源模型相媲美。

R1 版本则通过强化学习（Reinforcement Learning, RL）而非监督微调（Supervised Fine-Tuning, SFT）显著提升了模型能力，在某些测试项上甚至超越了 OpenAI 的模型。这标志着 DeepSeek 开源大模型的崛起，带来了巨大的不确定性，也为开源 AI 模型的发展注入了新的活力。

DeepSeek 的开源许可证

DeepSeek 在 Hugging Face 上共发布了 68 个模型及一个数据集。其中，DeepSeek-R1 和 DeepSeek-R1-Zero 模型采用 MIT 许可证，而其他模型则使用 DeepSeek 许可证，代码部分依然采用 MIT 许可证。此外，DeepSeek 还从 Qwen 和 Llama 蒸馏了 6 个模型，这些蒸馏模型采用 MIT 许可证，而 Qwen 和 Llama 基础模型分别使用 Apache 2.0 和 llama 许可证。

DeepSeek 的开放层级

根据 LF AI & Data 基金会引入的模型开放框架（Model Openness Framework, MOF），大模型的开放分为三个层次。以 DeepSeek-R1 和 DeepSeek-V3 为例，它们开放了模型架构、模型卡、模型参数、技术报告和评估结果等，但并未开放训练代码、推理代码、评估代码和数据集等更为重要的组件。因此，DeepSeek 的开放层级至多属于第三级。