DeepSeek
中国大模型的高性价比开源路线引领者。
一句话定义
通过算法架构革新(如 NSA 稀疏注意力)实现”密度法则”——更少计算与数据、更高效智能;将 Token 成本大幅降低,惠及全球开发者。
关键事实
- iiMedia Ranking 2025 大模型 TOP1(榜单 TOP10:DeepSeek / 元宝 / 豆包 / 千问 / 文心 / Kimi / 百川 / 灵光 / 纳米 AI / 360 智脑)
- 2025-12 月活 1.35 亿(第二位)
- 2026-02 千问月活 3.22 亿反超 DeepSeek
- 摩根士丹利评语:「正在证明 AI 下一次飞跃可能不是来自更多 GPU,而是来自学会如何在约束条件下思考」
- 清华张亚勤评:「标志着中国 AI 技术路线分化突破——更轻模型、更聪明架构、更高效率、更低价格」
技术路线
- NSA 稀疏注意力机制(与月之暗面 MoBA 类似),提升推理效率
- 即将发布的下一代模型预期:更强记忆 + 超长上下文 + 精进代码 / Agent + 补齐多模态短板(中信证券研报)
战略位置
- 在中国大模型梯队中占据独特生态位:高性价比 + 开源
- 引领”从拼规模到拼密度”的技术竞争逻辑转变
在本 Wiki 中的出现
- 09-中投-2026-AI产业深度报告
- 10-SDD五个常识全错了(仅一次提及,作为高推理模型代表)