DeepSeek

中国大模型的高性价比开源路线引领者

一句话定义

通过算法架构革新(如 NSA 稀疏注意力)实现”密度法则”——更少计算与数据、更高效智能;将 Token 成本大幅降低,惠及全球开发者。

关键事实

  • iiMedia Ranking 2025 大模型 TOP1(榜单 TOP10:DeepSeek / 元宝 / 豆包 / 千问 / 文心 / Kimi / 百川 / 灵光 / 纳米 AI / 360 智脑)
  • 2025-12 月活 1.35 亿(第二位)
  • 2026-02 千问月活 3.22 亿反超 DeepSeek
  • 摩根士丹利评语:「正在证明 AI 下一次飞跃可能不是来自更多 GPU,而是来自学会如何在约束条件下思考」
  • 清华张亚勤评:「标志着中国 AI 技术路线分化突破——更轻模型、更聪明架构、更高效率、更低价格」

技术路线

  • NSA 稀疏注意力机制(与月之暗面 MoBA 类似),提升推理效率
  • 即将发布的下一代模型预期:更强记忆 + 超长上下文 + 精进代码 / Agent + 补齐多模态短板(中信证券研报)

战略位置

  • 在中国大模型梯队中占据独特生态位:高性价比 + 开源
  • 引领”从拼规模到拼密度”的技术竞争逻辑转变

在本 Wiki 中的出现

相关

Agentic-AI