跳转到内容

DeepSeek:修订间差异

来自天明的百科全书
Ztm0929留言 | 贡献
无编辑摘要
Ztm0929留言 | 贡献
无编辑摘要
 
第1行: 第1行:
国产知名[[大型语言模型]]系列,由深度求索公司研发。
国产知名[[大型语言模型]]系列,由深度求索公司研发,背后是[[量化]]公司“[[幻方量化]]”,创始人是[[梁文锋]]。


https://deepseek.com/
https://deepseek.com/

2025年10月31日 (五) 11:59的最新版本

国产知名大型语言模型系列,由深度求索公司研发,背后是量化公司“幻方量化”,创始人是梁文锋

https://deepseek.com/

https://github.com/deepseek-ai

https://huggingface.co/deepseek-ai

现有模型

DeepSeek推出了多种模型,主要有以下几个系列[1]

  • DeepSeek R1:首发于2025年1月[注 1],其特点在于增强了模型的推理能力,支持思维链输出[2][3],最新版为DeepSeek-R1-0528[4]
  • DeepSeek V3:首发于2024年12月,其特点在于作为开源通用模型,模型能力比肩众多顶尖的闭源知名模型(如GPT-4o)[5],最新版为DeepSeek-V3.2-Exp[6]
  • DeepSeek Coder V2
  • DeepSeek VL
  • DeepSeek V2
  • DeepSeek Coder
  • DeepSeek Math
  • DeepSeek LLM

另请参阅

注释

  1. 2024年11月首次上线推理模型DeepSeek-R1-Lite,仅用于预览体验。参见:https://api-docs.deepseek.com/zh-cn/news/news1120

参考资料