DeepSeek
外观
国产知名大型语言模型系列,由深度求索公司研发。
https://github.com/deepseek-ai
https://huggingface.co/deepseek-ai
现有模型
DeepSeek推出了多种模型,主要有以下几个系列[1]:
- DeepSeek R1:首发于2025年1月[注 1],其特点在于增强了模型的推理能力,支持思维链输出[2][3]。
- DeepSeek V3:首发于2024年12月,其特点在于作为开源通用模型,模型能力比肩众多顶尖的闭源知名模型(如GPT-4o)[4]。
- DeepSeek Coder V2
- DeepSeek VL
- DeepSeek V2
- DeepSeek Coder
- DeepSeek Math
- DeepSeek LLM
另请参阅
注释
- ↑ 2024年11月首次推理模型DeepSeek-R1-Lite,仅用于预览体验。参见:https://api-docs.deepseek.com/zh-cn/news/news1120