DeepSeek
外观
国产知名大型语言模型系列,由深度求索公司研发,背后是量化公司“幻方量化”,创始人是梁文锋。
https://github.com/deepseek-ai
https://huggingface.co/deepseek-ai
现有模型
DeepSeek推出了多种模型,主要有以下几个系列[1]:
- DeepSeek R1:首发于2025年1月[注 1],其特点在于增强了模型的推理能力,支持思维链输出[2][3],最新版为DeepSeek-R1-0528[4]。
- DeepSeek V3:首发于2024年12月,其特点在于作为开源通用模型,模型能力比肩众多顶尖的闭源知名模型(如GPT-4o)[5],最新版为DeepSeek-V3.2-Exp[6]。
- DeepSeek Coder V2
- DeepSeek VL
- DeepSeek V2
- DeepSeek Coder
- DeepSeek Math
- DeepSeek LLM
另请参阅
注释
- ↑ 2024年11月首次上线推理模型DeepSeek-R1-Lite,仅用于预览体验。参见:https://api-docs.deepseek.com/zh-cn/news/news1120
参考资料
- ↑ https://huggingface.co/deepseek-ai/collections
- ↑ https://api-docs.deepseek.com/zh-cn/news/news250120
- ↑ https://github.com/deepseek-ai/DeepSeek-R1
- ↑ https://api-docs.deepseek.com/zh-cn/news/news250528
- ↑ https://api-docs.deepseek.com/zh-cn/news/news1226
- ↑ https://api-docs.deepseek.com/zh-cn/news/news250929