DeepSeek 大模型每个版本的特点以及运用场景对比
deepseek 网页地址:DeepSeek | 深度求索
1. DeepSeek-V1
-
发布时间:2024年1月
-
参数规模:预训练数据量2TB,具体参数未明确公开,推测为数十亿级别
-
功能特点:
-
编码能力:支持多种编程语言(如Python、Java、C++),可生成高质量代码框架。
-
长上下文处理:支持128K上下文窗口,适用于技术文档分析和总结。
-
局限性:多模态能力弱,复杂推理能力不足。
-
-
适用场景:技术文档处理、基础代码生成。</