Deepseek的起源与发展
文章目录
- 前言
- 一、Deepseek的起源
- 二、DeepSeek的发展脉络
- 三、Deepseek的突破与优势
-
- (1)功能强大:核心能力与应用场景
- (2)性能优势:效率与效果的革命性提升
- 四、Deepseek开源引发关注
前言
DeepSeek 在网络安全领域带来的新机遇,DeepSeek 从崭露头角到引领 AI 领域的重大变革,已经逐渐成为全球科技创新的重要力量
一、Deepseek的起源
DeepSeek 是一家总部位于中国杭州的人工智能公司,起源与幻方量化密切相关。成立于2015年的幻方量化是国内头部量化私募基金,在量化投资领域成绩显著,管理资金规模曾达到千亿级别。
DeepSeek成立于2023年7月17日,由幻方量化孵化并全资控股,被其定位为通用人工智能(AGI)和大模型研发的技术引擎。公司专注于自然语言处理、代码生成和多模态数据处理等领域,致力于开发先进的大语言模型(LLM)及相关技术。
DeepSeek 团队是一群来自中国顶尖高校和研究机构的AI人才,包括多位来自清华大学和北京大学的博士生,在深度学习、强化学习和模型优化等领域积累了丰富的经验,并取得了显著的研究成果。例如他们提出的新型的多头潜在注意力(MLA)架构,以及一种名为GRPO(Group Relative Policy Optimization)的强化学习算法,在提升模型性能的同时,显著降低了训练资源的需求。
二、DeepSeek的发展脉络
DeepSeek 的发展历程可以追溯到幻方量化自主研发的 “萤火一号” 训练平台。2023年,在 ChatGPT引发市场