当前位置：首页 > article >正文

Deepseek的起源与发展

article 2025/2/9 12:35:16

文章目录

前言
一、Deepseek的起源
二、DeepSeek的发展脉络
三、Deepseek的突破与优势
- (1)功能强大：核心能力与应用场景
- (2)性能优势：效率与效果的革命性提升
四、Deepseek开源引发关注

前言

DeepSeek 在网络安全领域带来的新机遇，DeepSeek 从崭露头角到引领 AI 领域的重大变革，已经逐渐成为全球科技创新的重要力量

在这里插入图片描述

一、Deepseek的起源

DeepSeek 是一家总部位于中国杭州的人工智能公司，起源与幻方量化密切相关。成立于2015年的幻方量化是国内头部量化私募基金，在量化投资领域成绩显著，管理资金规模曾达到千亿级别。

DeepSeek成立于2023年7月17日，由幻方量化孵化并全资控股，被其定位为通用人工智能（AGI）和大模型研发的技术引擎。公司专注于自然语言处理、代码生成和多模态数据处理等领域，致力于开发先进的大语言模型（LLM）及相关技术。

DeepSeek 团队是一群来自中国顶尖高校和研究机构的AI人才，包括多位来自清华大学和北京大学的博士生，在深度学习、强化学习和模型优化等领域积累了丰富的经验，并取得了显著的研究成果。例如他们提出的新型的多头潜在注意力（MLA）架构，以及一种名为GRPO（Group Relative Policy Optimization）的强化学习算法，在提升模型性能的同时，显著降低了训练资源的需求。