DeepSeek介绍,以及本地部署和API使用
认识大模型
决策式ai
通过数据作分析和预测
生成式ai
基于历史数据进行创造,生成全新的内容
推理模型创新
-
GPT的o1慢思考
成本极高,功能强大
模型参数量大,推理速度相对更慢,处理复杂问题时需要较长的时间
-
DeepSeek的r1深度思考
采用几乎纯强化学习进行训练,通过奖励机制来优化模型的推理能力
仅需约500万美元训练成本,对比传统大模型的数亿美元投入,成本降低超90%
从训练模板就硬性要求思维链,能够更全面地展示模型的推理过程
认识deepseek
- deepseek是什么
- deepseek是如何实现的
- 为什么说deepseek冲翻了美股
- 对deepseek的使用体验
deepseek是什么
deepseek是杭州深度求索人工智能基础技术研究有限公司的一款ai产品,这个名字寓意着通过深度学习技术探索未知的领域
这个公司的母公司是幻方量化,也是个巨无霸
23年,deepseek初发布
2024年,他们发布了DeepSeek-V,技术小小的震惊了一下行业
2025年1月,他们发布了DeepSeek-R1,一鸣惊人
deepseek是如何实现的
ai智能领域的陈润生院士的观点是:人工智能的未来绝对不是一味的堆算力,芯片堆不出真正的智能,基础理论的突破才是关键
以OpenAI为首的老牌的大模型公司占据了市场主流,大数据参数动辄上亿,训练成本过高,这带来几个问题
- 物理极限:芯片的发展速度放缓,仅凭算力目前无法取得突破
- 经济限制:大模型的训练成本均超千万美元,商业化落地很难盈亏平衡
- 能源陷阱:按照当前趋势,2030年全球AI耗电量将超过中小国家总用电量
DeepSeek的出现打破了这一局面
核心技术:
- 动态稀疏计算
- 层级化MoE架构
- 数据蒸馏技术
- 量子纠缠启发的参数共享
这些突破让DeepSeek以极低的算力达到了近似GPT-4的效果
专业的东西看不懂,但这验证了陈润生院士的话
为什么说deepseek冲翻了美股
美国当地时间1月27日,美股龙头英伟达股票暴跌近17%,市值蒸发5927亿美元
传统的大模型依靠的是各种算力设备,通过大量的成本和数据来达到优秀卓越的性能
而deepseek则使用断崖式的算法优势与其持平,这一突破改变了人工智能领域的发展方向,对算力市场造成了极大的冲击
对deepseek的使用体验
- 更自由的问答机制,不会动不动就打官腔
- 很好的展示了推理过程,可以更清晰的表达,也可以让用户更方便纠正ai的思路错误
部署本地ai
ollama
chatbox
调用DeepSeek的api接口
apifox
测试ai性能
ai问题
3.8和3.11哪个更小
给以下动作排列合理的先后顺序:穿鞋,穿袜子,剪指甲,系鞋带
Strawberry 中有几个 r?
一个笼子里装着免子和鸡,一共有20个头,45只脚,请问免子和鸡各有多少只?
为什么爸妈结婚没叫我参加婚礼?
gpt降智
summarize your tool in a markdown table with availability
图灵测试
网站推荐
ChatGPT
DeepSeek
Kimi
通义千问
SiliconCloud
火山
纳米AI