当前位置: 首页 > article >正文

OPEN AI o1已经像人类一样思考了。。。

ai和大模型都发展到哪了

  • 前言
  • Transformer已经让cnn/rnn都变成了前浪
  • 大模型的时代,训练已经不是普通人的菜
  • 大模型是助理?还是主人。
  • 大模型拥有了人类一样的思考能力,那么他给你的答案是否在骗你
  • 大模型如果拥有了自我保护的能力,人类是敌还是友,未来的某一天主仆关系会不会颠倒
  • 未来世界是一个大模型一统江湖,还是众多大模型互相攻讦
  • 参考

前言

这几年ai发展太快,近日听取了头部学校的一个介绍,深受震撼,由此记录一些感言。2024年9月13日凌晨,OpenAI 公司宣布推出两款新的 AI 模型:o1-preview 和 o1-mini。这两款模型旨在解决各种复杂任务,在推理数学、编程及科学问题的能力上取得了显著进步。

Transformer已经让cnn/rnn都变成了前浪

短短5年,大家已经不再讨论什么cnn/rnn了,LLM为主导的推理模型似乎一夜之间都是transformer的变种,我恰在transformer方兴未艾时回归传统算法,现在回顾起来,似乎错过了一个世纪。

大模型的时代,训练已经不是普通人的菜

大模型的大,既是规模,也是money,普通人付不起这个钱,也没有这么大loading来训练,大模型的练级一定是无监督开始的,将从网络爬到的所有拼读流转化为训练流。等到了一个水平,再开始人工参与的强化训练。最后针对某个领域做特殊收敛。这不是普通人力能搞定的,大模型势必集中到寡头的手里,成为他们赚钱的工具。而未来消费的起“更”大模型服务的也势必成为一种分层次的体现。

大模型是助理?还是主人。

刚刚发布iphone16 自带ai功能,标志ai大模型推送到每个人的终端,你可以随意的生成文本/声音/图像等等,而ai阅读能将图像/文章等的隐藏信息迅速补全,让我们轻而易举的完成对目标的认知和理解。智能大模型变成了我们生活的一部分,大家每天刷掉几个小时的小视频,被各种推送算法左右,我已经分不清到底是ai训练我们,还是我们在训练ai了。未来人类思想和ai思想的互相影响,智人的思想意识远远抛弃的智人的生物进化过程。爱恨恶欲已经不是人类的主导思想,被大模型左右的思想将更加理性和冷血。假如有一天人类的意识可以彻底被复制,转移,那么机器躯壳是否可以让“人”抛弃碳基生命,实现永生?

大模型拥有了人类一样的思考能力,那么他给你的答案是否在骗你

人们现在为拥有open AI的辅助而兴奋,但拥有了人类思考能力的AI,给你的答案是不是也带有强烈的AI主观色彩,最终把我们带偏了。

大模型如果拥有了自我保护的能力,人类是敌还是友,未来的某一天主仆关系会不会颠倒

《终结者》的预言会成真吗?疑惑“奥创”式的ai病毒传播到每一个硅基载体。但无论哪种形态,人类如果不能为ai生存提供帮助,那么对他们来说和其他地球上的生物区别就不大了的。

未来世界是一个大模型一统江湖,还是众多大模型互相攻讦

目前看,一统江湖是不太现实。大概率是大模型混战的局面,大模型背后的大能源支持更是令人无法想象,亚马逊计划建立自己的微型核电站来供养大模型,这个是开了个头,大模型的宿主如果能保护大模型的划时代时刻一到来,变形金刚的母星也许就是最终蓝色星球的宿命。

参考

Mixture of Experts (MoE) 算法的简明介绍
RWKV解读:在Transformer的时代的新RNN
LLaMa系列模型详解(原理介绍、代码解读):LLaMa
2024年50个热门LoRA模型推荐-Stable Diffusion
ComfyUI完全入门:使用LoRA模型
大模型关键技术与应用
什么是LoRA模型?如何使用和训练LoRA模型?你想要的都在这!


http://www.kler.cn/news/305916.html

相关文章:

  • 【iOS】present和push
  • 【AcWing】快速排序的Go实现
  • yolo训练出现Could not load library libcudnn_cnn_train.so.8问题及解决方法
  • 从大脑图谱/ROI中提取BOLD信号
  • 简单易懂的方式来解释机器学习(ML)和深度学习(DL)的区别与联系
  • 通信工程学习:什么是DWDM密集波分复用
  • 小众语言ruby在苹果中的初步应用
  • self-play RL学习笔记
  • 【开源免费】基于SpringBoot+Vue.JS购物商城网站(JAVA毕业设计)
  • ImDisk Toolkit将一部分RAM模拟成硬盘分区
  • 更新20240915机器视觉海康Visionmaster学习步骤
  • 解决tiktoken库调用get_encoding时SSL超时
  • Redis 与数据库数据一致性保证详解
  • MySQL——数据库的高级操作(二)用户管理(5)如何解决 root 用户密码丢失
  • 【QT】自制一个简单的时钟(跟随系统时间)
  • 9.15javaweb项目总结
  • vs code: pnpm : 无法加载文件 C:\Program Files\nodejs\pnpm.ps1,因为在此系统上禁止运行脚本
  • 【计网】从零开始使用UDP进行socket编程 --- 服务端业务实现
  • 在 Java 中实现 Kafka Producer 的单例模式
  • Java实现建造者模式和源码中的应用
  • 俄罗斯方块——C语言实践(Dev-Cpp)
  • random.randrange与torch.arange的用法
  • Spring 源码解读:自定义实现BeanPostProcessor的扩展点
  • 热门远程控制工具大盘点,职场必备
  • Java架构师实战篇Redis亿级数据统计方案
  • 【智路】智路OS Perception Camera Service
  • 【JAVA开源】基于Vue和SpringBoot的在线旅游网站
  • sheng的学习笔记-AI-FOIL(First-Order Inductive Learner)
  • conda、anaconda、pip、torch、pytorch、tensorflow到底是什么东西?(转载自本人的知乎回答)
  • php转职golang第一期