当前位置: 首页 > article >正文

Cyber Weekly #30

赛博·新闻

1、加强版Claude3.5上线,可模拟人类操控电脑

Anthropic公司发布了升级版Claude3.5,包括Claude3.5 Sonnet和Claude3.5 Haiku两个新模型,以及名为“计算机操控”的新功能。Claude3.5 Sonnet在推理、知识、编程能力等方面表现出色,能够生成可玩的游戏代码和动效模拟器。Claude3.5 Haiku则在性价比和速度上超越了之前的模型。最引人注目的是“计算机操控”功能,它允许Claude实时分析用户计算机屏幕上的活动,并自主执行在线任务,如浏览、点击和输入,类似于一个真正的AI助手。尽管目前这一功能仅对开发者开放,并且成功率和速度还有待提高,但它展示了AI技术在模拟人类与计算机互动方面的潜力。

2、谷歌版贾维斯即将问世,最强Gemini2.0加持

就在Anthropic发布“计算机操控”功能后,Information爆料称,谷歌正开发同类新项目「Project Jarvis」,能将Chrome网页任务自动化。谷歌“贾维斯”将由未来版Gemini2.0驱动,预计在12月亮相。此外,微软的Omni Parser项目可以将截图转化为结构化数据,帮助AI精准理解用户意图,OpenAI内部已有的AI智能体雏形,可以操控计算机完成在线订餐、自动查询解决编程难题等任务。AI操控电脑已成为微软、苹果等巨头下一个发力的战场,预示着AI自主操控电脑时代即将来临。

3、Stable Diffusion 3.5最强全家桶登场

本周,Stability AI发布了Stable Diffusion 3.5全家桶,这几款模型能够生成多种风格和美学,例如3D、摄影、绘画、线条艺术,以及几乎任何可以想象的视觉风格。个人和组织可以免费使用该模型进行非商业用途,包括科学研究。

  • Stable Diffusion 3.5 Large:80亿参数,具备卓越的质量和提示词遵循能力,这一基础模型是Stable Diffusion家族中最强大的。该模型非常适合1兆像素分辨率的专业应用。
  • Stable Diffusion 3.5 Large Turbo:Stable Diffusion 3.5 Large的精简版,仅需4个步骤即可生成高质量图像,同时具备出色的提示词遵循能力,因此比Stable Diffusion 3.5 Large快得多。
  • Stable Diffusion 3.5 Medium(10月29日发布):25亿参数,改进了MMDiT-X架构和训练方法,该模型设计为可以在消费硬件上「开箱即用」,在质量与易于定制取得平衡。它能够生成分辨率在0.25到2兆像素之间的图像。

4、清言上线情感语音模型GLM-4-Voice,AI的phone use也来了

本周五(10月25日),智谱宣布上线情感语音模型GLM-4-Voice,该模型能够理解情感、表达情绪、调节语速,并支持多语言和方言。GLM-4-Voice是端到端的语音模型,避免了传统语音转文字再转语音方案中的信息损失。模型已部署在清言app上,并将与视频通话功能结合,打造能看能说的AI助理。此外,智谱还开源了GLM-4-Voice的代码,展示了其在多模态领域的技术实力。同时,智谱介绍了AutoGLM的phoneuse能力,该能力可以模拟人类操作手机,基于自研的中间界面和强化学习框架,智谱表示,在AndroidLab评测基准上,AutoGLM超越了GPT-4o和Claude-3.5-Sonnet的表现。AutoGLMWeb已通过清言插件发布,而手机端AutoGLM正在内测中。

5、OpenAI下一个大模型或将于年底发布

据外媒The Verge报道,OpenAI计划在12月之前推出其下一个前沿模型Orion(猎户座),该模型的性能预计将比现有的GPT-4模型强大100倍。与之前的GPT-4o和o1不同,Orion不会立即部署到ChatGPT,而是首先向与OpenAI密切合作的公司提供访问权限,以便这些公司能够基于Orion构建自己的产品和服务。微软内部的工程师已经准备好最早在11月份将Orion托管在Azure。此外,OpenAI CEO Sam Altman和其他高管在不同场合暗示了新模型的性能将远超现有模型,但名称可能不会是“GPT-5”。


 

赛博·洞见

1、人工智能何时超越人类?2027-2028年。

文章提出了一个新物理量“Thought-hour(Th)”来量化人类和AI的智能程度,并通过比较token数量来评估智能发展,角度挺新颖的。目前,人类每年的思考量为1.9TTh(1TTh=1*10^12Th),而AI的思考量为0.085TTh,年增长率为36%。文章预测,考虑到AI算法效率的每年0.4数量级提升,AI的智能程度可能在4年内超越人类(也就是2027-2028年)。文章还讨论了知识工作者的数量和全球GPU市场增长对AI发展的影响,并指出这一预测模型虽然简化,但展示了未来发展的可计算性和可预测性。

2、我用AI3D,终于实现了我的手办自由。

作者卡兹克,分享了自己使用AI3D打印技术实现个性化手办制作的经历。起初,作者因找不到心仪的蟑螂小姐手办而决定自己动手制作。通过TripoAI平台(图/文生3D模型,强烈推荐),作者轻松地将图片转换成3D模型,并使用3D打印机制作出手办。文章详细介绍了3D打印的流程,包括建模和打印,并比较了光固化和FDM两种打印方式。作者认为,尽管3D打印技术已不新鲜,但AI的发展大幅降低了建模的人力成本,使得“手办自由”成为可能。文章还提到了其他人使用TripoAI和3D打印技术创造桌游棋子的例子,展示了AI3D打印技术在实现创意方面的潜力。

3、图灵奖得主:AI时代,我们还能教学生什么

在2024西湖高等教育论坛上,图灵奖得主John Edward Hopcroft教授就AI时代教育的挑战和机遇所做的主旨报告。Hopcroft教授认为,教育的目标之一是帮助学生发现自己喜欢的东西,并过上美好的生活。他强调,教育应鼓励学生追随自己的兴趣,因为专注个人兴趣能带来高质量的成果。教授还提到,教育应帮助学生了解自己喜欢什么,并始终保持对兴趣的好奇心。他指出,教师与学生之间的互动是影响教育质量的关键因素,AI虽能在教育中扮演重要角色,但教师的角色不可替代。Hopcroft教授还提到,中国正在努力改善教育,鼓励学生自由探索和成长。

4、世界经济论坛上,伯克利Stuart Russell教授的观点:AI时代你需要掌握的实用技能

文章报道了在世界经济论坛上,专家们就AI时代所需的技能进行了深入讨论。专家们认为,随着AI技术的发展,许多工作将发生变革,甚至消失,因此员工需要掌握新的核心技能。讨论中提到,未来的成功者可能是那些能够快速适应变化环境的人,而教育系统也需要调整以培养人际交往密集型角色所需的技能。专家们还强调了软技能的重要性,如文化意识、对人类的敏感度,以及训练人工智能的能力。专家们提出,在这个新时代,生存能力再次成为关键。在人工智能时代,未来的成功者可能不是那些学识最渊博的人,而是那些能够快速适应变化环境的人。正如我们在当今的金融和商业领域所看到的,真正脱颖而出的往往是那些善于适应的个体。

5、万字长文:十问“AI陪伴”

文章从电影《Her》出发,探讨了AI陪伴的潜力与挑战,包括市场规模、用户接受度、技术限制和社会影响。指出AI陪伴在3-5年内可达千亿市场规模,但目前技术限制使其更多作为“物”存在。讨论了AI陪伴的三大技术前沿:长期记忆、主动想象多模态生成能力。同时,文章分析了用户对AI陪伴的付费意愿,指出女性更倾向于情感交流,而男性更看重功能性。预测了AI陪伴在儿童、老人、残疾人等弱势群体中的应用潜力,并对社会价值和潜在风险进行了讨论,最后提出了AI陪伴的终极目标是成为“懂我”的第三类家庭成员。

6、10个改变日常的大模型隐藏玩法

文章介绍了10个不为人知但实用的大模型应用方式,包括将家庭录像带转换成数字格式并通过AI进行转录和归档、改善工作沟通、作为家庭调解员、辅助教育、讲述睡前故事、提供烹饪建议、语言学习辅助、增强Linux命令功能、创建个人工作“克隆”以及数据转换等。这些应用展示了大模型在提升日常生活质量、工作效率和学习体验方面的潜力。

7、AI时代的权力游戏:开发者、投资人和大厂的微妙平衡

文章分析了AI时代中,开发者、投资人和大厂之间的复杂互动和权力游戏。随着AI技术的发展,开发者成为了投资的焦点,他们在黑客松等活动中崭露头角,成为社交平台上的新流量密码,并在与大模型公司和科技大厂的会议中验证商业模式。然而,开发者们对于与投资人和大厂的合作热情似乎正在消退,他们担心合作成本高、idea泄露,以及产品功能被大厂“借鉴”。投资人和大厂也在寻找能够做出AI Native应用的开发者,但合作并不总是顺利。市场上真正获投的开发者不多,部分原因是行业存在系统性问题,如资金匹配和项目预期的不匹配。同时,大厂也在通过各种方式招募靠谱的AI技术人才,但面临激烈的市场竞争。文章最后指出,尽管存在挑战,但仍有机构在尝试与开发者建立顺畅的合作关系,并预测未来市场上会出现更多适合AI开发者的投资机会。

8、窥见美国AI的未来

文章来自Second Best,基于作者的广泛阅读和行业经验,对美国AI的未来进行了深入的预判。内容包括AI技术的加速发展、开源与闭源模型的未来、技术创新的非线性路径、AI对社会和政治的深远影响、以及AI监管的必要性和挑战。文章强调了AI发展的不连续性和潜在的跳跃式进步,以及在构建通用人工智能过程中可能遇到的技术和伦理挑战。同时,文章也探讨了AI对经济、社会结构和全球权力平衡的影响,以及技术快速变革可能带来的风险和机遇。

9、ISUX「十月」行业设计趋势速递

腾讯ISUX出品,文章详细介绍了不同行业在十月的设计趋势,特别强调了AI技术在各个平台的应用。Snapchat进行了大规模的重新设计,推出了AI驱动的创新功能,如MyAI聊天机器人和Snap AI Video视频生成工具。Gmail在iOS上整合了Gemini能力,推出了GmailQ&A功能和摘要卡,以提高邮件管理效率。Google Chrome book添加了专用于谷歌AI的新按钮,提供了快速访问AI功能的途径。Facebook推出了以Z世代为中心的重新设计,强化了本地社区功能和娱乐体验。福特提供了同时支持Apple Car Play和Android Automotive OS的无缝数字体验。YouTube通过集成VeoAI视频模型,增强了Shorts平台的视频背景生成,并引入了AI助力视频创作功能。Social AI作为一款AI机器人的私密社交网络,提供了定制化的社交体验。Verse是一款由AI驱动的创意应用程序,帮助Z世代设计和发布富有表现力的内容。AI播客NotebookLM革新了播客体验,能够将长文本转换成播客音频。这些趋势展示了AI技术在提升用户体验和内容创作方面的潜力。

赛博·工具

1、JobJump:AI辅助面试工具

JobJump旨在通过提供个性化的AI辅助,帮助用户在求职面试中脱颖而出。该扩展支持超过3个在线平台、50种以上的面试语言,并为200多个行业和职位提供定制服务。在加入Google Meet会议时,面试辅航窗口会自动显示在屏幕顶部,点击“开始”按钮即可启动会话。AI将自动识别面试官的问题,并即时生成个性化的回答提示。用户可以将提示固定在屏幕上,随时更新最新的问题,并自信地回答问题以获得理想的工作。

2、数字素养与技能提升学习社区

一个不错的互联网资源查找、工具效率提升导航站。

3、AlleyRead-重塑你的信息源

一个由用户推荐、人工审核的国内外优质内容导航网站。

4、NewsNow

一个不错的资讯聚合网站,收录了国内外主流新闻媒体,实时更新。

赛博·资源

1、甲子光年:2024年AI代码平台及产品发展简报(关注公众号【产品老A】回复【2024年AI代码平台及产品发展简报】下载)

甲子光年智库发布的这份简报深入分析了AI代码平台及产品在2024年的发展情况。报告指出,随着大模型数量和能力的显著增长,生成式AI应用的爆发为代码领域带来了创新和变革的契机。AI技术在代码生成、理解、互联网搜索、调试等方面的应用,正在逐步解决开发者的高频刚需问题,提升编程技能,防止倦怠,并优化代码结构。报告还讨论了大模型技术对代码生成带来的质的改变,以及AI+代码的技术历程。此外,报告展望了AI代码平台在金融、泛互联网、运营商等多个行业的应用前景,并提出了AI代码平台的产品功能架构图。最后,报告强调了AI代码平台在提升工程效能、重构智能时代的开发模式方面的隐性价值,并提出了基于项目开发“Know-How”的“AI+”技术的未来发展方向。

2、generative-ai-for-beginners

微软免费课程:12堂课入门生成式AI,从而开始构建你自己的生成式人工智能应用程序。

【推广时间】

欢迎大家关注我的个人公众号【产品老A】。

公众号简介:6年互联网大厂AIPM,专注探索新型人机交互。

老A是谁?——AI领域多年从业经验,见证了AI的沉寂和崛起。 热爱AI技术和产品,更热爱分享,希望将知识传递给更多人。 坚信AI的力量,致力于推动AI技术的应用和普及。


http://www.kler.cn/news/368206.html

相关文章:

  • Elasticsearch 与 Lucene 的区别和联系
  • 使用注解@ExcelIgnoreUnannotated实现了在导出 Excel 时忽略没有被标注的字段
  • css-画一个三角形
  • python csv库
  • vue通过JSON文件生成KML文件源码
  • 二十二、Python基础语法(模块)
  • 【语音转文本新体验】Windows部署Whisper Web结合内网穿透轻松远程转录——“cpolar内网穿透”
  • python爬虫基础篇:文本操作和二进制存储
  • 31个省份农业科技水平(农业技术创新或农业科技专利数据)2010-2022年
  • macport 多版本php快速切换自定义命令pvm shell脚本
  • java平方根计算 C语言指针变量
  • Mercury:一款网络元数据捕捉与安全分析工具
  • 计算机网络——有连接传输层协议TCP
  • 如何使用Qlik Sense Util
  • 使用 Cursor 和 Devbox 快速开发并上线 Gin 项目
  • ifftshift函数
  • 缓存放置文章调研
  • 二十二、Python基础语法(模块)
  • 通过企业架构蓝图(EA Blueprint)构建企业数字化转型之路
  • STM32 HAL 陶晶池串口屏使用
  • GEE引擎传奇UI界面修改教程
  • MybatisPlus入门(一)MybatisPlus简介
  • Java三大特性之一—— 封装
  • 【力扣】[Java版] 刷题笔记-94.二叉树的中序遍历
  • 四期书生大模型实战营(【入门岛】- 第4关 | 玩转HF/魔搭/魔乐社区)
  • Sql执行较慢的排查方式