当前位置: 首页 > article >正文

10月第4周AI资讯

阅读时间:3-4min

更新时间:2024.10.21-2024.10.25

目录

CoI-Agent:一键生成科研idea的AI研究助手

波兰电台正式启用 AI 主播

Claude可以像人类一样使用计算机

简单文本即可创建个性化语音

AI音乐制作工具新突破


CoI-Agent:一键生成科研idea的AI研究助手

 

概要

阿里巴巴达摩院最近开源了一款名为CoI-Agent的AI工具,可以帮助科研人员自动生成科研idea。这个工具可以根据输入的论文主题,快速生成相关的科研idea,帮助科研人员节省时间和提高效率。

详情

  • CoI-Agent可以被视为一个AI研究助手,可以帮助科研人员头脑风暴、发散思维,找到新的研究方向和idea

  • 这个工具可以根据输入的主题,快速生成相关的关键词、研究问题、研究方法等,帮助科研人员快速找到研究方向。

  • 目前已在github上开源

链接

GitHub - DAMO-NLP-SG/CoI-Agent: Official code for paper: Chain of Ideas: Revolutionizing Research Via Novel Idea Development with LLM Agents


波兰电台正式启用 AI 主播

概要

波兰的一家广播电台 OFF Radio Krakow裁掉了人类记者,改为使用人工智能生成的 “主播”。

详情

  • 三位 AI 主播专注于文化、艺术以及社会问题,特别是 LGBTQ + 群体的相关议题

  • 这一决定引发了公众的不满,担心AI可能会取代更多媒体工作者。

  • 数字事务部长呼吁立法,规范人工智能在媒体中的应用。

推荐理由

AI在媒体行业的应用可能会对社会产生深远影响,包括就业、信息传播和文化多样性。同时这件事也凸显了对AI技术应用进行立法规范的必要性。

链接

https://www.youtube.com/watch?v=Xdmhq-C_CTk


Claude可以像人类一样使用计算机

概要

Claude模型进行了升级,可以通过查看屏幕、打字、移动光标、执行命令来与计算机进行交互。

详情

  • Claude可以自主导航计算机界面,跨多个应用程序和网站执行复杂的任务。

  • Claude掌握通用计算机技能。

  • 升级后的 Sonnet 3.5 显着改进了编码和工具使用,在关键基准测试中优于其他模型(包括 o1-preview)。

  • 新的 Haiku 3.5 版本模型较以前的版本,具有更低的成本和更高的速度等优点。

链接

Introducing computer use, a new Claude 3.5 Sonnet, and Claude 3.5 Haiku \ Anthropic


简单文本即可创建个性化语音

概要

ElevenLabs最近推出了AI语音生成工具Voice Design,它能够根据简单的文本描述创建个性化语音。

详情

  • 直观文本提示:用户描述声音特征,系统便能生成符合要求的语音。

  • 语音参数调节:包括年龄、性别、口音、语调和音高,以精确匹配用户需求。

  • 角色化语音创作:支持创作虚拟角色的语音,如精灵或机器人的声音。

  • 创意工具:为游戏开发和有声内容制作提供强大的创意支持。

推荐理由

Voice Design的推出标志着AI语音定制化进入了一个全新阶段,为内容创作者提供了前所未有的声音定制自由。

链接

https://elevenlabs.io/voice-design


AI音乐制作工具新突破

概要

谷歌DeepMind最近更新了AI音乐制作工具MusicFX DJ,它能够根据用户指定的风格、乐器或情绪即时创作音乐。

详情

  • 即时创作:快速生成用户想要的音乐。

  • 实时适应:能够根据用户指令实时调整音乐。

  • 多层创作:允许用户混合不同音乐元素,像DJ一样。

  • 高质量输出:以48kHz立体声输出,可导出60秒音乐片段。

推荐理由

MusicFX DJ的更新为音乐创作带来新突破,让专业人士和非专业人士都能轻松创作音乐。

链接

https://aitestkitchen.withgoogle.com/tools/music-fx-dj


更多内容请关注我,

添加w信可以入群及时获取资讯:jiejing_ma(添加时请备注CSDN)



http://www.kler.cn/news/364895.html

相关文章:

  • CSS 中的content-visibility属性
  • Mybatis mapper文件 resultType和resultMap的区别
  • 如何写一个视频编码器演示篇
  • Verilog 0x01 基础
  • EasyExcel_动态表头的导入导出
  • 信息安全工程师(66)入侵阻断技术与应用
  • 看图识谭教授的概念性错误:曲线Δy=切线dy
  • [每周一更]-(第120期):Lua入门学习指南及示例
  • webView 支持全屏播放
  • nginx安装详解含 自动化编译安装 Debian/Ubuntu/CentOS/RHEL/ROCKY
  • js和vue巩固指引
  • 【Linq】在C#中从SQL query case语句发布到linq扩展方法
  • 61 mysql 存储引擎之动态格式 MyISAM
  • react18中的计算属性及useMemo的性能优化技巧
  • 如何利用 KPaaS 低代码及 CI/CD 优化企业业务集成与流程
  • 企业架构与业务流程管理之间的关系
  • 国产数据库的蓝海在哪?
  • 手动将python的flask程序打包成exe在windows上执行
  • Zabbix企业级分布式监控环境部署
  • Solidworks 选项卡不显示草图、焊件等选项
  • Docker 搭建mysql
  • 15.6 JDBC数据库编程6——可滚动和可更新的ResultSet
  • FFMPEG录屏(20)--- 枚举macOS下的窗口和屏幕列表,并获取名称缩略图等信息
  • OpenCV系列教程六:信用卡数字识别、人脸检测、车牌/答题卡识别、OCR
  • 利用飞腾派进行OpenCV开发
  • 【C++修炼】初识C++:命名空间、缺省参数、函数重载、引用、内联函数、指针空值