当前位置: 首页 > article >正文

眸思MouSi:“听见世界” — 用多模态大模型点亮盲人生活

文章目录

  • 1. Introduction
    • 1.1 APP细节展示
  • 2. Demo
    • 2.1 论文链接
    • 2.2 联系方式
  • 3. Experiment
    • 3.1 多专家的结合是否有效?
    • 3.2 如何更好的将多专家整合在一起?
  • Reference

让盲人听见世界,复旦眸思大模型打破视觉界限,用科技点亮新生活

1. Introduction

在这个世界上,视力­­是探索万物之美、与有灵万物互动的重要感官。而在中国,约有1700多万视力障碍者,相当于每100人中就有一名视障者。这些坚强的心灵,在黑暗中寻觅着生活的曙光,用触摸勾勒出文字的轮廓,借助耳畔的回声感知四周的世界


http://www.kler.cn/news/232564.html

相关文章:

  • Bee+SpringBoot稳定的Sharding、Mongodb ORM功能(同步 Maven)
  • C#系列-访问SqlServer+Mysql+Oracle数据库(6)
  • 4.0 Zookeeper Java 客户端搭建
  • B2080 计算多项式的值(洛谷)
  • 【Linux】Linux开发工具(yum、gdb、git)详解
  • API接口访问鉴权设计和实现的经验总结
  • 如何开始深度学习,从实践开始
  • seata分布式事务
  • Redis 单线程
  • Qt网络编程-ZMQ的使用
  • 算法随想录第五十一天打卡|309.最佳买卖股票时机含冷冻期, 714.买卖股票的最佳时机含手续费 ,总结
  • npm install express -g报错或一直卡着,亲测可解决
  • HLS 三角函数报错:undefined reference to ‘cordic_apfixed::circ_table_arctan_128‘
  • 蓝桥杯省赛模板构建——uart
  • 告别mPDF迎来TCPDF和中文打印遇到的问题
  • 【数据分享】1929-2023年全球站点的逐年平均风速(Shp\Excel\免费获取)
  • C#用Array类的FindAll方法和List<T>类的Add方法按关键词在数组中检索元素并输出
  • 【专业技术】高效并行分布式深度学习策略,助力模型训练与量化
  • 戴上HUAWEI WATCH GT 4,解锁龙年新玩法
  • 拦截器配置,FeignClient根据业务规则实现微服务动态路由
  • 什么是API
  • C#系列-数据结构+递归算法+排序算法(3)
  • 网络安全产品之认识准入控制系统
  • 力扣面试题 05.06. 整数转换(位运算)
  • Springboot 整合 Elasticsearch(三):使用RestHighLevelClient操作ES ①
  • 神经网络 | 基于 CNN 模型实现土壤湿度预测
  • re:从0开始的CSS学习之路 8. 浏览器默认样式
  • CleanMyMac2024智能算法有哪些优点和缺点?
  • Qt PCL学习(文章链接汇总)
  • C#,聚会数(相遇数,Rencontres Number)的算法与源代码