当前位置: 首页 > article >正文

眸思MouSi:“听见世界” — 用多模态大模型点亮盲人生活

文章目录

  • 1. Introduction
    • 1.1 APP细节展示
  • 2. Demo
    • 2.1 论文链接
    • 2.2 联系方式
  • 3. Experiment
    • 3.1 多专家的结合是否有效?
    • 3.2 如何更好的将多专家整合在一起?
  • Reference

让盲人听见世界,复旦眸思大模型打破视觉界限,用科技点亮新生活

1. Introduction

在这个世界上,视力­­是探索万物之美、与有灵万物互动的重要感官。而在中国,约有1700多万视力障碍者,相当于每100人中就有一名视障者。这些坚强的心灵,在黑暗中寻觅着生活的曙光,用触摸勾勒出文字的轮廓,借助耳畔的回声感知四周的世界


http://www.kler.cn/a/232564.html

相关文章:

  • Kettle配置数据源错误“Driver class ‘org.gjt.mm.mysql.Driver‘ could not be found”解决记录
  • 逐行加载 HTML 内容并实时显示效果:使用 wxPython 的实现
  • leetcode-位运算题型
  • 【缺陷检测】Anomaly Detection via Reverse Distillation from One-Class Embedding
  • SpringBoot(十八)SpringBoot集成Minio
  • Cyberchef配合Wireshark提取并解析HTTP/TLS流量数据包中的文件
  • Bee+SpringBoot稳定的Sharding、Mongodb ORM功能(同步 Maven)
  • C#系列-访问SqlServer+Mysql+Oracle数据库(6)
  • 4.0 Zookeeper Java 客户端搭建
  • B2080 计算多项式的值(洛谷)
  • 【Linux】Linux开发工具(yum、gdb、git)详解
  • API接口访问鉴权设计和实现的经验总结
  • 如何开始深度学习,从实践开始
  • seata分布式事务
  • Redis 单线程
  • Qt网络编程-ZMQ的使用
  • 算法随想录第五十一天打卡|309.最佳买卖股票时机含冷冻期, 714.买卖股票的最佳时机含手续费 ,总结
  • npm install express -g报错或一直卡着,亲测可解决
  • HLS 三角函数报错:undefined reference to ‘cordic_apfixed::circ_table_arctan_128‘
  • 蓝桥杯省赛模板构建——uart
  • 告别mPDF迎来TCPDF和中文打印遇到的问题
  • 【数据分享】1929-2023年全球站点的逐年平均风速(Shp\Excel\免费获取)
  • C#用Array类的FindAll方法和List<T>类的Add方法按关键词在数组中检索元素并输出
  • 【专业技术】高效并行分布式深度学习策略,助力模型训练与量化
  • 戴上HUAWEI WATCH GT 4,解锁龙年新玩法
  • 拦截器配置,FeignClient根据业务规则实现微服务动态路由