当前位置: 首页 > article >正文

【RAG研究1】导言-我打算如何对RAG进行全面且深入的研究

目录

  • 一、导言
  • 二、反思和部分想法更新
    • 全面和深入的权衡
    • 用敏捷开发和强化学习的思路来找工作
  • 三、原则、思路和策略
    • 总的原则和实施思路
    • 为什么要读论文
    • 各种信息获取方式的对比以及我的策略

一、导言

最近我打算对RAG(检索增强生成)进行一些深入的研究来帮助自己找到AI工作,几天前我有了一些初步的想法,见我的这两篇博客:【AI战略思考2】技术上不断聚焦和深入,精进一艺,一技胜万全和【AI战略思考3】我如何聚焦于RAG的一个痛点-我的思维链过程拆解。不过随着这两天对RAG的一些更深入的研究和探索后,包括研读论文、阅读技术博客和了解一些实战项目后,我发现需要重新审视一下自己之前的想法,并做进一步的深入思考。


二、反思和部分想法更新

全面和深入的权衡

不需要太深入,只需要证明自己的研究潜力,聚焦于nlp下的RAG即可,不需要太细,应该对RAG的各个方面有全面的了解并积累项目实战经验,研究应偏向应用落地,而且作为初级工作者,应以学习为主,研究为辅。

我觉得不断聚焦和深入一个很细小的点还是不适合现在的我,因为太细枝末节的深入研究会变成科研项目,这是博士生干的活,而我一个转行的硕士生不应该在这种劣势方向和别人硬碰硬。这种研究不仅难度过大,耗时过长,而且也不是自己第一份AI入门工作真正需要的能力,作为一个初学者,还是应该以学习为主。我其实只需要证明自己的研究潜力就够了,也就是需要一定的深入研究,但过犹不及,需要平衡好这个度,毕竟时间是很宝贵的,如果花了太多的时间在无法短期做出成果的研究上来,那么就得不偿失了。


用敏捷开发和强化学习的思路来找工作

之前是想着用一个月左右的时间完成一个完整的RAG深入研究项目再投简历,但是这两天实践下来,我觉得这不是最佳的策略,我应该用敏捷开发和强化学习的思路来找工作,原则如下:

一边学习和研究,一边做项目,一边投简历和面试,三者同时进行
先做再改,边做边想,小步快跑,快速迭代
把大项目拆成小项目,然后不断组合和叠加

如果做完项目之后再投,有两个问题:

  1. 这个项目不一定是面试官看重的
  2. 项目未必能在一个月内做完,那只是我的乐观估计

我把找工作看成对自己的强化学习,我自己就是一个大模型,而奖励反馈模型就是面试官和技术主管,打算过完十一国庆节就开始投简历,每周都投一些,根据反馈来不断调整自己,包括对学习研究和项目的调整。


三、原则、思路和策略

总的原则和实施思路

总的原则:

理论学习、动手实践和创新研究三者结合的方式。通过阅读相关论文掌握理论知识、最新的研究进展和行业动态,使用开源代码进行实际实验,并在此基础上尝试提出新的改进,最后在自己的项目(即某个实际应用场景)中综合应用。

实施思路:

  1. 从RAG的经典论文开始,再到综述的论文,再到细分领域的论文,并持续跟踪感兴趣的相关方向的论文。
  2. 学习与RAG相关的各种开源项目,重点是了解在实际应用中的一些难点和痛点,以及对应的解决办法。
  3. 把学到的这些理论知识和技术方案不断加到自己的项目上(企业内部知识库的动态更新和精准检索),不断完善自己的项目并改善效果。

为什么要读论文

我正在阅读RAG的相关论文,发现效果不错,原因有以下几点:

  1. 获取前沿知识:RAG是一个前沿的NLP方向,相关的创新和技术进展主要体现在学术论文中。通过阅读论文,我可以了解到最新的技术方法、框架和解决方案,这些是博客或教程无法及时提供的。

  2. 深入理解原理和方法:论文会详细介绍算法的原理、设计思路和理论依据,帮助我深入理解RAG模型如何工作。

  3. 实验与评估策略:论文中通常会提供实验的细节和评估指标。通过阅读论文,我可以了解不同方法的效果如何,并在不同的数据集和任务上进行比较,有助于为我自己的应用选择合适的方法。

  4. 避免重复工作:通过论文,我可以了解现有的方法和技术,避免重复发明轮子。了解已有研究可以帮助我站在巨人的肩膀上,提出新的改进或创新,而不是重新解决已经解决的问题。

  5. 了解局限性与挑战:论文中通常会讨论现有方法的局限性和未来工作方向。通过阅读这些部分,我可以了解当前技术的不足,并找到可以进一步研究的切入点。

  6. 参考开源代码和数据:许多论文会附带开源代码和数据集,可以帮助我快速上手实现RAG模型。

总之,阅读相关论文不仅可以帮助我快速掌握RAG的理论基础和技术细节,还能让我紧跟技术前沿,从而在研究和应用中找到创新点和培养自己的差异化优势。所以接下来阅读论文是我学习和研究RAG技术的重点之一。我也会分享自己对论文的学习和总结。


各种信息获取方式的对比以及我的策略

除了阅读论文,以下几种信息获取方式也常用于获取最新的研究成果或技术知识。它们的优劣对比和适用范围如下(这只是我的粗鄙观点,仅供参考):

  1. 博客与技术文章

    • 优点:通俗易懂,适合快速上手
    • 缺点:深度不够,内容质量参差不齐,可靠性较低
    • 适用范围:适合快速学习但不适合深入研究,这是我的补充学习渠道
  2. 开源项目和代码库

    • 优点:可以通过直接运行代码进行学习,可能有活跃的社区支持
    • 缺点:开源项目通常直接给出解决方案,但缺乏对背后原理的详细解释,如果没有理论基础,可能很难理解代码的具体设计和其优劣。而且项目和代码的质量也参差不齐。
    • 适用范围:实践性强,适合边学边做,这是我和论文并重的学习渠道
  3. 技术会议与研讨会

    • 优点:前沿讨论,互动性强
    • 缺点:费用较高,信息量有限,会议时间有限,讨论深度不如论文全面
    • 适用范围:适合业内人士和高端人才的人脉拓展,不太适合现在的我
  4. 在线课程和培训

    • 优点:系统化学习,也有一些动手实践机会
    • 缺点:更新较慢,滞后于最新的研究进展,深度也不够,多为入门级别,而且还要收费
    • 适用范围:适合零基础或者自学能力较差的学生和业余人士,不适合我
  5. 社交媒体(Twitter、Reddit、LinkedIn等)

    • 优点:信息更新快,可以直接参与讨论
    • 缺点:噪音较多,深度有限,比较碎片化
    • 适用范围:适合空余时间了解一些最新信息,但需要有较强的判断能力来过滤有价值的内容

为了进行全面的RAG研究,我会采用论文结合项目实践(如开源代码),再辅以博客和社交媒体来紧跟最新趋势。


http://www.kler.cn/a/321161.html

相关文章:

  • 「Mac畅玩鸿蒙与硬件48」UI互动应用篇25 - 简易购物车功能实现
  • 深度学习笔记(4)——视频理解
  • Excel 面试 01 “Highlight in red the 10 lowest orders”
  • Ftrace: 深入探究Linux内核的追踪利器
  • 嵌入式开发中的机器人表情绘制
  • 07 基于OpenAMP的核间通信方案
  • 【后端开发】JavaEE初阶——计算机是如何工作的???
  • 职业技能大赛-单元测试笔记(assertThat)分享
  • [SDX35]SDX35如何查看GPIO的Base值
  • 力扣随机一题——所有元音按顺序排序的最长字符串
  • Linux嵌入式驱动开发指南(速记版)---Linux基础篇
  • 【计算机组成原理】实验一:运算器输入锁存器数据写实验
  • Windows系统IP地址设置
  • 小白业主选瓷砖不知道质量好坏怎么办?三种方法交给你
  • 【PyTorch】张量操作与线性回归
  • 【学习笔记】网络设备(华为交换机)基础知识7——查看硬件信息 ① display device 命令详解
  • 【Redis入门到精通七】详解Redis持久化机制(AOF,RDB)
  • UBUNTU20.04安装CH384串口卡驱动
  • 【ARM】SOC的多核启动流程详解
  • 关于在vue2中给el-input等输入框的placeholder加样式
  • 【2024】前端学习笔记9-内部样式表-外部导入样式表-类选择器
  • MCUboot 和 U-Boot区别
  • 元宇宙的未来趋势:Web3的潜在影响
  • 二分查找算法(2) _在排序数组中查找元素的第一个和最后一个_模板
  • 前端Vue学习笔记02
  • 音视频入门基础:FLV专题(3)——FLV header简介