当前位置：首页 > article >正文

【RAG研究1】导言-我打算如何对RAG进行全面且深入的研究

article 2025/2/22 2:10:21

一、导言

最近我打算对RAG（检索增强生成）进行一些深入的研究来帮助自己找到AI工作，几天前我有了一些初步的想法，见我的这两篇博客：【AI战略思考2】技术上不断聚焦和深入，精进一艺，一技胜万全和【AI战略思考3】我如何聚焦于RAG的一个痛点-我的思维链过程拆解。不过随着这两天对RAG的一些更深入的研究和探索后，包括研读论文、阅读技术博客和了解一些实战项目后，我发现需要重新审视一下自己之前的想法，并做进一步的深入思考。

二、反思和部分想法更新

全面和深入的权衡

不需要太深入，只需要证明自己的研究潜力，聚焦于nlp下的RAG即可，不需要太细，应该对RAG的各个方面有全面的了解并积累项目实战经验，研究应偏向应用落地，而且作为初级工作者，应以学习为主，研究为辅。

我觉得不断聚焦和深入一个很细小的点还是不适合现在的我，因为太细枝末节的深入研究会变成科研项目，这是博士生干的活，而我一个转行的硕士生不应该在这种劣势方向和别人硬碰硬。这种研究不仅难度过大，耗时过长，而且也不是自己第一份AI入门工作真正需要的能力，作为一个初学者，还是应该以学习为主。我其实只需要证明自己的研究潜力就够了，也就是需要一定的深入研究，但过犹不及，需要平衡好这个度，毕竟时间是很宝贵的，如果花了太多的时间在无法短期做出成果的研究上来，那么就得不偿失了。

用敏捷开发和强化学习的思路来找工作

之前是想着用一个月左右的时间完成一个完整的RAG深入研究项目再投简历，但是这两天实践下来，我觉得这不是最佳的策略，我应该用敏捷开发和强化学习的思路来找工作，原则如下：

一边学习和研究，一边做项目，一边投简历和面试，三者同时进行
先做再改，边做边想，小步快跑，快速迭代
把大项目拆成小项目，然后不断组合和叠加

如果做完项目之后再投，有两个问题：

这个项目不一定是面试官看重的
项目未必能在一个月内做完，那只是我的乐观估计

我把找工作看成对自己的强化学习，我自己就是一个大模型，而奖励反馈模型就是面试官和技术主管，打算过完十一国庆节就开始投简历，每周都投一些，根据反馈来不断调整自己，包括对学习研究和项目的调整。

三、原则、思路和策略

总的原则和实施思路

总的原则：

理论学习、动手实践和创新研究三者结合的方式。通过阅读相关论文掌握理论知识、最新的研究进展和行业动态，使用开源代码进行实际实验，并在此基础上尝试提出新的改进，最后在自己的项目（即某个实际应用场景）中综合应用。

实施思路：

从RAG的经典论文开始，再到综述的论文，再到细分领域的论文，并持续跟踪感兴趣的相关方向的论文。
学习与RAG相关的各种开源项目，重点是了解在实际应用中的一些难点和痛点，以及对应的解决办法。
把学到的这些理论知识和技术方案不断加到自己的项目上（企业内部知识库的动态更新和精准检索），不断完善自己的项目并改善效果。

为什么要读论文

我正在阅读RAG的相关论文，发现效果不错，原因有以下几点：

获取前沿知识：RAG是一个前沿的NLP方向，相关的创新和技术进展主要体现在学术论文中。通过阅读论文，我可以了解到最新的技术方法、框架和解决方案，这些是博客或教程无法及时提供的。
深入理解原理和方法：论文会详细介绍算法的原理、设计思路和理论依据，帮助我深入理解RAG模型如何工作。
实验与评估策略：论文中通常会提供实验的细节和评估指标。通过阅读论文，我可以了解不同方法的效果如何，并在不同的数据集和任务上进行比较，有助于为我自己的应用选择合适的方法。
避免重复工作：通过论文，我可以了解现有的方法和技术，避免重复发明轮子。了解已有研究可以帮助我站在巨人的肩膀上，提出新的改进或创新，而不是重新解决已经解决的问题。
了解局限性与挑战：论文中通常会讨论现有方法的局限性和未来工作方向。通过阅读这些部分，我可以了解当前技术的不足，并找到可以进一步研究的切入点。
参考开源代码和数据：许多论文会附带开源代码和数据集，可以帮助我快速上手实现RAG模型。

总之，阅读相关论文不仅可以帮助我快速掌握RAG的理论基础和技术细节，还能让我紧跟技术前沿，从而在研究和应用中找到创新点和培养自己的差异化优势。所以接下来阅读论文是我学习和研究RAG技术的重点之一。我也会分享自己对论文的学习和总结。

各种信息获取方式的对比以及我的策略

除了阅读论文，以下几种信息获取方式也常用于获取最新的研究成果或技术知识。它们的优劣对比和适用范围如下（这只是我的粗鄙观点，仅供参考）：

博客与技术文章
- 优点：通俗易懂，适合快速上手
- 缺点：深度不够，内容质量参差不齐，可靠性较低
- 适用范围：适合快速学习但不适合深入研究，这是我的补充学习渠道
开源项目和代码库
- 优点：可以通过直接运行代码进行学习，可能有活跃的社区支持
- 缺点：开源项目通常直接给出解决方案，但缺乏对背后原理的详细解释，如果没有理论基础，可能很难理解代码的具体设计和其优劣。而且项目和代码的质量也参差不齐。
- 适用范围：实践性强，适合边学边做，这是我和论文并重的学习渠道
技术会议与研讨会
- 优点：前沿讨论，互动性强
- 缺点：费用较高，信息量有限，会议时间有限，讨论深度不如论文全面
- 适用范围：适合业内人士和高端人才的人脉拓展，不太适合现在的我
在线课程和培训
- 优点：系统化学习，也有一些动手实践机会
- 缺点：更新较慢，滞后于最新的研究进展，深度也不够，多为入门级别，而且还要收费
- 适用范围：适合零基础或者自学能力较差的学生和业余人士，不适合我
社交媒体（Twitter、Reddit、LinkedIn等）
- 优点：信息更新快，可以直接参与讨论
- 缺点：噪音较多，深度有限，比较碎片化
- 适用范围：适合空余时间了解一些最新信息，但需要有较强的判断能力来过滤有价值的内容