大模型智能体在金融公告理解领域的应用 | OPENAIGC开发者大赛高校组AI创新之星奖
在第二届拯救者杯OPENAIGC开发者大赛中,涌现出一批技术突出、创意卓越的作品。为了让这些优秀项目被更多人看到,我们特意开设了优秀作品报道专栏,旨在展示其独特之处和开发者的精彩故事。
无论您是技术专家还是爱好者,希望能带给您不一样的知识和启发。让我们一起探索AIGC的无限可能,见证科技与创意的完美融合!
创未来AI应用赛-高校组AI创新之星奖
作品名称:大模型智能体在金融公告理解领域的应用
参赛团队:上海大学AI rookie
作品简介
基于通义千问大模型,针对准确理解公告内容的下游任务进行训练和部署。使得模型能够为信息检索、风险监控、市场分析等领域提供重要的支持和价值。
项目背景
主要解决通用大模型在专业领域知识不足、回答准确度低的问题。
以Qwen大语言模型为基础,通过自定义数据集和模型微调技术,强化模型在金融领域的专业性和准确性。针对不同的用户群体和需求,选用不同的技术路线以提高模型在金融领域的实际应用效果。使用公告评测集对模型进行对比评价,确保模型性能的显著提升。
核心技术和创新点
自定义数据集:使用GPT-4针对收集的无标签公告数据进行分类并生成训练数据,辅助大模型微调。
指令精调:参考不同应用场景、实际任务的需要精心设计提示词,使用指令精调的方式对Qwen大模型进行微调。
多种技术方案集成:根据不同用户的需求,提供三种不同的应用方案Agent方案、RAG方案以及微调大模型方案。
技术成果和突破
使用多维的答题路径,将公告内容成功转化为可操作的业务流程模型。
金融公告的四类细致分化有助于模型理解不同类型公告的内容和语境,节省TOKEN使用,每次任务计算资源减少63%。
通过LangChain框架,利用知识库定位,减少幻觉和噪声,事实错误率降低12%。
对模型的精调使得数据查询和开放性问题回答能力都有相应的增强,达到了41.76%的准确率提升。
未来发展
未来将引入更多的市场和行业数据,持续优化InternLM和LangChain框架和算法,对公告类型进行进一步的细分,并搭建相应的知识库来提高速度与准确性。