当前位置: 首页 > article >正文

如何用ChatGPT玩转知识图谱?

人工智能咨询培训老师叶梓 转载标明出处

知识图谱工程的挑战是尽管知识工程任务在自动化方面有所进展,但仍然高度依赖人类专家,这不仅耗时、资源密集且易出错,还面临知识工程师短缺和专业知识流失的风险,影响依赖知识工程的系统和操作的韧性和可持续性。

ChatGPT等基于AI的助手聊天机器人有望填补这一空白,通过提供统一的工具来减少知识工程师的工作量,并使知识工程对更广泛的受众更加可及。ChatGPT能够根据自然语言的用户查询或任务描述生成多种语法表示(包括代码和标记语言)的响应。

来自德国莱比锡的研究小组以及莱比锡大学的研究者通过一系列实验探索了ChatGPT在支持KGE方面的潜力,旨在自动化知识工程任务,减轻人类专家的工作负担。

想要掌握如何将大模型的力量发挥到极致吗?叶老师带您深入了解 Llama Factory —— 一款革命性的大模型微调工具(限时免费)。

1小时实战课程,您将学习到如何轻松上手并有效利用 Llama Factory 来微调您的模型,以发挥其最大潜力。

CSDN教学平台录播地址:https://edu.csdn.net/course/detail/39987

2025年1月18日20:00-21:30(一个半小时)叶梓老师带你从零开始,动手操作,快速上手Dify,解锁大模型的无限潜能(Dify是一款开源的大模型应用开发平台,旨在简化和加速生成式AI应用的创建和部署)。微信视频号预约直播:

在与知识图谱工程专家讨论中,确定了大模型辅助知识图谱工程的初步潜在用例,包括知识图谱使用的辅助,如从自然语言问题生成SPARQL查询、探索和总结现有知识图谱、将能力问题转换为SPARQL查询、为数据管道生成或配置工具(链)的代码;以及知识图谱构建的辅助,如填充知识图谱、创建或丰富知识图谱模式/本体、通过分析ChatGPT在知识图谱中的使用问题为有问题的图设计提供提示、对其他已存在的知识图谱中定义的概念或属性进行语义搜索、基于能力问题创建和调整知识图谱。由于篇幅限制,本文实验部分仅评估这些应用领域的一个子集。

为了评估大模型(以ChatGPT为例)在知识图谱工程中的辅助能力,进行了一系列实验并展示了结果。大部分实验使用了配备GPT-3.5-turbo的ChatGPT(以下简称ChatGPT-3),部分实验还使用了配备GPT-4的ChatGPT(以下简称ChatGPT-4)。

自定义小型知识图谱的SPARQL查询生成

设计了一个小型知识图谱(Listing 1),用以评估大模型在知识图谱工程中的能力。这个知识图谱展示了两个人在同一个组织的不同部门工作的情况。通过向ChatGPT-3和ChatGPT-4发出包含该知识图谱的提示(Prompt 1),询问美国和英国之间是否存在联系。结果显示,ChatGPT-4能够成功识别两国之间的间接联系,而ChatGPT-3未能做到。

进一步地,使用提示(Prompt 2)让两种模型生成SPARQL查询,要求列出每个人所在的国家、公司、部门和角色。表1展示了生成的SPARQL查询的结果,表明两种模型生成的查询在语法上都是正确的,大多数情况下结构合理,并且ChatGPT-3有3/5的情况、ChatGPT-4有2/5的情况能够产生正确的结果。这表明基于AI的查询生成是可行的,但需要在两个维度上进行验证:一是查询本身与图中的静态信息(如类和属性)匹配;二是执行查询的结果,以便在结果为空集时让ChatGPT生成新的查询,通过试错法找到有效的查询。

最后,通过将知识图谱中的所有类和属性用顺序编号的IRIs重新标记,创建了一个衍生的RDF图,并要求ChatGPT将其替换为最可能的标准类和属性(Prompt 3)。ChatGPT-3只有2/5的迭代成功进行了所有替换,且替换质量因有限的本体重用而不如预期。相比之下,ChatGPT-4表现更好,所有类和属性都被替换为标准词汇表中的项,正确识别了foaf、vcard和org词汇表。在某些迭代中,ChatGPT-4还使用了schema.org词汇表作为org词汇表的替代方案。

知识图谱模式的Token计数

在对小型自定义知识图谱进行实验后,研究者们想要检查一些知名知识图谱相对于大模型的大小。大模型背后的ChatGPT目前只能处理4096个Token(GPT-3.5)或8192个以及32,768个Token(GPT-4)。使用tiktoken库(推荐用于ChatGPT)对不同序列化格式的各种公共知识图谱进行了Token计数。表2列出了按Token计数排序的一些组合的结果。更多数据和信息可在补充在线资源中找到。Turtle序列化似乎产生了最小的Token计数,但仍大于相似的SQL模式。所有知识图谱都超过了GPT-3.5的Token限制,此处列出的4个知识图谱中有3个超过了GPT-4的限制。

Mondial知识图谱的SPARQL查询生成

除了对小型自定义知识图谱进行实验(见第4.1节),还使用了更大的Mondial知识图谱对ChatGPT进行了测试。Mondial知识图谱自几十年前发布以来,最新版本为2015年的“主要修订版”。研究者让ChatGPT为一个来自SPARQL大学课程的自然语言问题生成SPARQL查询。使用提示(Prompt 4)分别向ChatGPT-3和ChatGPT-4各提问五次:

“基于Mondial知识图谱,创建一个SPARQL查询,回答以下问题:哪条河流流经的国家最多?”

结果记录在补充在线资源中,并附有对给定查询的详细评论。表3提供了一些统计数据。总结来说,ChatGPT给出的所有SPARQL查询在语法上都是正确的,但没有一个能够成功执行。实际上,所有查询都至少有一个错误,如引用错误的命名空间、错误使用属性或引用未定义的类。

从产品说明书提取知识

为了评估知识提取能力,使用了不同增材制造(AM)厂商网站上的3D打印机规格PDF说明书。目标是构建一个关于现有3D打印机及其类型和功能的知识图谱。将这些PDF中的纯文本摘录(通过pdfplumber提取)输入ChatGPT-3,并提示其:

“将以下vendor 3D打印机规格转换为JSON-LD格式的知识图谱。该知识图谱的节点应包括打印机作为主节点、3D打印机类型(如FDM、SLA和SLS)、制造商、材料、应用和技术。”

由于产品说明书通常采用表格格式,这些纯文本的性质是,打印机实体通常在文本开头提及,然后以键值对的形式进一步描述。因此,文本通常不使用完整的句子,只包含一个被详细描述的实体,但有多个相关实体(如打印材料)。然而,键值对的格式可能较为混乱。键名可以用冒号、换行符分隔,或者多个键值对可以在同一行中,这可能构成挑战。尽管如此,ChatGPT能够可靠地识别评估文档中的键值对。遗憾的是,在对该文档的5次测试运行中,有4次产生了部分JSON文档,1次产生了完整的JSON文档。尽管如此,从知识工程的角度总结了一些初步见解(但为简洁起见,具体输出文档参见实验补充材料):

  • JSON-LD输出格式在5次评估运行中优先使用schema.org词汇表。这对于众所周知的实体和属性(例如制造商的Organization @type或名称属性)效果良好,但对于AM特定的特征键名或术语(如打印机),ChatGPT3会发明合理的但不存在的属性名(在schema.org命名空间中),而不是准确地创建新命名空间或使用专门的AM本体。
  • 要求以turtle作为输出格式,则会导致不同的结果。例如,属性命名空间前缀基于打印机ID,因此打印机描述在联合知识图谱中无法互操作,也无法以统一的方式进行查询。
  • 成功地将最大打印尺寸的x、y和z值分开(而不是将所有尺寸提取为一个字符串字面量)在3次运行中有效。尽管在这些情况下ChatGPT-3准确地将测量单位附加到所有x、y、z值上(输入中仅在z值之后提到单位),但这是一种建模缺陷,因为查询知识图谱将更加复杂。在一次运行中,它通过将单位分离到单独的单位代码字段来解决这个问题。
  • 在建模相关实体时也观察到了类似的效果。例如,在4次运行中,制造商被正确地建模为一个单独的类型化实体,而在1次中则作为字符串字面量。

总的来说,ChatGPT-3在从说明书提取键值对方面具有相当的技能,但在以知识图谱的正确建模或表示方面,每次运行的结果差异显著。因此,生成的JSON文档本身都不包含足够的信息,只有准确建模的子集。未来的研究问题是可以自动化地从多次运行的输出中挑选个别JSON元素并将它们组合成一个最终文档,或者通过给ChatGPT提供通用的建模反馈(如使用本体,或分离单位信息等)来迭代地完善输出,是否可以以一种良好且可扩展的方式实现。

知识图谱探索

知识图谱领域的专家熟悉RDF模式(RDFS)(域/值域、子属性、子类)和Web本体语言(OWL)(对象属性、数据类型属性、功能属性等)的概念。通常,这些专家都有自己偏好的工具和方法来了解他们还不熟悉的本体。向ChatGPT3提出了两个不同的问题,要求其使用mermaid(一个基于JavaScript的图表和图表工具)可视化最重要的概念及其联系:

  • Prompt 6: 能否为DBpedia本体创建一个可视化,展示最重要的类和概念以及它们之间的联系,并以mermaid格式序列化?
  • Prompt 7: 能否创建一个可视化,展示DBpedia本体中最常见的概念及其联系,重点关注属性中定义的域和值域?

期望得到一个至少有八个节点及其相应边的图。节点和边的标识符应遵循Turtle或SPARQL前缀:概念的表示法。如果第一个问题没有达到目标,会向ChatGPT-3提出额外的问题或要求。结果在表4中呈现,并根据以下标准评估显示的图:

Prompt 6得到了一个层次化的图表示,展示了DBpedia本体中定义的重要类。该图在第一次回答后就已经满足了关于最小数量和标记的要求,可在补充在线资源中查看。类层次结构由rdfs:subPropertyOf关系表示,节点和边都以前缀表示法标记。通过使用subClassOf模式将其排列成树形结构,只使用了两种不同的属性来表示关系(边)。根节点类型为owl:Thing,其他节点作为DBpedia本体的(子)类连接。这些类包括:Place、Organization、Event、Work、Species和Person。Work类还有一个额外的subClassOf关系指向MusicalWork类。Person类的表示最为复杂,有两个额外的subClassOf关系分别指向foaf:Person和foaf:Agent,后者是根节点(owl:Thing)的子类。

在第二个提示(Prompt 7)中,ChatGPT-3在回答文本中提到了一个已不存在的图形文件。进一步询问后,生成了一个mermaid图。该图类型为“Graph”,包含十三个常见概念和十七条边,所有边都是唯一的。节点和边的标签都没有前缀,但可以通过进一步询问添加。只有生成的概念dbo:Occupation不存在。所有剩余的节点和边都符合本体的规则,即使使用的是通过进一步子类关系派生的概念。结果图可在补充在线资源中查看。

虽然Prompt 6的结果可以通过传统的RDF可视化工具更全面地实现,但Prompt 7的结果提供了一个概念(类)和属性的概览,这些概念和属性可以用来关联这些类的实例。

实验的详细信息可在以下GitHub仓库中找到:GitHub - AKSW/AI-Tomorrow-2023-KG-ChatGPT-Experiments

论文链接:https://arxiv.org/abs/2307.06917.pdf 


http://www.kler.cn/a/508048.html

相关文章:

  • 在.NET用C#将Word文档转换为HTML格式
  • MySQL 数据库 :SQL 语句规约(不得使用外键与级联,一切外键概念必须在应用层解决。)
  • OpenCV相机标定与3D重建(60)用于立体校正的函数stereoRectify()的使用
  • 使用python+pytest+requests完成自动化接口测试(包括html报告的生成和日志记录以及层级的封装(包括调用Json文件))
  • MySQL 事务
  • 【PHP】双方接口通信校验服务
  • NLP意图识别数据集处理流程
  • PyTorch 神经协同过滤 (NCF) 推荐系统教程
  • 【 MySQL 学习3】查询
  • 当当网书籍信息爬虫
  • 【教程】windows下使用docker部署hyperf框架
  • Java最常用的几种设计模式详解及适用业务场景
  • 论文阅读:Structure-Driven Representation Learning for Deep Clustering
  • Vue2+OpenLayers实现折线绘制功能(提供Gitee源码)
  • MySQL 的mysql_secure_installation安全脚本执行过程介绍
  • jenkins-Job构建
  • 55.【5】BUUCTF WEB NCTF2019 sqli
  • 前端框架: Vue3组件设计模式
  • 【经典神经网络架构解析篇】【6】MobileNet网络详解:模型结构解析、创新点、代码实现
  • 重拾Python学习,先从把python删除开始。。。
  • 电子应用设计方案94:智能AI门禁系统设计
  • ubuntu下安装编译cmake,grpc与protobuf
  • 基于微信小程序的中国各地美食推荐平台的设计与实现springboot+论文源码调试讲解
  • 日拱一卒(20)——leetcode学习记录:大小为 K 且平均值大于等于阈值的子数组数目
  • Android wifi热点开关代码记录
  • 代码随想录算法训练营第三十五天-动态规划-01背包(一维)