当前位置: 首页 > article >正文

学习笔记 - 知识图谱的符号表示方法

学习笔记 - 知识图谱的符号表示方法

说明:

  • 首次发表日期:2024-09-13
  • 个人阅读学习并摘录成笔记

知识表示的相关名词定义

以下内容摘录自 Knowledge Graphs Applied 2.3小节,然后AI翻译+人工润色。

  • 实体(Entities)—表示知识的核心概念,其他所有东西都是围绕其构建的。
    • 实体可以是物理实体(如化合物、疾病、患者、地点),也可以是抽象实体(如想法(idea)、情绪(sentiments)等概念)。
      实体可以具有不同的属性,如人名、城市的地理位置等。它们是知识库中的“一级公民”,因为它们代表了整个知识库创建的原子信息(atomic information)。
  • 关系(Relationships)—定义实体之间的关系。例如,一个城市属于某个地区,一个基因编码一种蛋白质,一种疾病有某些症状等。关系可以具有属性,如日期、描述、概率等。
  • 本体(Ontologies)—定义特定领域的知识中存在的实体和关系类型,以及他们拥有的属性。
    例如,通过本体论和分类法(taxonomies),你可以定义实体的层级表示(hierarchical representation)(如医疗或教育机构),或者定义其属性(如一个组织必须有一个创始人、一个地址和一个伦理政策)。你可以确定这些属性的基数(Cardinality)(如一个组织可以有多个创始人和地址,但必须有一个唯一的伦理政策),或者定义组织内关系的性质(如传递性(transitivity),这意味着你的老板的老板也是你的老板)。
  • 目标和效用(Goals and utilities)—定义世界期望的和不期望的状态和代理的状态(states of agents)。在我们的医疗系统中,这些可能是身体的温度的降低(期望结果)或升高(不期望结果),患者运动功能的改善,红斑减少,血氧饱和度提升,等等。
  • 策略、控制规则和启发(Policies, control rules, and heuristics)—规定行动方式(Prescribe ways of acting)。例如,在开处方前检查患者是否对对乙酰氨基酚过敏,询问患者是否服用了化合物 X X X,因为它可能影响化合物 Y Y Y的效力等。

属性图

以下内容摘录自知识图谱导论 2.3.2小节。

属性图是图数据库Neo4J实现的图结构表示模型。

在属性图的术语中,属性图是由顶点(Vertex)​、边(Edge)​、标签(Label)​、关系类型和属性(Property)组成的有向图。

顶点(Vertex)也称为节点(Node)​,边(Edge)也称为关系(Relationship)​。

在属性图中,节点(Vertex/Node)和关系边(Edge/Relationship)是最重要的表达要素。节点上包含属性,属性可以以任何键值形式存在。

关系边(Edge/Relationship)连接节点(Vertex/Node),每条关系边都有拥有一个方向、一个标签、一个开始节点和一个结束节点。

关系边的方向的标签使得属性图具有语义化特征。和节点一样,关系边也可以有属性,即边属性,可以通过在关系边上增加属性给图算法提供有关边的元信息,如创建时间等。此外还可以通过边属性为边增加权重和特性等其他额外语义,如下图所示。

请添加图片描述

相关资源

RDF

  • wiki: https://en.wikipedia.org/wiki/Resource_Description_Framework
  • 文档: https://www.w3.org/TR/rdf11-new/

RDF Schema

  • wiki: https://en.wikipedia.org/wiki/RDF_Schema
  • 文档: https://www.w3.org/TR/rdf11-schema/

R2RML: RDB to RDF Mapping Language

将数据库的数据映射到我们自己定义的本体上

  • 文档: https://www.w3.org/TR/r2rml/

D2RQ

将关系型数据库(如MySQL)转换为RDF

  • 官网: http://d2rq.org/
  • 知乎实践教程:
    • https://zhuanlan.zhihu.com/p/32552993
    • https://zhuanlan.zhihu.com/p/32880610

SPARQL

  • 简介: https://www.w3.org/TR/rdf-sparql-query/
  • 文档: https://www.w3.org/TR/sparql11-overview/
  • 知乎实践教程: https://zhuanlan.zhihu.com/p/32703794

Turtle (Terse RDF Triple Language)

  • 入门: https://linkeddata.github.io/rdflib.js/Documentation/turtle-intro.html
  • 文档: https://www.w3.org/TR/turtle/

OWL 2

  • 入门: https://www.w3.org/TR/owl2-primer/
  • 文档: https://www.w3.org/TR/owl2-overview/
  • 语法规范: https://www.w3.org/TR/2012/REC-owl2-syntax-20121211/

Protégé: ontology编辑器

  • https://protege.stanford.edu/
  • https://protege.stanford.edu/publications/ontology_development/ontology101.pdf

Apache Jena (知识推理)

  • 官网: https://jena.apache.org/
  • 知乎实践教程: https://zhuanlan.zhihu.com/p/33224431

http://www.kler.cn/news/303797.html

相关文章:

  • Python去除图片中的白色像素点背景
  • David Baker 任科学顾问,初创公司发布世界最大蛋白质相互作用数据库,已获 8 轮融资
  • WPS如何删除表格下的空白页
  • 常见的站长工具接口有哪些?站长们该如何选择?
  • uniapp child.onFieldChange is not a function
  • Android Studio 安装配置教程(Windows最详细版)
  • uview-plus 表单校验 相关字段有数据有值的情况下非空验证失败问题
  • 【Go】Go语言基本语法--注释、变量、常量
  • 023.PL-SQL进阶—视图
  • Quartz_将持久化配置写在appsettings.json中
  • LSS如何做深度和语义预测
  • ROS CDK魔法书:建立你的游戏王国(Csharp篇)
  • 几种mfc140u.dll常见错误情况,以及mfc140u.dll文件修复的方法
  • 【kafka】kafka如何保证数据的可靠性,kafka如何保证数据不丢失
  • 红外图像处理算法详解:从基础到应用
  • ‌seq_len 不等于 hidden_size 难道不会报错吗,他们是一会事情吗
  • Rocket: 从零开始构建Rust Web服务
  • 【计算机网络】电路交换、电报交换、分组交换
  • yum下载软件失败:‘Could not resolve host: mirrorlist .centos .org; Unknowm error
  • C++笔记---继承(上)
  • 参赛心得和思路分享:2021第二届云原生编程挑战赛2: 实现一个柔性集群调度机制
  • 门磁模块详解(防盗感应开关 STM32)
  • 2398. 预算内的最多机器人数目(24.9.13)
  • 【论文笔记】AutoLFADS (Nature Methods, 2022)
  • 深度学习的笔记
  • vue的自定义指令
  • 连年(年份)
  • 再次进阶 舞台王者 第八季完美童模全球赛代言人【肖牧辰】赛场+秀场超燃合集!
  • C51单片机-单按键输入识别,键盘消抖
  • 【原创教程】电气电工18:三大品牌的IO_LINK