人工智能之知识图谱实战系列
一.知识图谱介绍和应用领域分析
(1)知识图谱通俗解读
图模型把所有信息都连接起来了。把实体与实体(点)的关系与逻辑处理好就能把图模型建立好,这样就可做多种应用了(例检索,推理等)
(2).知识图谱在检索引擎中的应用
例百度中输入某些内容去检索,好像输入王菲与李亚鹏的女儿是谁来查,他会把王菲与李亚鹏都解释成实体,然后发现这二实体中有女儿这个属性,这时就按这属性对应结果返回。
实体中是有很多属性,实体可想像成一个类。
又例如输入今天离元旦还有几天?它会先得到今天与元旦这二个实体的日期,然后做计算得到多少天数。
(3)知识图谱在医疗领域应用实例
1)方便查询,例如智能问答助手。
例如有一个人看了某种疾病,那就以这疾病为中心实体往周边扩散关系,例看过那些科室,做过那些检查,开过什么药,疾病症状,风险情况等等构成简单基本的图模型结构。那到时候有人输入与这疾病症状内容来查询,就可返回得这种疾病的可能性给用户参考。同时吃什么药又可以与药品这个实体进行关取起来,例这个药与其它药一起吃有没有副作用,这药的不良反映等属性。
2)图模型能帮我们快速检索,只要有数据就能搭建图模型
3)知识图谱还可在医疗中不仅可做检索,还可做辅助决策。例诊前:小孩发烧与咳嗽,可按这二个实体(结合边的权重值)推出可能发烧引起咳嗽,也可能感染引起咳嗽,初步判断为上呼吸道感染或急性支气管炎。诊中(诊断辅助):上呼吸道感染或急性支气管炎这二个实体(节点)出发首先要听诊与血常规检查(当然可直接做这检查判断出这二种疾病,上呼吸道感染也许不用验血);治疗(诊断辅助):假设诊断出是急性支气管炎,那么从这实体出发可知它吃阿莫西林等药,而这药的副作用又关联出来,然后急性支气管炎并发症就可由概率角度来说,例5%可能转肺炎,呼吸衰竭可能性是0.5%等等。最后急性支气管炎最大特点是白细胞升高。
这里就运用到实体与实体间的边的权重与概率大小来判断了。
(4)金融与推荐领域的应用
1)反欺诈,风控模型是知识图谱在金融领域的经典应用。例如用借款app从这个人手机中获得它的个人信息,从这个人的基本信息出发判断,然后结合这个人的行为(例手机上安装很多借款软件或过期不还钱),又然后与它关系密切的人的情况分析,等等相关实体来综合分析,最后判断是否可借钱给他。
2)推荐系统。基本上所有互联网的产品都会涉及。
(5)数据获取分析
1)数据一般是非结构化数据,例如对这些文本数据的抽取一般要用nlp技术,所以知识图谱一般归于nlp。从文本中创建出点(标签)与关系出来。当然是结构化数据就更好,直接拿来用。
2)非结构化数据一般包括文本数据,音频,视频,图片等。音频与视频都一般先转成图像,再从图像中用ocr技术提取出文本数据出来。
二.知识图谱涉及的技术点分析
(1)数据关系抽取分析
1)数据从那里来?数据很多,关系却难,关系做得准确才可靠。涉及大量nlp技术。2025年可以通过大模型来生成出结构化数据。
(2)常用nlp技术点分析
(3)graph-embedding的作用与效果
1)embedding是能够把各种数据映射到低维的向量空间中,使它能让计算机读懂这些数据。
2)graph-embedding可以把每个实体构建编码成不同的向量,然后把这些向量放入深度学习算法(例神经网络算法)中进行计算与推测(这里还包括各个实体(向量)间的关系)。而普通的图像经过神经网络预测出分类,它也许就是这张图像,不用与其它对象找关联关系。
(4)金融领域图编码实例
凡用图模型,那肯定要做特征,做embedding。
(5)视觉领域图编码实例
图像/视频数据,用图卷积模型。例一张图像中的人,可对人的头,肩膀,手,脚分别做特征编码,最后把这些实体联系起来构成图模型。
知识图谱中节点对应的是实体,边是实体之间的关系。
三.Neo4j数据库实战
四.使用python操作Neo4j实例
五.基于知识图谱的医药问答系统实战
六.文本关系抽取实战
七.金融平台风控模型实战