python爬虫中json和xml字符串的xPath和jsonpath过滤语法区别对比
参考博客
两种语法结构作用
为了处理从网络请求返回的网页源码中得到自己想要的数据
首先了解两种库处理的对象语法
jsonpath处理的是json语法格式的字符串
**json(JavaScript Object Notation)**字符串的语法参考
**类似于下面的格式,以键值的形式,其中值可以是字符串,数值或中括号包括的数组形式。**但最小的元素表示还是以键值的i形式。
xpath处理的是xml字符串
xml(Extensible Markup Language)可扩展标记语言,这种语言注重是对数据传输而不是显示
实例语法参考,
xml文件和html文件的不同
主要还是标签和功能的不同,从标签定义看,HTML中的标签是定义好的,而xml是可以自己定义不同的标签;从功能重点上看,html为了更好的显示,让用户看;而xml为了更好的数据检索传递。
两种分析模块的语法
jsonpath模块
代码参考
{
"store":{
"book":[
{
"category":"reference",
"author":"Nigel Rees",
"title":"Sayings of the Century",
"price":8.95
},
{
"category":"fiction",
"author":"J. R. R. Tolkien",
"title":"The Lord of the Rings",
"isbn":"0-395-19395-8",
"price":22.99
}
],
"bicycle":{
"color":"red",
"price":19.95
}
}
}
实例输出分析筛选规则
jsonpath最终返回的都是json字符串键值对中的键对应的值,并使用列表包括,最终返回的数据类型是列表
xpath语法
实例代码参考
两种语法的对比
参考文档