当前位置: 首页 > article >正文

爬虫中XPath语法四个重要概念及示例

一、根节点与非根节点

1、/div :选择div节点,只有当它是文档的根节点时。

2、//div:选择文档中所有的div节点(包括非根节点)。

二、通过属性选择节点

1、//@href:选择带href属性的所有节点。

2、//a[@href='http://baidu.com']:选择页面中所有指向网站的链接。

三、通过位置选择节点

1、//a[3]:选择文档中的第三个链接。

2、//a[position()<3]:选择文档中的前三个链接。

3、//table[last()]:选择文档中的最后一个表。

四、星号(*)匹配任意字符或节点,可在不同条件下使用

1、//table/tr/*:选择所有表格行tr标签的所有的子节点。

2、//div[@*]:选择带任意属性的所有div标签。


http://www.kler.cn/a/149199.html

相关文章:

  • BILSTM法律网站用户提问自动分类
  • 随机数
  • 基于 Python Django 的二手房间可视化系统分析
  • 如何进行产线高阶能耗数据的计算和可视化?
  • 优化时钟网络之时钟抖动
  • 4.4 软件设计:UML顺序图
  • 【vue】v-model在表单元素上的应用
  • 代码随想录-刷题第十一天
  • CSS-常见元素显示模式总结
  • [Android]常见的数据传递方式
  • Spark---资源、任务调度
  • 【Linux下基本指令——(1)】
  • 【C 语言经典100例】C 练习实例13 - 水仙花数
  • python基础练习题库实验6
  • Vue3-toRaw 和 markRaw 函数
  • js相同字符串截取拼接
  • 牛客剑指offer刷题位运算篇
  • 八股文-如何理解Java中的多态
  • 管理后台系统,springboot+redis+nginx+html+bootstrap
  • UE5 中的computer shader使用
  • C++ 背包理论基础01 + 滚动数组
  • 【MySql】14- 实践篇(十二)-grant权限/分区表/自增Id用完怎么办
  • HassOS使用nmcli设置静态IPv4地址及网关、DNS
  • 对支付宝进行测试用例分析
  • .sketch的文件转.psd文件
  • Linux僵死进程及文件操作