当前位置: 首页 > article >正文

爬虫中XPath语法四个重要概念及示例

一、根节点与非根节点

1、/div :选择div节点,只有当它是文档的根节点时。

2、//div:选择文档中所有的div节点(包括非根节点)。

二、通过属性选择节点

1、//@href:选择带href属性的所有节点。

2、//a[@href='http://baidu.com']:选择页面中所有指向网站的链接。

三、通过位置选择节点

1、//a[3]:选择文档中的第三个链接。

2、//a[position()<3]:选择文档中的前三个链接。

3、//table[last()]:选择文档中的最后一个表。

四、星号(*)匹配任意字符或节点,可在不同条件下使用

1、//table/tr/*:选择所有表格行tr标签的所有的子节点。

2、//div[@*]:选择带任意属性的所有div标签。


http://www.kler.cn/news/149199.html

相关文章:

  • 【vue】v-model在表单元素上的应用
  • 代码随想录-刷题第十一天
  • CSS-常见元素显示模式总结
  • [Android]常见的数据传递方式
  • Spark---资源、任务调度
  • 【Linux下基本指令——(1)】
  • 【C 语言经典100例】C 练习实例13 - 水仙花数
  • python基础练习题库实验6
  • Vue3-toRaw 和 markRaw 函数
  • js相同字符串截取拼接
  • 牛客剑指offer刷题位运算篇
  • 八股文-如何理解Java中的多态
  • 管理后台系统,springboot+redis+nginx+html+bootstrap
  • UE5 中的computer shader使用
  • C++ 背包理论基础01 + 滚动数组
  • 【MySql】14- 实践篇(十二)-grant权限/分区表/自增Id用完怎么办
  • HassOS使用nmcli设置静态IPv4地址及网关、DNS
  • 对支付宝进行测试用例分析
  • .sketch的文件转.psd文件
  • Linux僵死进程及文件操作
  • 【ARM CoreLink 系列 8 -- SMMU 详细介绍-上半部】
  • 《微信小程序开发从入门到实战》学习三十六
  • springboot实战之stream API应用过滤不符合条件的数据
  • MySQL巧用公用表表达式(CTE)处理递归查询
  • 想学计算机视觉入门的可以看过来了
  • 牛客算法题 HJ100 等差数列 golang语言实现
  • QT配合CSS隐藏按钮
  • Springboot_文件下载功能(前端后端)
  • Kotlin学习——kt入门合集博客 kt里的委派模式Delegation kt里的特性
  • 基于C#实现Dijkstra算法