当前位置: 首页 > article >正文

爬虫-获取数据bs4

  1. 安装lxml

    pip3 install lxml
    
  2. 用法

	import requests
	from bs4 import BeautifulSoup
	url ='xxxx'
	res = requests.get(url).text
	soup = BeautifulSoup(res,'lxml')
	
	##---------------------bs4选择器使用方法--------------------------
	#1. 根据a标签查找,类型是list,元素是bs4对象
	print(soup.find_all('a')) 
	#2. 返回所有div 和 a 标签
	print(soup.find_all(['div','a']))
    #3. 根据标签属性定位
    print(soup.find_all(attrs={
   "clsaa":"xxx"}))
	#4. 根据标签和属性定位
	print(soup.find_all('div',attrs={
   "clsaa":"xxx"}))
	
	##---------------------css选择器使用方法--------------------------
	#1. 根据标签
	print(soup.select('h1'))
	#2. 根据css属性 查找class=xx的数据
	print(soup.select(

http://www.kler.cn/a/103883.html

相关文章:

  • AI的Prompt是什么
  • Java基础-反射
  • 如何进行二进制文件的读写操作?
  • mysql-面试50题-2
  • 8.力扣c++刷题-->买股票的最佳时机2
  • tcp/ip协议和opc协议对比详解
  • 在edge浏览器中安装好了burp的ca证书,浏览器依旧不能访问https的原因
  • GD32_定时器输入捕获波形频率
  • 【C++】继承和多态
  • 【Spring Cloud】openfeign负载均衡方案(和lb发展历史)
  • VUE3新组件 — Vue3
  • ES 8 新特性
  • pip 指定源
  • uni-app:引用文件的方法
  • wsl2环境的搭建
  • 研发效能(DevOps)职业技术认证-第六期开班啦丨IDCF
  • 栈(Stack)的概念+MyStack的实现+栈的应用
  • 【计算机网络】应用层协议--HTTP协议及HTTP报文格式
  • JDK8新特性:Stream流
  • 基于人工蜂鸟优化的BP神经网络(分类应用) - 附代码