当前位置: 首页 > article >正文

Requests-数据解析bs4+xpath

原理:定位到对应标签,获取标签内的东西

解析三种方法:

    1:正则

58二手房。获取图片列表,二进制content。展开,每个图片是一个内容,正则从头取到尾,不同之处用 .*? 替换掉。

import requests
import re
import os
if __name__ == "__main__":
    # url='https://img3.doubanio.com/view/photo/s_ratio_poster/public/p2898385373.jpg'
    # img_data=requests.get(url=url).content
    # with open("./pic.png","wb") as fp:
    #    fp.write(img_data)

    if not os.path.exists("./pictures"):
        os.makedirs("./pictures")

    url='https://www.58.com/ershoufang/'
    #2.进行UA伪装
    headers = {
        'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_12_0) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/72.0.3626.121 Safari/537.36'
    }
    #

http://www.kler.cn/a/471607.html

相关文章:

  • 【人工智能计算机视觉】——深入详解人工智能计算机视觉之图像处理之基础图像处理技术
  • 概率基本概念 --- 离散型随机变量实例
  • 关于Mac中的shell
  • 微信小程序中使用 TypeScript 定义组件时,Component 函数确实需要多个类型参数
  • 计算机网络--UDP和TCP课后习题
  • 【论文+源码】基于Spring和Spring MVC的汉服文化宣传网站
  • UWB实操:用信号分析仪(频谱分析仪)抓取UWB频域的图像
  • 【JMeter】多接口关联
  • es 3期 第22节-Bucket特殊分桶聚合实战
  • 【往届已EI检索】第五届智慧城市工程与公共交通国际学术会议(SCEPT 2025)
  • 在 PhpStorm 中配置命令行直接运行 PHP 的步骤
  • 后端开发入门超完整速成路线(算法篇)
  • 计算机网络:无线网络
  • 矩阵和向量点乘叉乘元素乘
  • ue5 替换角色的骨骼网格体和动画蓝图
  • 计算机网络之---计算机网络的性能评估
  • Redis中的主从/Redis八股
  • 信息安全:Java自定义Jackson序列化器进行数据脱敏
  • 如何在新窗口打开pdf文件,并修改网页标题
  • 【前端系列02】Pinia状态管理库
  • 回归预测 | MATLAB实现CNN-SVM多输入单输出回归预测
  • 云打印之快手打印组件交互协议
  • jenkins入门5 Manage Jenkins
  • PyQt5 UI混合开发,控件的提升
  • Travis CI/CD 功能详解
  • ES中的仓库和快照