当前位置: 首页 > article >正文

【Python】数据抓取失败解析

本次项目选择了中国的一线城市——上海市,通过了解上海市二手房的情况,可以帮助人们在购房、出租等方面做出更明智的决策。可以帮助人们了解上海市经济的发展趋势。随着互联网的发展,越来越多的房地产信息通过网络发布,使用爬虫技术可以方便地收集和分析这些信息。而本次项目选择的数据来源是链家。链家是一家著名的房地产经纪公司,在上海市有着广泛的房地产业务。通过爬取上海市链家发布的二手房信息,可以获得丰富的数据,为分析提供参考。

上海市链家二手房数据爬虫主要爬取了上海市链家二手房的所在行政区、小区名称、每平方米价格、整套房总价

def fetch_data(page_number):  
    url = f"https://sh.lianjia.com/ershoufang/pg{page_number}/"  
    response = requests.get(url)  

    if response.status_code != 200:  
        print(f"请求失败,状态码: {response.status_code}")  
        return []  

    soup = BeautifulSoup(response.text, 'html.parser')  
    rows = []  

    for house_info in soup.find_all("li", {"class": "clear LOGVIEWDATA LOGCLICKDATA"}):  
        row = {}  
        row['区域'] = house_info.find("div", {"class": "positionInfo"}).get_text() if house_info.find("div", {"class": "positionInfo"}) else None  
        row['房型'] = house_info.find("div", {"class": "houseInfo"}).get_text() if house_info.find("div", {"class": "houseInfo"}) else None  
        row['关注'] = house_info.find("div", {"class": "

http://www.kler.cn/a/409438.html

相关文章:

  • 输入三个整数x,y,z,请把这三个数由小到大输出。-多语言实现
  • Android 13 编译Android Studio版本的Launcher3
  • C0034.在Ubuntu中安装的Qt路径
  • 一个关于 CSS Modules 的陷阱
  • Python 版本的 2024详细代码
  • 笔记记录 k8s-install
  • Vue3-后台管理系统
  • 网络安全,文明上网(2)加强网络安全意识
  • 【LC】2529. 正整数和负整数的最大计数
  • 【人工智能】用Python和NLP工具构建文本摘要模型:使用NLTK和spaCy进行自然语言处理
  • Java爬虫的奇妙冒险:揭开1688商品详情的神秘面纱
  • 大连环保公益管理系统|Java|SSM|Vue| 前后端分离
  • (图解)TCP的三次握手,四次挥手
  • 前后端分离,解决vue+axios跨域和proxyTable不生效等问题
  • windows下轻量级虚拟化wsl 执行linux系统实践应用
  • 7天掌握SQL - 第三天:MySQL实践与索引优化
  • HarmonyOS应用开发中的页面路由与数据传输
  • C语言之为表达式计算器实现定义变量和使用变量功能
  • 大数据的数据整合
  • 【linux】插入新硬盘如何配置:格式化、分区、自动挂载(Ubuntu)
  • 表格数据处理中大语言模型的微调优化策略研究
  • Python 使用 OpenCV 将 MP4 转换为 GIF图
  • 新华三H3CNE网络工程师认证—子接口技术
  • 任子行网络安全审计系统 log_fw_ips_scan_jsondata SQL注入漏洞复现
  • java基础(一):JDK、JRE、JVM、类库等概念,java跨平台实现原理
  • On-Chip-Network之Topology