当前位置: 首页 > article >正文

Python程序员看见一个好看的手机壁纸网站,开撸!

人生苦短,我用python

最近好像没什么大事,

.那就采集一下小——姐——姐————看下吧~

python 安装包+资料:点击此处跳转文末名片获取

在这里插入图片描述

最近有同学的爬虫代码出了bug,给问我怎么改

在这里插入图片描述

于是就发现了这个好看的手机壁纸网站。

在这里插入图片描述

这个图片应该是违规的,放不出来的

看到那么多好看的壁纸,

我的pycharm已经饥渴难耐了(不是)

受害网址

在这里插入图片描述

python 安装包+资料:点击此处跳转文末名片获取
为了良性爬取,
这个代码就不完整的展示出来了

部分爬虫代码

导入工具

from urllib import parse
import requests
import parsel
import re

解析网站,爬取数据

for page in range(1, 10):
    print('正在爬取第{}页壁纸'.format(page))
    url = 'http://#### /tag/{}/page/{}/'.format(name, page)
    headers = {
        'Cookie': 'UM_distinctid=1747c5616688f-0da459aa281e74-3962420d-1fa400-1747c56166982d; CNZZDATA1278590218=744878758-1599811024-%7C1599811024',
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36'
    }
 
		response = requests.get(url=url, headers=headers)
    selector = parsel.Selector(response.text)
    img_url = selector.css('#main a::attr(href)').getall()

设置爬取类目

string = input('请输入你要爬取的类目:')
name = parse.unquote(string)

保存图片

        path = 'C:\\Users\\Administrator\\Desktop\\手机壁纸\\' + new_title + '.jpg'
        with open(path, mode='wb') as f:
            f.write(data_response.content)
            print(title)

运行代码,效果如下图

python 安装包+资料:点击此处跳转文末名片获取

在这里插入图片描述

最后放两张好看的图片~

咳咳…今天的文章就是这样啦!

我绝对没有在水!!!

在这里插入图片描述在这里插入图片描述


👇问题解答 · 源码获取 · 技术交流 · 抱团学习请联系👇


http://www.kler.cn/a/2224.html

相关文章:

  • 一体式IO模块:打印机加工产线国产化降本增效的新利器
  • Java爬虫获取1688 item_search_img接口详细解析
  • 重拾设计模式--备忘录模式
  • SpringBoot相关漏洞学习资料
  • 鸿蒙元服务从0到上架【第二篇】
  • C# cad启动自动加载启动插件、类库编译 多个dll合并为一个
  • Linux操作系统ARM体系结构处理器机制原理与实现
  • Vue面试题 路由守卫
  • 【Hive】HQL
  • 【2023新星计划 】博客创作指导 活动解读
  • ChatGPT应用场景与工具推荐
  • GPT-4是个编程高手,真服了!
  • MyBatis --- 缓存、逆向工程、分页插件
  • 【K8S系列】深入解析Pod对象(一)
  • MySQL-触发器
  • 继承和派生
  • vue后台管理系统
  • 网络安全工具大合集
  • C语言学习之路--结构体篇
  • [JS] JS小技巧
  • Python3,5行代码,生成自动排序动图,这操作不比Excel香?
  • Three.js——learn01
  • 什么是语法糖?Java中有哪些语法糖?
  • FPGA基于RIFFA实现PCIE采集HDMI传输,提供工程源码和QT上位机
  • C语言学习之路--指针篇
  • Linux文本三剑客(grep、sed、awk)