当前位置：首页 > article >正文

Python实现一个简单的爬虫程序（爬取图片）

article 2025/2/21 3:39:51

1、安装爬虫Scrapy

2、新建爬虫项目

3、配置爬虫

4、编写爬虫代码，爬取百度图片

5、运行爬虫程序

编程环境是Anaconda，其安装和使用见我之前的文章，这里就不赘述了。

首先安装爬虫Scrapy，为了加快下载速度，我用了国内镜像网站，如下所示：

pip install scrapy -i https://pypi.tuna.tsinghua.edu.cn/simple

还需要再安装一下Twisted，否则使用爬虫时会报错。

conda install --channel https://conda.anaconda.org/anaconda Twisted

新建爬虫项目test_spider

scrapy startproject test_spider

进入spiders目录，创建baiduSpider.py，域名是要爬取的网站，写错了就无法爬取图片。不过不必担心，这里我们

postgresql 导出CSV格式数据

电脑连手机热点，上不了网

QT学习第五天

mysql workbench 如何访问远程数据库

C++编译环境（IDE）推荐及安装

前端下载word、excel文件的两种方法

dedecms靶场（四种webshell姿势）