当前位置: 首页 > article >正文

爬虫学习笔记-scrapy安装及第一个项目创建问题及解决措施

1.安装scrapy

pycharm终端运行 pip install scrapy -i https://pypi.douban.com/simple

2.终端运行scrapy startproject scrapy_baidu,创建项目

        问题1:lxml版本低导致无法找到        

         解决措施:更新或者重新安装lxml

 3.项目创建成功

 4.终端cd到项目的spiders文件夹下,cd scrapy_baidu\scrapy_baidu\spiders

        创建爬虫文件名百度,域名scrapy genspider baidu www.baidu.com

 5.爬虫文件创建成功打开,修改def parse,打印输出

 6.运行爬虫文件,scrapy crawl baidu

        问题2:attrs版本低

        解决措施:重新安装

 7.再次运行爬虫文件,scrapy crawl baidu

        ​​​​问题3:无法加载sqllite3

         解决措施:下载sqllite dll文件,解压到python解释器对应DLLs文件夹下

https://www.sqlite.org/download.html

 8.禁用robot协议

9.再次执行后成功运行打印输出

10.注意:退出项目后,再次启动,需要cd到spiders目录下执行scrapy crawl baidu再启动项目


http://www.kler.cn/a/227446.html

相关文章:

  • Leetcode92:反转链表II(区间反转链表)
  • Facebook的社交影响力:用户行为解析与趋势
  • OJ刷题:《剑指offer》之单身狗1、2 !(巧用位操作符,超详细讲解!)
  • 深入Spring MVC的工作流程
  • 如何彻底卸载MySQL【可以解决问题】
  • idea创建spring项目
  • 适合大学英语搜题的软件?如何选择一款好用的大学搜题工具? #职场发展#微信#学习方法
  • 服务器使用过程中遇到常见故障及解决方案(包括蓝屏死机、无法删除的文件如何清理、网络卡、服务器连接不上等)
  • 算法逆向分析之-RC4
  • 4.0 HDFS 配置与使用
  • unity3d的海盗王白银城演示
  • MySQL十部曲之七:InnoDB索引及其优化措施
  • HubSpot营销自动化如何优化营销流程?
  • YoloV8改进策略:Block改进|DCNv4最新实践|高效涨点|完整论文翻译
  • 鸿蒙Native项目生产动态库(.so) 和静态库(.a)
  • C++拷贝构造函数、赋值运算符重载
  • 科普类(遥操作)——快速索引
  • 开普勒先行者vs特斯拉擎天柱,谁更胜一筹?
  • shell 中不同括号引号的含义
  • 153基于matlab的滚动轴承故障诊断