当前位置: 首页 > article >正文

爬虫第一篇

前言:本系列的文章有点难度,建议零基础小白先从小白学python系列的文章开始学习,并且,本系列的文章,博主只是讲解一些用来娱乐的知识点。知识点可能不会很全,还请见谅。

太聪明了怎么办?那就给脑子灌爬虫的知识点,让自己更加聪明 !!!

什么是爬虫

请求分为四部分

1.请求网址  -------request  url

2.请求方法 -------- request  methods(如get,post)

3.请求头-------request header

4.请求体 ---------- request body

ok,知道以上部分东西以后我们就可以开始爬虫了,由于本系列的文章只是用于娱乐,因此博主只会给大家讲解一些很浅,且容易吸收的东西。

那么时间有限今天就先简单讲一个爬取音乐的案例。

案例:爬取网易云音乐

第一步,百度搜索网易云音乐

这里博主使用的是edge浏览器,当然这里博主也推荐大家使用谷歌浏览器,这个要比edge好用。

进入到这个页面后先点击播放,然后再按f12或者fn + f12(这个是笔记本电脑的) ,也可以鼠标右击点击检查

选择网络,然后我们播放音乐

在这么多数据包中找到我们要爬的数据包,那么这里我们要找到对应的数据包,那么怎么找到音乐的数据包呢,首先音乐是有声的,我们可以在上面的分类中找到媒体类

通过这里的数据包名称和大小我们可以确定,这应该是一个完整的数据包,但具体是不是音乐呢我们爬下来后才知道。

那么找包的部分已经结束,我们来到代码部分。

这个就是简单爬虫的代码,对于小白而言,直接当成模板记就行

接下来我们来找url这一部分的字符串

点击这些包中的一个

选择标头

复制这些到url中

运行代码

成果验证

爬虫结果验证

本篇文章的内容就先到这里,我们下期文章再见!!!


http://www.kler.cn/a/510291.html

相关文章:

  • CT重建笔记(三)——共轭梯度法
  • git系列之revert回滚
  • LabVIEW桥接传感器数据采集与校准程序
  • Web前端第一次作业
  • 数据库服务体系结构
  • ScratchLLMStepByStep:训练自己的Tokenizer
  • oneplus3t-lineage-14编译-android7
  • Jenkins搭建
  • 深度学习中的张量 - 使用PyTorch进行广播和元素级操作
  • 后盾人JS -- 好用的 JavaScript Symbol 类型
  • 【ArcGIS微课1000例】0140:总览(鹰眼)、放大镜、查看器的用法
  • C++实现设计模式---组合模式 (Composite)
  • RabbitMQ---TTL与死信
  • 参数校验 Spring Validation框架
  • 探秘Shortest与Stagehand:开启高效测试与自动化新篇
  • 【Idea】编译Spring源码 read timeout 问题
  • FastGPT结合New-api,遍享各类大模型
  • pytest全局配置文件pytest.ini
  • rabbitmq安装延迟队列
  • MinerU:高效智能PDF文档解析工具完全指南
  • pg_sql关于时间的函数
  • 刷题小白——排序
  • Vue + Nuxt 全面解析:构建高效 SSR 与 SSG 应用的最佳实践
  • CORS:跨域访问、如何在Nginx中配置允许跨域访问
  • Flink(十):DataStream API (七) 状态
  • SVG To Font 创建自己的字体图标库