当前位置: 首页 > article >正文

Python 爬虫

一、创建项目

1.双击打开pycharm,点击新建项目
2.项目设置
	- 勾选[继承全局站点软件包]
	- 勾选[可用于所有项目]
	- 取消勾选[创建main.py欢迎脚本]
	- 点击创建
3.项目名称右键--新建--python文件
4.输入文件名--回车

二、编辑代码

# 导入请求模块
import requests
# 如果报错,需要先安装模块
# windows:cmd中执行:pip install requests
# Mac:       终端中执行:pip3 install requests


# 视频url
# url获取方式:
# 1.首先打开视频的网页,然后打开开发者工具
# 2.选中网络(Network)   选中媒体(Media)
# 3.点击上方刷新按钮,就能看见一条或者两条数据
# 4.点击这条数据,右侧出现“标头”,在“标头”的“常规”下面,找到“请求网址”即为url,复制过来
url = ''

# 使用requests的get获取网站的响应
res = requests.get(url)

# 打开一个空的视频,把得到res.content放进去,得到一个可以播放的视频
open('KSVideo.mp4','wb').write(res.content)

有的网站视频和音频是分开的,url也是分开的,需要分开抓取,获取视频、音频url方式如下

1.首先打开视频的网页,然后打开开发者工具
2.选中网络(Network) 点击全部(All)
3.点击上方刷新按钮,下方能看到很多条数据,点击数据上方的“大小”,使多条数据从大到小排列。点击最上面的(最大的那一条)右侧出现“标头”,在“标头”的“常规”下面,找到“请求网址”即为视频url。然后点击下面的几条找到音频的url。

在这里插入图片描述

# 导入请求库
import requests
# 视频URL
videourl = ''
# 构造伪装信息
# user-agent、referer、cookie在上面截图右侧【标头】下方获取,没有的值空着就行
headers = {'user-agent':'','referer':'','cookie':''}
# 带上伪装信息去请求
res = requests.get(videourl,headers=headers)
# 打开一个文件并且写入
open('video.mp4','wb').write(res.content)
# 音频url
audiourl = ''
# 构造伪装信息
# user-agent、referer、cookie在上面截图右侧【标头】下方获取,没有的值空着就行
headers1 = {'user-agent':'','referer':'','cookie':''}
# 带上伪装信息去请求
resaudio = requests.get(audiourl,headers=headers1)
# 打开一个文件并且写入
open('audio.mp3','wb').write(resaudio.content)

http://www.kler.cn/a/458056.html

相关文章:

  • 【游戏设计原理】36 - 环境叙事
  • 云手机服务器如何做到群控多台手机的?
  • socket建立客户端服务器程序
  • Docker安装和使用RabbitMQ
  • 【Python】什么是字典(Dictionary)?
  • springboot489基于springboot的七彩云南文化旅游网站的设计与实现(论文+源码)_kaic
  • 玉米中的元基因调控网络突出了功能上相关的调控相互作用\mo.20a3.R
  • PyTorch中提升模型训练速度的17种策略
  • uni-app开发-识图小程序-个人中心页面
  • Windows远程连接桌面报错“由于没有远程桌面授权服务器可以提供许可证,远程会话连接已断开。请跟服务器管理员联系
  • ELK入门教程(超详细)
  • 【算法】复杂性理论初步
  • Wordpress Tutor LMS插件存在SQL注入漏洞(CVE-2024-10400)
  • 【机器学习】SVM支持向量机(二)
  • mysql建立主从集群
  • 38. 日志
  • MySQL root用户密码忘记怎么办(Reset root account password)
  • 爬虫案例-爬取网页图片
  • 基于STM32的智能垃圾桶的Proteus仿真
  • 使用 pushy 热更新后 sentry 不能正常显示源码