当前位置: 首页 > article >正文

get请求(豆瓣电影第一页爬取)

目录

(一)需要的python库

import urllib.request

 import urllib.parse

(二)找到url和headers

url

headers

(三)创建一个请求对象和返回一个响应对象

创建一个请求对象

 返回一个响应对象

 (四)读取内容和写入文档

读取内容

写入文档

 (五)完整代码

 (六)结果​


(一)需要的python库

import urllib.request

import urllib.request导入了 urllib 模块中的 request 子模块,这个子模块提供了打开 URL(包括 HTTP、FTP 等协议)的功能,可以用于从网络上获取资源,比如发送 HTTP 请求获取网页内容等。

 import urllib.parse

import urllib.parse导入了 urllib 模块中的 parse 子模块,这个子模块主要用于解析 URL 和对 URL 中的参数进行编码和解码等操作,例如将字典形式的参数转换为 URL 编码的查询字符串,或者从 URL 中解析出参数等

(二)找到url和headers

url

https://movie.douban.com/j/chart/top_list?type=5&interval_id=100%3A90&action=&start=0&limit=20

headers

(三)创建一个请求对象和返回一个响应对象

  • 创建一个请求对象

Headers = urllib.request.Request(url=url,headers=header)
  •  返回一个响应对象

response = urllib.request.urlopen(Headers)

 (四)读取内容和写入文档

  • 读取内容

content = response.read().decode('utf-8')
  • 写入文档

open方法默认情况下使用的gbk的编码  如果我们想要保存中文  那么要在open方法中指定编码 utf-8
with open('豆瓣.json','w',encoding='utf-8') as fp:
    fp.write(content)

 (五)完整代码

import urllib.request
import urllib.parse

url = 'https://movie.douban.com/j/chart/top_list?type=5&interval_id=100%3A90&action=&start=0&limit=20'

header = {
"user-agent":
"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/129.0.0.0 Safari/537.36"
}

Headers = urllib.request.Request(url=url,headers=header)

response = urllib.request.urlopen(Headers)

content = response.read().decode('utf-8')
#open方法默认情况下使用的gbk的编码  如果我们想要保存中文  那么要在open方法中指定编码 utf-8
with open('豆瓣.json','w',encoding='utf-8') as fp:
    fp.write(content)

 (六)结果


加速中。。。


http://www.kler.cn/news/354833.html

相关文章:

  • Web 升级 Https
  • 【C语言】字符函数和字符串函数(中)
  • 远程控制手机时,怎样用电脑键盘给手机输入文本?
  • 自动化数控走心机
  • 分布式事务及seata解决方案
  • 《Linux从小白到高手》综合应用篇:深入理解Linux磁盘及IO优化
  • 【原创】java+springboot+mysql校园留言墙管理系统设计与实现
  • gitlab操作和管理
  • 从Maya对象中获取单个坐标值
  • Spring Boot 核心理解-嵌入式服务器
  • 怎么将视频速度调慢?视频速度调慢的快速方法
  • 基于springboot驾校管理系统
  • Xshell上Linux的基础指令
  • Axure树形菜单展开与折叠
  • 【机器学习(十三)】零代码开发案例之股票价格预测分析—Sentosa_DSML社区版
  • private field is never assigned
  • 百度智能云千帆 ModelBuilder 大模型服务及开发解读
  • Spark SQL 的离线数仓开发
  • Java学习之 状态机 机制
  • 一些简单的编程题(Java与C语言)