当前位置: 首页 > article >正文

爬虫案例-爬取某猫的电影数据

文章目录

      • 1.爬取的代码
      • 2.效果图

1.爬取的代码

import requests
import time
import random
import hashlib
import pandas as pd

url = "https://piaofang.maoyan.com/dashboard-ajax?"

header= {
    "user-agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/133.0.0.0 Safari/537.36 Edg/133.0.0.0"
}
#时间戳
time = str(int(time.time()*1000))
#数字
num = random.randint(1, 1000)
#原始字符串
data = f"method=GET&timeStamp={time}&User-Agent=TW96aWxsYS81LjAgKFdpbmRvd3MgTlQgMTAuMDsgV2luNjQ7IHg2NCkgQXBwbGVXZWJLaXQvNTM3LjM2IChLSFRNTCwgbGlrZSBHZWNrbykgQ2hyb21lLzEzMy4wLjAuMCBTYWZhcmkvNTM3LjM2IEVkZy8xMzMuMC4wLjA=&index={num}&channelId=40009&sVersion=2&key=A013F70DB97834C0A5492378BD76C53A"
#加密计算MD5哈希值
md5_hash = hashlib.md5(data.encode()).hexdigest()

param= {
    "orderType": 0,
    "uuid": "194fa637589c8-0c3f722a89eccf-4c657b58-1fa400-194fa637589c8",
    "timeStamp": {time},
    "User-Agent": "TW96aWxsYS81LjAgKFdpbmRvd3MgTlQgMTAuMDsgV2luNjQ7IHg2NCkgQXBwbGVXZWJLaXQvNTM3LjM2IChLSFRNTCwgbGlrZSBHZWNrbykgQ2hyb21lLzEzMy4wLjAuMCBTYWZhcmkvNTM3LjM2IEVkZy8xMzMuMC4wLjA=",
    "index": {num},
    "channelId": 40009,
    "sVersion": 2,
    "signKey": {md5_hash},
    "WuKongReady": "h5"
}

request = requests.get(url,headers=header,params=param)
print(request.json())

# 提取电影数据
movie_data = []
for index in request.json()["movieList"]["data"]['list']:
    movie_info = {
        "电影名称": index["movieInfo"]["movieName"],
        "总票房": index["sumBoxDesc"],
        "上映信息": index["movieInfo"]["releaseInfo"],
        "票房占比": index["splitBoxRate"],
        "场次": index["showCount"]
    }
    movie_data.append(movie_info)

print(movie_data)
# 将数据转换为 DataFrame
df = pd.DataFrame(movie_data)

# 保存到 Excel 文件
df.to_excel(r"C:\Users\zzx\Desktop\movie_data2.xlsx", index=False)

print("数据已保存到 movie_data.xlsx")

2.效果图

在这里插入图片描述


http://www.kler.cn/a/563838.html

相关文章:

  • 大模型最新面试题系列:深度学习基础(一)
  • Redis 运维实战指南:常用命令解析与场景化操作
  • 程序代码篇---C/C++中的变量存储位置
  • Day 50 卡玛笔记
  • PnP——根据3D与2d图片估计相机运动
  • NCYpred:一个具有注意力机制的双向Lstm网络,用于Y Rna和短的非编码Rna分类
  • 11. 断藕重连术 - 反转链表(迭代与递归)
  • [数据结构]栈问题之括号匹配
  • Ubuntu配置ROS2环境 使用串口通信
  • SSL和CA什么关系?
  • centos22.04 dpkg -l 输出状态标识含义
  • DMA 定制固件教程:小白跟做即得单人固件,超详细纯喂饭教程,100% 成功秘籍!FPGA仿真1:1、中断逻辑和TLP核心都在。
  • 获取 ubuntu 系统相关信息
  • VSCODE添加c/c++头文件路径
  • NL2SQL的应用-长上下文模型在处理NL2SQL任务时,相较于传统模型,有哪些显著的优势
  • 2025年【安全员-C证】考试总结及安全员-C证模拟考试
  • [SWPUCTF 2022 新生赛]ez_rce
  • 京准电钟:NTP精密时钟服务器在自动化系统中的作用
  • 模型思维 - 领域模型的应用与解析
  • vue项目中动态添加类名样式不生效问题