当前位置: 首页 > article >正文

爬虫 - 爬取王者荣耀所有皮肤图片

结果展示

在这里插入图片描述

安装

pip install requests logger

代码

import json
import os
import re
from concurrent.futures import ThreadPoolExecutor

import requests
from loguru import logger


def parse_url(url, b=False):
    try:
        headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.198 Safari/537.36", }
        res = requests.get(url, headers=headers)
        res.encoding = "GBK"
        assert res.status_code == 200, "Code not is 200"
        return res.content if b else res.text
    except:
        pass


def download_img(img_url, hero_name, hero_img, num):
    b_data = parse_url(img_url, b=True)
    if b_data is None:
        return
    with open(hero_img, "wb") as f:
        f.write(b_data)
    logger.success(f"{hero_name}{num}张皮肤图片 下载完毕")


def process_hero(id, name):
    logger.info(f"{id}\t{name}\t处理中...")

    hero_dir = f"./英雄皮肤/{name}"
    if not os.path.exists(hero_dir):
        os.makedirs(hero_dir, exist_ok=True)

    with ThreadPoolExecutor(max_workers=20) as pool:
        for num in range(1, 20):
            hero_img = f"{hero_dir}/皮肤_{num}.png"
            if os.path.exists(hero_img):
                logger.warning(f"{hero_img}已下载过,跳过")
                continue
            img_url = f"https://game.gtimg.cn/images/yxzj/img201606/skin/hero-info/{id}/{id}-bigskin-{num}.jpg"
            pool.submit(download_img, img_url, name, hero_img, num)


def start():
    api_url = "https://game.gtimg.cn/images/yxzj/web201706/js/heroid.js"
    text = parse_url(api_url)
    search_result = re.search('var module_exports = ({.*?})', text, re.S)
    hero_info_str = search_result.group(1)
    hero_info_str = re.sub("'", '"', hero_info_str)
    hero_info_dict = json.loads(hero_info_str)

    with ThreadPoolExecutor(max_workers=10) as pool:
        for hero in hero_info_dict:
            name, id = hero_info_dict[hero], hero
            pool.submit(process_hero, id, name)


if __name__ == '__main__':
    start()



http://www.kler.cn/a/461557.html

相关文章:

  • 回归预测 | MATLAB实现CNN-SVM多输入单输出回归预测
  • Spring Boot日志处理
  • 设计模式の状态策略责任链模式
  • ensp QOS的配置
  • PyTorch 中 reciprocal(取倒数)函数的深入解析:分析底层实现CPP代码
  • flink-connector-kafka 3.4源码编译
  • csrf跨站请求伪造(portswigger)无防御措施
  • pyinstaller打包exe可执行文件
  • Cherno C++学习笔记 P47 动态数组Vector
  • JS中的鼠标事件和键盘事件基础
  • 汇川Easy系列正弦信号发生器(ST源代码)
  • Swift Combine 学习(五):Backpressure和 Scheduler
  • 【OpenGL ES】GLSL基础语法
  • AAAI 2025论文分享┆一种接近全监督的无训练文档信息抽取方法:SAIL(文中附代码链接)
  • 【蓝桥杯——物联网设计与开发】基础模块9 - PWM
  • Android Notification 问题:Invalid notification (no valid small icon)
  • 读书网(文章内容的抓取)
  • 【Redis知识】Redis进阶-redis还有哪些高级特性?
  • private static final Logger log = LoggerFactory.getLogger()和@Slf4j的区别
  • wpf 基于Behavior库 的行为模块
  • 网络安全 | 物联网安全:从设备到网络的全方位防护
  • day 29 进程exec函数族 ,进程实现无人机模块,exec实现minishell
  • Ribbon和Eureka的集成
  • 黑神话悟空游戏鼠标光标使用教程与下载
  • 探秘Kafka源码:关键内容解析
  • 【Leetcode 热题 100】22. 括号生成