当前位置：首页 > article >正文

爬虫获取 item_get_video 接口数据：小红书笔记视频详情的深度解析

article 2025/3/17 21:12:08

在当今内容驱动的互联网时代，小红书作为国内领先的社交电商平台，其笔记视频内容成为品牌营销、内容创作和用户体验的重要组成部分。通过爬虫技术获取小红书笔记视频详情，不仅可以帮助开发者更好地理解用户需求，还能为电商运营、内容推荐和数据分析提供强大的支持。本文将详细介绍如何使用 Python 爬虫获取小红书 item_get_video 接口的返回数据，并对其数据结构进行详细解析。

一、`item_get_video` 接口简介

item_get_video 是小红书开放平台提供的一个 API 接口，专门用于获取笔记视频的详细信息。通过该接口，开发者可以获取以下关键数据：

视频直链：无水印的视频播放链接，可用于视频下载或嵌入展示。
封面图片：视频封面的 URL，可用于展示视频预览。
视频时长：视频的播放时长，通常以秒为单位。
笔记标题与描述：笔记的标题、正文内容以及标签。
互动数据：点赞数、评论数、收藏数等，用于分析内容的受欢迎程度。
用户信息：发布笔记的用户昵称、UID 等。

二、准备工作

在开始爬取 item_get_video 接口之前，需要完成以下准备工作：

1. 注册小红书开放平台账号

访问小红书开放平台官网，注册开发者账号并创建应用。创建成功后，系统会生成 API Key 和 Secret，这是调用接口的必要凭证。

2. 安装依赖库

确保安装了以下 Python 库：

requests：用于发送 HTTP 请求。
json：用于解析 JSON 数据。

使用以下命令安装：

bash

pip install requests

三、Python 爬虫实现

以下是一个完整的 Python 示例代码，展示如何调用 item_get_video 接口并解析返回的视频详情：

Python

import requests
import json

def get_video_info(api_key, secret, num_iid):
    """
    调用 item_get_video 接口获取视频详情
    :param api_key: API 密钥
    :param secret: API 密钥对中的 Secret
    :param num_iid: 笔记的唯一 ID
    :return: 视频详情的字典
    """
    url = f"https://api-gw.onebound.cn/smallredbook/item_get_video/?key={api_key}&secret={secret}&num_iid={num_iid}"
    response = requests.get(url)
    if response.status_code == 200:
        video_info = response.json()
        return video_info
    else:
        print(f"请求失败，状态码：{response.status_code}")
        return None

def main():
    api_key = "YOUR_API_KEY"  # 替换为你的 API Key
    secret = "YOUR_SECRET"  # 替换为你的 Secret
    num_iid = "649c46ab000000002702ad36"  # 示例笔记 ID
    video_info = get_video_info(api_key, secret, num_iid)
    if video_info:
        title = video_info.get("title", "未知标题")
        cover = video_info.get("cover", "无封面")
        video_url = video_info.get("play_url", "无视频链接")
        duration = video_info.get("duration", "未知时长")
        print(f"视频标题: {title}")
        print(f"封面图片: {cover}")
        print(f"播放链接: {video_url}")
        print(f"视频时长: {duration}")
    else:
        print("无法获取视频信息")

if __name__ == "__main__":
    main()

四、接口返回数据结构解析

调用 item_get_video 接口后，返回的 JSON 数据通常包含以下字段：

字段名称	类型	描述
`title`	String	视频标题
`cover`	String	视频封面图片的 URL
`play_url`	String	视频播放链接
`duration`	String	视频时长（通常以秒为单位）
`num_iid`	String	笔记的唯一 ID
`tag_list`	List	笔记中的标签列表
`interact_info`	Dict	互动数据（点赞数、评论数、收藏数）
`user_info`	Dict	发布笔记的用户信息（昵称、UID 等）

示例返回数据

JSON

{
    "title": "如何打造完美妆容",
    "cover": "https://example.com/cover.jpg",
    "play_url": "https://example.com/video.mp4",
    "duration": "120",
    "num_iid": "649c46ab000000002702ad36",
    "tag_list": ["美妆", "教程", "新手"],
    "interact_info": {
        "liked_count": 1500,
        "comment_count": 200,
        "collect_count": 500
    },
    "user_info": {
        "nickname": "美妆达人",
        "uid": "123456789"
    }
}