news 2026/6/23 4:24:44

小红书数据采集终极指南:5分钟掌握XHS-Downloader完整使用教程

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
小红书数据采集终极指南:5分钟掌握XHS-Downloader完整使用教程

小红书数据采集终极指南:5分钟掌握XHS-Downloader完整使用教程

【免费下载链接】XHS-Downloader小红书(XiaoHongShu、RedNote)链接提取/作品采集工具:提取账号发布、收藏、点赞、专辑作品链接;提取搜索结果作品、用户链接;采集小红书作品信息;提取小红书作品下载地址;下载小红书作品文件项目地址: https://gitcode.com/gh_mirrors/xh/XHS-Downloader

还在为如何高效采集小红书内容而烦恼吗?XHS-Downloader作为一款专业的开源工具,能够帮助你轻松提取小红书作品信息、批量下载无水印内容,无论是个人创作备份还是数据分析研究,都能提供强大的支持。这款小红书数据采集工具支持多种使用模式,包括图形界面、命令行、API服务和浏览器脚本,满足不同用户的需求。

🔍 为什么选择XHS-Downloader?

在小红书内容日益丰富的今天,高效的内容采集工具显得尤为重要。XHS-Downloader凭借其强大的功能和灵活的配置,成为众多用户的首选解决方案。

核心优势

  • 全面支持:支持发布、收藏、点赞、专辑等多种作品类型
  • 智能识别:自动识别作品类型,智能处理图文、视频、livePhoto等格式
  • 批量处理:支持多链接同时处理,大幅提升工作效率
  • 无水印下载:获取原始无水印文件,保持最佳画质
  • 数据完整:采集完整的作品元数据,包括点赞、评论、发布时间等信息

🚀 快速入门:三种部署方式

图形界面模式(推荐新手)

对于不熟悉命令行的用户,图形界面是最佳选择。只需简单几步即可开始使用:

# 克隆项目 git clone https://gitcode.com/gh_mirrors/xh/XHS-Downloader cd XHS-Downloader # 安装依赖 uv sync --no-dev # 启动程序 uv run main.py

启动后,你会看到一个直观的操作界面。将小红书作品链接粘贴到输入框中,多个链接用空格分隔,点击"下载作品文件"按钮即可开始下载。

Docker部署(适合服务器环境)

对于需要在服务器环境运行的用户,Docker提供了最便捷的部署方案:

# 拉取最新镜像 docker pull joeanamier/xhs-downloader # 运行容器(TUI模式) docker run -p 5556:5556 -v xhs_data:/app/Volume -it joeanamier/xhs-downloader # 运行容器(API模式) docker run -p 5556:5556 -v xhs_data:/app/Volume -it joeanamier/xhs-downloader python main.py api # 运行容器(MCP模式) docker run -p 5556:5556 -v xhs_data:/app/Volume -it joeanamier/xhs-downloader python main.py mcp

源码运行(适合开发者)

如果需要自定义功能或进行二次开发,源码运行提供了最大的灵活性:

# 安装Python 3.12+ python -m venv venv source venv/bin/activate # Linux/Mac # 或 .\venv\Scripts\activate.ps1 # Windows # 安装依赖 pip install -r requirements.txt # 启动程序 python main.py

📱 浏览器脚本:网页端直接操作

最便捷的使用方式是在浏览器中直接操作!XHS-Downloader提供了强大的用户脚本,可以直接在小红书网页端使用:

安装步骤

  1. 安装Tampermonkey浏览器扩展
  2. 从URL安装脚本:https://raw.githubusercontent.com/JoeanAmier/XHS-Downloader/refs/heads/master/static/XHS-Downloader.js
  3. 在小红书网页端会出现侧边菜单

主要功能

  • 提取发布作品链接
  • 提取点赞作品链接
  • 提取收藏作品链接
  • 提取专辑作品链接
  • 推送下载任务到服务器

⚙️ 核心功能详解

链接解析与采集

XHS-Downloader支持多种小红书链接格式:

https://www.xiaohongshu.com/explore/作品ID https://www.xiaohongshu.com/discovery/item/作品ID https://www.xiaohongshu.com/user/profile/作者ID/作品ID https://xhslink.com/分享码

支持单次输入多个作品链接,链接之间使用空格分隔,程序会自动提取有效链接。

下载配置优化

通过配置文件Volume/settings.json,你可以深度定制下载行为:

{ "name_format": "发布时间 作者昵称 作品标题", "image_format": "JPEG", "folder_mode": false, "max_retry": 5, "timeout": 10, "video_preference": "resolution", "author_archive": false, "write_mtime": false }

关键配置说明

  • name_format:自定义文件命名规则
  • image_format:支持AUTO、PNG、WEBP、JPEG、HEIC格式
  • video_preference:视频下载偏好(分辨率优先、码率优先、文件大小优先)
  • author_archive:按作者归档作品
  • write_mtime:将文件修改时间设为作品发布时间

Cookie配置指南

为了获取更高质量的内容,建议配置小红书Cookie:

配置步骤

  1. 打开浏览器访问https://www.xiaohongshu.com/explore
  2. 按F12打开开发者工具
  3. 切换到"网络"标签页
  4. 勾选"保留日志"
  5. 在过滤框输入cookie-name:web_session
  6. 选择任意数据包,全选复制Cookie值
  7. 在程序或配置文件中设置Cookie参数

🔧 高级使用技巧

命令行模式

对于需要批量处理的用户,命令行模式提供了最大的灵活性:

# 下载单个作品 python main.py --url "https://www.xiaohongshu.com/explore/作品ID" # 批量下载多个作品 python main.py --url "链接1 链接2 链接3" --download true # 自定义下载参数 python main.py --url "作品链接" --work-path "./下载目录" --image-format "WEBP" --folder-mode true

API服务器模式

XHS-Downloader提供了完整的API接口,方便与其他系统集成:

import requests # 调用API接口 api_url = "http://127.0.0.1:5556/xhs/detail" payload = { "url": "小红书作品链接", "download": True, "index": [1, 3, 5], # 只下载指定序号的图片 "proxy": "http://127.0.0.1:10808" } response = requests.post(api_url, json=payload, timeout=30) print(response.json())

MCP服务配置

支持Model Context Protocol服务模式,方便与AI工具集成:

启动MCP服务

python main.py mcp

MCP URLhttp://127.0.0.1:5556/mcp/

📊 实际应用场景

内容创作者备份

作为内容创作者,定期备份自己的作品至关重要:

  1. 使用浏览器脚本提取自己账号的所有发布作品链接
  2. 批量下载无水印原文件
  3. 按时间整理到不同文件夹
  4. 保存完整的作品信息用于数据分析

竞品分析与市场研究

营销人员和产品经理可以利用XHS-Downloader进行竞品分析:

  1. 收集竞品账号的作品链接
  2. 批量下载内容进行分析
  3. 统计点赞、收藏等互动数据
  4. 分析内容趋势和用户偏好

学术研究与数据采集

研究人员可以构建高质量的数据集:

  1. 根据关键词搜索相关作品
  2. 批量采集内容样本
  3. 提取文本、图片、视频等多模态数据
  4. 构建研究数据集

🛠 二次开发指南

XHS-Downloader提供了完善的API接口和模块化设计,方便二次开发:

from source import XHS async def custom_download(): """自定义下载示例""" async with XHS( work_path="./custom_download", folder_name="MyDownloads", name_format="作者昵称_作品标题_发布时间", image_format="WEBP", folder_mode=True, author_archive=True, write_mtime=True ) as xhs: result = await xhs.extract( "https://www.xiaohongshu.com/explore/作品ID", download=True, index=[1, 2, 3] # 只下载前3张图片 ) print(result)

核心模块

  • source/application/:主要应用逻辑
  • source/module/:核心功能模块
  • source/expansion/:扩展功能
  • source/CLI/:命令行接口
  • source/TUI/:图形界面

📝 注意事项与最佳实践

下载记录管理

XHS-Downloader会将下载过的作品ID储存至数据库,重复下载时会自动跳过。如需重新下载,需要先删除数据库中对应的作品ID。

请求频率控制

为了避免请求频率过高对平台服务器造成影响,项目内置了请求延时机制。建议合理设置请求间隔,避免触发反爬机制。

文件完整性检查

项目实现了作品文件完整性处理机制,确保下载的文件完整可用。如果下载过程中断,支持断点续传功能。

多语言支持

项目支持中文和英文界面,通过配置文件中的language参数设置:

  • zh_CN:简体中文
  • en_US:英文

🤝 社区与贡献

XHS-Downloader是一个活跃的开源项目,欢迎社区参与:

贡献方式

  1. 报告问题:在项目仓库提交Issue
  2. 提交代码:通过Pull Request贡献代码
  3. 改进文档:帮助完善使用文档和教程
  4. 分享经验:在社区分享使用技巧

项目地址https://gitcode.com/gh_mirrors/xh/XHS-Downloader

联系作者

  • 邮箱:yonglelolu@foxmail.com
  • Discord社区:https://discord.com/invite/ZYtmgKud9Y

⚠️ 使用注意事项

  1. 尊重版权:请遵守平台规则,仅将工具用于合法合规的用途
  2. 合理使用:避免过度频繁请求,尊重平台服务器资源
  3. 数据安全:妥善保管下载的内容,遵守相关法律法规
  4. 技术限制:部分功能可能需要Cookie配置才能获得最佳效果
  5. 版本更新:建议定期更新到最新版本以获得最佳体验

🎯 开始使用

现在你已经了解了XHS-Downloader的强大功能,是时候开始使用了!无论你是需要备份个人作品的内容创作者,还是需要进行数据分析的研究人员,这款工具都能为你提供强大的支持。

立即开始

git clone https://gitcode.com/gh_mirrors/xh/XHS-Downloader cd XHS-Downloader uv sync --no-dev uv run main.py

祝你使用愉快!如果在使用过程中遇到任何问题,欢迎查阅项目文档或参与社区讨论。

【免费下载链接】XHS-Downloader小红书(XiaoHongShu、RedNote)链接提取/作品采集工具:提取账号发布、收藏、点赞、专辑作品链接;提取搜索结果作品、用户链接;采集小红书作品信息;提取小红书作品下载地址;下载小红书作品文件项目地址: https://gitcode.com/gh_mirrors/xh/XHS-Downloader

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/23 4:20:05

DepotDownloader终极指南:轻松下载Steam游戏资源的完整教程

DepotDownloader终极指南:轻松下载Steam游戏资源的完整教程 【免费下载链接】DepotDownloader Steam depot downloader utilizing the SteamKit2 library. 项目地址: https://gitcode.com/gh_mirrors/de/DepotDownloader 你是否曾想备份自己心爱的Steam游戏&…

作者头像 李华
网站建设 2026/6/23 4:19:15

MOSAIC自动驾驶感知:解耦空间/几何/运动建模的工程实践

1. 这不是一篇普通论文报告:MOSAIC到底在解决自动驾驶里哪个“卡脖子”环节?如果你最近翻过CVPR、ICRA或CoRL的论文列表,或者刷过arXiv上自动驾驶方向的预印本,大概率已经见过MOSAIC这个名字。它不像BEVFormer那样一发布就刷屏社交…

作者头像 李华
网站建设 2026/6/23 4:01:49

基于GIRB框架的文本摘要评估指标校准方法与实践

1. 项目概述:当评估指标“说谎”时,我们该怎么办? 在文本摘要这个领域,从业者几乎每天都在和评估指标打交道。无论是研发新模型,还是优化现有算法,我们都需要一个客观的“裁判”来告诉我们,生成…

作者头像 李华
网站建设 2026/6/23 3:44:14

2026年西安人必看:就业指导哪家培训公司更靠谱?

用户痛点分析在西安这座充满机遇与挑战的城市中,高校毕业生和准备进入职场的职场新人常常会在就业方向上陷入迷茫。以下是他们在就业路上可能遇到的一些典型问题,以及在解决这些问题时可以尝试的方法。1. 职业方向迷茫问题描述:很多人临近毕业…

作者头像 李华
网站建设 2026/6/23 3:31:29

vscode claudecode 插件 request failed with status code 403

在.vscode/settings.json中配置网络代理,如:"http.proxy": "http://xxx:7890", "http.proxyStrictSSL": false, "http.proxySupport": "override", "claudeCode.environmentVariables": [{…

作者头像 李华
网站建设 2026/6/23 3:30:36

AVR32EB定时器TCB/TCE深度解析:从事件驱动到电机控制实战

1. 从555到MCU:为什么需要深入理解定时器?如果你是从经典的555定时器、51单片机或者STM32的定时器开始接触嵌入式开发的,那么当你看到AVR32EB系列的TCB/TCE定时器时,可能会觉得“定时器嘛,不就是计个数、产生个中断或者…

作者头像 李华