Spider_XHS
✨ 专业的小红书数据采集解决方案,支持笔记爬取,保存格式为excel或者media
✨ 小红书全域运营解决方法,AI一键改写笔记(图文,视频)直接上传
⭐功能列表
⚠️ 任何涉及数据注入的操作都是不被允许的,本项目仅供学习交流使用,如有违反,后果自负
| 模块 | 已实现 |
|---|---|
| 小红书创作者平台 | ✅ 二维码登录 ✅ 手机验证码登录 ✅ 上传(图集、视频)作品 ✅查看自己上传的作品 |
| 小红书PC | ✅ 二维码登录 ✅ 手机验证码登录 ✅ 获取无水印图片 ✅ 获取无水印视频 ✅ 获取主页的所有频道 ✅ 获取主页推荐笔记 ✅ 获取某个用户的信息 ✅ 用户自己的信息 ✅ 获取某个用户上传的笔记 ✅ 获取某个用户所有的喜欢笔记 ✅ 获取某个用户所有的收藏笔记 ✅ 获取某个笔记的详细内容 ✅ 搜索笔记内容 ✅ 搜索用户内容 ✅ 获取某个笔记的评论 ✅ 获取未读消息信息 ✅ 获取收到的评论和@提醒信息 ✅ 获取收到的点赞和收藏信息 ✅ 获取新增关注信息 |
🌟 功能特性
- ✅ 多维度数据采集
- 用户主页信息
- 笔记详细内容
- 智能搜索结果抓取
- 🚀 高性能架构
- 自动重试机制
- 🔒 安全稳定
- 小红书最新API适配
- 异常处理机制
- proxy代理
- 🎨 便捷管理
- 结构化目录存储
- 格式化输出(JSON/EXCEL/MEDIA)
🎨效果图
处理后的所有用户
某个用户所有的笔记
某个笔记具体的内容
保存的excel
🛠️ 快速开始
⛳运行环境
- Python 3.7+
- Node.js 18+
🎯安装依赖
pip install -r requirements.txt
npm install
🎨配置文件
配置文件在项目根目录.env文件中,将下图自己的登录cookie放入其中,cookie获取➡️在浏览器f12打开控制台,点击网络,点击fetch,找一个接口点开 
复制cookie到.env文件中(注意!登录小红书后的cookie才是有效的,不登陆没有用) 
🚀运行项目
python main.py
🗝️注意事项
- main.py中的代码是爬虫的入口,可以根据自己的需求进行修改
- apis/xhs_pc_apis.py 中的代码包含了所有的api接口,可以根据自己的需求进行修改
- apis/xhs_creator_apis.py 中的代码包含了小红书创作者平台的api接口,可以根据自己的需求进行修改
相关软件
暂无评论...







