news 2026/6/9 23:26:24

再也不用手动操作!Open-AutoGLM帮你全自动刷小红书

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
再也不用手动操作!Open-AutoGLM帮你全自动刷小红书

再也不用手动操作!Open-AutoGLM帮你全自动刷小红书

你有没有这样的经历:看到一个美食推荐,想立刻打开小红书搜一下,结果一边手忙脚乱点开App、输入关键词、翻找内容,一边还担心错过精彩评论?更别说还要点赞、收藏、关注博主……这一套流程下来,原本几分钟能搞定的事,硬是拖成了“手机劳动”。

现在,这一切都可以交给AI来做了。

Open-AutoGLM——由智谱开源的手机端AI Agent框架,正让“动口不动手”成为现实。你只需要说一句:“打开小红书搜美食”,它就能自动完成所有操作:启动App、输入搜索词、浏览结果、点击目标账号,甚至一键关注。整个过程无需你动手,就像有个私人助理在替你操作手机。

这不仅是效率的提升,更是人机交互方式的一次跃迁。本文将带你从零开始,了解如何部署和使用Open-AutoGLM,真正实现手机操作的自动化。


1. 什么是Open-AutoGLM?

1.1 多模态理解 + 自动执行 = 真·智能助手

Open-AutoGLM不是一个简单的语音指令工具,而是一个基于视觉语言模型(VLM)的手机端AI代理框架。它的核心能力在于:

  • 看懂屏幕:通过截图识别当前界面元素(按钮、输入框、标题等)
  • 听懂指令:用自然语言接收任务,比如“发个朋友圈说今天天气真好”
  • 规划路径:自动拆解任务步骤,决定先点哪里、再输什么
  • 执行操作:通过ADB(Android Debug Bridge)真实点击、滑动、输入

这套“感知—决策—执行”闭环,让它能像真人一样操作手机,而不是依赖特定App的API接口。

1.2 技术架构一瞥

系统主要由三部分组成:

组件功能
视觉语言模型(VLM)分析手机屏幕截图,理解UI布局与语义
ADB控制层实现对安卓设备的真实操作(点击、滑动、输入)
指令解析引擎将用户自然语言转化为可执行的任务流

特别值得一提的是,它内置了敏感操作确认机制。例如当检测到支付页面或涉及隐私的操作时,会暂停并提示人工接管,避免误操作风险。


2. 准备工作:连接你的手机

要让AI代理控制手机,首先得建立通信通道。Open-AutoGLM通过ADB实现设备控制,支持USB和WiFi两种连接方式。

2.1 硬件与环境要求

  • 操作系统:Windows 或 macOS
  • Python版本:建议3.10及以上
  • 安卓设备:Android 7.0以上手机或模拟器
  • ADB工具:用于设备调试与控制

2.2 安装并配置ADB

Windows用户:
  1. 下载Android SDK Platform Tools
  2. 解压后,将文件夹路径添加到系统环境变量Path
  3. 打开命令行,输入adb version,若显示版本号则安装成功
macOS用户:

在终端中运行以下命令(假设platform-tools解压在Downloads目录):

export PATH=${PATH}:~/Downloads/platform-tools

你可以将这行加入.zshrc.bash_profile文件,避免每次重复设置。

2.3 手机端设置

为了让AI能够“看到”和“操作”你的手机,需要开启几个关键权限:

  1. 开启开发者模式
    进入「设置 → 关于手机」,连续点击“版本号”7次,直到提示已开启开发者选项。

  2. 启用USB调试
    返回设置主菜单,进入「开发者选项」,勾选“USB调试”。

  3. 安装ADB Keyboard(可选但推荐)
    这是一个特殊的输入法,允许AI通过ADB发送文本输入,解决中文输入问题。

    • 下载 ADB Keyboard APK 并安装
    • 在「语言与输入法」中将其设为默认输入法

3. 部署Open-AutoGLM控制端

接下来,在本地电脑上部署控制代码,这是AI代理的大脑所在。

3.1 克隆项目并安装依赖

打开终端,执行以下命令:

git clone https://github.com/zai-org/Open-AutoGLM cd Open-AutoGLM # 安装所需依赖 pip install -r requirements.txt pip install -e .

⚠️ 建议使用虚拟环境(如venv或conda),避免依赖冲突。

3.2 获取设备ID

确保手机通过USB连接电脑,然后运行:

adb devices

你会看到类似输出:

List of devices attached 1234567890ABCDEF device

记下这个设备ID,后续会用到。


4. 连接设备:USB还是WiFi?

Open-AutoGLM支持两种连接方式,各有优势。

4.1 USB直连(稳定首选)

直接用数据线连接手机与电脑,稳定性高,适合开发调试。

adb devices

只要设备列表中有你的手机,说明连接成功。

4.2 WiFi远程连接(无线自由)

如果你希望摆脱数据线束缚,可以通过WiFi连接。

第一步:用USB连接并开启TCP/IP模式

adb tcpip 5555

第二步:断开USB,通过IP连接

先查看手机IP地址(可在「设置 → WLAN」中找到),然后运行:

adb connect 192.168.x.x:5555

连接成功后,即可拔掉数据线,实现无线控制。


5. 启动AI代理:一句话搞定复杂操作

一切准备就绪,现在可以下达指令了!

5.1 命令行快速体验

在项目根目录下运行:

python main.py \ --device-id 1234567890ABCDEF \ --base-url http://<云服务器IP>:<端口>/v1 \ --model "autoglm-phone-9b" \ "打开小红书搜索上海美食探店,并关注第一个博主"

参数说明:

  • --device-id:通过adb devices获取的设备ID
  • --base-url:运行视觉模型的云服务地址(需提前部署vLLM服务)
  • --model:指定使用的模型名称
  • 最后的字符串:你的自然语言指令

📌 示例中的“云服务器”指的是你自行部署的推理服务,例如使用vLLM运行GLM-4.5V模型,并暴露API接口。

5.2 Python API调用(适合集成)

如果你想把AI代理嵌入自己的应用中,也可以使用Python API进行远程控制。

from phone_agent.adb import ADBConnection, list_devices # 创建连接管理器 conn = ADBConnection() # 连接远程设备 success, message = conn.connect("192.168.1.100:5555") print(f"连接状态: {message}") # 列出已连接设备 devices = list_devices() for device in devices: print(f"{device.device_id} - {device.connection_type.value}") # 获取设备IP(用于WiFi连接) ip = conn.get_device_ip() print(f"设备 IP: {ip}")

这种方式更适合做批量任务处理或多设备管理。


6. 实战演示:全自动刷小红书

我们来走一遍完整的自动化流程,看看AI是如何代替你完成一系列操作的。

6.1 下达指令

输入如下命令:

python main.py \ --device-id YOUR_DEVICE_ID \ --base-url http://YOUR_SERVER_IP:8800/v1 \ "打开小红书,搜索‘北京周末好去处’,浏览前三个笔记,点赞并收藏第二个"

6.2 AI执行流程分解

  1. 启动小红书App
    AI识别桌面图标,点击进入。

  2. 定位搜索框并输入关键词
    通过图像识别找到搜索栏,调用ADB Keyboard输入“北京周末好去处”。

  3. 触发搜索并加载结果
    模拟点击“搜索”按钮,等待页面刷新。

  4. 浏览前三条笔记
    逐条滑动,截屏分析内容是否匹配主题。

  5. 对第二条笔记执行点赞+收藏
    识别点赞和收藏图标,精准点击。

整个过程完全自动,耗时约1-2分钟,而手动操作通常需要3-5分钟,且容易分心中断。


7. 常见问题与解决方案

尽管Open-AutoGLM功能强大,但在实际使用中仍可能遇到一些问题。以下是常见情况及应对方法。

7.1 设备无法连接

  • 检查USB调试是否开启
  • 确认ADB服务正常运行:尝试重启ADB服务
    adb kill-server adb start-server
  • 防火墙限制:若使用WiFi连接,确保路由器未屏蔽5555端口

7.2 模型无响应或乱码

  • 检查vLLM服务是否正常启动
  • 核对max-model-len参数:建议设置为8192以上以支持长上下文
  • 显存不足:9B模型至少需要24GB GPU显存(如A100或H100)

7.3 输入中文失败

  • 确保ADB Keyboard已安装并设为默认输入法
  • 测试输入命令
    adb shell am broadcast -a ADB_INPUT_TEXT --es msg "你好世界"

7.4 操作卡住或误触

  • 降低操作速度:增加每步之间的延迟,避免因页面未加载完成导致误判
  • 启用日志模式:查看详细执行轨迹,便于调试

8. 应用场景拓展:不止于小红书

虽然我们以“刷小红书”为例,但Open-AutoGLM的能力远不止于此。它可以应用于各种高频、重复性的手机操作场景。

8.1 社交媒体运营

  • 自动发布朋友圈/微博
  • 批量回复私信
  • 跨平台内容同步(如将公众号文章转成小红书笔记)

8.2 日常生活助手

  • 每天定时查看健康码、行程码
  • 自动打卡企业微信/钉钉
  • 查询天气、交通并生成日报

8.3 内容创作者提效

  • 自动生成短视频脚本并发布
  • 监控竞品动态(定期搜索关键词)
  • 收集热门话题与标签

8.4 企业级应用

  • 自动化测试:模拟用户操作进行App功能验证
  • 数据采集:从多个App抓取公开信息(需合规)
  • 客服辅助:帮助坐席快速查找知识库

9. 总结

Open-AutoGLM的出现,标志着我们正在从“人操作手机”迈向“手机替人操作”的新时代。它不仅仅是一个技术玩具,更是一种全新的生产力工具。

通过本文的介绍,你应该已经掌握了:

  • 如何配置ADB环境并连接安卓设备
  • 如何部署Open-AutoGLM控制端
  • 如何通过自然语言指令驱动AI完成复杂操作
  • 如何排查常见问题并优化使用体验

更重要的是,你已经开始思考:哪些重复性操作可以交给AI?我的日常工作中,有多少时间是可以被“自动化”节省下来的?

未来,AI不会取代人类,但它一定会取代那些不会使用AI的人。而现在,正是掌握这项技能的最佳时机。


获取更多AI镜像

想探索更多AI镜像和应用场景?访问 CSDN星图镜像广场,提供丰富的预置镜像,覆盖大模型推理、图像生成、视频生成、模型微调等多个领域,支持一键部署。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/10 14:08:23

Z-Image-Edit创意设计应用:海报生成自动化部署

Z-Image-Edit创意设计应用&#xff1a;海报生成自动化部署 1. 让海报设计像打字一样简单 你有没有遇到过这种情况&#xff1a;明天就要发活动了&#xff0c;设计师还在改第8版海报&#xff0c;而你只能干等着&#xff1f;或者一个小团队要做几十张风格统一的宣传图&#xff0…

作者头像 李华
网站建设 2026/6/10 9:44:15

YOLOv8损失函数优化:基于几何相似性的 Focal WIoU 实现与分析

文章目录 深度学习中WIoU的原理详解 1. 引言 2. 现有IoU变体的局限性 2.1 训练样本质量不均衡问题 2.2 梯度分配不合理 2.3 现有聚焦机制的不足 3. WIoU的设计思想 3.1 核心设计理念 3.2 数学定义 3.3 动态非单调聚焦机制 4. WIoU的详细计算步骤 4.1 基础IoU计算 4.2 异常度量子…

作者头像 李华
网站建设 2026/6/10 11:05:29

YOLOv9小样本学习:few-shot检测微调策略探讨

YOLOv9小样本学习&#xff1a;few-shot检测微调策略探讨 在目标检测领域&#xff0c;YOLO系列模型始终以“快而准”著称。当YOLOv9带着可编程梯度信息&#xff08;PGI&#xff09;和通用高效层&#xff08;GELAN&#xff09;架构横空出世时&#xff0c;它不仅刷新了单阶段检测…

作者头像 李华
网站建设 2026/6/10 11:45:14

基于YOLOv8的BAM(Bottleneck Attention Module)注意力机制研究

YOLOv8 深度增强:集成 BAMBlock (Bottleneck Attention Module) 详解 @[toc] 1. 引言:视觉注意力机制与 YOLOv8 1.1 深度学习与计算机视觉的挑战 在人工智能领域,深度学习,特别是卷积神经网络(CNNs),已经在计算机视觉任务中取得了突破性的进展,如图像分类、目标检…

作者头像 李华
网站建设 2026/6/10 11:12:03

PinWin窗口固定工具:重新定义Windows多任务工作流

PinWin窗口固定工具&#xff1a;重新定义Windows多任务工作流 【免费下载链接】pinwin .NET clone of DeskPins software 项目地址: https://gitcode.com/gh_mirrors/pi/pinwin 你是否经常在多个窗口间频繁切换&#xff0c;感到效率低下&#xff1f;PinWin作为一款基于.…

作者头像 李华