更新日志
v1.4 - Skills:让 AI 助手直接操控你的设备
v1.4 版本推出了 Midscene Skills —— 一套可安装到 Claude Code、OpenClaw 等 AI 助手中的技能包,让 AI 助手直接操控浏览器、桌面、Android 和 iOS 设备。同时本版本还包含独立桌面 MCP 服务、各平台 CLI 独立入口、AI 规划增强等多项改进。
Midscene Skills —— AI 助手的设备操控技能包
Midscene Skills 是一套可安装到 Claude Code、OpenClaw 等 AI 助手中的技能包。安装后,AI 助手可以通过自然语言直接操控浏览器、桌面、Android 和 iOS 设备。
各平台包(@midscene/android、@midscene/ios、@midscene/web 等)现在各自暴露了独立的 CLI 入口,Skills 正是基于此能力构建。
覆盖平台:
- 浏览器(Puppeteer 无头模式)
- Chrome Bridge(用户自己的桌面 Chrome)
- 桌面(macOS、Windows、Linux)
- Android(通过 ADB)
- iOS(通过 WebDriverAgent)
独立桌面自动化 MCP 包
新增 @midscene/computer-mcp 包,将 PC 桌面自动化能力以独立 MCP 服务的形式提供。开发者可以直接在 Cursor、Trae 等支持 MCP 的工具中使用桌面自动化能力,无需额外集成。
详见文档:PC 桌面自动化
Chrome 扩展支持 MCP 后台连接
Chrome 扩展新增后台 Bridge 模式的 MCP 连接支持,可以将桌面浏览器作为 MCP 工具暴露给 AI 助手,进一步打通 MCP 生态。
AI 规划能力增强
aiAct新增deepLocate选项

