PokeClaw – 开源的全本地离线运行手机 AI Agent 应用

Al项目 2026-04-13 12:00:13 AI导航网

PokeClaw是什么

PokeClaw(全称 PocketClaw)是开源 Android AI 自动化应用,由开发者 Nicole 独立打造。是首个实现完全本地离线运行的手机 AI 代理,基于 Google Gemma 4 模型通过 LiteRT-LM 运行时直接在设备端推理,无需联网、账户或 API 密钥即可自主控制手机。通过 Android 无障碍服务读取屏幕 UI 树,AI 可执行点击、滑动、输入文字、发送消息等操作,实现真正的闭环代理。所有数据处理均在本地完成,彻底保护隐私;同时可选配 OpenAI、Anthropic 等云端模型增强复杂任务能力。支持 WhatsApp 上下文感知自动回复、通知汇总、跨应用操作等功能,仅需 Android 9+ 和 8GB 内存即可运行。

PokeClaw

PokeClaw的主要功能

  • 完全本地离线 AI 运行:基于 Google Gemma 4 模型在设备端推理,无需联网、账户或 API 密钥,数据不离开手机。

  • 云端模型可选增强:支持连接 OpenAI、Anthropic、Google 等 API 获得更强推理能力,实时显示 token 消耗和成本。

  • 手机自动化控制:通过 Android 无障碍服务读取屏幕 UI 树,自主执行点击、滑动、输入文字、发送消息、打开应用等操作。

  • 上下文感知自动回复:监控 WhatsApp 等应用的消息通知,自动打开聊天界面阅读历史对话后生成智能回复。

  • 技能系统(Skills):提供预设可复用工作流,将通用工具组合成特定任务序列,如自动回复、晨间简报、智能转发。

  • 系统信息查询:实时报告电池状态、存储空间、手机温度、蓝牙状态、已安装应用、Android 版本等。

  • 多语言与设备兼容:界面支持英语、印地语、日语、德语、繁体中文,适配 Tensor G3/G4、骁龙 8 Gen 2+、天玑 9200+ 等芯片。

如何使用PokeClaw

  • 下载安装:从 GitHub Releases 获取 APK 文件安装 https://github.com/agents-io/PokeClaw,首次启动时自动下载约 2.6GB 的本地模型。

  • 授予权限:开启无障碍服务权限(必需,用于屏幕读取和操作)和通知访问权限(推荐,用于后台消息监控)。

  • 选择运行模式:本地模式无需任何配置即可使用,云端模式需在设置中填入 OpenAI、Anthropic 或 Google 的 API 密钥。

  • 聊天交互:在底部输入框用自然语言发送指令。

  • 任务卡片:在任务界面点击技能卡片(如”监控 WhatsApp 消息”或”发送消息”),填写联系人名称和内容后执行。

  • 后台运行:启用自动回复监控后保持应用在后台运行,AI 会自动检测新消息并执行回复流程。

PokeClaw的核心优势

  • 完全本地离线运行:基于 Google Gemma 4 模型在设备端直接推理,无需联网、无需账户、无需 API 密钥即可使用核心功能,所有数据处理均在手机内部完成,从根本上杜绝隐私泄露风险。

  • 隐私优先架构:本地模式下用户的屏幕内容、聊天记录、个人数据不会传输到任何外部服务器,敏感信息始终保留在设备端,实现真正的数据主权。

  • 上下文感知智能:自动回复功能不仅监控消息通知,还会主动打开聊天界面阅读完整对话历史,基于前文语境生成恰当回复,而非简单触发固定模板。

  • 技能系统(Skills):将通用工具(点击、滑动、输入等)组合成可复用的工作流(如自动回复、晨间简报),让小模型也能可靠执行复杂多步任务,同时支持用户自定义技能扩展。

  • 成本透明可控:云端模式实时显示 token 消耗和运行费用,支持设置软/硬预算上限,用户在复杂任务执行过程中可随时掌握资源使用情况。

  • 零门槛部署:不需要 root 权限,不需要开发者账号,APK 安装后即可使用,支持 Android 9+ 和 8GB 内存以上的主流设备,兼容 Tensor、骁龙、天玑等多种芯片平台。

PokeClaw关键信息和使用要求

  • 项目性质:开源 Android AI 自动化应用,采用 Apache 2.0 协议,由开发者 Nicole 独立开发并维护,代码托管于 GitHub(agents-io/PokeClaw)

  • 核心定位:全球首个实现完全本地离线运行的手机 AI 代理(On-device AI Agent),无需云端连接即可自主控制 Android 设备执行复杂任务

  • 技术基础:基于 Google Gemma 4 模型(通过 LiteRT-LM 运行时推理),支持原生工具调用(Tool Calling),模型大小约 2.6GB,纯本地推理无需 GPU 加速(CPU 可运行)

  • 运行模式:本地优先架构,默认离线运行保障隐私;可选接入 OpenAI、Anthropic、Google 等云端 API 增强复杂任务处理能力,支持会话中无缝切换模型

  • 控制方式:通过 Android 无障碍服务(Accessibility Service)获取屏幕 UI 树信息,AI 自主决策并执行点击、滑动、输入、发送消息等操作,形成闭环代理流程

  • 核心功能:上下文感知自动回复(支持 WhatsApp)、通知汇总、剪贴板分析、系统信息查询、跨应用操作,以及基于 Skills 架构的可复用工作流系统

  • 系统要求:Android 9.0 及以上版本,arm64 架构芯片,最低 8GB RAM(推荐 12GB+),至少 3GB 空闲存储空间(首次下载模型),无需 root 权限

  • 硬件性能:纯 CPU 设备可运行但启动约需 45 秒;推荐搭载 Tensor G3/G4(Pixel 8/9)、骁龙 8 Gen 2+、天玑 9200+ 等芯片的设备以获得秒级响应

  • 必要权限:必须授予无障碍服务权限(用于屏幕读取和自动化操作),建议授予通知访问权限(用于后台消息监控和自动回复功能)

  • 首次配置:安装 APK 后首次选择本地模式时自动下载约 2.6GB 模型文件;选择云端模式需在设置中配置对应 API 密钥(OpenAI、Anthropic、Google 等)

  • 语言支持:界面支持英语、印地语、日语、德语、繁体中文,技能系统支持任意语言的指令输入和应用操作

  • 网络需求:本地模式完全离线运行无需网络;云端模式需要联网连接对应 API 服务;模型下载需要稳定网络连接(支持断点续传)

PokeClaw的同类竞品分析

对比维度PokeClawHeyBroGoogle Project Astra
开发方Nicole / agents.io(独立开发者)

iamvaar-dev(独立开发者)

Google DeepMind(大厂)

开源协议Apache 2.0

未明确标注(Flutter/Kotlin 项目)

闭源(Google 内部项目)

运行模式本地优先(Gemma 4 离线运行)+ 可选云端

仅云端(需 Google AI Studio API 密钥)

云端为主(集成 Gemini)+ 端侧推理

手机控制方式Android 无障碍服务读取 UI 树并执行操作

悬浮窗权限 + 无障碍服务控制屏幕

系统级深度集成,自主控制应用和设置

模型支持Google Gemma 4(本地)+ OpenAI/Anthropic/Google(云端)

依赖 Google AI Studio 云端模型

Gemini 系列模型(云端+端侧)

隐私保护本地模式完全离线,数据不出设备

需上传屏幕数据至 Google AI Studio

数据上传至 Google 云端处理

功能范围WhatsApp 自动回复、通知汇总、跨应用操作、技能系统

通用设备自动化(基于自然语言指令)

实时环境理解、视觉辅助、跨应用任务、主动建议

硬件要求Android 9+,8GB+ RAM,arm64,3GB 存储

Android 设备(Flutter 跨平台),需悬浮窗权限

未公开具体配置,需较新 Android 设备

PokeClaw的应用场景

  • 消息自动化管理:监控 WhatsApp 等应用特定联系人消息自动上下文感知回复,支持错过电话后自动发送跟进短信,适用于驾车、会议等无法手动回复的场景,或帮助用户管理高频社交沟通。

  • 设备状态智能监控:实时检查电池健康度、存储空间占用、手机温度、蓝牙状态及已安装应用情况,自动分析并建议清理目标,适用于设备维护、性能优化和故障排查。

  • 跨应用信息检索与整合:在 YouTube 应用内搜索视频、查看 Twitter/X 趋势话题、在 Reddit 查找内容、复制邮件主题进行 Google 搜索,适用于需要快速获取多平台信息的调研和信息收集场景。

  • 个人日程与信息简报:执行晨间简报流程,自动打开天气应用读取温度、查看日历获取当日事件、统计未读邮件数量并生成摘要,适用于每日开始时的信息汇总和行程规划。

  • 隐私敏感数据处理:在完全离线模式下分析剪贴板内容、汇总通知信息、处理个人敏感数据,适用于对隐私要求极高的商务、医疗或法律场景,确保敏感信息不离开设备。

  • 无障碍操作辅助:通过自然语言指令让 AI 自主完成点击、滑动、输入等操作,帮助行动不便或视觉障碍用户更便捷地控制手机应用,降低智能手机使用门槛。

© 版权声明

相关文章