语音或文字,自然输入
ClawPaw 将复杂的配置层从交互中移除。你无需编写脚本、设计工作流,也不必拼接 API。只需用自然语言表达你想完成的事情——无论是打字还是语音——ClawPaw 会结合当前的操作系统环境进行理解与处理。
由于运行在 OS 层级,ClawPaw 可以直接感知你的工作状态。你不需要手动提供文件路径、复制链接,或解释自己正在使用哪个应用。如果你在某个目录中,它可以识别;如果你正在浏览某个网页,它也能理解当前可见内容。上下文无需重新拼接或额外说明。
这种方式减少了额外的思考成本。你关注的是目标本身,而不是如何组织指令。
语音交互
在启用麦克风权限后,你可以:
- 通过全局快捷键唤起 ClawPaw
- 以自然语句进行表达,无需命令格式
- 让系统完成转写,并在所选自主模式下执行任务
语音输入与文字输入的行为一致。它不会赋予额外权限,也不会绕过既有的安全边界。只有在你主动触发时才会开始录音,不存在被动监听。
工作机制
当你提交一个请求时,ClawPaw 会进行结构化处理:
意图识别
解析自然语言输入,明确任务目标。
上下文读取
读取与当前任务相关的系统环境,例如:
- 当前工作目录
- 正在使用的应用
- 前台浏览器标签页
- 已授权的系统服务
生成执行计划
根据所选自主模式,构建分步骤执行方案。
权限校验
所有操作都会受到以下限制:
- 授权目录范围
- 已授予的系统权限
- 当前执行模式
执行或提案
根据模式(Explore、Ask、Execute),进行分析、提出修改建议,或直接执行操作。
这种分层处理机制确保系统在具备理解能力的同时,仍然处于可控范围内。
你无需再做的事
与面向开发者的 Agent 框架不同,你不需要:
- 复制粘贴链接
- 明确写出文件路径
- 手动配置模块能力
- 将语言整理成命令式格式
ClawPaw 理解的是你真实的工作环境,而不仅仅是文本输入。
