Skip to content

语音或文字,自然输入

ClawPaw 将复杂的配置层从交互中移除。你无需编写脚本、设计工作流,也不必拼接 API。只需用自然语言表达你想完成的事情——无论是打字还是语音——ClawPaw 会结合当前的操作系统环境进行理解与处理。

由于运行在 OS 层级,ClawPaw 可以直接感知你的工作状态。你不需要手动提供文件路径、复制链接,或解释自己正在使用哪个应用。如果你在某个目录中,它可以识别;如果你正在浏览某个网页,它也能理解当前可见内容。上下文无需重新拼接或额外说明。

这种方式减少了额外的思考成本。你关注的是目标本身,而不是如何组织指令。

语音交互

在启用麦克风权限后,你可以:

  • 通过全局快捷键唤起 ClawPaw
  • 以自然语句进行表达,无需命令格式
  • 让系统完成转写,并在所选自主模式下执行任务

语音输入与文字输入的行为一致。它不会赋予额外权限,也不会绕过既有的安全边界。只有在你主动触发时才会开始录音,不存在被动监听。

工作机制

当你提交一个请求时,ClawPaw 会进行结构化处理:

  1. 意图识别

    解析自然语言输入,明确任务目标。

  2. 上下文读取

    读取与当前任务相关的系统环境,例如:

    • 当前工作目录
    • 正在使用的应用
    • 前台浏览器标签页
    • 已授权的系统服务
  3. 生成执行计划

    根据所选自主模式,构建分步骤执行方案。

  4. 权限校验

    所有操作都会受到以下限制:

    • 授权目录范围
    • 已授予的系统权限
    • 当前执行模式
  5. 执行或提案

    根据模式(Explore、Ask、Execute),进行分析、提出修改建议,或直接执行操作。

这种分层处理机制确保系统在具备理解能力的同时,仍然处于可控范围内。

你无需再做的事

与面向开发者的 Agent 框架不同,你不需要:

  • 复制粘贴链接
  • 明确写出文件路径
  • 手动配置模块能力
  • 将语言整理成命令式格式

ClawPaw 理解的是你真实的工作环境,而不仅仅是文本输入。