Windows语音唤醒助手
最近闲着无聊随便做了一个windows的语音唤醒助手,主要是闲平常要出门,或者不方便的时候(比如运动、躺床上的时候),可以叫一声电脑就做我想让他做的内容(可以连接LLM/GUI agent/MCP等等)。 再加上现在GUIAgent发展的很快,网上还没有语音唤醒形式的链接,也就自己搭了一个出来。 下面是这个项目的readme。 WinAssistant – Windows 本地语音唤醒与自动化执行 一个在 Windows 上运行的本地语音助手: 说出唤醒词 → 识别你的语音 → 自动执行自定义动作(脚本、GUI Agent、MCP 等)。 全离线(唤醒+识别均可离线),即插即用,优先使用耳机麦克风。 演示视频 https://github.com/user-attachments/assets/a48b8e94-8b95-46eb-9aa5-a4085c2341c4 ✨ 核心特性 多唤醒词可选 / 可自定义 内置多种常见唤醒词,也可替换为你训练的 .ppn 文件。 本地唤醒:Picovoice Porcupine 轻量、低延迟、可靠,离线运行。 语音识别:fast-whisper 内置去噪、VAD 端点检测,自动判断“用户是否说完”,可按需调节模型大小(速度/准确度权衡)。 自动音频设备选择 自动选择可用的输入/输出设备,优先耳机。 可插拔“处理态” 识别到文本后进入你的“处理态”(可自定义),例如: 调用 MCP / 工具调用 触发 GUI Agent 执行脚本、打开应用、查询信息等 🧠 工作流 / 状态机 stateDiagram-v2 [*] --> 空闲态 空闲态 --> 唤醒态: 语音唤醒 唤醒态 --> 处理态: 用户语音结束 处理态 --> 空闲态 唤醒态 --> 空闲态: 用户长时间无应答 空闲态 --> 空闲态: (持续监听) 说明:唤醒后进入实时听写;若检测到长时间静音则回退到空闲态。 ...