OpenLess:开源的 AI 语音输入工具,按住说话,松开成文
一句话定位
OpenLess 是一个开源的桌面语音输入工具:按住快捷键说话,松开后把语音转成经过 AI 润色的文字,并直接插入到当前光标位置。
基础信息卡片
| 项目 | 信息 |
|---|---|
| 项目名 | OpenLess |
| GitHub | https://github.com/appergb/openless |
| 官网 | https://openless.top |
| 项目定位 | 开源语音输入 + AI 润色工具 |
| 支持平台 | macOS 12+、Windows 10+ |
| 技术栈 | Tauri 2、Rust、React、TypeScript |
| 许可证 | MIT |
| 当前版本 | v1.2.21-tauri |
| GitHub 热度 | 约 900+ Stars |
解决什么问题
很多语音输入工具只是把语音转成逐字稿,结果常常还要手动删语气词、补标点、整理结构。
OpenLess 想解决的是:把口语直接变成可用的书面文字。
典型使用方式是,把光标放在 ChatGPT、Claude、Cursor、Notion、邮件、微信或 Slack 的输入框里,按下全局快捷键说一段话。OpenLess 会完成录音、语音识别、AI 润色,然后把处理后的文字插入到当前光标位置。如果目标输入框无法直接插入,它会自动复制到剪贴板,避免刚才说过的话丢失。
它尤其强调 AI prompt 模式:你可以随口描述需求,它帮你整理成结构清晰、约束明确的 prompt,再直接发给 ChatGPT、Claude 或 Cursor。
比如你口述:
我想让 ChatGPT 帮我写个 SQL,从 orders 表里查上个月的订单,按客户分组,金额倒序,要前十个。
OpenLess 可以整理成:
请帮我写一段 SQL,要求如下:
- 从 `orders` 表查询上个月的订单。
- 按客户分组。
- 按金额倒序排序。
- 只返回前 10 条。这类场景里,它不是简单“听写”,而是把口语变成更适合发送、提问或提交的文字。
核心功能
1. 全局快捷键语音输入
OpenLess 支持通过全局快捷键触发录音。用户可以把光标放在任意输入框里,然后按快捷键开始说话。项目当前支持按住说话和切换式录音两种方式,录音过程中也可以用 Esc 取消。
2. 多种输出模式
OpenLess 不是只输出原始转写,而是提供了几种处理方式:
- 原文:直接输出转写文字,不额外修改。
- 轻度润色:修正语气词、标点和明显错字,尽量保留原意。
- 清晰结构:把口语整理成结构化 prompt,适合直接发给 AI 工具。
- 正式表达:把口语转换成更正式的书面语。
其中“清晰结构”是它最有辨识度的模式,尤其适合经常写 AI prompt 的用户。
3. 直接插入当前光标位置
OpenLess 的目标不是成为一个新的笔记容器,而是减少输入成本。处理后的文字会直接落到当前应用的输入框里,例如浏览器、聊天工具、编辑器、文档工具等。
如果某些应用限制了直接写入,它会回退到复制到剪贴板,用户手动粘贴即可。
4. 词典和热词
项目提供词典能力,可以维护产品名、人名、专有名词等。启用后的词条会用于语音识别阶段的热词提示,也会在润色阶段作为语义参考。
这对经常输入英文产品名、技术名词、团队内部名称的用户会比较有用。
5. 历史记录和设置面板
OpenLess 提供主窗口,用来查看概览、历史、词典、风格和设置。用户可以回看每次录音的原始转写和润色结果,也可以调整语言、快捷键、模型凭据等配置。
6. 本地优先,自带服务凭据
类似工具很多是闭源订阅服务,用户的数据、词典和模型调用都沉淀在服务商账户里。
OpenLess 的思路是:应用开源,数据尽量保留在本机,用户自己配置语音识别和文本润色服务。当前支持火山引擎 ASR、OpenAI Whisper 兼容批式 ASR,以及 Ark / DeepSeek / OpenAI 兼容的 Chat Completions。
适合谁
OpenLess 比较适合这些用户:
- 经常给 ChatGPT、Claude、Cursor、Gemini 写 prompt 的人。
- 经常写邮件、需求说明、长消息,又不想一直打字的人。
- 希望用语音快速整理代码注释、commit message、PR 描述的开发者。
- 想要开源方案,不想完全依赖闭源订阅语音输入工具的人。
- macOS 或 Windows 桌面重度用户。
如果你的日常工作里有大量“把想法变成文字”的环节,OpenLess 会比较容易融入工作流。
快速上手
普通用户可以直接到 GitHub Releases 下载对应平台安装包:
- macOS:
OpenLess_<version>_aarch64.dmg - Windows:
OpenLess_<version>_x64-setup.exe
首次启动后需要授予必要权限。
macOS 用户需要:
- 授予麦克风权限。
- 授予辅助功能权限。
- 退出并重新打开 OpenLess。
- 在设置里填写 ASR 和 LLM 服务凭据。
Windows 用户需要:
- 授予麦克风权限。
- 在设置里确认全局快捷键监听正常。
- 填写 ASR 和 LLM 服务凭据。
开发者从源码运行大致如下:
git submodule update --init --recursive
cd openless-all/app
npm ci
npm run tauri dev项目当前活跃代码在 openless-all/app/,桌面端基于 Tauri 2,后端为 Rust,前端为 React / TypeScript。
结论
OpenLess 可以理解为一个开源版 AI 语音输入助手。
它不做问答,不帮你执行任务,也不试图变成另一个 AI 客户端。它专注做一件事:把你说的话变成更清楚、更适合发送或提问的文字,并放到当前输入框里。
对于经常写 prompt、长消息、邮件、需求说明或代码相关描述的人来说,这个方向很实用。开源、自带服务凭据、本地优先,再加上面向 AI prompt 的结构化整理,是 OpenLess 目前最值得关注的几个特点。
