OpenLess:开源的 AI 语音输入工具,按住说话,松开成文

OpenLess:开源的 AI 语音输入工具,按住说话,松开成文

May 7, 2026

一句话定位

OpenLess 是一个开源的桌面语音输入工具:按住快捷键说话,松开后把语音转成经过 AI 润色的文字,并直接插入到当前光标位置。

基础信息卡片

项目信息
项目名OpenLess
GitHubhttps://github.com/appergb/openless
官网https://openless.top
项目定位开源语音输入 + AI 润色工具
支持平台macOS 12+、Windows 10+
技术栈Tauri 2、Rust、React、TypeScript
许可证MIT
当前版本v1.2.21-tauri
GitHub 热度约 900+ Stars

解决什么问题

很多语音输入工具只是把语音转成逐字稿,结果常常还要手动删语气词、补标点、整理结构。

OpenLess 想解决的是:把口语直接变成可用的书面文字

典型使用方式是,把光标放在 ChatGPT、Claude、Cursor、Notion、邮件、微信或 Slack 的输入框里,按下全局快捷键说一段话。OpenLess 会完成录音、语音识别、AI 润色,然后把处理后的文字插入到当前光标位置。如果目标输入框无法直接插入,它会自动复制到剪贴板,避免刚才说过的话丢失。

它尤其强调 AI prompt 模式:你可以随口描述需求,它帮你整理成结构清晰、约束明确的 prompt,再直接发给 ChatGPT、Claude 或 Cursor。

比如你口述:

我想让 ChatGPT 帮我写个 SQL,从 orders 表里查上个月的订单,按客户分组,金额倒序,要前十个。

OpenLess 可以整理成:

请帮我写一段 SQL,要求如下:

- 从 `orders` 表查询上个月的订单。
- 按客户分组。
- 按金额倒序排序。
- 只返回前 10 条。

这类场景里,它不是简单“听写”,而是把口语变成更适合发送、提问或提交的文字。

核心功能

1. 全局快捷键语音输入

OpenLess 支持通过全局快捷键触发录音。用户可以把光标放在任意输入框里,然后按快捷键开始说话。项目当前支持按住说话和切换式录音两种方式,录音过程中也可以用 Esc 取消。

2. 多种输出模式

OpenLess 不是只输出原始转写,而是提供了几种处理方式:

  • 原文:直接输出转写文字,不额外修改。
  • 轻度润色:修正语气词、标点和明显错字,尽量保留原意。
  • 清晰结构:把口语整理成结构化 prompt,适合直接发给 AI 工具。
  • 正式表达:把口语转换成更正式的书面语。

其中“清晰结构”是它最有辨识度的模式,尤其适合经常写 AI prompt 的用户。

3. 直接插入当前光标位置

OpenLess 的目标不是成为一个新的笔记容器,而是减少输入成本。处理后的文字会直接落到当前应用的输入框里,例如浏览器、聊天工具、编辑器、文档工具等。

如果某些应用限制了直接写入,它会回退到复制到剪贴板,用户手动粘贴即可。

4. 词典和热词

项目提供词典能力,可以维护产品名、人名、专有名词等。启用后的词条会用于语音识别阶段的热词提示,也会在润色阶段作为语义参考。

这对经常输入英文产品名、技术名词、团队内部名称的用户会比较有用。

5. 历史记录和设置面板

OpenLess 提供主窗口,用来查看概览、历史、词典、风格和设置。用户可以回看每次录音的原始转写和润色结果,也可以调整语言、快捷键、模型凭据等配置。

6. 本地优先,自带服务凭据

类似工具很多是闭源订阅服务,用户的数据、词典和模型调用都沉淀在服务商账户里。

OpenLess 的思路是:应用开源,数据尽量保留在本机,用户自己配置语音识别和文本润色服务。当前支持火山引擎 ASR、OpenAI Whisper 兼容批式 ASR,以及 Ark / DeepSeek / OpenAI 兼容的 Chat Completions。

适合谁

OpenLess 比较适合这些用户:

  • 经常给 ChatGPT、Claude、Cursor、Gemini 写 prompt 的人。
  • 经常写邮件、需求说明、长消息,又不想一直打字的人。
  • 希望用语音快速整理代码注释、commit message、PR 描述的开发者。
  • 想要开源方案,不想完全依赖闭源订阅语音输入工具的人。
  • macOS 或 Windows 桌面重度用户。

如果你的日常工作里有大量“把想法变成文字”的环节,OpenLess 会比较容易融入工作流。

快速上手

普通用户可以直接到 GitHub Releases 下载对应平台安装包:

  • macOS:OpenLess_<version>_aarch64.dmg
  • Windows:OpenLess_<version>_x64-setup.exe

首次启动后需要授予必要权限。

macOS 用户需要:

  1. 授予麦克风权限。
  2. 授予辅助功能权限。
  3. 退出并重新打开 OpenLess。
  4. 在设置里填写 ASR 和 LLM 服务凭据。

Windows 用户需要:

  1. 授予麦克风权限。
  2. 在设置里确认全局快捷键监听正常。
  3. 填写 ASR 和 LLM 服务凭据。

开发者从源码运行大致如下:

git submodule update --init --recursive

cd openless-all/app
npm ci
npm run tauri dev

项目当前活跃代码在 openless-all/app/,桌面端基于 Tauri 2,后端为 Rust,前端为 React / TypeScript。

结论

OpenLess 可以理解为一个开源版 AI 语音输入助手。

它不做问答,不帮你执行任务,也不试图变成另一个 AI 客户端。它专注做一件事:把你说的话变成更清楚、更适合发送或提问的文字,并放到当前输入框里

对于经常写 prompt、长消息、邮件、需求说明或代码相关描述的人来说,这个方向很实用。开源、自带服务凭据、本地优先,再加上面向 AI prompt 的结构化整理,是 OpenLess 目前最值得关注的几个特点。

标签
相关文章
基于标签推荐
关注公众号
微信公众号二维码