OpenLess – 开源 AI 语音输入法,口语自动转为结构化文本

Al项目 2026-05-05 15:00:03 AI导航网

OpenLess是什么

OpenLess 是基于 Rust + Tauri + React + TypeScript 构建的完全开源跨平台语音输入应用,支持macOS & Windows,按住全局快捷键说话即可自动完成录音、ASR 转写、AI 润色,并将结果直接插入当前光标位置;对标 Typeless、Wispr Flow、Lazy、Superwhisper 等商业订阅制语音输入工具。

OpenLess的主要功能

  • 全局语音输入:在任意应用(ChatGPT、Claude、Cursor、Notion、邮件、聊天框等)的输入框中,通过全局快捷键触发录音,松开后自动处理并插入文本。

  • AI Prompt 模式:核心差异化功能。不只是语音转文字,而是将零散口语自动整理成结构化、带约束、有上下文的 AI Prompt,可直接喂给 ChatGPT / Claude / Cursor 使用。

  • 多种输出模式:支持「原文」「轻度润色」「清晰结构(AI Prompt 模式)」「正式表达」四种模式切换 。

  • 双模式录音:支持「切换式」和「按住说话」两种录音方式,任意阶段按 Esc 可取消。

  • 剪贴板兜底:若无法直接插入光标位置,结果会自动复制到剪贴板,确保内容不丢失。

  • 词典与热词:支持自定义专有名词、产品名、人名词典,作为 ASR 热词注入并在润色阶段进行语义修正。

  • 应用内自动更新:通过 Tauri updater 实现客户端自动检查并下载安装更新 。

如何使用OpenLess

  • 从 GitHub Releases 下载对应平台安装包macOS 用户下载 .dmg 拖入 /ApplicationsWindows 用户下载 .exe 运行安装程序。

  • macOS 首次启动:依次授予「麦克风」和「辅助功能」权限,退出并重新打开应用(辅助功能权限需重启生效);Windows 首次启动授予麦克风权限后,在设置中确认全局快捷键监听已激活。

  • 应用设置:填入火山引擎流式 ASR凭据(APP ID、Access Token、Resource ID)以及润色模型凭据(Ark / DeepSeek / OpenAI 兼容的 API Key、Model ID、Endpoint)。

  • 开始录音:将光标放入任意输入框(ChatGPT、Claude、Cursor、Notion、邮件、聊天框等),按下预设的全局快捷键开始录音;支持「切换式」和「按住说话」两种录音模式。对着麦克风自然说话,OpenLess 实时完成录音与 ASR 转写;松手后自动进入 AI 润色阶段,按你选择的模式处理文本。

  • AI润色:润色完成后结果自动插入当前光标位置;若目标应用阻止直接插入,则自动降级复制到剪贴板,确保内容不丢失。任意阶段(包括录音中、润色中、插入前)按 Esc 即可取消当前任务。

  • 在主窗口切换 4 种输出模式:「原文」「轻度润色」「结构化(AI Prompt 模式)」「正式表达」,满足不同场景的书面表达需求。

  • 添加专有名词:在「词典」页面手动添加专有名词、产品名、人名等,系统会将其作为 ASR 热词注入,并在润色阶段根据上下文自动进行语义修正。

  • 开发者构建:克隆仓库后进入 openless-all/app/ 目录,执行 npm ci 安装依赖,再运行 npm run tauri dev 即可进入开发调试模式。

OpenLess的官网地址

  • 官网地址:https://openless.top/
  • Github仓库:https://github.com/appergb/openless

OpenLess的关键信息和使用要求

  • 定位:macOS & Windows 跨平台开源语音输入工具,对标 Typeless / Wispr Flow / Superwhisper 等闭源订阅产品。

  • 核心模式:按住全局快捷键说话 → 录音 → ASR 转写 → LLM 润色 → 自动插入光标位置;核心差异化是 AI。 Prompt 模式,可将口语直接整理成结构化 Prompt。

  • 技术栈:Tauri 2(Rust 后端)+ React + TypeScript。

  • 当前版本:v1.2,支持切换式 / 按住说话两种录音方式,4 种输出模式(原文 / 轻度润色 / 结构化 / 正式),中英双语 UI,应用内自动更新。

  • 凭据要求:需自备火山引擎流式 ASR + Ark / DeepSeek / OpenAI 兼容的 Chat Completions 服务。

  • License:MIT。

OpenLess的核心优势

  • 完全开源、本地优先:代码在 GitHub 公开,所有数据写在本地,不强绑某家模型或 ASR 服务商 。

  • 自带云凭据:用户自行配置火山引擎 ASR + Ark / DeepSeek 等兼容 OpenAI 格式的 Chat Completions 服务,隐私可控 。

  • 不会替你回答:润色模型只做文本整理,不做问答、任务执行或项目分析,避免”越俎代庖” 。

  • 中英双语 UI:支持简体中文与 English 切换,首次启动按系统语言自动适配 。

OpenLess的同类竞品对比

对比维度OpenLessTypelessWispr Flow
开源/闭源完全开源(MIT License)闭源商业软件闭源商业软件
支持平台macOS、WindowsMac、Windows、iOS、Android、WebMac、Windows、iOS、Android
定价模式免费免费版 4,000–8,000 词/周;Pro $30/月 或 $144/年

免费版 2,000 词/周;Pro $15/月 或 $144/年;Teams $12/用户/月

ASR/LLM 处理方式自备火山引擎流式 ASR + Ark / DeepSeek / OpenAI 兼容 Chat Completions云端 AI 统一处理云端处理(OpenAI、Meta 等)

隐私架构本地优先,所有数据存在本地,无供应商锁仓纯云端,音频上传至供应商服务器,未公开是否用于模型训练

纯云端;存在截取活动窗口截图传输至云端的行为(用于上下文感知),引发隐私争议

核心差异化功能AI Prompt 模式:将口语自动整理为结构化 Prompt;自定义词典热词注入;剪贴板兜底插入跨平台覆盖最广;免费额度在同类中最慷慨上下文感知格式化:根据应用自动调整语气(Slack casual / 邮件 professional);Command Mode 语音编辑;Whisper Mode

离线能力否(需联网调用 ASR 与 LLM)否(纯云端,断网即停止)

否(纯云端,无离线模式)

语言支持中英双语 UI多语言自动检测100+ 语言,支持代码切换

录音限制无明确时长限制单次录音上限 6 分钟

未明确公开时长限制

OpenLess的应用场景

  • 为 AI 工具生成结构化 Prompt:口述一个模糊需求,OpenLess 自动将其整理成带约束、有上下文的详细 Prompt,直接插入对话框使用。

  • 起草邮件、需求文档:去除口语填充词、修正标点符号、重新组织段落,把随口说的话变成书面表达。

  • 编写代码注释、PR 描述:将脑海中的思路直接转为规范、简洁的文本,插入到 IDE 或 Git 工具的光标处。

  • 任何”不想打字但必须输出文字”的场景:如填写表单、撰写社交媒体帖子、做会议速记整理等,按住快捷键说话即可。

© 版权声明

相关文章