OpenSpeech

按一下快捷键说话，文字就出现在光标所在的地方。

跨平台 AI 语音输入桌面应用 · Voice typing for every app.

简体中文 · English · 繁體中文

简介

OpenSpeech 是一款跨平台的桌面端语音输入工具：在任何应用、任何输入框，按一下快捷键开始说话，再按一下就把转写文字写到光标位置。Windows / macOS / Linux 三端同步发布。

说一段大白话，落到光标里就是结构化文档。 录音 → 转写 → AI 清洗，口误、语气词、自我纠错全部抹平，再按你想要的格式重排：

功能

把语音直接变成你想要的文字 按一下快捷键开始说话，再按一下结束，文字落在光标位置。说话时的"嗯啊呃"、口误、改口都会被 AI 整理成干净的文字，不是逐字打出来。VS Code、聊天框、邮件、终端全部通用。

想发什么语言就发什么语言 按翻译快捷键说一段中文，光标位置直接出英文（或日、韩、法、德、西、繁中）。也可以让它给你"原文 + 译文"两份。

开会自动整理纪要 长录音、自动按发言人分段、AI 一键生成 Markdown 纪要——决策、待办、关键讨论点都帮你列好，可以导出。中途断网会自动重连，时间轴不会断。

它知道你的专业 勾选你的领域（医学、法律、心理、编程、设计、金融…共 16 个），AI 整理时不会把术语改成"通俗近义词"。再加个人字典，把人名、品牌、专有名词补上，识别更稳。

想用自己的 API 也行 腾讯云、阿里百炼，或任何 OpenAI 协议兼容的 API，直接填进去就能用。密钥存在系统钥匙串里，不会上传服务器。

历史和用量都在本机 每次录音、AI 整理后的版本、当时在哪个 App 里——全部存本地，可翻看、复制、重转。还能看本月用了多久、哪个 App 用得最多。

快捷键随你改 听写、翻译听写、唤起主窗口、打开 AI 工具——四个快捷键都能改成你顺手的组合。会自动检测冲突，也会提醒你按到了系统占用的快捷键。

桌面应用该有的都有 托盘驻留、开机自启、应用内自动更新、三语界面、明暗主题跟随系统、电脑睡眠唤醒后不会被踢登录。

截图

安装

前往 Releases 下载对应平台安装包：

macOS：OpenSpeech_x.y.z_universal.dmg（macOS 10.15+）
Windows：OpenSpeech_x.y.z_x64-setup.exe
Linux：.AppImage / .deb / .rpm

首次启动需授予麦克风权限；macOS 还需要辅助功能（Accessibility）权限。

路线图

已实现

待开发

更多 STT 供应商接入：

快速开始

启动 OpenSpeech 并授予权限。
在任意输入框点击光标。
按一下快捷键开始说话——
- macOS：Fn + Ctrl
- Windows：Alt + Win
- Linux：Ctrl + Super
再按一下同样的快捷键结束，文字自动写入。

开发

技术栈：Tauri 2 · React 19 · TypeScript · Rust · Tailwind CSS 4。

git clone https://github.com/OpenLoaf/OpenSpeech.git
cd OpenSpeech
pnpm install
pnpm tauri dev

环境要求：Node.js ≥ 18、pnpm ≥ 9、Rust stable。平台依赖参见 Tauri 官方先决条件。

关于前端源码 前端源码托管在独立的私有仓库，通过 npm 包 @openloaf/openspeech-frontend 以预构建产物形式分发。pnpm install 会自动拉到 node_modules，pnpm tauri dev / pnpm tauri build 自动取用，无需额外步骤。 Tauri / Rust 部分（src-tauri/）以及构建脚本、桌面打包配置全部开源在本仓库。

贡献

欢迎提 Issue / Pull Request。较大改动建议先开 Issue 讨论方案。

许可证

个人、研究、教育、非营利组织等非商业用途可自由使用、修改和分发。如需商业授权（包括但不限于将本项目用于商业产品、SaaS 服务或闭源分发），请联系作者获取单独授权。

Name		Name	Last commit message	Last commit date
Latest commit History 266 Commits
.claude/skills		.claude/skills
.github/workflows		.github/workflows
.vscode		.vscode
docs		docs
landing		landing
patches		patches
public		public
scripts		scripts
src-tauri		src-tauri
.gitignore		.gitignore
.npmrc		.npmrc
LICENSE		LICENSE
README.md		README.md
components.json		components.json
index.html		index.html
landing.html		landing.html
package.json		package.json
pnpm-lock.yaml		pnpm-lock.yaml
promo.html		promo.html
tsconfig.json		tsconfig.json
tsconfig.node.json		tsconfig.node.json
vite.config.ts		vite.config.ts

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

OpenSpeech

简介

功能

截图

安装

路线图

已实现

待开发

快速开始

开发

贡献

许可证

About

Uh oh!

Releases 45

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

OpenSpeech

简介

功能

截图

安装

路线图

已实现

待开发

快速开始

开发

贡献

许可证

About

Topics

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases 45

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages