Physical Address
304 North Cardinal St.
Dorchester Center, MA 02124
Physical Address
304 North Cardinal St.
Dorchester Center, MA 02124

OpenLess 是 MIT 開源的語音輸入工具(Rust+Tauri,GitHub 約 2,533 顆星,macOS/Windows),按住快捷鍵說話、鬆開即得 AI 潤色後的文字,串流逐字插入游標位置。它能把鬆散口述整理成帶脈絡與限制的結構化 Prompt,便於貼進 ChatGPT、Claude、Cursor;內建 Style Pack 市集可自訂輸出風格。定位是付費的 Wispr Flow、Typeless 的開源替代:本機優先、自帶雲端憑證、不綁訂閱。它只潤色你的話、不替你回答。要留意預設語音辨識與模型是火山引擎與 DeepSeek 相容服務,非中國用戶需自備替代憑證。
用 AI 摘要這篇文章:
OpenLess 是一套開源的語音輸入工具,做法很直觀:按住快捷鍵、把想說的話說出來(夾雜「呃」「所以」這些口語雜訊也沒關係),鬆開按鍵,AI 潤色過的文字就出現在你的游標位置,而且是出現在你當下使用的任何應用程式裡。它在 GitHub 有兩千五百多顆星,MIT 授權,用 Rust 加 Tauri 寫成,支援 macOS 與 Windows。它最有意思的一點不是「把語音轉成文字」,而是它把口述整理成可以直接貼進 ChatGPT、Claude、Cursor 使用的結構化內容,而且只清理你的話、不替你回答。

TL;DR:OpenLess(GitHub 兩千五百多顆星,MIT 開源,Rust 2021+Tauri 2,2026 年 4 月開張、6 月底仍活躍更新)是 macOS/Windows 的開源語音輸入工具。按住快捷鍵說話、鬆開即得潤色後的文字,串流逐字插入游標位置。它能把鬆散口述整理成帶脈絡、限制與需求的結構化 Prompt,便於貼進〈ChatGPT〉、〈Claude〉或 Cursor;內建 Style Pack 市集可自訂輸出風格(冷郵件、commit 訊息、正式報告等)。定位是付費的 Wispr Flow、Typeless 的開源替代:本機優先、自帶雲端憑證、不綁訂閱。要留意的是它預設搭配的語音辨識與語言模型是火山引擎(Volcengine)與 DeepSeek 相容服務,非中國用戶需自備替代憑證。
目錄
很多 AI 工具會把你的輸入當成問題、直接生成答案。OpenLess 刻意不走這條路:它的模型只負責清理你說的話,不會無中生有。舉個例子,你對著它說「這個 app 還缺什麼功能?」,它輸出的是一句整理過的提問,而不是直接丟給你一份功能清單;想要答案,再拿這句話去問 AI 本身就好。這層「只潤色、不代答」的設計,是它和一般 AI 助手最根本的差別,也是它適合拿來「構思 Prompt」這件事的根本原因。
這個邊界劃得很實際。AI 代答工具的問題在於,它常常把你想問的問題直接「解掉」,回你一個它以為你要的答案,但你其實只是想把念頭整理清楚、交給另一個 AI 去發揮;OpenLess 把自己限制在「整理你的話」這一步,反而讓它在 Prompt 構思的情境裡更可靠。你腦中浮現的是一團還沒成形的想法,它幫你把那團想法梳成結構完整的提問或草稿,至於接下來要怎麼發展,主導權還在你手上。對依賴 ChatGPT、Claude 這類工具工作的人,這種「只負責把輸入弄好、不搶著輸出」的分工,反而更順手。
實際效果可以用它官網給的例子感受:按住鍵,口述一段夾雜語助詞、順序混亂的客戶回覆構想(交期太緊想延兩週、報價比預期高兩成想談、整體仍抱持正面),鬆開後,游標處出現的是一份條理分明的回覆草稿,把「交期」和「預算」分點列出、語氣維持禮貌。這段文字幾乎不用再改,直接貼進 ChatGPT 或 Claude 就能讓它接手起草信件。整個流程的核心是:用說的構思 Prompt,比用打的更快也更完整。
OpenLess 有一個針對 AI 應用調整過的「結構化模式」。它把你鬆散的口述重新塑形成一份完整的 Prompt,自動補上脈絡、限制條件與具體需求,讓你貼進 ChatGPT、Claude、Cursor 或 Gemini 時,模型一拿到就懂你要什麼,不用再自己手動把零散想法重組成清楚的提問。對習慣用語音邊想邊講的人,這等於把你腦中還沒成形的念頭,直接翻譯成 AI 看得懂的好提問。
這個能力在幾個情境特別實用:寫給 ChatGPT 或 Claude 的長 Prompt、起草規格檔案或冗長的訊息、寫程式註解與 commit 訊息、〈Claude Code〉那類開發場景裡把想法快速落在游標上。原本你得打字反覆修改才成形的內容,改成說的反而更順;對開發者,把這套流程接進日常的〈CodexBar〉那類工作流,等於多了一個用語音加速的文字輸入端。
把使用場景再展開一點:客服或業務回郵件時,用說的把「要安撫客戶、要談這幾個條件、語氣別太衝」講一遍,OpenLess 吐出來的就是結構清楚的草稿,再交給 AI 細修;寫 PR 描述或 commit 訊息時,把這次改了什麼、為什麼這樣改口述進去,它整理成開發者讀得懂的條列說明;做內容的人構思貼文,用說的把想法倒出來,它潤成符合該平台語氣的初稿。共同點是:把「打字+反覆修改」這段最耗神的部分,換成更接近思考速度的「說話」。
OpenLess 在內建的潤色模式之外,還讓你用 Style Pack 進一步自訂輸出風格。一個 Style Pack 就是一組帶專屬系統提示詞的輸出樣式,你可以針對不同任務建立不同 pack:冷淡的工程 commit 訊息、溫暖的客戶回覆、正式報告、社群貼文,都能各有各的 pack,並用快捷鍵在它們之間切換。風格愈貼合你真正的任務,輸出就愈接近你心裡想的那個樣子。
更有競爭力的是它內建市集,你能一鍵安裝社群做的 Style Pack,也能把自己的 pack 發布出去分享。對團隊來說,這意味著可以統一一套「自家語氣」的 pack,每個成員說出來的草稿都自動符合團隊的書寫慣例;對個人,則是把工具調成完全順手的那個樣子,而不是被迫適應廠商給定的單一風格。

具體一點想像 pack 的用法:工程師可以建一個「簡潔 commit 訊息」pack,系統提示詞設成「只寫類型加一行摘要,不超過五十字」,說完一段改動經過,它就吐出規規矩矩的 commit 訊息;業務可以建一個「禮貌回客戶」pack,把口語化的抱怨自動轉成得體的商業回覆;做社群內容的人,則能用專為某平台語氣調過的 pack,把構思直接產成貼文初稿。pack 切換靠快捷鍵,等於一個工具就能在不同書寫情境之間瞬間變換,這是固定單一風格的聽寫工具做不到的。
使用體驗上,OpenLess 採用串流插入:文字在潤色的同時逐字流向游標,而不是等整段完成才一次吐出,體感延遲大幅降低,聽寫幾乎跟著思考的速度走。遇到無法接受串流按鍵輸入的應用程式,它會自動退回一次性貼上,確保在每個軟體裡都能用,不會因為目標程式不相容串流就卡住。

資料處理上有個邊界要先把話講清楚。OpenLess 是「本機優先」,指的是客戶端、你的聽寫歷史、個人詞典與 API 憑證都存在自己機器上;但這並不等於「資料完全不外送」。它預設的語音辨識是火山引擎的雲端串流 ASR、潤色模型是 DeepSeek/Ark 相容的雲端 LLM,也就是說,走預設設定時,你的音檔與轉寫文字會送往對應的雲端供應商處理。想要音檔完全不離開機器,需要改接本機 ASR(專案有打包 Qwen3-ASR 可選)與本機模型,這條路可行,但不是開箱預設。
所以它相對於訂閱制聽寫服務的隱私優勢,精確地說是「資料與憑證在你手上、你能選擇接哪種供應商(包含完全本機)」,而不是「絕對不外送」。這對在意隱私、或想把聽寫流程搬進公司內部環境的人仍是實質優勢,前提是你願意花功夫把預設的雲端服務換成本機或自選供應商。換句話說,OpenLess 免費的是軟體本身,語音辨識與語言模型的呼叫成本並不免費:接雲端就照供應商計費,接本機模型則吃你機器的算力與設定工夫。
技術上它用 Rust 2021 搭配 Tauri 2 打造,支援 macOS 12 與 Windows 10 以上(Linux 目前只列在 GitHub 主題標籤,README 並未提供 Linux 安裝包或將它列為正式支援平台)。Tauri 2 加 Rust 的組合,相較於 Electron 架構,通常能帶來較小的安裝包與較低的資源佔用,這對一個得整天掛在系統列、隨時等你想說話就啟動的聽寫工具來說,是架構上的先天優勢。
OpenLess 最常被拿來和 Wispr Flow、Typeless 這類 AI 聽寫訂閱制服務比較。它們提供相近的「說話即得潤色文字」體驗,但走的是月費模式、不能自帶模型、音檔上傳廠商、個人詞典與使用習慣存在廠商帳號裡。OpenLess 走的是同一條終端體驗,但用開源與本機優先來換取掌控權:免月費、可自帶憑證、資料不外送、風格可完全自訂。把幾個關鍵維度擺在一起看更清楚:
| 項目 | OpenLess | Wispr Flow/Typeless |
|---|---|---|
| 授權 | 開源(MIT) | 閉源訂閱制 |
| 計費 | 自有 API 成本 | 月費 |
| 音檔與資料 | 本機優先 | 上傳廠商 |
| 模型 | 自帶憑證 | 廠商提供 |
| 輸出風格 | Style Pack 完全自訂 | 依官方方案(以其說明為準) |
從長期成本看,兩條路的帳算法不同。訂閱制工具是固定的月費,用得多用得少都一樣價,對重度使用者划算,但一旦停繳就什麼都沒了;OpenLess 的成本取決於你呼叫 API 的量與你選的供應商,用量小時幾乎免費,用量大時則要自己盯帳單。對已經有慣用 API 供應商、或聽寫量不穩定的人,這種按量計費加完全掌控的模式,長期通常比月費彈性更大,前提是你得自己管理憑證與額度。
取捨也很實際。付費工具通常開箱即用、模型與基礎設施都包好,適合不想管設定的人;OpenLess 則要求你自行準備語音辨識與語言模型的 API 憑證,門檻略高,但換來的是成本可控與完全自主。對願意花一點設定時間、又在意隱私與成本的人,OpenLess 的開源路線通常更划算。
誠實講一個設定細節:OpenLess 預設搭配的語音辨識是火山引擎(Volcengine,字節跳動)的串流 ASR,語言模型則是 DeepSeek/Ark 相容的對話完成服務。換句話說,它開箱預設走的雲端服務都是中國的。對在中國的使用者這很順手;但對台灣或其他地區的使用者,意味著你得自備替代的 API 憑證(語言模型端因為是 DeepSeek 相容介面,彈性較大,凡介面相容的服務都能接;語音辨識端則要看專案是否支援其他 ASR 供應商,設定時建議先確認)。
這並不影響它作為開源工具的價值:正因為它本機優先、可自帶憑證,你才能把預設的中國服務換成自己信任的供應商。但「裝了就能直接用」的前提,是你要先備好一套不在預設清單裡的 ASR 與 LLM 憑證,這點在使用前要有心理準備。
OpenLess 最對口的是兩種人。一是大量構思 Prompt 或文字、但偏好用說的而非用打的人,無論是寫給 ChatGPT/Claude 的提問、起草郵件與規格、還是開發時寫 commit 訊息與 PR 描述,用語音邊想邊講通常比盯著鍵盤順。二是在意隱私與成本、不想被聽寫訂閱制綁住的人:開源、本機優先、自帶憑證這幾項加起來,等於把聽寫這件事從「月費服務」變成「自有工具」。
它的門檻在於要自備 API 憑證與一點初始設定,不像付費工具那樣裝了即用;但相對地,它給你的是完全的掌控與可訂製。把它理解成「開源、可自架風格的 Wispr Flow」,大概就抓準了它的位置。對願意花一個下午把憑證與風格 pack 調好的人,接下來每一天的聽寫體驗都會貼著你自己的工作習慣走,這是任何訂閱制服務都給不了的客製化程度。想試用,可以從 GitHub 的 release 頁下載 macOS 或 Windows 安裝包(macOS 首次開啟可能要繞過 Gatekeeper),或到 openless.top看官方介紹與設定說明。
