OpenLess 開源語音輸入工具：說話變結構化 Prompt，Wispr Flow 的開源替代

Facebook Line Messenger Telegram

OpenLess 是一套開源的語音輸入工具，做法很直觀：按住快捷鍵、把想說的話說出來（夾雜「呃」「所以」這些口語雜訊也沒關係），鬆開按鍵，AI 潤色過的文字就出現在你的游標位置，而且是出現在你當下使用的任何應用程式裡。它在 GitHub 有兩千五百多顆星，MIT 授權，用 Rust 加 Tauri 寫成，支援 macOS 與 Windows。它最有意思的一點不是「把語音轉成文字」，而是它把口述整理成可以直接貼進 ChatGPT、Claude、Cursor 使用的結構化內容，而且只清理你的話、不替你回答。

OpenLess 官方網站首頁截圖，呈現按住快捷鍵說話、鬆開後取得 AI 潤色文字的核心流程 — OpenLess 官網首頁呈現按住快捷鍵說話、鬆開後取得 AI 潤色文字的核心流程（圖片來源：OpenLess 官方網站 openless.top）。

TL;DR：OpenLess（GitHub 兩千五百多顆星，MIT 開源，Rust 2021＋Tauri 2，2026 年 4 月開張、6 月底仍活躍更新）是 macOS／Windows 的開源語音輸入工具。按住快捷鍵說話、鬆開即得潤色後的文字，串流逐字插入游標位置。它能把鬆散口述整理成帶脈絡、限制與需求的結構化 Prompt，便於貼進〈ChatGPT〉、〈Claude〉或 Cursor；內建 Style Pack 市集可自訂輸出風格（冷郵件、commit 訊息、正式報告等）。定位是付費的 Wispr Flow、Typeless 的開源替代：本機優先、自帶雲端憑證、不綁訂閱。要留意的是它預設搭配的語音辨識與語言模型是火山引擎（Volcengine）與 DeepSeek 相容服務，非中國用戶需自備替代憑證。

它做的是「潤色你的話」，不是「替你回答」

很多 AI 工具會把你的輸入當成問題、直接生成答案。OpenLess 刻意不走這條路：它的模型只負責清理你說的話，不會無中生有。舉個例子，你對著它說「這個 app 還缺什麼功能？」，它輸出的是一句整理過的提問，而不是直接丟給你一份功能清單；想要答案，再拿這句話去問 AI 本身就好。這層「只潤色、不代答」的設計，是它和一般 AI 助手最根本的差別，也是它適合拿來「構思 Prompt」這件事的根本原因。

這個邊界劃得很實際。AI 代答工具的問題在於，它常常把你想問的問題直接「解掉」，回你一個它以為你要的答案，但你其實只是想把念頭整理清楚、交給另一個 AI 去發揮；OpenLess 把自己限制在「整理你的話」這一步，反而讓它在 Prompt 構思的情境裡更可靠。你腦中浮現的是一團還沒成形的想法，它幫你把那團想法梳成結構完整的提問或草稿，至於接下來要怎麼發展，主導權還在你手上。對依賴 ChatGPT、Claude 這類工具工作的人，這種「只負責把輸入弄好、不搶著輸出」的分工，反而更順手。

實際效果可以用它官網給的例子感受：按住鍵，口述一段夾雜語助詞、順序混亂的客戶回覆構想（交期太緊想延兩週、報價比預期高兩成想談、整體仍抱持正面），鬆開後，游標處出現的是一份條理分明的回覆草稿，把「交期」和「預算」分點列出、語氣維持禮貌。這段文字幾乎不用再改，直接貼進 ChatGPT 或 Claude 就能讓它接手起草信件。整個流程的核心是：用說的構思 Prompt，比用打的更快也更完整。

把口述整理成結構化 Prompt

OpenLess 有一個針對 AI 應用調整過的「結構化模式」。它把你鬆散的口述重新塑形成一份完整的 Prompt，自動補上脈絡、限制條件與具體需求，讓你貼進 ChatGPT、Claude、Cursor 或 Gemini 時，模型一拿到就懂你要什麼，不用再自己手動把零散想法重組成清楚的提問。對習慣用語音邊想邊講的人，這等於把你腦中還沒成形的念頭，直接翻譯成 AI 看得懂的好提問。

這個能力在幾個情境特別實用：寫給 ChatGPT 或 Claude 的長 Prompt、起草規格檔案或冗長的訊息、寫程式註解與 commit 訊息、〈Claude Code〉那類開發場景裡把想法快速落在游標上。原本你得打字反覆修改才成形的內容，改成說的反而更順；對開發者，把這套流程接進日常的〈CodexBar〉那類工作流，等於多了一個用語音加速的文字輸入端。

把使用場景再展開一點：客服或業務回郵件時，用說的把「要安撫客戶、要談這幾個條件、語氣別太衝」講一遍，OpenLess 吐出來的就是結構清楚的草稿，再交給 AI 細修；寫 PR 描述或 commit 訊息時，把這次改了什麼、為什麼這樣改口述進去，它整理成開發者讀得懂的條列說明；做內容的人構思貼文，用說的把想法倒出來，它潤成符合該平台語氣的初稿。共同點是：把「打字＋反覆修改」這段最耗神的部分，換成更接近思考速度的「說話」。

Style Pack：自訂輸出風格與市集

OpenLess 在內建的潤色模式之外，還讓你用 Style Pack 進一步自訂輸出風格。一個 Style Pack 就是一組帶專屬系統提示詞的輸出樣式，你可以針對不同任務建立不同 pack：冷淡的工程 commit 訊息、溫暖的客戶回覆、正式報告、社群貼文，都能各有各的 pack，並用快捷鍵在它們之間切換。風格愈貼合你真正的任務，輸出就愈接近你心裡想的那個樣子。

更有競爭力的是它內建市集，你能一鍵安裝社群做的 Style Pack，也能把自己的 pack 發布出去分享。對團隊來說，這意味著可以統一一套「自家語氣」的 pack，每個成員說出來的草稿都自動符合團隊的書寫慣例；對個人，則是把工具調成完全順手的那個樣子，而不是被迫適應廠商給定的單一風格。

OpenLess GitHub 專案頁截圖，顯示 Style packs 與 Marketplace 段落，說明可建立、安裝與發布自訂輸出風格 — OpenLess README 的 Style Pack 與 Marketplace 段落，說明可建立、安裝與發布自訂輸出風格；因官方 README/docs 未提供無標註介面圖，這張以 GitHub 專案頁截圖補位（圖片來源：OpenLess GitHub 專案頁）。

具體一點想像 pack 的用法：工程師可以建一個「簡潔 commit 訊息」pack，系統提示詞設成「只寫類型加一行摘要，不超過五十字」，說完一段改動經過，它就吐出規規矩矩的 commit 訊息；業務可以建一個「禮貌回客戶」pack，把口語化的抱怨自動轉成得體的商業回覆；做社群內容的人，則能用專為某平台語氣調過的 pack，把構思直接產成貼文初稿。pack 切換靠快捷鍵，等於一個工具就能在不同書寫情境之間瞬間變換，這是固定單一風格的聽寫工具做不到的。

串流插入與本機優先

使用體驗上，OpenLess 採用串流插入：文字在潤色的同時逐字流向游標，而不是等整段完成才一次吐出，體感延遲大幅降低，聽寫幾乎跟著思考的速度走。遇到無法接受串流按鍵輸入的應用程式，它會自動退回一次性貼上，確保在每個軟體裡都能用，不會因為目標程式不相容串流就卡住。

OpenLess 官方網站使用場景截圖，顯示可把口述需求整理成帶上下文、限制與要求的結構化 Prompt — OpenLess 官網功能展示區，說明可把口述需求整理成帶上下文、限制與要求的結構化 Prompt（圖片來源：OpenLess 官方網站 openless.top）。

資料處理上有個邊界要先把話講清楚。OpenLess 是「本機優先」，指的是客戶端、你的聽寫歷史、個人詞典與 API 憑證都存在自己機器上；但這並不等於「資料完全不外送」。它預設的語音辨識是火山引擎的雲端串流 ASR、潤色模型是 DeepSeek／Ark 相容的雲端 LLM，也就是說，走預設設定時，你的音檔與轉寫文字會送往對應的雲端供應商處理。想要音檔完全不離開機器，需要改接本機 ASR（專案有打包 Qwen3-ASR 可選）與本機模型，這條路可行，但不是開箱預設。

所以它相對於訂閱制聽寫服務的隱私優勢，精確地說是「資料與憑證在你手上、你能選擇接哪種供應商（包含完全本機）」，而不是「絕對不外送」。這對在意隱私、或想把聽寫流程搬進公司內部環境的人仍是實質優勢，前提是你願意花功夫把預設的雲端服務換成本機或自選供應商。換句話說，OpenLess 免費的是軟體本身，語音辨識與語言模型的呼叫成本並不免費：接雲端就照供應商計費，接本機模型則吃你機器的算力與設定工夫。

技術上它用 Rust 2021 搭配 Tauri 2 打造，支援 macOS 12 與 Windows 10 以上（Linux 目前只列在 GitHub 主題標籤，README 並未提供 Linux 安裝包或將它列為正式支援平台）。Tauri 2 加 Rust 的組合，相較於 Electron 架構，通常能帶來較小的安裝包與較低的資源佔用，這對一個得整天掛在系統列、隨時等你想說話就啟動的聽寫工具來說，是架構上的先天優勢。

跟 Wispr Flow、Typeless 這類付費工具比

OpenLess 最常被拿來和 Wispr Flow、Typeless 這類 AI 聽寫訂閱制服務比較。它們提供相近的「說話即得潤色文字」體驗，但走的是月費模式、不能自帶模型、音檔上傳廠商、個人詞典與使用習慣存在廠商帳號裡。OpenLess 走的是同一條終端體驗，但用開源與本機優先來換取掌控權：免月費、可自帶憑證、資料不外送、風格可完全自訂。把幾個關鍵維度擺在一起看更清楚：

項目	OpenLess	Wispr Flow／Typeless
授權	開源（MIT）	閉源訂閱制
計費	自有 API 成本	月費
音檔與資料	本機優先	上傳廠商
模型	自帶憑證	廠商提供
輸出風格	Style Pack 完全自訂	依官方方案（以其說明為準）

從長期成本看，兩條路的帳算法不同。訂閱制工具是固定的月費，用得多用得少都一樣價，對重度使用者划算，但一旦停繳就什麼都沒了；OpenLess 的成本取決於你呼叫 API 的量與你選的供應商，用量小時幾乎免費，用量大時則要自己盯帳單。對已經有慣用 API 供應商、或聽寫量不穩定的人，這種按量計費加完全掌控的模式，長期通常比月費彈性更大，前提是你得自己管理憑證與額度。

取捨也很實際。付費工具通常開箱即用、模型與基礎設施都包好，適合不想管設定的人；OpenLess 則要求你自行準備語音辨識與語言模型的 API 憑證，門檻略高，但換來的是成本可控與完全自主。對願意花一點設定時間、又在意隱私與成本的人，OpenLess 的開源路線通常更划算。

一個要留意的點：預設雲端服務是中國的

誠實講一個設定細節：OpenLess 預設搭配的語音辨識是火山引擎（Volcengine，字節跳動）的串流 ASR，語言模型則是 DeepSeek／Ark 相容的對話完成服務。換句話說，它開箱預設走的雲端服務都是中國的。對在中國的使用者這很順手；但對台灣或其他地區的使用者，意味著你得自備替代的 API 憑證（語言模型端因為是 DeepSeek 相容介面，彈性較大，凡介面相容的服務都能接；語音辨識端則要看專案是否支援其他 ASR 供應商，設定時建議先確認）。

這並不影響它作為開源工具的價值：正因為它本機優先、可自帶憑證，你才能把預設的中國服務換成自己信任的供應商。但「裝了就能直接用」的前提，是你要先備好一套不在預設清單裡的 ASR 與 LLM 憑證，這點在使用前要有心理準備。

誰適合用

OpenLess 最對口的是兩種人。一是大量構思 Prompt 或文字、但偏好用說的而非用打的人，無論是寫給 ChatGPT／Claude 的提問、起草郵件與規格、還是開發時寫 commit 訊息與 PR 描述，用語音邊想邊講通常比盯著鍵盤順。二是在意隱私與成本、不想被聽寫訂閱制綁住的人：開源、本機優先、自帶憑證這幾項加起來，等於把聽寫這件事從「月費服務」變成「自有工具」。

它的門檻在於要自備 API 憑證與一點初始設定，不像付費工具那樣裝了即用；但相對地，它給你的是完全的掌控與可訂製。把它理解成「開源、可自架風格的 Wispr Flow」，大概就抓準了它的位置。對願意花一個下午把憑證與風格 pack 調好的人，接下來每一天的聽寫體驗都會貼著你自己的工作習慣走，這是任何訂閱制服務都給不了的客製化程度。想試用，可以從 GitHub 的 release 頁下載 macOS 或 Windows 安裝包（macOS 首次開啟可能要繞過 Gatekeeper），或到 openless.top看官方介紹與設定說明。