Physical Address
304 North Cardinal St.
Dorchester Center, MA 02124
Physical Address
304 North Cardinal St.
Dorchester Center, MA 02124

SpokenType 是一款覆蓋 macOS、Windows、Android 的閉源 AI 語音輸入工具,主打自動潤色、即時翻譯與自帶 API。本文拆解它的核心決策點:你要的是忠實轉錄還是 AI 改寫,以及雲端模式下語音會經過哪些第三方服務商。
用 AI 摘要這篇文章:
語音輸入工具最尷尬的地方,從來不是「聽不懂你說什麼」,而是聽完之後吐出來的那份草稿。你說的是一段帶口頭禪、會自我修正的自然口語,工具逐字記下的,往往是一份夾雜「嗯、啊、那個」、斷句零散、還得自己回頭刪改的初稿。對偶爾記個想法的人無所謂,對每天要寫大量郵件、回工作訊息的人,這份事後整理的功夫,常常把說話省下的時間又吃掉。
跟 SpokenType 把識別與潤色整包綁在閉源 App 裡不同,Input 0 把轉錄留在本機、潤色端點完全由你填的 Base URL 決定,原始碼也公開在 GitHub 上供檢視。
SpokenType 處理的就是這段事後功夫。它不只做語音轉文字,還會在輸出之前剔除口頭禪、整理語序,把口語整理成比較接近可以直接發送的書面文字,再疊上即時翻譯、上下文回覆草稿、自訂技能,以及本地端與雲端兩種識別模式。
它目前覆蓋 macOS、Windows、Android 三個平台(iOS 官網標示「即將推出」),版本大約在 1.0.x 階段,是一款閉源的商業訂閱工具,不是開源專案。這篇評測會把它真正拉開差距的地方,和它的核心取捨,分開講清楚。

目錄
系統內建的聽寫功能應付短訊息、臨時備忘這類輕量輸入綽綽有餘,但它的工作到「逐字記下」就停了,後續的刪口頭禪、順語序、補標點全留給你自己。SpokenType 這類工具想插手的,正是系統方案放手的那一段:把這些事後清理往輸入當下挪。
跟系統方案比起來,它主要多了幾層能力:
換句話說,它跟傳統語音輸入的分野,是會不會在「說完」與「發出」之間,多一道 AI 整理的手續。對高頻文字工作者來說,這道手續省下的,正是每天重複做的刪改勞動。

這是 SpokenType 最需要先想清楚的一層。它的核心賣點「自動潤色」,本質上是讓 AI 重新改寫你說過的話。
這件事的好處很明顯:你不用再手動刪填充詞、調語序,輸出來的文字更接近可以直接發送的狀態。但代價也比較少被提起;AI 改寫之後的句子,未必是你心裡想講的原句。它可能把「我覺得還行吧」潤成「整體表現尚可」,把口語化的語氣修成偏正式的商業用語。如果你要做的是會議紀錄、法律陳述、學術訪談這類需要原句準確的工作,這種「幫你改順」反而是個風險,因為你之後還得回頭比對它到底改了哪些地方。
更穩妥的用法是把它放在「本來就要再整理一次」的情境裡:寫郵件、回工作訊息、打草稿、做雙語溝通。這些情境裡你本來就會改字,AI 先幫你改一輪,省下的是重複勞動,而不是「原句該長怎樣」這個判斷。如果你的工作強調原句準確,那傳統的逐字轉錄加上人工複核,仍然更穩。
這也是它跟 OpenLess 這類開源語音輸入工具的路線分岔。OpenLess(TechMoon 先前評測過)把 AI 限制在「只清理、不替你發言」,定位上更接近結構化 Prompt 的前端;SpokenType 則把翻譯、回覆草稿、語氣改寫都包進來,想做一個更全面的桌面語音助理。哪一種比較適合你,取決於你要的是「盡量忠實地把話變成字」,還是「幫我把話整理成可以發出去的成品」。
SpokenType 在隱私這一層的設計,比完全封閉的方案更有彈性,但有幾件事必須先看清楚。
它支援本地模式、雲端模式,以及可配置第三方 AI 服務商。本地模式下,語音處理幾乎都在你的裝置上完成,比較適合在意資料邊界的情境。問題出在雲端模式;當你開啟雲端語音識別,或用第三方服務商的 API Key 時,你的語音內容和處理請求,會被送到對應的服務商那裡(隱私政策明確舉例 OpenAI、Google Cloud、百度 AI 等)。
SpokenType 自己的隱私政策寫得很清楚:他們不會儲存你的語音錄音、不會儲存轉錄結果、不會拿來做模型訓練,處理完就刪除暫存音訊檔。這一部分是好的。但它擋不住的是;一旦你選了雲端模式,資料就會先經過第三方 AI 服務商,而那些服務商怎麼處理你的資料,要回去看它們各自的隱私政策,SpokenType 管不到。
換句話說,「SpokenType 不儲存」不等於「所有資料都不離開你的裝置」。你最終的資料流向,取決於你選的模式和模型服務商。如果你處理的是商業機密、客戶資料、內部敏感資訊,不要只看「本地」或「隱私優先」這幾個字,要先把官網的模式說明和你選的服務商條款都看清楚,再決定要不要放進正式的工作流程。
另外有一個常被忽略的細節:SpokenType 的「AI 讀屏」功能在讀取螢幕內容時,這些畫面資訊一樣可能被送到你選的雲端服務商。隱私政策裡寫明它不會蒐集或儲存你的螢幕截圖,但這同樣不等於截圖內容不會在處理過程中經過第三方。對經常在螢幕上顯示敏感內容(例如客戶郵件、內部文件、財務報表)的人來說,這一點要特別留意。

SpokenType 支援自帶 API Key,可以接 10 家以上的主流 AI 服務商。對願意動手調整的人是加分項,因為模型選擇和使用成本更容易按需求控制,也能避開預設服務商。但對完全不熟悉 API 的人來說,這也代表多了一層設定門檻。
這條路有兩個現實成本。其一是計費方式不同:自帶 Key 是按使用量計費,你每一次雲端識別、每一次潤色、每一次翻譯,都會消耗那把 Key 的額度,費用隨使用量累積,不像訂閱制的固定月費那樣可預期。如果你平常就想集中管理多家 AI 服務的免費額度,可以參考我們整理過的 FreeLLMAPI 開源 API 閘道,把多家服務收進同一個端點再餵給這類工具。其二是資料流向不變:這些請求一樣會經過第三方服務商,自帶 Key 不會讓雲端模式的外送風險消失。
所以比較合理的判斷是:如果你本來就在用某一家的 API(例如工作中已經有 OpenAI 或 Anthropic 的額度),自帶 Key 可以讓 SpokenType 直接接上你既有的工作流,是明確的優點。如果你只是想要一個打開就能用的工具,那走它內建的訂閱方案,會比自己管 Key 簡單很多。
SpokenType 採用免費版加付費訂閱的商業模式。具體的方案內容、價格與各地區幣別,會顯示在 App 內或官網的定價頁(定價頁是動態內容,本文不直接抄錄數字,請以官方最新說明為準)。在決定要不要付費之前,有幾個條款層面的現實限制值得先知道。
付費訂閱是自動續訂。SpokenType 的服務條款明訂,除非你在當期帳單週期結束前至少 24 小時取消,否則會自動續約下一期;iOS 走 App Store、Android 走 Google Play、桌面版與網站走 Stripe 等第三方支付,取消流程也對應不同平台。退款政策則因平台而有落差:桌面版與網站版的條款寫明「所有銷售均為最終,不因改變主意、未使用的訂閱期間或部分使用的帳單週期提供退款」,等於付費後反悔幾乎無法退;行動版則受 Apple 與 Google 各自的退款規則保護,空間相對大一些。條款也保留隨時調整方案內容與價格的權利,價格異動會在下一個帳單週期生效並提前通知。
這些都不是 SpokenType 獨有的條款,多數訂閱制 SaaS 都是這個架構。但因為它的免費試用(官網提到加入社群可獲 7 到 14 天 Pro 體驗、邀請好友可疊加天數)是行銷引導的,建議在試用期內就把上述條款讀過一遍,不要等到自動續訂扣款才回頭看。
把 SpokenType 放進同類工具裡比較,會比較清楚它的位置。
OpenLess 是 TechMoon 先前評測過的開源 AI 語音輸入工具(MIT 授權、Rust + Tauri、約兩千五百顆星),核心設計是「模型只清理語音、不替你發言」,並提供 Style Pack 市集讓你切換系統提示詞。它的優勢是開源、可審計、本機優先的設計明確;但預設的雲端 ASR 與 LLM 仍是中國服務,要完全離線得手動切換到本機模型。這也是為什麼這一類工具的「本機優先」不等於「資料不外送」;預設服務商是不是雲端,才是判斷資料流向的關鍵,這個結論在 OpenLess 的評測裡也適用。
Superwhisper、MacWhisper 這一類,則多半聚焦在 Whisper 模型的離線或本地聽寫,定位上更接近「準確的語音轉文字引擎」,AI 改寫和跨應用整合不是主力。
SpokenType 走的是另一條路。它不是開源工具,所以你無法自行審計它的資料流向,只能仰賴官網隱私政策的描述;但它把語音輸入、自動潤色、即時翻譯、上下文回覆、自訂技能這幾件事包進同一個桌面應用裡,跨平台覆蓋也比 OpenLess 多了 Android 與即將推出的 iOS。如果你的需求是「一個裝好就能用的全方位語音助理」,SpokenType 的整合度比較高;如果你在意的是開源、可審計、可自架模型,OpenLess 會是更穩的選擇。
| 工具 | 授權 | 平台 | 資料處理 | 定位 |
|---|---|---|---|---|
| SpokenType | 閉源商業 | macOS / Windows / Android(iOS 預告) | 本地 + 雲端 + 自帶 API | 全方位語音助理 |
| OpenLess | 開源 MIT | macOS / Windows | 本機優先,預設雲端中國服務 | 結構化 Prompt 前端 |
| Superwhisper / MacWhisper | 部分開源 | 主要 macOS | 多為本機 Whisper | 準確聽寫引擎 |
需要提醒的是,這個表是把定位濃縮成一列,實際挑選時,每一項的細節(例如 OpenLess 預設服務商是哪一家、SpokenType 雲端模式接哪些服務)還是值得各自點進官網確認。
SpokenType 不太像一個面向所有人的基礎輸入法替代品,更像一個面向高頻溝通情境的語音助理。它能不能幫到你,取決於一件事:你願不願意讓 AI 在「說完」與「發出」之間那段本來留白的區間,動手幫你整理一遍。
比較能感受到差異的,是這幾種情境:
反過來說,只是偶爾回兩句閒聊、或本來打字就很快的人,加裝一個常駐工具未必划算。而工作性質要求逐字忠實(法律紀錄、嚴肅訪談、學術逐字稿)的讀者,則建議直接關閉自動潤色,把 SpokenType 當傳統聽寫用,再自己做人工複核,會更貼合需求。
還有一種人要特別小心:長期在機密環境工作的人。SpokenType 的「AI 讀屏」會讀取當下應用畫面,雲端模式下這些畫面內容一樣會經過第三方服務商。如果你的螢幕上經常顯示合約、客戶名單、未公開的財務數字,那麼即便 SpokenType 本身不儲存,資料在傳輸過程中經過第三方,這在合規上仍是一個需要評估的風險點。
更務實的做法是不要先下結論,而是先拿自己最典型的情境跑一遍;寫一封英文郵件、回一段工作訊息、做一次雙語輸入;看看它是不是真的能幫你減少修改,再決定要不要長期用下去。
SpokenType 是開源工具嗎?
不是。SpokenType 是閉源的商業訂閱軟體,沒有公開的原始碼倉庫可以審計,你只能透過官網的隱私政策與服務條款來了解它的資料處理方式。如果你需要的是可以自己審計、自架模型的開源方案,OpenLess 會比較合適。
它的「自動潤色」會改變我原本說的話嗎?
會。潤色等同 AI 重寫你的句子,輸出未必等於你的原話。在需要逐字忠實的場合(例如病歷聽寫、法庭紀錄、正式聲明),建議關掉這項功能,或改用傳統聽寫再人工複核。
雲端模式下,語音會被送到哪裡?
會被送到你選擇的第三方 AI 服務商,例如 OpenAI、Google Cloud 或百度 AI。SpokenType 自己聲明不儲存語音錄音與轉錄結果,但這不代表資料不離開你的裝置;服務商怎麼處理,要看它們各自的隱私政策。
自帶 API Key 會比較省錢嗎?
不一定。自帶 Key 的計費是按使用量累積,頻繁使用的話成本可能超過固定月費的訂閱方案。它比較適合本來就有 API 額度、或想避開預設服務商的人。
它跟 OpenLess 比起來,哪一個比較好?
沒有絕對的好壞,取決於你要什麼。要全方位整合(翻譯、回覆草稿、跨平台)的桌面助理,SpokenType 整合度較高;要開源、可審計、可自架模型,OpenLess 更穩。
免費版能用多久?
SpokenType 提供免費版,但官方沒有公開免費版的功能上限與使用量限制的完整說明,多數進階功能(自動潤色、即時翻譯、自訂技能)都鎖在 Pro 訂閱裡。加入官方社群可獲 7 到 14 天的 Pro 試用,邀請好友可疊加,但這是試用,不是永久免費。
免責聲明:本文基於工具目前公開頁面整理,主要提供選型與情境判斷參考。產品的具體功能、免費額度、收費方式、模型支援範圍與隱私處理規則,可能隨版本調整,請以官網最新說明為準。涉及個人隱私或商業敏感資訊時,建議先確認所選模式的資料流向,再投入正式使用。