Image Provenance 開源 AI 圖片偵測工具:純瀏覽器檢視 AI 簽章與 EXIF,不上傳、但抹除功能請慎用

Image Provenance 是一款 MIT 開源、100% 在瀏覽器本地運作的 AI 圖片偵測與中繼資料檢視工具(GitHub 190 顆星,JavaScript,開發中),圖片不離開裝置。它分層偵測 C2PA、Google SynthID、OpenAI、Midjourney、Stable Diffusion 等生成簽章,完整展開 EXIF/XMP/IPTC 並對 GPS 跳隱私警告,再用 65 個頻域特徵提供輔助判斷(準確率約七成到八成五,非深度學習分類器)。它另含抹除 C2PA、擾動水印、注入相機 EXIF 的轉換功能,作者限定為研究用途,用來造假即踩線。適合編輯、站長與隱私意識高的使用者做第一道篩檢。

用 AI 摘要這篇文章:

收到一張來路不明的照片,你想知道它是真拍的、還是 AI 生成的;又或者你要發一張原圖出去,想先確認裡面有沒有藏 GPS 座標。把圖丟給線上服務又怕圖就這麼上傳到不知名的伺服器。Image Provenance 是一個 MIT 開源、100% 在瀏覽器裡跑的工具,圖片從頭到尾不離開你的裝置,它能檢視 AI 生成簽章、展開完整的拍攝中繼資料,並用頻率域分析給你判斷線索。

一句話結論:它很適合編輯、站長、注重隱私的人,用來快速初判一張圖是不是 AI、照片有沒有漏出隱私。但有兩件事必須先講清楚:它的偵測只給線索、不給定論,而且它內建了抹除簽章、注入相機 EXIF 的能力,那一面只該用來做研究,拿來造假就是踩線。

它怎麼判斷一張圖是不是 AI 生成的

這個工具不會丟給你一個冷冰冰的「真」或「假」,而是分層把線索攤開來,讓你自己看。第一層是最可靠的直接聲明,會去認 Adobe Firefly、Midjourney、Flux、Stable Diffusion 這類主流生成器,以及 Google SynthID、OpenAI 的 DALL-E 與 Sora、和 C2PA 內容出處憑證留下的標記。這些是廠商主動寫進去的聲明,在訊號完整的前提下可靠度很高,工具會用強、中、弱三種可信度標示出來。

實際把一張圖丟進官方 demo,主視圖會把命中的來源直接列出來:凡是 Adobe、OpenAI 這類廠商主動寫入的簽章命中,可信度最高;只有頻率域指紋支持、卻無明確簽章的,會落在中等或弱,這時就得再搭配其他線索一起看。

Image Provenance 官方 demo 的溯源偵測主視圖,顯示 C2PA、OpenAI、SynthID、Midjourney 命中與強中弱置信度Pin
Image Provenance 官方 demo 的溯源偵測主視圖,可看到 AI 來源憑證與置信度徽章(圖片來源:Image Provenance 官方線上演示)。

第二層是給那些沒有明確簽章的圖用的。工具會在瀏覽器的背景執行緒裡,跑 65 個頻率域特徵,畫出 FFT 熱圖與徑向頻譜,再套用 12 條啟發式規則加權判斷。它看的是 AI 生成圖在頻率域裡殘留的統計指紋,而不是用一個大型分類模型去猜。這個分級是有意義的:只有強與中等訊號才計為命中,弱訊號只提示而不認定,避免把似是而非的特徵硬判成 AI。比起單純回一個真假標籤或一個百分比,這種做法更誠實,因為它坦白承認有些圖就是落在灰色地帶,需要你綜合其他線索一起看。

常掛在大家嘴邊的 C2PA,是由 Adobe、Microsoft、Sony 等多方共同推動的內容出處標準,目的是為一張圖、一段影片建立一條可驗證的來源鏈,概念上等同於一張可驗證的數位履歷。它的可靠性建立在一個前提上:簽章在中途不能受損,一旦能讓人抹掉,後面那組抹除功能就會變得很敏感。

頻率域分析的準確率,你得先認清

這裡要誠實講一下它的極限。它不是深度學習分類器,工具作者在文件裡引用 Corvi 2023 等研究,把純頻率域特徵對現代擴散模型的偵測表現概估為約 70% 到 85%;但這是工具方的概括,會隨生成模型與後製程度大幅波動,並不是論文給的單一數字。它能給你「這張圖可能有 AI 指紋」的參考,卻沒辦法當成法庭級的鐵證。

頻率域熱圖把這件事視覺化:AI 生成圖在特定頻帶的能量分布,往往與真實照片明顯不同,這正是工具給出強、中、弱線索的依據。但這些紋路一經壓縮或截圖就會變模糊,也是前面說準確率有限、只能當線索的原因。

Image Provenance 頻率域分析頁顯示 FFT 幅度譜熱圖、徑向功率譜與啟發式判定Pin
Image Provenance 的頻率域分析頁,包含 FFT 熱圖、徑向功率譜與啟發式判定(圖片來源:Image Provenance 官方線上演示)。

更實際的限制是,這些訊號相當脆弱。一張圖只要經過反覆壓縮、截圖、裁切或二次編輯,底層的頻率指紋和隱形水印往往就跟著失真或消失,工具能看到的線索會明顯變少,這也是 AI 圖最常就此漏網的原因。反過來也一樣:一張真實照片有時會因為後製或雜訊,觸發弱頻率域訊號而被標成「可能有 AI 指紋」。所以它給的是該進一步查的方向,雙向都可能出錯,沒看到訊號不等於真實,看到弱訊號也不等於一定是 AI。如果你想體驗壓縮對畫質與這類訊號的影響,可以看看 壓縮塢這類純本機的圖片壓縮工具,同樣是瀏覽器裡跑、不上傳的思路。

一張照片能洩漏多少事

除了判斷 AI 與否,它對中繼資料的展開做得相當完整。EXIF、XMP、IPTC、ICC 這些平常藏在檔案裡的資訊全部攤開,包括相機型號、拍攝參數、軟體編輯紀錄。這些欄位單獨看沒什麼,組合起來卻能拼出比你想像更多的資訊:拍攝時間配上 GPS 能還原你的移動行程,軟體欄位會洩漏你用了哪個修圖 App、修過幾次。現在透過手機截圖再轉傳的圖,EXIF 通常早就剝光了,所以一張完全沒有中繼資料的圖,本身就是個值得警覺的訊號。

最實用的是 GPS:只要照片裡帶了定位座標,工具會跳出隱私警告,並附上開放街圖連結讓你確認曝光地點。

Image Provenance 中繼資料頁顯示相機 EXIF、GPS 座標、OpenStreetMap 連結與 GPS 隱私警告Pin
Image Provenance 的中繼資料頁會列出 EXIF 欄位,照片含 GPS 時會顯示隱私警告(圖片來源:Image Provenance 官方線上演示)。

XMP 的編輯歷史時間線也值得一看,它能顯示一張圖經過哪些軟體、在什麼時間點改動。對要在公開場合發原圖的人來說,發出去前先丟進來掃一次,確認沒有把住家座標或敏感拍攝資訊一起外送,是相當實用的習慣。

不上傳,是它最該記住的一點

市面上不少 AI 圖片偵測服務都要求你把圖傳上去,由伺服器處理,這對隱私敏感、或涉及當事人的照片來說並不理想。Image Provenance 走的是完全相反的路:零後端、純靜態,所有運算都在你裝置上的瀏覽器裡完成,圖片不會主動送往任何第三方。

這個設計觀念,跟 傳給 AI 前先在瀏覽器本地脫敏的 Privacy Filter 是同一個方向:把敏感資料的處理留在自己手上,降低外洩風險。對隱私要求更高的人,還能把專案抓回來自己架,順便檢查相依套件是不是也都本地化了。這對處理當事人照片、未成年影像,或任何你不希望進入第三方資料庫的內容來說,是關鍵的差別;一張圖只要上了別人的伺服器,你幾乎管不到對方會把圖留多久、又拿去訓練什麼模型。

另一面:抹除簽章、注入相機 EXIF,這條線在哪

接下來這段是這個工具比較敏感的一面,也是你用之前最該想清楚的地方。除了只讀的偵測,它還提供一組圖片轉換功能,而且方向正好相反:能把 17 款真實相機的 EXIF 資訊寫進一張圖,讓它看起來像是用 iPhone、Sony 或 Leica 拍的;能在位元層級剝掉 C2PA 簽章;也能對水印做多檔強度的擾動。

Image Provenance README 轉換功能示意,顯示 AI 標記剝離、Canvas 重編碼、EXIF 注入前後差異Pin
Image Provenance README 的轉換功能前後對比,展示 AI 標記剝離與相機 EXIF 注入流程(圖片來源:Image Provenance GitHub README)。

作者把這些功能定位為學術研究與穩健性測試用途,例如測試數位水印有多脆弱、或做隱私去識別,並且在文件裡明白寫了不鼓勵用於散布假訊息、偽造身分或詐欺。這條線很清楚:拿來理解水印的脆弱性、做防禦研究沒問題;拿來抹掉 AI 簽章、把 AI 圖偽裝成真實照片去騙人,就是濫用,也可能觸法。

今天各大平台與媒體開始仰賴 AI 水印與 C2PA 來辨識內容來源,但這些標記到底經得起多少折騰?如果一個水印隨便縮個圖、加個濾鏡就掉,它作為真實性保證的價值就大有疑問。這個工具讓研究者能實際去檢驗這類問題,而不是只能相信廠商的一面之詞;前提是研究用途,而不是真的拿去抹除或偽造。

對所有人都重要的反過來啟示在這裡:正因為 C2PA 簽章能讓人輕易抹掉、相機 EXIF 能讓人隨手加上,所以「這張圖帶有 C2PA 標記」或「它的 EXIF 顯示是某款相機拍的」這類訊號,都不該當成絕對真實的證據。知道這些痕跡原來可任人抹除與偽造,反而是面對各種爆料圖、證據圖時,最該具備的防禦性常識。

適合誰,不適合誰

判斷適不適合,先問你想拿它做什麼。如果你會接觸來路不明的圖,例如在查核鏈上把關的編輯、站長或事實查核人員,需要快速判斷一張爆料圖有沒有 AI 簽章或異常中繼資料,這個工具能幫你快速聚焦可疑圖;但它會漏掉壓縮過的 AI 圖,也可能對真實照片出現弱訊號誤判,所以只能當線索、不能當結論,好處是因為不上傳,拿來處理敏感照片沒有顧忌。例如審核一張聲稱是現場直擊的照片時,丟進工具就能立刻看到有沒有生成器簽章或不合理的編輯痕跡,這比單靠肉眼多一層參考,卻不是保證。

如果你是一般使用者、純粹在意隱私,把它放進書籤,發原圖前先用它掃一下 GPS 與拍攝資訊,是低成本的自保動作。

但它不適合兩種期待。第一,別指望它給出百分百的真假判定,前面說過,頻率域分析有它的準確率上限,壓縮與截圖更會讓訊號流失。第二,如果你的目的是抹掉 AI 簽章、偽造拍攝來源去通過平台審核或誤導他人,這條路不只在工具的紅線之外,也踩在法律與倫理的邊界上,TechMoon 不會、也不該教你這麼做。要把敏感檔案安全地傳給信任的對象,端到端加密的 DropLock 才是對的工具。

常見問題

它能把 AI 圖百分之百認出來嗎? 不能。C2PA、EXIF 這類直接聲明很可靠,但頻率域分析只是輔助線索,工具方概估整體準確率約 70% 到 85%(會因模型而異),而且經過壓縮、截圖或二次編輯的圖,訊號會明顯減弱。

圖片會上傳嗎? 不會。所有分析都在瀏覽器本地完成,沒有後端。對隱私要求高的人可以自己架一份,再確認相依套件是否本地化。

那個抹除簽章、注入 EXIF 的功能能用嗎? 技術上能,但作者把它限定在研究用途,例如測試水印的穩健性或隱私去識別。拿來偽造圖片來源、規避平台審核或詐欺,是明確的濫用,不該這麼做。

它是正式版嗎? 還不是。專案仍標示為開發中(WIP),沒有正式 Release,要用在正式的內容審核或企業流程前,建議先自行測試並交叉驗證。

它跟一般 AI 偵測網站差在哪? 最大差別是不上傳。多數線上偵測服務要你把圖傳到它的伺服器運算,對隱私敏感或涉及他人的照片是個顧慮;它則是在你的瀏覽器裡跑完全程,圖片不離開裝置。代價是它靠的是簽章嗅探與頻率域特徵,而不是伺服器端的大型模型,準確率與模型更新速度自然會有落差。

比較項目Image Provenance一般線上 AI 偵測服務
運算位置你的瀏覽器(純前端)對方伺服器
圖片是否上傳不上傳,不離開裝置需上傳才能分析
偵測方法簽章嗅探+頻率域特徵多為伺服器端大型模型
隱私顧慮低,適合敏感照片高,照片會進對方資料庫
準確率特性給分級線索,非定論通常給單一判定分數

一般使用者怎麼用它保護隱私? 最實用的方式,是在把原圖傳出去之前先丟進來掃一次,確認照片沒有夾帶 GPS 座標、住家位置或你不想公開的拍攝資訊。比起事後補救,發圖前先檢查是成本最低的自保動作。

接下來怎麼動手

1. 先打開官方線上演示頁,丟一張你想檢查的圖進去,看看它能不能讀到 AI 簽章或 EXIF,熟悉一下分層線索長什麼樣。

2. 如果要處理隱私敏感的照片,把專案 clone 下來自己架,只需 git clone、切進目錄、跑 python3 -m http.server 8000,再打開本機網址即可。

3. 把它當作初步鑑識的線索,而不是最終定論;面對重要判斷,永遠搭配圖片來源與其他管道交叉比對。

這款工具最值得記住的,其實是兩件事:把圖片分析留在瀏覽器裡的隱私設計,以及它無意間示範的殘酷現實,連 C2PA 與相機 EXIF 這些我們以為可靠的真實性訊號,都能任人抹除與偽造。原始碼在 GitHub 專案頁,MIT 授權。

Sliven 褚崇名
Sliven 褚崇名

每日分享科技新知、免費資源以及 WordPress、虛擬主機相關主題,任何問題歡迎在科技月球下方留言,或是發送 Email 至 [email protected] 與我聯繫。

文章: 700

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *


目錄
Share to...