【明報專訊】生成式人工智能技術(GenAI)的出現,為內容創作者提供了很大方便。但另一方面,這亦大大拉低造假的門檻,令到很多圖片和視頻真假難分。考慮到金融機構的需求,應用科技研究院最近研發出一個「AI圖像文件防偽方案」,已交給超過一間機構試用,未來還希望擴大適用的文件種類。

明報記者 薛偉傑
應科院首席科技官黃莹、首席總監(人工智能及可信技術)張偉倫表示,他們一年半前就覺得,人工智能(AI)技術的影響很大,若有人將之用來偽造文件,會對社會造成很大的困擾,所以有需要以AI來剋制AI,研發一個「AI圖像文件防偽方案」。走訪一些金融機構之後,更加確認了這個需求,於是便展開研發工作。
相關文章:數字辦公布生成式AI指引 劃分4級風險 醫療駕駛列「高風險」須人監督
應科院:要以AI剋制AI
應科院的「AI圖像文件防偽方案」,乃專門針對jpeg、tiff和pdf等圖像檔案格式的文件。因為現時很多金融機構為了搶奪貸款服務的市場佔有率,都會標榜處理速度快,通常都接受申請者以圖像方式來提交各種證明文件。這個AI圖像文件防偽方案結合了多種模型和技術,包括:
1)多模型架構:「卷積神經網絡」(convolutional neural network,CNN)可以檢測圖像的局部紋理和異常,而基於注意力機制的深度學習模型架構Transformer,則用來理解全局的語義和結構,以提升整體的判斷力;
2)人工智能生成圖像偵測:識別是否存在AI合成或者AI生成的圖像特徵;
3)篡改圖像偵測:檢查圖片是否被修改過,找出不自然的痕迹;
4)相對版面比例比較:分析文件版面的佈局和比例,判斷是否符合真實文件的常規模式;
5)還有通用規則式文件資料擷取技術。
因此,它能夠從內容、結構、圖像特徵等三方面來交叉檢測,從而提升防偽的準確率。上面的技術詞彙可能較艱澀,但舉一些例子,會較容易理解其運作原理。
舉例說,如果有一些交易的入帳日期並非完全順序;或者所有收入和開支抵消之後,並非等於文件上的結餘,都屬於極度可疑。這是從會計的角度來檢測內容。又例如,如果有個別位置的數目字或英文字的大小或字體,與整份文件的其餘部分顯得不一致,就很可能是被人工修改過。
相關文章:金融學院研究指75%金融機構應用生成式AI 市場缺系統開發、數據及風險分析人才
準確率料約90%
至於以人工智能生成內容(AIGC)軟件來生成整份文件圖像,現時其中一個主要破綻是,若將之放大多倍,會看到文件內的中文字明顯比英文字模糊得多,線條沒有那麼銳利。當然,AIGC軟件進步很快,或許再過一段時間,就會克服這個缺點。但即使如此,每套AIGC軟件生成的檔案都有它獨特的「紋理」,就好像雜噪(Noise)般,仍然有殘留的痕迹可尋。
暫時來說,這個「AI圖像文件防偽方案」主要針對一些和申請貸款相關的文件,例如帳目、帳單、身分證明文件等。在訓練過程中,研發團隊一共使用了100多萬份真假文件,部分文件由合作的金融機構提供,部分假文件則是故意用AIGC軟件來生成。
估計這個方案現時的準確率大約是90%。一般來說,每檢測一頁文件真偽,只需要大約1分鐘。這聽起來好像比較慢。但以他們所知,現時有些金融機構靠人眼來詳細檢測(除了AIGC生成檔案的「紋理」,上述幾個例子都可以用人眼檢測),每頁文件就至少花幾分鐘,甚至超過10分鐘都有。
相關文章:金融科技領域未來三大領導崗位 港缺AI複合型專才 培訓成當務之急
未來擬擴適用文件種類
應科院早前已經將這個方案交給超過1家金融機構試用,預料很快就有機構正式採用。此外,應科院還正在和某些政府部門商討。兩人估計,外國和內地的機構其實亦有需要,只是還未有時間去接觸。
應科院未來還計劃擴大這個方案針對的文件種類,例如包括:月結單、電費單、水費單、各種發票、土地查冊文件、屋契等。希望除了金融機構之外,房地產機構、地產代理、業主、保險公司甚至某些大公司也適合使用,因為有些大公司每月都需要處理很多員工提交的發票。
理論上,這個方案針對的文件性質並沒有限制。就算是學歷證書、檢測認證機構的報告等,只要經過足夠樣本訓練(需要相關機構提供),這個方案也能辨別真偽。
相關文章:羅兵咸永道:AI革新公共服務審批與金融風控 促中小企「從小做起」
騰訊「朱雀AI檢測助手」可免費使用

對於一般個人用戶來說,若想檢測某些文章、圖像和視頻是否由人工智能生成內容(AIGC)軟件產生,或許可以試用騰訊的「朱雀AI檢測助手」(https://matrix.tencent.com/ai-detect/)。後者乃一個免費的線上AI檢測助手,普通人毋須註冊,每日可使用大約5次。
「朱雀AI檢測助手」聲稱可以偵測GPT、Claude、DeepSeek、混元等文生文模型產生的文本內容;以及Midjouney、Stable Diffusion、StyleGAN、Flux、豆包、通義、混元、即夢、可圖等文生圖模型生成的圖片,還有Sora、Veo、混元、即夢、海螺等文生視頻模型生成的視頻。
不過騰訊亦強調,這工具只是用來輔助檢測檔案中可能存在的AI生成特徵,不能作為內容真偽和版權歸屬的最終判定依據。其檢測結果會受到模型演算法和輸入文字品質、風格等多種因素影響,有誤判或漏判的可能。用戶只可以將檢測結果做參考,結合人工判斷和其他證據來綜合評估。而將這工具的檢測結果用於審查、封禁、降權、仲裁等行為所引發的後果和糾紛,用戶需要自行承擔。
檢測結果供參考 非最終判定
這工具會提供一個「AI濃度」,來顯示被檢測檔案是由AI生成的機率是高還是低,但不會有肯定的結論。
記者以近期內地網上流傳的一段流浪黑貓向上飛撲,以抵消部分衝力,救回一名墮樓嬰兒性命的視頻(不同解像度)做測試,它檢測出來的「AI濃度」分別是37.94%(不太可能是AI生成)(1080p)、40.55%(不確定是否為AI生成)(720p)、39.01%(不太可能是AI生成)(480p)等。結果還是有點模稜兩可。
網上亦曾經有人聲稱,他創作的文章的「AI濃度」本來很低,但「朱雀AI檢測助手」升級至9.3版之後,檢測出來的「AI濃度」即比以前大升。
另外,網上也有一些工具聲稱,能夠大幅降低由AI生成的文章的「AI濃度」。簡而言之,檢測AI生成的技術和反檢測的技術,就好像矛與盾之爭。
相關文章:了解AI短劇製作背後 距離「100%生成」有多遠?有何限制?