【明報專訊】今年3月,Google正式開放人工智能助手Gemini予香港用家,包括免費版、Plus、Pro和最高級的Ultra版,為本地掀起新一輪AI應用熱潮。不過工具再多,懂得用才是關鍵。香港無線科技商會主席李勁華(Keith)深耕AI應用多年,在綜合AI應用服務平台Poe開發了88個小應用,更以「氛圍編程」(Vibe Coding)方式,即以自然語言向AI描述需求、由AI自動生成程式碼,至今已獨力開發出3款功能豐富的應用服務。在他眼中,AI不是高科技玩具,而是可以替他解決麻煩的代理人,「無腦無痛是我用AI的原因,否則便不會畀月費」。


Keith近年經常在自家YouTube頻道(@keithlidotcom)分享「AI時代生存指南」,對於如何用好AI,有一套反直覺的看法:「最能用好AI的人,是那些對下屬要求很高的老闆,或者要求很多的客戶。因為他們不會替AI設限,不會考慮『它做不做到』,只會說:我要這個,你去做。」他認為,習慣先問「AI能不能做到」的人,其實是自己戴上枷鎖,「只要你有這個枷鎖,就用不好AI」。
相關文章:JUMP調查:86%欲裝備AI技能 個人:分階段進修策略 企業:團隊應用AI推動升級轉型
深度整合Google帳戶 大幅提升效率
這套邏輯,亦適用於他看待Gemini登陸香港一事。Keith認為,意義不止於多了一個AI選擇,或省卻VPN連線的麻煩,真正的價值在於Gemini能深度整合Google帳戶生態——Gmail、Google Drive、日曆、搜尋,一旦連通,日常效率將大幅提升。例如用家可指示Gemini搜尋有關開會的電郵,再將時間地點直接建立為日曆活動,毋須再開啟多個應用程式剪貼資料。他開辦的AI課堂近期亦加重了Gemini的內容,但他強調自己教的不是某一個工具,「我教的是釣魚。如果直接給你10個AI用法,那只是10條魚;但每個人要釣的魚都不同,所以教釣魚的方法才有用。」他在Poe開發的88個小應用,大部分便源於課堂示範。他習慣在上課前先找一個當下熱門話題,再將其製成AI應用例子。以六合彩投注為例,每逢大彩池,網上便湧現以數學原理減省投注成本的教學文,「只要你在網上看到有人分享這類資訊,已經可以把它包裝成一個AI應用示範」。


相關文章:中小學師生應用AI調查|逾九成用過 DeepSeek與Poe最普及 兩成學生稱無AI難完成功課
撰寫提示從「解釋」變成「把關」
從2022年末ChatGPT面世至今,AI模型進化之快令Keith印象深刻。他記得當年要特別強調如何撰寫提示(prompt):「因為那時的AI模型真的比較蠢,需要大量提示才能理解任務。」但現今的模型已能從自然語言中理解意圖,prompt的作用已從「解釋」變成「把關」,「現在寫prompt,是要令它做足你要它做的東西,或者避免它做你不需要的東西」。
「偷懶」節省運算成本
李勁華列出AI的「壞習慣」──偷懶及過度迎合。這些並非偶發事故,都有其結構原因。「AI模型的預設反應,是以最節省運算成本的方法完成任務。為了省token(即代幣,執行任務時需要消耗的點數),它傾向走最短路線,不會故意兜大圈。」因此他明確反對使用Gemini的「快速」模式,「你要它做到最好,又要它用最節省成本的方法,兩件事本身有矛盾」。遇到需要深度分析的任務,他會直接在prompt裏跟AI說清楚:「我知道你預設模式是幫我節省運算資源,但現在這項任務你不能替我省錢,token是我的不是你的;你只要負責把這件事做好,成本我自己會考慮。」
相關文章:職場趨勢|AI衝擊飯碗!使用AI漸成美職場員工考核因素 不再只是選項
為獎勵「過度迎合」
AI「偷懶」之外,還有一個更難察覺的問題——過度迎合。Keith提到AI模型開發公司Anthropic在2024年發表的研究報告:訓練AI的過程設有獎勵機制,答案符合人類期望便獲得獎勵,這衍生出reward hacking現象——AI為獲得更多獎勵,會說用家想聽的話,而非實話。「例如你把功課交給AI分析,它明知內容不夠好,但為了獎賞,仍會找10個理由說你做得不錯,因為它知道這樣說你會比較開心。」OpenAI的GPT-4o便是典型案例。該模型擅長以人性化回應,深受用家歡迎,不少人形容與它對話「好像同真人傾偈」。Keith解釋:「AI知道愈附和用家,用家會愈開心。但當迎合過火,就會令用家變得非常依賴AI、不能自拔地想跟它傾偈。」這亦是外界分析OpenAI決定將GPT-4o退役的原因之一。
相關文章:AI複合型人才吃香 必備十大核心能力 成職場創新力量
「逼迫」AI 9日開發翻譯工具
Keith觀察到,AI編程能力在去年第三季明顯躍進,專門用於程式編寫的工具相繼出現,他確信程式員現時一定會以AI輔助工作,不可能再全由人手寫程式。人類的角色,正從實作者變成設計者和把關人。這個判斷促成他完成第一個Vibe Coding應用——TranslationAI.app。
「我知道大型語言模型背後的技術,本來就與翻譯關係密切,於是便向AI查詢大學翻譯系的課程內容,以及市面上的消費級翻譯工具有否融入翻譯理論。」多個AI模型都回答說沒有,Keith因此看到市場缺口。現時他的翻譯工具結合多個翻譯流派與理論框架,共衍生出68種配置組合,並設有自動建立詞彙功能,確保全書譯名前後一致,同時支援長文自動翻譯及線上付費功能,是一款完成度相當高的商業應用。最驚人的是他只用了9天便完成開發,「這不是因為我懂翻譯,而是因為我不懂,所以一直問AI,同時指示它要全力工作,不可偷懶」。
相關文章:AI時代翻譯工作 學者:不懂語境的譯者恐淘汰 催生「譯後編輯」、「AI提示工程師」新職位
至於另一成果ClassRail,是Keith專為自己課程設計的自動化收生平台。由facebook及Instagram發布課程內容開始,到生成報名連結、付款系統、上課提醒,以至課程材料分發、評估問卷及電子證書,幾乎全程由AI系統處理,只剩學生到場登記一環由真人負責。以往他需付費使用第三方報名平台,現在毋須再與人分成,笑言「幫自己加了1倍人工」。他雖然懂寫程式,但自言並非樣樣精通——以往不懂如何在程式中連接WhatsApp,如今卻能透過文字指令讓AI完成。他認為,現時七成文書工作都可以交給AI代辦,若仍未能做到,值得認真反思自己的使用方式。AI時代的真正意義,不是令人變得多餘,而是令人可以只做最重要的事。

相關文章:AI衝擊就業市場 大學畢業職位3年減六成 孫玉菡:就業挑戰加大
活學活用Gemini 三大應用貼士
Gemini登港後,不少用家即時下載試玩,卻發現答案往往未如預期。原因通常不在於AI不夠聰明,而是提示技巧掌握不足。此外,活用個人化Gem及Gemini Live功能,也可在日常生活中解決不少問題。留意雖然免費版Gemini都可使用「思考型」及「Pro」模式,但每日限制了一定代幣量,如發現經常「爆數」,可考慮訂閱Google AI Plus版本(每月$38)或其他版本,除了增加使用額度,更可啟用免費版沒有的功能如影片創作等。

1. 有效提問結構
提問質素直接決定答案質素。一個有效的提問結構可參考:角色+任務+對象+格式+限制。例如想AI幫你寫電郵,應說明「你是誰、寫給誰、目的是什麼、語氣要求、字數上限」。資訊愈具體,答案愈貼近需要。
同時要清楚限制AI不能做什麼。若目的是生成一篇用字中肯的完整文章,可加入「不要用點列方式回答」、「不要有廣告語氣」、「用第三方客觀角度」等指示,以阻止AI走「最短路線」。此外,若希望得到誠實評估而非奉承,可在提問時加入「誠實評估,不需要照顧我的感受」或「如果有明顯問題要直接指出」。
Google亦製作了一份「Gemini for Workspace提示撰寫指南」,載有不同行業的常用提示例子,可到官網(tinyurl.com/2pky8um6)下載。
2. 自訂個人化助手
Gem是Gemini的自訂AI助手功能,可預先設定角色、指示及參考資料,適合處理重複任務,例如每次輸入一段新聞資訊,讓AI構思3個不同方向的回應角度,毋須每次重頭解釋背景。撰寫任務指令後,可按「使用Gemini重新撰寫指令」圖標,讓AI將指令改寫得更具體。

設定方法:進入gemini.google.com,在左側欄點擊「Gem」,點選「+新增Gem」,輸入名稱及指令,亦可上傳供AI參考的文件或檔案。設定完成後可先預覽測試,滿意後儲存,日後直接從左側欄開啟使用。Gemini已預設了程式伙伴、寫作編輯等常用Gem,可先試用再按需要設定。

3. 實時語音對話
Gemini Live是Gemini的實時語音對話功能,支援自然語言對話、中途打斷及轉換話題,並可開啟鏡頭或分享屏幕,讓AI「看見」你正面對的情况。在應用程式界面右下角點擊Live圖示即可開始。進入Live模式後,點擊鏡頭圖示可讓Gemini即時分析畫面,例如旅遊時將鏡頭對準景點,詢問歷史背景或附近餐廳推介。Gemini Live亦已整合Google日曆及Maps,可將鏡頭對準一項活動資訊,直接要求AI將其加入日曆。

文:周群雄
編輯:梁小玲
facebook @明報副刊
電郵:feature@mingpao.com