文章日期 : 2017年12月14日

大數據分析應用廣泛 港大新辦「數據科學碩士」

成就兼具統計學和計算機科學專才

【香港大學統計及精算學系專輯】

在這個大數據的年代,很多行業都已利用大數據發掘無限可能,其中天氣預報、客戶消費模式等,都是數據科學家、數據分析師從海量的數據中找出有用的資料後,再作整合和應用……現已廣泛應用於金融、醫療、市場營銷、能源等行業,以至政府機關。

為培訓能深入掌握數據科學這門學科,精通統計學和計算機科學知識的專才,香港大學統計及精算學系和計算機科學學系新辦了「數據科學碩士」課程,內容包括將機器學習、深度學習等人工智能技術應用在現實生活中,利用數據分析預測未來可能發生的事情,提升科技的發展和人們的生活質素等。《哈佛商業評論》甚至稱數據科學家為「21世紀最誘人的工作」(Data Scientist, The Sexiest Job of the 21st Century),到底這新興工作的潛力何在?

大數據這個名詞,聽來既熟悉又陌生,其實它已無時無刻在你我的日常生活中「運作」。近年電子商貿市場蓬勃,每當顧客在網上搜尋某種貨物,或瀏覽某個網站後,其個人社交平台只需於短時間內,已出現了相關的廣告或貨品推薦。

各行業渴求數據分析專才

香港大學統計及精算學系統計學講座教授李偉強教授指,網站能夠迅速地緊貼顧客的消費模式,是因為系統在過程中已蒐集了大量數據,主要根據顧客瀏覽網頁的內容、逗留時間、選購產品等資料,了解他們的喜好並預測需求,藉此推出個人化的促銷方案,增加其消費意欲。

「假設顧客購買的是嬰兒奶粉,系統便能從中推斷顧客對其他嬰兒用品,甚至是置業的需要……」香港大學統計及精算學系講師鍾玉嘉博士解釋,研究人員在編程時,透過機器學習的計算,實現了人工智能的技術,從複雜的數據中,挖掘出令人容易理解的信息,並增加預測的準確度。

十大工作技能:統計分析和數據挖掘

二人稱,近年有外國銀行、信貸機構,在評定借款人的財務狀及信貸評級時,使用有別於傳統只參考借款人信貸紀錄的方法,「機構除了分析借款人的銀行帳戶活動、投資紀錄等資料外,新方法是透過分析網絡蒐集的數據,如查看借款人的社交網絡,將其好友列表的信用評級計算在衡量指標之內。」

鍾博士續說,政府在最新的施政報告提出,推動香港發展成為「智慧城市」,當中提到的數碼個人身分、多功能智慧燈柱試驗計劃,以及革新電子政府系統的開發技術和設立大數據分析平台等,同樣跟應用大數據有莫大的關係。

從以上可見數據科學家的工作,既理性又要富創意,加上曾有調查指統計分析和數據挖掘是現時全球十大工作技能之一,難怪此為現時全球炙手可熱的工種之一。

兼備統計學及計算機科學人才缺 新辦課程培訓專才

為了培訓兼具統計學和計算機科學知識的專才,香港大學統計及精算學系和計算機科學學系將於2018/19學年合辦全新的「數據科學碩士」課程。李教授表示,如何從芸芸數據中擷取有用的資訊正是數據科學的一個重要挑戰。以上課程結合高階的計算、統計和數學領域知識,注重多元知識的整合、技術層面和分析技能的應用。

除了必修的6個核心科目外,學員還可以在兩組分別是統計學和計算機科學的選修科中,揀選適合自己的科目增值自己。李教授以「Data Mining Techniques」、「Computational Intelligence and Machine Learning」、「Deep Learning」等科目為例,學員可以由淺入深掌握數據挖掘。「再配合計算機和統計方面的技巧,當取得所需的數據後,如需要作出回應時,便可以加上機器學習和深度學習等人工智能的協助,達至找出有用資訊的目的。」學員亦可從「Data Science for Business」、「Financial Data Analysis」、「Advanced Quantitative Risk Management and Finance」等選修科中掌握商業、金融、財務分析的知識和工具。

此外,近年智能手機興起,帶動了開發新APP的需求。鍾博士舉例,有人將智能手機變成搖控器,設定電器的開關操作,省時省電。「Smart Phone Apps Development」一科,教導學員利用分析統計和所蒐集的數據資料,編寫成手機應用程式。而「Statistical Methods for Network Data」一科,則分析網絡蒐集的數據,是大數據的一門分支,可應用在擷取客戶社交網絡的資訊。課程亦會定期舉辦講座、工作坊等,探討不同行業中,大數據所發揮的作用或者利用深度學習進行預測等議題。

注重多元知識整合 與不同機構合作進行研究  

李教授表示,坊間同類型的課程,大多側重商業應用知識,但未來各行各業的發展和趨勢,其實更渴求擁有統計學和計算機科學這兩方面知識和經驗的人才,因此課程設計以訓練畢業生具備技能可以應付各方面的挑戰為目的。

學員在畢業前,必須完成一個與數據科學相關的大型個人研究「Data Science Project」,鍾博士強調,他們會跟不同機構合作研究項目如商業、醫療、研究或政府部門,利用數據製造模型、撰寫報告,及在課堂上發表研究成果。「學員通過以上研究,學習整合所學的多元知識,實際應用。」除了學院的導師外,合作伙伴機構亦會為學員提供相應指導,充實學習。

他說,過去曾有統計學系和計算機科學系的博士生(兩者合作的典型應用),利用面部識別技術,分析銀行客戶的心情。「相對傳統的問卷調查,新技術更有效了解顧客對產品和員工服務的滿意度。」研究項目得到今年FinTech Hackathon(金融科技「腦力編程馬拉松」)比賽的季軍。 「學院十分鼓勵學員參加比賽,自行研發創新的項目,體現知識和技能的實踐。」

各行各業應用大數據的部分例子:

.天文台「智能氣象監察助理」系統:模擬氣象專家處理天氣大數據,由系統綜合專家的知識,針對香港情,編寫成具體的法則應用在天氣監測上,自動產生可供執行的建議。

.電車公司調配班次:利用無線射頻識別技術收集行車、停站數據,藉此推斷不同時段的客量要求,作出班次調配,令服務更有彈性和效率。

.室內 GPS :顧客在大型商場和展覽場地,可透過室內GPS快捷地找到目標店舖,對視障人士更是理想的導航工具。

.智慧藥盒:透過手機APP提醒病人服藥和藥盒的位置,並保留藥物記錄,方便日後跟進治療,對照顧家居長者帶來方便。

.智能拐杖:偵測長者、使用者有沒有跌倒之外,還具備緊急自動求救、緊急手動求救、照明等功能。

課程Q&A

問:數據科學工作適合具備什麼性格特質或條件的人士報讀?

鍾:既能將數據轉化成知識,又喜歡親自設計和執行的人士最為適合。由於工作涉及很多編寫程式,主要在辦公室工作。從事電腦、工程、金融、行銷或統計工作的人士,都已知道這方面的知識在未來不可或缺。若能及早裝備自己,便能令自己更具優勢。

李:投身者要具備溝通技巧,他們需要跟客戶溝通,要明白客戶的需要,為他們解決問題,成為可以令人信賴的顧問。

問:課堂學習外,學員需要實習嗎?

李:學系鼓勵學員自行安排實習,學系亦與多間機構有聯繫,故在修讀過程中,會安排學員參觀不同投資機構如銀行、醫療部門,了解大數據在該行業的應用;亦會邀請行業專家到校內演講,介紹最近行業趨勢,剛於11月由中華電力公司代表主講的Big Data Opportunities in the Power Industry講座便是一例。 

問:一般學員會遇到哪方面的挑戰?學院又有什麼支援?

鍾:數據科學碩士課程,考試比重較小,學員平日要提交較多的功課或論文。兼讀生因要同時應付工作、家庭和學業,所以平衡生活和時間分配尤其重要。另外,學院為有需要的學員,提供短期Bridging Course,安排在暑期進行。學員可自願修讀數學和電腦程式相關課程「補底」,藉此重溫相關科目的基礎知識,令他日正式上課時較易上手。

問:課堂所教的統計程式或應用軟件會包括哪些?畢業生是否可考取相關的專業資格?

李:課堂上會教授「R」、「Python」、「SAS」等,同學可透過統計程式或應用軟件處理大量和複雜的數據,從而找出有用的資料,它們都是一些數據挖掘和分析常用的軟件。如畢業生具5年或以上統計相關工作經驗,一般可申請成為香港統計學會的 Certified Statistician。

香港大學統計及精算學系

查詢電話:(852) 3917 4152

課程網址:http://www.saasweb.hku.hk/programme/mdasc.php