Tag: 機器學習

  • 港人看台灣的另一面貌 - 新竹科學園區

    港人看台灣的另一面貌 - 新竹科學園區

    上次去新竹高鐵站旁的生物醫學園區,最近則去了新竹科技園區聽人工智能的講座。沒想到最大得著並非講座內容的啟發,反而是多一個角度認識台灣。 新竹確實是科技重鎮,而且給人很興旺的印象。記得曾看過一篇報道,全台灣平均收入最高的里(區域),並非來自台北,而是新竹。該區的生活水平高,曾有居於新竹的父母於網上透露,即便收入高,但生活支出昂貴,不論屋租和孩子學費等,亦較台灣其它地區高。當日從高鐵站乘車前往科技園區,途經所見盡是樓齡新簇簇的高樓,密度不低。而園區外圍,亦有興建中的大型設施。記得現職證券行的友人曾說,兩年前曾有客戶拉隊去新竹買樓花,說某個位置的物業具升值潛力,因為避過了需要塞車的路段,上下班便捷,並以900萬台幣買了小坪數的一房單位,現時物業落成,市值1800萬台幣,兩年間升值一倍!友人說很後悔當日因為預先安排了玩樂節目,沒有參與呢。要知道樓花首期僅一成,即是如果放售,兩年間回報達10倍!扣除稅款,亦有4-5倍回報!新竹大概就像是美國矽谷吧~ 是很有活力兼持續成長中的地方。 新竹科技園區佔地很廣,共有五期,部份還在擴建。交通不算方便,距離新竹高鐵站或台鐵竹中火車站約15分鐘車程,但勝在鄰近兩所大學 - 國立清華大學和國立陽明交通大學。科技園區內有五條免費接駁小巴路線,遊走整個園區、兩所大學,以及火車站和高鐵站等,班次頻密。園區環境清幽,綠化極佳。我未有機會參觀整個園區,直接前往聽講座。內容包括人工智能(機器學習)各式各樣的應用,包括市場推廣(如網上廣告)、金融財經(如程式交易)、健康護理(如X光片影像分析)、智慧工廠、智慧城市、智能機械人、和智能家居等。除此之外,談到發展人工智能,尤其是商業規模、最重要的因素、整個團隊的組合等,也有技術方面如何優化人工智能,以及控制資源用量。整個講座,印象最深刻的內容,除了學術界研究思維和商界開發產品思維的異同,是MLaaS (Machine Learning as a Service),這是非常聰明的概念,亦似乎會是未來趨勢。 在座聽眾大部份是男性,女性只有寥寥數人。雖然上次的生物醫療講座,男女比例較均衡,但這次的聽眾反應較多,演講中段已有問題和反饋,最後的問答環節亦有不少討論。這也許側面反映了台灣不少業界人士,已經應用了機器學習和人工智能,工業和工程產業相對成熟。其實這很合理 - 台灣的的半導體產業、以及電子周邊產品等,都是世界知名,而且全球具一定市佔率。 香港一直以金融業和服務業聞名。港人普遍不太熟悉工業界發展,也相對少接觸需要投入大量資金和長期研發的產業,較習慣以經濟角度看事物。台灣的專長是工業工程吧~ 生物醫療則是發展中階段(從聽眾的反應,就知道熟識這產業的人還不夠普遍)。早前和香港友人茶聚,他是IT 人,並由軟件界踩入硬件。他說在台灣由零開始設計和生產一台程式化的飲料機,整個項目預算較香港便宜一半以上。而所謂在香港設計和生產,其實已包括預算在中國大陸生產機器。所以,台灣在硬件設計和生產成本方面,確實有極大優勢,而且有很多人才! 台灣很大~ 每個區域都有其特色,值得認識發掘。 Facebook 專頁:www.facebook.com/trendalysis

  • 獅子銀行用AI 反洗錢

    友人米奇早前大大讚賞獅子銀行。事緣他收到該行電話查詢某宗信用卡交易,而那宗交易並非友人簽署的,估計信用卡已被盜用。米奇讚賞銀行每日幾千萬宗交易,都注意到兼且反應快,客戶零損失。未知讀者有否類似經驗? 除了個人信用卡消費、存款往來大幅波動等,銀行一直有團隊專責發掘和調查洗錢(money laundering) 的可疑活動。匯豐銀行早前和 Ayasdi 進行12星期的試點方案,運用人工智能和大數據進行分析,令可疑的調查個案總數大幅下降兩成,但匯報要求人類作深入調查的洗錢個案卻沒有下降。結果顯示科技將為匯豐節省大量的人力資源!6月初匯豐公佈和 Ayasdi 合作,令杜絕洗錢活動的調查更有效率。 Ayasdi 是來自矽谷的人工智能初創企業,由2008年成立至今融資了七次合共1.06億美元。共同創辦人兼CEO Gurjeet Singh 是史丹佛大學計算機數學博士,去年10月開始成為匯豐銀行技術顧問董事會員。上週三企業推出專注分析金融服務業數據的 Ayasdi Model Accelerator,目標是減低現時模型中的特質(features)和可變數(variables),令建立和運行模型時的透明度和效率更高。 筆者近來嘗試多閱讀人工智能相關文章,但由於沒技術背景,整體理念始終不容易拿捏。維基百科顯示Ayasdi 是機械智能軟件公司,分析大數據並建立具預測性的模型。Ayasdi 致力大規模的無預設條件自動分析,透過大量的監督(supervised)和非監督(unsupervised) 機器學習演算法,自動找出並排列相關數據,然後以網絡般的地圖顯示結果,幫助分析人員用新方式分類和檢視關連系數。 機器學習除了監督式和非監督學習,還有強化學習(reinforcement learning),即透過獎賞機制讓機器懂得辨別較好的選擇,現時的最佳例子是 AlphaGo。監督學習需要大量數據,而強化學習需要的數據量相對少很多,但始終未能像人類般不經歷都可以學懂。例如不衝紅燈過馬路,人類聽過一次就知道,不需要親身試過。但若以監督學習訓練機器,就需要大量的交通意外數據才能學會避開車輛。至於強化學習,則可能要在學習過程中撞幾千次車,機器才會學懂。 據聞現時非監督學習的應用不廣泛,實質例子少。Ayasdi 同時運用監督和非監督學習分析數據,並套用在不同行業(包括醫療、交易策略、疾病研究、資訊安全,金融服務等),確實是「超級智能」。希望在一年一度的科技界盛事RISE Conference,有機會向Gurjeet Singh 了解更多。 此文同見於《信報》的《價值投資》專欄 Facebook 專頁:www.facebook.com/trendalysis

  • 親睹Machine Learning 辨別靚仔靚女

    過去兩星期,恆指每天都錄得升幅(除了上週三),成交額大概500多至600多億元。而本欄曾提及過的價值投資型股票中,最奪目算是大昌集團(0088.HK)。股價除了創1年新高,更創了3年新高。大昌集團是本地的小型地產商,亦有投資美國的地產業務。以往分析該股,優點包括資產價值大折讓、債務很低、現金流充裕、預期收入不俗,而且股息穩健。缺點是股價波動小兼且交投不活躍,但過去幾天價量齊升,值得投資者注意。詳細分析以及公司估值,可參考舊文,在此不贅,免得被指呃字數。 昨日車品覺兄在《全民大數據》專欄,展望今年的科技發展趨勢時提到:「人工智能與大數據的巨輪將繼續全速前進」。而上星期其中一宗大新聞,是贏遍國際棋手的Master 自揭身份為AlphaGo 升級版。Master 的圍棋對奕結果除令人驚嘆,亦再次掀起廣泛的人工智能技術討論。 其實坊間對「人工智能」至今未有一致的定義,若硬要區分則可嘗試用四個層次觀之。第一級是加裝了控制程式的家電用品,所謂的「內置人工智能」等字眼只是gimmick,實則是系統工學。第二級是典型的人工智能,程式系統的行動模式變化多端。這級別的人工智能可以理解input 和 output 的關係並產生大量組合,實際應用包括醫學診斷。第三級的人工智能,則包含了機器學習程式,系統會根據大數據找出input 和output 的關連,就如模式辨認(pattern recognition),然後自行作出判斷。而近來媒體經常提及人工智能,多數屬於這級別。第四級的人工智能則是加入深度學習,即整個過程中有很多的變數和組合。 人工智能(artificial intelligent)、機器學習(machine learning)和深度學習(deep mind) 都是近來的熱爆詞彙,看到就覺得複雜和技術含量極高。上週筆者參與一個程式員聚會,其中一位講者Andy 即席演示如何使用神經網絡(neural network) 鑑別相中人是男或女。他說坊間有多種相關的開源軟件,讓程式員直接使用,包括Google 的Tensorflow。又笑指深度學習只是多加幾層(layer),增加變數,然後隨即在螢幕上將 code 連貼幾次,令系統更”deep”。然後將預先準備好的1300+ 人類大頭照片輸入,再執行開源碼,系統即多次嘗試分析。一般而言,幾次之後會找到更佳的組合,提升辨認男女的機率。數分鐘就運行完畢,Andy 再輸入10多張照片讓系統辨認,程式根據剛才的學習結果分析,並估算相中人是女性和男性的機率。當晚系統表現不俗,能正確辨認大部分相中男女的性別。這次的即席示範,讓筆者感到機器學習和深度學習技術,並非那麼高深莫測(至少當日的codes 都大致看得懂)。雖然開源碼背後的理論和技術極高階,但就如使用智能電話或搭飛機未必會理解其運作原理,普羅大眾應用AI 和機器學習軟件時,也不需要完全理解背後邏輯。現在是大數據時代,而大數據和人工智能相輔相承。只要數據量夠大,系統記憶體夠多,而且運算速度快,就可應用人工智能技術。 筆者要真正了解人工智能,顯然有極大段距離。套用不同程式員的簡潔解畫,這是本體論(ontology)-將不同數據(包括文字和句子)切割,並以數字表達。而各種數據間的關係,則以數學的多度空間顯示,然後形成龐大的神經網絡… 寫了咁多,整篇文就似「不懂扮懂」的介紹文,兼且和投資扯不上關係。其實,筆者想說明並非只有大公司或研究所,才會探討和開發人工智能和機器學習。既然有開源軟件,任何人只要懂得寫程式,就可以輸入數據測試效果。而當晚有程式員提到股票分析是機器學習的熱門課題。以前市場由人類行為組成,現時已加添了很多程式活動,而未來只會越來越多機器行為,並且以指數式增長。未來的金融市場,不論趨勢策略或經濟循環,都不能和過往相提並論。 此文同見於《信報》的《價值投資》專欄 Facebook 專頁:www.facebook.com/trendalysis