Tag: machine learning

  • 親睹Machine Learning 辨別靚仔靚女

    過去兩星期,恆指每天都錄得升幅(除了上週三),成交額大概500多至600多億元。而本欄曾提及過的價值投資型股票中,最奪目算是大昌集團(0088.HK)。股價除了創1年新高,更創了3年新高。大昌集團是本地的小型地產商,亦有投資美國的地產業務。以往分析該股,優點包括資產價值大折讓、債務很低、現金流充裕、預期收入不俗,而且股息穩健。缺點是股價波動小兼且交投不活躍,但過去幾天價量齊升,值得投資者注意。詳細分析以及公司估值,可參考舊文,在此不贅,免得被指呃字數。 昨日車品覺兄在《全民大數據》專欄,展望今年的科技發展趨勢時提到:「人工智能與大數據的巨輪將繼續全速前進」。而上星期其中一宗大新聞,是贏遍國際棋手的Master 自揭身份為AlphaGo 升級版。Master 的圍棋對奕結果除令人驚嘆,亦再次掀起廣泛的人工智能技術討論。 其實坊間對「人工智能」至今未有一致的定義,若硬要區分則可嘗試用四個層次觀之。第一級是加裝了控制程式的家電用品,所謂的「內置人工智能」等字眼只是gimmick,實則是系統工學。第二級是典型的人工智能,程式系統的行動模式變化多端。這級別的人工智能可以理解input 和 output 的關係並產生大量組合,實際應用包括醫學診斷。第三級的人工智能,則包含了機器學習程式,系統會根據大數據找出input 和output 的關連,就如模式辨認(pattern recognition),然後自行作出判斷。而近來媒體經常提及人工智能,多數屬於這級別。第四級的人工智能則是加入深度學習,即整個過程中有很多的變數和組合。 人工智能(artificial intelligent)、機器學習(machine learning)和深度學習(deep mind) 都是近來的熱爆詞彙,看到就覺得複雜和技術含量極高。上週筆者參與一個程式員聚會,其中一位講者Andy 即席演示如何使用神經網絡(neural network) 鑑別相中人是男或女。他說坊間有多種相關的開源軟件,讓程式員直接使用,包括Google 的Tensorflow。又笑指深度學習只是多加幾層(layer),增加變數,然後隨即在螢幕上將 code 連貼幾次,令系統更”deep”。然後將預先準備好的1300+ 人類大頭照片輸入,再執行開源碼,系統即多次嘗試分析。一般而言,幾次之後會找到更佳的組合,提升辨認男女的機率。數分鐘就運行完畢,Andy 再輸入10多張照片讓系統辨認,程式根據剛才的學習結果分析,並估算相中人是女性和男性的機率。當晚系統表現不俗,能正確辨認大部分相中男女的性別。這次的即席示範,讓筆者感到機器學習和深度學習技術,並非那麼高深莫測(至少當日的codes 都大致看得懂)。雖然開源碼背後的理論和技術極高階,但就如使用智能電話或搭飛機未必會理解其運作原理,普羅大眾應用AI 和機器學習軟件時,也不需要完全理解背後邏輯。現在是大數據時代,而大數據和人工智能相輔相承。只要數據量夠大,系統記憶體夠多,而且運算速度快,就可應用人工智能技術。 筆者要真正了解人工智能,顯然有極大段距離。套用不同程式員的簡潔解畫,這是本體論(ontology)-將不同數據(包括文字和句子)切割,並以數字表達。而各種數據間的關係,則以數學的多度空間顯示,然後形成龐大的神經網絡… 寫了咁多,整篇文就似「不懂扮懂」的介紹文,兼且和投資扯不上關係。其實,筆者想說明並非只有大公司或研究所,才會探討和開發人工智能和機器學習。既然有開源軟件,任何人只要懂得寫程式,就可以輸入數據測試效果。而當晚有程式員提到股票分析是機器學習的熱門課題。以前市場由人類行為組成,現時已加添了很多程式活動,而未來只會越來越多機器行為,並且以指數式增長。未來的金融市場,不論趨勢策略或經濟循環,都不能和過往相提並論。 此文同見於《信報》的《價值投資》專欄 Facebook 專頁:www.facebook.com/trendalysis