金融數據科學家的崛起勢不可擋

大數據改變了資本市場格局,對金融分析師需求日益增長
英國數學家Clive Humby早於2006年便提出「數據是新的石油」。此言一出,各界紛紛爭奪數據資源,其中以金融機構最積極將數據轉化為利潤。正如原油需經歷開採與精煉,原始數據也需要提取和加工,於是,被稱為「新煉金術士」的數據科學家由此成為一個新興行業。
數據科學家運用統計學、計算機科學及領域知識的技能組合,從海量數據中提煉有意義的洞見。這專業快速增長,已超越人才供應的速度。金融機構不但要在同業間競爭,更需與科技公司角逐,以吸納頂級的數據專家。
「過去二十年,金融機構大幅提升招聘數據科學家的力度。」香港中文大學(中大)商學院金融學系助理教授趙贊翼表示。「機構投資者會按戰略調整投資組合配置及招聘決策,務使數據科學家創造最大的效益。」

趙教授與同系的副教授岑岭在分析華爾街數據科學家人力資源時,發現了顯著的增長趨勢,從2008年的11,799人,經歷次貸危機後輕微下跌,其後反彈急增四倍,至2021年達到57,050人。摩根士丹利、瑞信及高盛是招聘最多數據科學家的三大公司。不同公司招聘人才的數量或多或少,亦導致數據科學家的集中程度不同。
惟研究發現,如果部分投資者透過增聘數據科學家,對特定股票掌握更充分的數據與分析,便可發掘其他市場參與者未知的額外資訊。獨家資訊將使該等投資者降低交易頻率與進取性,從而拖慢有用資訊反映在股價的速度。
趙教授進一步闡釋:「數據科學家之間的競爭加速了私有資訊的生成與流通,但如果針對某股票的數據科學家集中度過高,反而會削弱其在資本市場的價格資訊含量。」
數據科學家是否當代邁達斯?
在題為《華爾街的數據科學家》的論文中,趙教授、岑教授、多倫多大學韓冰教授及史蒂文斯理工學院韓彥如教授等人通過Revelio Lab(其數據源涵蓋領英、Indeed等招聘網站)收集了詳盡的履歷數據。
研究人員將數據集與路孚特(Refinitiv)及湯森路透全球持股資訊(Thomson Reuters Global Ownership)數據合併,並通過美國ONET職業分類編碼系統進一步識別數據科學家職位,最終鎖定2008年至2021年間,3,126家機構投資者聘用的326,627名獨立數據科學家的資訊。
該研究將所有數據科學家分為三類:收集與整理數據的「數據收集者」、為商業決策評估數據的「數據分析師」,以及處理儲存與保護數據的「數據維護員」。其中,以數據分析對交易盈利水平產生的影響最顯著,這意味數據分析能為投資決策提供最直接而具價值的洞見。
研究顯示,聘用更多數據科學家的機構投資者能獲得更高利潤。每增聘一名數據科學家,季度「異常利潤」(即超出標準資產定價模型預測的超額回報)便會增加0.004個百分點,機構平均交易盈利水平則提高13%。
趙教授指出:「數據科學家通過收集、維護及分析大規模數據(特別針對另類數據),協助金融機構識別錯誤定價的資產﹐從而獲取異常利潤。其專業洞見使機構作出帶來盈利的交易決策,其中分析師對賺取投資回報的影響最大。」
不平等的數據獲取途徑帶來不平等的回報
由於多個機構投資者可能持有相同股票,研究人員進一步分析數據科學家在集中度上的差異。具體而言:股票A由10家機構持有,其中一家擁有10名數據科學家,其餘9家並無數據科學家;股票B同樣由10家機構持有,每家均有1名數據科學家。儘管研究兩支股票的數據科學家總數相同,股票A的數據科學家比股票B的更集中。
在股票A的案例中,擁有更多數據科學家的投資者因集中資源於單一股票,獲得分析優勢;在股票B的案例中,各投資者資源趨同,令提取與利用資訊的競爭更激烈,最終削弱資訊優勢。
當擁有集中數據科學家的少數投資者,策略性地將資產配置在少量股票時,他們便享有「資訊壟斷」——關鍵的投資洞見僅集中於少數機構。此種特權並不外享。

「真正削減價格資訊含量的關鍵因素並非數據科學家的數量,而在於其集中程度。當數據科學家集中在少數機構投資者,這些機構投資者便會形成資訊壟斷,並減低了快速交易的誘因。」趙教授指出。「為維持優勢,該類投資者會進行審慎交易,既減慢資訊融入股價的進程,又阻礙資訊在整體市場的流通。」
研究人員還發現,聘用更多數據科學家的機構投資者持有更集中的投資組合。數據科學家集中度每提升一個標準差,價格資訊含量便下降11%。趙教授表示:「這種資訊集中現象使具價值的投資洞見只掌握於少數投資者手中,無法透過股價反映,因此價格形成機制的效率便會降低。」
組建頂尖數據團隊的博弈
機構投資者為在競爭中搶佔先機,使增聘數據科學家變為新戰場。意識到落後於同行的投資者將加大招聘力度,特別是數據分析崗位。
經常進行股票交易、業務覆蓋廣泛行業,加上資產龐大的金融機構,往往更積極擴充其數據團隊,這正是對沖基金較退休基金與銀行聘用更多數據科學家的原因。這些投資者策略性地觀察並回應競爭對手的招聘活動,而非盲目跟隨普遍趨勢。曾在競爭對手公司工作的數據科學家也受到追捧,使得人才競逐呈白熱化趨勢。
另外,數據人才招聘數量與本地高校數據科學本科項目數量呈現正相關,表明勞動力市場的供應會影響金融機構的聘用規模。
「金融市場中的數據科學職位將持續快速增長,其專業化程度與戰略重要性同步攀升。」趙教授說。「隨著金融機構與科技公司的競爭加劇,數據人才的薪資溢價或會擴大、分析技術亦會越趨精密,甚至可能出現針對資訊壟斷引致效率成本問題的監管。」
儘管研究所用數據源於美國機構投資者,趙教授認為其研究發現對中國等新興市場亦具啟示。「數據人才競爭與資訊優勢價值是普遍的市場動態,但監管差異、市場效率的不同水平及數據可獲取性的潛在差異,可能對這些效應在新興市場的顯現強度產生影響。」