
大數(shù)據(jù)將如何顛覆投資管理
近年來(lái),大數(shù)據(jù)成為了熱門詞匯。作為一種新的分析方法,大數(shù)據(jù)正運(yùn)用在許多行業(yè)當(dāng)中。但目前投資經(jīng)理采用大數(shù)據(jù)技術(shù)相當(dāng)有限,這可能為投資管理行業(yè)打開(kāi)一扇“機(jī)會(huì)之窗”。
利用大數(shù)據(jù)擴(kuò)展模型 進(jìn)行“信息套利”
在信息時(shí)代,利用大數(shù)據(jù)做交易的投資經(jīng)理將會(huì)遠(yuǎn)遠(yuǎn)走在同行之前,在他們的擴(kuò)展模型和那些運(yùn)用傳統(tǒng)分析工具的模型之間進(jìn)行“信息套利”。
隨著大數(shù)據(jù)分析方法進(jìn)一步提高數(shù)據(jù)容量、多樣性以及更新頻率,在過(guò)去10年,系統(tǒng)化交易模型的創(chuàng)新技術(shù)加速發(fā)展,定量分析與定性分析之間的差別將逐漸消失。
定量基本面分析師可采用大數(shù)據(jù)技術(shù),將所要驗(yàn)證的變量擴(kuò)展到行為、看法和感知反饋等數(shù)據(jù),而這些領(lǐng)域以前只屬于自主基本面分析師(discretionary fundamental researchers )。這提供了一個(gè)更廣泛的模型:通過(guò)使用一組新的數(shù)據(jù),來(lái)解釋相關(guān)的、類似的、最優(yōu)的和低劣的數(shù)值。而這些新的數(shù)據(jù)沒(méi)有被納入傳統(tǒng)的投資模型當(dāng)中。這就在運(yùn)用大數(shù)據(jù)技術(shù)的公司和那些沒(méi)有運(yùn)用大數(shù)據(jù)公司之間,創(chuàng)造了“信息套利”的可能性。
與現(xiàn)有模型的數(shù)據(jù)量和處理速度相同的情況下,系統(tǒng)性交易模型可處理新的輸入數(shù)據(jù)。新程序可能尋找大量輸入數(shù)據(jù)之間的相關(guān)性,而不是在傳統(tǒng)數(shù)據(jù)集中簡(jiǎn)單地選擇基于分析的交易,從而能夠識(shí)別新的交易模式,這些模式將價(jià)格活動(dòng)與非價(jià)格相關(guān)的變量聯(lián)系起來(lái)?!岸嘁蛩亍钡南到y(tǒng)化程序使用了更廣泛的數(shù)據(jù)集,能夠?qū)崿F(xiàn)當(dāng)前系統(tǒng)所沒(méi)有的信息優(yōu)勢(shì)。
如果新的建模能力與大數(shù)據(jù)分析方法相結(jié)合,比如預(yù)測(cè)分析和機(jī)器學(xué)習(xí),就可以通過(guò)這些能“思考”的模型得出前瞻性的結(jié)論,從而改變投資研究的性質(zhì)。這將導(dǎo)致關(guān)注價(jià)值的定量基本面模型和關(guān)注價(jià)格的系統(tǒng)性交易程序趨于一致。結(jié)果可能會(huì)形成一種新的自動(dòng)投資組合管理模型,該模型關(guān)注“未來(lái)價(jià)值”,并對(duì)一些還未發(fā)生的或還未公布的“可能性”事件起作用。
大數(shù)據(jù)將消除定性分析與定量分析的差別
新模型的關(guān)鍵將是擴(kuò)展當(dāng)前可用數(shù)據(jù)的閾值,采納新的數(shù)據(jù)源。而這些數(shù)據(jù)反映人們的觀點(diǎn)、行為和動(dòng)作,有助于自主基本面研究人員做出投資決策。新模型可能不會(huì)完全包含所有的數(shù)據(jù),但擴(kuò)展數(shù)據(jù)將使量化模型能更深入地研究,更廣泛地假設(shè)。
以石油和天然氣行業(yè)為例,假設(shè)有一家名為ABC的公司。基于資產(chǎn)負(fù)債表等財(cái)務(wù)報(bào)表,自主投資組合基金經(jīng)理和定量分析師的定量模型可能都創(chuàng)建了該行業(yè)中重要公司的相對(duì)排名。而這是目前大部分的定量模型能夠走到最遠(yuǎn)的一步了。
與此同時(shí),自主基本面投資組合經(jīng)理能夠與企業(yè)高管交談,并從他們的肢體語(yǔ)言中體會(huì)到他們對(duì)下一個(gè)季度所表現(xiàn)出來(lái)的興奮或緊張。自主基金經(jīng)理可能開(kāi)始領(lǐng)悟到更多關(guān)于公司的近期活動(dòng),如果他們感覺(jué)到公司活動(dòng)不同尋常的繁忙或平靜,他們甚至可能會(huì)造訪并觀察公司的辦公室或一些設(shè)施。他們還可能會(huì)聯(lián)系業(yè)內(nèi)人士,詢問(wèn)他們是否察覺(jué)到投機(jī)機(jī)會(huì)或聽(tīng)說(shuō)一些有意思的、新的人事變動(dòng)。
通過(guò)上述努力,自主基本面基金經(jīng)理認(rèn)為,ABC公司的CFO看起來(lái)比通常更樂(lè)觀,并且公司的新聞里多次提到一些重要高管在過(guò)去一年如何增加了研發(fā)預(yù)算。
將上述的解釋和預(yù)測(cè)進(jìn)行“數(shù)據(jù)化”之后,定量投資模型也能得到相同的結(jié)果。
過(guò)去18個(gè)月,語(yǔ)言程序利用情感分析,發(fā)現(xiàn)ABC公司公開(kāi)使用的積極詞匯和消極詞匯的比例有明顯變化,積極詞匯更多而消極詞匯變少。過(guò)去4個(gè)月,積極詞匯加速增多。通過(guò)程序識(shí)別,ABC公司高管在最新一年的新聞稿和采訪中使用“研發(fā)”一詞的頻率,較此前12個(gè)月上升了182%。此外,“勘探”與“擴(kuò)張”使用頻率也增加。
定量模型將這些高頻詞匯與提到ABC公司未開(kāi)發(fā)油田的公開(kāi)記錄聯(lián)系起來(lái),來(lái)確定是否有新文件公布出來(lái),并了解這些未開(kāi)發(fā)油田的地理位置。量化模型提取出每個(gè)油田的衛(wèi)星圖片,并進(jìn)行時(shí)間序列圖像分析,從而確定哪些油田的地貌有明顯變化。分析結(jié)果顯示,中非和撒哈拉以南非洲地區(qū)均出現(xiàn)顯著變化。那么,量化模型的這一結(jié)論與上述自主基本面分析師所預(yù)測(cè)的一致,ABC公司將在中非或撒哈拉以南非洲地區(qū)開(kāi)發(fā)新油田。
另外,模型將ABC公司駐非洲員工在社交網(wǎng)站上的照片進(jìn)行定位分析。比如,在20位員工中,有16位定位在撒哈拉以南非洲地區(qū),有2位員工出現(xiàn)在中非地區(qū)。這一系列因素結(jié)合此前的預(yù)測(cè)模型,可以斷定,ABC公司將建立新的油田生產(chǎn)設(shè)施。模型還可以更進(jìn)一步,通過(guò)分析撒哈拉以南非洲辦公室的建設(shè)進(jìn)程,判斷油田可能將在三個(gè)月后開(kāi)始生產(chǎn)。
綜上所述,基于還沒(méi)宣布的未來(lái)事件,自主基本面投資組合經(jīng)理和量化模型都將會(huì)做多ABC公司。
新型“未來(lái)價(jià)值”模型可能出現(xiàn)
隨著構(gòu)建新定量模型經(jīng)驗(yàn)豐富,以及系統(tǒng)化交易程序能夠識(shí)別越來(lái)越多的定價(jià)模式,可能會(huì)產(chǎn)生新型系統(tǒng)化組合管理模型,該模型將交易選擇基于公司可能的“未來(lái)價(jià)值”。
這些未來(lái)價(jià)值模型開(kāi)始于未來(lái)事件的輸出(future event output)(如預(yù)計(jì)ABC公司將會(huì)宣布開(kāi)發(fā)新油田)。新模型將未來(lái)事件進(jìn)行分類,并從歷史記錄中尋找ABC公司及其同行的類似公告,將這些公告日期標(biāo)記起來(lái),檢索事件前后的幾個(gè)星期內(nèi)相關(guān)公司的圖表。
公司某些新聞可能會(huì)引發(fā)價(jià)格變動(dòng),定價(jià)模型可將平均價(jià)格變動(dòng)幅度和持續(xù)時(shí)間進(jìn)行量化。模型將檢查公司過(guò)去90天的活動(dòng),并確定是否有最相近的先例。模型每天都重新評(píng)估當(dāng)前和歷史的價(jià)格模式,并基于不斷完善的數(shù)據(jù)來(lái)確定價(jià)格上漲還是降低。
若事件公布正如預(yù)期,當(dāng)預(yù)期價(jià)格變動(dòng)幅度和持續(xù)時(shí)間已實(shí)現(xiàn),模型就會(huì)關(guān)閉頭寸。如果事件不在特定窗口公布出來(lái),而預(yù)測(cè)分析發(fā)生了變化,并且ABC公司發(fā)出公告的可能性降低,模型會(huì)關(guān)閉頭寸或更早關(guān)閉頭寸。
大數(shù)據(jù)使用的其它例子
A公司通過(guò)分析社交媒體的數(shù)據(jù),比較該公司與同行業(yè)的B公司在社交媒體上的活躍程度,以判斷其廣告活動(dòng)是否取得成功。
一些公司通過(guò)觀察中國(guó)建設(shè)活動(dòng)的衛(wèi)星圖片,來(lái)衡量中國(guó)經(jīng)濟(jì)是否穩(wěn)健。
在官方調(diào)查報(bào)告出爐前,投資經(jīng)理剖析消費(fèi)者信用卡的交易數(shù)據(jù)以及旗艦店停車場(chǎng)汽車的數(shù)量,來(lái)預(yù)測(cè)零售活動(dòng)。
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實(shí)戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無(wú)論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫(kù)管理中,“大表” 始終是性能優(yōu)化繞不開(kāi)的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫(kù)表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動(dòng)態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開(kāi)始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價(jià)值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫(kù)表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實(shí)戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫(kù))處理 Excel 數(shù)據(jù)時(shí),“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗(yàn)與 t 檢驗(yàn):差異、適用場(chǎng)景與實(shí)踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計(jì)學(xué)領(lǐng)域,假設(shè)檢驗(yàn)是驗(yàn)證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤(pán)手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計(jì)劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計(jì)劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對(duì)象的 text 與 content:區(qū)別、場(chǎng)景與實(shí)踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請(qǐng)求開(kāi)發(fā)時(shí)(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價(jià)值的核心操盤(pán)手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫(kù)表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請(qǐng)求工具對(duì)比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請(qǐng)求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)的科學(xué)計(jì)數(shù)法問(wèn)題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)時(shí)的科學(xué)計(jì)數(shù)法問(wèn)題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價(jià)值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營(yíng)問(wèn)題、提升執(zhí)行效率的核心手段,其價(jià)值 ...
2025-09-12用 SQL 驗(yàn)證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實(shí)戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過(guò)程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計(jì)” 與 “用戶體驗(yàn) ...
2025-09-11塔吉特百貨孕婦營(yíng)銷案例:數(shù)據(jù)驅(qū)動(dòng)下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見(jiàn)頂” 的當(dāng)下,精準(zhǔn)營(yíng)銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價(jià)值 在數(shù)據(jù)驅(qū)動(dòng)決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實(shí)踐到業(yè)務(wù)價(jià)值挖掘 在數(shù)據(jù)分析場(chǎng)景中,聚類分析作為 “無(wú)監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計(jì)模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價(jià)值導(dǎo)向 統(tǒng)計(jì)模型作為數(shù)據(jù)分析的核心工具,并非簡(jiǎn)單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10