
金融學(xué)如何應(yīng)對人工智能和大數(shù)據(jù)
大數(shù)據(jù)這是一個比較大的話題,同時涉及到了大數(shù)據(jù)和人工智能兩個部分。從大數(shù)據(jù)角度談了一下現(xiàn)階段的發(fā)展對于金融行業(yè)的影響,作為一個在金融服務(wù)類公司從事AI相關(guān)的工作的人,我想從AI方面談?wù)剬τ诮鹑谛袠I(yè)可能有什么影響。
上一個我不成熟的結(jié)論:
金融學(xué)是一個復(fù)雜的學(xué)科,在短時間內(nèi),很難被AI完全替代。在利潤率較高、數(shù)據(jù)結(jié)構(gòu)化較好、問題定義明確的一些方面,AI會大行其道。在不同金融領(lǐng)域的AI如果都能發(fā)展到一定程度時,或許能加速整個金融產(chǎn)業(yè)的AI發(fā)展。
在現(xiàn)階段,金融公司所面臨的數(shù)據(jù)結(jié)構(gòu)化需求遠(yuǎn)遠(yuǎn)高于大數(shù)據(jù)要求。大量的歷史數(shù)據(jù)還并未電子化,甚至現(xiàn)階段大量金融公司新產(chǎn)生的數(shù)據(jù)都還屬于不規(guī)范的格式。
對于金融人才來說,這個時代需要專精金融且能和計算機(jī)從業(yè)者順暢溝通的人才。同時金融學(xué)的進(jìn)一步發(fā)展也需要專業(yè)人才繼續(xù)探索。因此金融完全是需要繼續(xù)學(xué)的,但有所側(cè)重的補(bǔ)充計算機(jī)知識可以為個人和社會帶來更大的價值。
對于金融機(jī)構(gòu)來說,有目的和計劃的在合法的途徑下收集、購買、或生成相關(guān)數(shù)據(jù)將會為未來企業(yè)發(fā)展帶來巨大的優(yōu)勢。對于大型的金融機(jī)構(gòu)/研究機(jī)構(gòu),應(yīng)該繼續(xù)加大在AI領(lǐng)域的投資,從內(nèi)部培養(yǎng)跨金融和AI領(lǐng)域的人才,即使在短時間內(nèi)不能產(chǎn)生直接利潤。
1. 人工智能在金融學(xué)中的應(yīng)用:
大量的機(jī)器學(xué)習(xí)模型已經(jīng)被用于金融實踐當(dāng)中,比如利用機(jī)器學(xué)習(xí)進(jìn)行風(fēng)險預(yù)測或者假賬/錯賬檢測。更多的例子可以輕松的通過搜索引擎獲得,如“人工智能+財務(wù)”。比較值得看的的行業(yè)動向包括各大金融服務(wù)類公司發(fā)布的展望,比如高盛去年年底發(fā)布的人工智能展望,機(jī)器之心有翻譯其中的重要部分。答主本身也在 隨著人工智能的進(jìn)步,財務(wù)工作者會大批失業(yè)么?該如何應(yīng)對? – 知乎 中提到了我們正在開發(fā)審計AI的進(jìn)展與展望。
2. 為什么AI不能完全替代金融學(xué)的各種模型?
A. 無法很好的用AI來定義一個金融問題
現(xiàn)階段比較被商業(yè)化廣泛應(yīng)用的機(jī)器學(xué)習(xí)還是監(jiān)督學(xué)習(xí),而監(jiān)督學(xué)習(xí)要求有明確的問題定義。現(xiàn)在看起來很有希望的強(qiáng)化學(xué)習(xí),遷移學(xué)習(xí)等還并不能大規(guī)模普及應(yīng)用。
以簡單的監(jiān)督學(xué)習(xí)為例,如果你想建立一個模型來預(yù)測企業(yè)并購是否會影響公司股價,那么你需要提供大量并購數(shù)據(jù),以及并購后股價是否發(fā)生了變動。理想情況下,在收集足夠多的并購消息和股價變動信息后,做自然語言分析后提取特征放到機(jī)器學(xué)習(xí)模型里面就大功告成了。
然而在實際情況中:我們無法給出明確的問題定義和邊界。如果想用AI來來制定一個股票交易策略,那么需要考慮進(jìn)去多少因素?僅僅只考慮并購消息就夠了么?越多的 相關(guān)的 因素越可以提高模型的擬合性和準(zhǔn)確性。如宏觀政策和微觀的具體情況都會影響到股價的波動,漏掉其中哪一個都會造成一定的影響,往往是多多益善。在這種情況下,每個問題都需要大量人和數(shù)據(jù)來支撐,這也是為什么大量用AI來預(yù)測股票走勢的探索都無疾而終的原因。
現(xiàn)階段或者可預(yù)見的未來,在很多問題上不會出現(xiàn)這種明確的定義和范圍。
B. AI從業(yè)者和金融從業(yè)者缺乏有效溝通
在很長的時間里面,計算機(jī)和金融學(xué)之間的聯(lián)系相對比較薄弱。作為一個CS背景的人,我個人對于金融/經(jīng)濟(jì)學(xué)的理解還處于比較膚淺的狀態(tài),只理解基本的概念和原理。同樣的,金融服務(wù)類從業(yè)者又缺乏對于AI模型和統(tǒng)計的了解。因此使用AI來推動金融學(xué)發(fā)展需要大量跨領(lǐng)域的人才,至少需要兩個方向都懂的項目經(jīng)理。
C. 金融領(lǐng)域缺乏足夠的大數(shù)據(jù)和人工智能人才儲備
人工智能的火爆,或者說06年Hinton論文后帶起的深度學(xué)習(xí)的老樹開花,并沒有來得及為行業(yè)儲存大量的專業(yè)人才。不難看出,大量一流AI/ML人才還是被互聯(lián)網(wǎng)公司一網(wǎng)打盡,(Hinton在谷歌Lecun 在FB)留給金融服務(wù)類公司的人才并不多。以我們公司舉例,各國分公司的Chief Data Scientist 基本都不是計算機(jī)/統(tǒng)計/數(shù)學(xué)背景出身的科學(xué)家。
D. 投出產(chǎn)出在現(xiàn)階段不成正比,短時間內(nèi)難以獲得收益。在這種情況下,每個問題都需要大量人和數(shù)據(jù)來支撐。因此研究探索型的、不能產(chǎn)生利潤的方向很少有公司來投資AI來進(jìn)行研究的。換言之,有財力提供AI研究的金融公司不多,小型的金融機(jī)構(gòu)或者學(xué)術(shù)機(jī)構(gòu)又缺乏資源(資金,技術(shù)人才,數(shù)據(jù)積累)來進(jìn)行相關(guān)系統(tǒng)的研究。
E. 技術(shù)性的難題還包括很多,比如AI在金融領(lǐng)域應(yīng)該以什么樣的模式存在?是一個軟件,一個網(wǎng)絡(luò)服務(wù),還是一個機(jī)器人。在大量需要與客戶溝通的領(lǐng)域,人機(jī)交互以及如何生成內(nèi)容也是繼續(xù)探索的領(lǐng)域。
3. 金融公司開發(fā)AI需要什么樣的數(shù)據(jù)?
需要結(jié)構(gòu)化的數(shù)據(jù),至少是電子數(shù)據(jù)。像上面第二點A和B中談到的,金融領(lǐng)域的大數(shù)據(jù)化,甚至是數(shù)據(jù)結(jié)構(gòu)化都還有很長的路的要走。以審計為例,很多公司還有大量的票據(jù)都不能無紙化,更不要提AI能夠消化的電子數(shù)據(jù)了。前一陣子我司開發(fā)一個面試AI,但是并沒有原始數(shù)據(jù)可以直接使用。于是我們讓12個剛?cè)肼毜膯T工花了一周時間把我們保留的面試視頻逐字逐句的轉(zhuǎn)譯到文字+特征,整個過程苦不堪言。
因此對于金融公司從現(xiàn)在起就應(yīng)該繼續(xù)大力推進(jìn)數(shù)據(jù)電子化,在數(shù)據(jù)價格便宜的時候從其他公司購買數(shù)據(jù)?;蛟S在不久的將來,數(shù)據(jù)的價格將會高到不可企及的程度。
4. 為什么還是要繼續(xù)從事金融學(xué)研究?如何有所側(cè)重的學(xué)習(xí)?
金融領(lǐng)域的AI化最需要的不是AI專家,也不是金融學(xué)者,而是懂AI的金融從業(yè)者。如果現(xiàn)階段各行各業(yè)都因為人工智能火爆而轉(zhuǎn)向這個方向,只會看到AI泡沫破滅后整個社會的一片狼藉。我們需要各個領(lǐng)域?qū)<襾砀嬖VAI從業(yè)者行業(yè)的痛點,我們需要項目經(jīng)理來領(lǐng)導(dǎo)各行各業(yè)的AI化。
對于已經(jīng)從業(yè)的金融工作者,掌握一些基本的軟件操作技能,遇到新的系統(tǒng)能很快上手,就可以了。至于專門花時間來學(xué)CS,甚至AI/ML,是不大必要的。畢竟最終留給金融從業(yè)者的入口不是數(shù)學(xué)模型或者代碼,而是封裝好的軟件/APP/機(jī)器,不會要求過高的理化背景。更何況AI/ML的學(xué)習(xí)要求如線代統(tǒng)計概率等很多基礎(chǔ)數(shù)學(xué)基礎(chǔ),自學(xué)起來的時間成本很高。
對于正在選擇專業(yè)方向或者轉(zhuǎn)型的年輕人來說,繼續(xù)學(xué)習(xí)金融,探索未知的領(lǐng)域是一條正道。如果有條件的話,多吸收數(shù)據(jù)科學(xué)方向的知識,甚至可以讀一個數(shù)據(jù)科學(xué)的副學(xué)位或者雙學(xué)位。AI時代說到底,我們只要抱著開放的心,選擇迎接新技術(shù),成為最能接受改變那一小部分人,是永遠(yuǎn)都不會失業(yè)的。歷史只會淘汰那些選擇對抗,停滯不前的人:)
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計學(xué)領(lǐng)域,假設(shè)檢驗是驗證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數(shù)據(jù)的科學(xué)計數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點數(shù)據(jù)時的科學(xué)計數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當(dāng)下,精準(zhǔn)營銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價值 在數(shù)據(jù)驅(qū)動決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實踐到業(yè)務(wù)價值挖掘 在數(shù)據(jù)分析場景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價值導(dǎo)向 統(tǒng)計模型作為數(shù)據(jù)分析的核心工具,并非簡單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10