
智能投顧一線學員分享:用戶DNA系統(tǒng)項目規(guī)劃和思路
本文整理自智能投顧學員&群友項目交流第一期的內(nèi)容,由誠壹金融科技數(shù)據(jù)產(chǎn)品經(jīng)理劉吉靜分享,主題為《用戶DNA系統(tǒng)項目規(guī)劃和思路》。
“智能投顧高級特訓班”還在如火如荼持續(xù)報名中,課程分為基礎、進階、高級三個階段,在第二階段即將開始之前,AI慕課學院智能投顧群近期發(fā)起了項目分享活動,來自智能投顧從業(yè)者、投資人、銀行產(chǎn)品經(jīng)理等學員互相交流??的學習經(jīng)驗,以及如何在學習課程的過程中解決實際問題。
以下為劉吉靜的分享實錄,編輯做了不改變原意的梳理:
學習心得
現(xiàn)在《智能投顧高級特訓班之基礎課程》已經(jīng)結(jié)束,王蓁博士授課思路很清晰,也很詳細,不僅對使用到的算法加以說明,還將推導過程進行了完整講解,只要跟上王蓁博士的節(jié)奏,這些知識點能順利地掌握。根據(jù)原課程安排,在雷鋒網(wǎng)?AI慕課學院“智能投顧高級特訓班”接下來的進階課程中,王蓁博士將帶來更加詳細、實踐化機器學習算法進階的教程,手把手教你搭建專屬的智能資產(chǎn)配置模型。同時,我對智能投顧進階課程充滿了期待,希望對接下來的框架講解,也能順利地掌握。
項目分享:用戶DNA系統(tǒng)項目規(guī)劃&思路
1、智能投顧:用戶DNA系統(tǒng)
用戶DNA系統(tǒng)是以用戶為中心,整合多渠道信息,通過挖掘業(yè)務增長契機,實現(xiàn)數(shù)據(jù)驅(qū)動的精準運營。用戶DNA系統(tǒng)主要由以下幾模塊構(gòu)成:數(shù)據(jù)收集,收據(jù)整合,用戶畫像,個性化推薦和智能投顧。
(用戶DNA系統(tǒng)落地方案框架)
(用戶DNA系統(tǒng)落地步驟)
(1)通知系統(tǒng):既能將用戶的信息及行為反饋銷售,又能協(xié)助我們完善用戶信息。
(2)標簽管理系統(tǒng):實現(xiàn)標簽的自動化配置及周期性計算。
(3)用戶畫像系統(tǒng):DNA系統(tǒng)的橋梁,抽象出用戶的平臺價值全貌。
(4)用戶提?。簽闋I銷活動、精準營銷、用戶挖掘與分析提供特定用戶群的提取。
2、推薦系統(tǒng)模塊
推薦服務首先需要采集(用戶基本信息、用戶行為信息)到離線存儲,然后在離線環(huán)境下利用推薦算法進行用戶和物品的匹配計算,找出每個用戶可能感興趣的物品集合。通過線下的推薦算法(屬性、行為)找出用戶感興趣的產(chǎn)品后,不一定所有物品都可以推薦給用戶,因此需要通過一個過濾過程。線下找出每個用戶可能感興趣的物品集合后,將這些預先計算好的結(jié)果推送到在線存儲上,最終產(chǎn)品在有用戶訪問時通過在線API向推薦服務發(fā)起請求,獲得該用戶可能感興趣的物品,完成推薦業(yè)務。加上推薦效果的檢測與反饋,便完成一個推薦任務的完整流程。
3、推薦邏輯
(1)基于標簽的冷啟動推薦算法
離線狀態(tài)下根據(jù)用戶tag產(chǎn)出用戶分組,及分組的推薦理財產(chǎn)品。當新用戶注冊時,根據(jù)新用戶的tag,把用戶歸到相應的分組中,并獲取分組的推薦結(jié)果。主要有:K-MEAS聚類和決策樹分類。
(2)基于用戶的協(xié)同過濾
收集用戶行為信息,通過用戶對產(chǎn)品的行為評分。如不同的用戶對不同的作品有不同的評分(瀏覽、預約、參團、購買)而評分接近則意味著用戶相近,便可判定為相似用戶。收集了用戶行為數(shù)據(jù)之后,接下來便要對數(shù)據(jù)進行減噪(去除錯誤信息)與歸一化(權(quán)重與歸一)操作,得到一個用戶偏好的二維矩陣,一維是用戶列表,另一維是物品列表,值是用戶對物品的偏好,一般是 [0,1] 或者 [-1, 1] 的浮點數(shù)值。通過KNN找到相鄰用戶, 通過皮爾遜算法計算相似度,確定推薦結(jié)果。
4、智能投顧模塊
智能投顧模塊主要分為4個部分:智能投顧的流程、實現(xiàn)方案、市場分析、心得體會。
智能投顧的流程:用戶畫像(主觀畫像+客觀畫像),確定投資者類型,輸出理財方案,針對理財方案,提出預期提示。
以下是我們操作的智能投顧實現(xiàn)方案。
方案一:確定投資者類型,輸出理財方案,針對理財方案前期為人工操作,有了一定的數(shù)據(jù)積累之后,機器學習理財師的思路,機器進行上述步驟。而這種方案有一個凸顯的問題,就是系統(tǒng)水平完全依賴理財師。
方案二:確定投資者類型,輸出理財方案,針對理財方案通過算法,得出理財方案,不斷調(diào)參,優(yōu)化模型。這種方案適合中國本土的資產(chǎn)配置模型,算法工程師,wind 數(shù)據(jù)等。
方案三:基于用戶的協(xié)同過濾算法,為相似的用戶推薦相同的理財方案。
針對目前智能投顧市場,從數(shù)據(jù)源、產(chǎn)品思路、團隊組織三個方面做分析——
首先,數(shù)據(jù)源方面,與其他互聯(lián)網(wǎng)行業(yè)相比,金融領域可供機器學習的數(shù)據(jù)“珍貴有限”,我們只能從各個渠道盡可能地合理合法地獲取各方數(shù)據(jù)信息,主要是:場景內(nèi)數(shù)據(jù),平臺自身數(shù)據(jù)以及外部征信數(shù)據(jù);其次,不管是人工智能,還是“人工+智能”,只要能夠高效、低成本的為用戶提供出高收益的理財方案,就是成功的系統(tǒng);最后是團隊組織職能。
專家點評
以下是《智能投顧高級特訓班》主講人王蓁博士對本期分享內(nèi)容做的點評——
王蓁:首先非常感謝劉吉靜女士的精彩分享。下面我就劉女士分享的內(nèi)容談談自己的想法,如有不對,歡迎大家批評指正。
整體來說分享的內(nèi)容很好,細節(jié)上,分享的智能投顧屬于比較特定的構(gòu)建投資組合環(huán)節(jié),我個人認為智投端到端的一整套系統(tǒng)人工智能的應用上,美國的智能投顧和國內(nèi)常見的智能投顧都是符合的,不過確實有真實應用人工智能技術(shù)的智能投顧,并且人工智能在智能投顧的具體應用不限于構(gòu)建投資組合這一個環(huán)節(jié),包括用戶畫像,擇時選基等等,都是可以基于人工智能的。在我對中國銀行實際項目的實施中,智能投顧實際上是包括了分享PPT中的全部流程。
在財富管理領域,分享PPT上闡述的用戶畫像還是大家努力的方向,但因為國內(nèi)人才嚴重缺乏,現(xiàn)在商業(yè)化的主要都是簡單問卷,這也一部分是監(jiān)管的原因。
用戶DNA系統(tǒng)頁,這塊部分分析得很好,在這里我補充一點。實際項目中,驗證效果中你會發(fā)現(xiàn)很難驗證,為什么?因為沒有一個用戶分類結(jié)果的標準答案。版本迭代,其中會涉及到大量的樣本偏差和數(shù)據(jù)缺失的問題,也可以解決。這都是我在實際項目中碰到的真實困難。
推薦系統(tǒng)板塊整體思路很好,其中推薦效果的檢驗方法,其實是使用了營銷的體系,UV,PV,CPS等等類似指標,這樣的好處是便于領導直觀理解。但其中可能存在嚴重的ascertainment bias,數(shù)據(jù)和背后的邏輯可能不一致。其實還可以增加一項效果檢驗方法,推薦人物可以類比搜索的結(jié)果推薦,所以可以計算MAP,DCG等指標,具有很好的說服力。但背后引出一個問題,就是訓練集的獲取怎么做?也可以解決,比如通過半監(jiān)督學習+小樣本重復抽樣獲取。
整體PPT能看出是非常有框架的,是經(jīng)過了大量的討論后的結(jié)果,是一個比較完整的系統(tǒng)。因為系統(tǒng)龐大,所以其中項目實施(如果照著這個框架做)可能需要兩三年甚至更長時間,而且要做好心理準備,預想的問題在實施中輕松解決了,而實際項目中碰到的問題,可能是之前完全沒有預想到的。士不可以不弘毅,不忘初心。
王蓁博士課程推薦
點擊閱讀原文,或掃描下方二維碼了解課程詳情
大神一對一
想跟覃老師一對一交流?在學習中接受付老師的學習指導?更多交流互動請掃碼添加小助手(不定期發(fā)放干貨資料)
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(RNN)家族中,長短期記憶網(wǎng)絡(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準備指南? ? 在數(shù)據(jù)驅(qū)動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認 ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務的價值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預測分析中的應用:從數(shù)據(jù)查詢到趨勢預判? ? 在數(shù)據(jù)驅(qū)動決策的時代,預測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點,而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報考到取證的全攻略? 在數(shù)字經(jīng)濟蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗:捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準 ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應用與實戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗:數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領域中,準確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認證作為國內(nèi)權(quán)威的數(shù)據(jù)分析能力認證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應對策略? 長短期記憶網(wǎng)絡(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(RNN)的一種變體,憑借獨特的門控機制,在 ...
2025-07-07統(tǒng)計學方法在市場調(diào)研數(shù)據(jù)中的深度應用? 市場調(diào)研是企業(yè)洞察市場動態(tài)、了解消費者需求的重要途徑,而統(tǒng)計學方法則是市場調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準確性的基礎 ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03