
數(shù)據(jù)機(jī)器人幫你創(chuàng)造大數(shù)據(jù)商業(yè)價(jià)值
在大數(shù)據(jù)概念似乎與每個(gè)公司乃至每個(gè)人都緊密相關(guān)的今日,如果有人問(wèn)大數(shù)據(jù)到底是什么?怎樣才能讓大數(shù)據(jù)為我創(chuàng)造實(shí)實(shí)在在的價(jià)值?大部分時(shí)候,你所得到的答案或者艱澀難懂,或者虛無(wú)縹緲,比如說(shuō)3V(Volume(容量)、Velocity(速度)和Variety(多樣性)),甚至是5V (再加上Veracity(真實(shí)性)和Value(價(jià)值)),又或者“結(jié)構(gòu)化數(shù)據(jù)”和“半結(jié)構(gòu)化數(shù)據(jù)”。上到天體太空,下到海底勘探,大到教育文化,小到細(xì)胞DNA,總有一款可以迷惑你。
或許真相是,想在在大數(shù)據(jù)時(shí)代乘風(fēng)破浪勇奪先機(jī),你根本不需要知道這些。中國(guó)有句老話,術(shù)業(yè)有專攻。從大數(shù)據(jù)到商業(yè)價(jià)值,你需要的只是根據(jù)業(yè)務(wù)經(jīng)驗(yàn)提出需求和目標(biāo),其他的一切都可以交給數(shù)據(jù)機(jī)器人來(lái)搞定。
聽(tīng)起來(lái)像是一個(gè)神話?其實(shí)這一切已經(jīng)在發(fā)生。
“讓天下沒(méi)有難用的數(shù)據(jù),讓人人都可以成為數(shù)據(jù)科學(xué)家?!笔翘覙?shù)科技創(chuàng)始人最初的理想。桃樹(shù)科技起源于2015年,其創(chuàng)始人楊滔和汪秦宇均為海歸博士,在美中兩國(guó)頂級(jí)互聯(lián)網(wǎng)及金融公司具有資深的大數(shù)據(jù)技術(shù)和管理經(jīng)驗(yàn),因?yàn)榭礈?zhǔn)了大數(shù)據(jù)領(lǐng)域全自動(dòng)建模預(yù)測(cè)這一趨勢(shì),毅然放棄穩(wěn)定高薪的大公司職位,轉(zhuǎn)而投身創(chuàng)業(yè)這一荊棘艱險(xiǎn)之旅。
如前文提到,大數(shù)據(jù)似乎可以在各個(gè)領(lǐng)域落地,但是能真正產(chǎn)生爆發(fā)效應(yīng)的領(lǐng)域卻并不多。根據(jù)多年的大數(shù)據(jù)應(yīng)用經(jīng)驗(yàn),桃樹(shù)選擇了金融和電商大數(shù)據(jù)應(yīng)用為公司起步的切入點(diǎn)。在金融領(lǐng)域,數(shù)據(jù)應(yīng)用的需求屬于剛需。尤其銀行對(duì)貸款客戶信用的評(píng)估關(guān)系到銀行壞賬率的比例。在電商領(lǐng)域,大數(shù)據(jù)應(yīng)用可以產(chǎn)生規(guī)模化效應(yīng),形成數(shù)據(jù)積累的閉環(huán),最終帶動(dòng)流量的獲取。
信用風(fēng)險(xiǎn)評(píng)估機(jī)器人:CAN
“極客看什么不順眼,就自己動(dòng)手做一個(gè)?!币詳?shù)據(jù)極客自詡的楊滔這樣說(shuō),“大數(shù)據(jù)應(yīng)用的廣泛訴求,就是輸入數(shù)據(jù),輸出結(jié)果。”于是他創(chuàng)造了第一個(gè)數(shù)據(jù)機(jī)器人CAN。CAN是一個(gè)專門應(yīng)用于金融行業(yè)的風(fēng)險(xiǎn)評(píng)估機(jī)器人。在以民生銀行為代表的多家知名銀行和互聯(lián)網(wǎng)金融機(jī)構(gòu)中,都已經(jīng)存在CAN的身影。當(dāng)你給這臺(tái)機(jī)器輸入散落在各個(gè)角落的原始數(shù)據(jù),它便如同一匹永不疲憊的戰(zhàn)馬夜以繼日地飛奔,輸出銀行/p2p中申請(qǐng)貸款客戶的信用打分及每個(gè)客戶的風(fēng)險(xiǎn)點(diǎn)。這臺(tái)機(jī)器,可以提早發(fā)現(xiàn)這些金融機(jī)構(gòu)貸款業(yè)務(wù)中90%以上的貸款壞賬,并且可以提早預(yù)測(cè)客戶是否逾期歸還貸款,預(yù)測(cè)準(zhǔn)確率均在80%以上。傳統(tǒng)的銀行風(fēng)險(xiǎn)建模一般一個(gè)數(shù)據(jù)團(tuán)隊(duì)工作3到6個(gè)月,而CAN只需要3天。
無(wú)論是數(shù)據(jù)的清洗整理,還是算法的復(fù)雜處理,都是CAN的內(nèi)在機(jī)制。對(duì)于銀行客戶經(jīng)理,CAN提供的數(shù)據(jù)結(jié)果無(wú)比簡(jiǎn)單——客戶經(jīng)理負(fù)責(zé)客戶的信用風(fēng)險(xiǎn)打分及對(duì)應(yīng)的風(fēng)險(xiǎn)因子。CAN建立了這個(gè)數(shù)據(jù)提煉機(jī)制之后,自然把外部大量數(shù)據(jù)與內(nèi)部數(shù)據(jù)動(dòng)態(tài)整合,整合后的風(fēng)險(xiǎn)數(shù)據(jù)不僅包括客戶的基本信息、金融行為、動(dòng)態(tài)還款行為,并且還包括客戶以及他的網(wǎng)絡(luò)關(guān)系對(duì)應(yīng)的央行征信數(shù)據(jù)、法院工商數(shù)據(jù)、房產(chǎn)資產(chǎn)數(shù)據(jù)以及在P2P平臺(tái)上的貸款及表現(xiàn)數(shù)據(jù)等。從臟亂復(fù)雜的大數(shù)據(jù)到包含豐富預(yù)測(cè)信息的大數(shù)據(jù),正是CAN的輸入和輸出。
當(dāng)客戶經(jīng)理負(fù)責(zé)客戶出現(xiàn)風(fēng)險(xiǎn),他將第一時(shí)間獲得風(fēng)險(xiǎn)預(yù)警,并可以根據(jù)CAN輸出的風(fēng)險(xiǎn)因子去追蹤事實(shí)真相。對(duì)于銀行客戶經(jīng)理,大數(shù)據(jù)經(jīng)過(guò)CAN的處理,成為在他們?nèi)粘I(yè)務(wù)流程中的“決策抓手”。大數(shù)據(jù)遠(yuǎn)在天邊,也近在眼前。
商品銷量預(yù)測(cè)機(jī)器人:BOB
在CAN被多家銀行客戶高度認(rèn)可之后,楊滔又帶領(lǐng)他的團(tuán)隊(duì)開(kāi)發(fā)了桃樹(shù)機(jī)器人工廠的第二個(gè)機(jī)器人BOB。BOB是一款選品機(jī)器人,它可以基于商品的行業(yè)、類目、關(guān)鍵字、款式、價(jià)格、產(chǎn)地和營(yíng)銷渠道數(shù)據(jù),預(yù)測(cè)商品在一定流量中,不同的場(chǎng)景、時(shí)間下,可獲得的成交額(或轉(zhuǎn)化率)。
電商運(yùn)營(yíng)的第一個(gè)環(huán)節(jié)就是選品。選品包括商品采購(gòu)、營(yíng)銷活動(dòng)爆款篩洗、商品排序規(guī)則等。B2C選品好壞直接關(guān)系庫(kù)存積壓,電商平臺(tái)選品好壞直接關(guān)系流量分配機(jī)制,淘寶賣家如果無(wú)法打造爆款根本獲得不到流量,導(dǎo)購(gòu)網(wǎng)站其實(shí)也就是一個(gè)選品系統(tǒng)。傳統(tǒng)電商選品主要依賴行業(yè)經(jīng)驗(yàn),運(yùn)營(yíng)人員通過(guò)對(duì)不同行業(yè)的經(jīng)驗(yàn)來(lái)判斷什么商品會(huì)賣得好。這種運(yùn)營(yíng)方式的局限在于難以規(guī)?;?,并且還有腐敗可能性。并且,在互聯(lián)網(wǎng)上,所有商品信息都不是孤立的,消費(fèi)者往往會(huì)比價(jià),從多個(gè)電商平臺(tái)找到性價(jià)比最優(yōu)的商品。因此,綜合電商自身與外部數(shù)據(jù)的選品,才有可能滿足消費(fèi)者需求。
選品機(jī)器人BOB的誕生,直擊電商行業(yè)發(fā)展的基礎(chǔ)痛點(diǎn):1. 商家面對(duì)十幾億海量商品,不知如何選則適合自己平臺(tái)的客群的商品; 2. 除了淘寶京東這樣的大型平臺(tái),一般的中小電商迷失在海量數(shù)據(jù)中,缺乏利用數(shù)據(jù)幫助運(yùn)營(yíng)的知識(shí)。這些中小電商,在互聯(lián)網(wǎng)時(shí)代依舊依賴傳統(tǒng)的人工經(jīng)驗(yàn)判斷來(lái)進(jìn)行決策,效率低下;3. 電商數(shù)據(jù)應(yīng)用的技術(shù)門檻極高,商家面臨大量非結(jié)構(gòu)化文本數(shù)據(jù),圖像數(shù)據(jù),中小賣家卻往往沒(méi)有能力建立數(shù)據(jù)科學(xué)團(tuán)隊(duì),無(wú)法充分利用大數(shù)據(jù)幫助決策。
這一切問(wèn)題,BOB都可以全自動(dòng)化的解決。BOB起源于利用機(jī)器學(xué)習(xí)技術(shù)建立大規(guī)模商品銷量預(yù)測(cè)模型。此模型成功幫助電商巨頭淘寶旗下的聚劃算平臺(tái)實(shí)現(xiàn)數(shù)據(jù)化運(yùn)營(yíng),挖掘爆款,提升運(yùn)營(yíng)效率80%,提升銷售額235%。桃樹(shù)科技成立的短短數(shù)月間,已經(jīng)與多家電商網(wǎng)站展開(kāi)洽談,并與新興電商網(wǎng)站街蜜以及風(fēng)趣海淘簽署了服務(wù)協(xié)議。
桃樹(shù)的夢(mèng)想,是讓天下沒(méi)有難用的數(shù)據(jù),讓人人都可以成為數(shù)據(jù)科學(xué)家。
在執(zhí)著追尋這個(gè)夢(mèng)想的路上,楊滔帶領(lǐng)著他的團(tuán)隊(duì)不斷壯大著他們的機(jī)器人工廠,這些機(jī)器人個(gè)個(gè)武藝高超,兼?zhèn)鋸臄?shù)據(jù)源自動(dòng)清洗數(shù)據(jù),抽取特征,并自動(dòng)學(xué)習(xí)、預(yù)測(cè)、解釋及強(qiáng)化自我的能力。它們內(nèi)置了世界頂級(jí)數(shù)據(jù)科學(xué)家的智慧精華,擁有讓數(shù)據(jù)價(jià)值最大化的計(jì)算程序,可以模擬數(shù)據(jù)科學(xué)家工作流,肩負(fù)著將各行各業(yè)的大數(shù)據(jù)高效率轉(zhuǎn)化為商業(yè)價(jià)值的使命。
阿姆斯特朗踏上月球時(shí)曾經(jīng)說(shuō)過(guò):“這是一個(gè)人的一小步,卻是人類的一大步。”如今,人類憑著對(duì)知識(shí)無(wú)窮盡的渴望與狂熱,已經(jīng)邁出了一步又一步。
楊滔說(shuō):“大數(shù)據(jù)的0到1,其實(shí)就是人的99到100?!?
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
數(shù)據(jù)分析師的技能圖譜:從數(shù)據(jù)到價(jià)值的橋梁? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代,數(shù)據(jù)分析師如同 “數(shù)據(jù)翻譯官”,將冰冷的數(shù)字轉(zhuǎn)化為清晰的 ...
2025-07-17Pandas 寫入指定行數(shù)據(jù):數(shù)據(jù)精細(xì)化管理的核心技能? 在數(shù)據(jù)處理的日常工作中,我們常常需要面對(duì)這樣的場(chǎng)景:在龐大的數(shù)據(jù)集里精 ...
2025-07-17解碼 CDA:數(shù)據(jù)時(shí)代的通行證? 在數(shù)字化浪潮席卷全球的今天,當(dāng)企業(yè)決策者盯著屏幕上跳動(dòng)的數(shù)據(jù)曲線尋找增長(zhǎng)密碼,當(dāng)科研人員在 ...
2025-07-17CDA 精益業(yè)務(wù)數(shù)據(jù)分析:數(shù)據(jù)驅(qū)動(dòng)業(yè)務(wù)增長(zhǎng)的實(shí)戰(zhàn)方法論 在企業(yè)數(shù)字化轉(zhuǎn)型的浪潮中,“數(shù)據(jù)分析” 已從 “加分項(xiàng)” 成為 “必修課 ...
2025-07-16MySQL 中 ADD KEY 與 ADD INDEX 詳解:用法、差異與優(yōu)化實(shí)踐 在 MySQL 數(shù)據(jù)庫(kù)表結(jié)構(gòu)設(shè)計(jì)中,索引是提升查詢性能的核心手段。無(wú)論 ...
2025-07-16解析 MySQL Update 語(yǔ)句中 “query end” 狀態(tài):含義、成因與優(yōu)化指南? 在 MySQL 數(shù)據(jù)庫(kù)的日常運(yùn)維與開(kāi)發(fā)中,開(kāi)發(fā)者和 DBA 常會(huì) ...
2025-07-16如何考取數(shù)據(jù)分析師證書:以 CDA 為例? ? 在數(shù)字化浪潮席卷各行各業(yè)的當(dāng)下,數(shù)據(jù)分析師已然成為企業(yè)挖掘數(shù)據(jù)價(jià)值、驅(qū)動(dòng)決策的 ...
2025-07-15CDA 精益業(yè)務(wù)數(shù)據(jù)分析:驅(qū)動(dòng)企業(yè)高效決策的核心引擎? 在數(shù)字經(jīng)濟(jì)時(shí)代,企業(yè)面臨著前所未有的數(shù)據(jù)洪流,如何從海量數(shù)據(jù)中提取有 ...
2025-07-15MySQL 無(wú)外鍵關(guān)聯(lián)表的 JOIN 實(shí)戰(zhàn):數(shù)據(jù)整合的靈活之道? 在 MySQL 數(shù)據(jù)庫(kù)的日常操作中,我們經(jīng)常會(huì)遇到需要整合多張表數(shù)據(jù)的場(chǎng)景 ...
2025-07-15Python Pandas:數(shù)據(jù)科學(xué)的瑞士軍刀? ? 在數(shù)據(jù)驅(qū)動(dòng)的時(shí)代,面對(duì)海量、復(fù)雜的數(shù)據(jù),如何高效地進(jìn)行處理、分析和挖掘成為關(guān)鍵。 ...
2025-07-15用 SQL 生成逆向回滾 SQL:數(shù)據(jù)操作的 “后悔藥” 指南? 在數(shù)據(jù)庫(kù)操作中,誤刪數(shù)據(jù)、錯(cuò)改字段或誤執(zhí)行批量更新等問(wèn)題時(shí)有發(fā)生。 ...
2025-07-14t檢驗(yàn)與Wilcoxon檢驗(yàn)的選擇:何時(shí)用t.test,何時(shí)用wilcox.test? t 檢驗(yàn)與 Wilcoxon 檢驗(yàn)的選擇:何時(shí)用 t.test,何時(shí)用 wilcox. ...
2025-07-14AI 浪潮下的生存與進(jìn)階: CDA數(shù)據(jù)分析師—開(kāi)啟新時(shí)代職業(yè)生涯的鑰匙(深度研究報(bào)告、發(fā)展指導(dǎo)白皮書) 發(fā)布機(jī)構(gòu):CDA數(shù)據(jù)科 ...
2025-07-13LSTM 模型輸入長(zhǎng)度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長(zhǎng)序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報(bào)考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計(jì)的實(shí)用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強(qiáng)大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠(chéng)摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實(shí)施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價(jià)值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡(jiǎn)稱 BI)深度融合的時(shí)代,BI ...
2025-07-10SQL 在預(yù)測(cè)分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢(shì)預(yù)判? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代,預(yù)測(cè)分析作為挖掘數(shù)據(jù)潛在價(jià)值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價(jià)值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點(diǎn),而是將數(shù) ...
2025-07-10