
大數(shù)據(jù)應(yīng)用:落地才能開花
數(shù)據(jù)資源,在未來社會(huì)將扮演與礦石能源同等重要的角色。如同瓦特的蒸汽機(jī)、愛迪生的白熾燈一樣,對(duì)當(dāng)下及未來生產(chǎn)、生活模式發(fā)生顛覆性影響。而當(dāng)下如火如荼的大數(shù)據(jù)核心產(chǎn)業(yè),仍面臨諸多挑戰(zhàn),需要經(jīng)歷復(fù)雜過程。這不禁讓人想起:19世紀(jì)初,英國(guó)屢次發(fā)生工人搗毀生產(chǎn)機(jī)器的事件;晚清時(shí)期,技術(shù)先進(jìn)的鐵路、蒸汽機(jī)車被清朝君臣視為“奇技淫巧”,破壞風(fēng)水。人們接受新生事物,從認(rèn)知、接受,到使用、建立經(jīng)營(yíng)模式,非一朝一夕之功,需從業(yè)者謹(jǐn)慎面對(duì),避免概念炒作,創(chuàng)新商業(yè)模式,讓技術(shù)真正“落地“服務(wù)。就如同今日的中國(guó)機(jī)械馳名中外,高速鐵路縱橫南北,技術(shù)“落地”才能生根發(fā)芽。
“供給創(chuàng)造它自己的需求”,誕生于19世紀(jì)的薩伊定律提出,只要有供給,就會(huì)產(chǎn)生相匹配的需求,市場(chǎng)會(huì)自動(dòng)出清。在大數(shù)據(jù)廣泛應(yīng)用的今天,這一破產(chǎn)于20世紀(jì)大蕭條時(shí)期的理論似乎暗藏新含義。
當(dāng)前,全球圍繞大數(shù)據(jù)挖掘、采集、存儲(chǔ)管理,正在形成一個(gè)生態(tài)圈,即大數(shù)據(jù)產(chǎn)業(yè)。在消費(fèi)市場(chǎng)快速變化背景下,依靠大數(shù)據(jù)分析,市場(chǎng)供應(yīng)者可精準(zhǔn)對(duì)接需求,一定程度上,或許真的可以“出清”。
2015年9月,李克強(qiáng)總理簽發(fā)《促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要》,將大數(shù)據(jù)產(chǎn)業(yè)推向最高熱度。2017年政府工作報(bào)告中提到,深入推進(jìn)“互聯(lián)網(wǎng)+”行動(dòng)和國(guó)家大數(shù)據(jù)戰(zhàn)略。并指出,加快大數(shù)據(jù)、云計(jì)算、物聯(lián)網(wǎng)應(yīng)用,以新技術(shù)新業(yè)態(tài)新模式,推動(dòng)傳統(tǒng)產(chǎn)業(yè)生產(chǎn)、管理和營(yíng)銷模式變革。2016年,全球大數(shù)據(jù)核心產(chǎn)業(yè)規(guī)模達(dá)到300億美元。然而,在迅猛發(fā)展過程中,一些現(xiàn)象仍值得思考。
過熱炒作的弊端
根據(jù)中國(guó)信息通信研究院測(cè)算:2015年,我國(guó)大數(shù)據(jù)核心產(chǎn)業(yè)市場(chǎng)規(guī)模達(dá)到115.9億元,增速達(dá)38%,預(yù)計(jì)2016年達(dá)到168億元,2017-2018年還將維持40%左右的高增長(zhǎng)。一些大型企業(yè),紛紛建立自己的數(shù)據(jù)分析團(tuán)隊(duì)。阿里巴巴董事局主席馬云提出,未來的制造業(yè)不僅生產(chǎn)產(chǎn)品,未來的制造業(yè)制造出來的機(jī)器必須會(huì)思考,必須會(huì)說話,必須會(huì)交流,未來所有的制造業(yè)都將會(huì)成為互聯(lián)網(wǎng)和大數(shù)據(jù)的終端企業(yè)。“未來的制造業(yè)要的不是石油,它最大的能源是數(shù)據(jù)”??墒?,高增長(zhǎng)背后,一些現(xiàn)象透露出隱憂:
2017年初,高德地圖公布的大數(shù)據(jù)分析結(jié)果引發(fā)爭(zhēng)議。其發(fā)布的《2016年度中國(guó)主要城市交通分析報(bào)告》汽車用戶畫像指出,中高檔車主駕駛“野蠻”,其中被看作最野蠻的是mini車主,凱迪拉克車主偏愛洗浴中心。瞬間,一石激起千層浪,不僅相關(guān)車主、車友會(huì)群起攻之,也引起部分汽車廠商關(guān)注。當(dāng)事方表示,這份分析資料由高德地圖交通大數(shù)據(jù)團(tuán)隊(duì)撰寫,基于高德積累的海量交通出行數(shù)據(jù),通過大數(shù)據(jù)挖掘計(jì)算所得。即便如此,數(shù)據(jù)來源、計(jì)算方法、數(shù)據(jù)用途都受到質(zhì)疑。
同樣困擾大數(shù)據(jù)應(yīng)用的不僅是內(nèi)容,更有過度的概念炒作、投資過熱。2016年,數(shù)家大數(shù)據(jù)技術(shù)與應(yīng)用服務(wù)商開始削減團(tuán)隊(duì)人數(shù),其中一部分,即便經(jīng)過多輪融資,但實(shí)際經(jīng)營(yíng)利潤(rùn)仍無法彌補(bǔ)成本或無法擴(kuò)大營(yíng)業(yè)規(guī)模,出現(xiàn)虧損。伴隨而來的是投資削減:據(jù)統(tǒng)計(jì),2016年,在大數(shù)據(jù)領(lǐng)域第三季度共發(fā)生投資案例801起,同比減少2.2%。就投資總額看,披露金額的727起投資案例共涉及投資金額1141億元人民幣,同比下降4.9%,較第二季度下降51.1%。投資項(xiàng)目同比降低三分之一。
短短數(shù)年時(shí)間,大數(shù)據(jù)分析的商業(yè)理念就已經(jīng)遍布各個(gè)行業(yè)。而其真正能為產(chǎn)業(yè)革新作出的貢獻(xiàn)以及產(chǎn)業(yè)本身生存狀態(tài)仍值得商榷。
比計(jì)算方法更重要的是制定策略
二戰(zhàn)時(shí),英國(guó)空軍請(qǐng)哥倫比亞大學(xué)統(tǒng)計(jì)學(xué)教授統(tǒng)計(jì)戰(zhàn)機(jī)受損情況,以統(tǒng)計(jì)結(jié)果作為飛機(jī)加強(qiáng)改裝的依據(jù)。受當(dāng)時(shí)技術(shù)局限,飛機(jī)只能做部分加強(qiáng)。他們積累了很多數(shù)據(jù),統(tǒng)計(jì)飛機(jī)所有受傷的彈孔位置。最后發(fā)現(xiàn):機(jī)翼兩端彈孔最多,人們認(rèn)為應(yīng)把加強(qiáng)鋼板放在機(jī)翼,但教授卻堅(jiān)持認(rèn)為,那些薄弱的部位,就是沒有統(tǒng)計(jì)出來的地方,因?yàn)檫@些地方受傷的飛機(jī)根本沒有飛回來。不管是原始的統(tǒng)計(jì)方式,還是大數(shù)據(jù)廣泛應(yīng)用的當(dāng)下,人們進(jìn)行統(tǒng)計(jì)分析,會(huì)忽略很多樣本,甚至策略制定發(fā)生偏差。如此,再精確的數(shù)據(jù)統(tǒng)計(jì),也將無濟(jì)于事。
中國(guó)信息通信研究院發(fā)布的《大數(shù)據(jù)白皮書(2016)》指出:我國(guó)大數(shù)據(jù)產(chǎn)業(yè)發(fā)展已具備一定基礎(chǔ),但要實(shí)現(xiàn)從“數(shù)據(jù)大國(guó)”向“數(shù)據(jù)強(qiáng)國(guó)”轉(zhuǎn)變,還面臨諸多挑戰(zhàn):一是對(duì)數(shù)據(jù)資源及其價(jià)值認(rèn)識(shí)不足。二是技術(shù)創(chuàng)新與支撐能力不夠。三是數(shù)據(jù)資源建設(shè)和應(yīng)用水平不高。四是信息安全和數(shù)據(jù)管理體系尚未建立。五是人才隊(duì)伍建設(shè)亟須加強(qiáng)。在數(shù)據(jù)資源建設(shè)和應(yīng)用層面。白皮書提出:“用戶普遍不重視數(shù)據(jù)資源的建設(shè),即使有數(shù)據(jù)意識(shí)的機(jī)構(gòu),大多只重視數(shù)據(jù)的簡(jiǎn)單存儲(chǔ),很少針對(duì)后續(xù)應(yīng)用需求進(jìn)行加工整理。數(shù)據(jù)資源普遍存在質(zhì)量差,標(biāo)準(zhǔn)規(guī)范缺乏,管理能力弱等現(xiàn)象,跨部門、跨行業(yè)的數(shù)據(jù)共享仍不順暢,有價(jià)值的公共信息資源和商業(yè)數(shù)據(jù)開放程度低。數(shù)據(jù)價(jià)值難以被有效挖掘利用,大數(shù)據(jù)應(yīng)用整體上處于起步階段,潛力遠(yuǎn)未釋放?!?
在金融應(yīng)用領(lǐng)域,91金融CEO許澤瑋認(rèn)為,不能過分依賴數(shù)據(jù),要設(shè)立風(fēng)險(xiǎn)委員會(huì),使專業(yè)人員的經(jīng)驗(yàn)與數(shù)據(jù)統(tǒng)計(jì)相結(jié)合。同時(shí),企業(yè)一定要具有足夠的數(shù)據(jù)處理能力,同時(shí)要確保安全。“在檢測(cè)防控風(fēng)險(xiǎn)方面,需采用線上和線下相結(jié)合的風(fēng)險(xiǎn)管理體系,包括基于大數(shù)據(jù)的線上征信和風(fēng)控模型,以及傳統(tǒng)的線下調(diào)查和貸后管理。”許澤瑋介紹,建立具備豐富風(fēng)控經(jīng)驗(yàn)的從業(yè)團(tuán)隊(duì),基于線上的大數(shù)據(jù)匹配,嚴(yán)格篩選借款人,確保他們有穩(wěn)定的企業(yè)和還款能力,此外,借款人借款金額必須在抵押物評(píng)估值的70%以內(nèi),而且借款期限不得超過6個(gè)月。5位風(fēng)控委員會(huì)委員均投票通過,則可以借出,如有一人不同意,則此項(xiàng)目作廢。在很多行業(yè)愈發(fā)依賴大數(shù)據(jù)的當(dāng)下,這些人工程序和經(jīng)驗(yàn)愈發(fā)重要。
現(xiàn)在,公眾對(duì)“大數(shù)據(jù)”已有基本認(rèn)知,各種大數(shù)據(jù)的案例故事廣為流傳。但在當(dāng)下,概念性的故事,未必能帶來真正效果。人們需要的是,把停留在“講故事”層面的內(nèi)容深挖、落地,變成真正可行,低成本高效率的商業(yè)模式,讓當(dāng)下的概念在應(yīng)用場(chǎng)景中發(fā)揮真正價(jià)值。
用數(shù)據(jù)解決實(shí)際問題
解決大數(shù)據(jù)應(yīng)用的痛點(diǎn),要解決使用者的大數(shù)據(jù)認(rèn)知,更要實(shí)現(xiàn)大數(shù)據(jù)應(yīng)用“落地服務(wù)”。
多數(shù)企業(yè)需要的不是數(shù)據(jù)本身,而是用數(shù)據(jù)解決實(shí)際問題。不是每個(gè)企業(yè)經(jīng)營(yíng)者都需要具備數(shù)據(jù)分析系統(tǒng),但他們都希望大數(shù)據(jù)帶來收益并節(jié)約成本。能夠給企業(yè)帶來價(jià)值的大數(shù)據(jù)“落地服務(wù)”,才有可能被企業(yè)接受。避免炒作、制定策略、落地服務(wù)是決定大數(shù)據(jù)核心產(chǎn)業(yè)長(zhǎng)足發(fā)展的關(guān)鍵。
就金融行業(yè)而言,大數(shù)據(jù)主要業(yè)務(wù)應(yīng)用于企業(yè)風(fēng)險(xiǎn)管理、信用評(píng)估、借貸、保險(xiǎn)、理財(cái)、證券分析等。在這些領(lǐng)域,可以通過獲取、關(guān)聯(lián)和分析更多維度、更深層次的數(shù)據(jù),通過不斷發(fā)展的大數(shù)據(jù)處理技術(shù)得以更好、更快、更準(zhǔn)確的實(shí)現(xiàn),更多的金融企業(yè)利用大數(shù)據(jù)技術(shù)整合來自互聯(lián)網(wǎng)等渠道的外部數(shù)據(jù),從而使得原來不可擔(dān)保的信貸可以擔(dān)保,不可保險(xiǎn)的風(fēng)險(xiǎn)可以保險(xiǎn)。 《大數(shù)據(jù)白皮書(2016)》披露:中信銀行信用卡中心從2010年開始引入大數(shù)據(jù)分析解決方案,為企業(yè)中心提供了統(tǒng)一的客戶視圖。借助客戶統(tǒng)一視圖,可以從交易、服務(wù)、風(fēng)險(xiǎn)、權(quán)益等多層面獲取和分析數(shù)據(jù),對(duì)客戶按照低、中、高價(jià)值來進(jìn)行分類,根據(jù)銀行整體經(jīng)營(yíng)策略積極地提供相應(yīng)的個(gè)性化服務(wù),在降低成本的同時(shí)大幅提升精準(zhǔn)營(yíng)銷能力。
許澤瑋介紹,他們通過自主研發(fā)搜索引擎,捕捉借款用戶的網(wǎng)絡(luò)行為軌跡,鼓勵(lì)借款用戶將賬號(hào)與微博等社交網(wǎng)絡(luò)賬號(hào)關(guān)聯(lián),監(jiān)測(cè)用戶登錄習(xí)慣,不斷積累和健全用戶行為因子,擴(kuò)展并完善大數(shù)據(jù)風(fēng)控模型。他說,完善的用戶數(shù)據(jù)主要有兩大作用,一方面是為了更好地防范金融風(fēng)險(xiǎn),另一方面則是為了進(jìn)一步完善用戶畫像,實(shí)現(xiàn)精細(xì)化運(yùn)營(yíng)。讓數(shù)據(jù)真正服務(wù)于業(yè)務(wù)。
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
LSTM 模型輸入長(zhǎng)度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長(zhǎng)序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報(bào)考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計(jì)的實(shí)用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強(qiáng)大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠(chéng)摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實(shí)施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價(jià)值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡(jiǎn)稱 BI)深度融合的時(shí)代,BI ...
2025-07-10SQL 在預(yù)測(cè)分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢(shì)預(yù)判? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代,預(yù)測(cè)分析作為挖掘數(shù)據(jù)潛在價(jià)值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價(jià)值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點(diǎn),而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報(bào)考到取證的全攻略? 在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭(zhēng)搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢(shì)性檢驗(yàn):捕捉數(shù)據(jù)背后的時(shí)間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢(shì)性檢驗(yàn)如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時(shí)間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時(shí)間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實(shí)戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗(yàn):數(shù)據(jù)趨勢(shì)與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢(shì)變化以及識(shí)別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國(guó)內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對(duì)策略? 長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨(dú)特的門控機(jī)制,在 ...
2025-07-07統(tǒng)計(jì)學(xué)方法在市場(chǎng)調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場(chǎng)調(diào)研是企業(yè)洞察市場(chǎng)動(dòng)態(tài)、了解消費(fèi)者需求的重要途徑,而統(tǒng)計(jì)學(xué)方法則是市場(chǎng)調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動(dòng)力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動(dòng)力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價(jià)值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03