
抓住大數(shù)據(jù)時(shí)代的精髓 展現(xiàn)其現(xiàn)實(shí)的魅力
在被熱情的聽眾擠爆的西南財(cái)經(jīng)大學(xué)柳江校區(qū)演講廳,央視年度十大科技創(chuàng)新人物周濤,用了整整2個(gè)小時(shí)的酣暢演講和交流向聽眾展示了大數(shù)據(jù)時(shí)代的魅力。
大數(shù)據(jù)時(shí)代是如何到來的?大數(shù)據(jù)產(chǎn)生的商業(yè)模式,將為企業(yè)帶來怎樣的發(fā)展機(jī)遇?大數(shù)據(jù)又能否支撐起國家經(jīng)濟(jì)社會的發(fā)展戰(zhàn)略?面對這些宏觀而現(xiàn)實(shí)的問題,思維縝密的周濤一一道來。針對人們關(guān)心的創(chuàng)業(yè)創(chuàng)新話題,周濤則表示出對下一代年輕創(chuàng)業(yè)者的期望。“要用你的一生去做偉大創(chuàng)新。”
(周濤教授現(xiàn)場和大家交流)
周濤教授本次演講主要包括以下幾方面的內(nèi)容:
第一 什么力量把我們推動到今天這個(gè)所謂的大數(shù)據(jù)時(shí)代
第二 大數(shù)據(jù)怎么樣去支撐整個(gè)中國未來經(jīng)濟(jì)社會發(fā)展的重大戰(zhàn)略
第三 大數(shù)據(jù)的精髓和現(xiàn)實(shí)魅力
第四 對下一代,我們期望你們做什么樣的一代人
1、大數(shù)據(jù)時(shí)代,不僅是技術(shù)和算法的變化
現(xiàn)在大數(shù)據(jù)這個(gè)概念很熱,我希望通過這場論壇讓大家能夠去甄別:哪些是真正大數(shù)據(jù)創(chuàng)新、哪些是偽大數(shù)據(jù)。
驅(qū)動大數(shù)據(jù)產(chǎn)業(yè)發(fā)展走到今天,有三個(gè)趨勢。第一個(gè)趨勢是數(shù)據(jù)爆炸性增長?,F(xiàn)在每天在亞馬遜有幾百萬數(shù)據(jù),淘寶有10多億數(shù)據(jù),互聯(lián)網(wǎng)有4萬多億網(wǎng)頁。這意味著,普通人甄別信息能力和可獲得信息量爆炸性增長,這之間的矛盾我們把它叫信息過載。
很多商業(yè)模式都來自于此。比如說互聯(lián)網(wǎng)上怎么樣找喜歡的歌、喜愛的商品,甚至大家到百合網(wǎng)、珍愛網(wǎng)找個(gè)好對象,這就涉及對無窮多的信息處理。大數(shù)據(jù)中典型的商業(yè)模式,就是精準(zhǔn)廣告搜索推薦等。
第二個(gè)趨勢就是數(shù)據(jù)形態(tài)正發(fā)生變化。比如,以前我們用excel表格管理一名學(xué)生,知道是男是女、在哪畢業(yè)、家庭住址等。有了這些數(shù)據(jù),我們就可以通過建立回歸、關(guān)聯(lián)等方法,得到變量和變量的關(guān)系。舉個(gè)例子,成都某中學(xué)哪些學(xué)生畢業(yè)后發(fā)展更好,女孩子是否更適合會計(jì)專業(yè)等,這些都不是大數(shù)據(jù),這是幾十年前的時(shí)候早期數(shù)據(jù)。
而現(xiàn)在我們面臨的絕大部分?jǐn)?shù)據(jù)都是非結(jié)構(gòu)化數(shù)據(jù),比如文本、視頻、語音、圖像,還包括社會關(guān)系網(wǎng)絡(luò),它們也有著巨大價(jià)值。舉個(gè)例子,假如我們靠某個(gè)人手機(jī)行程的軌跡數(shù)據(jù),只要有3年或以上的追蹤,比如他經(jīng)常去五星級酒店、高爾夫球場和高檔會所,就可以很好地判斷其經(jīng)濟(jì)收入水平。再往外延伸,比如我3年前曾經(jīng)在北京幫一個(gè)關(guān)于醫(yī)療的手機(jī)APP做過一個(gè)商業(yè)項(xiàng)目。他們提出需要,要找在北京醫(yī)院工作的醫(yī)生。這些醫(yī)院的經(jīng)緯度我們是清楚的,但如何判斷進(jìn)出這些醫(yī)院的人哪些是醫(yī)生呢?通過比對這些醫(yī)院進(jìn)出人員的頻次,我們發(fā)現(xiàn)如果某人進(jìn)入醫(yī)院很快就出來,那么他可能是病人;如果進(jìn)入醫(yī)院再也不出來,可能就去世了。我們從中找出那些每天有規(guī)律進(jìn)出的人,很大可能他們就是醫(yī)生或醫(yī)療工作者。
第三個(gè)大的趨勢,是大數(shù)據(jù)真正不一樣的地方,就是數(shù)據(jù)的關(guān)聯(lián)發(fā)生了變化。以前的數(shù)據(jù)是單獨(dú)的,比如一個(gè)人,淘寶知道他買了什么東西,新浪微博知道他有什么朋友,醫(yī)院知道他患了什么病,但這些對同一個(gè)人的數(shù)據(jù)是沒有打通的。我們現(xiàn)在通過商業(yè)模式、技術(shù)資本,可以把這些數(shù)據(jù)打通。比如阿里巴巴投資新浪微博,兩年前推出新淘浪;還有企業(yè)通過一個(gè)軟件管理所有社交賬戶、豆瓣賬號、支付賬戶等,這里面帶來一個(gè)很好玩的事情,就好像圍繞一個(gè)人360度拍照,知道這個(gè)人的全息影像,就可能帶來很大商業(yè)價(jià)值。比如這個(gè)人的征信。但這也可能影響到他的隱私。所以大數(shù)據(jù)的第三個(gè)挑戰(zhàn)是,如何在安全隱私可控的情況下,充分利用這些關(guān)聯(lián)數(shù)據(jù)來形成1+1>2的價(jià)值。
大數(shù)據(jù)時(shí)代不是說某種技術(shù)或者某種算法的變化,而是某種理念的變化。大數(shù)據(jù)是針對關(guān)聯(lián)異構(gòu)化數(shù)據(jù)深度分析。從關(guān)聯(lián)性看,是生活方式、商業(yè)模式、管理流程等一切顛覆性變化的總和。未來新型的企業(yè),乃至政府,對于他們而言數(shù)據(jù)的采集分析都是核心戰(zhàn)略。
2、如何運(yùn)用大數(shù)據(jù),對企業(yè)進(jìn)行征信評級
第二個(gè)大方面,大數(shù)據(jù)是怎么樣在某些方面支撐一個(gè)國家的經(jīng)濟(jì)社會戰(zhàn)略發(fā)展?
首先就要求創(chuàng)業(yè)者要把握好社會發(fā)展整個(gè)趨勢。在今天創(chuàng)新創(chuàng)業(yè)驅(qū)動發(fā)展過程中,企業(yè)遇到的痛點(diǎn)是什么?創(chuàng)新企業(yè)尤其是小微企業(yè),大多是輕資產(chǎn)企業(yè),這些企業(yè)創(chuàng)業(yè)想的是先做個(gè)APP,而不會去拿一塊地。絕大多數(shù)創(chuàng)新企業(yè)沒有資產(chǎn)可以質(zhì)押,他就沒法通過傳統(tǒng)渠道進(jìn)行融資。
通過雙創(chuàng)驅(qū)動解決中小微企業(yè)融資難問題,也是諸如數(shù)聯(lián)銘品這類大數(shù)據(jù)公司的主要內(nèi)容之一。我們怎樣用大數(shù)據(jù)來解決這個(gè)問題?因?yàn)槲覀兊哪繕?biāo)是對企業(yè)進(jìn)行征信評級,對公司債進(jìn)行定價(jià)。解決這個(gè)問題不是走傳統(tǒng)的道路,我們是在互聯(lián)網(wǎng)上采集大量公開數(shù)據(jù),包括它所處的行業(yè)、注冊資本、實(shí)繳資本、股東、董事等方面。有了這些信息,我們再結(jié)合企業(yè)發(fā)展得到幾個(gè)要素:第一,你所處的行業(yè)市盈率好不好,盈利情況,有沒有上市潛力;第二,你是否存在關(guān)聯(lián)交易的風(fēng)險(xiǎn),比如你的股權(quán)關(guān)系是否有風(fēng)險(xiǎn);第三,看你的董事、監(jiān)事、高管和投資方關(guān)系,看你背后投資方和股東是不是優(yōu)質(zhì)良好。
其次,我們還有大量公司資產(chǎn)數(shù)據(jù)、人力資源招聘數(shù)據(jù)、招標(biāo)投標(biāo)數(shù)據(jù)和法律訴訟數(shù)據(jù)等。例如,一個(gè)企業(yè)發(fā)展好壞,很大程度上可以通過人力資源招聘看出來。同時(shí),還可以看企業(yè)在招投標(biāo)中勝出幾率、價(jià)格。另外,企業(yè)有沒有法律訴訟,尤其是關(guān)于合同、股權(quán)詐騙的訴訟,是評價(jià)企業(yè)很好的指標(biāo)。利用這些指標(biāo),我們就可以不依賴于企業(yè)主動提供的有可能虛假的財(cái)務(wù)報(bào)表,對企業(yè)的信用和風(fēng)險(xiǎn)進(jìn)行全面和精準(zhǔn)的評估,從而推動真正針對小微輕資產(chǎn)企業(yè)的征信評級和公司債定價(jià),這就是非常典型大數(shù)據(jù)運(yùn)用。
從這些方面看,我認(rèn)為大數(shù)據(jù)的分析和運(yùn)用,一定程度上可以支撐國家的經(jīng)濟(jì)社會戰(zhàn)略發(fā)展。
3、如何在3萬人中,找出最孤獨(dú)的那一個(gè)
我覺得大數(shù)據(jù)的精髓,就是能夠把數(shù)據(jù)外部化。比如,谷歌曾經(jīng)把它大量的搜索數(shù)據(jù)與疾控中心傳染病報(bào)告的人數(shù)做了一個(gè)關(guān)聯(lián)分析,實(shí)際上就是一個(gè)簡單的線性回歸模型,它最終能夠比較好地預(yù)測傳染病的流行,并且能夠提前一周預(yù)測出突然的上升和下降。這個(gè)例子就說明了,表面上看起來是我的搜索數(shù)據(jù)和你傳染病模型是風(fēng)馬牛不相及的事,但卻通過這些數(shù)據(jù)解決了你的大問題。
我們在電子科大還做過一個(gè)課題——尋找校園中最孤獨(dú)的人。我們從3萬名在校生中,采集到了2億多條行為數(shù)據(jù),它們來自學(xué)生選課記錄、進(jìn)出圖書館、寢室,以及食堂用餐、超市購物等數(shù)據(jù)。通過對不同的校園一卡通“一前一后刷卡”的記錄進(jìn)行分析,可以發(fā)現(xiàn)一個(gè)學(xué)生在學(xué)校有多少親密朋友,比如戀人、閨蜜。最后,我們找到了800多個(gè)校園中最孤獨(dú)的人。他們平均在校兩年半時(shí)間,一個(gè)知心朋友都沒有。這些人中的17%可能產(chǎn)生心理疾病,剩下的則可能用意志力暫時(shí)戰(zhàn)勝了癥狀,但需要學(xué)校和家長重點(diǎn)予以關(guān)愛。
這些例子,其實(shí)都透露了大數(shù)據(jù)的三個(gè)精髓:第一個(gè),是數(shù)據(jù)的外圍性。例如一卡通的數(shù)據(jù),其實(shí)來自學(xué)校的后勤集團(tuán),本質(zhì)上是一種消費(fèi)數(shù)據(jù),但我們利用這種數(shù)據(jù)來預(yù)測學(xué)習(xí)成績、觀察學(xué)生作息是否有異常,通過看起來沒有關(guān)系的數(shù)據(jù)去透視問題;第二個(gè),是數(shù)據(jù)的群集性。光有一張卡,你分析得再清楚,也看不出什么問題,只有把這張卡放在3萬張卡里才能看出端倪;第三個(gè),是這些數(shù)據(jù)其實(shí)存在很多年了,一卡通和學(xué)校的心理健康中心都存在十幾年,但一直沒有發(fā)現(xiàn)兩者之間的關(guān)系,為什么?因?yàn)槿狈?shù)據(jù)科學(xué)家,需要有人針對這些數(shù)據(jù)去進(jìn)行分析。
4、年輕人創(chuàng)業(yè),首先要考慮格局與方法
講完了大數(shù)據(jù),我還想對大家說一句,不管你們是要?jiǎng)?chuàng)業(yè)或做什么事情,都要考慮兩個(gè)問題:格局和方法。
第一,你要思考自己做的事是否具有原始的重要的創(chuàng)新性?例如谷歌開發(fā)阿爾法狗,以前很多人都認(rèn)為這是不可能的,但這件事的美妙之處就是在于,把以往不可能的事情變成可能。你要用你的一生去做偉大創(chuàng)新。企業(yè)的核心價(jià)值是它對社會的貢獻(xiàn),而不是掙了多少錢,選擇的方向很重要。
其次,你們的價(jià)值觀不能高度統(tǒng)一。你們一定要想清楚自己喜歡什么,如果你想的和全社會都一樣,那么你其實(shí)可以消失了,因?yàn)橛心銢]你都沒關(guān)系。
最后我還想說,你要有戰(zhàn)斗的情懷。今天很多人可能覺得我講的這些都是務(wù)虛的,但人在不斷往前走的歷程中,你會發(fā)現(xiàn)我講的這些都是需要的。
我對自己的定位,是希望我的工作和人生能去影響下一代,你們也要去想如何成為一代人的榜樣,如何抓住這個(gè)時(shí)代脈搏發(fā)展中所缺失的東西。
另外,在人的一生之中,千萬不要怕重大挫折和痛苦。從這個(gè)問題出發(fā),我還想給大家講我比較欣賞的一句話,是儒學(xué)乃至中國文化傳統(tǒng)中著名的“十六字心傳”——“人心惟危,道心惟微;惟精惟一,允執(zhí)厥中”。我主要想講的是中間這個(gè)“惟精惟一”,它說的是什么呢?
人生之中會有很多誘惑,但你要把所有能量集中起來做唯一的事,其他的事都不重要,不要把事做碎、做雜,很多事情你都想要做一做,那你就很難登上巔峰,所以,不是你的核心事情,不要去做。
5、大數(shù)據(jù)進(jìn)行征信評級,同樣需要保護(hù)企業(yè)隱私
問題1:你更多精力放在學(xué)術(shù)還是公司管理上?技術(shù)人才如何擔(dān)當(dāng)公司創(chuàng)始人?
周濤:我一方面做純理論研究,我的這塊理論研究其實(shí)是很難產(chǎn)業(yè)化的。另一方面,我在企業(yè)里主要進(jìn)行戰(zhàn)略決策、市場資源整合,以及投融資事務(wù)。我認(rèn)為,任何一個(gè)人靠一己之力都很難撐起所有,像我就很難管理超過10人的團(tuán)隊(duì)。那么他如果想要成功,就要具備兩個(gè)能力:一是領(lǐng)導(dǎo)力。不斷給團(tuán)隊(duì)打雞血,朝著共同的夢想去戰(zhàn)斗;第二個(gè)是被領(lǐng)導(dǎo)的能力。你要給團(tuán)隊(duì)成員充分權(quán)力去做決策,你就跟著這樣的決策走就是了??傊?,千萬別想讓自己變成一個(gè)多面人,或去學(xué)著做一些本身不擅長的事情。
問題2:作為一家大數(shù)據(jù)公司,數(shù)聯(lián)銘品如何保護(hù)企業(yè)隱私?你們開展企業(yè)征信業(yè)務(wù),被你們“評級”的企業(yè)是否具有知情權(quán)和異議權(quán)?
周濤:我們的數(shù)據(jù)有兩個(gè)來源,第一個(gè)是公開數(shù)據(jù),例如企業(yè)工商登記中必須公開的法人等信息、法院判決的公開文書等,我們采集這些數(shù)據(jù)做成報(bào)告,這塊不涉及隱私;當(dāng)然,還有一部分?jǐn)?shù)據(jù)的確涉及隱私,例如企業(yè)財(cái)務(wù)的真實(shí)數(shù)據(jù)。當(dāng)我們在為企業(yè)提供服務(wù)時(shí),就需要征得企業(yè)的授權(quán),去查看這家公司的真實(shí)財(cái)務(wù)數(shù)據(jù);如果企業(yè)不授權(quán),我們就不會用這些數(shù)據(jù)。征信業(yè)務(wù)這塊,目前我們拿到了企業(yè)征信牌照,企業(yè)如果向我們申請征信時(shí),我們會告知這些征信會向哪些機(jī)構(gòu)公開。
問題3:你對傳統(tǒng)銀行業(yè)的產(chǎn)品創(chuàng)新有沒有研究?
周濤:例如債券市場,在美國的規(guī)模比中國大得多,一旦放開,就存在很大的機(jī)會。還有保險(xiǎn),目前我們國內(nèi)的保險(xiǎn)規(guī)模也比美國小,并且呈現(xiàn)高度同質(zhì)化,實(shí)際上通過大數(shù)據(jù),我們可以建立出很多精算模型,更好地為傳統(tǒng)銀行業(yè)服務(wù)。例如,如果我們能拿到個(gè)體的一些醫(yī)療數(shù)據(jù),就可以推算一個(gè)人在多少年后有患上糖尿病概率,對應(yīng)的,他的醫(yī)療保險(xiǎn)應(yīng)該如何變化,這些都可以計(jì)算出來。
大數(shù)據(jù)時(shí)代,或許你可以不會大數(shù)據(jù),但是一定不能不知道大數(shù)據(jù)。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報(bào)考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動決策的時(shí)代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計(jì)的實(shí)用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強(qiáng)大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實(shí)施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價(jià)值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時(shí)代,BI ...
2025-07-10SQL 在預(yù)測分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢預(yù)判? ? 在數(shù)據(jù)驅(qū)動決策的時(shí)代,預(yù)測分析作為挖掘數(shù)據(jù)潛在價(jià)值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價(jià)值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點(diǎn),而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報(bào)考到取證的全攻略? 在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗(yàn):捕捉數(shù)據(jù)背后的時(shí)間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗(yàn)如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時(shí)間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時(shí)間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實(shí)戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗(yàn):數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對策略? 長短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨(dú)特的門控機(jī)制,在 ...
2025-07-07統(tǒng)計(jì)學(xué)方法在市場調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場調(diào)研是企業(yè)洞察市場動態(tài)、了解消費(fèi)者需求的重要途徑,而統(tǒng)計(jì)學(xué)方法則是市場調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價(jià)值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03