
大數(shù)據(jù)之速度與激情
隨著 IT 技術(shù)不斷發(fā)展,我們已經(jīng)進(jìn)入到了大數(shù)據(jù)的時(shí)代,人類將在2020 年創(chuàng)造出40ZB的數(shù)據(jù)量,這個(gè)數(shù)字意味著如果我們把40ZB的數(shù)據(jù)存儲(chǔ)在DVD光盤里,這些光盤疊加起來(lái)便可以從地球延伸到月球。
數(shù)據(jù),無(wú)所不在!無(wú)論是個(gè)人手機(jī)拍照、發(fā)視頻,發(fā)微信,微博互動(dòng),還是各個(gè)企業(yè)里發(fā)生的人事、財(cái)務(wù)、供應(yīng)鏈、管理系統(tǒng)等產(chǎn)生的大量數(shù)據(jù),或者是房間、空調(diào)、電梯等傳感器或者設(shè)備數(shù)據(jù)。這么多信息量里,既有企業(yè)內(nèi)部所產(chǎn)生的數(shù)據(jù),也有外部社交、客戶對(duì)企業(yè)的反饋,如何利用這些大數(shù)據(jù)為企業(yè)提升營(yíng)收,提升客戶滿意度,降低運(yùn)營(yíng)成本,降低企業(yè)運(yùn)行的風(fēng)險(xiǎn)?很多企業(yè)通過(guò)部署大數(shù)據(jù)平臺(tái)來(lái)實(shí)現(xiàn)上述對(duì)數(shù)據(jù)的管理,達(dá)到快速、實(shí)時(shí)分析處理數(shù)據(jù)之目的。
事實(shí)上,大數(shù)據(jù)價(jià)值早已被業(yè)界認(rèn)可,各行各業(yè)已在各自領(lǐng)域里探索著自身業(yè)務(wù)對(duì)大數(shù)據(jù)的需求結(jié)合點(diǎn)該如何結(jié)合的問(wèn)題。這種探索,已然在速度與激情中碰撞。原因很簡(jiǎn)單,對(duì)大數(shù)據(jù)的價(jià)值探索越超前,給企業(yè)所帶來(lái)的商機(jī)自然越豐富,而這種探索,也從來(lái)都不是一味乏味或者一帆風(fēng)順的,激情而富有創(chuàng)造性的探索將帶給企業(yè)無(wú)限可能。
大數(shù)據(jù)之速度
比如一家叫做BlaBla的提供順風(fēng)車服務(wù)的公司,它可以幫客戶智能選座,比如是否愿意與健談的人在一起就坐并交流,是否暈車需要靠窗等,通過(guò)各種數(shù)據(jù)處理,為客戶推薦最好體驗(yàn)的出行方式。BlaBla順風(fēng)車跑出了速度,自然收獲了它在行業(yè)內(nèi)的價(jià)值。
Facebook 則采用了 HPE Vertica大數(shù)據(jù)平臺(tái),可以每小時(shí)處理超過(guò) 30T-50T 數(shù)據(jù),通過(guò)移動(dòng)端可以實(shí)時(shí)分析超過(guò) 10 億條記錄做到精準(zhǔn)營(yíng)銷,服務(wù) Facebook 客戶。
醫(yī)療行業(yè)通過(guò) HPE IDOL 和 HPE Vertica 解決方案可以做到預(yù)防性治療,幫助保險(xiǎn)公司或者政府社保機(jī)構(gòu)或醫(yī)院能減少病人患病的幾率,同時(shí)達(dá)到為保險(xiǎn)公司或政府的社?;疬_(dá)到節(jié)省支出的效果,同時(shí)通過(guò)大數(shù)據(jù)技術(shù),可以為病患提供正確的診療方式,節(jié)約成本;和醫(yī)療機(jī)構(gòu)合作,可以做到醫(yī)療機(jī)構(gòu)的研發(fā)更有針對(duì)性,提升運(yùn)營(yíng)效率,降低運(yùn)營(yíng)成本。美國(guó)社?;饳C(jī)構(gòu)通過(guò) HPE Vertica 解決方案在原型驗(yàn)證中發(fā)現(xiàn)了 8000 萬(wàn)美金的詐騙機(jī)會(huì),。
在電信行業(yè),如中國(guó)移動(dòng),利用大數(shù)據(jù),能夠分析花費(fèi)記錄,做到有針對(duì)性的精準(zhǔn)營(yíng)銷,每年創(chuàng)造的效益超過(guò) 1600 萬(wàn)美金。
在電視媒體,則可以采用 HPE IDOL 技術(shù),實(shí)時(shí)捕捉電視中廣告客戶的 Logo,同時(shí)實(shí)時(shí)捕捉媒體對(duì)廣告的評(píng)論,做到更精準(zhǔn)的營(yíng)銷,帶來(lái)更大的價(jià)值。
而政務(wù)大數(shù)據(jù),通過(guò)政府開放數(shù)據(jù)為社會(huì)服務(wù),提高政府效益,同時(shí)提高民眾體驗(yàn)。
由此可見,大數(shù)據(jù)與各行各業(yè)的結(jié)合已經(jīng)越來(lái)越緊密,大數(shù)據(jù)的創(chuàng)新應(yīng)用速度越高,其行業(yè)價(jià)值越明顯。
大數(shù)據(jù)之激情
大數(shù)據(jù)既是業(yè)務(wù)與數(shù)據(jù)的結(jié)合,也是業(yè)務(wù)與技術(shù)的結(jié)合,需要行業(yè)人士的激情探索。筆者觀察到,大數(shù)據(jù)最早從互聯(lián)網(wǎng)開始,攻城掠地后,目前幾乎已覆蓋到全部行業(yè)。只是各家模式不一。
較大型的集團(tuán)公司通過(guò)組建自身的大數(shù)據(jù)團(tuán)隊(duì),實(shí)現(xiàn)自身業(yè)務(wù)模式的探索。比如京東就組建了“京東技術(shù)研究院”,以此研究相關(guān)的業(yè)務(wù)方向與技術(shù)研發(fā);另有部分企業(yè)直接采購(gòu)較為成型的大數(shù)據(jù)處理平臺(tái)。但無(wú)論采用何種平臺(tái),都需要解決大數(shù)據(jù)的三種數(shù)據(jù)結(jié)構(gòu)同化的問(wèn)題。
目前的大數(shù)據(jù)一般包括三種結(jié)構(gòu)數(shù)據(jù):
一是最傳統(tǒng)的業(yè)務(wù)數(shù)據(jù),比如ERP、CRM 系統(tǒng)數(shù)據(jù)等。
二是機(jī)器數(shù)據(jù),比如物聯(lián)網(wǎng)的數(shù)據(jù),來(lái)源于成千上萬(wàn)的傳感器以及設(shè)備的機(jī)器數(shù)據(jù)。
三是來(lái)源于人類的數(shù)據(jù),這個(gè)數(shù)據(jù)是非結(jié)構(gòu)化式的,而且由人類所產(chǎn)生并且消費(fèi)的數(shù)據(jù),包括各種講話、發(fā)言、社交媒體、視頻、短信、流媒體等等。
因此,先進(jìn)而成熟的大數(shù)據(jù)平臺(tái)需要對(duì)上述數(shù)據(jù)進(jìn)行處理。但遺憾的是,目前能全部解決的大數(shù)據(jù)平臺(tái)并不多見,原因很多,一是大數(shù)據(jù)技術(shù)發(fā)展時(shí)間并不太長(zhǎng),其技術(shù)積累需要時(shí)間;其次,大數(shù)據(jù)處理過(guò)程中非結(jié)構(gòu)化數(shù)據(jù),尤其是圖像、音頻、視頻的處理難度較大;三是大數(shù)據(jù)與企業(yè)業(yè)務(wù)的結(jié)合程度高,需要對(duì)行業(yè)應(yīng)用有深度認(rèn)識(shí)。
上圖為:Hewlett Packard Enterprise 中國(guó)區(qū)副總裁,軟件集團(tuán)總經(jīng)理李時(shí)先生
近期,HPE舉辦“大數(shù)據(jù)世界之旅—北京站”活動(dòng),筆者了解到HPE大數(shù)據(jù)平臺(tái)的最新進(jìn)展,頗有收獲。據(jù)HPE中國(guó)區(qū)副總裁,軟件集團(tuán)總經(jīng)理李時(shí)先生介紹,HPE大數(shù)據(jù)平臺(tái)主要包括三個(gè)方面的組件:
1、HPE IDOL,IDOL 主要分析結(jié)構(gòu)化、非結(jié)構(gòu)化、半結(jié)構(gòu)化數(shù)據(jù),包括視頻、音頻、圖像、文本等數(shù)據(jù)。
2、HPE Vertica,Vertica 可以幫助我們更好,更快地分析企業(yè)所擁有的結(jié)構(gòu)化數(shù)據(jù),通過(guò) HPE IDOL 和 HPE Vertica 結(jié)合則可以全面分析企業(yè)擁有的內(nèi)部和外部數(shù)據(jù),為企業(yè)創(chuàng)造價(jià)值。
3、HPE OnDemand Open API,可以通過(guò)云化的方式為開發(fā)者,企業(yè)開發(fā)人員、創(chuàng)業(yè)人員提供一個(gè)快速的做技術(shù)原型驗(yàn)證的平臺(tái),大家可以成熟地運(yùn)用API 調(diào)用進(jìn)行快速人臉識(shí)別。過(guò)去企業(yè)需要大量的數(shù)據(jù)科學(xué)家,大量的建模人員來(lái)實(shí)施的工作,現(xiàn)在簡(jiǎn)化到 Haven OnDemand平臺(tái)上,從而可以幫助企業(yè)做快速的創(chuàng)新。并通過(guò)原型的建立,原型的驗(yàn)證把最終的產(chǎn)品環(huán)境放到 HPE Vertica 和 HPE IDOL上面,為企業(yè)創(chuàng)造更大的價(jià)值。
也就是HPE 大數(shù)據(jù)平臺(tái)是個(gè)開放的軟件架構(gòu),可以架構(gòu)在傳統(tǒng)企業(yè)的數(shù)據(jù)中心,也可以架構(gòu)在企業(yè)的私有云、公有云,或者是混合云這樣的 IT 基礎(chǔ)架構(gòu)上,并可基于全數(shù)據(jù)、實(shí)時(shí)分析能力的大數(shù)據(jù)分析平臺(tái)構(gòu)建應(yīng)用系統(tǒng)。
李時(shí)說(shuō):“HPE圍繞大數(shù)據(jù)平臺(tái)生態(tài)系統(tǒng),目前在中國(guó)已經(jīng)有超過(guò) 20 家以上的合作伙伴,在不同行業(yè)有超過(guò) 200 家客戶,通過(guò)這樣的生態(tài)系統(tǒng)創(chuàng)建,能夠幫助我們?cè)谌蝾I(lǐng)先的產(chǎn)品、技術(shù)和解決方案,結(jié)合中國(guó)本地的合作伙伴,做到在中國(guó)的落地創(chuàng)新?!?/span>
此外,上述提到的BlaBla順風(fēng)車、Facebook、中國(guó)移動(dòng)的大數(shù)據(jù)創(chuàng)新案例,便一直活躍著HPE大數(shù)據(jù)平臺(tái)的身影。
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
LSTM 模型輸入長(zhǎng)度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長(zhǎng)序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報(bào)考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計(jì)的實(shí)用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強(qiáng)大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠(chéng)摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實(shí)施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價(jià)值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡(jiǎn)稱 BI)深度融合的時(shí)代,BI ...
2025-07-10SQL 在預(yù)測(cè)分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢(shì)預(yù)判? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代,預(yù)測(cè)分析作為挖掘數(shù)據(jù)潛在價(jià)值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價(jià)值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點(diǎn),而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報(bào)考到取證的全攻略? 在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭(zhēng)搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢(shì)性檢驗(yàn):捕捉數(shù)據(jù)背后的時(shí)間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢(shì)性檢驗(yàn)如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時(shí)間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時(shí)間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實(shí)戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗(yàn):數(shù)據(jù)趨勢(shì)與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢(shì)變化以及識(shí)別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國(guó)內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對(duì)策略? 長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨(dú)特的門控機(jī)制,在 ...
2025-07-07統(tǒng)計(jì)學(xué)方法在市場(chǎng)調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場(chǎng)調(diào)研是企業(yè)洞察市場(chǎng)動(dòng)態(tài)、了解消費(fèi)者需求的重要途徑,而統(tǒng)計(jì)學(xué)方法則是市場(chǎng)調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動(dòng)力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動(dòng)力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價(jià)值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03