
大數(shù)據(jù)分析激活產(chǎn)業(yè)鏈
馬云在給阿里巴巴員工的一封內(nèi)部郵件中說,以控制為出發(fā)點(diǎn)的IT時代正在走向激活生產(chǎn)力為目的的DT(data technology)數(shù)據(jù)時代。隨著計算機(jī)技術(shù)的發(fā)展,大數(shù)據(jù)運(yùn)算變得越來越現(xiàn)實(shí),基于大數(shù)據(jù)應(yīng)用服務(wù)的公司不斷嶄露頭角。大數(shù)據(jù)在營銷領(lǐng)域的應(yīng)用將廣告變成了“窄告”——精準(zhǔn)營銷,而在互聯(lián)網(wǎng)金融大熱的背景下,大數(shù)據(jù)在金融業(yè)征信方面的應(yīng)用也在逐漸興起。
人人都是“數(shù)據(jù)動物”
不同于“天空中沒有留下鳥的痕跡,但我已飛過”,人們不論是網(wǎng)上聊天、購物還是瀏覽網(wǎng)頁、發(fā)微信、微博,都會或多或少留下記錄,這些記錄以數(shù)據(jù)的形式被存儲下來。隨著移動互聯(lián)網(wǎng)的迅猛發(fā)展,無論在何時、何地、何處,手機(jī)等各種網(wǎng)絡(luò)入口以及無處不在的傳感器等都會對個人數(shù)據(jù)進(jìn)行采集、存儲、使用、分享。而大量的數(shù)據(jù)結(jié)合起來,通過分析,不難還原出一個人的“樣子”——數(shù)據(jù)化的形象。
很多人在瀏覽網(wǎng)頁時都有這樣的體驗(yàn),網(wǎng)站上的廣告位所出現(xiàn)的廣告往往是自己最近瀏覽過的產(chǎn)品,或是最近搜索過的內(nèi)容,這背后就是大數(shù)據(jù)在營銷上應(yīng)用。
北京集奧聚合科技有限公司就是一家大數(shù)據(jù)服務(wù)提供商,公司推出的DataQuate解決方案主要用于解決運(yùn)營商大數(shù)據(jù)的接入、挖掘及應(yīng)用,為運(yùn)營商大數(shù)據(jù)的價值轉(zhuǎn)化提供端到端服務(wù)。
集奧聚合所做的正是通過大數(shù)據(jù)的挖掘,幫助廣告主更精準(zhǔn)地進(jìn)行廣告投放。據(jù)集奧聚合CMO段培力介紹,公司通過系統(tǒng)地對海量的、碎片化的網(wǎng)絡(luò)用戶行為數(shù)據(jù)進(jìn)行梳理,采用科學(xué)的分類法和特征模型進(jìn)行數(shù)據(jù)挖掘及用戶建模,最大程度逼真還原“用戶畫像”,分析獲得用戶多維度信息,實(shí)現(xiàn)數(shù)據(jù)的商業(yè)價值。
盡管這樣的廣告很大程度上具有一定滯后性,但相比于過去“漫天撒網(wǎng)”式的廣告投放,在精準(zhǔn)性上已經(jīng)有了較大程度的提升。段培力表示,用戶數(shù)據(jù)的“新鮮”程度,直接影響到用戶的回復(fù)率。數(shù)據(jù)對于用戶興趣判定的準(zhǔn)確性會隨著時間迅速降低,因?yàn)樵摓g覽者很可能已經(jīng)完成了一次購買行為。因而數(shù)據(jù)光是有量還遠(yuǎn)遠(yuǎn)不夠,數(shù)據(jù)方還必須保證時效性。
此外,目前的大數(shù)據(jù)技術(shù)多將數(shù)據(jù)還原到某一終端,基于PC端的數(shù)據(jù)由于無法區(qū)分具體的數(shù)據(jù)源自一人或多人,也可能出現(xiàn)不夠精確的情況。不過,隨著移動互聯(lián)網(wǎng)的普及,手機(jī)終端的一對一特性,則為大數(shù)據(jù)追蹤到具體用戶創(chuàng)造了條件。段培力認(rèn)為,現(xiàn)有的大數(shù)據(jù)基礎(chǔ)加上實(shí)時數(shù)據(jù)分析,甚至數(shù)據(jù)源的動態(tài)跟蹤,將有助于廣告的推送更加精準(zhǔn)并具有前瞻性。
事實(shí)上,大數(shù)據(jù)的商業(yè)應(yīng)用遠(yuǎn)遠(yuǎn)不止?fàn)I銷這一個領(lǐng)域,集奧聚合新近開發(fā)了針對互聯(lián)網(wǎng)金融的個人征信數(shù)據(jù)產(chǎn)品?!皩?shí)際上不管是營銷還是征信,數(shù)據(jù)的搜集方法都是一樣的,只是數(shù)據(jù)輸出的維度不同?!?段培力介紹說。
數(shù)據(jù)分析激活產(chǎn)業(yè)鏈
根據(jù)IDC過去五年的研究,全球數(shù)據(jù)量大約每兩年翻一番。然而,大數(shù)據(jù)產(chǎn)業(yè)鏈上常常出現(xiàn)一個怪相:有數(shù)據(jù)的公司不知道怎么用,需要數(shù)據(jù)的公司又沒有足夠的數(shù)據(jù)來源,或分析數(shù)據(jù)的技術(shù)。在這種背景下,大量大數(shù)據(jù)服務(wù)公司產(chǎn)生,它們通過大數(shù)據(jù)技術(shù)從各種各樣類型的數(shù)據(jù)中快速獲得有價值的信息,并提供給需要數(shù)據(jù)的公司。
作為建設(shè)和管理數(shù)據(jù)管道的運(yùn)營商,在大數(shù)據(jù)領(lǐng)域有天然的資源優(yōu)勢。以一個省級電信運(yùn)營商為例,每天能產(chǎn)生70~100TB的數(shù)據(jù)量,幾十億次點(diǎn)擊的上網(wǎng)記錄。運(yùn)營商已經(jīng)認(rèn)識到信息資產(chǎn)的價值含量,并正在著手建設(shè)其用戶數(shù)據(jù)倉庫。不過,由于行業(yè)應(yīng)用與數(shù)據(jù)運(yùn)營的經(jīng)驗(yàn)有限,運(yùn)營商需要面向應(yīng)用的數(shù)據(jù)挖掘,需要數(shù)據(jù)的價值轉(zhuǎn)化工具和運(yùn)營層面的戰(zhàn)略合作伙伴。
據(jù)業(yè)內(nèi)人士介紹,根據(jù)所提供價值的不同來源,目前主要有三種大數(shù)據(jù)公司。三種數(shù)據(jù)來源是指:數(shù)據(jù)本身、技能與思維。
基于數(shù)據(jù)本身的公司往往擁有大量數(shù)據(jù)或者至少可以收集到大量數(shù)據(jù),卻不一定有從數(shù)據(jù)中提取價值或者用數(shù)據(jù)催生創(chuàng)新思想的技能。例如微博等社交網(wǎng)絡(luò)和運(yùn)營商。前文所提到的集奧聚合則屬于基于技能的公司。這些公司能夠進(jìn)行不同程度的大數(shù)據(jù)整理和分析,提供給需要數(shù)據(jù)的公司使用。而基于大數(shù)據(jù)思維的公司,則通過現(xiàn)有數(shù)據(jù)的加工,創(chuàng)造性地為用戶提供更具價值的想法和建議。這些公司成功的關(guān)鍵不在于占有多少數(shù)據(jù)和分析數(shù)據(jù)的技能,而是其創(chuàng)新的思路。
阿里巴巴的金融業(yè)務(wù)就是基于其數(shù)據(jù)資產(chǎn)進(jìn)行商業(yè)創(chuàng)新的重要成果。阿里巴巴在金融業(yè)的全面布局已經(jīng)對傳統(tǒng)銀行、保險、小貸等多個行業(yè)形成沖擊,尤其在技術(shù)、模式和思維上已經(jīng)形成巨大的沖擊,且將推動金融產(chǎn)業(yè)格局的重構(gòu)。而這也正是馬云宣稱要“搖一搖”傳統(tǒng)金融的基礎(chǔ)。
一位正在大數(shù)據(jù)領(lǐng)域創(chuàng)業(yè)的人士告訴中國證券報記者,他所從事的大數(shù)據(jù)業(yè)務(wù)將為金融企業(yè)提供有關(guān)個人的數(shù)據(jù)化行為分析,并進(jìn)行評級,以推動金融產(chǎn)品的差別定價。例如,給予個人信用好的貸款人更低的貸款利率;或給駕駛行為良好的有車族提供更低的車險保費(fèi)。
隱私保護(hù)的矛盾
隱私問題一直是越來越社交化的互聯(lián)網(wǎng)爭論的熱點(diǎn),而大數(shù)據(jù)時代則將這一爭論進(jìn)一步推向高潮。大數(shù)據(jù)來自于具體的網(wǎng)絡(luò)行為,作為做出這些行為的個人,最關(guān)心的當(dāng)然是自己的隱私數(shù)據(jù)會不會被泄露和濫用。
據(jù)媒體報道,歐洲議會的一項(xiàng)研究報告表示:云計算大數(shù)據(jù)已經(jīng)對個人隱私造成了比想象中更加嚴(yán)重的威脅。該報告還稱:云計算的隱私威脅被低估了。大數(shù)據(jù)時代現(xiàn)有的技術(shù)手段保護(hù)對于個人隱私而言遠(yuǎn)遠(yuǎn)不足,除了要建立健全個人隱私保護(hù)的法律法規(guī)和基本規(guī)則之外,鼓勵隱私保護(hù)技術(shù)的研發(fā)、創(chuàng)新和使用,從技術(shù)層面來保障隱私安全,完善用戶保障體系。
據(jù)段培力介紹,集奧聚合所采用的是非cookies(訪問網(wǎng)絡(luò)時儲存在用戶本地終端上的數(shù)據(jù))數(shù)據(jù),不僅能夠更全面地進(jìn)行受眾描述,也有助于保護(hù)用戶隱私信息?!霸诰W(wǎng)絡(luò)上,其實(shí)有很多地方都屬于‘公共場合’,比如網(wǎng)店、網(wǎng)站公開信息等,用戶在這些區(qū)域產(chǎn)生的數(shù)據(jù)是我們主要使用的。”
據(jù)了解,集奧聚合在隱私安全方面擁有獨(dú)家首創(chuàng)的核心技術(shù),公司采用三級數(shù)據(jù)安全技術(shù)全面保障用戶數(shù)據(jù)的隱私安全。第一級采用集奧聚合大數(shù)據(jù)采集解決方案,在數(shù)據(jù)源頭消除用戶隱私;第二級采用大數(shù)據(jù)挖掘和價值應(yīng)用解決方案,系統(tǒng)間通過IPSEC隧道協(xié)議通信,具有不可否認(rèn)性、發(fā)重播性、數(shù)據(jù)完整性、數(shù)據(jù)可靠性和認(rèn)證功能;第三級采用大數(shù)據(jù)挖掘解決方案,運(yùn)維支撐系統(tǒng)通過SSL隧道協(xié)議維護(hù)挖掘系統(tǒng),具有身份識別和數(shù)據(jù)加密功能。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實(shí)戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實(shí)戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗(yàn)與 t 檢驗(yàn):差異、適用場景與實(shí)踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計學(xué)領(lǐng)域,假設(shè)檢驗(yàn)是驗(yàn)證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實(shí)踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點(diǎn)數(shù)據(jù)的科學(xué)計數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點(diǎn)數(shù)據(jù)時的科學(xué)計數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗(yàn)證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實(shí)戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計” 與 “用戶體驗(yàn) ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當(dāng)下,精準(zhǔn)營銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價值 在數(shù)據(jù)驅(qū)動決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實(shí)踐到業(yè)務(wù)價值挖掘 在數(shù)據(jù)分析場景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價值導(dǎo)向 統(tǒng)計模型作為數(shù)據(jù)分析的核心工具,并非簡單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10