
互聯(lián)網(wǎng)大數(shù)據(jù)技術(shù)藍(lán)皮書(shū)_數(shù)據(jù)分析師
DMP(數(shù)據(jù)管理平臺(tái))的概念在互聯(lián)網(wǎng)廣告領(lǐng)域并不陌生。然而,你是否真正需要DMP?你可以從DMP中獲取些什么?DMP可以運(yùn)用到哪些行業(yè)、哪些環(huán)節(jié)?該如何理解DMP的數(shù)據(jù)價(jià)值?你的數(shù)據(jù)是否安全?以及如何選擇一個(gè)有價(jià)值且可信任的DMP合作伙伴,你是否真的了解?
▲
如何理解數(shù)據(jù)價(jià)值?
GEO對(duì)數(shù)據(jù)價(jià)值的理解可以用一個(gè)公式來(lái)概括:
▲
V=數(shù)據(jù)價(jià)值,U=用戶數(shù),V和U是線性關(guān)系,用戶規(guī)模越大,價(jià)值越大;N=數(shù)據(jù)的維度,比如用戶的興趣、購(gòu)物偏好、活動(dòng)區(qū)域等,V和N是指數(shù)關(guān)系,維度越多,價(jià)值便會(huì)指數(shù)級(jí)增長(zhǎng)。特別是在提供DMP服務(wù)的同時(shí),技術(shù)提供方還能獲取更豐富的數(shù)據(jù)。那么,不斷擴(kuò)張的數(shù)據(jù)量和數(shù)據(jù)維度引由此形成滾雪球效應(yīng),使得數(shù)據(jù)的價(jià)值成指數(shù)級(jí)提升。此外,值得注意的還有數(shù)據(jù)的時(shí)效性。T=時(shí)間,T和V成線性關(guān)系。拿關(guān)鍵詞定向?yàn)槔?,?shù)據(jù)顯示,超過(guò)3天的關(guān)鍵詞對(duì)于展示廣告的投放基本失去指導(dǎo)意義。
非Cookie數(shù)據(jù) VS Cookie數(shù)據(jù),哪個(gè)強(qiáng)?
Cookie數(shù)據(jù)目前主要來(lái)源于互聯(lián)網(wǎng)行業(yè),應(yīng)用主要集中在精準(zhǔn)廣告、電子商務(wù)、內(nèi)容推薦等領(lǐng)域。Cookie是一種模糊處理技術(shù),由于瀏覽器安全限制、Cookie老化、采集范圍限制等原因,傳統(tǒng)方式采集的Cookie數(shù)據(jù)不夠準(zhǔn)確,單用戶特征非常稀疏,時(shí)間周期也非常短,特別在移動(dòng)互聯(lián)網(wǎng)方面Cookie更是失去了其基本價(jià)值。
而非Cookie數(shù)據(jù)來(lái)源更為廣泛,比如政府開(kāi)放數(shù)據(jù)、金融企業(yè)開(kāi)放數(shù)據(jù)、通訊運(yùn)營(yíng)商開(kāi)放數(shù)據(jù)、互聯(lián)網(wǎng)開(kāi)放數(shù)據(jù)等。這些數(shù)據(jù)更加完整,能夠精準(zhǔn)的定位到一個(gè)人,也能夠全面反映用戶特征,永不過(guò)期,且適用于各個(gè)行業(yè)領(lǐng)域。
GEO DataQuate非Cookie大數(shù)據(jù)管理平臺(tái)
GEO DMP(Data Management Platform)是全球第一家非Cookie大數(shù)據(jù)管理平臺(tái)。不可否認(rèn),傳統(tǒng)的Cookie技術(shù)在互聯(lián)網(wǎng)行業(yè)曾經(jīng)廣泛應(yīng)用,但其設(shè)計(jì)的初衷在于短期存儲(chǔ)少量用戶信息,在安全性、穩(wěn)定性、一致性等方面都有諸多先天不足,越來(lái)越難以適應(yīng)迅猛發(fā)展的互聯(lián)網(wǎng)和移動(dòng)互聯(lián)網(wǎng)時(shí)代的新環(huán)境、新需求。
非Cookie大數(shù)據(jù)管理平臺(tái)是大數(shù)據(jù)行業(yè)的一個(gè)里程碑式的創(chuàng)新,GEO DMP通過(guò)多項(xiàng)專利技術(shù),實(shí)現(xiàn)了多維數(shù)據(jù)關(guān)聯(lián),貫通了數(shù)據(jù)的生產(chǎn)者和消費(fèi)者,建立了完整的大數(shù)據(jù)生態(tài)系統(tǒng)。
打通互聯(lián)網(wǎng)和移動(dòng)互聯(lián)網(wǎng)數(shù)據(jù)
對(duì)DMP來(lái)講,最大的難點(diǎn)在于,如何收集和處理數(shù)據(jù),如何建立一種ID識(shí)別方法來(lái)使得提取的數(shù)據(jù)和使用方的數(shù)據(jù)能夠?qū)?yīng)起來(lái),以及如何保護(hù)好用戶隱私安全。那么,GEO是如何解決這幾方面難題的?
眾所周知,打通同一個(gè)用戶在移動(dòng)互聯(lián)網(wǎng)和互聯(lián)網(wǎng)的數(shù)據(jù)對(duì)DMP平臺(tái)來(lái)說(shuō)至關(guān)重要。GEO采用自有知識(shí)產(chǎn)權(quán)的“移固融合”技術(shù)實(shí)現(xiàn)了互聯(lián)網(wǎng)、移動(dòng)互聯(lián)網(wǎng)的打通、第一方數(shù)據(jù)、第三方數(shù)據(jù)的打通、以及線下數(shù)據(jù)和線上數(shù)據(jù)的打通。GEO非Cookie DMP把所有不同類(lèi)型的數(shù)據(jù)都統(tǒng)一關(guān)聯(lián)到一個(gè)“人”,完整刻畫(huà)出360°立體的用戶畫(huà)像。
1、“移固融合”的前提是充足的數(shù)據(jù)。GEO DMP作為最大的非Cookie數(shù)據(jù)管理平臺(tái),擁有多種來(lái)源的海量數(shù)據(jù)。其中,之于“移固融合”技術(shù)最關(guān)鍵的固網(wǎng)DPI(Deep Packet Inspection)數(shù)據(jù)上,GEO處于絕對(duì)領(lǐng)先地位:
用戶覆蓋全:覆蓋全國(guó)5億用戶,擁有海量數(shù)據(jù);
數(shù)據(jù)維度多:包括用戶人口特征、行為特征、業(yè)務(wù)特征等諸多方面;
渠道來(lái)源廣:全面覆蓋政府、金融、通訊、互聯(lián)網(wǎng)等各個(gè)渠道。
2、“移固融合”的基礎(chǔ)是“知識(shí)庫(kù)”的建設(shè)。建立成熟的“知識(shí)庫(kù)”需要豐富的經(jīng)驗(yàn)和長(zhǎng)期的積累,GEO的“知識(shí)庫(kù)”開(kāi)發(fā)團(tuán)隊(duì)成員主要來(lái)自于通信行業(yè),對(duì)管道中的數(shù)據(jù)有充分的理解;
3、“移固融合”的核心是算法。GEO一直重視數(shù)據(jù)挖掘和算法團(tuán)隊(duì)的建設(shè),并且建設(shè)了統(tǒng)一的云訓(xùn)練平臺(tái),能夠同時(shí)支持多個(gè)團(tuán)隊(duì)進(jìn)行AB測(cè)試,不斷對(duì)模型進(jìn)行驗(yàn)證。
其次,GEO 非Cookie DMP是一個(gè)開(kāi)放的大數(shù)據(jù)管理平臺(tái),數(shù)據(jù)來(lái)源多樣,管理統(tǒng)一,是全球第一個(gè)實(shí)現(xiàn)通訊、政府、金融、互聯(lián)網(wǎng)數(shù)據(jù)大融合的DMP平臺(tái),為數(shù)據(jù)消費(fèi)方提供了一個(gè)統(tǒng)一的數(shù)據(jù)入口,降低數(shù)據(jù)使用成本,提高業(yè)務(wù)效率。
最后,關(guān)于如何保護(hù)隱私數(shù)據(jù)安全,是建立一個(gè)成熟的大數(shù)據(jù)平臺(tái)面臨的重要挑戰(zhàn)。作為業(yè)界領(lǐng)先的大數(shù)據(jù)技術(shù)公司,GEO一直對(duì)隱私保護(hù)問(wèn)題尤為重視,并就此作了全方位的布局和設(shè)計(jì),這在上一篇我們已經(jīng)重點(diǎn)講述過(guò),這里不再贅述。
案例應(yīng)用
GEO DMP大數(shù)據(jù)管理平臺(tái)目前已經(jīng)在電商、通訊、金融、游戲、快消等諸多行業(yè)形成成熟應(yīng)用,也是國(guó)內(nèi)唯一規(guī)模化運(yùn)營(yíng)的數(shù)據(jù)管理平臺(tái)。采用GEO的技術(shù),業(yè)務(wù)應(yīng)用方能夠打消數(shù)據(jù)壁壘、降低數(shù)據(jù)使用成本、提高傳統(tǒng)業(yè)務(wù)效率、快速驗(yàn)證新業(yè)務(wù)的可行性及實(shí)際應(yīng)用價(jià)值。
案例一:真正的跨屏營(yíng)銷(xiāo):從"多屏"到"跨屏"
“跨屏廣告投放系統(tǒng)”能夠?qū)Σ煌O(shè)備的廣告進(jìn)行統(tǒng)一的投放管理,提高管理效率,同時(shí)也使得投放監(jiān)控與效果評(píng)估有了統(tǒng)一的標(biāo)準(zhǔn)。但是現(xiàn)在常被眾人提起的所謂的“跨屏”,僅僅是解決了投放管理的問(wèn)題,并沒(méi)有解決投放效果的問(wèn)題,還有很多不足:
1、不能針對(duì)同一個(gè)用戶進(jìn)行投放。現(xiàn)有的“跨屏廣告投放系統(tǒng)”只能對(duì)互聯(lián)網(wǎng)用戶和移動(dòng)互聯(lián)網(wǎng)用戶分別投放,沒(méi)有辦法識(shí)別這些用戶是不是同一個(gè)人;
2、無(wú)法實(shí)現(xiàn)跨屏聯(lián)動(dòng)。一個(gè)用戶在手機(jī)上的行為無(wú)法指導(dǎo)PC廣告的投放;
3、跨屏的頻次控制?,F(xiàn)有的投放系統(tǒng)只能夠?qū)ヂ?lián)網(wǎng)廣告或移動(dòng)互聯(lián)網(wǎng)廣告單獨(dú)控制投放頻次,無(wú)法做到跨屏的頻次控制,廣告的實(shí)際投放效果不能保證。
GEO的aDirect是全球第一個(gè)能夠?qū)崿F(xiàn)跨屏聯(lián)動(dòng)的廣告投放系統(tǒng),采用了GEO自有知識(shí)產(chǎn)權(quán)的移動(dòng)固網(wǎng)融合技術(shù),用非Cookie數(shù)據(jù)打通PC和移動(dòng)端,真正實(shí)現(xiàn)了移動(dòng)和固網(wǎng)的無(wú)縫融合,做到跨屏廣告的統(tǒng)一投放及管理。基于GEO DMP數(shù)據(jù)管理平臺(tái),aDirect可以實(shí)現(xiàn):
1、移動(dòng)固網(wǎng)設(shè)備ID關(guān)聯(lián)。通過(guò)關(guān)聯(lián),一個(gè)用戶在使用不同設(shè)備上網(wǎng)時(shí),廣告投放系統(tǒng)能夠知道是同一個(gè)人在訪問(wèn),這樣就可以實(shí)現(xiàn)真正的跨屏聯(lián)動(dòng);
2、移動(dòng)和固網(wǎng)數(shù)據(jù)統(tǒng)一建模分析。GEO擁有自己獨(dú)立的標(biāo)簽分類(lèi)體系,針對(duì)移動(dòng)和固網(wǎng)不同來(lái)源的數(shù)據(jù),GEO采用統(tǒng)一的模型對(duì)用戶特征進(jìn)行標(biāo)注,也就是說(shuō)模型既可以利用移動(dòng)數(shù)據(jù)、也可以利用固網(wǎng)數(shù)據(jù),還可以移動(dòng)固網(wǎng)數(shù)據(jù)同時(shí)使用。不同的數(shù)據(jù)源不影響模型運(yùn)算結(jié)果的輸出;
3、跨屏聯(lián)動(dòng)。移動(dòng)固網(wǎng)ID關(guān)聯(lián)和統(tǒng)一建模技術(shù)使得跨屏聯(lián)動(dòng)成為現(xiàn)實(shí)。aDirect根據(jù)統(tǒng)一標(biāo)注的用戶標(biāo)簽,可以實(shí)現(xiàn)在PC和手機(jī)上同步投放廣告:同一個(gè)人在同一段時(shí)間訪問(wèn)不同設(shè)備時(shí),能夠看到同樣的廣告。根據(jù)GEO的統(tǒng)計(jì),采用跨屏聯(lián)動(dòng)技術(shù)可以使廣告的轉(zhuǎn)化率提高70%以上;
4、跨屏頻次控制。aDirect能夠在同樣的廣告在不同設(shè)備顯示時(shí),既可以控制一個(gè)廣告的總投放頻次,也可以控制每個(gè)設(shè)備投放一個(gè)廣告的頻次。
案例二:互聯(lián)網(wǎng)金融征信:讓“陌生人”不再“陌生”
在國(guó)外,征信是一個(gè)成熟的行業(yè)。在美國(guó)FICO指數(shù)應(yīng)用非常廣泛,從車(chē)貸到房貸都可以根據(jù)FICO指數(shù)快速申請(qǐng),Trans Union(環(huán)聯(lián))、Equifax(艾可飛)、Experian(益百利)三大數(shù)據(jù)公司為FICO提供了完善的基礎(chǔ)數(shù)據(jù)服務(wù)。在中國(guó),雖然央行成立了征信中心,也開(kāi)始面向個(gè)人提供征信報(bào)告服務(wù),但由于數(shù)據(jù)不全、維度不夠豐富等原因還是不能很好的滿足其抵抗風(fēng)險(xiǎn)和個(gè)性化服務(wù)的需求。
另外一方面,隨著互聯(lián)網(wǎng)金融的爆炸性增長(zhǎng),互聯(lián)網(wǎng)金融企業(yè)對(duì)個(gè)人征信的需求越來(lái)越強(qiáng)烈,主要涵蓋以下方面:
1、用戶量要大,最好能夠覆蓋全國(guó)用戶;
2、數(shù)據(jù)維度(feature)要豐富,要能夠體現(xiàn)用戶信用的差異;
3、要長(zhǎng)時(shí)間的歷史數(shù)據(jù),最好有若干年的數(shù)據(jù);
4、系統(tǒng)查詢速度要快,最好能夠直接線上完成授信。
對(duì)于以上需求,以非Cookie數(shù)據(jù)為基礎(chǔ)的GEO DMP平臺(tái)很自然的成為了首選。從GEO和國(guó)內(nèi)銀行合作的案例來(lái)觀察,通過(guò)GEO DMP提供的用戶社交、通訊、位置等數(shù)據(jù),結(jié)合第一方數(shù)據(jù)庫(kù)的線下數(shù)據(jù),共同訓(xùn)練了風(fēng)險(xiǎn)控制模型。該模型的應(yīng)用使得貸款的壞賬率降低了2%-5%,實(shí)踐效果非常顯著。
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
訓(xùn)練與驗(yàn)證損失驟升:機(jī)器學(xué)習(xí)訓(xùn)練中的異常診斷與解決方案 在機(jī)器學(xué)習(xí)模型訓(xùn)練過(guò)程中,“損失曲線” 是反映模型學(xué)習(xí)狀態(tài)的核心指 ...
2025-09-19解析 DataHub 與 Kafka:數(shù)據(jù)生態(tài)中兩類(lèi)核心工具的差異與協(xié)同 在數(shù)字化轉(zhuǎn)型加速的今天,企業(yè)對(duì)數(shù)據(jù)的需求已從 “存儲(chǔ)” 轉(zhuǎn)向 “ ...
2025-09-19CDA 數(shù)據(jù)分析師:讓統(tǒng)計(jì)基本概念成為業(yè)務(wù)決策的底層邏輯 統(tǒng)計(jì)基本概念是商業(yè)數(shù)據(jù)分析的 “基礎(chǔ)語(yǔ)言”—— 從描述數(shù)據(jù)分布的 “均 ...
2025-09-19CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫(kù)表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-19SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實(shí)戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無(wú)論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫(kù)管理中,“大表” 始終是性能優(yōu)化繞不開(kāi)的話題。 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動(dòng)態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開(kāi)始提取前,需先判斷 TIF 文件的類(lèi)型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價(jià)值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫(kù)表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實(shí)戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫(kù))處理 Excel 數(shù)據(jù)時(shí),“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗(yàn)與 t 檢驗(yàn):差異、適用場(chǎng)景與實(shí)踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計(jì)學(xué)領(lǐng)域,假設(shè)檢驗(yàn)是驗(yàn)證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤(pán)手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計(jì)劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計(jì)劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對(duì)象的 text 與 content:區(qū)別、場(chǎng)景與實(shí)踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請(qǐng)求開(kāi)發(fā)時(shí)(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價(jià)值的核心操盤(pán)手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫(kù)表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請(qǐng)求工具對(duì)比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請(qǐng)求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)的科學(xué)計(jì)數(shù)法問(wèn)題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)時(shí)的科學(xué)計(jì)數(shù)法問(wèn)題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價(jià)值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營(yíng)問(wèn)題、提升執(zhí)行效率的核心手段,其價(jià)值 ...
2025-09-12用 SQL 驗(yàn)證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實(shí)戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過(guò)程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計(jì)” 與 “用戶體驗(yàn) ...
2025-09-11塔吉特百貨孕婦營(yíng)銷(xiāo)案例:數(shù)據(jù)驅(qū)動(dòng)下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見(jiàn)頂” 的當(dāng)下,精準(zhǔn)營(yíng)銷(xiāo)成為企業(yè)突圍的核心方 ...
2025-09-11