
互聯(lián)網(wǎng)大數(shù)據(jù)技術(shù)藍皮書_數(shù)據(jù)分析師
DMP(數(shù)據(jù)管理平臺)的概念在互聯(lián)網(wǎng)廣告領(lǐng)域并不陌生。然而,你是否真正需要DMP?你可以從DMP中獲取些什么?DMP可以運用到哪些行業(yè)、哪些環(huán)節(jié)?該如何理解DMP的數(shù)據(jù)價值?你的數(shù)據(jù)是否安全?以及如何選擇一個有價值且可信任的DMP合作伙伴,你是否真的了解?
▲
如何理解數(shù)據(jù)價值?
GEO對數(shù)據(jù)價值的理解可以用一個公式來概括:
▲
V=數(shù)據(jù)價值,U=用戶數(shù),V和U是線性關(guān)系,用戶規(guī)模越大,價值越大;N=數(shù)據(jù)的維度,比如用戶的興趣、購物偏好、活動區(qū)域等,V和N是指數(shù)關(guān)系,維度越多,價值便會指數(shù)級增長。特別是在提供DMP服務(wù)的同時,技術(shù)提供方還能獲取更豐富的數(shù)據(jù)。那么,不斷擴張的數(shù)據(jù)量和數(shù)據(jù)維度引由此形成滾雪球效應(yīng),使得數(shù)據(jù)的價值成指數(shù)級提升。此外,值得注意的還有數(shù)據(jù)的時效性。T=時間,T和V成線性關(guān)系。拿關(guān)鍵詞定向為例,數(shù)據(jù)顯示,超過3天的關(guān)鍵詞對于展示廣告的投放基本失去指導(dǎo)意義。
非Cookie數(shù)據(jù) VS Cookie數(shù)據(jù),哪個強?
Cookie數(shù)據(jù)目前主要來源于互聯(lián)網(wǎng)行業(yè),應(yīng)用主要集中在精準廣告、電子商務(wù)、內(nèi)容推薦等領(lǐng)域。Cookie是一種模糊處理技術(shù),由于瀏覽器安全限制、Cookie老化、采集范圍限制等原因,傳統(tǒng)方式采集的Cookie數(shù)據(jù)不夠準確,單用戶特征非常稀疏,時間周期也非常短,特別在移動互聯(lián)網(wǎng)方面Cookie更是失去了其基本價值。
而非Cookie數(shù)據(jù)來源更為廣泛,比如政府開放數(shù)據(jù)、金融企業(yè)開放數(shù)據(jù)、通訊運營商開放數(shù)據(jù)、互聯(lián)網(wǎng)開放數(shù)據(jù)等。這些數(shù)據(jù)更加完整,能夠精準的定位到一個人,也能夠全面反映用戶特征,永不過期,且適用于各個行業(yè)領(lǐng)域。
GEO DataQuate非Cookie大數(shù)據(jù)管理平臺
GEO DMP(Data Management Platform)是全球第一家非Cookie大數(shù)據(jù)管理平臺。不可否認,傳統(tǒng)的Cookie技術(shù)在互聯(lián)網(wǎng)行業(yè)曾經(jīng)廣泛應(yīng)用,但其設(shè)計的初衷在于短期存儲少量用戶信息,在安全性、穩(wěn)定性、一致性等方面都有諸多先天不足,越來越難以適應(yīng)迅猛發(fā)展的互聯(lián)網(wǎng)和移動互聯(lián)網(wǎng)時代的新環(huán)境、新需求。
非Cookie大數(shù)據(jù)管理平臺是大數(shù)據(jù)行業(yè)的一個里程碑式的創(chuàng)新,GEO DMP通過多項專利技術(shù),實現(xiàn)了多維數(shù)據(jù)關(guān)聯(lián),貫通了數(shù)據(jù)的生產(chǎn)者和消費者,建立了完整的大數(shù)據(jù)生態(tài)系統(tǒng)。
打通互聯(lián)網(wǎng)和移動互聯(lián)網(wǎng)數(shù)據(jù)
對DMP來講,最大的難點在于,如何收集和處理數(shù)據(jù),如何建立一種ID識別方法來使得提取的數(shù)據(jù)和使用方的數(shù)據(jù)能夠?qū)?yīng)起來,以及如何保護好用戶隱私安全。那么,GEO是如何解決這幾方面難題的?
眾所周知,打通同一個用戶在移動互聯(lián)網(wǎng)和互聯(lián)網(wǎng)的數(shù)據(jù)對DMP平臺來說至關(guān)重要。GEO采用自有知識產(chǎn)權(quán)的“移固融合”技術(shù)實現(xiàn)了互聯(lián)網(wǎng)、移動互聯(lián)網(wǎng)的打通、第一方數(shù)據(jù)、第三方數(shù)據(jù)的打通、以及線下數(shù)據(jù)和線上數(shù)據(jù)的打通。GEO非Cookie DMP把所有不同類型的數(shù)據(jù)都統(tǒng)一關(guān)聯(lián)到一個“人”,完整刻畫出360°立體的用戶畫像。
1、“移固融合”的前提是充足的數(shù)據(jù)。GEO DMP作為最大的非Cookie數(shù)據(jù)管理平臺,擁有多種來源的海量數(shù)據(jù)。其中,之于“移固融合”技術(shù)最關(guān)鍵的固網(wǎng)DPI(Deep Packet Inspection)數(shù)據(jù)上,GEO處于絕對領(lǐng)先地位:
用戶覆蓋全:覆蓋全國5億用戶,擁有海量數(shù)據(jù);
數(shù)據(jù)維度多:包括用戶人口特征、行為特征、業(yè)務(wù)特征等諸多方面;
渠道來源廣:全面覆蓋政府、金融、通訊、互聯(lián)網(wǎng)等各個渠道。
2、“移固融合”的基礎(chǔ)是“知識庫”的建設(shè)。建立成熟的“知識庫”需要豐富的經(jīng)驗和長期的積累,GEO的“知識庫”開發(fā)團隊成員主要來自于通信行業(yè),對管道中的數(shù)據(jù)有充分的理解;
3、“移固融合”的核心是算法。GEO一直重視數(shù)據(jù)挖掘和算法團隊的建設(shè),并且建設(shè)了統(tǒng)一的云訓(xùn)練平臺,能夠同時支持多個團隊進行AB測試,不斷對模型進行驗證。
其次,GEO 非Cookie DMP是一個開放的大數(shù)據(jù)管理平臺,數(shù)據(jù)來源多樣,管理統(tǒng)一,是全球第一個實現(xiàn)通訊、政府、金融、互聯(lián)網(wǎng)數(shù)據(jù)大融合的DMP平臺,為數(shù)據(jù)消費方提供了一個統(tǒng)一的數(shù)據(jù)入口,降低數(shù)據(jù)使用成本,提高業(yè)務(wù)效率。
最后,關(guān)于如何保護隱私數(shù)據(jù)安全,是建立一個成熟的大數(shù)據(jù)平臺面臨的重要挑戰(zhàn)。作為業(yè)界領(lǐng)先的大數(shù)據(jù)技術(shù)公司,GEO一直對隱私保護問題尤為重視,并就此作了全方位的布局和設(shè)計,這在上一篇我們已經(jīng)重點講述過,這里不再贅述。
案例應(yīng)用
GEO DMP大數(shù)據(jù)管理平臺目前已經(jīng)在電商、通訊、金融、游戲、快消等諸多行業(yè)形成成熟應(yīng)用,也是國內(nèi)唯一規(guī)?;\營的數(shù)據(jù)管理平臺。采用GEO的技術(shù),業(yè)務(wù)應(yīng)用方能夠打消數(shù)據(jù)壁壘、降低數(shù)據(jù)使用成本、提高傳統(tǒng)業(yè)務(wù)效率、快速驗證新業(yè)務(wù)的可行性及實際應(yīng)用價值。
案例一:真正的跨屏營銷:從"多屏"到"跨屏"
“跨屏廣告投放系統(tǒng)”能夠?qū)Σ煌O(shè)備的廣告進行統(tǒng)一的投放管理,提高管理效率,同時也使得投放監(jiān)控與效果評估有了統(tǒng)一的標準。但是現(xiàn)在常被眾人提起的所謂的“跨屏”,僅僅是解決了投放管理的問題,并沒有解決投放效果的問題,還有很多不足:
1、不能針對同一個用戶進行投放?,F(xiàn)有的“跨屏廣告投放系統(tǒng)”只能對互聯(lián)網(wǎng)用戶和移動互聯(lián)網(wǎng)用戶分別投放,沒有辦法識別這些用戶是不是同一個人;
2、無法實現(xiàn)跨屏聯(lián)動。一個用戶在手機上的行為無法指導(dǎo)PC廣告的投放;
3、跨屏的頻次控制?,F(xiàn)有的投放系統(tǒng)只能夠?qū)ヂ?lián)網(wǎng)廣告或移動互聯(lián)網(wǎng)廣告單獨控制投放頻次,無法做到跨屏的頻次控制,廣告的實際投放效果不能保證。
GEO的aDirect是全球第一個能夠?qū)崿F(xiàn)跨屏聯(lián)動的廣告投放系統(tǒng),采用了GEO自有知識產(chǎn)權(quán)的移動固網(wǎng)融合技術(shù),用非Cookie數(shù)據(jù)打通PC和移動端,真正實現(xiàn)了移動和固網(wǎng)的無縫融合,做到跨屏廣告的統(tǒng)一投放及管理?;贕EO DMP數(shù)據(jù)管理平臺,aDirect可以實現(xiàn):
1、移動固網(wǎng)設(shè)備ID關(guān)聯(lián)。通過關(guān)聯(lián),一個用戶在使用不同設(shè)備上網(wǎng)時,廣告投放系統(tǒng)能夠知道是同一個人在訪問,這樣就可以實現(xiàn)真正的跨屏聯(lián)動;
2、移動和固網(wǎng)數(shù)據(jù)統(tǒng)一建模分析。GEO擁有自己獨立的標簽分類體系,針對移動和固網(wǎng)不同來源的數(shù)據(jù),GEO采用統(tǒng)一的模型對用戶特征進行標注,也就是說模型既可以利用移動數(shù)據(jù)、也可以利用固網(wǎng)數(shù)據(jù),還可以移動固網(wǎng)數(shù)據(jù)同時使用。不同的數(shù)據(jù)源不影響模型運算結(jié)果的輸出;
3、跨屏聯(lián)動。移動固網(wǎng)ID關(guān)聯(lián)和統(tǒng)一建模技術(shù)使得跨屏聯(lián)動成為現(xiàn)實。aDirect根據(jù)統(tǒng)一標注的用戶標簽,可以實現(xiàn)在PC和手機上同步投放廣告:同一個人在同一段時間訪問不同設(shè)備時,能夠看到同樣的廣告。根據(jù)GEO的統(tǒng)計,采用跨屏聯(lián)動技術(shù)可以使廣告的轉(zhuǎn)化率提高70%以上;
4、跨屏頻次控制。aDirect能夠在同樣的廣告在不同設(shè)備顯示時,既可以控制一個廣告的總投放頻次,也可以控制每個設(shè)備投放一個廣告的頻次。
案例二:互聯(lián)網(wǎng)金融征信:讓“陌生人”不再“陌生”
在國外,征信是一個成熟的行業(yè)。在美國FICO指數(shù)應(yīng)用非常廣泛,從車貸到房貸都可以根據(jù)FICO指數(shù)快速申請,Trans Union(環(huán)聯(lián))、Equifax(艾可飛)、Experian(益百利)三大數(shù)據(jù)公司為FICO提供了完善的基礎(chǔ)數(shù)據(jù)服務(wù)。在中國,雖然央行成立了征信中心,也開始面向個人提供征信報告服務(wù),但由于數(shù)據(jù)不全、維度不夠豐富等原因還是不能很好的滿足其抵抗風(fēng)險和個性化服務(wù)的需求。
另外一方面,隨著互聯(lián)網(wǎng)金融的爆炸性增長,互聯(lián)網(wǎng)金融企業(yè)對個人征信的需求越來越強烈,主要涵蓋以下方面:
1、用戶量要大,最好能夠覆蓋全國用戶;
2、數(shù)據(jù)維度(feature)要豐富,要能夠體現(xiàn)用戶信用的差異;
3、要長時間的歷史數(shù)據(jù),最好有若干年的數(shù)據(jù);
4、系統(tǒng)查詢速度要快,最好能夠直接線上完成授信。
對于以上需求,以非Cookie數(shù)據(jù)為基礎(chǔ)的GEO DMP平臺很自然的成為了首選。從GEO和國內(nèi)銀行合作的案例來觀察,通過GEO DMP提供的用戶社交、通訊、位置等數(shù)據(jù),結(jié)合第一方數(shù)據(jù)庫的線下數(shù)據(jù),共同訓(xùn)練了風(fēng)險控制模型。該模型的應(yīng)用使得貸款的壞賬率降低了2%-5%,實踐效果非常顯著。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
用 SQL 生成逆向回滾 SQL:數(shù)據(jù)操作的 “后悔藥” 指南? 在數(shù)據(jù)庫操作中,誤刪數(shù)據(jù)、錯改字段或誤執(zhí)行批量更新等問題時有發(fā)生。 ...
2025-07-14如何考取數(shù)據(jù)分析師證書:以 CDA 為例? ? 在數(shù)字化浪潮席卷各行各業(yè)的當下,數(shù)據(jù)分析師已然成為企業(yè)挖掘數(shù)據(jù)價值、驅(qū)動決策的 ...
2025-07-14t檢驗與Wilcoxon檢驗的選擇:何時用t.test,何時用wilcox.test? t 檢驗與 Wilcoxon 檢驗的選擇:何時用 t.test,何時用 wilcox. ...
2025-07-14AI 浪潮下的生存與進階: CDA數(shù)據(jù)分析師—開啟新時代職業(yè)生涯的鑰匙(深度研究報告、發(fā)展指導(dǎo)白皮書) 發(fā)布機構(gòu):CDA數(shù)據(jù)科 ...
2025-07-13LSTM 模型輸入長度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準備指南? ? 在數(shù)據(jù)驅(qū)動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認 ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預(yù)測分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢預(yù)判? ? 在數(shù)據(jù)驅(qū)動決策的時代,預(yù)測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點,而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報考到取證的全攻略? 在數(shù)字經(jīng)濟蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗:捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準 ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗:數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認證作為國內(nèi)權(quán)威的數(shù)據(jù)分析能力認證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對策略? 長短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨特的門控機制,在 ...
2025-07-07統(tǒng)計學(xué)方法在市場調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場調(diào)研是企業(yè)洞察市場動態(tài)、了解消費者需求的重要途徑,而統(tǒng)計學(xué)方法則是市場調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07