
大數(shù)據(jù)時代的用戶行為研究
隨著大數(shù)據(jù)行業(yè)的飛速發(fā)展,未來5-10年將是大數(shù)據(jù)產(chǎn)業(yè)的黃金增長期。2017年3月21日我國成立了首個聚焦數(shù)據(jù)流動的國家級實(shí)驗(yàn)室——大數(shù)據(jù)流通與交易國家工程實(shí)驗(yàn)室。2017年國內(nèi)大數(shù)據(jù)技術(shù)和服務(wù)市場的復(fù)合年增長率預(yù)計將達(dá)27%,市場規(guī)模約320億美元。設(shè)備指紋技術(shù)實(shí)現(xiàn)了對用戶移動設(shè)備的精準(zhǔn)識別,結(jié)合大數(shù)據(jù)用戶研究,使得大數(shù)據(jù)在精準(zhǔn)營銷、智能推薦等諸多領(lǐng)域能夠完美定位目標(biāo)用戶,實(shí)現(xiàn)信息的精準(zhǔn)觸達(dá)。大數(shù)據(jù)用戶研究,不僅僅需要洞察用戶特征、用戶偏好,還需要評估用戶間的關(guān)聯(lián)度,建立用戶社交網(wǎng)絡(luò)。只有對用戶全方位的洞察,才能提高定位目標(biāo)用戶的精度,提供大數(shù)據(jù)應(yīng)用質(zhì)量。
研究背景
極光大數(shù)據(jù)擁有海量的用戶行為數(shù)據(jù),能夠?yàn)槠髽I(yè)提供全行業(yè)諸多領(lǐng)域的綜合解決方案。目前基于自有的大數(shù)據(jù)平臺,極光大數(shù)據(jù)在精準(zhǔn)營銷、數(shù)字化運(yùn)營、智能推薦等領(lǐng)域取得了豐碩的成果。而極光大數(shù)據(jù)在這些領(lǐng)域的成就,完全取決于極光高效率的大數(shù)據(jù)平臺、豐富的數(shù)據(jù)資源、海量跨行業(yè)用戶標(biāo)簽、以及經(jīng)驗(yàn)豐富的團(tuán)隊(duì)。
目前大數(shù)據(jù)行業(yè)中對于用戶的研究大多數(shù)集中于用戶標(biāo)簽開發(fā)階段。而極光大數(shù)據(jù)為了提升自己數(shù)據(jù)產(chǎn)品的質(zhì)量和實(shí)力,在精準(zhǔn)營銷和智能推薦的實(shí)際案例中不僅使用了海量的客戶標(biāo)簽,還將基于設(shè)備的用戶相似性引入模型,以提高目標(biāo)用戶識別精度和廣度,實(shí)際運(yùn)用中也取得了非常好的效果。此外設(shè)備相似性為兩兩之間的相似性,對于較大用戶體量的極光大數(shù)據(jù)來說,整個模型處理計算量非常龐大,性能和精度也是我們不斷優(yōu)化的關(guān)鍵點(diǎn)。
極光大數(shù)據(jù)研究方案
本文重點(diǎn)介紹基于極光海量數(shù)據(jù),計算基于用戶在移動互聯(lián)網(wǎng)行為特征的用戶行為相似性,以及基于用戶線下地理位置軌跡的空間軌跡相似度。
1、 一人多機(jī)檢測
極光大數(shù)據(jù)通過自有業(yè)務(wù)海量調(diào)用日志分析,對于用戶設(shè)備及app建立了多維度的唯一性識別標(biāo)識,通過設(shè)備的多維度識別交叉定位,發(fā)掘設(shè)備關(guān)聯(lián)關(guān)系。
2、 用戶行為相似性
極光大數(shù)據(jù)通過移動設(shè)備的用戶行為相似性來衡量用戶在移動設(shè)備上的使用行為相關(guān)程度,主要從2個方面來度量:
app安裝特征相似度:
基于極光大數(shù)據(jù)平臺的海量數(shù)據(jù)挖掘,構(gòu)造用戶app安裝行為特征矩陣,使用廣義Jaccard相關(guān)系數(shù),計算用戶app安裝特征相似度。對于用戶app安裝特征,不同的app能夠反映用戶相似度的程度有很大差異,根據(jù)app的滲透率加權(quán)得到修正后的app安裝特征相似度。
WiFi特征關(guān)聯(lián)度:
基于極光大數(shù)據(jù)平臺的海量數(shù)據(jù),根據(jù)時間、空間、無線WiFi屬性等信息進(jìn)行清洗加工,建立用戶WiFi使用特征矩陣;基于用戶WiFi特征矩陣,對于不同時段設(shè)備間的WiFi特征,采用余弦相似度計算兩兩用戶間的工作日WiFi使用特征關(guān)聯(lián)度和周末WiFi使用特征關(guān)聯(lián)度。
3、空間軌跡相似度
空間軌跡相似度(spatial trajectory similarity)算法的基本思想就是通過降維的手段將多維空間向量分解到同一維度上求解,通過解決平面問題來達(dá)到最終解決空間模型的目的。
兩個軌跡間的相似度可以定義為:Sim(A,B) = (POIA∩POIB)/ (POIA∪POIB);
向量空間余弦相似度(Cosine Similarity):余弦相似度用向量空間中兩個向量夾角的余弦值作為衡量兩個個體間差異的大小。余弦值越接近1,就表明夾角越接近0度,也就是兩個向量越相似。
提取一段時間內(nèi)的用戶報點(diǎn)信息,按照時間序列處理,采用STS算法,計算兩兩設(shè)備間的空間軌跡相似度。
實(shí)證效果
1、app安裝特征相似度:
對于某用戶換機(jī)前后的兩個設(shè)備,計算app安裝特征相似度,使用app滲透率加權(quán),兩個移動設(shè)備的app安裝特征相似度為:0.913,app安裝特征相似性非常高。
兩個設(shè)備安裝app數(shù)量為120個以上,app安裝重合度為72.8%,同時安裝了滲透率低于5%的app應(yīng)用有22個,滲透率低于1%的app有7個。由此可見,app的安裝情況能在一定程度上反應(yīng)設(shè)備之間的相似性。
2、 WiFi使用特征關(guān)聯(lián)度:
基于兩個設(shè)備的WiFi使用偏好情況,計算WiFi特征關(guān)聯(lián)度,計算得出工作日WiFi使用特征關(guān)聯(lián)度為0.35,周末WiFi使用特征關(guān)聯(lián)度為0;
經(jīng)過極光大量數(shù)據(jù)驗(yàn)證,工作日WiFi特征關(guān)聯(lián)度大于0.25,為工作日關(guān)系較為密切的用戶,比如同事關(guān)系;周末WiFi特征關(guān)聯(lián)度大于50%,為周末關(guān)系較為密切的用戶,比如親人。
3、空間軌跡相似度
從極光大數(shù)據(jù)數(shù)據(jù)庫中挑選3個空間軌跡較為相似的設(shè)備,其中設(shè)備A和設(shè)備C為同一用戶的兩個設(shè)備,設(shè)備A和設(shè)備B的位置軌跡比較相近,以設(shè)備A為基準(zhǔn),分別計算設(shè)備A和設(shè)備B、設(shè)備A和設(shè)備C的空間軌跡相似度。
上表中都是解析出的各軌跡對應(yīng)的POI坐標(biāo)值,按時間維度將三維空間軌跡解析到平面中,分別取各POI點(diǎn)的經(jīng)度(id,lat)和維度(id,lng)計算軌跡間的余弦相似度。二者的平面軌跡圖如下(紅線表示設(shè)備A,藍(lán)實(shí)線表示設(shè)備B,虛線表示設(shè)備C):
可以計算出COSlat(A,B)= 0.708, COSlng(A,B)= 0.784; COSlat(A,C)= 0.746, COSlng(A,C)= 0.819;
那么可以得到該設(shè)備A與設(shè)備B的相似度為0.746,與設(shè)備C的相似度為0.783。顯然設(shè)備A和設(shè)備C的空間相似度較高。
總結(jié)
目前各個行業(yè)的大數(shù)據(jù)的應(yīng)用越來越頻繁,大數(shù)據(jù)精準(zhǔn)營銷、大數(shù)據(jù)運(yùn)營、智能推薦等應(yīng)用均取得顯著的效果,而這些領(lǐng)域都要求企業(yè)對用戶要有充分的了解,才能精準(zhǔn)的定位目標(biāo)人群。如何有效高質(zhì)量的擴(kuò)充目標(biāo)群體用戶,基于現(xiàn)有用戶標(biāo)簽的基礎(chǔ)上,用戶相似性也是一個非常重要的信息。極光大數(shù)據(jù)基于設(shè)備的用戶相似性能夠在精準(zhǔn)營銷、智能推薦中發(fā)現(xiàn)很多的關(guān)聯(lián)用戶,能夠一定程度上擴(kuò)充關(guān)聯(lián)目標(biāo)人群,提升企業(yè)的營銷效率和質(zhì)量。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實(shí)用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強(qiáng)大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實(shí)施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預(yù)測分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢預(yù)判? ? 在數(shù)據(jù)驅(qū)動決策的時代,預(yù)測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點(diǎn),而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報考到取證的全攻略? 在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗(yàn):捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗(yàn)如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實(shí)戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗(yàn):數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對策略? 長短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨(dú)特的門控機(jī)制,在 ...
2025-07-07統(tǒng)計學(xué)方法在市場調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場調(diào)研是企業(yè)洞察市場動態(tài)、了解消費(fèi)者需求的重要途徑,而統(tǒng)計學(xué)方法則是市場調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03