
作者:小伍哥
來源:小伍哥聊風(fēng)控
大家好,我是小伍哥。
風(fēng)控業(yè)務(wù)中,團(tuán)伙挖掘是非常核心的分析方法,甚至可以說是最重要的的分析方法。而團(tuán)伙挖掘的基礎(chǔ)就是關(guān)系數(shù)據(jù),但是關(guān)系數(shù)據(jù)非常豐富多樣,有些同學(xué)可能會疏漏或者不知道某些重要的關(guān)系導(dǎo)致挖掘深度不夠。
我對自己遇到過的一些關(guān)系進(jìn)行了全面的梳理(大家遇到過其他的也可以在區(qū)補(bǔ)充),希望能給你帶來一定的啟示作用。
商家規(guī)避網(wǎng)絡(luò),需要付出巨大的成本,比如規(guī)避設(shè)備指紋關(guān)聯(lián),需要更換設(shè)備或者購買最新的模擬器技術(shù),為了規(guī)避支付網(wǎng)絡(luò),需要購買新的支付寶賬號。
但是黑產(chǎn)從業(yè)人員反偵察能力不斷提高,從簡單違規(guī)到各種高科技違規(guī),留下的信息越來越少,為了分析關(guān)聯(lián)人員,關(guān)系也有了很大的演進(jìn),從簡單可理解關(guān)系逐步到復(fù)雜抽象關(guān)系, 下面我們一一總結(jié)。
在互聯(lián)網(wǎng)上,沒人知道你是一條狗,互聯(lián)網(wǎng)上無法知道一個真實(shí)的用戶,因此設(shè)備指紋ID、WiFi等物理介質(zhì)與用戶ID形成的關(guān)系,變得非常重要??筛鶕?jù)最近N天內(nèi)是否共同使用過一臺設(shè)備、是否共同使用過同一個WiFi等指標(biāo)衡量其中兩個用戶的關(guān)聯(lián)強(qiáng)度,對于對抗初期的團(tuán)伙挖掘,有非常重要的意義。
IP、Cookie等由用戶進(jìn)行網(wǎng)頁瀏覽時形成的關(guān)系,一般來說,該類關(guān)系相對較弱,不進(jìn)行直接應(yīng)用,可以進(jìn)行轉(zhuǎn)換應(yīng)用,比如用Ip轉(zhuǎn)換后進(jìn)行常用地址的統(tǒng)計,一般可以在盜號等場景使用效果非常不錯。
支付寶好友、微信好友、抖音好友、微博關(guān)注等,也是非常重要的關(guān)系特征,可根據(jù)最近N天內(nèi)聯(lián)系次數(shù)、關(guān)系時長等指標(biāo)來衡量兩個人之間的親密程度。
手機(jī)通話關(guān)系、通訊錄中的備注、賬號填寫的緊急聯(lián)系人等數(shù)據(jù)、獲取兩個賬號的父子、兄弟、同學(xué)、男女朋友等關(guān)系。
收貨地址、發(fā)貨地址、注冊地址、家庭住址等形成的關(guān)系,可以通過是否同一收貨地址,收貨地址相識程度等,計算兩個用戶緊密關(guān)系
拉新活動形成的關(guān)系、分享關(guān)系、推薦關(guān)系等,形成各種上下層級關(guān)系,如拼多多的砍一刀、要邀請有獎等,直接形成的業(yè)務(wù)關(guān)系,也是非常重要的。
購物支付、購物代付、轉(zhuǎn)賬、微信轉(zhuǎn)賬、銀行卡支付、銀行卡轉(zhuǎn)賬、銀行卡綁定、電話充值等,均能形成較強(qiáng)的關(guān)系,資金關(guān)系在大部分場景下,是極強(qiáng)的關(guān)系,但某些場景,可能比較通用,購物轉(zhuǎn)賬等,可能就不是很強(qiáng)的關(guān)系。很難形成團(tuán)伙。
一種簡化方法,是用GeoHash將二維的經(jīng)緯度轉(zhuǎn)換成字符串,,如北京9個區(qū)域的GeoHash字符串,分別是WX4ER,WX4G2、WX4G3等等,每一個字符串代表了某一矩形區(qū)域不同的用戶是否處于同一個區(qū)塊。同一塊的用戶,可能存在比較緊密的關(guān)系。
商品的標(biāo)題、前幾位相似的昵稱、相同圖片或相似圖片、視頻中相似場景等內(nèi)容關(guān)系 ,行為相似關(guān)系綜合相似關(guān)系,比如店鋪相似
1)圖片關(guān)系:很多風(fēng)險商家 ,店鋪使用相同或相識的圖片,風(fēng)險用戶,也可能使用相同或者相似的照片,利用圖片的相識關(guān)系進(jìn)行關(guān)系挖掘,也是非常重要的。
2)文本關(guān)系:商家店鋪商品標(biāo)題的相似性計算商家關(guān)系,評價內(nèi)容相似性計算商家關(guān)系等
3)昵稱關(guān)系:很多風(fēng)險用戶,采用系列的昵稱,也是一個非常重要的關(guān)系特征
一個群體移動刷單、移動進(jìn)行流量點(diǎn)擊、一個分散群體進(jìn)行網(wǎng)絡(luò)攻擊等,各個攻擊者之間本身不存在關(guān)系,但是受到同樣的人或者共同的目標(biāo)指使,這是最難防控的一種關(guān)系。若同一個體存在多次攻擊,基本上有跡可循,若同一個體只存在一次攻擊,那基本上無跡可尋,只能通過潛伏等方式進(jìn)行防控。
該種關(guān)系可以通過同步行為,進(jìn)行非常高效的挖掘,參考我的另一篇文章:SynchroTrap-基于松散行為相似度的欺詐賬戶檢測算法
投資關(guān)系、參股關(guān)系、董事監(jiān)事等任職關(guān)系、注冊郵箱、注冊電話、注冊地址、注冊身份證等工商注冊信息,也存在巨大的網(wǎng)絡(luò)關(guān)系,當(dāng)然,很多人會利用身份證注冊大量公司, 再利用營業(yè)執(zhí)照注冊用戶,同一個營業(yè)執(zhí)照也可能存在大量的賬號,這些關(guān)系都存在非常重要的作用。
共用產(chǎn)權(quán)證明也是非常強(qiáng)的關(guān)系,比如兩個賬號綁定同一輛車、綁定同一個房產(chǎn)證明、婚姻證書等關(guān)系
水電煤代繳費(fèi)、網(wǎng)約車代預(yù)約、醫(yī)院代掛號、淘寶購物代付款、代點(diǎn)外賣等,存在這些關(guān)系的一般都比較親近或者存在某些利益關(guān)系,有非常強(qiáng)的關(guān)聯(lián)性??梢栽跇I(yè)務(wù)中挖掘類似的關(guān)系進(jìn)行分析研究。
買家瀏覽商品、買家點(diǎn)擊商品、用戶點(diǎn)擊廣告等,搜索詞關(guān)系等,某些商搜索相同的詞的用戶可能存在某種特定的關(guān)系,同時點(diǎn)擊某個商品的一群消費(fèi)者可能也存在某些關(guān)系,通過挖掘,都能得到一些特殊的模式。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實(shí)用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強(qiáng)大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實(shí)施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預(yù)測分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢預(yù)判? ? 在數(shù)據(jù)驅(qū)動決策的時代,預(yù)測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點(diǎn),而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報考到取證的全攻略? 在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗(yàn):捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗(yàn)如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實(shí)戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗(yàn):數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對策略? 長短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨(dú)特的門控機(jī)制,在 ...
2025-07-07統(tǒng)計學(xué)方法在市場調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場調(diào)研是企業(yè)洞察市場動態(tài)、了解消費(fèi)者需求的重要途徑,而統(tǒng)計學(xué)方法則是市場調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03