
作者 | CDA數(shù)據(jù)分析師
前言
用戶畫(huà)像又稱用戶角色,作為一種勾畫(huà)目標(biāo)用戶、聯(lián)系用戶訴求與設(shè)計(jì)方向的有效工具,用戶畫(huà)像在各領(lǐng)域得到了廣泛的應(yīng)用。用戶畫(huà)像最初是在電商領(lǐng)域得到應(yīng)用的,在大數(shù)據(jù)時(shí)代背景下,用戶信息充斥在網(wǎng)絡(luò)中,將用戶的每個(gè)具體信息抽象成標(biāo)簽,利用這些標(biāo)簽將用戶形象具體化,從而為用戶提供有針對(duì)性的服務(wù)。
用戶畫(huà)像是一種目標(biāo)用戶的人物原型,它不僅可以快速了解用戶的基本信息并快速歸類(lèi),并且可以進(jìn)一步精準(zhǔn)地分析用戶行為習(xí)慣和態(tài)度偏好。用戶畫(huà)像雖然是用戶的虛擬代表,但必須基于的是真實(shí)用戶和真實(shí)數(shù)據(jù)。
嘗試去做一個(gè)用戶畫(huà)像,往往是基于以下情景:
從用戶畫(huà)像的使用情境也可以看出,用戶畫(huà)像適用于各個(gè)產(chǎn)品周期:從潛在用戶挖掘到新用戶引流,再到老用戶的培養(yǎng)與流失用戶的回流,用戶畫(huà)像都有用武之地。
采用定性的方法(如,深度訪談、焦點(diǎn)小組)或定量的方法(如,定量問(wèn)卷、行為日志數(shù)據(jù))都能夠完成用戶畫(huà)像的構(gòu)建,不同的方法各有優(yōu)缺點(diǎn):
但是,不論是選擇定性還是定量的方法,都首先需要對(duì)用戶類(lèi)型有一個(gè)基本“量”的了解,否則在選用樣本時(shí)就會(huì)產(chǎn)生偏差。那么如何通過(guò)定量的方法(聚類(lèi))構(gòu)建用戶畫(huà)像呢?
選擇那些指標(biāo)?
用戶指標(biāo)的選擇,可以是封閉性的,也可以是開(kāi)放性的。在封閉的指標(biāo)中,用戶群的類(lèi)型是固定的,所有用戶類(lèi)型構(gòu)成了全部的用戶整體,比如輕度用戶、重度用戶;男性用戶,女性用戶。但是這種劃分方式維度可能過(guò)于單一,無(wú)法體現(xiàn)用戶群的復(fù)雜性,并且不利于指標(biāo)體系的補(bǔ)充改進(jìn)和迭代,因此在研究中我們更傾向于采用開(kāi)放性的分類(lèi)方式,可以根據(jù)不同應(yīng)用場(chǎng)景變更或者拓展指標(biāo)。
開(kāi)放式的指標(biāo)體系包括用戶人口屬性、行為操作屬性、態(tài)度偏好屬性、用戶價(jià)值屬性等,用戶的行為和態(tài)度是不斷變化的。
其中,注意一點(diǎn),封閉式指標(biāo)中的人口屬性指標(biāo)是相對(duì)穩(wěn)定的靜態(tài)數(shù)據(jù)。通常,從我們的經(jīng)驗(yàn)和掌握到的用戶信息,我們對(duì)用戶的年齡結(jié)構(gòu)、性別比例都已經(jīng)明確,如果在聚類(lèi)中人口屬性指標(biāo)對(duì)聚類(lèi)干擾較大(共線性較強(qiáng)),或在模型中作為因子影響過(guò)高,可以在聚類(lèi)時(shí)重點(diǎn)關(guān)注用戶的行為操作和態(tài)度偏好等指標(biāo),聚類(lèi)成功之后再比較每一種用戶類(lèi)型的人口學(xué)背景信息等。
如何獲得和篩選數(shù)據(jù)?
在確定指標(biāo)后,我們需要確定指標(biāo)的來(lái)源。有些數(shù)據(jù)是后臺(tái)行為日志可以記錄到的,有些是需要用問(wèn)卷調(diào)查的。一般而言,行為層面的指標(biāo)可以用后臺(tái)日志,更加準(zhǔn)確。而態(tài)度層面的則要用問(wèn)卷來(lái)獲取。兩種數(shù)據(jù)渠道各有優(yōu)缺點(diǎn):
理論上,所有的數(shù)據(jù)都可以通過(guò)問(wèn)卷獲得。但是,為了最優(yōu)化研究效果,我們采取了問(wèn)卷+行為日志結(jié)合的方式。在發(fā)問(wèn)卷的同時(shí),抓取了用戶的設(shè)備號(hào)和ID,以匹配后臺(tái)數(shù)據(jù)。
在保證問(wèn)卷效度的前提下,問(wèn)卷設(shè)計(jì)還需要注意結(jié)合用戶特征,以提高填答率以及數(shù)據(jù)準(zhǔn)確率。比如,針對(duì)二次元用戶,在用戶群年齡結(jié)構(gòu)偏小的前提下問(wèn)卷不能太長(zhǎng),不能出現(xiàn)深?yuàn)W的專業(yè)術(shù)語(yǔ);同時(shí)問(wèn)卷的語(yǔ)句表達(dá)以及頁(yè)面風(fēng)格也要相應(yīng)調(diào)整,使其沒(méi)有距離感。同時(shí),注意篩除多次填答和注冊(cè)的馬甲賬號(hào)問(wèn)卷。此外還要注意新用戶的占比,需要評(píng)估填答問(wèn)卷中新注冊(cè)用戶的比例是否與投放期新用戶正常增量一致。用戶畫(huà)像是否需要包含新用戶取決于項(xiàng)目目的,也可以和產(chǎn)品方討論后決定。
把用戶分成幾種類(lèi)型?
聚類(lèi)分析是探索性的研究,他根據(jù)指標(biāo)或者變量之間的距離判斷親疏關(guān)系,將相似性的聚為一類(lèi),因此會(huì)出現(xiàn)多個(gè)可能的解,并不會(huì)給出一個(gè)最優(yōu)的解,最終選擇哪一種方案是取決于研究者的分析判斷。
把用戶分的類(lèi)型越少,顆粒度就越粗,每種類(lèi)型之間的特征就不會(huì)很分明;用戶類(lèi)型越多,顆粒度也就越細(xì),但復(fù)雜的類(lèi)型劃分也會(huì)給產(chǎn)品定位和運(yùn)營(yíng)推廣帶來(lái)負(fù)擔(dān)。因此,細(xì)化顆粒度不僅需要定量的聚類(lèi)來(lái)調(diào)整,還需要結(jié)合產(chǎn)品經(jīng)驗(yàn)來(lái)驗(yàn)證。同時(shí),因?yàn)椴捎玫氖情_(kāi)放性的指標(biāo)體系,我們不可能像區(qū)分“男性用戶、女性用戶”那樣清楚地知道用戶類(lèi)型的數(shù)量,因此,在用數(shù)據(jù)進(jìn)行用戶畫(huà)像時(shí),最關(guān)鍵的一步就是確定把用戶分成幾種類(lèi)型。
我們將數(shù)據(jù)導(dǎo)入spss嘗試進(jìn)行聚類(lèi)分析。如果變量數(shù)據(jù)形式不統(tǒng)一(選擇的指標(biāo)有定序、有定類(lèi)),則需要首先對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化;其次,兩個(gè)強(qiáng)相關(guān)的變量和其他變量一起進(jìn)行聚類(lèi)會(huì)加大因子的權(quán)重,使聚類(lèi)效果不理想,所以我們還要使用因子分析對(duì)選擇的指標(biāo)提取公共因子,對(duì)因子共線性判斷,因子分析是選擇合適變量進(jìn)行聚類(lèi)的前提,如果因子之間共線性強(qiáng),則提取公因子進(jìn)行聚類(lèi),若共線性不強(qiáng),則直接聚類(lèi)。
如何選擇合適的聚類(lèi)方法?
在確定因子之后需要選擇合適的聚類(lèi)方法。不同方法適用的情況不同,常用的是K均值聚類(lèi)以及層次聚類(lèi)。
K均值聚類(lèi)也稱快速聚類(lèi),內(nèi)存少,復(fù)雜程度低,快速高效,適用大數(shù)據(jù)量。但是需要提前明確分類(lèi)數(shù)目,并對(duì)均值進(jìn)行定義。只能對(duì)樣本聚類(lèi),不能對(duì)變量聚類(lèi),樣本的變量需是連續(xù)性變量。
層次聚類(lèi)可以對(duì)變量聚類(lèi),也可以對(duì)樣本聚類(lèi),可以是連續(xù)變量也可以是分類(lèi)變量。能提供多種計(jì)算距離的方法,但是計(jì)算復(fù)雜度高,適用小數(shù)據(jù)量,我們需要結(jié)合項(xiàng)目的具體情況,包括項(xiàng)目周期、數(shù)據(jù)形式、數(shù)據(jù)量、聚類(lèi)特征等等來(lái)確定聚類(lèi)方法。
最后通過(guò)嘗試不同的聚類(lèi)數(shù)、距離算法和分類(lèi)方法,我們可以根據(jù)以下幾點(diǎn)來(lái)確定分類(lèi)的數(shù)量:
聚類(lèi)效果好壞的評(píng)估可以從聚類(lèi)中心之間的距離、組件與組內(nèi)的方差以及群組數(shù)量之間的比例是否符合產(chǎn)品特征、比例是否協(xié)調(diào)以及劃分的類(lèi)型對(duì)產(chǎn)品是否有意義等方面去評(píng)估。
5、把數(shù)據(jù)還原成用戶
在已經(jīng)得知了分類(lèi)結(jié)果并且分析得出了每一類(lèi)用戶在各項(xiàng)指標(biāo)上的特征之后,構(gòu)建用戶畫(huà)像的工作也就好比在一副骨架上填充血肉。一方面,我們可以直接利用獲取的數(shù)據(jù),找到具有顯著特征的信息,賦予到用戶身上。比如第一類(lèi)用戶60%使用iOS系統(tǒng),而其他三類(lèi)均不超過(guò)20%,我們就可以將第一類(lèi)用戶抽象為一個(gè)平時(shí)使用iPhone 的人。除了問(wèn)卷數(shù)據(jù)之外,想要使人物形象更加鮮明,可以對(duì)問(wèn)卷本文題進(jìn)行分析,或者根據(jù)產(chǎn)品經(jīng)驗(yàn)、用戶反饋或已有研究進(jìn)行畫(huà)像,這樣可以使用戶形象更加有血有肉。
但是,把數(shù)據(jù)還原成用戶本身用戶也需要遵循幾個(gè)原則,畫(huà)像(Persona)意味著一個(gè)令人信服的用戶角色要滿足七個(gè)條件:
通過(guò)定量化的調(diào)研可以快速對(duì)用戶建立一個(gè)精準(zhǔn)的認(rèn)識(shí),對(duì)不同數(shù)量、不同特征的用戶進(jìn)行比較統(tǒng)計(jì)分析,在后期產(chǎn)品迭代改進(jìn)的過(guò)程中可以將用戶進(jìn)行優(yōu)先級(jí)排序,著重關(guān)注核心的、規(guī)模大的用戶。但是,依靠數(shù)據(jù)這種偏定量的方式建立的用戶畫(huà)像依然是粗線條的,難以描述典型用戶的生活情景、使用場(chǎng)景,難以挖掘用戶情感傾向和行為操作背后的原因和深層次動(dòng)機(jī)。因此,如果有足夠精力和時(shí)間,后續(xù)可以對(duì)每類(lèi)用戶進(jìn)行深入的訪談,將定量和定性的方法結(jié)合起來(lái),建立的用戶畫(huà)像會(huì)更為精準(zhǔn)和生動(dòng)。
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
LSTM 模型輸入長(zhǎng)度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長(zhǎng)序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報(bào)考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計(jì)的實(shí)用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強(qiáng)大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠(chéng)摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實(shí)施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價(jià)值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡(jiǎn)稱 BI)深度融合的時(shí)代,BI ...
2025-07-10SQL 在預(yù)測(cè)分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢(shì)預(yù)判? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代,預(yù)測(cè)分析作為挖掘數(shù)據(jù)潛在價(jià)值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價(jià)值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點(diǎn),而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報(bào)考到取證的全攻略? 在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭(zhēng)搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢(shì)性檢驗(yàn):捕捉數(shù)據(jù)背后的時(shí)間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢(shì)性檢驗(yàn)如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類(lèi)型:時(shí)間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時(shí)間是最不可或缺的維度之一,而year_month數(shù)據(jù)類(lèi)型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實(shí)戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗(yàn):數(shù)據(jù)趨勢(shì)與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢(shì)變化以及識(shí)別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國(guó)內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對(duì)策略? 長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨(dú)特的門(mén)控機(jī)制,在 ...
2025-07-07統(tǒng)計(jì)學(xué)方法在市場(chǎng)調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場(chǎng)調(diào)研是企業(yè)洞察市場(chǎng)動(dòng)態(tài)、了解消費(fèi)者需求的重要途徑,而統(tǒng)計(jì)學(xué)方法則是市場(chǎng)調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書(shū)考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動(dòng)力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動(dòng)力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開(kāi)啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價(jià)值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03