
數(shù)據(jù)科學(xué)關(guān)注查找噪聲中隱藏的信號(hào)。這一點(diǎn)說(shuō)起來(lái)容易做起來(lái)難,但無(wú)需依靠眾多數(shù)據(jù)專家即可實(shí)現(xiàn)。本文介紹的定量分析技術(shù)是非常實(shí)用的入門方法(鏈接中提供額外信息),適用于想親自使用基礎(chǔ)統(tǒng)計(jì)技術(shù)的人員。從本質(zhì)上來(lái)講,其流程可以總結(jié)為以下四步:
1.觀察:移動(dòng)用戶數(shù)據(jù)趨勢(shì)可能會(huì)帶來(lái)一些不可預(yù)料的見(jiàn)解,幫助更好地理解用戶使用應(yīng)用程序的方式、時(shí)間、地點(diǎn)和原因。這些見(jiàn)解具有潛在價(jià)值,可以據(jù)此制定后續(xù)決策,優(yōu)化用戶體驗(yàn)。
2.形成假設(shè)框架:無(wú)法獲取全部信息時(shí),需要進(jìn)行歸納推理。對(duì)于移動(dòng)應(yīng)用程序來(lái)說(shuō),這一點(diǎn)顯然正確,因?yàn)槟繕?biāo)用戶不可能聚在一起等著你去采訪。
3.數(shù)據(jù)采集:對(duì)假設(shè)進(jìn)行判斷需要面對(duì)的挑戰(zhàn)是確定對(duì)相關(guān)任務(wù)有幫助的可用證據(jù)。在我看來(lái),這得先做好才考慮機(jī)器學(xué)習(xí)算法的細(xì)節(jié)。
4.評(píng)估假設(shè):生成模型的出發(fā)點(diǎn)是希望進(jìn)一步解釋數(shù)據(jù)。接下來(lái),根據(jù)模型對(duì)目前所觀察到數(shù)據(jù)的解釋情況,對(duì)模型可信度進(jìn)行評(píng)估。
制定高質(zhì)量并且切實(shí)可行的決策
數(shù)據(jù)科學(xué)可以描述為業(yè)務(wù)假設(shè)實(shí)際運(yùn)行情況之間的競(jìng)爭(zhēng)。與 Countly 合作將獲取完整的移動(dòng)用戶行為數(shù)據(jù)集以及數(shù)據(jù)可視化所需的整套工具。定量分析需要使用完整的移動(dòng)用戶行為數(shù)據(jù)集,而非抽樣技術(shù)分析所采集的數(shù)據(jù),后者可能會(huì)在分析中引入不確定性的偏差。只需單擊幾次,就能夠以可視化方式查看關(guān)于用戶的各種詳細(xì)信息。例如,可以使用 Countly 在多種語(yǔ)言環(huán)境下快速可視化應(yīng)用程序用戶的原始數(shù)據(jù)和百分比數(shù)據(jù)(請(qǐng)參見(jiàn)下方屏幕截圖)。此方法比 Excel 更加形象生動(dòng),無(wú)需額外導(dǎo)出原始數(shù)據(jù)進(jìn)行日常數(shù)據(jù)分析,為團(tuán)隊(duì)節(jié)省時(shí)間。
此外,Countly 可以靈活整合其他來(lái)源的移動(dòng)數(shù)據(jù)和人口統(tǒng)計(jì)數(shù)據(jù),例如銀行可能需要從后端整合數(shù)據(jù)(年齡、估計(jì)收入、婚姻狀況、最近大宗交易記錄和近期地址變更),以便 Countly 更好地了解用戶在應(yīng)用程序內(nèi)的行為并通過(guò)特定推送通知促進(jìn)微目標(biāo)定位。這樣數(shù)據(jù)分析就能夠更具有針對(duì)性,更加適應(yīng)業(yè)務(wù)需要。
為了幫助您在令人興奮的數(shù)據(jù)驅(qū)動(dòng)領(lǐng)域中不斷發(fā)展,您需要擴(kuò)展成功的定義:對(duì)您來(lái)說(shuō),“成功”意味著什么?這個(gè)問(wèn)題其實(shí)并不像看起來(lái)那樣簡(jiǎn)單。您優(yōu)先考慮什么問(wèn)題?如果您重點(diǎn)關(guān)注應(yīng)用程序內(nèi)購(gòu)買,那么您的目標(biāo)是收入和用戶生命周期價(jià)值 (LTV)。對(duì)于其他大部分不以貨幣化為中心的應(yīng)用程序來(lái)說(shuō),主要關(guān)注點(diǎn)可能在于留存用戶。
那么,現(xiàn)在我們開(kāi)始觀察數(shù)據(jù)。利用 Countly 您能夠訪問(wèn) 100% 應(yīng)用程序用戶數(shù)據(jù),還可以詳細(xì)查看高參與度用戶(假設(shè)您運(yùn)營(yíng)一款健身應(yīng)用程序,并選擇留存率作為成功標(biāo)準(zhǔn))以及這些用戶注冊(cè)時(shí)執(zhí)行的操作。觀察高參與度用戶行為模式,然后進(jìn)行定量訪問(wèn)確定應(yīng)用程序最令人興奮的特點(diǎn)。隨后,您的團(tuán)隊(duì)可以獲取下載應(yīng)用的初 10 天內(nèi)完成對(duì)提高留存率有幫助操作的主要假設(shè):
1.完成 3 項(xiàng)推薦鍛煉
2.在社區(qū)發(fā)布 5 件信息
3.關(guān)注5 份健康飲食
我們?yōu)槊宽?xiàng)操作定義隊(duì)列,然后在采樣數(shù)據(jù)上使用二分類測(cè)試比較注冊(cè) 2 個(gè)月后每組用戶留存表現(xiàn)。之后我們可以觀察每項(xiàng)測(cè)試的正負(fù)預(yù)測(cè)值(定義如下),確定我們正在尋找的關(guān)鍵閾值。
測(cè)試 1:用戶在初 10 天內(nèi)是否完成 ≥ 3項(xiàng)推薦鍛煉?
測(cè)試 2:用戶在初 10 天內(nèi)在社區(qū)發(fā)布 ≥ 5 件信息?
測(cè)試 3:用戶在初 10 天內(nèi)關(guān)注 ≥ 5 份健康飲食?
顯然完成 3 項(xiàng)推薦鍛煉勝出。因此,這項(xiàng)操作有較高的 2 個(gè)月留存正預(yù)測(cè)值;相反地,完成少于 3 項(xiàng)鍛煉有較高的負(fù)預(yù)測(cè)值。這項(xiàng)測(cè)試可以很好地預(yù)測(cè) 2 個(gè)月留存情況:達(dá)到標(biāo)準(zhǔn),有 99% 機(jī)率留存應(yīng)用程序;未達(dá)到標(biāo)準(zhǔn),有 95% 機(jī)率會(huì)丟失用戶。
發(fā)布 5 件信息和關(guān)注 5 份健康飲食與留存情況有很大關(guān)聯(lián)(因此有較高的正預(yù)測(cè)值),但未達(dá)到關(guān)鍵條件標(biāo)準(zhǔn)。未執(zhí)行這些操作的用戶仍有很高機(jī)率在 2 個(gè)月后仍留存應(yīng)用程序。
到目前為止,完成推薦鍛煉似乎成為關(guān)鍵性閾值。另一項(xiàng)評(píng)估要點(diǎn)在于讓用戶完成行動(dòng)的價(jià)值。換言之,讓用戶完成 3 項(xiàng)推薦鍛煉進(jìn)而提高 2 個(gè)月后留存應(yīng)用程序所需付出的代價(jià)。分析數(shù)字時(shí),完成 3 項(xiàng)推薦鍛煉可使 2 個(gè)月后留存機(jī)率提高大約 20 倍,而發(fā)布 5 次更新和關(guān)注 5 份健康飲食甚至無(wú)法讓留存率翻倍(分別提高 1.3 倍和 1.1 倍)。你可以通過(guò)回歸分析得出這一結(jié)論,但所需時(shí)間過(guò)長(zhǎng)。如要了解更多信息,我建議閱讀該URL。數(shù)據(jù)分析結(jié)果表明,值得投入時(shí)間和精力鼓勵(lì)用戶完成 3 項(xiàng)推薦鍛煉。發(fā)布 5 件信息和關(guān)注 5 份健康飲食與留存情況有很大關(guān)聯(lián)(因此有較高的正預(yù)測(cè)值),但未達(dá)到關(guān)鍵條件標(biāo)準(zhǔn)。未執(zhí)行這些操作的用戶仍有很高機(jī)率在 2 個(gè)月后仍留存應(yīng)用程序。
如果對(duì)機(jī)器學(xué)習(xí)和更復(fù)雜的模型感興趣,我建議針對(duì)非結(jié)構(gòu)化數(shù)據(jù)使用 K 均值聚類(K-Means Clustering),使用 R 語(yǔ)言實(shí)現(xiàn)。該技術(shù)提供另一種識(shí)別與 3 個(gè)月后留存率等業(yè)務(wù)目標(biāo)相關(guān)特定聚類的方法。觀察結(jié)果按指定標(biāo)準(zhǔn)分為 K 組并重新分組,形成關(guān)聯(lián)最為緊密的聚類(請(qǐng)參見(jiàn)以下示例)。
與分層聚類相比,K 均值聚類可以處理更大規(guī)模的數(shù)據(jù)集。此外,觀察結(jié)果不會(huì)永遠(yuǎn)固定在一個(gè)聚類中。分析時(shí),觀察結(jié)果會(huì)移動(dòng),從而改善整體結(jié)果。要了解更多關(guān)于 K 均值聚類的信息,我建議閱讀《R 語(yǔ)言實(shí)戰(zhàn)》作者 Rob Kabacoff 發(fā)表的文章。
保持簡(jiǎn)潔
誤差最小的通用模型最有可能準(zhǔn)確預(yù)測(cè)未來(lái)觀察結(jié)果——奧卡姆剃刀原理。確定關(guān)鍵性閾值時(shí)的兩個(gè)重要注意事項(xiàng):保持穩(wěn)定簡(jiǎn)潔。如果涉及過(guò)多不同行動(dòng),將難以衡量并且可能會(huì)隨時(shí)間發(fā)生變化。同時(shí)也會(huì)分散團(tuán)隊(duì)的注意力 — 這引出我們的下一步驟。
采取行動(dòng)
既然已經(jīng)確定關(guān)鍵指標(biāo),即必須加以克服以便提高用戶滿意度和參與度的閾值,那么就應(yīng)該采取相應(yīng)行動(dòng)。Sokrati,印度領(lǐng)先的網(wǎng)絡(luò)廣告績(jī)效管理公司,已成功在開(kāi)節(jié)日期間展開(kāi)2-3天的Facebook 活動(dòng)為珠寶品牌贏了超過(guò)300%的銷售增長(zhǎng)。他們的策略包括三個(gè)步驟:
關(guān)鍵在于利用節(jié)日期間有針對(duì)性地鼓勵(lì)更多用戶盡快行動(dòng)。深入挖掘不同的受眾群以擴(kuò)大受眾群體,你會(huì)看到參與和保留度上升。我希望這些概念與結(jié)構(gòu)可以幫你。歡迎你聯(lián)系Countly繼續(xù)討論與分享自己的故事!
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
LSTM 模型輸入長(zhǎng)度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長(zhǎng)序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報(bào)考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計(jì)的實(shí)用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強(qiáng)大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠(chéng)摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實(shí)施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價(jià)值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡(jiǎn)稱 BI)深度融合的時(shí)代,BI ...
2025-07-10SQL 在預(yù)測(cè)分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢(shì)預(yù)判? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代,預(yù)測(cè)分析作為挖掘數(shù)據(jù)潛在價(jià)值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價(jià)值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點(diǎn),而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報(bào)考到取證的全攻略? 在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭(zhēng)搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢(shì)性檢驗(yàn):捕捉數(shù)據(jù)背后的時(shí)間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢(shì)性檢驗(yàn)如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時(shí)間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時(shí)間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實(shí)戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗(yàn):數(shù)據(jù)趨勢(shì)與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢(shì)變化以及識(shí)別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國(guó)內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對(duì)策略? 長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨(dú)特的門控機(jī)制,在 ...
2025-07-07統(tǒng)計(jì)學(xué)方法在市場(chǎng)調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場(chǎng)調(diào)研是企業(yè)洞察市場(chǎng)動(dòng)態(tài)、了解消費(fèi)者需求的重要途徑,而統(tǒng)計(jì)學(xué)方法則是市場(chǎng)調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書(shū)考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動(dòng)力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動(dòng)力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開(kāi)啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價(jià)值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03