
很多小伙伴都計(jì)劃年后換工作,為了幫助各位學(xué)習(xí)數(shù)據(jù)分析的小伙伴們成功拿到offer!本期給大家整理了一些數(shù)據(jù)分析面試時(shí)的高頻問題,希望大家積極點(diǎn)贊收藏加關(guān)注,一起沖鴨~
1、APP近期上線了一個(gè)拉新活動,并在各個(gè)渠道進(jìn)行了推廣投放,如何評估活動效果?
【參考答案】
如果要對一個(gè)活動效果進(jìn)行分析,無非是要回答以下3個(gè)問題:
(1)活動效果怎么樣?要不要繼續(xù)做?
(2)如果可以繼續(xù)做,活動的做的好的方面是哪些?問題或者瓶頸環(huán)節(jié)在哪?
(3)針對問題環(huán)節(jié)的改進(jìn)方案是什么?
具體展開來講,可以從以下幾個(gè)方面:
(1)活動關(guān)鍵指標(biāo)達(dá)成分析
活動關(guān)鍵核心指標(biāo)達(dá)成情況,比如拉新多少用戶,達(dá)成多少GMV?ROI如何?
(2)活動關(guān)鍵流程漏斗分析
活動的關(guān)鍵流程是什么?以及各個(gè)流程的漏斗分析,定位問題發(fā)生的環(huán)節(jié)。
(3)活動的渠道、用戶分析
活動在哪些渠道推送?活動推送給哪些用戶?用戶畫像是啥樣的?各渠道用戶的質(zhì)量/ROI如何?
(4)活動策略、節(jié)奏分析
活動玩法的裂變效果如何?利益點(diǎn)是否有吸引力?活動整個(gè)過程節(jié)奏把控如何,前期預(yù)熱、中期爆發(fā)和尾期是否過短/過長,運(yùn)營應(yīng)該在何時(shí)進(jìn)行適當(dāng)干預(yù)。
2、業(yè)務(wù)場景題,如何分析次日留存率下降的問題
【參考答案】
業(yè)務(wù)問題關(guān)鍵是問對問題,然后才是拆解問題去解決。
(1)兩層模型
從用戶畫像、渠道、產(chǎn)品、行為環(huán)節(jié)等角度細(xì)分,明確到底是哪里的次日留存率下降了
(2)指標(biāo)拆解
次日留存率 = Σ 次日留存數(shù) / 今日獲客人數(shù)
(3)原因分析
內(nèi)部:運(yùn)營活動、產(chǎn)品變動、技術(shù)故障、設(shè)計(jì)漏洞(如產(chǎn)生可以擼羊毛的設(shè)計(jì))
外部:競品、用戶偏好、節(jié)假日、社會事件(如產(chǎn)生輿論)
3、談?wù)凴FM用戶模型
【參考答案】
RFM模型是客戶關(guān)系管理(CRM)中一種被廣泛使用的營銷模型,它是衡量客戶價(jià)值和客戶創(chuàng)利能力的重要工具和手段。
RFM模型主要通過3個(gè)指標(biāo)來描述一個(gè)客戶的價(jià)值:
? 最近一次消費(fèi)時(shí)間(Recency),縮寫為R
? 消費(fèi)頻次(Frequency),縮寫為F
? 消費(fèi)金額(Monetary),縮寫為M
在具體的應(yīng)用中,一般是通過R、F、M這3項(xiàng)值將買家進(jìn)行分層,賣家可以對不同層級的用戶采取不同的營銷方式~
利用RFM模型劃分用戶層級,可以進(jìn)行客戶細(xì)分、尋找目標(biāo)客戶:
?重要價(jià)值客戶,RFM都很大,優(yōu)質(zhì)客戶,需要保持
?重要發(fā)展客戶,低活高購高價(jià)值,交易金額和交易次數(shù)大,但最近無交易。需要發(fā)展
?重要保持客戶,高活低購高價(jià)值,交易金額大貢獻(xiàn)度高,且最近有交易。需要重點(diǎn)識別
?重要挽留客戶,低活低購高價(jià)值:交易金額大,潛在的有價(jià)值客戶,需要挽留、促活。
這一模型的【優(yōu)點(diǎn)】:
?能夠快速對某段時(shí)間內(nèi)的付費(fèi)用戶做用戶分類,響應(yīng)快速的業(yè)務(wù)需求;
?能直觀了解用戶消費(fèi)的質(zhì)量,短時(shí)間監(jiān)控大客戶的流失情況,及時(shí)做出挽回應(yīng)對措施;
?能及時(shí)發(fā)現(xiàn)新的大客戶,比如頻次低但額度大的用戶。
4、什么是假設(shè)檢驗(yàn)?
【參考答案】
參數(shù)估計(jì)和假設(shè)檢驗(yàn)是統(tǒng)計(jì)推斷的兩個(gè)組成部分,它們都是利用樣本對總體進(jìn)行某種推斷,但推斷的角度不同。
(1)參數(shù)估計(jì)討論的是用樣本估計(jì)總體參數(shù)的方法,總體參數(shù)μ在估計(jì)前是未知的。
(2)而在假設(shè)檢驗(yàn)中,則是先對μ的值提出一個(gè)假設(shè),然后利用樣本信息去檢驗(yàn)這個(gè)假設(shè)是否成立。
5、 置信度、置信區(qū)間
【參考答案】
置信區(qū)間是我們所計(jì)算出的變量存在的范圍,水平就是我們對于這個(gè)數(shù)值存在于我們計(jì)算出的這個(gè)范圍的可信程度。
(1)舉例來講,有95%的把握,真正的數(shù)值在我們所計(jì)算的范圍里。在這里,95%是置信水平,而計(jì)算出的范圍,就是置信區(qū)間。
(2)如果置信度為95%, 則抽取100個(gè)樣本來估計(jì)總體的均值,由100個(gè)樣本所構(gòu)造的100個(gè)區(qū)間中,約有95個(gè)區(qū)間包含總體均值。
6、 撲克牌54張,平均分成2份,求這2份都有2張A的概率
【參考答案】
這個(gè)問題可以通過計(jì)算概率來解決:
有2張A的概率可以通過組合來計(jì)算,即從4張A中選取2張A的組合數(shù)除以從54張牌中選取2張的組合數(shù):P(2張A) = C(4, 2) / C(54, 2) 其中,C(n, m)表示從n個(gè)元素中選取m個(gè)元素的組合數(shù)。
我們需要將剩下的52張牌平均分成2份,每份26張。其中,有2張A的概率可以表示為:P(2張A) = P(1份有2張A,另1份沒有A) + P(1份沒有A,另1份有2張A) 假設(shè)第一份有2張A,第二份沒有A,那么從剩下的50張牌中選出24張牌來組成第一份,剩下的26張牌自然組成第二份。這種情況的概率為:P(1份有2張A,另1份沒有A) = C(4, 2) * C(50, 24) / C(54, 26)
(3)同樣的道理,當(dāng)?shù)谝环輿]有A,第二份有2張A時(shí),這種情況的概率也是:P(1份沒有A,另1份有2張A) = C(4, 0) * C(50, 26) / C(54, 26)
(4)最后,將兩種情況的概率相加即可得到答案:P(兩份都有2張A) = P(1份有2張A,另1份沒有A) + P(1份沒有A,另1份有2張A)代入計(jì)算,即可得到最終的概率。
7、做過AB test嗎,談?wù)勗?
【參考答案】
ABtest的本質(zhì)其實(shí)是兩個(gè)總體的假設(shè)檢驗(yàn)問題。這個(gè)測試很多教育機(jī)構(gòu)作業(yè)幫、學(xué)而思等經(jīng)常用,用來測試哪些課程組合比較受歡迎等。當(dāng)我們現(xiàn)在有兩種方案,方案A和方案B,我們想要知道哪種方案更好,那我們就要做ABtest,也就是要做假設(shè)檢驗(yàn)。
?假設(shè)檢驗(yàn)的步驟如下:
(1) 根據(jù)檢驗(yàn)?zāi)康?,?gòu)造原假設(shè)和備擇假設(shè)
(2) 構(gòu)造檢驗(yàn)統(tǒng)計(jì)量
(3)給出顯著性水平,根據(jù)樣本數(shù)據(jù),計(jì)算檢驗(yàn)統(tǒng)計(jì)量的值.
(4)得出檢驗(yàn)的結(jié)果,拒絕原假設(shè)還是沒有充分的理由拒絕原假設(shè)
?AB test具體場景問題:
AB test效果不顯著,你該怎么判斷這個(gè)實(shí)驗(yàn)的收益?
AB test中實(shí)驗(yàn)組核心指標(biāo)明顯優(yōu)于對照組,那么這個(gè)優(yōu)化就一定能夠上線嘛?
AB test時(shí)效果顯著,但是全量上線時(shí),效果平平,問題在哪里?
AB test效果不顯著時(shí),那么是否可以判斷這個(gè)實(shí)驗(yàn)失敗了,沒有意義?
一般的AB test場景問題都可以從以下幾個(gè)理由中得到解釋:辛普森悖論、新奇效應(yīng)、以偏蓋全、以全蓋偏、正交互斥實(shí)驗(yàn)。
8、APP激活量的來源渠道很多,怎樣對來源渠道變化大的進(jìn)行預(yù)警?
【參考答案】
(1)如果渠道使用時(shí)間較長,認(rèn)為渠道的app激活量滿足一個(gè)分布,比較可能是正態(tài)分布。求平均值和標(biāo)準(zhǔn)差,對 于今日數(shù)值與均值差大于3/2/1個(gè)標(biāo)準(zhǔn)差的渠道進(jìn)行預(yù)警。
(2)對于短期的新渠道,直接與均值進(jìn)行對比。
9、用戶剛進(jìn)來APP的時(shí)候會選擇屬性,怎樣在保證有完整用戶信息的同時(shí)讓用戶流失減少?
【參考答案】
可以采用技術(shù)接受模型(TAM)來分析,影響用戶接受選擇屬性這件事的主要因素有:
(1)感知的有用性(perceived usefulness),反映一個(gè)人認(rèn)為使用一個(gè)具體的系統(tǒng)對他工作業(yè)績提高的程度; 感知有用性:文案告知用戶選擇屬性能給用戶帶來的好處
(2)感知的易用性(perceived ease of use),反映一個(gè)人認(rèn)為容易使用一個(gè)具體的系統(tǒng)的程度。
感知易用性: a. 關(guān)聯(lián)用戶第三方賬號 (如微博),可以冷啟動階段匹配用戶更有可能選擇的屬性,推薦用戶選擇。b. 交互性做好。
(3)使用者態(tài)度:用戶對填寫信息的態(tài)度 a. 這里需要允許用戶跳過,后續(xù)再提醒用戶填寫 b. 告知用戶填寫的信息會受到很好的保護(hù)
(4)行為意圖:用戶使用APP的目的性,難以控制
(5)外部變量:如操作時(shí)間、操作環(huán)境等,這里難以控制
10、賣玉米如何提高收益?價(jià)格提高多少才能獲取最大收益?
【參考答案】
根據(jù)公式收益 = 單價(jià)*銷售量,那么我們的策略是提高單位溢價(jià)或者提高銷量。
(1) 提高單位溢價(jià)的方法:
品牌打造獲得長期溢價(jià),但缺陷是需要大量前期營銷投入;
加工商品占據(jù)價(jià)值鏈更多環(huán)節(jié),如熟玉米、玉米汁、玉米蛋白粉;
(2)重定位商品,如禮品化等;
價(jià)格歧視,根據(jù)價(jià)格敏感度對不同用戶采用不同定價(jià)。
銷售量=流量x轉(zhuǎn)化率,上述提高單位溢價(jià)的方法可能對流量產(chǎn)生影響,也可能對轉(zhuǎn)化率產(chǎn)生影響。
收益 = 單價(jià)x流量x轉(zhuǎn)化率,短期內(nèi)能規(guī)?;捎玫膽?yīng)該是進(jìn)行價(jià)格歧視,如不同時(shí)間、不同商圈的玉米價(jià)格不同,采取高定價(jià),然后對價(jià)格敏感的用戶提供優(yōu)惠券等。
推薦學(xué)習(xí)書籍
《CDA一級教材》適合CDA一級考生備考,也適合業(yè)務(wù)及數(shù)據(jù)分析崗位的從業(yè)者提升自我。完整電子版已上線CDA網(wǎng)校,累計(jì)已有10萬+在讀~
免費(fèi)加入閱讀:https://edu.cda.cn/goods/show/3151?targetId=5147&preview=0
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價(jià)值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實(shí)戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時(shí),“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗(yàn)與 t 檢驗(yàn):差異、適用場景與實(shí)踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計(jì)學(xué)領(lǐng)域,假設(shè)檢驗(yàn)是驗(yàn)證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計(jì)劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計(jì)劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實(shí)踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請求開發(fā)時(shí)(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價(jià)值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點(diǎn)數(shù)據(jù)的科學(xué)計(jì)數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點(diǎn)數(shù)據(jù)時(shí)的科學(xué)計(jì)數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價(jià)值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營問題、提升執(zhí)行效率的核心手段,其價(jià)值 ...
2025-09-12用 SQL 驗(yàn)證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實(shí)戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計(jì)” 與 “用戶體驗(yàn) ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當(dāng)下,精準(zhǔn)營銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價(jià)值 在數(shù)據(jù)驅(qū)動決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實(shí)踐到業(yè)務(wù)價(jià)值挖掘 在數(shù)據(jù)分析場景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計(jì)模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價(jià)值導(dǎo)向 統(tǒng)計(jì)模型作為數(shù)據(jù)分析的核心工具,并非簡單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10CDA 數(shù)據(jù)分析師:商業(yè)數(shù)據(jù)分析實(shí)踐的落地者與價(jià)值創(chuàng)造者 商業(yè)數(shù)據(jù)分析的價(jià)值,最終要在 “實(shí)踐” 中體現(xiàn) —— 脫離業(yè)務(wù)場景的分 ...
2025-09-10機(jī)器學(xué)習(xí)解決實(shí)際問題的核心關(guān)鍵:從業(yè)務(wù)到落地的全流程解析 在人工智能技術(shù)落地的浪潮中,機(jī)器學(xué)習(xí)作為核心工具,已廣泛應(yīng)用于 ...
2025-09-09SPSS 編碼狀態(tài)區(qū)域中 Unicode 的功能與價(jià)值解析 在 SPSS(Statistical Product and Service Solutions,統(tǒng)計(jì)產(chǎn)品與服務(wù)解決方案 ...
2025-09-09