
經(jīng)驗(yàn) : 從設(shè)計(jì)到數(shù)據(jù)——寫給非數(shù)據(jù)人的數(shù)據(jù)入門
供非專業(yè)人士學(xué)習(xí)交流,望專業(yè)人士勘察糾錯(cuò)。
一. 一段經(jīng)歷,一點(diǎn)心得
一直追我博客的人想必是清楚我之前做交互設(shè)計(jì),然后去輪崗過行業(yè)運(yùn)營(yíng),然后突然就開始做產(chǎn)品經(jīng)理了。我也覺得奇怪的事,上次發(fā)了一個(gè)招聘啟事后,來加我微信的同學(xué)們,既有做交互的,也有做產(chǎn)品經(jīng)理的,甚至還有在IBM做了5年BI數(shù)據(jù)分析師的……這樣看來,我的博客逐漸成了一個(gè)交叉學(xué)科。
簡(jiǎn)單來說,也差不多如上圖所示。
當(dāng)時(shí)是一個(gè)新業(yè)務(wù)開拓,僅僅4個(gè)月的輪崗(非正式的輪崗,當(dāng)時(shí)就是老大給了各個(gè)部門體驗(yàn)其他團(tuán)隊(duì)工作的機(jī)會(huì),但是組織架構(gòu)可以在輪崗結(jié)束后再恢復(fù)原崗位),結(jié)果成了職業(yè)歷程上的分水嶺。為什么呢?
行業(yè)運(yùn)營(yíng)除了日常的商家管理、活動(dòng)策劃以及選品外,當(dāng)時(shí)的商業(yè)模式還需要我們介入整體的供應(yīng)鏈管理。而雖然當(dāng)時(shí)身處家居行業(yè),供應(yīng)鏈管理卻是在不同行業(yè)之間有較大的共通性。所以后來又成立了一個(gè)橫向的部門——供應(yīng)鏈管理。于是從垂直行業(yè)里調(diào)出的部分同學(xué)加入這個(gè)橫向部門。而供應(yīng)鏈管理,離不開大量的數(shù)據(jù)分析工作,供應(yīng)鏈整體效能如何?需要和BI部門通力合作,所以供應(yīng)鏈管理部門合并到了BI部門。
于是我就“隨波逐流”地成了BI部門的一員——雖然我們并不做具體的數(shù)據(jù)分析,更多是向分析師提需求。
再后來,供應(yīng)鏈整體效能的數(shù)據(jù)統(tǒng)計(jì)和分析,是靠分析師們每天出手工報(bào)表和報(bào)告發(fā)送給各部門管理人員的。發(fā)了一段時(shí)間后,分析師苦不堪言,接收方也過于被動(dòng),當(dāng)他在郵件里看到某個(gè)數(shù)據(jù)異常時(shí),無法自己主動(dòng)地進(jìn)行探索鉆取,所以自然而然有了將供應(yīng)鏈報(bào)告“產(chǎn)品化”的需求。
要求:短、平、快。
資源:極少。沒有設(shè)計(jì)師、PD、以及充足的開發(fā)人員支持。
原因很正常:大部分人都投入到了業(yè)務(wù)系統(tǒng)建設(shè)中(彼時(shí),供應(yīng)鏈管理系統(tǒng)、物流管理系統(tǒng)、認(rèn)證系統(tǒng)、以及前臺(tái)都處于開荒建設(shè)階段)。
所以,因?yàn)槲易鲞^交互設(shè)計(jì)——會(huì)畫DEMO;和PD接觸時(shí)間長(zhǎng)——多少知道PRD怎么寫;又給分析師提過需求——知道數(shù)據(jù)大概怎么回事……
所以,我就“隨波逐流”成了數(shù)據(jù)產(chǎn)品的產(chǎn)品經(jīng)理。
插句后話,以后在晉升面試或者轉(zhuǎn)崗面試時(shí),當(dāng)面試官問我怎么就突然從交互設(shè)計(jì)師轉(zhuǎn)成數(shù)據(jù)產(chǎn)品經(jīng)理時(shí),最早我也是講的隨波逐流的故事……然后被挑戰(zhàn)比較嚴(yán)重,后來?yè)Q個(gè)說法:Why not?
有這個(gè)機(jī)會(huì),大家都信任你,又不給你壓力,又能學(xué)習(xí)到新領(lǐng)域的知識(shí),和新的人打交道,同時(shí)還能繼續(xù)沿用交互設(shè)計(jì)的技能知識(shí),Why not? 然后對(duì)方就頷首了,所以講故事的角度是多么重要。
說點(diǎn)這段故事中,讓我真正堅(jiān)定起來的兩句話:
一個(gè)老大說:“給你機(jī)會(huì)去試錯(cuò),錯(cuò)了大不了重頭再來?!?/span>
另一個(gè)老大說:“設(shè)計(jì)師盯著皮膚看,產(chǎn)品經(jīng)理要了解整體的經(jīng)絡(luò)組織和骨骼,更重要的是要知道數(shù)據(jù)作為血液如何在流通。你有機(jī)會(huì)深入皮膚之下看一下,再回來看皮膚感覺又不一樣了。”
所以我是帶著這個(gè)人體經(jīng)絡(luò)圖的即視感忐忐忑忑接下了數(shù)據(jù)產(chǎn)品經(jīng)理這個(gè)新的崗位的。
不用別人說,我也知道有兩座大山需要翻:1. 數(shù)據(jù) 2. 產(chǎn)品經(jīng)理。
二. 本文的目標(biāo)
不指導(dǎo)就業(yè),不提供數(shù)據(jù)分析解決方案,不承諾對(duì)任何人都必要有效。根據(jù)個(gè)人僅有的經(jīng)驗(yàn)、心得,我只能:
1. 面向?qū)?/span>數(shù)據(jù)分析、數(shù)據(jù)產(chǎn)品有興趣但是又有點(diǎn)畏懼的交互設(shè)計(jì)師、產(chǎn)品經(jīng)理
2. 希望能夠讓你們“減少對(duì)于數(shù)據(jù)世界的恐懼”,使用數(shù)據(jù)的語(yǔ)言“順暢溝通”。
三. 歡迎進(jìn)入數(shù)據(jù)的世界
還記得你學(xué)習(xí)游泳的經(jīng)歷嗎?記得我當(dāng)時(shí)就是怎么都不敢下水。
我的教練告訴我的最有用的一句話是:你會(huì)憋氣吧?你試試在淺水區(qū)里什么都不要做,松開欄桿,憋住氣,讓自己沉下去。如果你受不了了,反正你一站就站起來了。
我一想,也對(duì),反正淺水區(qū)嘛。于是第一次松開了欄桿。
奇怪的事情發(fā)生了。我居然不會(huì)沉入水底耶~甚至透過泳鏡看別人的腳撲騰撲騰!原來水里的世界沒有那么的可怕!
克服了這個(gè)對(duì)水的恐懼后,才開始慢慢學(xué)習(xí)各種動(dòng)作,開始享受水的樂趣。
數(shù)據(jù)的世界對(duì)于不了解它的人而言,正如這神秘的水一樣。
那么我提供的讓你不怕“水”的心得有:兩個(gè)詞、一個(gè)立方體、一張流程圖
你準(zhǔn)備好了嗎?
1. 兩個(gè)詞
先復(fù)習(xí)一下你可能也聽過的兩句話:
如果你無法量化,那就無法很好管理。
無細(xì)分,不分析。
第一句話來自管理大師彼得德魯克,第二句話則是分析界的金玉良言了。
這兩句話里就隱含著我說的這兩個(gè)詞。
接下來,再來看一句話:成交10億人民幣!
肯定沒有人單獨(dú)說這樣的話,一般情況,這句話前都要加上一些“定語(yǔ)”,比如“今年截至到7月份,全國(guó)蔬菜市場(chǎng)”,或“去年9月,女裝市場(chǎng)”,或“過去N年,東三省豬肉市場(chǎng)”……等等。
這些語(yǔ)境里,也隱含著這兩個(gè)詞。
再來看一張圖:
這是剛?cè)腴T時(shí),為了追求PPT的好看,做的一張概念圖。雖然當(dāng)時(shí)還沒有體會(huì)到兩個(gè)詞的重要,但是從感覺上,我畫了以上的圖,有位前輩說,維度還不夠。
哦,我后來才知道,中間的圈里,我大部分呈現(xiàn)的是度量,而下面的幾個(gè)圈,我列了重要的一些維度。至于上面的幾個(gè)圈里,應(yīng)該是呈現(xiàn)的分析專題或功能。
至于你平時(shí)有機(jī)會(huì)接觸到的各種數(shù)據(jù)可視化,報(bào)表,也基本上脫離不了這兩個(gè)詞,比如,若你去客服部門分析客戶來電量(下圖僅供演示,非真實(shí)場(chǎng)景數(shù)據(jù))
1.你按時(shí)間趨勢(shì)來看總體來電量。當(dāng)你發(fā)現(xiàn)某個(gè)月或某周來電量波動(dòng)較大,你就需要添加別的“角度”來進(jìn)一步細(xì)分。
2. 你按熱線來細(xì)分來電量,看看來電撥打的什么熱線。
3. 當(dāng)你發(fā)現(xiàn)某個(gè)熱線來電量波動(dòng)異常后,你又需要進(jìn)一步細(xì)分,看看此熱線的來電是被什么接起公司承接的……
下面不賣關(guān)子了。有些人可能已經(jīng)猜到了,我要分享的這兩個(gè)詞就是:維度+度量。
下圖中,我將重點(diǎn)放到大道至簡(jiǎn)幾個(gè)字,以及維度+度量上,而維度和度量下面分別放了所在家族的一些其他常用詞匯,我稍后會(huì)解釋。
我始終認(rèn)為在這條路上,我有一個(gè)兩詞之師,當(dāng)我比較迷茫的時(shí)候,他就像當(dāng)時(shí)教我游泳的導(dǎo)師一樣,告訴我:你不需要了解那么多,只要了解數(shù)據(jù)的世界沒有那么復(fù)雜,知道有什么維度,看什么度量,然后怎么呈現(xiàn)出來即可。
對(duì),他沒有時(shí)間教我別的,也沒有分享過任何文檔給我,只告訴了我這句話,但是讓我受益至今,因?yàn)槟且豢?,就是恍然大悟。所以我現(xiàn)在也分享給你們。
定義:
1. 度量:即Metrics, 指量化的數(shù)值。一般都有個(gè)名稱,比如網(wǎng)頁(yè)瀏覽次數(shù),網(wǎng)頁(yè)瀏覽時(shí)長(zhǎng),支付寶成交金額等等。平時(shí),我們一般會(huì)叫成“指標(biāo)”,但是在專業(yè)語(yǔ)境,你需要知道,指標(biāo)和度量還是有些差異,比如某些場(chǎng)合,他們會(huì)用指標(biāo)特指一些經(jīng)過計(jì)算的度量結(jié)果,比如拿度量A(網(wǎng)站總瀏覽次數(shù)),除以度量B(網(wǎng)站總瀏覽人數(shù)),得到一個(gè)新的指標(biāo)(網(wǎng)站人均瀏覽次數(shù)),用以衡量網(wǎng)站粘性。但是我建議你平時(shí)使用兩者可以通用。
2. 維度:即Dimension。指我們平時(shí)看事物的角度。比如,同樣是網(wǎng)站瀏覽次數(shù)(PV),我們可以從日期角度去看,也可以以流量來源去看(來自直接訪問的、來自微博的、來自搜索的等),也可以以新老用戶分群來看。更多的場(chǎng)景是同時(shí)以兩個(gè)維度的組合去看,比如這樣的圖,就是同時(shí)結(jié)合了時(shí)間、來源兩個(gè)維度對(duì)網(wǎng)站流量進(jìn)行分析:
兩者你知道如何清楚區(qū)分嗎?
雖然從定義上,你可以看出明顯不同,但是現(xiàn)實(shí)中,卻還是有人喜歡亂用——把明明屬于維度的東西寫成“我要看什么指標(biāo)”,或者喜歡用“我想從收藏人數(shù)這個(gè)維度去看”,雖然我屬于強(qiáng)迫癥,喜歡幫別人的需求糾錯(cuò),被冠以扣字眼的“名號(hào)”,但是在這件事情,我一定要摳到底。
而且,你摳清楚了,以后你的世界也清晰很多。
區(qū)分的一個(gè)方法:維度,一定是有成員值的,且成員值是可以枚舉出來的——不管它有多少,大不了你多花點(diǎn)時(shí)間去枚舉,總之是一定可以枚舉的,且會(huì)維持一定的穩(wěn)定性。
比如,日期這個(gè)維度,幾月幾號(hào)一定是有限的,一年也就365天,如果是年這個(gè)維度,也是一樣的。城市這個(gè)維度更好理解了吧?
其他你需要了解的:
1. 度量:
除了指標(biāo)這個(gè)有著略略差異的俗稱外,有時(shí)還會(huì)遇到衍生指標(biāo)這個(gè)說法,比如拿指標(biāo)A和指標(biāo)B做運(yùn)算得到的指標(biāo)C就叫做衍生指標(biāo)。此外,還要注意可累加以及不可累加的度量說法,比如網(wǎng)站UV(獨(dú)立訪問用戶數(shù)),這個(gè)指標(biāo)就是典型的不可累加的度量:某網(wǎng)站1月1日UV=100個(gè),1月2日UV=200個(gè),但是這兩天的UV不等于300個(gè),因?yàn)?月2日的獨(dú)立用戶數(shù)里可能包含了1月1日的用戶,所以如果要得到2天的UV,需要重新計(jì)算而不能直接相加。而像成交類的金額,不涉及到去重的問題,就叫可累加的度量。
2. 維度:
維度的層次:即Level。有些維度是獨(dú)立并列的關(guān)系,比如城市維度和時(shí)間維度。但是有些維度之間有層次關(guān)系,比如省份維度和城市維度,行業(yè)維度和類目維度,年級(jí)維度和班級(jí)維度等。有層次關(guān)系的維度,則可用于“鉆取”場(chǎng)景中,先匯總到比較粗的維度,當(dāng)有需要的時(shí)候,可以層層鉆取到更加明細(xì)的維度,此時(shí),也會(huì)把這些維度叫做某維度類型的不同“粒度”——比如會(huì)有一個(gè)虛擬的維度類型曰地區(qū)維度,而把省份、城市、區(qū)叫做地區(qū)維的粒度。維度的層次根據(jù)不同的需求,可能會(huì)鉆取到很細(xì)(Details),那就是通常我們說的"明細(xì)數(shù)據(jù)"了。比如分析成交金額時(shí),從行業(yè)維度,細(xì)分到一級(jí)類目乃至葉子類目,最后,鉆取到某個(gè)獨(dú)立的商品ID(不能再細(xì)了),商品ID就是最細(xì)小的層次維度。
這么說可能會(huì)把你繞暈,那么還是畫個(gè)圖吧(我真的適合當(dāng)唐僧似的老師……o(╯□╰)o)
如上圖所示,左列也即維度,不管是國(guó)家、省份、城市,都是維度,但因?yàn)樗麄冇袑哟侮P(guān)系,所以,有時(shí)會(huì)被描述為地區(qū)維度的不同粒度或?qū)哟危靼琢税桑6覀?cè)就是每個(gè)維度的維度成員了,有時(shí)也被叫成維度值。在可累加的度量中,每一個(gè)維度值相加,應(yīng)該等于上級(jí)維度的某成員值總和。比如若城市A只有三個(gè)區(qū),這三個(gè)區(qū)的人口總數(shù)應(yīng)該等于城市A的。
維度的屬性:用以描述維度的一些屬性,比如上圖中“城市”這個(gè)維度吧,它可能會(huì)有一些屬性特征,比如城市類型:省會(huì)城市、地級(jí)市、縣級(jí)市等,那么有一個(gè)分析需求,可能還會(huì)按不同城市類型匯總細(xì)分。這種情況,維度的屬性會(huì)成為分析中的維度。
這時(shí),你可能會(huì)明白,平時(shí)為什么那么多表單要填寫各種字段,這些字段,都可能是分析時(shí)的維度哦~
碼了這么多,休息一下,給你們放張圖:
當(dāng)時(shí)小貝和馬云一碰面,無論在阿里還是網(wǎng)絡(luò)上,都出現(xiàn)了一個(gè)兩難的問題:到底是選誰當(dāng)老公呢?(能有這個(gè)問題的妹子,你真想多了……),其實(shí)這里仔細(xì)分析,無非也是涉及到維度和度量?jī)稍~:
維度:人啊。
維度成員:馬云、小貝
度量:眾位妹子和弟弟們無非就是按自己心目中的算法給兩位成員計(jì)算顏值、財(cái)富,以及自己心目中的權(quán)重,衡量一個(gè)綜合指數(shù)了……我可不敢隨便填。
最后,發(fā)現(xiàn)兩難的選擇,只能得到一個(gè)結(jié)論是:左邊的當(dāng)老公,右邊的當(dāng)爸爸。
點(diǎn)評(píng):做夢(mèng)吧您。
總結(jié)一下:
兩個(gè)詞的應(yīng)用:無論你聽怎么復(fù)雜的需求,以及無論你有多么復(fù)雜的需求,請(qǐng)有傾向地提煉這兩個(gè)詞,因?yàn)檫@是你做數(shù)據(jù)產(chǎn)品、數(shù)據(jù)分析或者可視化設(shè)計(jì)的基礎(chǔ)的基礎(chǔ):
翻了自己的電腦半天,終于翻出一個(gè)不敏感的文檔,供參考,下圖就是移動(dòng)數(shù)據(jù)分析中的需求交付模版之一:左側(cè)列舉度量,右側(cè)標(biāo)注出此度量需要看的維度,有時(shí)還會(huì)注明維度之間是否要交叉組合查詢。不展開。
2. 一個(gè)立方體
其實(shí)本文的精華就在兩個(gè)詞之間了。下面您看不看都成。
立方體在數(shù)據(jù)的世界里叫做Cube。我想為何有立方體這個(gè)概念,應(yīng)該是它很形象地能夠表達(dá)出多維的概念,至少有3維,如上圖所示,成交100億的金額,是一個(gè)大立方體的總量。如果按季度、行業(yè)、地區(qū)三個(gè)維度來分析,我們可以清楚地知道第三季度A地區(qū)女裝行業(yè)有多少——也即我用橙色標(biāo)注的那一個(gè)切塊的量,是嗎?
那如果是我要知道B地區(qū)女裝行業(yè)四季度的成交總和呢?你怎么切給我?
空間感好的同學(xué)已經(jīng)知道怎么切了,你知道嗎?
這只是切塊。我們還可以切片,比如我想要知道B地區(qū)所有行業(yè)的四個(gè)季度的成交總和,怎么切?我想要知道男裝行業(yè)所有地區(qū)四個(gè)季度的成交總和怎么切?
具體怎么切,你們自己意會(huì)吧,篇幅有限,不展開。
現(xiàn)實(shí)分析場(chǎng)景中,恐怕不只三個(gè)維度,比如還要加上銷售部門維度、銷售渠道維度呢~ 那么立方體可就復(fù)雜了,空間感差一些的同學(xué),就想想不出來這個(gè)立方體什么樣子了吧,事實(shí)上,數(shù)據(jù)開發(fā)同學(xué)會(huì)用雪花模型或者星型模型去建設(shè)這些立方體。你只要有這個(gè)立方體的概念就可以了……數(shù)據(jù)分析就是像玩魔方一下,撥弄著這些立方體。
在網(wǎng)上找了一個(gè)包含了我剛才說的鉆取、匯總的概念的立方體再給你們感受下,想要詳細(xì)學(xué)習(xí)的同學(xué)可以搜索“數(shù)據(jù)立方體”繼續(xù)研究。
我剛才舉的那幾個(gè)切塊、切片的案例有毛用?。?/span>
現(xiàn)實(shí)生活中,你提需求的時(shí)候,不可能讓你畫個(gè)立方體吧?是的,我們是以表格的方式去看數(shù)據(jù)的,比如第一個(gè)切塊,是什么表格呢? 站在行業(yè)負(fù)責(zé)人,尤其是女裝負(fù)責(zé)人的視角,可能是這樣的一個(gè)報(bào)表:
當(dāng)然,如果是某地區(qū)銷售經(jīng)理,有可能是這樣的:
所以就有各種數(shù)據(jù)透視分析的視角。
總結(jié):
數(shù)據(jù)分析就是在撥弄各種數(shù)據(jù)立方體,你可以切片、切塊、鉆取、匯總,你所玩的魔方每一塊,就是一個(gè)具體的度量值,是什么數(shù)字,則是多種維度交叉后的結(jié)果。
工作實(shí)踐中,數(shù)據(jù)產(chǎn)品經(jīng)理會(huì)考慮做出更加方便易用的“立方體玩法”以供普通用戶使用:
如,在分析客戶來電的自動(dòng)語(yǔ)音導(dǎo)航服務(wù)中,我們就可以按不同的維度去對(duì)比看用戶在導(dǎo)航菜單里按鍵量,下圖所示是“按菜單對(duì)比”的界面,在“對(duì)比按”中可以進(jìn)行切換其他對(duì)比視角。
至于左側(cè)的兩個(gè)篩選,也即指篩選數(shù)據(jù)集合(切片或切塊了),比如限定某幾個(gè)熱線和菜單去看。
3. 一張圖片
了解了維度、度量?jī)蓚€(gè)詞,又有了立方體之概念,讓我們?cè)賮砜磾?shù)據(jù)是怎么產(chǎn)生,怎么被放到用戶界面上供查詢使用的。
巧婦難為無米之炊。數(shù)據(jù)不是憑空產(chǎn)生的,當(dāng)需求方提出想要什么樣的數(shù)據(jù)分析的時(shí)候,首先要檢視的是,TA需求中涉及到的維度是否確定被采集到?度量的計(jì)算成本是否高?比如若一個(gè)需求想要分析不同買家分層的留存,買家分層是一個(gè)新維度,需求方是按骨灰級(jí)、高級(jí)、新手等對(duì)買家進(jìn)行分層。且什么叫骨灰級(jí)?系統(tǒng)里并未對(duì)買家進(jìn)行打標(biāo)記,且不同類目的骨灰級(jí)算法還不一樣,加上算法定義本身也在磨合。這種情況下,我們應(yīng)該和需求方一起推動(dòng)業(yè)務(wù)系統(tǒng)完成打標(biāo),而不是自己接下這個(gè)需求,在數(shù)據(jù)倉(cāng)庫(kù)ETL環(huán)節(jié)完成。
了解ETL:這個(gè)是做數(shù)據(jù)工作繞不開的術(shù)語(yǔ),E(抽取、清洗)——T(轉(zhuǎn)換)——L(裝載),抽取是從各個(gè)業(yè)務(wù)系統(tǒng)中抽取所需的數(shù)據(jù),然后完成語(yǔ)義層、邏輯層的轉(zhuǎn)換,比如不同系統(tǒng)中記錄銷售渠道這個(gè)維度,有的叫做saleschannel,有的叫做channel,需要轉(zhuǎn)化為同一個(gè)概念。裝載,也可以理解成抽取、清洗、轉(zhuǎn)換好了,裝載到另外一個(gè)空間里,供多維查詢服務(wù)應(yīng)用調(diào)用。
當(dāng)然,則個(gè)領(lǐng)域,水很深,我只能簡(jiǎn)單描述一下,再深的也擔(dān)心大家暈菜了——畢竟本文是寫給非數(shù)據(jù)人的。(其實(shí)作者本人也講不粗來了……哈哈)
四. 應(yīng)用
我說了,我無法教你具體復(fù)雜的數(shù)據(jù)分析案例。我希望能夠借助本文和你分享下如何建立起比較專業(yè)的數(shù)據(jù)分析思路——數(shù)據(jù)產(chǎn)品經(jīng)理本身也應(yīng)該可以是優(yōu)秀的數(shù)據(jù)分析師。
1. 三部曲——建立分析框架
建立分析框架:了解業(yè)務(wù)、以及業(yè)務(wù)想要什么(目標(biāo))。
提交數(shù)據(jù)需求: 根據(jù)你的訪談、梳理,得到業(yè)務(wù)流程、業(yè)務(wù)愿景以及目標(biāo),那么就可以和需求方共同確認(rèn)“看什么”以及“怎么看”。好的數(shù)據(jù)產(chǎn)品經(jīng)理或者數(shù)據(jù)分析師,永遠(yuǎn)不是坐等需求方提出他要看什么度量和維度,而是要引導(dǎo)對(duì)方看更合適的東西以回答他關(guān)于目標(biāo)是否達(dá)成的問題。
進(jìn)行數(shù)據(jù)分析:使用多種維度,進(jìn)行總體的、細(xì)分的、多維的分析,當(dāng)發(fā)現(xiàn)問題時(shí),能夠使用這些維度的組合幫助用戶找到影響原因。
一切都基于你有多了解業(yè)務(wù):
下圖是幾年前的老圖了,左側(cè)是業(yè)務(wù)流程圖(業(yè)務(wù)流程圖怎么畫),右側(cè)是概念中的數(shù)字體系示意(可視化是為了更好和需求方溝通)。
PPT里因?yàn)榇嬖诰唧w業(yè)務(wù)的案例,不便分享,到此為止吧。如果有時(shí)間的話,我還是會(huì)編脫離具體業(yè)務(wù)的案例的……這就是寫博客的苦逼之處,工作中都是工作的案例,為了寫篇博客,還得自己再編一套有板有眼的故事……
2. 三部曲——提交數(shù)據(jù)需求
故意放了張你可能看不清楚的圖(o(╯□╰)o),所以別問我要大圖了,謝謝~
左側(cè)就是度量分類和度量,從標(biāo)注了顏色底色開始的就是維度了,標(biāo)了顏色的也即此指標(biāo)需要被計(jì)算到所需的維度,灰色的表示不需要,黃色和綠色(以及上面的數(shù)字1、2),表示優(yōu)先級(jí)不同,黃色的當(dāng)然是高優(yōu)先級(jí)了。比如黃色上我寫的數(shù)字應(yīng)該是1,也即第一優(yōu)先級(jí)。
實(shí)際上,依據(jù)不同的場(chǎng)景,當(dāng)然可以有很多簡(jiǎn)化,比如無需標(biāo)注優(yōu)先級(jí)之類的。
此外,還需要單獨(dú)提供維度和度量的詳細(xì)口徑定義說明表格,這時(shí)最好和分析師一起,詳細(xì)進(jìn)行確認(rèn)。
3. 三部曲——進(jìn)行數(shù)據(jù)分析
你提的需求不管是做成報(bào)表、還是做成具體可視化的界面,總之如果已經(jīng)開發(fā)出來了,就來玩魔方吧。只是報(bào)表有可能你得導(dǎo)出來在EXCEL里玩魔方。(即使是可視化的界面,也依賴于對(duì)方設(shè)計(jì)得是否易用)
最簡(jiǎn)單的分析是逐級(jí)鉆取,如:
復(fù)雜的則需要多維交叉:
比如,當(dāng)分析某個(gè)APP的Active users, 當(dāng)我已經(jīng)鎖定某個(gè)省份有問題的時(shí)候,我們既可以繼續(xù)鉆取到城市去明曉細(xì)節(jié),又可以交叉到品牌,看不同省份間品牌偏好的問題。比如是否小城市中安卓品牌的人更加活躍。
五. 留點(diǎn)作業(yè):要記得思考哦
1. Detail頁(yè)面的設(shè)計(jì)師被追責(zé),怎么應(yīng)對(duì)?
某日,負(fù)責(zé)搜索結(jié)果頁(yè)(LIST)的設(shè)計(jì)師來找商品詳情頁(yè)(Detail),他好容易做了LIST頁(yè)面的改版,而且結(jié)果也確實(shí)喜人,從List頁(yè)面到Detailye頁(yè)面的轉(zhuǎn)化率確實(shí)提升了(比如原來100萬的人來到List頁(yè)面,只有40萬繼續(xù)點(diǎn)擊到Detail,改版后,變成了50萬)。但是不幸的是,總體從L到訂單的轉(zhuǎn)化率卻沒有提升,反而下降了。
請(qǐng)問,如果你是Detail的分析師,如何和List的分析師一起想辦法分析什么原因?
2. 掛羊頭賣狗肉的Banner,怎么用數(shù)據(jù)證明其反而有害無益?
有時(shí)為了爆眼球效應(yīng),你的老板會(huì)要求你做個(gè)華而不實(shí)的banner,比如明明活動(dòng)頁(yè)(Landing Page)里都是一些屌絲產(chǎn)品,卻偏偏在banner上用屌絲的價(jià)格放一些高大上的產(chǎn)品圖片。想要吸引人點(diǎn)擊進(jìn)去。而確實(shí)點(diǎn)擊效果很好!過去放鳳姐一晚,100個(gè)人里只有5個(gè)人點(diǎn),現(xiàn)在放了林志玲一晚,100個(gè)人居然有99個(gè)人點(diǎn)擊。老板很高興,而且確實(shí)成交額似乎是比過去略微高那么一點(diǎn)點(diǎn)了?,F(xiàn)在,除了用道德說辭說服老板不要這么做,還有別的方式嗎?
六. 最后,嘮叨幾句
最后,分享給各位的心得是:
你現(xiàn)在也知道,數(shù)據(jù)本身需要經(jīng)過分析師的定義、數(shù)據(jù)源系統(tǒng)的采集、數(shù)據(jù)開發(fā)的開發(fā)以及展現(xiàn)設(shè)計(jì),任何一個(gè)環(huán)節(jié),可能會(huì)產(chǎn)出錯(cuò)誤的數(shù)據(jù),所以數(shù)據(jù)本身未必100%靠譜。
此外,數(shù)據(jù)的解讀,需要保持謹(jǐn)慎批判之心。比如同樣是小明語(yǔ)文得了59分,如果你不了解上下文以及歷史趨勢(shì)的話,會(huì)認(rèn)為小明沒考好,有的人甚至?xí)贸鲂∶髡Z(yǔ)文不好的結(jié)論。而要是了解他上個(gè)季度每次語(yǔ)文考試都只有30多分,又會(huì)得出小明雖然語(yǔ)文不好但是明顯進(jìn)步了。而要是了解到這個(gè)班級(jí)平均分?jǐn)?shù)只有49分,你又會(huì)覺得小明簡(jiǎn)直太贊了!所以,單純的一個(gè)數(shù)字本身沒有任何意義,要窺一斑,更要知全貌。
此外,數(shù)據(jù)會(huì)被有心計(jì)的故意利用,而向你呈現(xiàn)部分事實(shí)(他不是在彎曲事實(shí),而是只呈現(xiàn)對(duì)他有利的一面),數(shù)據(jù)本身有那么多維度以及層次,導(dǎo)致解讀的方式完全可以被利用。
所以,要記得我本文的最后提點(diǎn):
對(duì)于產(chǎn)品經(jīng)理和分析師來講,最針對(duì)的是我們基于對(duì)于業(yè)務(wù)的深入理解而產(chǎn)生的直覺。不要盲目被數(shù)據(jù)拉著走。只有有較好的直覺,我們才能有更合理的假設(shè),有了這個(gè)合理的假設(shè),才能夠更好解讀數(shù)據(jù)以及提數(shù)據(jù)的需求。而不是在各種數(shù)據(jù)的海洋里玩數(shù)據(jù)的游戲而浪費(fèi)時(shí)間。
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
LSTM 模型輸入長(zhǎng)度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長(zhǎng)序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報(bào)考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計(jì)的實(shí)用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強(qiáng)大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠(chéng)摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實(shí)施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價(jià)值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡(jiǎn)稱 BI)深度融合的時(shí)代,BI ...
2025-07-10SQL 在預(yù)測(cè)分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢(shì)預(yù)判? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代,預(yù)測(cè)分析作為挖掘數(shù)據(jù)潛在價(jià)值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價(jià)值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點(diǎn),而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報(bào)考到取證的全攻略? 在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭(zhēng)搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢(shì)性檢驗(yàn):捕捉數(shù)據(jù)背后的時(shí)間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢(shì)性檢驗(yàn)如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時(shí)間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時(shí)間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實(shí)戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗(yàn):數(shù)據(jù)趨勢(shì)與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢(shì)變化以及識(shí)別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國(guó)內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對(duì)策略? 長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨(dú)特的門控機(jī)制,在 ...
2025-07-07統(tǒng)計(jì)學(xué)方法在市場(chǎng)調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場(chǎng)調(diào)研是企業(yè)洞察市場(chǎng)動(dòng)態(tài)、了解消費(fèi)者需求的重要途徑,而統(tǒng)計(jì)學(xué)方法則是市場(chǎng)調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動(dòng)力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動(dòng)力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價(jià)值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03