
資深數(shù)據(jù)分析師和您聊聊手游的數(shù)據(jù)分析這點事
在互聯(lián)網(wǎng)的各個時代,“數(shù)據(jù)”對于從業(yè)者來講一直是“富者不嫌,窮者不棄”的東西。究其原因是因為通過數(shù)據(jù)往往能夠集中對于本公司產(chǎn)品或者當前的市場現(xiàn)狀做出一個相對客觀和直觀的反饋,而根據(jù)這些數(shù)據(jù)則有助于從業(yè)者對于本公司或者公司旗下產(chǎn)品的下一步調(diào)整做出參考。
而對于移動游戲從業(yè)者來說,對于數(shù)據(jù)的依賴同樣存在。除去根據(jù)后臺數(shù)據(jù)對于本公司產(chǎn)品進行分析以及公開的行業(yè)數(shù)據(jù)報告進行趨勢預測外,通過對外曬本公司產(chǎn)品的留存,付費率等數(shù)據(jù),也是一種移動游戲行業(yè)比較常見的PR手法。
但是,在這個人人都在談數(shù)據(jù),并對數(shù)據(jù)見怪不怪的時代。對于數(shù)據(jù)的分析與解讀應該如何進行?卻并不是每個從業(yè)者都明白的話題,對于數(shù)據(jù)的分析應該如何進行?而數(shù)據(jù)分析的關鍵點又在哪里?如何能夠最大限度的體現(xiàn)出數(shù)據(jù)的價值? 帶著這些問題,龍虎豹在近日拜訪了業(yè)內(nèi)知名的數(shù)據(jù)分析機構TalkingData,并通過與其資深分析師、市場智能部高級總監(jiān)陶京琪的溝通,為游戲行業(yè)的從業(yè)者在數(shù)據(jù)分析過程中能夠提供一些有價值的方法與幫助。
為閱讀方便,本文以陶京琪自述形式展開:
為什么要做數(shù)據(jù)分析
在開始這個話題之前,我想先從數(shù)據(jù)的意義和目的聊起。
在TalkingData內(nèi)部,我們有一句口號是“用數(shù)據(jù)說話”。意思是所有的東西都要用數(shù)據(jù)來表現(xiàn),因為數(shù)據(jù)本質(zhì)上還是一種能夠相對的對于要研究的話題進行客觀呈現(xiàn)的東西。但是真正能夠徹底明白“讓數(shù)據(jù)說話”這句話意思的人卻不多。
什么是“讓數(shù)據(jù)說話”呢?在我看來最重要的就是發(fā)揮數(shù)據(jù)的價值,那怎么讓數(shù)據(jù)發(fā)揮價值呢?其實這就牽扯到了當前行業(yè)里數(shù)據(jù)報告普遍存在的問題。我今天還經(jīng)??匆恍﹫蟾妫还苁且苿踊ヂ?lián)網(wǎng)的還是游戲行業(yè)的,我發(fā)現(xiàn)這里面有個最大的問題是,我們的數(shù)據(jù)報告往往還停留在五年前最基礎的數(shù)據(jù)統(tǒng)計方面,而這樣的報告所能呈現(xiàn)出的結果未必是我們想得到的。在這方面我覺得TalkingData還是比別人多走了一步的,我們每年的報告都可以比去年多做一些東西。
那么這些報告缺一些什么呢?在我看來可能就是分析與解讀,這兩方面是做數(shù)據(jù)比較關鍵的點。因為每一項數(shù)據(jù)樣本其實都能夠反應一樣東西,關鍵在于你去如何分析和解讀它。
舉例來講我曾經(jīng)看見過一些游戲行業(yè)里常見的“曬留存”的數(shù)據(jù)新聞,這些數(shù)據(jù)也許在公布時有一些不完善(究竟哪些不完善我會在后面說明),但總得來講它仍然提供了一種解讀方式,并且從其目的出發(fā)仍不失為體現(xiàn)了數(shù)據(jù)的價值,只不過這種價值可能更多的局限于PR。但歸根結底,對于企業(yè)來講,它的確是產(chǎn)生了價值的。
事實上這就是數(shù)據(jù)產(chǎn)生的意義,你要做的是學會解讀和分析它。那接下來,我就來聊聊怎么做數(shù)據(jù)分析?
剛才在一開始的時候,我曾經(jīng)提到過一點就是今天的很多數(shù)據(jù)報告還停留在五年前,最基礎的數(shù)據(jù)統(tǒng)計方面,談不上什么分析與解讀。作為CP與發(fā)行商來說,我認為這種分析你是應該杜絕的,這也就牽扯到了我們接下來說的一個話題——數(shù)據(jù)分析的前提。
我認為作為CP與發(fā)行商來說,你是這個行業(yè)里一線的從業(yè)者,因此你在做數(shù)據(jù)分析之前的時候目的一定是明確的:什么是目的呢?就是你心里明白你為什么要去做這個數(shù)據(jù)分析?在你心里是帶有一個問題的,這個問題不管是就整個行業(yè)的趨勢來說還是就你的產(chǎn)品出現(xiàn)的某一問題來說都是一樣的。而做數(shù)據(jù)分析的目的其實就是驗證你發(fā)現(xiàn)的問題是否是存在的。
這話聽起來像是廢話,但實際上它卻決定了你的下一步行動。在我們看來數(shù)據(jù)解讀不能就數(shù)據(jù)解讀數(shù)據(jù),而一定是要結合行業(yè)里的某一個現(xiàn)象看的,畢竟數(shù)據(jù)是能夠比較直觀地反應出一個現(xiàn)象的。在這種情況下,你心里有一個明確的目的和你沒有目的做出的分析與解讀是完全不同的。
接下來,我就聊聊數(shù)據(jù)分析的三個過程。
首先:預判與篩選,明確你的目的是關鍵
前文說過,作為數(shù)據(jù)分析來說,你不能就數(shù)據(jù)說數(shù)據(jù),更不能把所有的數(shù)據(jù)進行簡單的匯總。因此在第一步做數(shù)據(jù)分析之前,你要做的是預判。
預判對于數(shù)據(jù)分析來說極為重要,前文說過數(shù)據(jù)分析與解讀的前提一定是為了解決某一問題而存在的。也正因此,預判在這個環(huán)節(jié)中所起到的作用就提出假設。說得通俗點就是:“要解決問題,先要證明問題?!?/span>
這一步看似簡單,但實際是異常重要。這是因為今天的移動游戲運營是一件復雜與多元化的事情。也正因此,為證明問題的存在要通過多個不同緯度的數(shù)據(jù)來進行。而預判這個環(huán)節(jié)也正是為此而存在,它決定的其實是根據(jù)你提出的問題而去提取哪個緯度的數(shù)據(jù)。
舉例來講,2015年之后,移動電競概念開始出現(xiàn),市場上打“移動電競”牌的產(chǎn)品越來越多。那么這一領域的市場是否就此進入了一個強增長周期,這個時候我就可以做出類似的預判,而后去篩選出多組數(shù)據(jù)。
比如說證明移動電競市場將處于強增長周期,那么我首先要看的是市場環(huán)境,這其中用戶數(shù)量是一個緯度,其次還有CP數(shù)量、產(chǎn)品數(shù)量、在往后還有收入規(guī)模等等一系列的東西。通過這些緯度數(shù)據(jù)的篩選和提取,最后的結果我才能加以分析,并且得出一個結論是或者否。當然說提取數(shù)據(jù)和分析都是之后的事情,在這一步中我們要做的僅僅是提出問題,而后根據(jù)問題在去找到幾個相關的緯度。
對于移動游戲的發(fā)行商或者CP來說,根據(jù)自己所面對的問題,提出的問題是可大或可小的,重要的是與自己當前面對的問題息息相關,但并不因為問題較為明顯而使得在隨后篩選數(shù)據(jù)緯度時也因此而簡單。
舉例來講,某些CP在游戲上線一段時間之后會認為自己的游戲已經(jīng)處于增長乏力期,那么這時他提出了一個明顯的問題:我的游戲是否處于增長乏力期難以后繼。這時表面看起來簡單,只要提取過去一個周期內(nèi)新進用戶的數(shù)量即可。但實際上剛才我們說過游戲運營往往是一個多元化導致的最終結果,因此你還要看游戲的收入規(guī)模是否也因此而走緩?你的用戶流失在過往的幾個月里是怎樣的?你的競品數(shù)據(jù)是否在這一周期有了提升?
以及再往上的,你這個產(chǎn)品所處的領域是否收入也呈一樣的趨勢?通過這一系列多元化的數(shù)據(jù)篩選,最終你才能得出一個結論是這個游戲是否真的是增長乏力?還是并非增長乏力而是用戶流失過多?亦或是因為整個細分領域的遇冷使得你的產(chǎn)品也被連帶。你需要做的就是用這個問題去找到相關的緯度,而后在去篩選提取數(shù)據(jù)。
但我需要在此聲明的一點是:作為預判這個環(huán)節(jié)來說,它僅限于“解決某一問題”時存在,對于一些行業(yè)趨勢性的預測是不存在這一環(huán)節(jié)的。其理由在于趨勢性的東西往往是通過數(shù)據(jù)直觀反應出來的,因此如果真的是預測行業(yè)中的某一趨勢的話,則應該做的是直接進入篩選環(huán)節(jié),通過多個緯度去提取數(shù)據(jù)。
接下來是提數(shù)據(jù):加權處理這一刀砍在哪
預判與篩選這一步完成之后,接下來要做的事情就是按照劃分的緯度提取數(shù)據(jù)。在很多人看來這一步過后就可以直接進入數(shù)據(jù)分析的環(huán)節(jié),但事實上這其中仍有一個加權處理即對數(shù)據(jù)進行加工的過程。
為什么要進行數(shù)據(jù)的加工?在很多人看來,原始的數(shù)據(jù)往往是最能夠顯示問題的根本的,但是作為分析師,我想說的是生活在移動互聯(lián)網(wǎng)的大數(shù)據(jù)時代,你要做的絕對不是把所有的數(shù)據(jù)匯總在桌上就可以了。如果你真這么做了你會發(fā)現(xiàn)自己根本無法找到想要的數(shù)據(jù)。為什么這么說呢?因為在大數(shù)據(jù)時代下是有一些過于零散的“臟數(shù)據(jù)”的,如果你一味地將之進行匯總的話,那么毫無疑問它會把你的數(shù)據(jù)線帶偏。
舉個不夠恰當?shù)睦樱阆脶槍τ趇OS排行榜上的應用去做一次用戶付費分析。那你最后會發(fā)現(xiàn)在一萬名之后仍然存在著許多小的、不為人知的應用APP,這些應用APP,它們的使用行為過于零散,但是匯總到一起之后仍然是可觀的數(shù)量,最后的結果就是它可能會把你原本的數(shù)據(jù)線帶跑,使你對于數(shù)據(jù)的曲線產(chǎn)生一定的懷疑。而對于數(shù)據(jù)的加工,其實就是為了避免這種現(xiàn)象。你要把一些過于零散的數(shù)據(jù)砍掉。
那么如何去砍這一刀呢?這其實與第一個問題預測和篩選息息相關。你要明白你提取數(shù)據(jù)是干什么的?并且你要研究的問題是什么?在搞清楚這件事情之后,剩下的事就是把數(shù)據(jù)中那些不到1%的體量的小概率數(shù)據(jù)給砍掉。
在TalkingData我們是這么處理這個問題的。假設我要分析的是付費用戶相關的數(shù)據(jù),那我會先去提數(shù)據(jù),其次根據(jù)數(shù)據(jù)計算體量。一般來講,頭部數(shù)據(jù)一定是占絕大多數(shù)的比例,那剩下的事我就要根據(jù)我研究的問題以及整個的數(shù)據(jù)體量去設置這一刀砍在哪。研究問題不同,最后這一刀的設置也不一樣。
總得來講,從你研究問題的角度出發(fā),隨后去根據(jù)行業(yè)、平均值以及主體數(shù)據(jù)量來設定這一刀卡在哪個位置,這個位置之下的全部數(shù)據(jù)都砍掉。
對于CP或者發(fā)行商來說,在這個過程中比較容易犯的問題是突然間忽略了自己要研究的課題。舉例來講CP或者發(fā)行商要研究的是游戲的主要付費用戶的某一項行為,那么你就要記住你的主體是什么,至少應該是個小R,而小R之下還有很多更小額的付費用戶,其付費呈碎片化就整體的付費金額來說根本構不成比例。
但這時有的CP就想了,這是活躍用戶呀?也是很有參考價值的。這樣想倒沒錯,但你要明白的一點是,在這里你的研究主體是“主要付費用戶”,那這些用戶也許是活躍用戶不假,但他并不符合這個主體,最后的結果就是只能把你的曲線帶偏。最后結果我覺得你真因此做出錯誤的反饋大R用戶走了,也不是你想要的。
當然就數(shù)據(jù)的加權處理這事來說,這其實是一個挺復雜的過程??车襞K數(shù)據(jù)僅僅是其中的一部分,限于篇幅不在此多說。但這一步應該是每一個想做分析的CP或者發(fā)行都需要了解的,最起碼你是要利用數(shù)據(jù)得出結論,而不是說被數(shù)據(jù)帶著跑。那樣的話就失去數(shù)據(jù)分析的本意了。
分析與解讀:你能正確解讀出數(shù)據(jù)反應出的問題嗎
在開始這一部分的時候我首先要明確一點。那就是對于數(shù)據(jù)來說,分析與解讀的含義是不同的。具體來說分析主要是就數(shù)據(jù)說數(shù)據(jù),而解讀則是就行業(yè)說數(shù)據(jù)?;谶@一觀點來說,對于今天的CP與發(fā)行商來說,其實更需要的是后者。
我曾經(jīng)見過有一些CP或者發(fā)行商,問題也提出了,緯度也找了,數(shù)據(jù)也提了,但最后的結果是經(jīng)過分析沒有得出任何有價值的結果。在我看來其實這都是在解讀這一環(huán)節(jié)做得不夠。解讀這事咱們前面說過,一定是就行業(yè)或者是某一問題說數(shù)據(jù)的。因此你最首先需要對于某項數(shù)據(jù)對應的指標要有一個大概的了解,其次就是你應該把這個數(shù)據(jù)結合到整個行業(yè)的高度去看,而不是單純地看一個數(shù)據(jù)。
舉個最簡單的例子,CP或者發(fā)行商發(fā)現(xiàn)新增放緩了如臨大敵,但在這種情況下你參考的數(shù)據(jù)緯度可能都是正確的,但是你是否把它與行業(yè)結合了,并且充分地把你的公司模型放在這個行業(yè)里了?有的時候你的產(chǎn)品已經(jīng)推出三個季度甚至快一年了,那有可能產(chǎn)品就是進入了穩(wěn)定期,它的新增在這種情況就是放緩了。
其次不在這個穩(wěn)定期的話,你是否應該看看你做了什么推廣活動?別家的企業(yè)做了什么推廣活動?用戶的需求一定是不斷流動的,在這種情況下我認為你是需要進行一個對比的。其次就是對于很多CP來說要學會擺正自己的位置。王健林說得好,先定一個可以實現(xiàn)的小目標,作為CP來講也是一樣,目標不要定得太大。你別先把自己的某項數(shù)據(jù)單純和市場上的頭部產(chǎn)品比較。
所以就這個環(huán)節(jié)來說,表面上來看只要根據(jù)數(shù)據(jù)做一個匯總就可以了,但其實真正考驗的是你的解讀功力,即將數(shù)據(jù)與行業(yè)、與自己的企業(yè)和產(chǎn)品充分在市場上對接的能力。說到這我想多說兩句關于之前提的一點,就是行業(yè)里常見的發(fā)行商和CP曬數(shù)據(jù)的行為。其實這樣的行為目的,一是給自己發(fā)聲和曝光,第二則是通過這種方式引發(fā)渠道的注意能夠獲得更好的位置,而一些渠道也會對此另眼相看。
但這里有一個問題仍然在于對這份數(shù)據(jù)的解讀。這些數(shù)據(jù)在我看來一個比較明顯的問題就是,它沒有把自己的數(shù)據(jù)提取環(huán)境與樣本等相關的東西說清楚。舉例來講有的游戲說自己付費率100%,但根據(jù)我們的理解可能行業(yè)里付費超過50%都很困難。但有可能是這家CP的游戲是一個點卡制收費的游戲,那在這種情況下他說100%的付費率的確是沒有錯的。
不過這里有一個問題就是對于發(fā)行也罷,還是渠道也罷,都需要對于數(shù)據(jù)有進一步的解讀能力。舉例來講你看一個游戲首測數(shù)據(jù)不錯,次留是60%以上,那我覺得你還應該看看其它的數(shù)據(jù),比如說一個時間周期的新增、留存以及付費,然后其次是背景信息,包括題材、類型,以及這個題材和這個類型之下真正的“市場尾燈”是誰,通過這些綜合的信息對于這些產(chǎn)品在市場上的前景得出一個大致的結論。這些緯度我覺得都是應該你去看的,當然就這塊來說我認為渠道或者發(fā)行作為實操者肯定比我更有經(jīng)驗,因此我就不在這班門弄斧了。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
CDA 精益業(yè)務數(shù)據(jù)分析:數(shù)據(jù)驅動業(yè)務增長的實戰(zhàn)方法論 在企業(yè)數(shù)字化轉型的浪潮中,“數(shù)據(jù)分析” 已從 “加分項” 成為 “必修課 ...
2025-07-16MySQL 中 ADD KEY 與 ADD INDEX 詳解:用法、差異與優(yōu)化實踐 在 MySQL 數(shù)據(jù)庫表結構設計中,索引是提升查詢性能的核心手段。無論 ...
2025-07-16解析 MySQL Update 語句中 “query end” 狀態(tài):含義、成因與優(yōu)化指南? 在 MySQL 數(shù)據(jù)庫的日常運維與開發(fā)中,開發(fā)者和 DBA 常會 ...
2025-07-16如何考取數(shù)據(jù)分析師證書:以 CDA 為例? ? 在數(shù)字化浪潮席卷各行各業(yè)的當下,數(shù)據(jù)分析師已然成為企業(yè)挖掘數(shù)據(jù)價值、驅動決策的 ...
2025-07-15CDA 精益業(yè)務數(shù)據(jù)分析:驅動企業(yè)高效決策的核心引擎? 在數(shù)字經(jīng)濟時代,企業(yè)面臨著前所未有的數(shù)據(jù)洪流,如何從海量數(shù)據(jù)中提取有 ...
2025-07-15MySQL 無外鍵關聯(lián)表的 JOIN 實戰(zhàn):數(shù)據(jù)整合的靈活之道? 在 MySQL 數(shù)據(jù)庫的日常操作中,我們經(jīng)常會遇到需要整合多張表數(shù)據(jù)的場景 ...
2025-07-15Python Pandas:數(shù)據(jù)科學的瑞士軍刀? ? 在數(shù)據(jù)驅動的時代,面對海量、復雜的數(shù)據(jù),如何高效地進行處理、分析和挖掘成為關鍵。 ...
2025-07-15用 SQL 生成逆向回滾 SQL:數(shù)據(jù)操作的 “后悔藥” 指南? 在數(shù)據(jù)庫操作中,誤刪數(shù)據(jù)、錯改字段或誤執(zhí)行批量更新等問題時有發(fā)生。 ...
2025-07-14t檢驗與Wilcoxon檢驗的選擇:何時用t.test,何時用wilcox.test? t 檢驗與 Wilcoxon 檢驗的選擇:何時用 t.test,何時用 wilcox. ...
2025-07-14AI 浪潮下的生存與進階: CDA數(shù)據(jù)分析師—開啟新時代職業(yè)生涯的鑰匙(深度研究報告、發(fā)展指導白皮書) 發(fā)布機構:CDA數(shù)據(jù)科 ...
2025-07-13LSTM 模型輸入長度選擇技巧:提升序列建模效能的關鍵? 在循環(huán)神經(jīng)網(wǎng)絡(RNN)家族中,長短期記憶網(wǎng)絡(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準備指南? ? 在數(shù)據(jù)驅動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認 ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務的價值轉化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預測分析中的應用:從數(shù)據(jù)查詢到趨勢預判? ? 在數(shù)據(jù)驅動決策的時代,預測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結束)并非工作的終點,而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報考到取證的全攻略? 在數(shù)字經(jīng)濟蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗:捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準 ...
2025-07-09