99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

熱線電話(huà):13121318867

登錄
首頁(yè)職業(yè)發(fā)展數(shù)據(jù)分析這點(diǎn)事_數(shù)據(jù)分析
數(shù)據(jù)分析這點(diǎn)事_數(shù)據(jù)分析
2014-09-06
收藏
  其實(shí),數(shù)據(jù)分析這個(gè)話(huà)題還有很多延伸,比如,如何看一個(gè)年輕人有沒(méi)有數(shù)據(jù)分析潛質(zhì);以及如何培養(yǎng)數(shù)據(jù)分析和產(chǎn)品分析人才,等等,不過(guò),就這樣吧。今天說(shuō)的不少了,我水平有限,吃飯的就這幾招,而且又老又笨,大家都會(huì)了我離下崗也不遠(yuǎn)了,您就湊活看吧。
  先聲明一下,按照傳統(tǒng)的定義,我還真不是數(shù)據(jù)分析高手,各種關(guān)聯(lián)算法,只會(huì)最簡(jiǎn)單的一種(話(huà)說(shuō)不少場(chǎng)合還算管用);各種挖掘技術(shù),基本上一竅不通;各種牛逼的數(shù)據(jù)分析工具,除了最簡(jiǎn)單的幾個(gè)免費(fèi)統(tǒng)計(jì)平臺(tái)之外,基本上一個(gè)都不會(huì)用。所以,各種高手高高手請(qǐng)隨意BS,或自行忽略。這里說(shuō)點(diǎn)高手不說(shuō)的。
  從微博段子說(shuō)起,微博上關(guān)于數(shù)據(jù)分析有兩個(gè)段子,我經(jīng)常當(dāng)作案例講,第一個(gè)段子,說(shuō)某投資商對(duì)某企業(yè)所屬行業(yè)有興趣,要做背景調(diào)查,甲是技術(shù)流,一周分析各種網(wǎng)上數(shù)據(jù),四處尋找行業(yè)材料,天天熬夜,終于寫(xiě)出一份報(bào)告;乙是人脈流,和對(duì)方高管喝了次酒,請(qǐng)對(duì)方核心人員吃了頓飯,所有內(nèi)幕數(shù)據(jù)全搞定,問(wèn)誰(shuí)的方法是對(duì)的;第二個(gè)段子,某電商發(fā)現(xiàn)競(jìng)爭(zhēng)對(duì)手淘寶店,周收入突然下降了30%,但是隔周后又自然恢復(fù),中間毫無(wú)其他異常現(xiàn)象,于是老板讓分析師分析,苦逼的分析師辛苦數(shù)日,做各種數(shù)學(xué)模型,總算找到勉強(qiáng)的理由自圓其說(shuō),老板讀畢,雖說(shuō)不能讓人信服,卻也沒(méi)有更合理的解釋?zhuān)橙?,?jiàn)對(duì)手老板,閑聊此事,“你們某段時(shí)間怎么突然收入下降?”“嗨,別提了,丈母娘去世了,回家奔喪,公司放羊了?!崩习寤腥淮笪颉?br />   兩個(gè)段子,第一個(gè)段子,微博上一邊倒的說(shuō),苦逼分析沒(méi)有人脈有用;第二個(gè)段子類(lèi)似,一邊倒的認(rèn)為,人脈的消息比苦逼分析管用多了。但是我想說(shuō)的是,這個(gè)解讀絕對(duì)是錯(cuò)的!
  先說(shuō)第一個(gè)段子,其實(shí)網(wǎng)絡(luò)不乏這種“人脈達(dá)人”,特別是媒體圈,一些所謂的“IT名記”或者“著名評(píng)論家、分析師”和各種互聯(lián)網(wǎng)大佬稱(chēng)兄道弟,天天秘聞不斷,但是呢?他們從不研究產(chǎn)品,不分析用戶(hù),所以,他們知道了數(shù)據(jù),卻不懂?dāng)?shù)據(jù)背后是什么,更不知道什么是重要的,什么是次要的,我有時(shí)會(huì)批評(píng)身邊這樣的朋友,別天天覺(jué)得自己知道幾個(gè)互聯(lián)網(wǎng)大佬的花邊新聞,就當(dāng)自己是資深業(yè)內(nèi)人士了,正因?yàn)檎莆者@些東西又覺(jué)得炫耀,才反而忽視了真正有價(jià)值的信息和有價(jià)值的數(shù)據(jù)。這就是為什么混網(wǎng)絡(luò)媒體的,見(jiàn)過(guò)市面的各種達(dá)人,在互聯(lián)網(wǎng)創(chuàng)業(yè)浪潮里,幾乎沒(méi)有成功幾率的真實(shí)原因,自以為人脈廣泛,無(wú)所不知,其實(shí)正因?yàn)槿狈ψ罨镜臄?shù)據(jù)背景分析,所以才是看上去什么都懂,細(xì)究下其實(shí)什么都不懂。請(qǐng)記住一點(diǎn),除非你是富二代,官二代,銜著金鑰匙出生,那不在我的討論范圍里,否則,沒(méi)有苦逼的經(jīng)歷,就沒(méi)有牛逼的成就。
  我常訂閱一些著名分析師的微博,他們透露的數(shù)據(jù)往往是很有價(jià)值的(這是我訂閱的原因),但是他們的解讀通常是慘不忍睹的,這就是只看表象的惡果,而且隨便翻看一下他們的數(shù)據(jù)解讀,可以說(shuō)他們的數(shù)據(jù)感和數(shù)據(jù)認(rèn)知貧乏到可笑,甚至缺乏最基本的數(shù)據(jù)校核和考證的能力,他們拿到了某公司核心數(shù)據(jù)又怎樣?沒(méi)經(jīng)歷過(guò)苦逼的分析,他們其實(shí)什么都看不到。
  第二個(gè)段子同理,如果不是持續(xù)有效的數(shù)據(jù)跟蹤,怎么能得出下降30%的結(jié)論,這一數(shù)據(jù)結(jié)論與人脈得到的消息相互驗(yàn)證,才會(huì)得到完整真實(shí)的結(jié)果,否則僅僅是閑聊,你怎能知道對(duì)方企業(yè)管理對(duì)業(yè)績(jī)影響的范疇,苦逼的分析也許一時(shí)沒(méi)有人脈的消息管用,但是你所得到的對(duì)數(shù)據(jù)的認(rèn)知和積累,是人脈永遠(yuǎn)不會(huì)給你的。
  所以,再次強(qiáng)調(diào),基本的數(shù)據(jù)跟蹤和日常的數(shù)據(jù)感養(yǎng)成,絕不是可以忽略和無(wú)視的。人脈情報(bào)可以成為數(shù)據(jù)解讀重要的信息來(lái)源,但是絕不能喧賓奪主,替代基本的數(shù)據(jù)分析工作。
  下面說(shuō)一下數(shù)據(jù)感,什么是數(shù)據(jù)感?就是別人說(shuō)一個(gè)數(shù)據(jù)出來(lái),你會(huì)琢磨一下這個(gè)是否符合常理,與你日常的數(shù)據(jù)觀測(cè)經(jīng)驗(yàn)是否一致,如果不一致,那么可能的理由是哪些? 比如12306號(hào)稱(chēng)一天幾十億次點(diǎn)擊,如果你有數(shù)據(jù)感,第一眼就會(huì)質(zhì)疑這個(gè)“點(diǎn)擊”定義的合理性;比如曾經(jīng)有人說(shuō)某國(guó)內(nèi)圖片分享網(wǎng)站一天多少億訪問(wèn)量,第一眼就知道這個(gè)“訪問(wèn)量”定義是有歧義的,(事后官方解釋是圖片加載量,這個(gè)和訪問(wèn)量差異幾十倍。) 數(shù)據(jù)感需要不斷的培養(yǎng),和基本的邏輯(比如你應(yīng)該知道中國(guó)有多少網(wǎng)民,每天有多少人上網(wǎng),一個(gè)大概什么類(lèi)型,什么排名的網(wǎng)站會(huì)覆蓋網(wǎng)民的比例是多少),以及善于利用各種工具,我以前在巨頭公司,得益于公司巨大的數(shù)據(jù)資源,可以看到很多互聯(lián)網(wǎng)的核心數(shù)據(jù);但是離開(kāi)后,才發(fā)現(xiàn),其實(shí)互聯(lián)網(wǎng)上公開(kāi)可獲取的數(shù)據(jù)途徑是非常多的,而且善于利用的話(huà)非常有效。每天去查詢(xún)一些感興趣的數(shù)據(jù),經(jīng)過(guò)一段時(shí)間積累,想沒(méi)有數(shù)據(jù)感都難。
  作為公司或團(tuán)隊(duì)負(fù)責(zé)人,怎么培養(yǎng)員工的數(shù)據(jù)感,我其實(shí)也有一個(gè)建議,平時(shí)可以搞一些小的競(jìng)猜,比如團(tuán)隊(duì)集體競(jìng)猜新產(chǎn)品或產(chǎn)品改版上線后的日活躍用戶(hù),或者pv數(shù)字,或者收入數(shù)據(jù),等等;然后看誰(shuí)的最準(zhǔn),一種是懲罰制,最不準(zhǔn)的請(qǐng)最準(zhǔn)的喝奶茶,吃冰淇淋;另一種不懲罰,最準(zhǔn)的累計(jì)積分后公司可以發(fā)一些獎(jiǎng)品鼓勵(lì),這樣下去大家的數(shù)據(jù)感就會(huì)在日常培養(yǎng)起來(lái),而且對(duì)團(tuán)隊(duì)的氣氛培養(yǎng)也有幫助。
  數(shù)據(jù)感之后,談數(shù)據(jù)分析的方法,我的建議是,不炫技,不苛求技術(shù)復(fù)雜度,最簡(jiǎn)單的數(shù)據(jù),所包含的信息往往是最有價(jià)值的,而很多人恰恰這一步都沒(méi)做好,就總想著弄一堆挖掘算法;數(shù)據(jù)的價(jià)值在于正確的解讀,而不是處理算法的復(fù)雜度,切不可喧賓奪主。 大公司的kpi制度,往往會(huì)產(chǎn)生偏差,比如技術(shù)工程師的評(píng)定,要講究“技術(shù)復(fù)雜度”、“技術(shù)領(lǐng)先性”,直接導(dǎo)致簡(jiǎn)單的事情沒(méi)人肯做,最基本的工作不認(rèn)真做!所以往往是大公司的分析工程師,為了評(píng)高級(jí)工程師,非要簡(jiǎn)單問(wèn)題復(fù)雜化,四則運(yùn)算就搞定的事情一定要弄一套詭異的算法,最終非但浪費(fèi)了資源,消耗了時(shí)間,而且往往由于工程師對(duì)業(yè)務(wù)理解的漠視,對(duì)應(yīng)的產(chǎn)品人員又對(duì)算法的陌生,導(dǎo)致了嚴(yán)重的理解歧義,從而出現(xiàn)各種誤讀。
  下面說(shuō)關(guān)鍵,數(shù)據(jù)解讀,正確的數(shù)據(jù)解讀,是所有數(shù)據(jù)分析工作最關(guān)鍵的一步,這一步錯(cuò)了,前面的所有努力都是白搭,然后,往往很多人簡(jiǎn)單的以為“數(shù)據(jù)會(huì)說(shuō)話(huà)”,他們認(rèn)為把數(shù)據(jù)處理完一擺就ok了,所以我看到很多知名分析師拿著正確的數(shù)據(jù)信口胡謅;而更有甚者,顯然是故意的行為,一個(gè)非常非常著名的、口碑極佳的跨國(guó)企業(yè),曾經(jīng)就同一份很酷的數(shù)據(jù),在不同的場(chǎng)合下,為了市場(chǎng)公關(guān)的需求,做出不同的解讀;這簡(jiǎn)直就是道德問(wèn)題了。
  數(shù)據(jù)解讀,不能是為了迎合誰(shuí),要遵循數(shù)據(jù)的本質(zhì),要遵循科學(xué)的邏輯,要有想象力(配合求證),可能有時(shí)候也需要依賴(lài)人脈關(guān)系所獲得的情報(bào),(這個(gè)也有很多典型范例),這個(gè)具體再怎么說(shuō)可能我也說(shuō)不清楚,說(shuō)幾個(gè)反面例子也許更容易理解。
  1、因果關(guān)聯(lián)錯(cuò)誤,或忽略關(guān)鍵因素,A和B的數(shù)據(jù)高度相關(guān),有人就片面認(rèn)為A影響了B,或者B影響了A;但是,有時(shí)候真實(shí)原因是C同時(shí)影響了A和B,有時(shí)候C被忽略掉了。
  2、忽略沉默的大多數(shù),特別是網(wǎng)上投票,調(diào)查,極易產(chǎn)生這種偏差,參與者往往有一定的共同訴求,而未參與者往往才是主流用戶(hù)。
  3、數(shù)據(jù)定義錯(cuò)誤,或理解歧義,在技術(shù)與市場(chǎng)、產(chǎn)品人員溝通中產(chǎn)生信息歧義,直接導(dǎo)致所處理的數(shù)據(jù)和所需求的數(shù)據(jù)有偏差,結(jié)果顯著不正確。
  4、強(qiáng)行匹配;不同公司,不同領(lǐng)域的數(shù)據(jù)定義可能不一致,在同一個(gè)公司內(nèi)或領(lǐng)域內(nèi)做對(duì)比,往往沒(méi)有問(wèn)題,大家對(duì)此都很習(xí)慣,卻有評(píng)論家不懂裝懂,強(qiáng)行將不同定義的數(shù)據(jù)放在一起對(duì)比做結(jié)論,顯著失真;海外著名金融機(jī)構(gòu)在分析中國(guó)頁(yè)游和端游市場(chǎng)就連續(xù)犯這類(lèi)錯(cuò)誤。
  5、忽略前提;有些數(shù)據(jù)結(jié)論是基于某種前提,符合某種特定場(chǎng)景下得出的,但是解讀者有意或無(wú)意忽略前提,將結(jié)論擴(kuò)大化,顯著誤讀。
  6、忽略交互;在商業(yè)模式改造和產(chǎn)品改進(jìn),往往都會(huì)出這類(lèi)問(wèn)題,最簡(jiǎn)單說(shuō),你游戲中的道具降價(jià),對(duì)收入的影響是增還是減?如果忽略交互,僅僅依賴(lài)于數(shù)據(jù)推算,當(dāng)然是減,但是實(shí)際呢?做運(yùn)營(yíng)的都知道。
  7、缺乏常識(shí);如果對(duì)一些重要的紀(jì)念日,節(jié)日,或者網(wǎng)購(gòu)節(jié)不了解,那去處理有關(guān)數(shù)據(jù)顯然就不知所云了。做行業(yè)報(bào)告更是如此,很難想像對(duì)行業(yè)不了解的人能做出怎樣的報(bào)告。
  8、無(wú)視樣本偏差;我們通常做數(shù)據(jù)調(diào)研,是基于樣本數(shù)據(jù),而采樣過(guò)程本身很難做到完全的公平和分散,樣本偏差要控制在合理范疇內(nèi),即便無(wú)法控制,在結(jié)論中也需要標(biāo)注;這才是嚴(yán)謹(jǐn)?shù)臄?shù)據(jù)解讀,對(duì)樣本偏差視而不見(jiàn),甚至為了某種宣傳目的刻意尋找偏差的樣本,都不可能做出好的數(shù)據(jù)結(jié)論。
  那么, 數(shù)據(jù)處理也多說(shuō)一點(diǎn),雖說(shuō)是個(gè)技術(shù)活,但是有些不那么技術(shù)的事情,也必須做到位才行;很多時(shí)候,我看到一個(gè)數(shù)據(jù),不符合我的預(yù)期,我第一反應(yīng),是了解數(shù)據(jù)來(lái)源和處理邏輯,我們通常面對(duì)的數(shù)據(jù),包括大量的干擾,噪音數(shù)據(jù),以及一些識(shí)別上容易產(chǎn)生歧義甚至誤判的數(shù)據(jù),這都是需要處理的,很多時(shí)候工程師只關(guān)心算法層面、效率層面,不愿意也不關(guān)心這些東西,所得出的數(shù)據(jù)結(jié)論失真度就非常高,越是大公司,這種情況越普遍;在我效力的巨頭公司時(shí),這樣的范例非常多,處理方法其實(shí)很簡(jiǎn)單,多看看源數(shù)據(jù),對(duì)中間的噪音和干擾數(shù)據(jù)正確識(shí)別標(biāo)注,對(duì)容易誤判的數(shù)據(jù)進(jìn)行二次判定,全是苦力活,沒(méi)啥技術(shù)含量,但是這是必須的。
  最后,很多人想知道我怎么看數(shù)據(jù),或者想問(wèn)我,他們每天看很多數(shù)據(jù),不知道怎么去看,我其實(shí)有很簡(jiǎn)單的三板斧,一學(xué)就會(huì),一用就靈,對(duì)常見(jiàn)的數(shù)據(jù)場(chǎng)景,可解決絕大部分日常需求。 簡(jiǎn)單說(shuō)就是“對(duì)比,細(xì)分,溯源” 六字真言,沒(méi)了。
  對(duì)比,數(shù)據(jù)放在那里,是沒(méi)意義的,你說(shuō)你游戲周流失率80%,啥情況?不知道,你問(wèn)我我也不知道。對(duì)比起來(lái)才知道。
  一是橫比,你拿出50款游戲來(lái)比,別人平均流失率90%,你80%,你游戲還不錯(cuò)勒,別人要平均流失65%,你80%,這就有問(wèn)題了。
  二是縱比,和自己時(shí)間軸比,你兩個(gè)月前1.0版本流失率90%,你現(xiàn)在80%,有進(jìn)步么,你要是兩個(gè)月前是50%,現(xiàn)在80%,好好反思嘍。
  所以,我特別強(qiáng)調(diào),在通常企業(yè)數(shù)據(jù)監(jiān)控,顯示一大屏數(shù)據(jù)的界面上,對(duì)比特征要最大體現(xiàn),比如所有同比下降超過(guò)多少比例的一概紅色體現(xiàn),所有上升多少比例的一概綠色體現(xiàn),公司運(yùn)營(yíng)狀況一目了然。
  細(xì)分,數(shù)據(jù)出現(xiàn)對(duì)比異常,你當(dāng)然想知道原因,那就需要細(xì)分了。
  細(xì)分先分維度,再分粒度,什么是維度?你按照時(shí)間去分,就是時(shí)間維度,按照地區(qū)去分,就是地區(qū)維度,按照來(lái)路去分,就是來(lái)路維度,按照受訪去分,就是受訪維度;你說(shuō)今天網(wǎng)站訪問(wèn)量漲了5%,咋回事不知道,你細(xì)分一看,大部分網(wǎng)頁(yè)都沒(méi)漲,某個(gè)頻道某個(gè)活動(dòng)頁(yè)漲了300%,這就清楚了,這就是細(xì)分最簡(jiǎn)單的范例,其實(shí)很多領(lǐng)域都通用。 粒度是什么,你時(shí)間維度,是按照天,還是按照小時(shí)?這就是粒度差異,你來(lái)路維度,是來(lái)路的網(wǎng)站,還是來(lái)路的url,這就是粒度的差異;這樣可以將對(duì)比的差異值逐級(jí)鎖定,尋找原因。
  溯源,有時(shí)候我對(duì)比,細(xì)分鎖定到具體維度,具體粒度了,依然沒(méi)有結(jié)論,怎么辦,溯源,依據(jù)鎖定的這個(gè)維度和粒度作為搜索條件,查詢(xún)所涉及的源日志,源記錄,然后基于此分析和反思用戶(hù)的行為,往往會(huì)有驚人的發(fā)現(xiàn),我們正是基于這一邏輯發(fā)現(xiàn)過(guò)產(chǎn)品的一些缺陷,而且你不斷通過(guò)這個(gè)方式分析數(shù)據(jù),對(duì)用戶(hù)行為的理解也會(huì)逐步加深。
  其實(shí),這個(gè)話(huà)題還有很多延伸,比如,如何看一個(gè)年輕人有沒(méi)有數(shù)據(jù)分析潛質(zhì);以及如何培養(yǎng)數(shù)據(jù)分析和產(chǎn)品分析人才,等等,不過(guò),就這樣吧。今天說(shuō)的不少了,我水平有限,吃飯的就這幾招,而且又老又笨,大家都會(huì)了我離下崗也不遠(yuǎn)了,您就湊活看吧。

數(shù)據(jù)分析咨詢(xún)請(qǐng)掃描二維碼

若不方便掃碼,搜微信號(hào):CDAshujufenxi

數(shù)據(jù)分析師資訊
更多

OK
客服在線
立即咨詢(xún)
客服在線
立即咨詢(xún)
') } function initGt() { var handler = function (captchaObj) { captchaObj.appendTo('#captcha'); captchaObj.onReady(function () { $("#wait").hide(); }).onSuccess(function(){ $('.getcheckcode').removeClass('dis'); $('.getcheckcode').trigger('click'); }); window.captchaObj = captchaObj; }; $('#captcha').show(); $.ajax({ url: "/login/gtstart?t=" + (new Date()).getTime(), // 加隨機(jī)數(shù)防止緩存 type: "get", dataType: "json", success: function (data) { $('#text').hide(); $('#wait').show(); // 調(diào)用 initGeetest 進(jìn)行初始化 // 參數(shù)1:配置參數(shù) // 參數(shù)2:回調(diào),回調(diào)的第一個(gè)參數(shù)驗(yàn)證碼對(duì)象,之后可以使用它調(diào)用相應(yīng)的接口 initGeetest({ // 以下 4 個(gè)配置參數(shù)為必須,不能缺少 gt: data.gt, challenge: data.challenge, offline: !data.success, // 表示用戶(hù)后臺(tái)檢測(cè)極驗(yàn)服務(wù)器是否宕機(jī) new_captcha: data.new_captcha, // 用于宕機(jī)時(shí)表示是新驗(yàn)證碼的宕機(jī) product: "float", // 產(chǎn)品形式,包括:float,popup width: "280px", https: true // 更多配置參數(shù)說(shuō)明請(qǐng)參見(jiàn):http://docs.geetest.com/install/client/web-front/ }, handler); } }); } function codeCutdown() { if(_wait == 0){ //倒計(jì)時(shí)完成 $(".getcheckcode").removeClass('dis').html("重新獲取"); }else{ $(".getcheckcode").addClass('dis').html("重新獲取("+_wait+"s)"); _wait--; setTimeout(function () { codeCutdown(); },1000); } } function inputValidate(ele,telInput) { var oInput = ele; var inputVal = oInput.val(); var oType = ele.attr('data-type'); var oEtag = $('#etag').val(); var oErr = oInput.closest('.form_box').next('.err_txt'); var empTxt = '請(qǐng)輸入'+oInput.attr('placeholder')+'!'; var errTxt = '請(qǐng)輸入正確的'+oInput.attr('placeholder')+'!'; var pattern; if(inputVal==""){ if(!telInput){ errFun(oErr,empTxt); } return false; }else { switch (oType){ case 'login_mobile': pattern = /^1[3456789]\d{9}$/; if(inputVal.length==11) { $.ajax({ url: '/login/checkmobile', type: "post", dataType: "json", data: { mobile: inputVal, etag: oEtag, page_ur: window.location.href, page_referer: document.referrer }, success: function (data) { } }); } break; case 'login_yzm': pattern = /^\d{6}$/; break; } if(oType=='login_mobile'){ } if(!!validateFun(pattern,inputVal)){ errFun(oErr,'') if(telInput){ $('.getcheckcode').removeClass('dis'); } }else { if(!telInput) { errFun(oErr, errTxt); }else { $('.getcheckcode').addClass('dis'); } return false; } } return true; } function errFun(obj,msg) { obj.html(msg); if(msg==''){ $('.login_submit').removeClass('dis'); }else { $('.login_submit').addClass('dis'); } } function validateFun(pat,val) { return pat.test(val); }