
關(guān)于數(shù)據(jù)分析那些事,看這一文章就夠了
一:那到底什么是數(shù)據(jù)分析呢?數(shù)據(jù)分析是基于商業(yè)目的,有目的的進行收集、整理、加工和分析數(shù)據(jù),提煉有價信息的一個過程。其過程概括起來主要包括:明確分析目的與框架、數(shù)據(jù)收集、數(shù)據(jù)處理、數(shù)據(jù)分析、數(shù)據(jù)展現(xiàn)和撰寫報告等6個階段。
1、明確分析目的與框架
一個分析項目,你的數(shù)據(jù)對象是誰?商業(yè)目的是什么?要解決什么業(yè)務(wù)問題?數(shù)據(jù)分析師對這些都要了然于心。
基于商業(yè)的理解,整理分析框架和分析思路。例如,減少新客戶的流失、優(yōu)化活動效果、提高客戶響應(yīng)率等等。不同的項目對數(shù)據(jù)的要求,使用的分析手段也是不一樣的。
2、數(shù)據(jù)收集
數(shù)據(jù)收集是按照確定的數(shù)據(jù)分析和框架內(nèi)容,有目的的收集、整合相關(guān)數(shù)據(jù)的一個過程,它是數(shù)據(jù)分析的一個基礎(chǔ)。
3、數(shù)據(jù)處理
數(shù)據(jù)處理是指對收集到的數(shù)據(jù)進行加工、整理,以便開展數(shù)據(jù)分析,它是數(shù)據(jù)分析前必不可少的階段。這個過程是數(shù)據(jù)分析整個過程中最占據(jù)時間的,也在一定程度上取決于數(shù)據(jù)倉庫的搭建和數(shù)據(jù)質(zhì)量的保證。
數(shù)據(jù)處理主要包括數(shù)據(jù)清洗、數(shù)據(jù)轉(zhuǎn)化等處理方法。
4、數(shù)據(jù)分析
數(shù)據(jù)分析是指通過分析手段、方法和技巧對準(zhǔn)備好的數(shù)據(jù)進行探索、分析,從中發(fā)現(xiàn)因果關(guān)系、內(nèi)部聯(lián)系和業(yè)務(wù)規(guī)律,為商業(yè)目提供決策參考。
到了這個階段,要能駕馭數(shù)據(jù)、開展數(shù)據(jù)分析,就要涉及到工具和方法的使用。其一要熟悉常規(guī)數(shù)據(jù)分析方法,最基本的要了解例如方差、回歸、因子、聚類、分類、時間序列等多元和數(shù)據(jù)分析方法的原理、使用范圍、優(yōu)缺點和結(jié)果的解釋;其二是熟悉1+1種數(shù)據(jù)分析工具,Excel是最常見,一般的數(shù)據(jù)分析我們可以通過Excel完成,后而要熟悉一個專業(yè)的分析軟件,如數(shù)據(jù)分析工具SPSS/SAS/R/Matlab等,便于進行一些專業(yè)的統(tǒng)計分析、數(shù)據(jù)建模等。
5、數(shù)據(jù)展現(xiàn)
一般情況下,數(shù)據(jù)分析的結(jié)果都是通過圖、表的方式來呈現(xiàn),俗話說:字不如表,表不如圖。。借助數(shù)據(jù)展現(xiàn)手段,能更直觀的讓數(shù)據(jù)分析師表述想要呈現(xiàn)的信息、觀點和建議。。
常用的圖表包括餅圖、折線圖、柱形圖/條形圖、散點圖、雷達(dá)圖等、金字塔圖、矩陣圖、漏斗圖、帕雷托圖等。
6、撰寫報告
最后階段,就是撰寫數(shù)據(jù)分析報告,這是對整個數(shù)據(jù)分析成果的一個呈現(xiàn)。通過分析報告,把數(shù)據(jù)分析的目的、過程、結(jié)果及方案完整呈現(xiàn)出來,以供商業(yè)目的提供參考。
一份好的數(shù)據(jù)分析報告,首先需要有一個好的分析框架,并且圖文并茂,層次明晰,能夠讓閱讀者一目了然。結(jié)構(gòu)清晰、主次分明可以使閱讀者正確理解報告內(nèi)容;圖文并茂,可以令數(shù)據(jù)更加生動活潑,提高視覺沖擊力,有助于閱讀者更形象、直觀地看清楚問題和結(jié)論,從而產(chǎn)生思考。
另外,數(shù)據(jù)分析報告需要有明確的結(jié)論、建議和解決方案,不僅僅是找出問題,后者是更重要的,否則稱不上好的分析,同時也失去了報告的意義,數(shù)據(jù)的初衷就是為解決一個商業(yè)目的才進行的分析,不能舍本求末。
二:數(shù)據(jù)分析師職業(yè)介紹
做數(shù)據(jù)分析前我們首先要明確分析目的和內(nèi)容,對于數(shù)據(jù)分析師而言,他們的進階需求無外乎是各個企業(yè)對數(shù)據(jù)分析師的職位要求。在前程無憂、中華英才網(wǎng)以及智聯(lián)招聘上,我們隨便搜索下數(shù)據(jù)分析的崗位信息,都能找到大量類似于下面的一些職位要求信息:
別看崗位職責(zé),任職要求這么多,說白了主要就三點要求:1)對相關(guān)業(yè)務(wù)的理解;2)掌握一到二種數(shù)據(jù)分析工具;3)良好的溝通??赡懿煌墓疽驗樾枨蟛煌瑫谝笊嫌悬c小小的不同,而這個不同主要集中在數(shù)據(jù)庫上。了解數(shù)據(jù)分析師的具體需求之前,我們有必要先了解數(shù)據(jù)分析師的職位體系。
數(shù)據(jù)分析師的職位體系
在傳統(tǒng)行業(yè)中,數(shù)據(jù)分析更多存在移動、銀行、超市等行業(yè),在這些行業(yè)中你才會偶爾聽到數(shù)據(jù)分析師這個職位,也許更多是聽到數(shù)據(jù)挖掘工程師、數(shù)據(jù)建模師。在中國也許只在電信的項目中,才會存在真正的意義上的數(shù)據(jù)挖掘。
數(shù)據(jù)行業(yè)從廣義上講可以分為以下幾個職位:
1、數(shù)據(jù)分析師
更注意是對數(shù)據(jù)、數(shù)據(jù)指標(biāo)的解讀,通過對數(shù)據(jù)的分析,來解決商業(yè)問題。主要有以下幾個次層次:
1)業(yè)務(wù)監(jiān)控:診斷當(dāng)前業(yè)務(wù)是否正常?是否存在問題?業(yè)務(wù)發(fā)展是否達(dá)到預(yù)期(KPI)?如果沒有達(dá)到預(yù)期,問主要問題在哪?是什么原因引起的?
2)建立分析體系:這些數(shù)據(jù)分析師已經(jīng)對業(yè)務(wù)有一定的理解,對業(yè)務(wù)也相對比較熟悉,更多幫業(yè)務(wù)方建立一套分析體系,或者更高級是做成數(shù)據(jù)產(chǎn)品。例如:營銷活動。分析師會告訴業(yè)務(wù)方,在活動前你應(yīng)該分析哪些數(shù)據(jù),從而制定恰當(dāng)?shù)臓I銷計劃。在營銷過程中,你應(yīng)該看哪些數(shù)據(jù),從而及時做出營銷活動調(diào)整。在營銷活動,應(yīng)該如何進行活動效果評估。
3)行業(yè)未來發(fā)展的趨勢分析:這應(yīng)該是數(shù)據(jù)分析師最高級別,有的公司叫做戰(zhàn)略分析師/商業(yè)分析師。這個層次的數(shù)據(jù)分析師站的更高,在行業(yè)、宏觀的層面進行業(yè)務(wù)分析,預(yù)測未來行業(yè)的發(fā)展,競爭對手的業(yè)務(wù)構(gòu)成,幫助公司制定戰(zhàn)略發(fā)展計劃,并及時跟蹤、分析市場動態(tài),從而及時對戰(zhàn)略進行不斷優(yōu)化。
主要技能要求:
數(shù)據(jù)庫知識(SQL至少要熟悉)、基本的統(tǒng)計分析知識、EXCEL要相當(dāng)熟悉,對SPSS或SAS有一定的了解,對于與網(wǎng)站相關(guān)的業(yè)務(wù)還可能要求掌握GA等網(wǎng)站分析工具,當(dāng)然PPT也是必備的。
2、數(shù)據(jù)挖掘工程師
更多是通過對海量數(shù)據(jù)進行挖掘,尋找數(shù)據(jù)的存在模式、或者說規(guī)律,從而通過數(shù)據(jù)挖掘來解決具體問題。數(shù)據(jù)挖掘更多是針對某一個具體的問題,是以解決具體問題為導(dǎo)向的。例如:聚類分析,通過對于會員各種人口統(tǒng)計學(xué)、行為數(shù)據(jù)進行分析,對會員進行分類,對不同的類型的會員建立相應(yīng)的profiling,從而更好的理解會員,知道公司會員是到底如何?高、中、低低價值的會員構(gòu)成,既可以后期各種會員的運營提供指導(dǎo),提高活動效率,可以指導(dǎo)公司的營銷,例如廣告的投放策略。以及用于公司各種戰(zhàn)略的制定。
主要技能要求:
1)數(shù)據(jù)庫必須精通。很多時候,你模型的數(shù)據(jù)預(yù)處理,可能完成在數(shù)據(jù)庫里完成,你用到的數(shù)據(jù)庫技巧更高。
2)必須要會成熟的數(shù)據(jù)挖掘工具、數(shù)據(jù)挖掘算法,例如:SPSS/CELEMENTINE、SAS/EM等,當(dāng)然如果你會一、二款開源軟件,并會寫一些程序代碼那是最好的,大公司都喜歡用開源的軟件,例如:R、WEKA。
這個職位與數(shù)據(jù)挖掘工程師還是有本質(zhì)區(qū)別的。數(shù)據(jù)建模師,更多偏向于中、小數(shù)據(jù)量,而且其使用更多更多是統(tǒng)計學(xué)的方法,而數(shù)據(jù)挖掘中的例如:決策樹、神經(jīng)網(wǎng)絡(luò)、SVM等在這里是根據(jù)不會涉及的。
當(dāng)然二者有一個共同之處都是,針對很具體的問題,都是會解決某個具體問題,例如:營銷反應(yīng)率,你就可能歷史的郵箱、短信的反應(yīng)情況,來建模型進行預(yù)測,從而提高郵件反應(yīng)率,或者減少對用戶來說的“垃圾”郵箱,提高用戶體驗。所以從掌握的技能上講,這二者就有很大的區(qū)別,數(shù)據(jù)建模師其實很少會提到算法這個詞,更多說使用什么模型,有感覺嗎?但是從實務(wù)界來看,這二個模型越來越?jīng)]有明確的分工,一般來說都會二個職位的人都會去學(xué)習(xí)對方的知識,所以這二個職位有合并的趨勢,但在未來幾年來,我覺得公司要招人的時候應(yīng)該還是要有區(qū)別的。
新進入數(shù)據(jù)行業(yè)的同學(xué),可以根據(jù)自己的背景背景選擇相應(yīng)的職位,學(xué)數(shù)據(jù)、統(tǒng)計學(xué)的朋友更多可以偏向于建模師,而計算機特別是寫編程出現(xiàn)和同學(xué),可以走數(shù)據(jù)挖掘工程師,也許適應(yīng)性更好,但這不是絕對的。
數(shù)據(jù)分析師的職位級別劃分
不同公司對數(shù)據(jù)分析師的職位劃分騷有不同,在一些中小型企業(yè),沒有成立獨立的數(shù)據(jù)中心前,數(shù)據(jù)分析的相關(guān)職位往往是在譬如市場部、運營部這些部門之下,通常數(shù)據(jù)分析成員在2-4人不等。對于一些大型企業(yè),有獨立的數(shù)據(jù)部門的企業(yè),其數(shù)據(jù)分析團隊人員則是十到百人不等,其職位頭銜有通俗的總監(jiān)、經(jīng)理、主管劃分,也有助理、資深、專家之類的劃分。下面是一張微博上傳的比較火的某集團的數(shù)據(jù)分析師職位級別劃分圖表,大家可根據(jù)自身的情況對號入座。
三:數(shù)據(jù)分析職業(yè)生涯規(guī)劃
按照不同分析方法所能給人帶來的智能程度,可以把分析能力劃分為以下8個等級。
數(shù)據(jù)分析師的級別
1、數(shù)據(jù)跟蹤員:機械拷貝看到的數(shù)據(jù),很少處理數(shù)據(jù)
雖然這個工作的人還不能稱作數(shù)據(jù)分析師,但是往往作這樣工作的人還都自稱是數(shù)據(jù)分析師,這樣的人,只能通過×××系統(tǒng)看到有限的數(shù)據(jù),并且很少去處理數(shù)據(jù),甚至不理解數(shù)據(jù)的由來和含義,只是機械的把自己看到的數(shù)據(jù)拷貝出來,轉(zhuǎn)發(fā)給相應(yīng)的人。這類人發(fā)出來的數(shù)據(jù),是否有意義,怎么解讀,他自己是不知道的,只能期望收到數(shù)據(jù)的人了。
2、數(shù)據(jù)查詢員/處理員:數(shù)據(jù)處理沒問題,缺乏數(shù)據(jù)解讀能力
這些人可以稱為分析師了,他們已經(jīng)對數(shù)據(jù)有一定的理解了,對于大部分?jǐn)?shù)據(jù),他們也知道數(shù)據(jù)的定義,并且可以通過監(jiān)控系統(tǒng)或者原始的數(shù)據(jù),處理得到這些數(shù)據(jù)。統(tǒng)計學(xué)的方法,這批人還是很精通的,統(tǒng)計學(xué)的工具,他們也是用起來得心應(yīng)手,你讓他們做一下因子分析,聚類肯定是沒問題,各類檢驗也是用的爐火純青。他們的不足是:1、如果不告訴他們命題,那么他們就不知道該應(yīng)用什么樣的方法去得到結(jié)論了。2、對于數(shù)據(jù)的處理沒問題,但是卻沒有一個很好的數(shù)據(jù)解讀能力。只能在統(tǒng)計學(xué)的角度上解釋數(shù)據(jù)。
3、數(shù)據(jù)分析師:解讀數(shù)據(jù),定位問題提出答案
數(shù)據(jù)分析師這群人,對于數(shù)據(jù)的處理已經(jīng)不是問題了,他們的重點已經(jīng)轉(zhuǎn)化到怎么樣去解讀數(shù)據(jù)了,同樣的數(shù)據(jù),在不同人的眼中有不一致的內(nèi)容。好的數(shù)據(jù)分析師,是能通過數(shù)據(jù)找到問題,準(zhǔn)確的定位問題,準(zhǔn)確的找到問題產(chǎn)生的原因,為下一步的改進,找到機會點的人。往往科班出身的人,欠缺的不是在處理數(shù)據(jù)上,而是在解讀數(shù)據(jù)上,至于將數(shù)據(jù)和產(chǎn)品結(jié)合到一起,則是其更缺少的能力了。
4、數(shù)據(jù)應(yīng)用師:將數(shù)據(jù)還原到產(chǎn)品中,為產(chǎn)品所用
數(shù)據(jù)應(yīng)用,這個詞很少被提到。但是應(yīng)用數(shù)據(jù)被提的很多,分析了大量的數(shù)據(jù),除了能找到問題以外,還有很多數(shù)據(jù)可以還原到產(chǎn)品中,為產(chǎn)品所用。典型的是在電子商務(wù)的網(wǎng)站中,用戶的購買數(shù)據(jù),查看數(shù)據(jù)和操作的記錄,往往是為其推薦新商品的好起點,而數(shù)據(jù)應(yīng)用師就是要通過自己的分析,給相應(yīng)的產(chǎn)品人員一個應(yīng)該推薦什么產(chǎn)品,購買的可能性會最大的一個結(jié)論。國內(nèi)能做到這個級別的數(shù)據(jù)人員還真是少的可憐,甚至大部分人員連數(shù)據(jù)的視圖都搞不定,而真正意義上的能數(shù)據(jù)應(yīng)用師,可以用數(shù)據(jù)讓一個產(chǎn)品變得更加地簡單高效。
5、數(shù)據(jù)規(guī)劃師:走在產(chǎn)品前面,讓數(shù)據(jù)有新的價值方向
數(shù)據(jù)規(guī)劃師,不能說水平上比數(shù)據(jù)應(yīng)用師高多少,而是另外一個讓數(shù)據(jù)有價值的方向。往往在實際的應(yīng)用中,數(shù)據(jù)都是有其生命周期的,用來分析、應(yīng)用的數(shù)據(jù)也是,這點上,尤其是在互聯(lián)網(wǎng)公司更加明顯,一個版本的更新,可能導(dǎo)致之前的所有數(shù)據(jù)都一定程度的失效。數(shù)據(jù)規(guī)劃師在一個產(chǎn)品設(shè)計之前,就已經(jīng)分析到了,這個產(chǎn)品應(yīng)該記錄什么樣的數(shù)據(jù),這些數(shù)據(jù)能跟蹤什么問題,哪些記錄到的數(shù)據(jù),應(yīng)該可以用到數(shù)據(jù)中去,可以對產(chǎn)品產(chǎn)生什么樣的價值。
四:數(shù)據(jù)分析薪酬情況
數(shù)據(jù)分析相關(guān)職位在企業(yè)當(dāng)中,同級別,相比運營等要高20%左右,這里以BAT整體薪酬情況,為大家作一下參考。
三大互聯(lián)網(wǎng)巨頭公司,百度騰訊跟阿里如何劃分級別?薪資待遇又有多少?除非身居其位,否則很難探知,但是等你到那個位置知道了,卻又不能說,至少不能在公開場合談?wù)摗=酉聛砭蜑榇蠹医颐?,百度、阿里與騰訊內(nèi)部的級別劃分跟薪資待遇。這是一個群眾喜聞樂見卻又諱莫如深的話題。
各個公司頭銜名字都不一樣,級別的數(shù)目也不一樣;有些扁平,有些很多l(xiāng)evel慢慢升;有些薪水范圍嚴(yán)格跟級別掛鉤,有些薪水跟級別沒絕對的關(guān)系。最近剛好整理了一份「互聯(lián)網(wǎng)公司薪酬體系架構(gòu)」內(nèi)部資料,年底了,上年貨,哦不,上部分干貨。
阿里
最近對阿里羨慕嫉妒恨的同學(xué)可不少,知乎上也開起了對阿里的批斗會--2014 年放棄阿里巴巴 offer 的人是否格外多?--個么,就重點先說說阿里吧!
1. 舉個栗子。校招不論,單說社招。想知道阿里內(nèi)部級別和薪資待遇的題主,或許正面臨offer選擇,就像這位糾結(jié)阿里系offer的同學(xué)W:
最近剛通過面試,但基本薪酬也是不升反小降。 級別只有P6+,連P7都沒有,非常郁悶,打算拒絕算了。小本工作9年了,這算不算loser ?
奇了怪了,阿里系的P6和P7的范圍到底是多少?
不過反過來說,阿里系面試還真是有點深度的,通過不易,但拿到這個級別總感覺是否自已混的太一般了。
郁悶。
這樣的糾結(jié)實在太常見了,都是工作好幾年的老程序員了,好不容易動心跳個槽,獵頭開始保證得好好的,怎么拿到offer的薪酬卻不盡如人意?是自己能力不夠,還是被HR/獵頭忽悠?
專心做技術(shù)的大都是心思單純之人,卻最容易吃虧。知己知彼方可百戰(zhàn)不殆,看看對方的級別和待遇,謀定而后動,才能跳得更遠(yuǎn),走得更穩(wěn)。
2. 先看阿里的級別定義:
P序列=技術(shù)崗 M序列=管理崗
阿里的非管理崗分為10級
其中P6、P7、P8需求量最大,也是阿里占比最大的級別
前面栗子中郁悶的W同學(xué)拿到了P6+的offer,正處于最龐大但又最尷尬的級別中段,至于為什么差一點兒沒拿到P7,難道是HR在省招聘費?
3. 再看阿里的級別對應(yīng)薪資:
?阿里薪資結(jié)構(gòu):一般是12+1+3=16薪
?年底的獎金為0-6個月薪資,90%人可拿到3個月
?股票是工作滿2年才能拿,第一次拿50%,4年能全部拿完
說到股票,真是要普及下常識,別被忽悠了。股票是公司用來獎勵員工忠誠度的,所以阿里分年限行權(quán),想要離職套現(xiàn)真的是難。更不要高額的稅收了,首先,歸屬要收高達(dá)45%的個稅,然后得到的還是限制性股票,還不能馬上賣呢。好不容易可以出售的時候,還得交20%股票增值部分的個人所得稅哦!
更重要的是,你必須先繳稅,才能歸屬,繳稅還必須用現(xiàn)金,不能sell to cover!So,拿的越多,先拿出的cash就越多,這里面的流動性風(fēng)險你自己權(quán)衡吧。
百度
再說說級別分層和阿里類似的百度
1. 百度的技術(shù)級別:
百度有4萬人,每年招聘應(yīng)屆生技術(shù)產(chǎn)品人員1000人左右,技術(shù)崗位級別和阿里類似,分為T序列12級,不贅述了,大概阿里的級別減1或2,就是百度的級別。
?主要集中在T5/T6,升T7很困難,T7升T8更困難;T7以上一般就不做coding了
?一般來說,在百度待3年能給到T5,很多人都等不到三年,原因下面說,社招過來的,一般是外面公司的技術(shù)骨干了
?T10是技術(shù)總監(jiān),十個左右;T11是首席科學(xué)家;T12基本沒見過。
2. 再看百度薪資的大概范圍:
?百度薪資結(jié)構(gòu):月薪*14.6(12+0.6+2),其他崗位月薪*14
?T5以上為關(guān)鍵崗位,另外有股票、期權(quán)
?T5、T6占比最大的級別,T8、T9占比最小
?級別越高,每檔之間的寬幅越大
百度是一家業(yè)務(wù)定性,內(nèi)部穩(wěn)定,金字塔形的成熟公司。也就是說,大部分事情都是按部就班、駕輕就熟,所有人都比較輕松、穩(wěn)定、舒服,尤其是對老員工而言。但是對于新員工來說,這意味著成長空間的極度壓縮,機會少,上升慢。
百度工資高,福利好,但是這么多年期權(quán)已經(jīng)基本發(fā)光了,只有總監(jiān)以上才有,幾十股幾百股就算多了。問題就來了,百度新老員工的期權(quán)數(shù)量太懸殊,據(jù)說到百度樓下停車場一看,開卡宴的都是老員工,開捷達(dá)的都是新員工,其實很多新員工的貢獻比老員工大得多,但是收入反而倒掛,于是很多新人等不到3年就跳了。
騰訊
談?wù)勛钅线叺尿v訊
1. 騰訊的技術(shù)級別:
騰訊的分級和阿里/百度都不一樣,分為T1/T2/T3/T4共4級,其中又細(xì)分為3級。
?員工仍然集中在中段,尤其是 T2.3 和 T3.1
?想從T2跨到T3,即從2.3升3.1是非常困難的
2. 了解薪酬和級別的關(guān)系:
? 騰訊標(biāo)準(zhǔn)薪資是14薪,但是通常能拿到16-20薪
? T3.1以上開始另外有股票
值得一提的是,騰訊是有淘汰制考核的。一般一年兩次考核(6月、12月),實行末尾淘汰制,0-10%優(yōu)秀,必須有5%的人轉(zhuǎn)組(轉(zhuǎn)組也可能出現(xiàn)沒人接收的情況)或者被開除,這點比較狠。
升級也跟考核結(jié)果很有關(guān)系,要升一個小等級,必須最近兩次考核得過一次A類考核結(jié)果。升 T3.1是內(nèi)部晉升的第一道檻,要求架構(gòu)在領(lǐng)域內(nèi)優(yōu)秀,被追問攻擊時能無漏洞應(yīng)答出來--據(jù)說只有30%的通過率。同時,騰訊好的一點在于,底層普通員工如果技術(shù)真的不錯,照樣升級,和是不是leader關(guān)系不大。 leader的帶隊價值在T3.3時才顯現(xiàn)出來。
別問我是怎么知道答案的,我不是互聯(lián)網(wǎng)獵頭,我正在做的事就是要用互聯(lián)網(wǎng)產(chǎn)品替代獵頭,因為獵頭不透明、不全面,還死貴。
五:數(shù)據(jù)分析的基本素質(zhì)
一名合格的數(shù)據(jù)分析師需要具備的五大基本能力和素質(zhì)。
1、態(tài)度嚴(yán)謹(jǐn)負(fù)責(zé)
嚴(yán)謹(jǐn)負(fù)責(zé)是數(shù)據(jù)分析師的必備素質(zhì)之一,只有本著嚴(yán)謹(jǐn)負(fù)責(zé)的態(tài)度,才能保證數(shù)據(jù)的客觀、準(zhǔn)確。在企業(yè)里,數(shù)據(jù)分析師可以說是企業(yè)的醫(yī)生,他們通過對企業(yè)運營數(shù)據(jù)的分析,為企業(yè)尋找癥結(jié)及問題。一名合格的數(shù)據(jù)分析師,應(yīng)具有嚴(yán)謹(jǐn)、負(fù)責(zé)的態(tài)度,保持中立立場,客觀評價企業(yè)發(fā)展過程中存在的問題,為決策層提供有效的參考依據(jù);不應(yīng)受其他因素影響而更改數(shù)據(jù),隱瞞企業(yè)存在的問題,這樣做對企業(yè)發(fā)展是非常不利的,甚至?xí)斐蓢?yán)重的后果。而且,對數(shù)據(jù)分析師自身來說,也是前途盡毀,從此以后所做的數(shù)據(jù)分析結(jié)果都將受到質(zhì)疑,因為你已經(jīng)不再是可信賴的人,在同事、領(lǐng)導(dǎo)、客戶面前已經(jīng)失去了信任。所以,作為一名數(shù)據(jù)分析師就必須持有嚴(yán)謹(jǐn)負(fù)責(zé)的態(tài)度,這也是最基本的職業(yè)道德。
2、好奇心強烈
好奇心人皆有之,但是作為數(shù)據(jù)分析師,這份好奇心就應(yīng)該更強烈,要積極主動地發(fā)現(xiàn)和挖掘隱藏在數(shù)據(jù)內(nèi)部的真相。在數(shù)據(jù)分析師的腦子里,應(yīng)該充滿著無數(shù)個“為什么”,為什么是這樣的結(jié)果,為什么不是那樣的結(jié)果,導(dǎo)致這個結(jié)果的原因是什么,為什么結(jié)果不是預(yù)期的那樣等等。這一系列問題都要在進行數(shù)據(jù)分析時提出來,并且通過數(shù)據(jù)分析,給自己一個滿意的答案。越是優(yōu)秀的數(shù)據(jù)分析師,好奇心也越不容易滿足,回答了一個問題,又會拋出一個新的問題,繼續(xù)研究下去。只有擁有了這樣一種刨根問底的精神,才會對數(shù)據(jù)和結(jié)論保持敏感,繼而順藤摸瓜,找出數(shù)據(jù)背后的真相。
3、邏輯思維清晰
除了一顆探索真相的好奇心,數(shù)據(jù)分析師還需要具備縝密的思維和清晰的邏輯推理能力。我記得有位大師說過:結(jié)構(gòu)為王。何謂結(jié)構(gòu),結(jié)構(gòu)就是我們常說的邏輯,不論說話還是寫文章,都要有條理,有目的,不可眉毛胡子一把抓,不分主次。
通常從事數(shù)據(jù)分析時所面對的商業(yè)問題都是較為復(fù)雜的,我們要考慮錯綜復(fù)雜的成因,分析所面對的各種復(fù)雜的環(huán)境因素,并在若干發(fā)展可能性中選擇一個最優(yōu)的方向。這就需要我們對事實有足夠的了解,同時也需要我們能真正理清問題的整體以及局部的結(jié)構(gòu),在深度思考后,理清結(jié)構(gòu)中相互的邏輯關(guān)系,只有這樣才能真正客觀地、科學(xué)地找到商業(yè)問題的答案。
4、擅長模仿
在做數(shù)據(jù)分析時,有自己的想法固然重要,但是“前車之鑒”也是非常有必要學(xué)習(xí)的,它能幫助數(shù)據(jù)分析師迅速地成長,因此,模仿是快速提高學(xué)習(xí)成果的有效方法。這里說的模仿主要是參考他人優(yōu)秀的分析思路和方法,而并不是說直接“照搬”。成功的模仿需要領(lǐng)會他人方法精髓,理解其分析原理,透過表面達(dá)到實質(zhì)。萬變不離其宗,要善于將這些精華轉(zhuǎn)化為自己的知識,否則,只能是“一直在模仿,從未超越過”。
5、勇于創(chuàng)新
通過模仿可以借鑒他人的成功經(jīng)驗,但模仿的時間不宜太長,并且建議每次模仿后都要進行總結(jié),提出可以改進的地方,甚至要有所創(chuàng)新。創(chuàng)新是一個優(yōu)秀數(shù)據(jù)分析師應(yīng)具備的精神,只有不斷的創(chuàng)新,才能提高自己的分析水平,使自己站在更高的角度來分析問題,為整個研究領(lǐng)域乃至社會帶來更多的價值。現(xiàn)在的分析方法和研究課題千變?nèi)f化,墨守成規(guī)是無法很好地解決所面臨的新問題的。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動態(tài)隨機一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計學(xué)領(lǐng)域,假設(shè)檢驗是驗證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進行 HTTP 網(wǎng)絡(luò)請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數(shù)據(jù)的科學(xué)計數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點數(shù)據(jù)時的科學(xué)計數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當(dāng)下,精準(zhǔn)營銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價值 在數(shù)據(jù)驅(qū)動決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實踐到業(yè)務(wù)價值挖掘 在數(shù)據(jù)分析場景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價值導(dǎo)向 統(tǒng)計模型作為數(shù)據(jù)分析的核心工具,并非簡單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10