
大數(shù)據(jù)分析實習生應該如何選擇職業(yè)方向
最近逃離學校在某大數(shù)據(jù)公司實習,雖然我不認為大數(shù)據(jù)像現(xiàn)在很多人說的那么邪乎,但是我認為互聯(lián)網(wǎng)時代所帶來的大量數(shù)據(jù)是很有價值的。所以便在這個公司做實習生,已經一個多星期了,都是做一些簡單的搜索,排序,去重的活。excel就完全搞定了。每天需要找的東西毫無技術含量,卻挺耗費時間。不知道這是不是實習的融入期。大三就逃離學校,冒的風險也挺大的。我該學點什么,做點什么準備才能讓未來走的更快。畢業(yè)目標,在北上廣年薪10w+這個目標容易實現(xiàn)么,需要具備什么樣的素質。
那么,大數(shù)據(jù)方向實習生到底該做些什么?
Excel2013目前可以支持104萬行數(shù)據(jù),即使是這樣也遠遠算不上大數(shù)據(jù)。
話說回來,對于一個實習生來說,讓你處理Excel不能說不合理,因為Excel處理是數(shù)據(jù)分析的基礎中的基礎,拉拉數(shù)據(jù)透視表,寫寫vlookup等函數(shù)甚至用vb寫一些自動化,一旦熟悉了對于你的數(shù)據(jù)分析是大有卑益的!還別說,一般公司的數(shù)據(jù)分析師崗位或者說一些市場調研公司還就只是要求會Excel和PPT。
說到薪資,對于北上廣來說10W+是應屆畢業(yè)生的程序員職位的起薪,如果你僅會Excel,去一些靠譜的市場調研公司做數(shù)據(jù)分析,大一點的公司如尼爾森、華通明略這種可以拿到6K左右的薪資,6*13就是8W左右了,如果你想去BAT這種公司里邊做數(shù)據(jù)分析,只會Excel是不夠的,你還需要至少懂點SPSS或者R,當然如果能進去的話10W+是有的。
個人建議的話,最好不要為了錢而去學一樣東西,這樣內在驅動力不會大到讓你走得比別人快,盡快確定一個感興趣的方向,隨著大數(shù)據(jù)概念的興起以及企業(yè)的越加重視,數(shù)據(jù)相關的崗位細分越來越多,每一個細分都足夠你好好鉆研個10年+。
看到評論區(qū)有人問到是否會SPSS就可以進BAT做數(shù)據(jù)分析,答案是肯定的,并不是說進BAT一定要會擼代碼,因為隨著數(shù)據(jù)職位的細分,互聯(lián)網(wǎng)公司需要一些有產品思維并且略有統(tǒng)計背景的人來做數(shù)據(jù)分析,以下貢獻一張圖。
我喜歡根據(jù)職位離業(yè)務端(如產品、運營、銷售等)的遠近以及離技術端(開發(fā)部門)的遠近來描述職位,可以看到,在不同的位置都有數(shù)據(jù)相關的職位
說說市場調研,這種職位是最靠近業(yè)務的,他們的工作主要是調研外部數(shù)據(jù),比如產品目標用戶的情況,競爭對手的情況,整個行業(yè)的情況等,為產品的每一個改版提供數(shù)據(jù)支撐,對于互聯(lián)網(wǎng)公司來說這種職位一般會放在UED(用戶體驗部)或者產品部下面,日常工作比如去各個城市開用戶訪談會,用調研問卷的形式收集用戶數(shù)據(jù),打用戶調研電話,設計訪談問卷等,崗位要求不會涉及到編程,一般的要求就是統(tǒng)計學基礎知識,EXCEL跟PPT,SPSS懂一些更好,BAT及其他中小型互聯(lián)網(wǎng)公司都有崗位招聘。對于這種類型的崗位,建議一開始可以去咨詢公司,市場上有非常多好的咨詢公司可以選擇,比如全球最大的尼爾森、華通明略、易普索、蓋洛普之類,互聯(lián)網(wǎng)行業(yè)的有艾瑞、艾媒、易觀之類,都是不錯的選擇。從職業(yè)發(fā)展道路來講,市場調研除了是各個行業(yè)普適的職位之外(快速消費品行業(yè)對市場調研的需求量很大),在大公司縱向發(fā)展可以做到市場調研總監(jiān),橫向發(fā)展可以去做品牌經理或者互聯(lián)網(wǎng)公司產品策劃類的產品經理。
數(shù)據(jù)分析師,各行各業(yè)都有做數(shù)據(jù)分析的崗位,但估計是最近1,2年在互聯(lián)網(wǎng)公司才有數(shù)據(jù)分析師這個title的職位出現(xiàn),之前一直是產品經理或者運營經理在做數(shù)據(jù)分析的活,之所以細分出來是因為隨著數(shù)據(jù)量越來越大以及數(shù)據(jù)價值的凸顯,做數(shù)據(jù)分析的門檻越來越高,舉個栗子,做數(shù)據(jù)分析你需要取數(shù)據(jù)吧,取數(shù)據(jù)一般需要寫SQL語句從數(shù)據(jù)庫里取,你讓一個產品經理或者運營經理去寫SQL估計有些難度,當然技術出身的除外,另外說到分析,數(shù)據(jù)量大的話Excel總歸不好分析,你得會點能處理大數(shù)據(jù)量的工具如SAS或者R,如果是SAS的EG模塊還可以圖形化操作,如果是R的話就是純編程了,所以我認為數(shù)據(jù)分析崗位有30%在于技術,是因為在數(shù)據(jù)處理層面它需要涉及很多大數(shù)據(jù)量的操作。從業(yè)務端來看,數(shù)據(jù)分析師的價值在于能夠為公司搭建數(shù)據(jù)流,通過數(shù)據(jù)來對產品功能進行反饋,支持日常的業(yè)務部門取數(shù),以及為產品改版提供數(shù)據(jù)支撐,做到這些你需要跟進整個數(shù)據(jù)流從頭到尾的流動過程,源頭端比如產品開發(fā)時候的數(shù)據(jù)埋點,你需要跟產品經理及開發(fā)溝通哪個功能需要上報哪些數(shù)據(jù),有數(shù)據(jù)上報了你需要跟進這些上報的數(shù)據(jù)要錄入哪個數(shù)據(jù)庫的哪張表,數(shù)據(jù)錄入口徑怎么定,數(shù)據(jù)存在數(shù)據(jù)庫了你需要讓這些數(shù)據(jù)產生價值,除了業(yè)務部門跑來跟你要數(shù)據(jù)之外,你需要主動地定一些分析課題,自己取數(shù)自己用工具進行分析,最后寫成PPT呈現(xiàn)給業(yè)務部門并最終影響決策,如果業(yè)務部門的取數(shù)任務多了,你需要思考怎么去將這些重復性的取數(shù)工作形成報表,自動化地呈現(xiàn)數(shù)據(jù),這時你需要去跟后端開發(fā)以及數(shù)據(jù)倉庫的人溝通,并從頭到尾跟進報表的實現(xiàn)。
另外有一種職位叫數(shù)據(jù)產品經理,它跟數(shù)據(jù)分析師的職責有重疊的部分,不同的地方是這個職位關注的點是數(shù)據(jù)分析的產品化。這是普通互聯(lián)網(wǎng)公司數(shù)據(jù)產品經理的日常:
在大的互聯(lián)網(wǎng)公司,產品經理有各種細分的,有偏向功能界面設計的產品經理,這類型的產品經理關注的是產品界面的美觀吸引,他們要會用Axure畫各種界面按鈕,最好有繪畫功底,他們跟數(shù)據(jù)相關的地方在于需要通過數(shù)據(jù)反饋來改進產品界面;有偏向功能實現(xiàn)的產品經理,這類型的產品經理關注的是產品功能實現(xiàn)是否滿足用戶預期,效率是否夠高,實現(xiàn)步驟是否夠短,他們要求最好有技術背景,能了解開發(fā)的各種實現(xiàn)邏輯,他們跟數(shù)據(jù)相關的地方在于需要通過數(shù)據(jù)反饋來提高功能實現(xiàn)的成功率,降低崩潰率以及提高實現(xiàn)速度;前面兩者都是屬于前端的產品經理,而后端的產品經理除了幫助各個部門搭建管理平臺的產品經理外,剩下的就是數(shù)據(jù)產品經理了。
從以上可以看到,產品經理有各種細分,而數(shù)據(jù)產品經理也有他不一樣的要求和關注點。
這是智聯(lián)上某公司數(shù)據(jù)產品經理的職位描述:
職位描述:
1) 負責門戶端、APP端數(shù)據(jù)統(tǒng)計產品開發(fā)及推薦算法迭代等相關工作,獨立負責產品線的日常迭代工作,以數(shù)據(jù)為導向對運營結果負責。
2) 監(jiān)管全部產品核心KPI數(shù)據(jù),可對運營團隊及時輸出價值數(shù)據(jù)。
3) 負責產品上線后的數(shù)據(jù)管理和運營工作,對相關數(shù)據(jù)進行持續(xù)監(jiān)控和分析,并定期對自身產品、整體行業(yè)、競爭對手等進行數(shù)據(jù)分析并評估,不斷優(yōu)化產品,完成產品生命周期管理。
4) 匯報項目核心數(shù)據(jù)指標和項目進度,對產品生命周期內各項指標負責。
5) 負責產品的持續(xù)運營,不斷優(yōu)化、改進、迭代,深度挖掘用戶需求。
從以上描述可以看到該數(shù)據(jù)產品經理職位有三個關注點:一是數(shù)據(jù)統(tǒng)計后臺;二是推薦系統(tǒng);三是對產品數(shù)據(jù)的監(jiān)控和分析。那么延伸出來該職位的要求應該是對數(shù)據(jù)要敏感,了解一定的數(shù)據(jù)挖掘算法,于是一個數(shù)學或統(tǒng)計學的學位會有所助益。
下圖簡單地從背景以及工作中打交道的人來區(qū)分數(shù)據(jù)產品經理和其他產品經理:
終于說到數(shù)據(jù)挖掘工程師了,在數(shù)據(jù)相關職位里,我認為數(shù)據(jù)挖掘和數(shù)據(jù)架構門檻最高,也是最能體現(xiàn)數(shù)據(jù)價值的職位。大部分公司在招聘數(shù)據(jù)挖掘工程師時的門檻都是數(shù)學、統(tǒng)計學或者計算機的碩士以上,為什么本科不行非要碩士?大部分企業(yè)認為,只有4年的本科學習不足以理解數(shù)據(jù)挖掘相關算法的推導以及應用場景,要做好數(shù)據(jù)挖掘,除了堅實的數(shù)學和統(tǒng)計學基礎之外,算法的代碼實現(xiàn)也是很重要的考察地方。數(shù)據(jù)挖掘何以門檻這么高,他對企業(yè)真有那么高的價值么?如果將其應用場景搬出來便知分曉。
某音樂公司A成立多年,一直以界面小清新用戶體驗絕佳著稱,可惜多年來對音樂版權的重視程度不夠,導致用戶因下載不了喜歡的歌曲而頻頻流失。后來公司痛定思痛,決定另辟蹊徑于是重金聘請了一支數(shù)據(jù)挖掘工程師團隊,打造了音樂界最好的推薦系統(tǒng),一下子挽回了大量用戶,現(xiàn)在用戶占有率穩(wěn)居行業(yè)前三。是的,推薦系統(tǒng)可以說是數(shù)據(jù)挖掘最重要的應用場景,最初來源于電商網(wǎng)站的瀏覽了該商品的用戶還瀏覽了什么,購買了該商品的用戶還購買了什么,現(xiàn)在發(fā)展到各種復雜的特征度提取并從各個維度來計算相關性。很多著名的數(shù)據(jù)挖掘算法,如樸素貝葉斯、神經網(wǎng)絡、邏輯回歸等,都需要扎實的統(tǒng)計學基礎以及相關項目經驗才能成熟地應用于業(yè)務實踐。數(shù)據(jù)挖掘是隨著大數(shù)據(jù)技術的發(fā)展而崛起的一門職業(yè),過去由于技術的局限,很多時候只能通過抽樣來選取訓練數(shù)據(jù),導致最后通過算法出來的預測概率只有60%左右,而大數(shù)據(jù)的成熟讓工程師能夠對接近全量的數(shù)據(jù)進行建模,導致最后出來的預測概率能達到80%甚至90%,從而更能體現(xiàn)數(shù)據(jù)挖掘的價值。
從職業(yè)發(fā)展角度來說,BAT是最適合做數(shù)據(jù)挖掘的地方,巨量的數(shù)據(jù),對技術的重視甚至崇拜以及成熟的應用場景讓數(shù)據(jù)挖掘工程師如魚得水。一個碩士畢業(yè)并有1,2年工作經驗的數(shù)據(jù)挖掘工程師在互聯(lián)網(wǎng)行業(yè)能輕易拿到25K往上的月薪。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關鍵? 在循環(huán)神經網(wǎng)絡(RNN)家族中,長短期記憶網(wǎng)絡(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準備指南? ? 在數(shù)據(jù)驅動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認 ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務的價值轉化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預測分析中的應用:從數(shù)據(jù)查詢到趨勢預判? ? 在數(shù)據(jù)驅動決策的時代,預測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結束)并非工作的終點,而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報考到取證的全攻略? 在數(shù)字經濟蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗:捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準 ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應用與實戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗:數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領域中,準確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認證作為國內權威的數(shù)據(jù)分析能力認證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應對策略? 長短期記憶網(wǎng)絡(LSTM)作為循環(huán)神經網(wǎng)絡(RNN)的一種變體,憑借獨特的門控機制,在 ...
2025-07-07統(tǒng)計學方法在市場調研數(shù)據(jù)中的深度應用? 市場調研是企業(yè)洞察市場動態(tài)、了解消費者需求的重要途徑,而統(tǒng)計學方法則是市場調研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉日期:解鎖數(shù)據(jù)處理的關鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準確性的基礎 ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅動力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產要素的今天,數(shù)據(jù)分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03