
文科生決心做數(shù)據(jù)分析師是不是瘋了?
背景:
傳媒類(lèi)專(zhuān)業(yè)畢業(yè),一直做視頻剪輯、編輯方面的工作。沒(méi)什么編碼基礎(chǔ),只在大學(xué)時(shí)期考過(guò)VB。偶然得到一份數(shù)據(jù)分析師的工作,便決心從零做起。
疑惑:
工作近一年,一直在做數(shù)據(jù)整理方面工作,感覺(jué)沒(méi)什么分析提煉的能力提升。自學(xué)了一點(diǎn)SQL查詢語(yǔ)句,統(tǒng)計(jì)學(xué)與概率教程看不懂理論與具體工作有什么關(guān)系。想問(wèn)我這種情況該從哪方面著手自我修煉呢?
回答:
完全有可能。
題主知不知道有個(gè)專(zhuān)業(yè)叫心理學(xué),這是一個(gè)理科專(zhuān)業(yè),但是是文理兼招的。心理學(xué)專(zhuān)業(yè)要學(xué)很多數(shù)據(jù)分析,很多文科生也學(xué)的很好。
首先破除一個(gè)誤解,數(shù)據(jù)分析師最主要的能力不是計(jì)算機(jī)技術(shù),而是數(shù)據(jù)統(tǒng)計(jì)分析能力。其實(shí)小公司里面的數(shù)據(jù)分析師能力要求并不高,周?chē)臄?shù)據(jù)分析師很少有高級(jí)到懂機(jī)器學(xué)習(xí)的。大家說(shuō)的懂Java什么的我覺(jué)得是數(shù)據(jù)挖掘工程師了。數(shù)據(jù)分析和數(shù)據(jù)挖掘需要掌握的技能有什么區(qū)別? – 紀(jì)路的回答須知數(shù)據(jù)分析師到數(shù)據(jù)挖掘工程師之間還差了100個(gè)程序員。下面貼出阿里的“數(shù)據(jù)分析師職位技能樹(shù)分析,進(jìn)阿里什么難度大家懂,所以應(yīng)聘小公司“數(shù)據(jù)分析師崗位的話技能要求可適當(dāng)放低?!薄毙@招聘時(shí)一位應(yīng)聘“數(shù)據(jù)分析師”職位的學(xué)生應(yīng)該具備哪些技能? – 知乎用戶的回答
如果你要入坑數(shù)據(jù)分析師,我建議你從四方面入門(mén): (根據(jù)阿里數(shù)據(jù)分析師試卷)
1.統(tǒng)計(jì)學(xué)
2.SQL
3.spss
4.R語(yǔ)言
統(tǒng)計(jì)學(xué)絕對(duì)是數(shù)據(jù)分析師的核心競(jìng)爭(zhēng)力,是你技能樹(shù)的骨干,你要知道過(guò)去數(shù)據(jù)分析也是直接靠人工計(jì)算的。但是現(xiàn)在數(shù)據(jù)量級(jí)越來(lái)越大,靠手算已經(jīng)不能解決問(wèn)題了。所以我們需要一些工具來(lái)幫助我們處理數(shù)據(jù)。比如spss就是一個(gè)專(zhuān)門(mén)為數(shù)據(jù)分析開(kāi)發(fā)出來(lái)的成品軟件,已經(jīng)非常成熟了。你可能聽(tīng)別人說(shuō)數(shù)據(jù)分析師要會(huì)spss和SAS,其實(shí)呢,他們就相當(dāng)于PPT和Keynote的關(guān)系。工具嘛,會(huì)一門(mén)就行。對(duì)于你這種還沒(méi)入門(mén)的,spss比SAS簡(jiǎn)單,你可以就學(xué)spss不學(xué)SAS。那SQL是干什么的呢,它是數(shù)據(jù)庫(kù)語(yǔ)言,也就是說(shuō)數(shù)據(jù)太多了你要建個(gè)倉(cāng)庫(kù)把它們分門(mén)別類(lèi)的放好,方便查找。R語(yǔ)言呢,是專(zhuān)門(mén)用來(lái)統(tǒng)計(jì)和制圖的一門(mén)編程語(yǔ)言,也是數(shù)據(jù)分析的利器。但是呢,其實(shí)spss已經(jīng)有很多功能了,所以R語(yǔ)言并非必要,只能說(shuō)是個(gè)加分項(xiàng)。
所以只要你統(tǒng)計(jì)學(xué)的好,spss和SQL也會(huì)了,基本上就差不多了。
至于學(xué)習(xí)難度呢,統(tǒng)計(jì)學(xué)選外國(guó)的教程看起來(lái)思路就明晰很多。SQL選對(duì)了書(shū)一點(diǎn)也不難,spss比SAS簡(jiǎn)單好多,就是一個(gè)直接點(diǎn)的軟件,R語(yǔ)言跟你想的不一樣,它也跟一般的編程語(yǔ)言不同。不需要多少編程基礎(chǔ),非常適合作為文科生的你。
話不多說(shuō),直接推薦入門(mén)書(shū)籍:
1.統(tǒng)計(jì)學(xué):國(guó)外的統(tǒng)計(jì)學(xué)書(shū)籍你自己找找,看書(shū)做練習(xí)題。
2.SQL:《head first SQL》強(qiáng)推,超級(jí)簡(jiǎn)單
3.spss……這個(gè)都可以,在網(wǎng)上找找課件
4.R語(yǔ)言:可以從code school上R的入門(mén)教程學(xué)起,書(shū)的話《實(shí)戰(zhàn)R語(yǔ)言》《R for beginners》《R語(yǔ)言核心技術(shù)手冊(cè)》 入門(mén)之后再多分析case,多運(yùn)用。
還有這個(gè)答案,很值得參考如何快速成為數(shù)據(jù)分析師? – 卡牌大師的回答
但是入門(mén)之后,往深里學(xué)的話還是要彌補(bǔ)一下自己的數(shù)學(xué)方面的短板,高數(shù)、現(xiàn)代、離散數(shù)學(xué)(計(jì)算機(jī)數(shù)學(xué))和數(shù)據(jù)結(jié)構(gòu)(計(jì)算機(jī)數(shù)學(xué))等。尤其離散數(shù)字。前期你也許感受不到這個(gè)的重要性??墒呛笃谀銜?huì)越來(lái)越感受到。比如你學(xué)R語(yǔ)言的xx包,那個(gè)包有個(gè)論文,然后你看論文發(fā)現(xiàn)里面講了有向圖,你就會(huì)想這個(gè)有向圖是個(gè)什么鬼。然后你學(xué)了離散數(shù)學(xué)就知道了。數(shù)據(jù)分析師總之是一個(gè)數(shù)學(xué)和計(jì)算機(jī)交匯處的職業(yè),所以計(jì)算機(jī)方面比如網(wǎng)頁(yè)分析等等也需要涉及一些。這些也并沒(méi)有你想象的難。我們科班出身的也就是一門(mén)學(xué)了一學(xué)期而已。
然后關(guān)于如何入門(mén)數(shù)據(jù)分析師和數(shù)據(jù)分析師的要求,推薦你翻一翻上關(guān)于數(shù)據(jù)分析師的答案。多看看,然后制定自己的學(xué)習(xí)計(jì)劃。關(guān)于數(shù)據(jù)分析、挖掘和R語(yǔ)言的公眾號(hào)和資源。還有一些博客、統(tǒng)計(jì)之都等等可以去看看。
最后,要對(duì)自己有信心,有一個(gè)idea就去實(shí)現(xiàn)它。這是完全可能的。多看書(shū),多刷題,刷到一定數(shù)量開(kāi)始嘗試解決實(shí)際問(wèn)題。我有個(gè)文科同學(xué)就做了一個(gè)學(xué)期習(xí)題期末統(tǒng)計(jì)得了我們班最高分 99。現(xiàn)在統(tǒng)計(jì)很厲害。
但是我覺(jué)得你更應(yīng)該考慮的是你的職業(yè)規(guī)劃,你學(xué)數(shù)據(jù)分析到底是準(zhǔn)備現(xiàn)在就靠這個(gè)找工作呢還是把它當(dāng)做未來(lái)的跳板?如果在小公司,數(shù)據(jù)分析師技能要求并不高,你也許學(xué)個(gè)幾個(gè)月就可以去了??墒桥c之對(duì)應(yīng),工資也并不高。你不一定愿意。如果去大公司呢,技能要求高,那需要一定的時(shí)間。
總之,相信自己,文理科本來(lái)就是一個(gè)人為的劃分而已,大家的腦結(jié)構(gòu)并無(wú)顯著差異。加油
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實(shí)戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無(wú)論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫(kù)管理中,“大表” 始終是性能優(yōu)化繞不開(kāi)的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫(kù)表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動(dòng)態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開(kāi)始提取前,需先判斷 TIF 文件的類(lèi)型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價(jià)值的專(zhuān)業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫(kù)表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實(shí)戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫(kù))處理 Excel 數(shù)據(jù)時(shí),“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗(yàn)與 t 檢驗(yàn):差異、適用場(chǎng)景與實(shí)踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計(jì)學(xué)領(lǐng)域,假設(shè)檢驗(yàn)是驗(yàn)證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專(zhuān)業(yè)操盤(pán)手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計(jì)劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計(jì)劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對(duì)象的 text 與 content:區(qū)別、場(chǎng)景與實(shí)踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請(qǐng)求開(kāi)發(fā)時(shí)(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價(jià)值的核心操盤(pán)手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫(kù)表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請(qǐng)求工具對(duì)比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請(qǐng)求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)的科學(xué)計(jì)數(shù)法問(wèn)題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)時(shí)的科學(xué)計(jì)數(shù)法問(wèn)題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價(jià)值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營(yíng)問(wèn)題、提升執(zhí)行效率的核心手段,其價(jià)值 ...
2025-09-12用 SQL 驗(yàn)證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實(shí)戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過(guò)程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計(jì)” 與 “用戶體驗(yàn) ...
2025-09-11塔吉特百貨孕婦營(yíng)銷(xiāo)案例:數(shù)據(jù)驅(qū)動(dòng)下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見(jiàn)頂” 的當(dāng)下,精準(zhǔn)營(yíng)銷(xiāo)成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價(jià)值 在數(shù)據(jù)驅(qū)動(dòng)決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類(lèi)分析:從操作實(shí)踐到業(yè)務(wù)價(jià)值挖掘 在數(shù)據(jù)分析場(chǎng)景中,聚類(lèi)分析作為 “無(wú)監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計(jì)模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價(jià)值導(dǎo)向 統(tǒng)計(jì)模型作為數(shù)據(jù)分析的核心工具,并非簡(jiǎn)單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10