
作者Zulie Rane,自由撰稿人和編碼愛(ài)好者。
數(shù)據(jù)分析是一個(gè)非常酷的、有前途的行業(yè)。它一直在上升很長(zhǎng)一段時(shí)間,這解釋了為什么這么多人想知道如何進(jìn)入數(shù)據(jù)分析。自從互聯(lián)網(wǎng)和智能手機(jī)的廣泛使用,瘋狂的數(shù)據(jù)量無(wú)時(shí)無(wú)刻不在產(chǎn)生。2020年初,世界上的數(shù)據(jù)量估計(jì)為44zettabytes,或44x10^21字節(jié)。所有這些數(shù)據(jù)包含大量非常有用的信息,如消費(fèi)者的購(gòu)買模式或疾病指標(biāo)。
數(shù)據(jù)分析員掌握數(shù)據(jù)集,并負(fù)責(zé)理解它們。這些數(shù)字說(shuō)明了什么,公司應(yīng)該怎么做?一個(gè)簡(jiǎn)單的例子是,當(dāng)你把一件商品放在購(gòu)物車?yán)?,包含顧客?jīng)常一起購(gòu)買的產(chǎn)品時(shí),就會(huì)出現(xiàn)產(chǎn)品的橫幅。數(shù)據(jù)分析員可以負(fù)責(zé)確定哪些產(chǎn)品應(yīng)該相互關(guān)聯(lián),以提高轉(zhuǎn)化率。
數(shù)據(jù)分析是分析原始數(shù)據(jù)以發(fā)現(xiàn)趨勢(shì)并回答問(wèn)題的過(guò)程。它涉及到很多在屏幕前的個(gè)人工作,但如果你喜歡數(shù)學(xué)和編程,這對(duì)你來(lái)說(shuō)是一個(gè)很好的機(jī)會(huì)。您可以獲取和收集數(shù)據(jù),以及清理、組織、可視化和分析數(shù)據(jù)。
簡(jiǎn)單說(shuō)明一下:數(shù)據(jù)科學(xué)家負(fù)責(zé)為數(shù)據(jù)設(shè)計(jì)和構(gòu)建新的模型。他們創(chuàng)造原型,算法,預(yù)測(cè)模型。數(shù)據(jù)分析師做的是顧名思義的事情--她查看數(shù)據(jù),試圖預(yù)測(cè)趨勢(shì),進(jìn)行可視化,并傳達(dá)結(jié)果。換句話說(shuō),數(shù)據(jù)分析師分析數(shù)據(jù)。在美國(guó),數(shù)據(jù)科學(xué)家的年薪比數(shù)據(jù)分析師高出3-4萬(wàn)美元,所以這是一個(gè)重要的區(qū)別。
這就是本文將如何引導(dǎo)您完成獲得第一份數(shù)據(jù)分析工作所需了解的一切。
在您開(kāi)始考慮如何進(jìn)入數(shù)據(jù)分析之前,您應(yīng)該確保您了解該領(lǐng)域。數(shù)據(jù)分析是從大量數(shù)據(jù)中找出意義的藝術(shù)。據(jù)toDOMO稱,自2020年以來(lái),地球上每秒為每個(gè)人創(chuàng)造1.7MB的數(shù)據(jù)。數(shù)據(jù)分析師的任務(wù)是找到與他們的業(yè)務(wù)應(yīng)用程序相關(guān)的數(shù)據(jù),理解這些數(shù)據(jù),并找到應(yīng)用這些知識(shí)來(lái)改進(jìn)業(yè)務(wù)的方法。
數(shù)據(jù)分析中有許多子字段。這些包括描述性、診斷性、預(yù)測(cè)性和規(guī)定性分析。您可以通過(guò)以下方式來(lái)考慮這些不同類型的分析。
數(shù)據(jù)分析師可以在日常工作中很好地涵蓋所有這些子領(lǐng)域。通常,數(shù)據(jù)分析人員將逐步完成所有這些形式的分析,以最大限度地利用數(shù)據(jù)集并優(yōu)化其業(yè)務(wù)影響。如果您想進(jìn)入數(shù)據(jù)分析,了解這些不同形式的分析和應(yīng)用它們的訣竅是很重要的。
數(shù)據(jù)分析師的任務(wù)是幫助企業(yè)做出數(shù)據(jù)驅(qū)動(dòng)的決策。由于收集數(shù)據(jù)很簡(jiǎn)單,數(shù)據(jù)分析師可以測(cè)試他們的假設(shè),并糾正他們所做的說(shuō)明性模型,以提高他們的性能,并調(diào)整從他們的數(shù)據(jù)洞察中創(chuàng)建的操作項(xiàng)。根據(jù)數(shù)據(jù)做出假設(shè),實(shí)現(xiàn)你的預(yù)測(cè),并分析結(jié)果是進(jìn)入數(shù)據(jù)分析的方法。
鑒于數(shù)據(jù)分析是數(shù)學(xué)和編程的交叉,它是一個(gè)非常技術(shù)性的領(lǐng)域。你必須使用許多不同的工具和技術(shù)技巧來(lái)完成這項(xiàng)工作。軟件工程師瑪格麗塔·哈馬赫(Margarita Hamacher)為數(shù)據(jù)分析師整理了一份7種技術(shù)技能的綜合列表。數(shù)據(jù)分析不僅僅是硬技能。但對(duì)于任何想知道如何進(jìn)入數(shù)據(jù)分析的人來(lái)說(shuō),這些技術(shù)技能將是一個(gè)很好的起點(diǎn)。
這些技能包括數(shù)學(xué)、數(shù)據(jù)可視化、機(jī)器學(xué)習(xí)、編碼等。數(shù)學(xué)需求可以進(jìn)一步分解為線性代數(shù)、統(tǒng)計(jì)學(xué)和概率,這些都是數(shù)據(jù)分析師真正重要的理論基礎(chǔ)。值得強(qiáng)調(diào)的是如何將數(shù)據(jù)分離用于訓(xùn)練和測(cè)試的重要性,并列舉基本的機(jī)器學(xué)習(xí)算法,如果不是實(shí)現(xiàn)的話,您應(yīng)該放心使用。
如果您想知道如何進(jìn)入數(shù)據(jù)分析,那么掌握所有這些技能是很重要的,因?yàn)槟枰恳环N技能來(lái)正確地理解數(shù)據(jù)并準(zhǔn)確地分析數(shù)據(jù)。此外,這些技巧中的很多對(duì)于面試問(wèn)題來(lái)說(shuō)都是絕對(duì)公平的游戲。
我肯定會(huì)創(chuàng)建一些使用這些技能的個(gè)人項(xiàng)目,并在你的簡(jiǎn)歷中鏈接到它們。如果你遇到下面這樣的問(wèn)題:
如果您已經(jīng)通過(guò)項(xiàng)目中的實(shí)際數(shù)據(jù)解決了同樣的問(wèn)題,您的答案將更加令人信服和知情。您可以討論這些相關(guān)特性對(duì)項(xiàng)目中使用的數(shù)據(jù)集分析的影響。
數(shù)據(jù)分析是一個(gè)真正迷人的領(lǐng)域。例如,大多數(shù)經(jīng)典經(jīng)濟(jì)學(xué)理論都是基于人類個(gè)體做出理性決策的假設(shè)。這種假設(shè)是錯(cuò)誤的,因此使許多經(jīng)典的經(jīng)濟(jì)理論完全過(guò)時(shí)。例如,一個(gè)古老的經(jīng)濟(jì)學(xué)理論認(rèn)為消費(fèi)者喜歡選擇,雖然在某些情況下這是正確的,但做出決定可能會(huì)讓人筋疲力盡,馬克·萊珀和辛·艾揚(yáng)格發(fā)現(xiàn)了選擇的悖論。他們發(fā)現(xiàn),如果顧客有6種選擇,而不是24種,他們更有可能購(gòu)買果醬。然而,基于數(shù)據(jù)的經(jīng)濟(jì)理論要準(zhǔn)確得多。數(shù)據(jù)分析仍然需要時(shí)不時(shí)的一些小假設(shè),但由于它完全基于所收集的數(shù)據(jù),如果您的數(shù)據(jù)是全面的和有代表性的,數(shù)據(jù)分析提供了一種優(yōu)雅而準(zhǔn)確的方法來(lái)理解世界以及在其中做出的決定或習(xí)慣。
數(shù)據(jù)分析是一個(gè)跳躍的領(lǐng)域。美國(guó)勞工統(tǒng)計(jì)局預(yù)測(cè),到2026年,數(shù)據(jù)科學(xué)領(lǐng)域?qū)⒃鲩L(zhǎng)28%。如果你在找錢,美國(guó)數(shù)據(jù)分析師的平均工資是70000美元,而且隨著對(duì)數(shù)據(jù)分析師需求的增加,這一數(shù)字可能會(huì)上升。這是進(jìn)入數(shù)據(jù)分析的好時(shí)機(jī),您可以采取一些簡(jiǎn)單的步驟來(lái)進(jìn)行分析。
數(shù)據(jù)分析是一個(gè)非常技術(shù)性的領(lǐng)域,所以任何想知道如何進(jìn)入數(shù)據(jù)分析的人都需要對(duì)大量高級(jí)數(shù)學(xué)概念有很強(qiáng)的理解,而且你應(yīng)該是一個(gè)稱職的程序員。如果你對(duì)數(shù)字和它們能向你揭示的東西有熱情,一旦你確保你能掌握上面概述的技術(shù)來(lái)滿足工作要求,數(shù)據(jù)分析就是你的工作。
數(shù)據(jù)分析師工作中的一個(gè)重要因素是您需要的上下文業(yè)務(wù)知識(shí),這是許多人沒(méi)有考慮的。如果您是一名處理樹(shù)生長(zhǎng)數(shù)據(jù)的數(shù)據(jù)分析師,而數(shù)據(jù)集中缺少某些值,則需要對(duì)樹(shù)及其生長(zhǎng)方式有足夠的了解,以確定是否可以拋出這些數(shù)據(jù),或者補(bǔ)充這些數(shù)據(jù)的最佳方式是什么。您還需要能夠理解數(shù)據(jù)集的特性意味著什么。如果您有兩個(gè)特性,就其含義而言非常相似,那么您可能想扔掉其中一個(gè)。通過(guò)使用上下文知識(shí)評(píng)估特征之間的依賴關(guān)系以及哪些特征與手頭的問(wèn)題最相關(guān),您可以省去對(duì)特征依賴關(guān)系進(jìn)行深入分析的麻煩。
想想你的激情或你現(xiàn)有知識(shí)的領(lǐng)域是什么,以及你如何將數(shù)據(jù)分析應(yīng)用到這些領(lǐng)域。許多從事數(shù)據(jù)分析的人沒(méi)有數(shù)據(jù)分析的正式背景或?qū)W位,所以你可以成為一名數(shù)據(jù)分析師,處理你所研究的領(lǐng)域的數(shù)據(jù)。
如何進(jìn)入數(shù)據(jù)分析的很大一部分是粉碎你的數(shù)據(jù)分析師職位的面試。除了精通Python并能夠解釋中心極限定理之外,您還可以逐步了解如何比較不同后端引擎的性能以自動(dòng)生成建議??纯聪旅娴拿嬖噯?wèn)題:
準(zhǔn)備技術(shù)面試的最佳方法?;卮鸺夹g(shù)問(wèn)題是一項(xiàng)技能,就像其他任何技能一樣。不斷練習(xí)編碼和非編碼問(wèn)題。您可以使用StrataScratch這樣的網(wǎng)站,它為數(shù)據(jù)分析師提供了大量的編碼和非編碼面試問(wèn)題。
除了回答編碼問(wèn)題,比如找出每個(gè)用戶在Facebook上的受歡迎程度百分比,以及技術(shù)、理論和非編碼問(wèn)題,比如解釋時(shí)間序列預(yù)測(cè)的不同技術(shù),你還需要為行為面試問(wèn)題提供與數(shù)據(jù)分析師相關(guān)的內(nèi)容。雖然你的大多數(shù)面試都是技術(shù)性面試,有編碼或非編碼問(wèn)題,但重要的是你要有一段時(shí)間你經(jīng)歷過(guò)失敗或你特別自豪的成就的例子,這些例子與數(shù)據(jù)分析有關(guān)。
這就是為什么與數(shù)據(jù)分析有關(guān)的個(gè)人項(xiàng)目如此重要。也許你有拯救動(dòng)物的熱情。你可以創(chuàng)建一個(gè)模型,預(yù)測(cè)什么策略最有效地讓動(dòng)物被收養(yǎng)。如果你有機(jī)會(huì)應(yīng)用你的模型,就更好了,比如如果你有一個(gè)動(dòng)物收容所來(lái)遵循你推薦的策略,看看這是否會(huì)對(duì)收養(yǎng)率產(chǎn)生影響。數(shù)據(jù)分析可以應(yīng)用于任何有數(shù)據(jù)的領(lǐng)域。一定會(huì)有一個(gè)數(shù)據(jù)集與您感興趣的主題相關(guān)。在這方面練習(xí)你作為數(shù)據(jù)分析師的技能,這樣你就可以為你的面試官突出這些技能。
許多可能擔(dān)心如何進(jìn)入數(shù)據(jù)分析的程序員和非程序員應(yīng)該知道,正規(guī)教育,特別是數(shù)據(jù)分析,是不需要的。并不是很多大學(xué)都有完整的數(shù)據(jù)科學(xué)或數(shù)據(jù)分析學(xué)位課程。盡管越來(lái)越多的大學(xué)增加了數(shù)據(jù)分析項(xiàng)目,但對(duì)數(shù)據(jù)分析師的需求仍然太高,雇主不需要正式的數(shù)據(jù)分析或數(shù)據(jù)科學(xué)背景。如果你有數(shù)學(xué)或計(jì)算機(jī)科學(xué)的背景,這可能會(huì)很有幫助,但不是必需的。
要獲得一份入門級(jí)數(shù)據(jù)分析師的工作,最好的辦法是精通Python并對(duì)SQL以及SAS、R、Tableau或其他數(shù)據(jù)庫(kù)接口工具和語(yǔ)言非常有信心。如果你沒(méi)有C.S.的背景?;蛘邤?shù)學(xué),在一旁發(fā)展這些技能,并將它們應(yīng)用到展示你能力的個(gè)人項(xiàng)目中。
由于上下文知識(shí)如此重要,數(shù)據(jù)分析是從另一個(gè)行業(yè)進(jìn)入的一個(gè)很好的領(lǐng)域。根據(jù)您所分析的數(shù)據(jù)的行業(yè),無(wú)論是醫(yī)學(xué)圖像還是在線零售行業(yè)中中小企業(yè)的購(gòu)買模式,對(duì)您所分析的數(shù)據(jù)的行業(yè)有重要的了解可能是有幫助的,有時(shí)也是必要的。
在美國(guó),數(shù)據(jù)分析師的平均工資是70.7萬(wàn)美元,但對(duì)于那些職業(yè)生涯后期的人來(lái)說(shuō),工資可以高達(dá)10.6萬(wàn)美元。我們的帖子數(shù)據(jù)科學(xué)家賺多少錢可以幫助你了解數(shù)據(jù)分析方面的工資,以及他們是如何受到各種因素的影響的。
數(shù)據(jù)分析師的常見(jiàn)工作職責(zé)包括收集和組織數(shù)據(jù)、確保符合數(shù)據(jù)政策、執(zhí)行質(zhì)量控制功能以確保數(shù)據(jù)的完整性、利潤(rùn)優(yōu)化建議或制定價(jià)格和組合折扣計(jì)劃。確切的職責(zé)在不同的公司之間可能會(huì)有很大的差異,所以檢查確切的工作描述,找到與你最喜歡的任務(wù)相匹配的工作描述。
數(shù)據(jù)分析是一個(gè)廣闊的領(lǐng)域。對(duì)數(shù)據(jù)分析師的需求迅速增長(zhǎng),這意味著你將享受相對(duì)較高水平的工作保障。由于這個(gè)行業(yè)還很年輕,所以有很大的職業(yè)發(fā)展?jié)摿?。所需的技能多種多樣,所以絕對(duì)不是為那些已經(jīng)完成學(xué)習(xí)的人準(zhǔn)備的。由于該行業(yè)發(fā)展如此迅速,在未來(lái)幾年中,在使用的工具和新的應(yīng)用程序方面肯定會(huì)有很多變化。
如果你想進(jìn)入技術(shù)和編程領(lǐng)域,但又不想回到學(xué)?;虺蔀檐浖こ處?,數(shù)據(jù)分析對(duì)你來(lái)說(shuō)是一個(gè)很好的選擇。數(shù)據(jù)分析員仍然可以處理代碼,但你可以少處理隨叫隨到或處理開(kāi)發(fā)人員的頭痛問(wèn)題。數(shù)據(jù)分析的應(yīng)用通常是迷人的,通過(guò)指導(dǎo)企業(yè)做出數(shù)據(jù)驅(qū)動(dòng)的決策,您可以對(duì)企業(yè)的成功產(chǎn)生很大的影響。
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實(shí)戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無(wú)論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫(kù)管理中,“大表” 始終是性能優(yōu)化繞不開(kāi)的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫(kù)表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動(dòng)態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開(kāi)始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價(jià)值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫(kù)表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實(shí)戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫(kù))處理 Excel 數(shù)據(jù)時(shí),“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗(yàn)與 t 檢驗(yàn):差異、適用場(chǎng)景與實(shí)踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計(jì)學(xué)領(lǐng)域,假設(shè)檢驗(yàn)是驗(yàn)證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計(jì)劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計(jì)劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對(duì)象的 text 與 content:區(qū)別、場(chǎng)景與實(shí)踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請(qǐng)求開(kāi)發(fā)時(shí)(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價(jià)值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫(kù)表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請(qǐng)求工具對(duì)比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請(qǐng)求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)的科學(xué)計(jì)數(shù)法問(wèn)題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)時(shí)的科學(xué)計(jì)數(shù)法問(wèn)題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價(jià)值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營(yíng)問(wèn)題、提升執(zhí)行效率的核心手段,其價(jià)值 ...
2025-09-12用 SQL 驗(yàn)證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實(shí)戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過(guò)程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計(jì)” 與 “用戶體驗(yàn) ...
2025-09-11塔吉特百貨孕婦營(yíng)銷案例:數(shù)據(jù)驅(qū)動(dòng)下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見(jiàn)頂” 的當(dāng)下,精準(zhǔn)營(yíng)銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價(jià)值 在數(shù)據(jù)驅(qū)動(dòng)決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實(shí)踐到業(yè)務(wù)價(jià)值挖掘 在數(shù)據(jù)分析場(chǎng)景中,聚類分析作為 “無(wú)監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計(jì)模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價(jià)值導(dǎo)向 統(tǒng)計(jì)模型作為數(shù)據(jù)分析的核心工具,并非簡(jiǎn)單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10