
作者Zulie Rane,自由撰稿人和編碼愛(ài)好者。
數(shù)據(jù)分析是一個(gè)非??岬摹⒂星巴镜男袠I(yè)。它一直在上升很長(zhǎng)一段時(shí)間,這解釋了為什么這么多人想知道如何進(jìn)入數(shù)據(jù)分析。自從互聯(lián)網(wǎng)和智能手機(jī)的廣泛使用,瘋狂的數(shù)據(jù)量無(wú)時(shí)無(wú)刻不在產(chǎn)生。2020年初,世界上的數(shù)據(jù)量估計(jì)為44zettabytes,或44x10^21字節(jié)。所有這些數(shù)據(jù)包含大量非常有用的信息,如消費(fèi)者的購(gòu)買模式或疾病指標(biāo)。
數(shù)據(jù)分析員掌握數(shù)據(jù)集,并負(fù)責(zé)理解它們。這些數(shù)字說(shuō)明了什么,公司應(yīng)該怎么做?一個(gè)簡(jiǎn)單的例子是,當(dāng)你把一件商品放在購(gòu)物車?yán)?,包含顧客?jīng)常一起購(gòu)買的產(chǎn)品時(shí),就會(huì)出現(xiàn)產(chǎn)品的橫幅。數(shù)據(jù)分析員可以負(fù)責(zé)確定哪些產(chǎn)品應(yīng)該相互關(guān)聯(lián),以提高轉(zhuǎn)化率。
數(shù)據(jù)分析是分析原始數(shù)據(jù)以發(fā)現(xiàn)趨勢(shì)并回答問(wèn)題的過(guò)程。它涉及到很多在屏幕前的個(gè)人工作,但如果你喜歡數(shù)學(xué)和編程,這對(duì)你來(lái)說(shuō)是一個(gè)很好的機(jī)會(huì)。您可以獲取和收集數(shù)據(jù),以及清理、組織、可視化和分析數(shù)據(jù)。
簡(jiǎn)單說(shuō)明一下:數(shù)據(jù)科學(xué)家負(fù)責(zé)為數(shù)據(jù)設(shè)計(jì)和構(gòu)建新的模型。他們創(chuàng)造原型,算法,預(yù)測(cè)模型。數(shù)據(jù)分析師做的是顧名思義的事情--她查看數(shù)據(jù),試圖預(yù)測(cè)趨勢(shì),進(jìn)行可視化,并傳達(dá)結(jié)果。換句話說(shuō),數(shù)據(jù)分析師分析數(shù)據(jù)。在美國(guó),數(shù)據(jù)科學(xué)家的年薪比數(shù)據(jù)分析師高出3-4萬(wàn)美元,所以這是一個(gè)重要的區(qū)別。
這就是本文將如何引導(dǎo)您完成獲得第一份數(shù)據(jù)分析工作所需了解的一切。
在您開(kāi)始考慮如何進(jìn)入數(shù)據(jù)分析之前,您應(yīng)該確保您了解該領(lǐng)域。數(shù)據(jù)分析是從大量數(shù)據(jù)中找出意義的藝術(shù)。據(jù)toDOMO稱,自2020年以來(lái),地球上每秒為每個(gè)人創(chuàng)造1.7MB的數(shù)據(jù)。數(shù)據(jù)分析師的任務(wù)是找到與他們的業(yè)務(wù)應(yīng)用程序相關(guān)的數(shù)據(jù),理解這些數(shù)據(jù),并找到應(yīng)用這些知識(shí)來(lái)改進(jìn)業(yè)務(wù)的方法。
數(shù)據(jù)分析中有許多子字段。這些包括描述性、診斷性、預(yù)測(cè)性和規(guī)定性分析。您可以通過(guò)以下方式來(lái)考慮這些不同類型的分析。
數(shù)據(jù)分析師可以在日常工作中很好地涵蓋所有這些子領(lǐng)域。通常,數(shù)據(jù)分析人員將逐步完成所有這些形式的分析,以最大限度地利用數(shù)據(jù)集并優(yōu)化其業(yè)務(wù)影響。如果您想進(jìn)入數(shù)據(jù)分析,了解這些不同形式的分析和應(yīng)用它們的訣竅是很重要的。
數(shù)據(jù)分析師的任務(wù)是幫助企業(yè)做出數(shù)據(jù)驅(qū)動(dòng)的決策。由于收集數(shù)據(jù)很簡(jiǎn)單,數(shù)據(jù)分析師可以測(cè)試他們的假設(shè),并糾正他們所做的說(shuō)明性模型,以提高他們的性能,并調(diào)整從他們的數(shù)據(jù)洞察中創(chuàng)建的操作項(xiàng)。根據(jù)數(shù)據(jù)做出假設(shè),實(shí)現(xiàn)你的預(yù)測(cè),并分析結(jié)果是進(jìn)入數(shù)據(jù)分析的方法。
鑒于數(shù)據(jù)分析是數(shù)學(xué)和編程的交叉,它是一個(gè)非常技術(shù)性的領(lǐng)域。你必須使用許多不同的工具和技術(shù)技巧來(lái)完成這項(xiàng)工作。軟件工程師瑪格麗塔·哈馬赫(Margarita Hamacher)為數(shù)據(jù)分析師整理了一份7種技術(shù)技能的綜合列表。數(shù)據(jù)分析不僅僅是硬技能。但對(duì)于任何想知道如何進(jìn)入數(shù)據(jù)分析的人來(lái)說(shuō),這些技術(shù)技能將是一個(gè)很好的起點(diǎn)。
這些技能包括數(shù)學(xué)、數(shù)據(jù)可視化、機(jī)器學(xué)習(xí)、編碼等。數(shù)學(xué)需求可以進(jìn)一步分解為線性代數(shù)、統(tǒng)計(jì)學(xué)和概率,這些都是數(shù)據(jù)分析師真正重要的理論基礎(chǔ)。值得強(qiáng)調(diào)的是如何將數(shù)據(jù)分離用于訓(xùn)練和測(cè)試的重要性,并列舉基本的機(jī)器學(xué)習(xí)算法,如果不是實(shí)現(xiàn)的話,您應(yīng)該放心使用。
如果您想知道如何進(jìn)入數(shù)據(jù)分析,那么掌握所有這些技能是很重要的,因?yàn)槟枰恳环N技能來(lái)正確地理解數(shù)據(jù)并準(zhǔn)確地分析數(shù)據(jù)。此外,這些技巧中的很多對(duì)于面試問(wèn)題來(lái)說(shuō)都是絕對(duì)公平的游戲。
我肯定會(huì)創(chuàng)建一些使用這些技能的個(gè)人項(xiàng)目,并在你的簡(jiǎn)歷中鏈接到它們。如果你遇到下面這樣的問(wèn)題:
如果您已經(jīng)通過(guò)項(xiàng)目中的實(shí)際數(shù)據(jù)解決了同樣的問(wèn)題,您的答案將更加令人信服和知情。您可以討論這些相關(guān)特性對(duì)項(xiàng)目中使用的數(shù)據(jù)集分析的影響。
數(shù)據(jù)分析是一個(gè)真正迷人的領(lǐng)域。例如,大多數(shù)經(jīng)典經(jīng)濟(jì)學(xué)理論都是基于人類個(gè)體做出理性決策的假設(shè)。這種假設(shè)是錯(cuò)誤的,因此使許多經(jīng)典的經(jīng)濟(jì)理論完全過(guò)時(shí)。例如,一個(gè)古老的經(jīng)濟(jì)學(xué)理論認(rèn)為消費(fèi)者喜歡選擇,雖然在某些情況下這是正確的,但做出決定可能會(huì)讓人筋疲力盡,馬克·萊珀和辛·艾揚(yáng)格發(fā)現(xiàn)了選擇的悖論。他們發(fā)現(xiàn),如果顧客有6種選擇,而不是24種,他們更有可能購(gòu)買果醬。然而,基于數(shù)據(jù)的經(jīng)濟(jì)理論要準(zhǔn)確得多。數(shù)據(jù)分析仍然需要時(shí)不時(shí)的一些小假設(shè),但由于它完全基于所收集的數(shù)據(jù),如果您的數(shù)據(jù)是全面的和有代表性的,數(shù)據(jù)分析提供了一種優(yōu)雅而準(zhǔn)確的方法來(lái)理解世界以及在其中做出的決定或習(xí)慣。
數(shù)據(jù)分析是一個(gè)跳躍的領(lǐng)域。美國(guó)勞工統(tǒng)計(jì)局預(yù)測(cè),到2026年,數(shù)據(jù)科學(xué)領(lǐng)域?qū)⒃鲩L(zhǎng)28%。如果你在找錢,美國(guó)數(shù)據(jù)分析師的平均工資是70000美元,而且隨著對(duì)數(shù)據(jù)分析師需求的增加,這一數(shù)字可能會(huì)上升。這是進(jìn)入數(shù)據(jù)分析的好時(shí)機(jī),您可以采取一些簡(jiǎn)單的步驟來(lái)進(jìn)行分析。
數(shù)據(jù)分析是一個(gè)非常技術(shù)性的領(lǐng)域,所以任何想知道如何進(jìn)入數(shù)據(jù)分析的人都需要對(duì)大量高級(jí)數(shù)學(xué)概念有很強(qiáng)的理解,而且你應(yīng)該是一個(gè)稱職的程序員。如果你對(duì)數(shù)字和它們能向你揭示的東西有熱情,一旦你確保你能掌握上面概述的技術(shù)來(lái)滿足工作要求,數(shù)據(jù)分析就是你的工作。
數(shù)據(jù)分析師工作中的一個(gè)重要因素是您需要的上下文業(yè)務(wù)知識(shí),這是許多人沒(méi)有考慮的。如果您是一名處理樹(shù)生長(zhǎng)數(shù)據(jù)的數(shù)據(jù)分析師,而數(shù)據(jù)集中缺少某些值,則需要對(duì)樹(shù)及其生長(zhǎng)方式有足夠的了解,以確定是否可以拋出這些數(shù)據(jù),或者補(bǔ)充這些數(shù)據(jù)的最佳方式是什么。您還需要能夠理解數(shù)據(jù)集的特性意味著什么。如果您有兩個(gè)特性,就其含義而言非常相似,那么您可能想扔掉其中一個(gè)。通過(guò)使用上下文知識(shí)評(píng)估特征之間的依賴關(guān)系以及哪些特征與手頭的問(wèn)題最相關(guān),您可以省去對(duì)特征依賴關(guān)系進(jìn)行深入分析的麻煩。
想想你的激情或你現(xiàn)有知識(shí)的領(lǐng)域是什么,以及你如何將數(shù)據(jù)分析應(yīng)用到這些領(lǐng)域。許多從事數(shù)據(jù)分析的人沒(méi)有數(shù)據(jù)分析的正式背景或?qū)W位,所以你可以成為一名數(shù)據(jù)分析師,處理你所研究的領(lǐng)域的數(shù)據(jù)。
如何進(jìn)入數(shù)據(jù)分析的很大一部分是粉碎你的數(shù)據(jù)分析師職位的面試。除了精通Python并能夠解釋中心極限定理之外,您還可以逐步了解如何比較不同后端引擎的性能以自動(dòng)生成建議。看看下面的面試問(wèn)題:
準(zhǔn)備技術(shù)面試的最佳方法。回答技術(shù)問(wèn)題是一項(xiàng)技能,就像其他任何技能一樣。不斷練習(xí)編碼和非編碼問(wèn)題。您可以使用StrataScratch這樣的網(wǎng)站,它為數(shù)據(jù)分析師提供了大量的編碼和非編碼面試問(wèn)題。
除了回答編碼問(wèn)題,比如找出每個(gè)用戶在Facebook上的受歡迎程度百分比,以及技術(shù)、理論和非編碼問(wèn)題,比如解釋時(shí)間序列預(yù)測(cè)的不同技術(shù),你還需要為行為面試問(wèn)題提供與數(shù)據(jù)分析師相關(guān)的內(nèi)容。雖然你的大多數(shù)面試都是技術(shù)性面試,有編碼或非編碼問(wèn)題,但重要的是你要有一段時(shí)間你經(jīng)歷過(guò)失敗或你特別自豪的成就的例子,這些例子與數(shù)據(jù)分析有關(guān)。
這就是為什么與數(shù)據(jù)分析有關(guān)的個(gè)人項(xiàng)目如此重要。也許你有拯救動(dòng)物的熱情。你可以創(chuàng)建一個(gè)模型,預(yù)測(cè)什么策略最有效地讓動(dòng)物被收養(yǎng)。如果你有機(jī)會(huì)應(yīng)用你的模型,就更好了,比如如果你有一個(gè)動(dòng)物收容所來(lái)遵循你推薦的策略,看看這是否會(huì)對(duì)收養(yǎng)率產(chǎn)生影響。數(shù)據(jù)分析可以應(yīng)用于任何有數(shù)據(jù)的領(lǐng)域。一定會(huì)有一個(gè)數(shù)據(jù)集與您感興趣的主題相關(guān)。在這方面練習(xí)你作為數(shù)據(jù)分析師的技能,這樣你就可以為你的面試官突出這些技能。
許多可能擔(dān)心如何進(jìn)入數(shù)據(jù)分析的程序員和非程序員應(yīng)該知道,正規(guī)教育,特別是數(shù)據(jù)分析,是不需要的。并不是很多大學(xué)都有完整的數(shù)據(jù)科學(xué)或數(shù)據(jù)分析學(xué)位課程。盡管越來(lái)越多的大學(xué)增加了數(shù)據(jù)分析項(xiàng)目,但對(duì)數(shù)據(jù)分析師的需求仍然太高,雇主不需要正式的數(shù)據(jù)分析或數(shù)據(jù)科學(xué)背景。如果你有數(shù)學(xué)或計(jì)算機(jī)科學(xué)的背景,這可能會(huì)很有幫助,但不是必需的。
要獲得一份入門級(jí)數(shù)據(jù)分析師的工作,最好的辦法是精通Python并對(duì)SQL以及SAS、R、Tableau或其他數(shù)據(jù)庫(kù)接口工具和語(yǔ)言非常有信心。如果你沒(méi)有C.S.的背景?;蛘邤?shù)學(xué),在一旁發(fā)展這些技能,并將它們應(yīng)用到展示你能力的個(gè)人項(xiàng)目中。
由于上下文知識(shí)如此重要,數(shù)據(jù)分析是從另一個(gè)行業(yè)進(jìn)入的一個(gè)很好的領(lǐng)域。根據(jù)您所分析的數(shù)據(jù)的行業(yè),無(wú)論是醫(yī)學(xué)圖像還是在線零售行業(yè)中中小企業(yè)的購(gòu)買模式,對(duì)您所分析的數(shù)據(jù)的行業(yè)有重要的了解可能是有幫助的,有時(shí)也是必要的。
在美國(guó),數(shù)據(jù)分析師的平均工資是70.7萬(wàn)美元,但對(duì)于那些職業(yè)生涯后期的人來(lái)說(shuō),工資可以高達(dá)10.6萬(wàn)美元。我們的帖子數(shù)據(jù)科學(xué)家賺多少錢可以幫助你了解數(shù)據(jù)分析方面的工資,以及他們是如何受到各種因素的影響的。
數(shù)據(jù)分析師的常見(jiàn)工作職責(zé)包括收集和組織數(shù)據(jù)、確保符合數(shù)據(jù)政策、執(zhí)行質(zhì)量控制功能以確保數(shù)據(jù)的完整性、利潤(rùn)優(yōu)化建議或制定價(jià)格和組合折扣計(jì)劃。確切的職責(zé)在不同的公司之間可能會(huì)有很大的差異,所以檢查確切的工作描述,找到與你最喜歡的任務(wù)相匹配的工作描述。
數(shù)據(jù)分析是一個(gè)廣闊的領(lǐng)域。對(duì)數(shù)據(jù)分析師的需求迅速增長(zhǎng),這意味著你將享受相對(duì)較高水平的工作保障。由于這個(gè)行業(yè)還很年輕,所以有很大的職業(yè)發(fā)展?jié)摿ΑK璧募寄芏喾N多樣,所以絕對(duì)不是為那些已經(jīng)完成學(xué)習(xí)的人準(zhǔn)備的。由于該行業(yè)發(fā)展如此迅速,在未來(lái)幾年中,在使用的工具和新的應(yīng)用程序方面肯定會(huì)有很多變化。
如果你想進(jìn)入技術(shù)和編程領(lǐng)域,但又不想回到學(xué)?;虺蔀檐浖こ處?,數(shù)據(jù)分析對(duì)你來(lái)說(shuō)是一個(gè)很好的選擇。數(shù)據(jù)分析員仍然可以處理代碼,但你可以少處理隨叫隨到或處理開(kāi)發(fā)人員的頭痛問(wèn)題。數(shù)據(jù)分析的應(yīng)用通常是迷人的,通過(guò)指導(dǎo)企業(yè)做出數(shù)據(jù)驅(qū)動(dòng)的決策,您可以對(duì)企業(yè)的成功產(chǎn)生很大的影響。
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
LSTM 模型輸入長(zhǎng)度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長(zhǎng)序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報(bào)考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計(jì)的實(shí)用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強(qiáng)大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠(chéng)摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實(shí)施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價(jià)值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡(jiǎn)稱 BI)深度融合的時(shí)代,BI ...
2025-07-10SQL 在預(yù)測(cè)分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢(shì)預(yù)判? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代,預(yù)測(cè)分析作為挖掘數(shù)據(jù)潛在價(jià)值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價(jià)值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點(diǎn),而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報(bào)考到取證的全攻略? 在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭(zhēng)搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢(shì)性檢驗(yàn):捕捉數(shù)據(jù)背后的時(shí)間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢(shì)性檢驗(yàn)如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時(shí)間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時(shí)間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實(shí)戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗(yàn):數(shù)據(jù)趨勢(shì)與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢(shì)變化以及識(shí)別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國(guó)內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對(duì)策略? 長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨(dú)特的門控機(jī)制,在 ...
2025-07-07統(tǒng)計(jì)學(xué)方法在市場(chǎng)調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場(chǎng)調(diào)研是企業(yè)洞察市場(chǎng)動(dòng)態(tài)、了解消費(fèi)者需求的重要途徑,而統(tǒng)計(jì)學(xué)方法則是市場(chǎng)調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動(dòng)力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動(dòng)力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開(kāi)啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價(jià)值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03