
作者Zulie Rane,自由撰稿人和編碼愛好者。
數(shù)據(jù)分析是一個非??岬?、有前途的行業(yè)。它一直在上升很長一段時間,這解釋了為什么這么多人想知道如何進入數(shù)據(jù)分析。自從互聯(lián)網(wǎng)和智能手機的廣泛使用,瘋狂的數(shù)據(jù)量無時無刻不在產(chǎn)生。2020年初,世界上的數(shù)據(jù)量估計為44zettabytes,或44x10^21字節(jié)。所有這些數(shù)據(jù)包含大量非常有用的信息,如消費者的購買模式或疾病指標(biāo)。
數(shù)據(jù)分析員掌握數(shù)據(jù)集,并負(fù)責(zé)理解它們。這些數(shù)字說明了什么,公司應(yīng)該怎么做?一個簡單的例子是,當(dāng)你把一件商品放在購物車?yán)?,包含顧客?jīng)常一起購買的產(chǎn)品時,就會出現(xiàn)產(chǎn)品的橫幅。數(shù)據(jù)分析員可以負(fù)責(zé)確定哪些產(chǎn)品應(yīng)該相互關(guān)聯(lián),以提高轉(zhuǎn)化率。
數(shù)據(jù)分析是分析原始數(shù)據(jù)以發(fā)現(xiàn)趨勢并回答問題的過程。它涉及到很多在屏幕前的個人工作,但如果你喜歡數(shù)學(xué)和編程,這對你來說是一個很好的機會。您可以獲取和收集數(shù)據(jù),以及清理、組織、可視化和分析數(shù)據(jù)。
簡單說明一下:數(shù)據(jù)科學(xué)家負(fù)責(zé)為數(shù)據(jù)設(shè)計和構(gòu)建新的模型。他們創(chuàng)造原型,算法,預(yù)測模型。數(shù)據(jù)分析師做的是顧名思義的事情--她查看數(shù)據(jù),試圖預(yù)測趨勢,進行可視化,并傳達結(jié)果。換句話說,數(shù)據(jù)分析師分析數(shù)據(jù)。在美國,數(shù)據(jù)科學(xué)家的年薪比數(shù)據(jù)分析師高出3-4萬美元,所以這是一個重要的區(qū)別。
這就是本文將如何引導(dǎo)您完成獲得第一份數(shù)據(jù)分析工作所需了解的一切。
在您開始考慮如何進入數(shù)據(jù)分析之前,您應(yīng)該確保您了解該領(lǐng)域。數(shù)據(jù)分析是從大量數(shù)據(jù)中找出意義的藝術(shù)。據(jù)toDOMO稱,自2020年以來,地球上每秒為每個人創(chuàng)造1.7MB的數(shù)據(jù)。數(shù)據(jù)分析師的任務(wù)是找到與他們的業(yè)務(wù)應(yīng)用程序相關(guān)的數(shù)據(jù),理解這些數(shù)據(jù),并找到應(yīng)用這些知識來改進業(yè)務(wù)的方法。
數(shù)據(jù)分析中有許多子字段。這些包括描述性、診斷性、預(yù)測性和規(guī)定性分析。您可以通過以下方式來考慮這些不同類型的分析。
數(shù)據(jù)分析師可以在日常工作中很好地涵蓋所有這些子領(lǐng)域。通常,數(shù)據(jù)分析人員將逐步完成所有這些形式的分析,以最大限度地利用數(shù)據(jù)集并優(yōu)化其業(yè)務(wù)影響。如果您想進入數(shù)據(jù)分析,了解這些不同形式的分析和應(yīng)用它們的訣竅是很重要的。
數(shù)據(jù)分析師的任務(wù)是幫助企業(yè)做出數(shù)據(jù)驅(qū)動的決策。由于收集數(shù)據(jù)很簡單,數(shù)據(jù)分析師可以測試他們的假設(shè),并糾正他們所做的說明性模型,以提高他們的性能,并調(diào)整從他們的數(shù)據(jù)洞察中創(chuàng)建的操作項。根據(jù)數(shù)據(jù)做出假設(shè),實現(xiàn)你的預(yù)測,并分析結(jié)果是進入數(shù)據(jù)分析的方法。
鑒于數(shù)據(jù)分析是數(shù)學(xué)和編程的交叉,它是一個非常技術(shù)性的領(lǐng)域。你必須使用許多不同的工具和技術(shù)技巧來完成這項工作。軟件工程師瑪格麗塔·哈馬赫(Margarita Hamacher)為數(shù)據(jù)分析師整理了一份7種技術(shù)技能的綜合列表。數(shù)據(jù)分析不僅僅是硬技能。但對于任何想知道如何進入數(shù)據(jù)分析的人來說,這些技術(shù)技能將是一個很好的起點。
這些技能包括數(shù)學(xué)、數(shù)據(jù)可視化、機器學(xué)習(xí)、編碼等。數(shù)學(xué)需求可以進一步分解為線性代數(shù)、統(tǒng)計學(xué)和概率,這些都是數(shù)據(jù)分析師真正重要的理論基礎(chǔ)。值得強調(diào)的是如何將數(shù)據(jù)分離用于訓(xùn)練和測試的重要性,并列舉基本的機器學(xué)習(xí)算法,如果不是實現(xiàn)的話,您應(yīng)該放心使用。
如果您想知道如何進入數(shù)據(jù)分析,那么掌握所有這些技能是很重要的,因為您需要每一種技能來正確地理解數(shù)據(jù)并準(zhǔn)確地分析數(shù)據(jù)。此外,這些技巧中的很多對于面試問題來說都是絕對公平的游戲。
我肯定會創(chuàng)建一些使用這些技能的個人項目,并在你的簡歷中鏈接到它們。如果你遇到下面這樣的問題:
如果您已經(jīng)通過項目中的實際數(shù)據(jù)解決了同樣的問題,您的答案將更加令人信服和知情。您可以討論這些相關(guān)特性對項目中使用的數(shù)據(jù)集分析的影響。
數(shù)據(jù)分析是一個真正迷人的領(lǐng)域。例如,大多數(shù)經(jīng)典經(jīng)濟學(xué)理論都是基于人類個體做出理性決策的假設(shè)。這種假設(shè)是錯誤的,因此使許多經(jīng)典的經(jīng)濟理論完全過時。例如,一個古老的經(jīng)濟學(xué)理論認(rèn)為消費者喜歡選擇,雖然在某些情況下這是正確的,但做出決定可能會讓人筋疲力盡,馬克·萊珀和辛·艾揚格發(fā)現(xiàn)了選擇的悖論。他們發(fā)現(xiàn),如果顧客有6種選擇,而不是24種,他們更有可能購買果醬。然而,基于數(shù)據(jù)的經(jīng)濟理論要準(zhǔn)確得多。數(shù)據(jù)分析仍然需要時不時的一些小假設(shè),但由于它完全基于所收集的數(shù)據(jù),如果您的數(shù)據(jù)是全面的和有代表性的,數(shù)據(jù)分析提供了一種優(yōu)雅而準(zhǔn)確的方法來理解世界以及在其中做出的決定或習(xí)慣。
數(shù)據(jù)分析是一個跳躍的領(lǐng)域。美國勞工統(tǒng)計局預(yù)測,到2026年,數(shù)據(jù)科學(xué)領(lǐng)域?qū)⒃鲩L28%。如果你在找錢,美國數(shù)據(jù)分析師的平均工資是70000美元,而且隨著對數(shù)據(jù)分析師需求的增加,這一數(shù)字可能會上升。這是進入數(shù)據(jù)分析的好時機,您可以采取一些簡單的步驟來進行分析。
數(shù)據(jù)分析是一個非常技術(shù)性的領(lǐng)域,所以任何想知道如何進入數(shù)據(jù)分析的人都需要對大量高級數(shù)學(xué)概念有很強的理解,而且你應(yīng)該是一個稱職的程序員。如果你對數(shù)字和它們能向你揭示的東西有熱情,一旦你確保你能掌握上面概述的技術(shù)來滿足工作要求,數(shù)據(jù)分析就是你的工作。
數(shù)據(jù)分析師工作中的一個重要因素是您需要的上下文業(yè)務(wù)知識,這是許多人沒有考慮的。如果您是一名處理樹生長數(shù)據(jù)的數(shù)據(jù)分析師,而數(shù)據(jù)集中缺少某些值,則需要對樹及其生長方式有足夠的了解,以確定是否可以拋出這些數(shù)據(jù),或者補充這些數(shù)據(jù)的最佳方式是什么。您還需要能夠理解數(shù)據(jù)集的特性意味著什么。如果您有兩個特性,就其含義而言非常相似,那么您可能想扔掉其中一個。通過使用上下文知識評估特征之間的依賴關(guān)系以及哪些特征與手頭的問題最相關(guān),您可以省去對特征依賴關(guān)系進行深入分析的麻煩。
想想你的激情或你現(xiàn)有知識的領(lǐng)域是什么,以及你如何將數(shù)據(jù)分析應(yīng)用到這些領(lǐng)域。許多從事數(shù)據(jù)分析的人沒有數(shù)據(jù)分析的正式背景或?qū)W位,所以你可以成為一名數(shù)據(jù)分析師,處理你所研究的領(lǐng)域的數(shù)據(jù)。
如何進入數(shù)據(jù)分析的很大一部分是粉碎你的數(shù)據(jù)分析師職位的面試。除了精通Python并能夠解釋中心極限定理之外,您還可以逐步了解如何比較不同后端引擎的性能以自動生成建議??纯聪旅娴拿嬖噯栴}:
準(zhǔn)備技術(shù)面試的最佳方法?;卮鸺夹g(shù)問題是一項技能,就像其他任何技能一樣。不斷練習(xí)編碼和非編碼問題。您可以使用StrataScratch這樣的網(wǎng)站,它為數(shù)據(jù)分析師提供了大量的編碼和非編碼面試問題。
除了回答編碼問題,比如找出每個用戶在Facebook上的受歡迎程度百分比,以及技術(shù)、理論和非編碼問題,比如解釋時間序列預(yù)測的不同技術(shù),你還需要為行為面試問題提供與數(shù)據(jù)分析師相關(guān)的內(nèi)容。雖然你的大多數(shù)面試都是技術(shù)性面試,有編碼或非編碼問題,但重要的是你要有一段時間你經(jīng)歷過失敗或你特別自豪的成就的例子,這些例子與數(shù)據(jù)分析有關(guān)。
這就是為什么與數(shù)據(jù)分析有關(guān)的個人項目如此重要。也許你有拯救動物的熱情。你可以創(chuàng)建一個模型,預(yù)測什么策略最有效地讓動物被收養(yǎng)。如果你有機會應(yīng)用你的模型,就更好了,比如如果你有一個動物收容所來遵循你推薦的策略,看看這是否會對收養(yǎng)率產(chǎn)生影響。數(shù)據(jù)分析可以應(yīng)用于任何有數(shù)據(jù)的領(lǐng)域。一定會有一個數(shù)據(jù)集與您感興趣的主題相關(guān)。在這方面練習(xí)你作為數(shù)據(jù)分析師的技能,這樣你就可以為你的面試官突出這些技能。
許多可能擔(dān)心如何進入數(shù)據(jù)分析的程序員和非程序員應(yīng)該知道,正規(guī)教育,特別是數(shù)據(jù)分析,是不需要的。并不是很多大學(xué)都有完整的數(shù)據(jù)科學(xué)或數(shù)據(jù)分析學(xué)位課程。盡管越來越多的大學(xué)增加了數(shù)據(jù)分析項目,但對數(shù)據(jù)分析師的需求仍然太高,雇主不需要正式的數(shù)據(jù)分析或數(shù)據(jù)科學(xué)背景。如果你有數(shù)學(xué)或計算機科學(xué)的背景,這可能會很有幫助,但不是必需的。
要獲得一份入門級數(shù)據(jù)分析師的工作,最好的辦法是精通Python并對SQL以及SAS、R、Tableau或其他數(shù)據(jù)庫接口工具和語言非常有信心。如果你沒有C.S.的背景?;蛘邤?shù)學(xué),在一旁發(fā)展這些技能,并將它們應(yīng)用到展示你能力的個人項目中。
由于上下文知識如此重要,數(shù)據(jù)分析是從另一個行業(yè)進入的一個很好的領(lǐng)域。根據(jù)您所分析的數(shù)據(jù)的行業(yè),無論是醫(yī)學(xué)圖像還是在線零售行業(yè)中中小企業(yè)的購買模式,對您所分析的數(shù)據(jù)的行業(yè)有重要的了解可能是有幫助的,有時也是必要的。
在美國,數(shù)據(jù)分析師的平均工資是70.7萬美元,但對于那些職業(yè)生涯后期的人來說,工資可以高達10.6萬美元。我們的帖子數(shù)據(jù)科學(xué)家賺多少錢可以幫助你了解數(shù)據(jù)分析方面的工資,以及他們是如何受到各種因素的影響的。
數(shù)據(jù)分析師的常見工作職責(zé)包括收集和組織數(shù)據(jù)、確保符合數(shù)據(jù)政策、執(zhí)行質(zhì)量控制功能以確保數(shù)據(jù)的完整性、利潤優(yōu)化建議或制定價格和組合折扣計劃。確切的職責(zé)在不同的公司之間可能會有很大的差異,所以檢查確切的工作描述,找到與你最喜歡的任務(wù)相匹配的工作描述。
數(shù)據(jù)分析是一個廣闊的領(lǐng)域。對數(shù)據(jù)分析師的需求迅速增長,這意味著你將享受相對較高水平的工作保障。由于這個行業(yè)還很年輕,所以有很大的職業(yè)發(fā)展?jié)摿?。所需的技能多種多樣,所以絕對不是為那些已經(jīng)完成學(xué)習(xí)的人準(zhǔn)備的。由于該行業(yè)發(fā)展如此迅速,在未來幾年中,在使用的工具和新的應(yīng)用程序方面肯定會有很多變化。
如果你想進入技術(shù)和編程領(lǐng)域,但又不想回到學(xué)校或成為軟件工程師,數(shù)據(jù)分析對你來說是一個很好的選擇。數(shù)據(jù)分析員仍然可以處理代碼,但你可以少處理隨叫隨到或處理開發(fā)人員的頭痛問題。數(shù)據(jù)分析的應(yīng)用通常是迷人的,通過指導(dǎo)企業(yè)做出數(shù)據(jù)驅(qū)動的決策,您可以對企業(yè)的成功產(chǎn)生很大的影響。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預(yù)測分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢預(yù)判? ? 在數(shù)據(jù)驅(qū)動決策的時代,預(yù)測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點,而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報考到取證的全攻略? 在數(shù)字經(jīng)濟蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗:捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗:數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對策略? 長短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨特的門控機制,在 ...
2025-07-07統(tǒng)計學(xué)方法在市場調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場調(diào)研是企業(yè)洞察市場動態(tài)、了解消費者需求的重要途徑,而統(tǒng)計學(xué)方法則是市場調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03