
作為一個(gè)初學(xué)者,我有很多關(guān)于如何開始的問題?我如何學(xué)習(xí),或者我從哪里得到的想法工作的項(xiàng)目。于是,經(jīng)過長時(shí)間的搜索,我找到了一個(gè)關(guān)于數(shù)據(jù)分析的項(xiàng)目。我花了3天時(shí)間寫代碼,我很高興我的第一次嘗試,但接下來有一個(gè)大問題,我如何與世界分享它?我只是沒有良好的編碼技能或文檔技能來展示我的工作,所以我把它存儲(chǔ)在云中,然后忘記了它。一個(gè)月后,我隨機(jī)地在吉圖布上尋找更多的項(xiàng)目,發(fā)現(xiàn)了這個(gè)驚人的個(gè)人資料,激勵(lì)我創(chuàng)建我的投資組合。這是我做出的最好的決定,因?yàn)樗屛以陂_發(fā)人員社區(qū)的地圖上,不久之后,我開始收到招聘人員和初學(xué)者關(guān)于我的項(xiàng)目的電子郵件。
找工作通常是建立投資組合的主要原因。有時(shí),如果我們沒有相關(guān)的教育或經(jīng)驗(yàn),這是必要的(eugeneyan.com)。在這個(gè)現(xiàn)代社會(huì),雇主對(duì)雇傭新畢業(yè)生持懷疑態(tài)度,那么你如何讓他們相信你最適合這份工作呢?你通過展示你在前一個(gè)項(xiàng)目中所做的工作來展示你的技能。你的在線投資組合越強(qiáng),你得到理想工作的機(jī)會(huì)就越高。
“投資組合非常重要,因?yàn)楫?dāng)你在面試時(shí),它展示了你的真實(shí)經(jīng)驗(yàn),所以你可以向雇主從頭到尾解釋整個(gè)數(shù)據(jù)科學(xué)工作流程。”--大衛(wèi)·雅科博維奇。
另一個(gè)動(dòng)機(jī)是創(chuàng)建您的個(gè)人項(xiàng)目,以滿足您對(duì)學(xué)習(xí)新事物的好奇心。當(dāng)我們學(xué)習(xí)一項(xiàng)新技能時(shí),我們想要試驗(yàn)并最終構(gòu)建一個(gè)可以在現(xiàn)實(shí)世界中使用的工作產(chǎn)品。
在本文中,我們將學(xué)習(xí)作為數(shù)據(jù)科學(xué)初學(xué)者展示自己工作的方法。您將了解一些新的平臺(tái),使您的生活輕松和技巧,建立強(qiáng)大的投資組合。
讓我澄清一下數(shù)據(jù)科學(xué)家之間的誤解。是的,吉圖布是必要的,我們都應(yīng)該學(xué)習(xí)Git。作為一名數(shù)據(jù)科學(xué)家,我每天都會(huì)使用Github,在那里我尋找有趣的數(shù)據(jù)集和項(xiàng)目。這是最受開發(fā)人員歡迎的平臺(tái),老實(shí)說,招聘人員在打電話給你面試之前確實(shí)會(huì)檢查你的吉圖布個(gè)人資料。
吉圖布是一個(gè)全球協(xié)作平臺(tái),人們?cè)诖斯蚕砗蛥f(xié)作項(xiàng)目。你可以在我的個(gè)人資料中看到,我是如何為別人的項(xiàng)目做出貢獻(xiàn)的,也是如何為自己的項(xiàng)目工作的。
創(chuàng)建可靠配置文件的提示:
深度音符比吉圖布簡單得多,而且對(duì)初學(xué)者也很友好。如果您熟悉Jupyter筆記本,那么發(fā)布您的第一個(gè)項(xiàng)目將是小菜一碟。我對(duì)深度音符的體驗(yàn)絕對(duì)令人驚訝,因?yàn)樵撈脚_(tái)提供了吉圖布的所有品質(zhì),但要簡單得多,并且專注于數(shù)據(jù)科學(xué)家的社區(qū)。
最近,他們推出了一個(gè)深度音符配置文件,將展示您發(fā)布的所有筆記本電腦,其中包括您的信息和配置文件圖片。
就像吉圖布 Gist一樣,您可以與您的團(tuán)隊(duì)或一般公眾共享代碼片段。我在所有媒體、出版物和社交媒體平臺(tái)上都使用了深度音符 cell。您可以查看我以前的文章,了解如何實(shí)現(xiàn)深度音符單元格。將代碼片段與輸出一起使用可以使您在多個(gè)平臺(tái)上共享項(xiàng)目。
我更喜歡深度音符嵌入式單元而不是吉圖布 Gist的原因是它附帶輸出,不僅僅是靜態(tài)輸出,還有交互功能。
您可以在一篇中等的文章中使用Plotly并顯示您的圖表:
創(chuàng)建可靠配置文件的提示:
達(dá)格舒布對(duì)這個(gè)世界來說是新的,它通過為機(jī)器學(xué)習(xí)從業(yè)者和數(shù)據(jù)工程師提供一站式解決方案而迅速成名。達(dá)格舒布附帶了DVC服務(wù)器、MLflow、可視化管道和吉圖布同步。我們不會(huì)深入到功能,但會(huì)專注于使它脫穎而出的功能。
達(dá)格舒布允許您共享吉圖布存儲(chǔ)庫,并創(chuàng)建具有可視化機(jī)器學(xué)習(xí)和數(shù)據(jù)管道能力的數(shù)據(jù)科學(xué)項(xiàng)目。它還有一個(gè)隱藏的特性readme.ipynb作為項(xiàng)目描述文件,最適合不習(xí)慣markdown的初學(xué)者和喜歡在Jupyter筆記本上工作的數(shù)據(jù)科學(xué)家。它類似于吉圖布,這意味著您需要學(xué)習(xí)Git和DVC才能正確使用這個(gè)平臺(tái)。
我看到其他用戶喜歡的是通過管道可視化他們的項(xiàng)目結(jié)構(gòu)的能力,以及將他們的數(shù)據(jù)和模型視為項(xiàng)目不可分割的一部分的能力。此外,我們基于開源工具而不是重新發(fā)明現(xiàn)有解決方案的事實(shí)是人們喜歡的。-Dean
我的個(gè)人資料很新,但我喜歡這個(gè)平臺(tái),因?yàn)樗鼈優(yōu)槲姨峁┝艘粋€(gè)完整的機(jī)器學(xué)習(xí)生態(tài)系統(tǒng)。我想就特性和UI簡單性而言,我更喜歡它而不是吉圖布。
創(chuàng)建可靠配置文件的提示:
如果你想在數(shù)據(jù)科學(xué)界更快地引起注意,你應(yīng)該創(chuàng)建一個(gè)卡格爾帳戶,并開始為競(jìng)賽、數(shù)據(jù)集、筆記本和討論做出貢獻(xiàn)。當(dāng)你成為特級(jí)大師時(shí),人們尊重你,并為你提供更好的職業(yè)機(jī)會(huì)。如果你問我,我建議你在學(xué)習(xí)基礎(chǔ)知識(shí)的同時(shí)創(chuàng)建一個(gè)卡格爾配置文件。向?qū)<覍W(xué)習(xí),發(fā)現(xiàn)你的利基。我是這個(gè)平臺(tái)的超級(jí)粉絲,因?yàn)樗鼮槌鯇W(xué)者提供支持,以競(jìng)爭和開發(fā)各種行業(yè)的創(chuàng)新解決方案。它是AI研究的中堅(jiān)力量。
你可以在下面查看我的個(gè)人資料,因?yàn)閺囊婚_始,我就在各種類別中做出貢獻(xiàn),以獲得排名。目前,我是一個(gè)專家,但有了一枚金牌和銀牌,我將成為一個(gè)大師,這并不容易,老實(shí)說,我尊重特級(jí)大師,因?yàn)樗麄円呀?jīng)證明了他們是其他數(shù)據(jù)從業(yè)者中最好的。
創(chuàng)建可靠配置文件的提示:
寫博客是在上述平臺(tái)上創(chuàng)建項(xiàng)目后的下一步。如果你想擴(kuò)大你的受眾,我會(huì)強(qiáng)烈建議你從中等開始。寫博客不是必須的,但你從各個(gè)領(lǐng)域獲得了更多的牽引力。Medium平臺(tái)允許您創(chuàng)建您的個(gè)人資料,并允許您在各種出版物下發(fā)布文章,如《走向數(shù)據(jù)科學(xué)》和《走向人工智能》。您可以開發(fā)您的博客網(wǎng)站或使用其他類似的平臺(tái),如Analytics、Vidhya。
創(chuàng)建可靠配置文件的提示:
您還可以在個(gè)人網(wǎng)站上顯示您的項(xiàng)目,如果您不是web開發(fā)人員,也可以使用一些簡單的工具來簡化這個(gè)過程。您可以查看如何使用Hugo&吉圖布頁面和Hugo為各種模板構(gòu)建數(shù)據(jù)科學(xué)投資組合網(wǎng)站。
我的投資組合網(wǎng)站有一個(gè)項(xiàng)目從所有的平臺(tái)與簡短的描述和子類別。我花了三天時(shí)間創(chuàng)建整個(gè)網(wǎng)站,并將其部署到吉圖布頁面上。
創(chuàng)建可靠的投資組合網(wǎng)站的提示:
我通常使用權(quán)重和偏差來進(jìn)行機(jī)器學(xué)習(xí)實(shí)驗(yàn)和記錄我的模型的性能度量,但隨著W&B概要的引入,這種情況發(fā)生了變化。您可以通過使用嵌入式鏈接和圖形集成來寫關(guān)于當(dāng)前項(xiàng)目的博客。它與我提到的其他投資組合平臺(tái)非常相似,但它附帶了與Python庫直接集成的好處。
Ayush的簡介給我留下了最深刻的印象,因?yàn)樗趯戧P(guān)于機(jī)器學(xué)習(xí)的博客時(shí)一直在為其他組織做出貢獻(xiàn)。
W&B項(xiàng)目有模型性能指標(biāo),如下所示。
創(chuàng)建可靠配置文件的提示:
W&B是一個(gè)通配符,因?yàn)樗杂涗泴?shí)驗(yàn)而不是投資組合而聞名,但交互式博客的引入給了我們獨(dú)特的優(yōu)勢(shì),可以顯示您的項(xiàng)目并創(chuàng)建一個(gè)強(qiáng)大的投資組合。
如果你是一個(gè)初學(xué)者,我會(huì)建議你從深度音符開始,因?yàn)樗鼘?duì)團(tuán)隊(duì)是免費(fèi)的,并給你的初學(xué)者友好的工具開始。如果你希望得到數(shù)據(jù)科學(xué)界的關(guān)注,試著在吉圖布和卡格爾上創(chuàng)建你的個(gè)人資料。如果你想創(chuàng)建你的品牌,那么從博客網(wǎng)站或創(chuàng)建你的網(wǎng)站開始。
最后,我希望你們?cè)谖疑厦嫣岬降乃衅脚_(tái)上創(chuàng)建你的個(gè)人資料,因?yàn)樗鼈兌加歇?dú)特的優(yōu)勢(shì)來給你的潛在雇主留下深刻印象。我知道在開始的時(shí)候,這是相當(dāng)令人難以承受的,但是一旦你習(xí)慣了記錄和展示你的項(xiàng)目,這就變得容易了。
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實(shí)戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動(dòng)態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價(jià)值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實(shí)戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時(shí),“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗(yàn)與 t 檢驗(yàn):差異、適用場(chǎng)景與實(shí)踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計(jì)學(xué)領(lǐng)域,假設(shè)檢驗(yàn)是驗(yàn)證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計(jì)劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計(jì)劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對(duì)象的 text 與 content:區(qū)別、場(chǎng)景與實(shí)踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請(qǐng)求開發(fā)時(shí)(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價(jià)值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請(qǐng)求工具對(duì)比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請(qǐng)求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點(diǎn)數(shù)據(jù)的科學(xué)計(jì)數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點(diǎn)數(shù)據(jù)時(shí)的科學(xué)計(jì)數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價(jià)值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營問題、提升執(zhí)行效率的核心手段,其價(jià)值 ...
2025-09-12用 SQL 驗(yàn)證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實(shí)戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計(jì)” 與 “用戶體驗(yàn) ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動(dòng)下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當(dāng)下,精準(zhǔn)營銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價(jià)值 在數(shù)據(jù)驅(qū)動(dòng)決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實(shí)踐到業(yè)務(wù)價(jià)值挖掘 在數(shù)據(jù)分析場(chǎng)景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計(jì)模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價(jià)值導(dǎo)向 統(tǒng)計(jì)模型作為數(shù)據(jù)分析的核心工具,并非簡單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10