
在 Nordstrom 數(shù)據(jù)實驗室度過了兩年美好時光以后, 我獲得了一個亞馬遜網(wǎng)絡(luò)服務(wù) S3 部門的崗位。我為即將開始的人生新篇章感到興奮,也為耗時又折磨人的面試過程終于結(jié)束松了口氣。面試通常包含三種初篩的一種,以及全天的現(xiàn)場面試。這些面試充滿壓力,因為不知道會被問到什么, 而且對方通常期待你大秀智力,數(shù)據(jù)科學家正常情況下不太會做這種事(至少不會脫離上下文,僅憑記憶在電話中大秀智力) 。
你需要時間
如果你在考慮跳槽(或進入這個行業(yè)),我能給出的最好建議是現(xiàn)在就開始準備。你需要給自己大量時間, 避免填鴨模式?;c時間確保你能用自己的語言解釋核心概念。電話面試的問題通常是這樣:“如何向一個工程師解釋什么是 p 值?”假設(shè),要向一位非統(tǒng)計專業(yè),不使用專業(yè)術(shù)語的工程師解釋。毫無疑問,你不想在這樣的場合初次解釋這些基本概念。 此外,不要低估緊張對于你記憶的影響,哪怕是回憶那些自認為很了解的內(nèi)容。如果你是行業(yè)新人,你可能需要給自己更多時間去準備自己不熟悉的概念。
我也建議多花時間準備個人資料,即你的簡歷和自薦信。這個問題上有兩種看法,一派認為這很重要,一派認為這不重要。面試官真的會細看這些資料嗎?很難籠統(tǒng)回答,但當我在 Nordstrom 工作時參加過海量面試,就個人而言,我非??粗剡@些資料。拼寫錯誤不能容忍。自吹自擂的自薦信不是好兆頭。糟糕的個人資料代表對崗位缺乏興趣(或缺乏對閱讀者的尊重),而堆砌關(guān)鍵詞是在暗示面試官詢問申請者何時何地做了這些。 在更廣泛的技術(shù)領(lǐng)域,大家傾向于認為 GitHub 上的東西才重要。但大多數(shù)公司,尤其是大型公司,不會看你的 GitHub 。他們會看簡歷和自薦信(這可能讓人驚訝,但科技不是精英統(tǒng)治的)。最終這些文件會體現(xiàn)你如何職業(yè)化地自我展示,所以它們的確重要,哪怕你之前不這么想。
實踐出真知
我建議多做實踐并分析自己的弱點。許多人誤以為反復(fù)讀書是最有效的學習方法,但這不是當場解決概率問題和邏輯謎題的有效辦法(在你開始學習之前,強烈推薦《Make it Stick》一書)。通過專心解決實際問題,你會立刻發(fā)現(xiàn)自己的弱項,并確定學習的優(yōu)先級?;〞r間在已經(jīng)了解的事情上是一種拖延癥,何況你都已經(jīng)很忙了。此外,這是一個技術(shù)領(lǐng)域,你應(yīng)該準備好在技術(shù)層面回答問題。如果可以,我建議站在一塊白板前面解答實際問題,以便讓自己適應(yīng)這種寫字方式還有邊說邊寫。在 Quora 上能找到很多相關(guān)的建議和面試問題。
圖一: 我在密歇根大學讀博期間為第一輪面試布置的辦公室。當時我很青澀,剛剛轉(zhuǎn)換領(lǐng)域,因一無所知感到害怕。這種偏執(zhí)程度既不健康也不推薦。
盡可能多了解未來的崗位
你知道什么是信息訪談( informational interview )嗎?在我朋友使用這個方法之前,我也不知道這是什么!有時面試過程在推進,但你不知道自己是否想要這份工作。那么你可以讓對方減緩節(jié)奏,然后做個信息訪談以確定這是否是你真正想要的工作。你也可以花時間“偷窺”公司和面試官。比如,為了亞馬遜的現(xiàn)場面試, 我花時間在 Linkedin 上查了每個面試人員和他們的背景。這會幫你猜到他們會提的問題。哦,這人是個工程師,那她可能不會問你統(tǒng)計方面的內(nèi)容,但可能會問拓展方法的內(nèi)容。等等她是個高級管理工程師,也許她會想了解我對領(lǐng)導(dǎo)能力和人際交往技巧。Ellen Chisa 有許多關(guān)于面試禁忌的建議。
獲取資源!
你可以料到以下領(lǐng)域會被問及:統(tǒng)計學、機器學習、預(yù)測、算法、所有計算機系本科生應(yīng)該了解的知識,以及與上面所有領(lǐng)域相關(guān)的擴展性和表現(xiàn)。哦對了,你還要準備用一種你選擇的語言編程。小菜一碟吧?!
書籍
搞本概率論入門書,具體是哪本不要緊。我用的是Ross寫的, 典型的本科概率論教材。要是你有這本,我推薦做 1~5 章的自測題,以此決定是否在上面花更多時間。組合數(shù)學和基本概率問題是電話面試必備,要確保掌握。我也用過 Casella 和 Berger 寫的教材來復(fù)習期望和方差,這書可以說是統(tǒng)計學者的圣經(jīng)?;\統(tǒng)地說多數(shù)面試比教材簡單。
對于計算機相關(guān)的內(nèi)容,我一般參考三本書:《Programming Interviews Exposed》,《Cracking the Coding Interview》和《Programming Pearls》。 第一本是三本中最綜合的。如果時間只夠讀一本書,就讀這本。第二本簡潔具體,針對 Amazon,Google 和 Facebook 這樣的大公司面試,但不廣泛適用。我使用的版本還有些煩人的插圖,教你確保自己是“一個跟面試官愿意叫你喝酒的哥們”。這書的哥們兒氣重到我最終棄讀(本來期待得到更有價值的內(nèi)容)。第三本無關(guān)面試。它是一個計算問題和解決方法的思維闡釋的集合。這本書不止適用于學習,還適用于理解計算過程。如果有時間讀一讀此書會是種享受。
圖二: 一些課程允許閱覽存檔的內(nèi)容,不必等待(新的)講義
對,就是 Coursera 這玩意兒。如果你已經(jīng)丟掉了舊教材又不想買什么書,Cousera 上的資料就可以滿足你。我非常非常非常推薦約翰霍普金斯大學的生物統(tǒng)計訓(xùn)練營。這是對統(tǒng)計學本科一年級課程的有效復(fù)習。別花太多時間看課程視頻。用測試題和作業(yè)進行自我檢測,然后再去看薄弱環(huán)節(jié)的視頻。也可以看看數(shù)據(jù)科學專項課程。跟上面的課是由同一批老師組織的,內(nèi)容包括探索性數(shù)據(jù)統(tǒng)計和R編程。吳恩達的機器學習一定要學且其樂無窮。他善于闡釋方法背后的動機,并在課程中花了很多時間訓(xùn)練直覺。直覺對電話面試尤其有益,這些面試中你可能不想強調(diào)技術(shù)細節(jié)卻又要證明對領(lǐng)域的熟悉。由于我當時的目標是亞馬遜,所以云計算專項課程也令我受益。我正從零售技術(shù)領(lǐng)域轉(zhuǎn)向云計算領(lǐng)域,并且想更好理解我將面對的問題。在這種情況下,我只看了課程視頻來學習這個領(lǐng)域的用詞,而未深究技術(shù)細節(jié)。我總是在搜羅 Coursera 的好課程,如果你有推薦的課程可以給我留言!
Coursera 的課程起止時間制讓我惱火。最近我發(fā)現(xiàn),許多課程可以閱覽之前存檔的資料,不用等待新課開始。這對我來說是個重要變化,快去試試吧!
祝你好運!
以上就是我所謂的干貨。但我還想講一些老生常談。
第一,保持鎮(zhèn)靜!過于緊張會讓你無法回憶起一些知識。這對我來說是個麻煩,令我做出一些瘋狂的事,比如把所有東西寫下來貼墻上,但不推薦大家也這樣做。我最新的瘋狂手段是在電話面試之前幾分鐘做健身操,使自己汗流浹背氣喘吁吁。除此之外,如果你住在目標公司的所在城市,就直接約面試官面談。我表情充沛,而且能比電話面試表現(xiàn)更好。
不要忘了你同時也在面試對方。相信你的直覺。我曾對一個創(chuàng)業(yè)公司進行了信息訪談。我感覺對方目中無人,根本不聽我說話,但我仍對那份工作感興趣。我試圖跟進,但每次都要預(yù)約一萬次才能得到確認。那是一次很糟糕的經(jīng)歷,如果我相信了我的直覺(這些人不靠譜)也就不至于浪費那么多時間。再有趣的工作也不值得每天花八小時跟不尊重你的人在一起。
最后一點,不要把自己的經(jīng)歷跟其他人比較,因為你會誤解或失望。當我在經(jīng)歷面試時,碰巧一些我熟悉的同事也在接受面試。那時把自己的經(jīng)歷和他人相比較后,我覺得又驚訝又生氣。簡單來說,我和一個資歷較淺的男同事在同一個星期面試了同一個崗位。他被團隊成員當面面試,對方問了擲骰子概率這種很基礎(chǔ)的問題。我卻被不同辦公室的人電話面試,對方問了我一個博弈論最優(yōu)解問題。這事令人難以接受,也很難不亂想不生氣。現(xiàn)在我把這事解釋為招聘經(jīng)驗不足和公司不成熟。這公司不知道如何面試我的崗位,甚至可能因此雇用我不想共事的人,我不想在這種地方工作。
最終你應(yīng)該盡可能準備充分,但不要因為你的知識有漏洞而懊惱。相信自己,相信自己的印象。從失敗的面試中學習,以便搞定下一個。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
訓(xùn)練與驗證損失驟升:機器學習訓(xùn)練中的異常診斷與解決方案 在機器學習模型訓(xùn)練過程中,“損失曲線” 是反映模型學習狀態(tài)的核心指 ...
2025-09-19解析 DataHub 與 Kafka:數(shù)據(jù)生態(tài)中兩類核心工具的差異與協(xié)同 在數(shù)字化轉(zhuǎn)型加速的今天,企業(yè)對數(shù)據(jù)的需求已從 “存儲” 轉(zhuǎn)向 “ ...
2025-09-19CDA 數(shù)據(jù)分析師:讓統(tǒng)計基本概念成為業(yè)務(wù)決策的底層邏輯 統(tǒng)計基本概念是商業(yè)數(shù)據(jù)分析的 “基礎(chǔ)語言”—— 從描述數(shù)據(jù)分布的 “均 ...
2025-09-19CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-19SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動態(tài)隨機一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計學領(lǐng)域,假設(shè)檢驗是驗證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數(shù)量的準確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進行 HTTP 網(wǎng)絡(luò)請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數(shù)據(jù)的科學計數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點數(shù)據(jù)時的科學計數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動下的精準零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當下,精準營銷成為企業(yè)突圍的核心方 ...
2025-09-11