
治理分析應(yīng)用 保護客戶數(shù)據(jù)
CDPQ是加拿大魁北克省蒙特利爾市一家公司,該公司管理著加拿大魁北克的公共部門養(yǎng)老基金。該公司正面臨一個棘手的問題:如何監(jiān)管其數(shù)據(jù)科學(xué)家和業(yè)務(wù)分析師基于分析應(yīng)用所做的工作,同時還不會妨礙他們的工作。
作為新數(shù)據(jù)管理架構(gòu)的一部分,其設(shè)計是為幫助提升其分析能力,CDPQ在數(shù)據(jù)倉庫內(nèi)部設(shè)置了分離的數(shù)據(jù)沙箱,給分析師提供探索和原型用途。CDPQ負(fù)責(zé)建模和業(yè)務(wù)分析的高級主管Luc Veillette介紹,他們的目標(biāo)是為分析師們清理道路,快速研制算法并對業(yè)務(wù)問題給出答案——最終實現(xiàn)更好的投資計劃和投資組合管理決策。
但是,這并不意味著可以全權(quán)委托。CDPQ的數(shù)據(jù)治理項目包括一組使用規(guī)則,例如:只要有可用的官方公司數(shù)據(jù)源,分析師們必須使用這些數(shù)據(jù)源;分析模型需要在審計階段審查。他和其它經(jīng)理們還要對分析活動保持關(guān)注。
他說:“我們對于我們的數(shù)據(jù)科學(xué)家做什么,努力形成集中的認(rèn)識。另外CDPQ想確保分析過程有文檔記錄下來,而且數(shù)據(jù)不會被誤用。即便如此,治理工作也并不是高壓強制措施,而是一種協(xié)作行為,為了讓業(yè)務(wù)單元持續(xù)走上數(shù)據(jù)驅(qū)動的發(fā)展方向。”
Intuit公司個人理財軟件開發(fā)者已經(jīng)把這種協(xié)作帶到了另一個層面。兩年前,Intuit把其150人的分析團隊安置為法務(wù)部門的一部分,并且讓律師們和分析經(jīng)理、數(shù)據(jù)科學(xué)家和其他員工配合工作,一起確立訪問和分析不同客戶數(shù)據(jù)集的規(guī)則,使各個產(chǎn)品線配合更加緊密。
分析應(yīng)用程序的不同優(yōu)先級
Laura Fennell是Intuit公司的高級副總裁,兼法律顧問和秘書,他說此舉是因擴展分析應(yīng)用的需求而產(chǎn)生的,為了推動產(chǎn)品研發(fā)和市場策略,同時維護客戶個人信息,盡力避免任何形式的數(shù)據(jù)誤用。誤用可能會損害加利福尼亞州Mountain View公司的名聲。
Fennell說:“我們必須做正確的事。分析的利益是巨大的,但是風(fēng)險也是巨大的。我們客戶的信任就是品牌的一切。這是我們客戶的數(shù)據(jù),不是我們的數(shù)據(jù)。涉及信息總量巨大:截止今年年初,我們有超過五千萬客戶,數(shù)據(jù)累積超過6PB?!?
分析團隊負(fù)責(zé)人Bill Loconzolo在剛剛結(jié)束的Strata+Hadoop2015全球大會上展示了一次聯(lián)合演示,F(xiàn)ennell承認(rèn)“我們對關(guān)系的處理真是萬事開頭難”。法律團隊看到了大量需要保護的敏感數(shù)據(jù),數(shù)據(jù)科學(xué)家質(zhì)疑如果在流程中有律師參與,他們怎么能做出來創(chuàng)新性的分析工作。Loconzolo說,即便現(xiàn)在,為什么分析團隊屬于法律部門也仍然是“一個不斷被問及的問題,我們一直在解答這個問題”,每次他和其他管理者們招募到了新的分析師就需要解釋一次。
但是,Loconzolo說這種搭配經(jīng)證明是有好處的,他現(xiàn)在的頭銜是數(shù)據(jù)工程副總裁。在此之前,分析團隊主要是為明確客戶數(shù)據(jù)保護措施而努力工作,作為獨立的業(yè)務(wù)單元一對一的交流,法律團隊在形成技術(shù)決策以后提供輸入。但是,Loconzolo說這樣做流程太慢而且“極其痛苦”,可能會要幾年時間才能完成整個公司64個產(chǎn)品名錄的相關(guān)工作。Intuit加快了這項工作,把更多數(shù)據(jù)放到了專為分析用途建立的私有云,經(jīng)過這樣的集中化處理,就把律師從業(yè)務(wù)單元帶到了原始數(shù)據(jù)的面前。
律師們還必須調(diào)整他們對新流程環(huán)節(jié)的認(rèn)識。Fennell說:“我們的工作必須調(diào)整,不能只是說不行,要考慮我們怎樣能使工作運轉(zhuǎn)起來。目標(biāo)不是完全鎖定在客戶數(shù)據(jù),而是要弄清楚如何使數(shù)據(jù)量合適,以便分析師們可以完成他們的工作。要避免不同方向兩頭使勁,他們要把待分析數(shù)據(jù)訪問的目標(biāo)共享出來,讓大家都能有分析用途的數(shù)據(jù)訪問,也分擔(dān)了實現(xiàn)那些目標(biāo)的職責(zé)?!?
Rent the Runway 是紐約一家創(chuàng)業(yè)公司,該公司利用互聯(lián)網(wǎng)租借禮服和時尚配飾用于婚禮、聚會派對和其它活動。該公司要處理的數(shù)據(jù)比Intuit少,但是對于處理系統(tǒng)中的客戶數(shù)據(jù)避免步驟出錯也有類似的擔(dān)憂。
Vijay Subramanian是該公司的首席分析官。他說:“這正是我們思考的內(nèi)容。我們的理念是‘客戶至上,信任第一’”。由于Rent the Runway 公司現(xiàn)在還沒有自己的法務(wù)部門,所以他在外面聘請律師來操作,審核在線表單收集的尺碼信息和其他數(shù)據(jù),這些數(shù)據(jù)會導(dǎo)入到網(wǎng)站的推薦引擎中用來幫助給訪問網(wǎng)站的用戶推薦他們可能喜歡的服飾。
為分析項目限制時間
該創(chuàng)業(yè)公司資源非常有限,而其業(yè)務(wù)需求變化很快。結(jié)果,Subramanian試圖限制他的團隊所做開發(fā)項目的周期不超過三個月到六個月。他說:“對于要做的業(yè)務(wù)來說,超過這個時間范圍就有巨大風(fēng)險,我們沒有那么奢侈的時限?!?
Rent the Runway公司的數(shù)據(jù)科學(xué)家們使用Python或者開源R編程語言來編寫機器學(xué)習(xí)算法,包括增強的推薦引擎和用于微調(diào)定價的需求預(yù)測系統(tǒng)。為幫助保證開發(fā)流程向前推進,Subramanian采用了所謂的最小化變化產(chǎn)品方法學(xué),該策略限制算法實現(xiàn)盡可能少的功能并高效實現(xiàn)。他說,然后數(shù)據(jù)科學(xué)家們可以回過頭來在另一輪開發(fā)周期中再添加算法,他希望在項目中避免“沙漠中漫無目的的游蕩”。
在后端,Rent the Runway公司把數(shù)據(jù)放到數(shù)據(jù)倉庫,使用了HP的Vertica數(shù)據(jù)庫,把來自MySQL系統(tǒng)的傳統(tǒng)數(shù)據(jù)和來自MongoDB的NoSQL數(shù)據(jù)(存儲關(guān)于對服飾的態(tài)度評價信息),還有跟蹤網(wǎng)站活動的JSON日志文件混存到了一起。隨著該公司數(shù)據(jù)量的增長,Subramanian說他希望最終在Vertica之前增加一套Hadoop系統(tǒng)作為資產(chǎn)存儲所有原始數(shù)據(jù)。
在他們公司有一件事永遠(yuǎn)不會落伍,就是在利用分析應(yīng)用改善業(yè)務(wù)方面做投資。Rent the Runway公司需要數(shù)據(jù)來驅(qū)動成功。他強調(diào)說:“我們看起來像是常規(guī)的時尚業(yè)公司,但是我們必須有良好的數(shù)據(jù)存儲使消費者信服,進而只租不買”。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預(yù)測分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢預(yù)判? ? 在數(shù)據(jù)驅(qū)動決策的時代,預(yù)測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點,而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報考到取證的全攻略? 在數(shù)字經(jīng)濟蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗:捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗:數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對策略? 長短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨特的門控機制,在 ...
2025-07-07統(tǒng)計學(xué)方法在市場調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場調(diào)研是企業(yè)洞察市場動態(tài)、了解消費者需求的重要途徑,而統(tǒng)計學(xué)方法則是市場調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03