
數(shù)據(jù)集市的挑戰(zhàn)是識別和處理數(shù)據(jù)安全
由于企業(yè)數(shù)據(jù)可見性的增強和數(shù)據(jù)安全團隊的要求,數(shù)據(jù)集市團隊面臨的挑戰(zhàn)是確保某些客戶屬性被識別和“處理”。要求技術提供商演示對潛在敏感數(shù)據(jù)的自動識別和操作,以此來解決這個問題。
簡而言之,測試包括攝取一個提供的樣本數(shù)據(jù)集,然后演示該平臺大幅簡化和加快準備和交付自助式業(yè)務就緒數(shù)據(jù)的能力,包括潛在敏感數(shù)據(jù)的識別和治理。
信息治理涵蓋多個方面,包括準確性、完整性、一致性、可訪問性、隱私和信息安全。在本文中,我們不討論信息治理的所有方面,而是專注于數(shù)據(jù)安全及其在這一背景下的意義。
聚焦PII:個人可識別信息
數(shù)據(jù)集市旨在向企業(yè)用戶提供高質(zhì)量的自助式數(shù)據(jù),幫助他們更快地獲得洞見。更容易訪問更多數(shù)據(jù),這只會加劇要求企業(yè)安全團隊為所有這些可用新信息提供安全保障的重要性。
如果你正在打造一個精心設計、有效執(zhí)行的數(shù)據(jù)集市,你可能面臨很多挑戰(zhàn),包括如何保護你的數(shù)據(jù)。所有的安全措施都用上了:AD、ACL’s、Kerberos、加密等等。然而,數(shù)據(jù)安全的一個方面常常被忽視:你怎么知道哪些數(shù)據(jù)需要保護?有的人把所有數(shù)據(jù)都封鎖起來,這限制了需要數(shù)據(jù)的用戶獲取數(shù)據(jù),大幅降低數(shù)據(jù)的價值。有的人可能會定義他們“認為”敏感的屬性,這會使本應被保護的未知屬性處于未被保護的險境。
“到2018年,90%已部署的數(shù)據(jù)湖將失效,因為以不確定的使用案例為目的而收集的信息資產(chǎn)會讓它們不堪重負。”
想要解決這個問題,請明智地選擇你的解決方案。有一些提供商在做PII探測,而且做得很好,堪為表率。你要找的提供商應該是已經(jīng)開發(fā)出了作為數(shù)據(jù)打通(data on-boarding)一部分的流程和技術,在字段層面上及早發(fā)現(xiàn)可能敏感的模式。這不僅僅是出于安全原因。從攝取時就管理所有數(shù)據(jù)(包括管理數(shù)據(jù)訪問權限),這已經(jīng)解決或緩和了困擾數(shù)據(jù)湖企業(yè)的很多挑戰(zhàn)。
各級數(shù)據(jù)專家:你需要擁有數(shù)據(jù)集市治理
首席信息官、首席技術官、首席數(shù)據(jù)官和那些參與或負責信息治理實踐的人感受到了前所未有的壓力。為什么?因為大多數(shù)的數(shù)據(jù)湖致力于存儲和處理數(shù)據(jù),而不是治理數(shù)據(jù)。
統(tǒng)計結果顯示,如果IT企業(yè)員工的治理技能水平參差不齊,那么公司內(nèi)部很可能存在數(shù)據(jù)孤島,這會加劇整個企業(yè)的脆弱性和風險。
“不到10%的數(shù)據(jù)湖企業(yè)正式確定了他們的治理方法。”
融合:元數(shù)據(jù)、治理和安全
在過去兩三年里,很多企業(yè)已經(jīng)或者正在建立數(shù)據(jù)湖。數(shù)據(jù)湖擁有巨大吸引力:自助式按需訪問所有數(shù)據(jù),不管數(shù)據(jù)存儲在哪里。但IT管理人員往往很快發(fā)現(xiàn),由于不符合內(nèi)部數(shù)據(jù)安全要求,自助式數(shù)據(jù)管理模式無法實現(xiàn)。
這意味著,用意良好的數(shù)據(jù)湖已經(jīng)變成了一個累贅而不是共享庫,只向一位或少數(shù)幾位授權用戶按需提供安全的數(shù)據(jù)。這違背了數(shù)據(jù)湖的初衷,對信息搜索者來說既耗費了資源,又沒有得到好處。
大數(shù)據(jù)要求我們從頭反思數(shù)據(jù)治理。大數(shù)據(jù)治理不是從物理上把沙盒和生產(chǎn)數(shù)據(jù)分割開來,而是在數(shù)據(jù)從“未經(jīng)加工”到“準備就緒”的成熟過程中,從邏輯上控制數(shù)據(jù)的訪問和使用。你怎么知道數(shù)據(jù)是否準備好用于生產(chǎn)?看元數(shù)據(jù)。任何支持生產(chǎn)使用數(shù)據(jù)的大數(shù)據(jù)平臺都必須擁有元數(shù)據(jù),追蹤數(shù)據(jù)攝取、安全、驗證、準備和使用的周期。
元數(shù)據(jù)=更好的數(shù)據(jù)
元數(shù)據(jù)需要管理數(shù)據(jù)訪問權限、取得數(shù)據(jù)概要結果,數(shù)據(jù)開發(fā)者和終端用戶的反饋。元數(shù)據(jù)儲存了定義生產(chǎn)準備就緒的策略,而且能夠執(zhí)行這些策略。沒有元數(shù)據(jù),數(shù)據(jù)湖就會無法使用,并變成一個嚴重的安全風險。
很少有人真正知道如何把公司的內(nèi)部安全政策有效地應用于數(shù)據(jù)。讓當今的商業(yè)技術取代以人力進行的猜測,因為沒人可能知道所有來源、所有領域的內(nèi)容。利用豐富的元數(shù)據(jù),再結合模式自動識別,這是在全公司上下推行大規(guī)模戰(zhàn)略計劃的基礎。
當你制定自助式數(shù)據(jù)戰(zhàn)略時,由元數(shù)據(jù)驅(qū)動、通過明確流程管理的數(shù)據(jù)安全不僅可以降低風險,還能為你提供超越傳統(tǒng)數(shù)據(jù)湖、實現(xiàn)自助式數(shù)據(jù)集市的真正希望。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關鍵? 在循環(huán)神經(jīng)網(wǎng)絡(RNN)家族中,長短期記憶網(wǎng)絡(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準備指南? ? 在數(shù)據(jù)驅(qū)動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認 ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務的價值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預測分析中的應用:從數(shù)據(jù)查詢到趨勢預判? ? 在數(shù)據(jù)驅(qū)動決策的時代,預測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結束)并非工作的終點,而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報考到取證的全攻略? 在數(shù)字經(jīng)濟蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗:捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準 ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應用與實戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗:數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領域中,準確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認證作為國內(nèi)權威的數(shù)據(jù)分析能力認證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應對策略? 長短期記憶網(wǎng)絡(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(RNN)的一種變體,憑借獨特的門控機制,在 ...
2025-07-07統(tǒng)計學方法在市場調(diào)研數(shù)據(jù)中的深度應用? 市場調(diào)研是企業(yè)洞察市場動態(tài)、了解消費者需求的重要途徑,而統(tǒng)計學方法則是市場調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準確性的基礎 ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03