
那么多大數(shù)據(jù)公司“買數(shù)據(jù)” 怎么保護數(shù)據(jù)隱私?
數(shù)據(jù)是什么?是金子,也就是錢??!
最近統(tǒng)計來看,全國已經(jīng)有三百多家大數(shù)據(jù)公司,但在大數(shù)據(jù)發(fā)展初期這個情況下,國內(nèi)大數(shù)據(jù)交易的現(xiàn)狀是:供不應求!所以各種形式的數(shù)據(jù)交易公司都出來“賣數(shù)據(jù)”賺錢了;
還有個趨勢是,無論是國內(nèi)、國外,大數(shù)據(jù)集中在大廠中,更可氣的是還通過兼并使數(shù)據(jù)公司越來越少,構成商業(yè)壁壘。so,數(shù)據(jù)聚集在一小部分企業(yè)手中,創(chuàng)業(yè)公司縱使有好的想法,拿不到足夠大的數(shù)據(jù)也無濟于事。這么看來,數(shù)據(jù)就是命啊!
所以,在這幾天舉辦的第九屆中國大數(shù)據(jù)技術大會上,也特意開了數(shù)據(jù)市場及交易分論壇,給大家答疑解惑。在此摘一些觀點來分享。
其實,國內(nèi)大數(shù)據(jù)交易的現(xiàn)狀除了供不應求,還非常不均衡。
具體說來,數(shù)據(jù)堂副總裁肖永紅介紹了數(shù)據(jù)的四個特點:
第一個特點是頭重腳輕。互聯(lián)網(wǎng)企業(yè)和高科技企業(yè)在大數(shù)據(jù)產(chǎn)業(yè)里面起領跑作用。因為他們有大量的用戶數(shù)據(jù),比如百度,有大量用戶搜索數(shù)據(jù);比如阿里,掌握了全國海量的電商行為數(shù)據(jù),比如騰訊,也掌握了全部的社交數(shù)據(jù)。有了這些數(shù)據(jù)以后,就可以“攜數(shù)據(jù)以令諸侯”。(這個重要系醒表現(xiàn)在:阿里已經(jīng)在和一些地方政府、甚至和國家層面合作;現(xiàn)在可以根據(jù)每年雙十一,或者淘寶的交易量,反過來推測中國經(jīng)濟運行的狀況。)
第二個特點,目前大數(shù)據(jù)產(chǎn)業(yè)分布偏重在應用環(huán)節(jié)。
第三特點,應用領域行業(yè)分布還不夠廣,集中于電商行業(yè),在傳統(tǒng)行業(yè)非常少。
第四特點,缺乏綜合性的數(shù)據(jù)聚合流通平臺。雖然這一年兩年內(nèi)冒出了很多,但是遠遠不夠。
當然,了解了數(shù)據(jù)特點,就能更好地尋找數(shù)據(jù)源。那么數(shù)據(jù)都在哪里,如何收集?
對應上文所說,首先是互聯(lián)網(wǎng)企業(yè)。很多數(shù)據(jù)都是在各個行業(yè)領域的IDC或者數(shù)據(jù)中心的服務器上面;
其次,在電信運營商領域。大家已經(jīng)意識到,運營商的用戶行為數(shù)據(jù)特別是移動用戶的行為數(shù)據(jù),非常有價值;
并且,科技部和財政部在四五年前,提出了一個全國科學數(shù)據(jù)共享基礎工程,圍繞人口健康、交通科學,以及地理、地球、氣象等方面,已經(jīng)做了很多科研和科學領域的數(shù)據(jù)共享平臺;
針對傳統(tǒng)行業(yè)數(shù)據(jù)收集,可以利用眾包的形式,以及利用傳感器記錄、采集線下分散的數(shù)據(jù);
另外最近還有一個趨勢,很多高校和科研機構也在收集大量的數(shù)據(jù),因為他們做項目也需要大量的數(shù)據(jù)支撐;
另一方面,現(xiàn)在很多個人、公司都在找數(shù)據(jù),也愿意花錢買,所以無論是官方的還是企業(yè)的數(shù)據(jù)交易市場,在今年格外火爆。
因此,另外一塊就是數(shù)據(jù)源變現(xiàn)的形式。這幾年商業(yè)數(shù)據(jù)或者政府大數(shù)據(jù)變現(xiàn)項目也有大量數(shù)據(jù)。
比如官方的,如北京市政務數(shù)據(jù)資源網(wǎng)、九次方在“中國數(shù)都”貴陽籌建“貴陽大數(shù)據(jù)交易所”、中關村“數(shù)?!贝髷?shù)據(jù)交易平臺、北京軟交所旗下“北京大數(shù)據(jù)交易服務平臺”,以及各地風起云涌的大數(shù)據(jù)交易平臺、交易所,如亞信和武漢市政府長江大數(shù)據(jù)交易所,都是開放了一些官方數(shù)據(jù),由政府背書,但還是沒有配套法律規(guī)范。
企業(yè)層面,有登上新三板的數(shù)據(jù)堂,以及百度API Store 聚合平臺、聚合數(shù)據(jù)。
但是,數(shù)據(jù)交易需求雖然很大,但是畢竟沒有配套法律規(guī)范。因此,在交易流通中存在很多問題。中國信息通信研究院高級工程師韓涵總結(jié),數(shù)據(jù)流通交易面臨兩個極端:一是黑市交易無序流動,二是數(shù)據(jù)凍結(jié)無法流動。
首先,來看看數(shù)據(jù)交易流程中會遇到什么問題?
來自亞信數(shù)據(jù)的龔靜介紹,總結(jié)來說,包括四個方面:尋找成本,需要很快的去找到對方;實施成本,數(shù)據(jù)流通過程中涉及到很多協(xié)議、數(shù)據(jù)格式,需要方便的工具來做協(xié)議的轉(zhuǎn)換;信任成本,需要監(jiān)管渠道,中介不會竊取數(shù)據(jù);外部成本,即隱私數(shù)據(jù)要得到保護。
因此,為了規(guī)范交易流程來保護各方利益,目前數(shù)據(jù)流程模型,大體來說有三種:
第一種是最簡單的,數(shù)據(jù)供需雙方直接進行交互。但流通中四個成本都非常高。
第二種,加入數(shù)據(jù)中介。尋找成本變低了,但信任成本增高了。
第三種流通模型,是再引入一個產(chǎn)權人的角色??梢员U系谌嚼?,降低外部成本。
所以,每一方的利益都能夠得到保障,數(shù)據(jù)流動才能真正在全社會流轉(zhuǎn)起來。
其次,針對數(shù)據(jù)壁壘問題,怎么破?
最近有一個詞匯比較流行——數(shù)據(jù)的民主化,像政治上的民主,能夠做到數(shù)據(jù)的民主,用數(shù)據(jù)激發(fā)創(chuàng)新。還有共享經(jīng)濟,包括對數(shù)據(jù)價值的共享,亞信也提出了一個想法:數(shù)據(jù)去中心化。
意思是,在數(shù)據(jù)流動的過程當中,整個數(shù)據(jù)不會經(jīng)過任何一方,而是直接在數(shù)據(jù)流動的參與方之間進行流動。這種數(shù)據(jù)去中心化的數(shù)據(jù)流通方式,和P2P下載、電話交換網(wǎng)的模式類似:參與方的認證、計費、公證的環(huán)節(jié),可以由數(shù)據(jù)中介平臺來完成。完成之后,在數(shù)據(jù)需求方和數(shù)據(jù)提供方之間進行數(shù)據(jù)的流動。
此外,完善的流程還需要保護數(shù)據(jù)隱私。
因此,平臺還要使數(shù)據(jù)可用不可見。數(shù)據(jù)雙方各把加密之后的數(shù)據(jù)放到這個數(shù)據(jù)交易的中介平臺上來,在這個平臺上進行碰撞,碰撞之后,把這個結(jié)果進行解密,返還給雙方,然后再把數(shù)據(jù)銷毀;數(shù)據(jù)版權要保護起來。當有侵犯到你版權的數(shù)據(jù)在市場上流動時候,你可以通過平臺來發(fā)現(xiàn)它。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
用 SQL 生成逆向回滾 SQL:數(shù)據(jù)操作的 “后悔藥” 指南? 在數(shù)據(jù)庫操作中,誤刪數(shù)據(jù)、錯改字段或誤執(zhí)行批量更新等問題時有發(fā)生。 ...
2025-07-14如何考取數(shù)據(jù)分析師證書:以 CDA 為例? ? 在數(shù)字化浪潮席卷各行各業(yè)的當下,數(shù)據(jù)分析師已然成為企業(yè)挖掘數(shù)據(jù)價值、驅(qū)動決策的 ...
2025-07-14t檢驗與Wilcoxon檢驗的選擇:何時用t.test,何時用wilcox.test? t 檢驗與 Wilcoxon 檢驗的選擇:何時用 t.test,何時用 wilcox. ...
2025-07-14AI 浪潮下的生存與進階: CDA數(shù)據(jù)分析師—開啟新時代職業(yè)生涯的鑰匙(深度研究報告、發(fā)展指導白皮書) 發(fā)布機構:CDA數(shù)據(jù)科 ...
2025-07-13LSTM 模型輸入長度選擇技巧:提升序列建模效能的關鍵? 在循環(huán)神經(jīng)網(wǎng)絡(RNN)家族中,長短期記憶網(wǎng)絡(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準備指南? ? 在數(shù)據(jù)驅(qū)動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認 ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務的價值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預測分析中的應用:從數(shù)據(jù)查詢到趨勢預判? ? 在數(shù)據(jù)驅(qū)動決策的時代,預測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點,而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報考到取證的全攻略? 在數(shù)字經(jīng)濟蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗:捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準 ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應用與實戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗:數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領域中,準確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認證作為國內(nèi)權威的數(shù)據(jù)分析能力認證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應對策略? 長短期記憶網(wǎng)絡(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(RNN)的一種變體,憑借獨特的門控機制,在 ...
2025-07-07統(tǒng)計學方法在市場調(diào)研數(shù)據(jù)中的深度應用? 市場調(diào)研是企業(yè)洞察市場動態(tài)、了解消費者需求的重要途徑,而統(tǒng)計學方法則是市場調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07