
融合?重構(gòu)?區(qū)塊鏈和大數(shù)據(jù)關(guān)系竟如此簡單
最近一段時間,區(qū)塊鏈和大數(shù)據(jù)這兩大熱詞正在被越來越多地放在一起,隨著各種言論的增多,兩者的關(guān)系開始變得撲朔迷離。區(qū)塊鏈將與大數(shù)據(jù)融合發(fā)展?區(qū)塊鏈最終將重構(gòu)大數(shù)據(jù)?圍觀群眾紛紛表示想弄個明白。
“要弄清區(qū)塊鏈和大數(shù)據(jù)的關(guān)系,首先要從兩者的不同開始。”從事互聯(lián)網(wǎng)技術(shù)研究20余年,人稱互聯(lián)網(wǎng)技術(shù)相面師的中國信息通信研究院云計(jì)算與大數(shù)據(jù)研究所所長何寶宏拋出了這一觀點(diǎn)。他認(rèn)為,區(qū)塊鏈和大數(shù)據(jù)技術(shù)存在一定的共性,但是兩者在技術(shù)處理方式上,更多的是不同。
何寶宏 中國信息通信研究院云計(jì)算與大數(shù)據(jù)研究所所長
何寶宏表示,區(qū)塊鏈技術(shù)是分布式數(shù)據(jù)存儲、點(diǎn)對點(diǎn)傳輸、共識機(jī)制、加密算法等計(jì)算機(jī)技術(shù)的新型應(yīng)用模式,區(qū)塊鏈處理的數(shù)據(jù)更小,是細(xì)致的處理方式。而大數(shù)據(jù)管理的是海量數(shù)據(jù),要求廣度和數(shù)量,處理方式上也會粗糙,重點(diǎn)是統(tǒng)計(jì)分析(如下圖)。
“這個時代最大的特點(diǎn)就是變化?!睂τ趨^(qū)塊鏈的興起引發(fā)的業(yè)界的討論、思考和擔(dān)憂,何寶宏認(rèn)為,我們擅長關(guān)注變化的東西,但是實(shí)際上很多變化背后的一些東西是不變的,比如——技術(shù)的規(guī)律。因而,在探討區(qū)塊鏈和大數(shù)據(jù)的關(guān)系時,我們需要跳出技術(shù)看技術(shù)。
客觀而言,作為一個顛覆式的新興技術(shù),區(qū)塊鏈要應(yīng)用在大數(shù)據(jù)場景下,其本身還還不夠成熟,需要進(jìn)一步的研究而探討。而區(qū)塊鏈?zhǔn)欠窨赡苤貥?gòu)大數(shù)據(jù)?何寶宏認(rèn)為基本不存在這一可能,因?yàn)榇髷?shù)據(jù)針對的是非結(jié)構(gòu)化的數(shù)據(jù),而區(qū)塊鏈處理的是結(jié)構(gòu)化數(shù)據(jù)?!皟烧叩哪繕?biāo)數(shù)據(jù)不同,要解決的問題也不同?!?
在4月18日-19日即將于北京國家會議中心召開的“2018大數(shù)據(jù)產(chǎn)業(yè)峰會”上,何寶宏將發(fā)表題為“預(yù)見大數(shù)據(jù)的2018”的演講,就大數(shù)據(jù)、區(qū)塊鏈等技術(shù)發(fā)展背后的規(guī)律,以及2018年的市場動態(tài)和趨勢進(jìn)行展望。下面,小編收集了何寶宏博士近期的精彩觀點(diǎn),供大家提前養(yǎng)養(yǎng)眼、洗洗腦。
區(qū)塊鏈:互聯(lián)網(wǎng)的“大補(bǔ)丁”
草根、全球、自治、分布、開放、透明、對等、匿名、分享……二十年前,人們?nèi)绱诵稳莼ヂ?lián)網(wǎng);今天,這些卻成為了區(qū)塊鏈身上的標(biāo)簽。
這是為何?“區(qū)塊鏈?zhǔn)腔ヂ?lián)網(wǎng)的發(fā)展和延續(xù),是互聯(lián)網(wǎng)的一塊大補(bǔ)丁?!焙螌毢暾J(rèn)為,區(qū)塊鏈顛覆不了互聯(lián)網(wǎng),更顛覆不了世界。如果非要認(rèn)為區(qū)塊鏈可以顛覆世界,只能說那可能是你的世界太小了。
要為區(qū)塊鏈相面,我們能發(fā)現(xiàn)很多問題,如:性能低、能耗高、生態(tài)鏈、安全防護(hù)、隱私保護(hù)、監(jiān)管缺失、標(biāo)準(zhǔn)缺失、不務(wù)正業(yè)等?!耙晕?0多年的互聯(lián)網(wǎng)相面經(jīng)驗(yàn)來說,但凡是有這些問題的技術(shù)都是‘好技術(shù)’,這些缺點(diǎn)隨著時間的推移都是可以克服和解決的。所以,每當(dāng)有人批評區(qū)塊鏈這些缺點(diǎn)時,我都會說這是優(yōu)秀技術(shù)的典型特征?!?
相比較區(qū)塊鏈這樣的顛覆式技術(shù),何寶宏認(rèn)為那些注定要失敗的技術(shù)往往具備以下特征:
1、聲稱包治百病,一句話說不清楚它希望解決的具體問題;
2、概念模糊,一句話說不清楚它的基本思想和原理,與現(xiàn)有技術(shù)的明顯區(qū)別或邊界;
3、準(zhǔn)備從主流市場,最賺錢的市場或存量市場開始;
4、需要建立以我為中心的生態(tài)鏈(技術(shù)富二代除外);
5、看起來過于完美,沒有明顯的取舍,回避需要付出的技術(shù)代價(jià);
6、不考慮摩爾定律是否支持;
7、經(jīng)濟(jì)學(xué)規(guī)律模糊,歷史案例牽強(qiáng)。
區(qū)塊鏈的本質(zhì)是分布式賬本。何寶宏認(rèn)為,分布式賬本是“剛需”。過去的幾百年,我們一直在使用集中式的記賬方式,沒有一種手段能夠支持高效的分布式記賬,直到區(qū)塊鏈的出現(xiàn)。
“成年后的技術(shù)大多活成自己討厭的樣子?!眳^(qū)塊鏈的特點(diǎn)是去中心化、防篡改、匿名性,但是隨著其不斷成熟和落地,這些特征需要從更深層次去理解。
分布式≠去中心
分布式不等于去中心?!案吆叭ブ行牡拇蠖鄶?shù)是自己想成為新的中心?!焙螌毢暌员忍貛艦槔?,其代碼控制在Core小組手中,算力是高度集中的。同時,有報(bào)告顯示,40%的比特幣實(shí)際上是集中在1000個人手里,而另外一個報(bào)告則說,96.53%的比特幣歸屬于4.11%的地址。因而,隨著區(qū)塊鏈的發(fā)展,去中心正在變成多中心。
防篡改≠不可修改
防篡改不等于不可修改。在何寶宏看來,人會犯錯,數(shù)據(jù)因而也會出錯。在會計(jì)體系里,不允許做假賬但是允許改錯賬。在傳統(tǒng)的數(shù)據(jù)庫技術(shù)中,修改是很容易實(shí)現(xiàn)的,因而需要一些管理手段來防止篡改。但是今天,區(qū)塊鏈技術(shù)是不可修改,那么如果數(shù)據(jù)出錯了怎么辦?因而需要在不可篡改的技術(shù)上加上“可修改”。
保護(hù)隱私≠匿名
保護(hù)隱私不意味著一定要匿名。何寶宏認(rèn)為,匿名是保護(hù)隱私的一種方法和手段,但不是絕對。二十多年前的互聯(lián)網(wǎng)是匿名的、全球化的,誰也關(guān)不掉,共享且自治。然而,到了今天,登陸一個網(wǎng)站,你就需要輸入驗(yàn)證碼,以證明自己是人,而不是機(jī)器或其他。
對共識機(jī)制難有共識
“對共識機(jī)制,難有共識?!焙螌毢暾f,我們需要共識,但我們的共識機(jī)制本身卻是分裂的、碎片化的。我們用POW比誰勁大,用POS比誰錢多,這是典型的從原始社會過渡到資本主義社會的“玩法”。后來錢多了人也太多了,于是又用DPOS搞出了代理人機(jī)制。
共識機(jī)制如何形成共識,屬于控制層面范疇,這個共識特別難。要有這樣的共識就必須要有共識之母,一個共識前面還得有一個共識才能形成后面的共識,共識也是鏈?zhǔn)浇Y(jié)構(gòu)的,信任也是鏈?zhǔn)浇Y(jié)構(gòu)的。因而,說區(qū)塊鏈?zhǔn)侨バ湃蔚模鞘遣豢赡艿摹?
小產(chǎn)業(yè)、大變革
從技術(shù)的角度上看,區(qū)塊鏈就是將原來的單個賬本變成了現(xiàn)在的多個賬本。原來,所有的數(shù)據(jù)庫之間是主從關(guān)系,賬本只有一個;今天多個數(shù)據(jù)庫之間是對等關(guān)系,賬本從一個變成多。
從一個會計(jì)到多個會計(jì),以前記賬可以讀、寫、改、刪,今天記賬只有讀和寫;以前記賬要給會計(jì)發(fā)工資,進(jìn)行外部激勵,我們今天自己激勵就可以了;以前所有公司的商務(wù)和財(cái)務(wù)都是分離的,付賬過程特別繁瑣;今天的智能合約是商務(wù)財(cái)務(wù)一體化,這就顛覆了我們很多的想法。
以前,代碼就是技術(shù);今天,代碼變成了金融產(chǎn)品,所以就出現(xiàn)了新的機(jī)會。以前,數(shù)據(jù)主要是指信息,技術(shù)則就是如何幫它更廣泛的傳播;現(xiàn)在數(shù)據(jù)越來越成為資產(chǎn),技術(shù)的走向就要發(fā)生很大的變化。
以前,二進(jìn)制代碼表達(dá)的是信息;今天,二進(jìn)制代碼表達(dá)的是一種財(cái)產(chǎn)。數(shù)據(jù)即資產(chǎn),資產(chǎn)即數(shù)據(jù)。當(dāng)二進(jìn)制代碼代表資產(chǎn),技術(shù)的核心要義就要走向保護(hù),要去管理和控制。技術(shù)的目的從最大限度的傳播,轉(zhuǎn)為考慮如何把代碼圈起來。
區(qū)塊鏈?zhǔn)切‘a(chǎn)業(yè)、大變革。它顛覆的是我們的經(jīng)濟(jì)、經(jīng)濟(jì)運(yùn)營最底層的復(fù)式記賬法。我們用了幾百年的復(fù)式記賬法將演進(jìn)為三式記賬法。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
訓(xùn)練與驗(yàn)證損失驟升:機(jī)器學(xué)習(xí)訓(xùn)練中的異常診斷與解決方案 在機(jī)器學(xué)習(xí)模型訓(xùn)練過程中,“損失曲線” 是反映模型學(xué)習(xí)狀態(tài)的核心指 ...
2025-09-19解析 DataHub 與 Kafka:數(shù)據(jù)生態(tài)中兩類核心工具的差異與協(xié)同 在數(shù)字化轉(zhuǎn)型加速的今天,企業(yè)對數(shù)據(jù)的需求已從 “存儲” 轉(zhuǎn)向 “ ...
2025-09-19CDA 數(shù)據(jù)分析師:讓統(tǒng)計(jì)基本概念成為業(yè)務(wù)決策的底層邏輯 統(tǒng)計(jì)基本概念是商業(yè)數(shù)據(jù)分析的 “基礎(chǔ)語言”—— 從描述數(shù)據(jù)分布的 “均 ...
2025-09-19CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-19SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實(shí)戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價(jià)值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實(shí)戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗(yàn)與 t 檢驗(yàn):差異、適用場景與實(shí)踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計(jì)學(xué)領(lǐng)域,假設(shè)檢驗(yàn)是驗(yàn)證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計(jì)劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計(jì)劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實(shí)踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價(jià)值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點(diǎn)數(shù)據(jù)的科學(xué)計(jì)數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點(diǎn)數(shù)據(jù)時的科學(xué)計(jì)數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價(jià)值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營問題、提升執(zhí)行效率的核心手段,其價(jià)值 ...
2025-09-12用 SQL 驗(yàn)證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實(shí)戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計(jì)” 與 “用戶體驗(yàn) ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當(dāng)下,精準(zhǔn)營銷成為企業(yè)突圍的核心方 ...
2025-09-11