99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

熱線電話:13121318867

登錄
首頁職業(yè)發(fā)展大數(shù)據(jù)的小時(shí)代,沒有IOE也能玩轉(zhuǎn)智慧城市
大數(shù)據(jù)的小時(shí)代,沒有IOE也能玩轉(zhuǎn)智慧城市
2015-12-21
收藏

大數(shù)據(jù)的小時(shí)代,沒有IOE也能玩轉(zhuǎn)智慧城市

如今一談到大數(shù)據(jù),人們就會聯(lián)想到數(shù)百TB以上且規(guī)模不斷增長的Hadoop集群系統(tǒng),人們?yōu)檫^去兩年我們制造了超過人類歷史總和的數(shù)據(jù)量而感到顫抖,但實(shí)際上大數(shù)據(jù)可以很小,甚至在智能手機(jī)和筆記本上就能進(jìn)行分析處理,而聰明的機(jī)器學(xué)習(xí)算法能將大型強(qiáng)子對撞機(jī)數(shù)據(jù)分析工作量減少上萬倍;后大數(shù)據(jù)時(shí)代,人們將更加關(guān)心如何讓大數(shù)據(jù)“大事化小”。

但在粒度更小,數(shù)據(jù)規(guī)模卻更大的智能傳感器時(shí)代,在一場官方色彩越來越濃的“去IOE運(yùn)動”中,如何利用本土低成本技術(shù)資源,在Hadoop之外尋找一條新的開源大數(shù)據(jù)處理技術(shù)方案?如何在大力開展“智慧城市”等物聯(lián)網(wǎng)大數(shù)據(jù)項(xiàng)目的同時(shí)防止對個(gè)人隱私的侵犯?

在計(jì)算機(jī)科學(xué)中, 一個(gè)簡單的真理可以預(yù)言一部分未來: “正在CERN(歐洲粒子物理研究所)上演的將很快發(fā)生在世界上每個(gè)地方?!?我們還可以再加上第二個(gè)預(yù)言: “一切正在聚集的將最終以分散結(jié)尾?!?這與大數(shù)據(jù)應(yīng)用有何關(guān)系?

大數(shù)據(jù)通常都很小

許多所謂的 “大數(shù)據(jù)” 問題其實(shí)并不是那么大。一個(gè)中央銀行五年的交易數(shù)據(jù)量大概有100GB 大小。所以,中央銀行一年的交易數(shù)據(jù)是完全能夠被存儲在一部智能手機(jī)中的。 一所保險(xiǎn)公司關(guān)于一個(gè)國家的所有交易數(shù)據(jù)量不會超過4TB。 一個(gè)硬盤就可以儲存這些保險(xiǎn)數(shù)據(jù)。

那些由企業(yè)巨額投資的被標(biāo)記為時(shí)尚 “大數(shù)據(jù)”用來解決數(shù)據(jù)分析問題的基礎(chǔ)結(jié)構(gòu),實(shí)際上完全可以通過一臺筆記本 —— 甚至是一部智能手機(jī) —— 和開源軟件來替代。研究者們和全球金融機(jī)構(gòu)都用像 Scikit-Learn[1]Pandas[2]NLTK[3] 這樣的開源軟件來處理交易數(shù)據(jù)和客戶關(guān)系數(shù)據(jù)。如MariaDB[4]這樣傳統(tǒng)的數(shù)據(jù)庫現(xiàn)如今能夠處理差不多每秒1百萬的錄入。MariaDB 10.0[5] 甚至還有來自淘寶的開發(fā)人員開發(fā)的一些可以被延伸的復(fù)制技術(shù)。

我建議在進(jìn)行昂貴的投資前:先購買一個(gè)小型的含至少32 GB記憶卡的GNU/Linux 服務(wù)器, 一個(gè)大容量的SSD 盤(例如 1 TB)并學(xué)習(xí) Scikit-Learn 機(jī)器學(xué)習(xí)工具包102[30] (基于Andrew Ng吳恩達(dá),最近加入百度的機(jī)器學(xué)習(xí)之父[31]的課程)。在大多數(shù)情況下,這些已經(jīng)足夠解決您的問題。 如果還不夠,您還可以設(shè)計(jì)一個(gè)稍后能夠延伸成一個(gè)大型基礎(chǔ)架構(gòu)的模型。Scikit-Learn 被許多谷歌工程師用作 “大數(shù)據(jù)” 問題建模解決方案的工具包。

最小的微粒生產(chǎn)出最大的數(shù)據(jù)

極端的挑戰(zhàn)由核物理及小微粒研究提出來,不斷引導(dǎo)了新信息技術(shù)的創(chuàng)造。 HTML 是由在歐洲核子研究組織 – 也被稱為CERN 的Tim Berners Lee于1991 為解決大規(guī)模文檔管理的問題而創(chuàng)造。CERN的大型強(qiáng)子對撞機(jī) (the Large Hadron Collider,簡稱LHC)被設(shè)計(jì)用作處理每秒1 PB 的數(shù)據(jù)。它在2013年提供了第一個(gè)證明 希格斯玻色子 [6]存在的證據(jù), 這是一個(gè)在過去的50年里都沒有被解決的問題。

讓我們來理解一下每秒1 PB 的數(shù)據(jù)意味著什么。 1 PB和1,000 TB, 1,000,000 GB 或者是13.3年的HD視頻容量一樣大。 能夠每秒處理1 PB的數(shù)據(jù)相當(dāng)于能夠處理419,428,800個(gè)(13.3*365*24*3600)HD攝像設(shè)備生成的數(shù)據(jù)。這比中國的閉錄電視攝像機(jī)[7]多15倍, 比英國的多100倍[8].

總的說來,在CERN里為小粒子創(chuàng)造的技術(shù)可以被應(yīng)用到實(shí)時(shí)收集和處理地球上每個(gè)人制造的以聲音,視頻,健康監(jiān)測,智能材料日志等形式存在的數(shù)據(jù)。

智能傳感器介紹

大數(shù)據(jù)結(jié)構(gòu)成功的關(guān)鍵概念是它可以迅速丟棄收集的大部分?jǐn)?shù)據(jù)并最終只 儲存其中的一小部分[9]。 這是通過將大多數(shù)數(shù)據(jù)處理轉(zhuǎn)移到所謂的 “人工智能”的智能傳感器上來實(shí)現(xiàn),在現(xiàn)實(shí)的高級統(tǒng)計(jì)學(xué)中也被叫做機(jī)器學(xué)習(xí)。

大型強(qiáng)子對撞機(jī)的傳感器之一 ,叫做 緊湊μ子線圈 (CMS)[10] – 每秒中能夠收集3太字節(jié)代表小型粒子碰撞的圖像數(shù)據(jù)。然后它會自動丟棄被認(rèn)為是無關(guān)的圖像并”只” 發(fā)送每秒100 Mb到LHC存儲結(jié)構(gòu)中,這比它收集的原始數(shù)據(jù)要少30,000倍。傳感器本身使用了FPGA, 一種能夠比一般處理器更快處理數(shù)據(jù)的可編程硬件, 來實(shí)施叫做 “clustering”[11]機(jī)器學(xué)習(xí)運(yùn)算法則。

如果我們希望將大型強(qiáng)子對撞機(jī)的想法應(yīng)用到閉錄電視監(jiān)控, 我們可以在每個(gè)攝像機(jī)中存儲幾個(gè)小時(shí)的視頻并使用一個(gè)FPGA 或者一個(gè)GPU直接在攝影機(jī)中實(shí)時(shí)處理視頻數(shù)據(jù)。我們可以使用可改編程序的人工智能來偵查人群的數(shù)量,性別,尺寸, 行為(和平的, 暴力的, 偷偷摸摸的,迷路的,工作的等等),一個(gè)物品的存在(例如:一個(gè)手提箱)或一個(gè)物品的缺少(例如: 一個(gè)路燈)。 只有這些元數(shù)據(jù)才可以通過網(wǎng)絡(luò)被發(fā)送到一個(gè)中央處理設(shè)備。 如果有需要的話,這個(gè)設(shè)備可以決定下載相關(guān)的圖片或著視頻片段。 以防出現(xiàn)一個(gè)地區(qū)的閉錄電視被犯罪人員破壞而無法進(jìn)行連接的情況,然后發(fā)送一個(gè) consumer drone 遙控飛行器[12] 去檢查問題的源頭。

總的來說, LHC告訴我們?nèi)绾瓮ㄟ^少量的投資或者是廣泛的覆蓋面來快速建立一個(gè)有效的攝像監(jiān)控系統(tǒng)。 這個(gè)系統(tǒng)能夠被 – 在世界上的任何地方- 部署到現(xiàn)存的窄頻帶通信網(wǎng)絡(luò) – 包括GSM。它同樣也比集中存儲和處理所有信息的系統(tǒng)更加有彈性。并且它在電力中斷的時(shí)候也可以離線工作。

智能隱私,智慧市場

“With the tapping program code-named PRISM, the U.S. government has infringed on the privacy rights of people both at home and abroad” 由新華網(wǎng)在2014年2月28日發(fā)表,它解釋了美國人權(quán)的現(xiàn)狀[13]. 類似的項(xiàng)目在許多國家都實(shí)施了嚴(yán)格的隱私法律[27]. 65%的市場份額都貢獻(xiàn)給了監(jiān)控和背后強(qiáng)大的經(jīng)濟(jì)力量。如果不加以規(guī)范管理, 大數(shù)據(jù)是最容易侵犯隱私權(quán)的技術(shù)之一。

blog-Big.Data.Candidate
大數(shù)據(jù)的候選市場[14]

智能傳感器提供了一個(gè)可能的解決方案, 只要編碼能夠由獨(dú)立的負(fù)責(zé)隱私的權(quán)利機(jī)關(guān)審核。通過在傳感器中丟棄,加密并匿名化大多數(shù)的數(shù)據(jù), 并在產(chǎn)出地加強(qiáng)執(zhí)行隱私律法,濫用監(jiān)控系統(tǒng)的風(fēng)險(xiǎn)可以通過缺少原始數(shù)據(jù)的傳輸和缺少集中的存儲來降低。傳感器訪問記錄可以作為開源數(shù)據(jù)發(fā)布出來以確保審核的完成。

升級閉錄電視到智能攝像機(jī)僅在中國就代表了每年2千億元人民幣的市場。 一個(gè)國有的升級項(xiàng)目可以作為在智能攝像機(jī)內(nèi)建立”智慧城市” 核心功能的契機(jī):公共網(wǎng)絡(luò)的訪問, 網(wǎng)頁加速,微云,移動存儲卸載, 地理定位, 多重訪問mesh網(wǎng)絡(luò),無障礙收費(fèi)系統(tǒng)等等。 這些只是許多可以進(jìn)行開發(fā)應(yīng)用的一小部分,并且日后還可以在全球范圍內(nèi)推廣,因?yàn)?nbsp;中國是最大的閉錄電視系統(tǒng)的生產(chǎn)方并且已經(jīng)和許多外國國防工業(yè)有緊密的合作關(guān)系[15]。

物聯(lián)網(wǎng)代表了更大的數(shù)據(jù)

到2020年,監(jiān)控系統(tǒng)將不再是大數(shù)據(jù)的首要市場了。 根據(jù)Gartner分析,260億個(gè)對象將會被連接到互聯(lián)網(wǎng)[16], 超出全球范圍的閉錄電視攝像機(jī)數(shù)量的100倍。連接的對象包含工廠,車,電子消費(fèi)品,工業(yè)傳感器,風(fēng)力發(fā)電機(jī),交通燈等使用的工業(yè)用傳感器。

通過故障預(yù)測進(jìn)行預(yù)防性維護(hù) —— 一個(gè)機(jī)器學(xué)習(xí)和大數(shù)據(jù)的直接應(yīng)用,以及其它的智慧功能都將會被內(nèi)嵌入對象中。低價(jià)系統(tǒng)芯片(SOC)里的GPU 將被用于實(shí)施低成本高速度的機(jī)器學(xué)習(xí)[17]。

中國工業(yè)已經(jīng)具有了一個(gè)連接物聯(lián)網(wǎng)及大數(shù)據(jù)的優(yōu)勢。 最近ARM, 展訊(Spreadtrum), 全志科技(Allwinner), 瑞芯微電子(Rockchip),華為以及其他公司的結(jié)盟[18]強(qiáng)調(diào)了中國設(shè)計(jì)的以ARM為基礎(chǔ)解決方案逐漸增長的重要性。我們可以想象, 在幾年的時(shí)間內(nèi),一個(gè)有GPU, 網(wǎng)絡(luò)及Linux操作系統(tǒng)的系統(tǒng)芯片價(jià)值將不超過1美元。用這個(gè)價(jià)錢,它將可以成為用來為智能設(shè)備實(shí)施機(jī)器學(xué)習(xí)運(yùn)算法則的標(biāo)準(zhǔn)組件。更高端一點(diǎn)來說, 一個(gè)大數(shù)據(jù)集群可以被設(shè)計(jì)成一個(gè)多核ARM 系統(tǒng)的系統(tǒng)芯片(SOC)以及固態(tài)硬盤(SSD)。首次,所有的組件都可以來自中國并且用比因特爾更低的成本提供相同質(zhì)量的性能。

blog-MCA.Picture
中國移動計(jì)算聯(lián)盟(MCA) 于2014年4月在深圳正式成立(Credit. Bob Peng, ARM) [18]

現(xiàn)在所缺乏的是通過使用高效的分布式運(yùn)算法則來處理數(shù)據(jù)的軟件。考慮到最近在中國討論的”No ICE Policy [21]” 以及HADOOP對Java強(qiáng)烈的依賴性(一個(gè)現(xiàn)在被Oracle控制的產(chǎn)品)。這正是考慮為大數(shù)據(jù)使用另一種軟件解決方案的最佳時(shí)機(jī)。近期,許多社區(qū)都開始在 Python的Numpy 開源技術(shù)上整合他們的數(shù)據(jù)處理能力[20, 21] 另外一些則是在創(chuàng)建新的語言例如Julia [22]。需要解決的大挑戰(zhàn)之一是 “out-of-core” 數(shù)據(jù)處理,即超越可用存儲器的極限來處理數(shù)據(jù)。像Wendelin [23] 和Blaze [24] 這樣的項(xiàng)目已經(jīng)都在進(jìn)行中用來提供開源的解決方案。

總的來說,我們的猜測是”No ICE”的解決方法將會在中國的這些大數(shù)據(jù)項(xiàng)目中里被創(chuàng)造出來 – 例如 貴州[25]或著新疆 [26] – 由數(shù)以億計(jì)的人民幣預(yù)算作為強(qiáng)大的后盾,向純粹的科技創(chuàng)新敞開大門, 使其能夠處理由智能傳感器產(chǎn)生的艾字節(jié)或是zetabytes數(shù)據(jù)。

數(shù)據(jù)分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數(shù)據(jù)分析師資訊
更多

OK
客服在線
立即咨詢
客服在線
立即咨詢
') } function initGt() { var handler = function (captchaObj) { captchaObj.appendTo('#captcha'); captchaObj.onReady(function () { $("#wait").hide(); }).onSuccess(function(){ $('.getcheckcode').removeClass('dis'); $('.getcheckcode').trigger('click'); }); window.captchaObj = captchaObj; }; $('#captcha').show(); $.ajax({ url: "/login/gtstart?t=" + (new Date()).getTime(), // 加隨機(jī)數(shù)防止緩存 type: "get", dataType: "json", success: function (data) { $('#text').hide(); $('#wait').show(); // 調(diào)用 initGeetest 進(jìn)行初始化 // 參數(shù)1:配置參數(shù) // 參數(shù)2:回調(diào),回調(diào)的第一個(gè)參數(shù)驗(yàn)證碼對象,之后可以使用它調(diào)用相應(yīng)的接口 initGeetest({ // 以下 4 個(gè)配置參數(shù)為必須,不能缺少 gt: data.gt, challenge: data.challenge, offline: !data.success, // 表示用戶后臺檢測極驗(yàn)服務(wù)器是否宕機(jī) new_captcha: data.new_captcha, // 用于宕機(jī)時(shí)表示是新驗(yàn)證碼的宕機(jī) product: "float", // 產(chǎn)品形式,包括:float,popup width: "280px", https: true // 更多配置參數(shù)說明請參見:http://docs.geetest.com/install/client/web-front/ }, handler); } }); } function codeCutdown() { if(_wait == 0){ //倒計(jì)時(shí)完成 $(".getcheckcode").removeClass('dis').html("重新獲取"); }else{ $(".getcheckcode").addClass('dis').html("重新獲取("+_wait+"s)"); _wait--; setTimeout(function () { codeCutdown(); },1000); } } function inputValidate(ele,telInput) { var oInput = ele; var inputVal = oInput.val(); var oType = ele.attr('data-type'); var oEtag = $('#etag').val(); var oErr = oInput.closest('.form_box').next('.err_txt'); var empTxt = '請輸入'+oInput.attr('placeholder')+'!'; var errTxt = '請輸入正確的'+oInput.attr('placeholder')+'!'; var pattern; if(inputVal==""){ if(!telInput){ errFun(oErr,empTxt); } return false; }else { switch (oType){ case 'login_mobile': pattern = /^1[3456789]\d{9}$/; if(inputVal.length==11) { $.ajax({ url: '/login/checkmobile', type: "post", dataType: "json", data: { mobile: inputVal, etag: oEtag, page_ur: window.location.href, page_referer: document.referrer }, success: function (data) { } }); } break; case 'login_yzm': pattern = /^\d{6}$/; break; } if(oType=='login_mobile'){ } if(!!validateFun(pattern,inputVal)){ errFun(oErr,'') if(telInput){ $('.getcheckcode').removeClass('dis'); } }else { if(!telInput) { errFun(oErr, errTxt); }else { $('.getcheckcode').addClass('dis'); } return false; } } return true; } function errFun(obj,msg) { obj.html(msg); if(msg==''){ $('.login_submit').removeClass('dis'); }else { $('.login_submit').addClass('dis'); } } function validateFun(pat,val) { return pat.test(val); }