99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

熱線電話:13121318867

登錄
首頁職業(yè)發(fā)展大數(shù)據(jù)時代 PB級數(shù)據(jù)怎么管
大數(shù)據(jù)時代 PB級數(shù)據(jù)怎么管
2015-06-21
收藏

大數(shù)據(jù)時代 PB級數(shù)據(jù)怎么管



如何理解PB級數(shù)據(jù)?說到這個數(shù)據(jù)量級,人們首先會聯(lián)想到CADAL項目(大學數(shù)字圖書館國際合作計劃),該項目可以說是開啟了大數(shù)據(jù)時代PB級數(shù)據(jù)管理的一個典型案例。他的成功運行搭建為眾多方案商提供了借鑒。

PB級數(shù)據(jù)挑戰(zhàn)多

據(jù)大學數(shù)字圖書館國際合作計劃管理中心副主任黃晨介紹:“CADAL項目面臨的三個大數(shù)據(jù)應用挑戰(zhàn)是:首先是 PB級數(shù)據(jù)需要長期保留;其次,需要24小時不間斷為高校師生服務;最后,多重業(yè)務需要共享資源。為此,我們在建設中,從系統(tǒng)穩(wěn)定性、易用性、分級存儲/信息生命周期管理、硬件升級更新與業(yè)務連續(xù)性、可用性、性能六個方面去考慮。

事實上,CADAL在開展二期項目的過程中,就明顯感覺到了大數(shù)據(jù)上述的三大應用挑戰(zhàn)。經(jīng)過一期和二期工程建設,CADAL項目已經(jīng)完成250多萬冊古籍和相關音視頻資料的數(shù)字化,面向全國2000所高校開展服務,部分資源向公眾開放。250多萬冊古籍和相關音視頻資料加在一起,數(shù)據(jù)量已經(jīng)達到600TB。三期工程將繼續(xù)擴大資源建設,數(shù)據(jù)量將很快達到PB級。

為此,信息基礎架構平臺需要能夠動態(tài)地支持多重工作流,滿足不同的性能要求、不同的容量要求,并且隨時能夠改變;需要有效地管理共享資源,存儲資源按需分配,同時通過配額管理功能,以提高利用率。

選擇方案的關鍵點

據(jù)了解,250萬冊的紙質圖書,需要1棟15層的大樓才能容納。如圖2所示。而采用現(xiàn)代的技術手段,只需要一個機柜,就足夠應對250萬冊甚至更多圖書的數(shù)字化影像。圖所3所示。

圖2某省圖書館介紹,建筑面積18073平方米,書庫主體15層,可容納250萬冊藏書

http://ww3.sinaimg.cn/bmiddle/726f4e7bjw1djdgnuezy0j.jpg

圖3 這樣一組EMC Isilon機柜可以保存幾千萬冊數(shù)字化圖書

面對上述挑戰(zhàn),據(jù)CADAL項目管理中心數(shù)據(jù)主管劉濤老師介紹說,CADAL項目管理中心從系統(tǒng)穩(wěn)定性、易用性、分級存儲/信息生命周期管理、硬件升級更新與業(yè)務連續(xù)性、可用性、性能六個方面進行綜合考察。最終選擇了EMC Isilon,總容量1PB的EMC Isilon大數(shù)據(jù)存儲系統(tǒng)在CADAL項目管理中心部署完成,投入使用。

方案核心優(yōu)勢

這一方案的核心優(yōu)勢主要表現(xiàn)在兩個方面:

一是支持文件、FTP等多種靈活的訪問方式,簡化了操作,提高了效率。

CADAL圖書數(shù)字化的大致工作流程是:共建高校申報圖書資源à項目管理委員會審定à共建高校負責數(shù)字化處理并將數(shù)字圖書提交給管理中心à管理中心將數(shù)字圖書發(fā)布到前端存儲對外提供服務,同時備份多份份到后端存儲。

劉老師經(jīng)常要做的一件事情是:通過工作機將共建高校提交的數(shù)字圖書從臨時存儲復制到前端和后臺存儲。由于各臺服務器連接不同的光纖存儲,需要把存儲設備掛接到服務器才能操作,并且各服務器還應用不同的操作系統(tǒng),數(shù)據(jù)需要走“臨時存儲à工作機服務器à服務器à后端存儲”的路徑。換成Isilon之后,數(shù)據(jù)只需要走“臨時存儲à前端服務器à后端Isilon存儲”的路徑,由于Isilon的吞吐量很大,并且沒有文件系統(tǒng)和LUN管理的兼容問題,可以同時從多個臨時存儲往后端Isilon存儲保存數(shù)據(jù),且沒有額外的速度損失,效率大大提高。以前,從共建高校接收數(shù)字圖書較多時,后端的發(fā)布或備份服務器上的數(shù)據(jù)流量會比較大,會影響其它數(shù)據(jù)訪問或應用,發(fā)布和備份會出現(xiàn)瓶頸;如果大量使用光纖存儲,服務器端的成本也會增加。采用Isilon之后,硬件上帶寬提高了,系統(tǒng)上跳過了操作系統(tǒng)層面的處理,這種現(xiàn)象有較大改觀。

二是支持磁盤分級存儲、節(jié)點分級存儲和SSD固態(tài)硬盤加速,既保證了大容量,也保證了高性能。

CADAL的做法是,將活躍的數(shù)據(jù)保存在配有固態(tài)硬盤的高速Isilon節(jié)點上,其它數(shù)據(jù)保存在普通Isilon節(jié)點上。不同高校圖書館提供的數(shù)字圖書分區(qū)保存,存儲空間按需分配,并實行配額管理,提高存儲利用率。

PB知識鏈接:

TechTarget自己的百科網(wǎng)站W(wǎng)hatis有關于PB大小的定義:“PB是數(shù)據(jù)存儲容量的單位,它等于2的50次方個字節(jié),或者在數(shù)值上大約等于1000個TB?!?/span>

那么一個TB呢?

“TB是一個計算機存儲容量的單位,它等于2的40次方,或者接近一萬億個字節(jié)(即,一千千兆字節(jié))?!?/span>

未來學家Raymond Kurzweil他的論文中對PB的定義進行延伸:人類功能記憶的容量預計在1.25個TB。這意味著,800個人類記憶才相當于1個PB。

如果這樣還不夠清楚,那么Adfonic的CTO Wes Biggs給出了下面更直接的計算:

假設手機播放MP3的編碼速度為平均每分鐘1MB,而1首歌曲的平均時長為4分鐘,那么1PB歌曲可以連續(xù)播放2000年。

如果智能手機相機拍攝相片的平均大小為3MB,打印照片的平均大小為8.5英寸,那么總共1PB的照片的并排排列長度就達到48000英里——大約可以環(huán)繞地球2周。

1PB足夠存儲整個美國人口的DNA,而且還能再克隆2倍。


數(shù)據(jù)分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數(shù)據(jù)分析師考試動態(tài)
數(shù)據(jù)分析師資訊
更多

OK
客服在線
立即咨詢
客服在線
立即咨詢
') } function initGt() { var handler = function (captchaObj) { captchaObj.appendTo('#captcha'); captchaObj.onReady(function () { $("#wait").hide(); }).onSuccess(function(){ $('.getcheckcode').removeClass('dis'); $('.getcheckcode').trigger('click'); }); window.captchaObj = captchaObj; }; $('#captcha').show(); $.ajax({ url: "/login/gtstart?t=" + (new Date()).getTime(), // 加隨機數(shù)防止緩存 type: "get", dataType: "json", success: function (data) { $('#text').hide(); $('#wait').show(); // 調用 initGeetest 進行初始化 // 參數(shù)1:配置參數(shù) // 參數(shù)2:回調,回調的第一個參數(shù)驗證碼對象,之后可以使用它調用相應的接口 initGeetest({ // 以下 4 個配置參數(shù)為必須,不能缺少 gt: data.gt, challenge: data.challenge, offline: !data.success, // 表示用戶后臺檢測極驗服務器是否宕機 new_captcha: data.new_captcha, // 用于宕機時表示是新驗證碼的宕機 product: "float", // 產(chǎn)品形式,包括:float,popup width: "280px", https: true // 更多配置參數(shù)說明請參見:http://docs.geetest.com/install/client/web-front/ }, handler); } }); } function codeCutdown() { if(_wait == 0){ //倒計時完成 $(".getcheckcode").removeClass('dis').html("重新獲取"); }else{ $(".getcheckcode").addClass('dis').html("重新獲取("+_wait+"s)"); _wait--; setTimeout(function () { codeCutdown(); },1000); } } function inputValidate(ele,telInput) { var oInput = ele; var inputVal = oInput.val(); var oType = ele.attr('data-type'); var oEtag = $('#etag').val(); var oErr = oInput.closest('.form_box').next('.err_txt'); var empTxt = '請輸入'+oInput.attr('placeholder')+'!'; var errTxt = '請輸入正確的'+oInput.attr('placeholder')+'!'; var pattern; if(inputVal==""){ if(!telInput){ errFun(oErr,empTxt); } return false; }else { switch (oType){ case 'login_mobile': pattern = /^1[3456789]\d{9}$/; if(inputVal.length==11) { $.ajax({ url: '/login/checkmobile', type: "post", dataType: "json", data: { mobile: inputVal, etag: oEtag, page_ur: window.location.href, page_referer: document.referrer }, success: function (data) { } }); } break; case 'login_yzm': pattern = /^\d{6}$/; break; } if(oType=='login_mobile'){ } if(!!validateFun(pattern,inputVal)){ errFun(oErr,'') if(telInput){ $('.getcheckcode').removeClass('dis'); } }else { if(!telInput) { errFun(oErr, errTxt); }else { $('.getcheckcode').addClass('dis'); } return false; } } return true; } function errFun(obj,msg) { obj.html(msg); if(msg==''){ $('.login_submit').removeClass('dis'); }else { $('.login_submit').addClass('dis'); } } function validateFun(pat,val) { return pat.test(val); }