
飛揚(yáng)大數(shù)據(jù)平臺(tái)備戰(zhàn)大數(shù)據(jù)時(shí)代
伴隨互聯(lián)網(wǎng)技術(shù)的風(fēng)生水起,龐大而復(fù)雜的網(wǎng)絡(luò)技術(shù)將地球濃縮為一個(gè)小小的村落。互聯(lián)網(wǎng)技術(shù)的廣泛應(yīng)用,不同角色間所輸入與輸出的海量信息衍生出來的巨大數(shù)據(jù)量再一次顛覆云時(shí)代,堂而皇之的迎來了信息量暴增的嶄新時(shí)代——大數(shù)據(jù)時(shí)代。
“大數(shù)據(jù)”則變成了時(shí)下最火熱詞匯之一。從擁有數(shù)據(jù)到預(yù)判需求,這就是大數(shù)據(jù)的“威力”,近幾年各軟件巨頭公司紛紛涉足該領(lǐng)域,8月16日,在北京京儀酒店舉辦的“風(fēng)起潮涌、撥云見數(shù)——東方飛揚(yáng)開啟大數(shù)據(jù)之門發(fā)布會(huì)”更是將檔案大數(shù)據(jù)推向了新的高潮。一場(chǎng)以“大數(shù)據(jù)”為核心驅(qū)動(dòng)的檔案信息革命,風(fēng)生水起,席卷而來。
大數(shù)據(jù)時(shí)代的來臨成就檔案領(lǐng)域發(fā)展契機(jī)
據(jù)IDC預(yù)測(cè),未來10年全球數(shù)據(jù)量將以超過40%的速度增長(zhǎng),2020年全球數(shù)據(jù)量將達(dá)到35ZB,為2009年(0.8ZB)的44倍,且其中80%以上為非結(jié)構(gòu)化數(shù)據(jù)(如圖片、音頻、視頻等)。這組數(shù)據(jù),充分說明了世界已經(jīng)步入了大數(shù)據(jù)時(shí)代。那么,這些數(shù)據(jù)到底是從何來呢?總的說來,正是傳統(tǒng)互聯(lián)網(wǎng)、移動(dòng)互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、云計(jì)算的快速發(fā)展推動(dòng)了數(shù)據(jù)的爆發(fā)式增長(zhǎng)。
究竟何為“大數(shù)據(jù)”?所謂大數(shù)據(jù),簡(jiǎn)而言之就是巨量資料、海量資料,指的是所涉及的資料量規(guī)模巨大到無法通過目前主流軟件工具,在合理時(shí)間內(nèi)達(dá)到擷取、管理、處理、并整理成為幫助企業(yè)經(jīng)營(yíng)決策更積極目的的資訊。由數(shù)量巨大、結(jié)構(gòu)復(fù)雜、類型眾多數(shù)據(jù)構(gòu)成的大數(shù)據(jù),是基于云計(jì)算的數(shù)據(jù)處理與應(yīng)用模式,通過數(shù)據(jù)的整合共享、交叉復(fù)用形成的智力資源和知識(shí)服務(wù)能力。同時(shí)炙手可熱的大數(shù)據(jù)還具備了4V特點(diǎn):Volume(數(shù)據(jù)體量巨大)、Velocity(數(shù)據(jù)類型多)、Variety(速度要求高)、Veracity(價(jià)值大、密度低)。
那么何為“大數(shù)據(jù)時(shí)代”?通過對(duì)大數(shù)據(jù)概念的了解,能夠更加深切的體悟到:所謂的大數(shù)據(jù)時(shí)代,是一個(gè)數(shù)據(jù)更加全面的時(shí)代,通過對(duì)于大數(shù)據(jù)應(yīng)用技術(shù)的掌握,便可輕而易舉的攻克更多之前由于數(shù)據(jù)缺乏而無法涉足的領(lǐng)域,比如檔案領(lǐng)域。
眾所周知,檔案信息化在過去的二十年中見證了三次模式的變遷,從最初的主機(jī)計(jì)算時(shí)代,到后來的局域網(wǎng)應(yīng)用時(shí)代,再到如今的互聯(lián)互通時(shí)代,數(shù)字檔案管理的演變。具體呈現(xiàn)了以下幾個(gè)主要特點(diǎn):一是產(chǎn)生了數(shù)量巨大的、異構(gòu)的文檔信息;二是人們的信息需求呈現(xiàn)出多樣化、高效化、個(gè)性化、專深化等特點(diǎn);三是原有的傳統(tǒng)檔案信息服務(wù)系統(tǒng),僅依靠數(shù)據(jù)庫(kù)的查詢檢索機(jī)制和統(tǒng)計(jì)學(xué)方法已經(jīng)不能滿足現(xiàn)實(shí)的需要。這些是檔案領(lǐng)域發(fā)展大數(shù)據(jù)應(yīng)用的重要基礎(chǔ)。同時(shí),也覺察到在檔案領(lǐng)域發(fā)展大數(shù)據(jù)的契機(jī)——政策支持、現(xiàn)實(shí)需要、技術(shù)支撐。
伴隨國(guó)家信息化建設(shè)的不斷深入,由云計(jì)算、云存儲(chǔ)等新型的IT服務(wù)模式所直接催生的數(shù)字信息正在爆炸式增長(zhǎng),面對(duì)數(shù)量巨大、異構(gòu)的文檔信息,同時(shí)還要與時(shí)俱進(jìn)的滿足現(xiàn)代人類對(duì)于信息多樣化、高效化、個(gè)性化、專深化的需求,傳統(tǒng)的檔案信息服務(wù)顯然已經(jīng)不能滿足時(shí)代的需求,檔案管理工作將面臨更大的挑戰(zhàn)。
大數(shù)據(jù)時(shí)代下,要如何抓住契機(jī)實(shí)現(xiàn)檔案管理及內(nèi)容的價(jià)值全面提升?
在“風(fēng)起潮涌、撥云見數(shù)——東方飛揚(yáng)開啟大數(shù)據(jù)之門發(fā)布會(huì)”上,東方飛揚(yáng)指出檔案管理正在步入大數(shù)據(jù)時(shí)代,如何從海量數(shù)據(jù)中發(fā)掘出有價(jià)值的信息,滿足不同檔案客戶的信息需求,將檔案資源轉(zhuǎn)化為知識(shí)資源,尤其是覆蓋人民群眾的知識(shí)資源,這已成為檔案人的使命,基于大數(shù)據(jù)的數(shù)據(jù)分析和數(shù)據(jù)挖掘技術(shù)將會(huì)起到巨大的推動(dòng)作用。
基于大數(shù)據(jù)來臨的契機(jī)和趨勢(shì),東方飛揚(yáng)順勢(shì)而行,及時(shí)推出“ES-Bigdata飛揚(yáng)大數(shù)據(jù)智慧平臺(tái)”。該大數(shù)據(jù)平臺(tái)即可依托“政務(wù)網(wǎng)”、“行業(yè)專網(wǎng)”,構(gòu)建海量存儲(chǔ)、分布計(jì)算、集中管理、自動(dòng)調(diào)度的大型數(shù)據(jù)智能平臺(tái),服務(wù)于各級(jí)政府、國(guó)家部委、綜合性檔案館、中央企業(yè)等總部級(jí)單位;又能依托“公網(wǎng)”,構(gòu)建多樣性、可定制、可擴(kuò)展、經(jīng)濟(jì)性配置的基于公有云的數(shù)據(jù)智能平臺(tái),服務(wù)于中小微企業(yè)檔案管理工作;還可依托“公網(wǎng)”,構(gòu)建靈活、方便、大容量的個(gè)人數(shù)據(jù)智能平臺(tái),服務(wù)于個(gè)人、家庭。
其核心內(nèi)容主要有兩個(gè)方面:一是依托ES-iCloud數(shù)字檔案云,基于結(jié)構(gòu)化和非結(jié)構(gòu)化的數(shù)字信息,構(gòu)建集數(shù)據(jù)獲取、組織、分析及決策支持于一體的大數(shù)據(jù)平臺(tái)解決方案。二是通過飛揚(yáng)大數(shù)據(jù)平臺(tái),支持各級(jí)各類檔案館決策管理,優(yōu)化資源調(diào)度,拓展檔案館的信息服務(wù)方式,提高服務(wù)質(zhì)量,實(shí)現(xiàn)檔案管理及內(nèi)容的價(jià)值全面提升。
如何真正做到以上兩個(gè)核心內(nèi)容?據(jù)東方飛揚(yáng)介紹可以從下三方面助力檔案管理及內(nèi)容的價(jià)值全面提升。一是支持各級(jí)各類檔案館的決策管理;二是優(yōu)化各級(jí)各類檔案館的檔案信息資源;三是拓展檔案館的信息服務(wù)方式,提高服務(wù)質(zhì)量。
據(jù)透露,“ES-BigData飛揚(yáng)大數(shù)據(jù)智慧平臺(tái)”還具有高可用機(jī)制、安全機(jī)制、終端應(yīng)用、數(shù)據(jù)采集、云前端、私有云/公有云等特點(diǎn)。東方飛揚(yáng)還表示,對(duì)于“ES-BigData飛揚(yáng)大數(shù)據(jù)智慧平臺(tái)”的技術(shù)愿景是構(gòu)建基于檔案內(nèi)容的數(shù)據(jù)倉(cāng)庫(kù);實(shí)現(xiàn)標(biāo)準(zhǔn)化、開放化的技術(shù)架構(gòu);支持應(yīng)用快速、靈活部署;實(shí)現(xiàn)系統(tǒng)高效、低成本運(yùn)營(yíng)。
結(jié)合大數(shù)據(jù)時(shí)代的特點(diǎn)借力發(fā)展檔案領(lǐng)域
除了“ES-BigData飛揚(yáng)大數(shù)據(jù)智慧平臺(tái)”的推出,在會(huì)議中還介紹了東方飛揚(yáng)典型大數(shù)據(jù)平臺(tái)技術(shù)方案。方案中指出面臨大數(shù)據(jù)時(shí)代的海量數(shù)據(jù),從中獲取、利用、收錄正確有用的信息需要四個(gè)步驟:獲取、組織、分析和決策。
首先獲取信息方面可面向企業(yè)應(yīng)用,如:數(shù)字檔案館系統(tǒng),采用HDFS、NOSQL快速捕獲和存儲(chǔ)結(jié)構(gòu)化、非結(jié)構(gòu)化的數(shù)據(jù)信息。獲取到信息后,采用Hadoop的MapReduce技術(shù),在原始數(shù)據(jù)存儲(chǔ)集群中組織和處理大量數(shù)據(jù),將最終的聚合結(jié)果,通過數(shù)據(jù)轉(zhuǎn)換器,加載到關(guān)系DBMS系統(tǒng)中。最后,根據(jù)數(shù)據(jù)分析模型,自動(dòng)進(jìn)行數(shù)據(jù)關(guān)聯(lián)、多維度分析,發(fā)現(xiàn)規(guī)律,自動(dòng)作出決策。
由此可見,檔案領(lǐng)域的信息繁榮、價(jià)值提升必將由大數(shù)據(jù)來推動(dòng)。據(jù)了解,在大數(shù)據(jù)啟迪下,東方飛揚(yáng)結(jié)合“ES-Bigdata飛揚(yáng)大數(shù)據(jù)智慧平臺(tái)”的特點(diǎn)自主研發(fā)了ES-OAIS 4.0產(chǎn)品。該產(chǎn)品具有以“穩(wěn)定性”為基礎(chǔ),以“易實(shí)施、易使用”為指導(dǎo)思想,同時(shí)兼顧“高性能”等特點(diǎn)。目前,該產(chǎn)品已正式發(fā)布。
通過東方飛揚(yáng)對(duì)于大數(shù)據(jù)優(yōu)勢(shì)的深入解讀,我們能夠更加明白大數(shù)據(jù)對(duì)于現(xiàn)代社會(huì)進(jìn)步的意義。無論如何,大數(shù)據(jù)時(shí)代已然是信息社會(huì)發(fā)展的必然結(jié)果,反過來,這一人類文明也必將加快推動(dòng)社會(huì)的發(fā)展。讓我們拭目以待吧,大數(shù)據(jù)時(shí)代在未來社會(huì)進(jìn)步中的大手筆。同時(shí),我們也更加期待東方飛揚(yáng)這支行業(yè)內(nèi)的旗艦,讓大數(shù)據(jù)在檔案管理事業(yè)中大放異彩。
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
LSTM 模型輸入長(zhǎng)度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長(zhǎng)序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報(bào)考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計(jì)的實(shí)用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強(qiáng)大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠(chéng)摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實(shí)施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價(jià)值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡(jiǎn)稱 BI)深度融合的時(shí)代,BI ...
2025-07-10SQL 在預(yù)測(cè)分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢(shì)預(yù)判? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代,預(yù)測(cè)分析作為挖掘數(shù)據(jù)潛在價(jià)值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價(jià)值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點(diǎn),而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報(bào)考到取證的全攻略? 在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭(zhēng)搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢(shì)性檢驗(yàn):捕捉數(shù)據(jù)背后的時(shí)間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢(shì)性檢驗(yàn)如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時(shí)間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時(shí)間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實(shí)戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗(yàn):數(shù)據(jù)趨勢(shì)與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢(shì)變化以及識(shí)別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國(guó)內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對(duì)策略? 長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨(dú)特的門控機(jī)制,在 ...
2025-07-07統(tǒng)計(jì)學(xué)方法在市場(chǎng)調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場(chǎng)調(diào)研是企業(yè)洞察市場(chǎng)動(dòng)態(tài)、了解消費(fèi)者需求的重要途徑,而統(tǒng)計(jì)學(xué)方法則是市場(chǎng)調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動(dòng)力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動(dòng)力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價(jià)值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03