
深層數(shù)據(jù):推動(dòng)大數(shù)據(jù)成功的關(guān)鍵所在
毫無(wú)疑問(wèn),大家肯定都聽(tīng)說(shuō)過(guò)“大數(shù)據(jù)”,但“深層數(shù)據(jù)”呢?答案恐怕是否定的。不用緊張,我并不打算給硬塞給大家新的專(zhuān)業(yè)詞匯。不過(guò)鑒于近期以來(lái)企業(yè)用戶(hù)正持續(xù)就需要收集并管理的數(shù)據(jù)量展開(kāi)爭(zhēng)論,我認(rèn)為深層數(shù)據(jù)的概念應(yīng)當(dāng)進(jìn)入各位關(guān)注數(shù)據(jù)潛力的企業(yè)用戶(hù)的扁當(dāng)中。專(zhuān)注于建筑行業(yè)能源利用效率的分析企業(yè)FirstFuel公司CTO兼首席數(shù)據(jù)官Badri Raghavan對(duì)此有著自己的獨(dú)到見(jiàn)解。該公司的客戶(hù)們,包括政府機(jī)關(guān)與能源機(jī)構(gòu),都在使用FirstFuel的能源分析服務(wù)以推動(dòng)更為環(huán)保、更具成本效益的方案向辦公環(huán)境、學(xué)校以及其它設(shè)施建設(shè)領(lǐng)域的普及。
在一次電話(huà)采訪(fǎng)當(dāng)中,Raghavan談到了他對(duì)于“深層數(shù)據(jù)”的看法以及FirstFuel公司如何將這一理念轉(zhuǎn)化為自身競(jìng)爭(zhēng)優(yōu)勢(shì)。
“我們所謂的‘深層數(shù)據(jù)’其實(shí)是相關(guān)領(lǐng)域多種專(zhuān)業(yè)性知識(shí)儲(chǔ)備的綜合體——對(duì)于我們來(lái)說(shuō),也就是能源行業(yè)與數(shù)據(jù)科學(xué)的結(jié)合——旨在幫助技術(shù)人員從宏觀(guān)規(guī)模角度對(duì)建筑的能源使用情況作出分析,”他告訴我們。
深層數(shù)據(jù)的概念與信息密度擁有密不可分的關(guān)聯(lián)。“給定數(shù)據(jù)流當(dāng)中可能包含大量信息,”Raghavan表示?!跋喾?,大家也有可能收集到大量缺乏足夠結(jié)論性?xún)?nèi)容或者信息的數(shù)據(jù)。”
大家可能已經(jīng)猜到了,Raghavan本人對(duì)于數(shù)據(jù)收集或者盡可能匯總更多信息的作法并不認(rèn)同。但目前很多企業(yè)都是這樣做的,即在尚不確定是否有意義的情況下盲目匯集規(guī)模龐大的數(shù)據(jù)總量。
數(shù)據(jù)收集的真正核心在于效率,或者說(shuō)“對(duì)目前已經(jīng)掌握的數(shù)據(jù)資產(chǎn)加以利用。要實(shí)現(xiàn)這一目標(biāo),我們需要首先明確自己需要解決哪些技術(shù)或者業(yè)務(wù)難題。在大家可資利用的資源當(dāng)中,哪一種數(shù)據(jù)流的作用最為重要?”
在FirstFuel所從事的行業(yè)當(dāng)中——即分析大型建筑物的能源消耗情況——單一數(shù)據(jù)流往往成為最重要的計(jì)量數(shù)據(jù)。
“我們會(huì)把計(jì)量數(shù)據(jù)作為一棟建筑物的掃描結(jié)果。利用我們的數(shù)據(jù)科學(xué)算法,我們可以對(duì)建筑物的健康狀況作出分析、找出其中的薄弱環(huán)節(jié)以及仍有效率提升空間的部分?!?/span>
他指出,這就是深層數(shù)據(jù)實(shí)際起效的一類(lèi)極佳實(shí)例。計(jì)量數(shù)據(jù)是“一種相對(duì)精練的數(shù)據(jù)流,但其中包含的內(nèi)容卻相當(dāng)豐富,”FirstFuel得以借此定位其最感興趣的問(wèn)題:找出能源消耗當(dāng)中有違效率優(yōu)先原則的狀況。
當(dāng)然,對(duì)于很多企業(yè)來(lái)說(shuō)最重要的是摸清哪些數(shù)據(jù)流最具分析價(jià)值,而后還需要將其與其它數(shù)據(jù)加以結(jié)合以獲得新的分析結(jié)論。
FirstFuel已經(jīng)找到了幾種通常最具潛在價(jià)值的數(shù)據(jù)流類(lèi)型。
“計(jì)量數(shù)據(jù)能夠告訴我們與建筑物相關(guān)的大量信息,”Raghavan指出?!敖酉聛?lái)我們開(kāi)始使用高分辨率航空影像——是的,就是谷歌地球,我們?cè)诠ぷ髦写罅渴褂眠@類(lèi)資料。從我們的角度來(lái)看,其中包含豐富的潛在信息。它能告訴我們這些建筑物樓頂布置有哪些類(lèi)型的設(shè)備,”而FirstFuel能夠借此大體判斷對(duì)應(yīng)建筑物需要消費(fèi)的能源總量。
這家分析企業(yè)還將來(lái)自國(guó)家氣象服務(wù)中心的數(shù)據(jù)納入考量范疇。
“我們著手進(jìn)行設(shè)置,并逐步逐步再逐步將其引入。只要能夠?qū)π畔⒎治鼋Y(jié)論起到改進(jìn)作用,我們就會(huì)將相關(guān)數(shù)據(jù)流納入考量?!?/span>
而根據(jù)他的說(shuō)法,這就是深層數(shù)據(jù)的基本概念。“大家可以對(duì)規(guī)模相對(duì)較小的數(shù)據(jù)集進(jìn)行深層研究,而不再像過(guò)去那樣長(zhǎng)期面對(duì)浩如煙海的數(shù)據(jù)總和……并試圖從其中撈到象征有價(jià)值結(jié)論的小針?!?/span>
舉例來(lái)說(shuō),F(xiàn)irstFuel完全可以收集多種額外數(shù)據(jù)——其中包括與交通流量及泊車(chē)狀況有關(guān)的信息,此外Twitter數(shù)據(jù)流也有涉及——但事實(shí)上根本沒(méi)有明確的理由驅(qū)使他們選擇這樣費(fèi)力的方式。
“相對(duì)于直接躍入存在海量數(shù)據(jù)可資進(jìn)行潛在分析的大數(shù)據(jù)海洋、卻往往最終幾乎甚至完全得不到有價(jià)值信息,我們更傾向于從規(guī)模相對(duì)較小的數(shù)據(jù)量中獲得更大收益——即將注意力集中在那些能夠切實(shí)反映建筑物客觀(guān)狀況的數(shù)據(jù)身上,”Raghavan指出?!霸谥贫ǔ鲞@樣的解決思路后,接下來(lái)我們會(huì)逐步把想法變成現(xiàn)實(shí)?!?/span>
數(shù)據(jù)分析咨詢(xún)請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
在A(yíng)I滲透率超85%的2025年,企業(yè)生存之戰(zhàn)就是數(shù)據(jù)之戰(zhàn),CDA認(rèn)證已成為決定企業(yè)存續(xù)的生死線(xiàn)!據(jù)麥肯錫全球研究院數(shù)據(jù)顯示,AI驅(qū) ...
2025-07-2035歲焦慮像一把高懸的利刃,裁員潮、晉升無(wú)望、技能過(guò)時(shí)……當(dāng)職場(chǎng)中年危機(jī)與數(shù)字化浪潮正面交鋒,你是否發(fā)現(xiàn): 簡(jiǎn)歷投了10 ...
2025-07-20CDA 數(shù)據(jù)分析師報(bào)考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-18剛?cè)肼殘?chǎng)或是在職場(chǎng)正面臨崗位替代、技能更新、人機(jī)協(xié)作等焦慮的打工人,想要找到一條破解職場(chǎng)焦慮和升職瓶頸的系統(tǒng)化學(xué)習(xí)提升 ...
2025-07-182025被稱(chēng)為“AI元年”,而AI,與數(shù)據(jù)密不可分。網(wǎng)易公司創(chuàng)始人丁磊在《AI思維:從數(shù)據(jù)中創(chuàng)造價(jià)值的煉金術(shù) ...
2025-07-18CDA 數(shù)據(jù)分析師:數(shù)據(jù)時(shí)代的價(jià)值挖掘者 在大數(shù)據(jù)席卷全球的今天,數(shù)據(jù)已成為企業(yè)核心競(jìng)爭(zhēng)力的重要組成部分。從海量數(shù)據(jù)中提取有 ...
2025-07-18SPSS 賦值后數(shù)據(jù)不顯示?原因排查與解決指南? 在 SPSS( Statistical Package for the Social Sciences)數(shù)據(jù)分析過(guò)程中,變量 ...
2025-07-18在 DBeaver 中利用 MySQL 實(shí)現(xiàn)表數(shù)據(jù)同步操作指南? ? 在數(shù)據(jù)庫(kù)管理工作中,將一張表的數(shù)據(jù)同步到另一張表是常見(jiàn)需求,這有助于 ...
2025-07-18數(shù)據(jù)分析師的技能圖譜:從數(shù)據(jù)到價(jià)值的橋梁? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代,數(shù)據(jù)分析師如同 “數(shù)據(jù)翻譯官”,將冰冷的數(shù)字轉(zhuǎn)化為清晰的 ...
2025-07-17Pandas 寫(xiě)入指定行數(shù)據(jù):數(shù)據(jù)精細(xì)化管理的核心技能? 在數(shù)據(jù)處理的日常工作中,我們常常需要面對(duì)這樣的場(chǎng)景:在龐大的數(shù)據(jù)集里精 ...
2025-07-17解碼 CDA:數(shù)據(jù)時(shí)代的通行證? 在數(shù)字化浪潮席卷全球的今天,當(dāng)企業(yè)決策者盯著屏幕上跳動(dòng)的數(shù)據(jù)曲線(xiàn)尋找增長(zhǎng)密碼,當(dāng)科研人員在 ...
2025-07-17CDA 精益業(yè)務(wù)數(shù)據(jù)分析:數(shù)據(jù)驅(qū)動(dòng)業(yè)務(wù)增長(zhǎng)的實(shí)戰(zhàn)方法論 在企業(yè)數(shù)字化轉(zhuǎn)型的浪潮中,“數(shù)據(jù)分析” 已從 “加分項(xiàng)” 成為 “必修課 ...
2025-07-16MySQL 中 ADD KEY 與 ADD INDEX 詳解:用法、差異與優(yōu)化實(shí)踐 在 MySQL 數(shù)據(jù)庫(kù)表結(jié)構(gòu)設(shè)計(jì)中,索引是提升查詢(xún)性能的核心手段。無(wú)論 ...
2025-07-16解析 MySQL Update 語(yǔ)句中 “query end” 狀態(tài):含義、成因與優(yōu)化指南? 在 MySQL 數(shù)據(jù)庫(kù)的日常運(yùn)維與開(kāi)發(fā)中,開(kāi)發(fā)者和 DBA 常會(huì) ...
2025-07-16如何考取數(shù)據(jù)分析師證書(shū):以 CDA 為例? ? 在數(shù)字化浪潮席卷各行各業(yè)的當(dāng)下,數(shù)據(jù)分析師已然成為企業(yè)挖掘數(shù)據(jù)價(jià)值、驅(qū)動(dòng)決策的 ...
2025-07-15CDA 精益業(yè)務(wù)數(shù)據(jù)分析:驅(qū)動(dòng)企業(yè)高效決策的核心引擎? 在數(shù)字經(jīng)濟(jì)時(shí)代,企業(yè)面臨著前所未有的數(shù)據(jù)洪流,如何從海量數(shù)據(jù)中提取有 ...
2025-07-15MySQL 無(wú)外鍵關(guān)聯(lián)表的 JOIN 實(shí)戰(zhàn):數(shù)據(jù)整合的靈活之道? 在 MySQL 數(shù)據(jù)庫(kù)的日常操作中,我們經(jīng)常會(huì)遇到需要整合多張表數(shù)據(jù)的場(chǎng)景 ...
2025-07-15Python Pandas:數(shù)據(jù)科學(xué)的瑞士軍刀? ? 在數(shù)據(jù)驅(qū)動(dòng)的時(shí)代,面對(duì)海量、復(fù)雜的數(shù)據(jù),如何高效地進(jìn)行處理、分析和挖掘成為關(guān)鍵。 ...
2025-07-15用 SQL 生成逆向回滾 SQL:數(shù)據(jù)操作的 “后悔藥” 指南? 在數(shù)據(jù)庫(kù)操作中,誤刪數(shù)據(jù)、錯(cuò)改字段或誤執(zhí)行批量更新等問(wèn)題時(shí)有發(fā)生。 ...
2025-07-14t檢驗(yàn)與Wilcoxon檢驗(yàn)的選擇:何時(shí)用t.test,何時(shí)用wilcox.test? t 檢驗(yàn)與 Wilcoxon 檢驗(yàn)的選擇:何時(shí)用 t.test,何時(shí)用 wilcox. ...
2025-07-14