
大數(shù)據(jù)應(yīng)用如何開啟新局面
隨著大數(shù)據(jù)應(yīng)用的經(jīng)濟(jì)社會效應(yīng)不斷顯現(xiàn),大數(shù)據(jù)已經(jīng)在市場營銷、金融、交通、制造、醫(yī)療等各個領(lǐng)域開展試水應(yīng)用,取得了一定的成果。不過,業(yè)界認(rèn)為我國大數(shù)據(jù)應(yīng)用仍處于初級階段,還未形成普遍應(yīng)用的局面,對大多數(shù)企業(yè),特別是傳統(tǒng)領(lǐng)域的企業(yè)而言,還未找到有效的應(yīng)用模式。如何進(jìn)一步普及大數(shù)據(jù)應(yīng)用,通過應(yīng)用帶動整個產(chǎn)業(yè)鏈發(fā)展,成為當(dāng)前迫切需要解決的問題之一。
大數(shù)據(jù)應(yīng)用未形成燎原之勢
大數(shù)據(jù)應(yīng)用呈散發(fā)狀,目前主要集中于互聯(lián)網(wǎng)市場營銷場景。
“目前,我國大數(shù)據(jù)應(yīng)用仍處于初級階段,《促進(jìn)大數(shù)據(jù)發(fā)展行動綱要》的出臺為我國大數(shù)據(jù)應(yīng)用拓展起到了有力的推動作用?!惫ば挪啃畔⒒蛙浖?wù)業(yè)司司長陳偉近日向《中國電子報》記者這樣表示。他認(rèn)為,大數(shù)據(jù)在電子商務(wù)領(lǐng)域的應(yīng)用逐漸增多,成為大數(shù)據(jù)最成熟的應(yīng)用模式。
京東通過建立PB級大數(shù)據(jù)平臺,將每個用戶在其網(wǎng)站上的行為數(shù)據(jù)進(jìn)行記錄和分析,提高與用戶間的溝通效率、提升用戶體驗。實現(xiàn)了向不同用戶展示不同的內(nèi)容的效果,帶來了10%的訂單提升。比如提供給推薦搜索調(diào)用,針對不同用戶屬性特征、性格特點(diǎn)或行為習(xí)慣在他搜索或點(diǎn)擊時展示符合該用戶特點(diǎn)和偏好的商品,給用戶以友好舒適的購買體驗,能大幅提高用戶的購買轉(zhuǎn)化率甚至重復(fù)購買,提高用戶忠誠度和用戶黏性?;谟脩酎c(diǎn)擊數(shù)據(jù)、瀏覽頁面信息等信息的數(shù)據(jù)模型和數(shù)據(jù)資源在經(jīng)過淘寶商城的挖掘和分析之后,向用戶和商家開放了查詢APP。通過數(shù)據(jù)挖掘和分析為淘寶提供了定向廣告投遞的能力。開放查詢APP則為用戶和商家提供了便捷的選擇服務(wù)。淘寶網(wǎng)還建立了“淘寶CPI”,通過采集、編制淘寶上390個類目的熱門商品價格來統(tǒng)計CPI。
不過,研究機(jī)構(gòu)中國信息通信研究院研究成果表明,大數(shù)據(jù)應(yīng)用呈散發(fā)狀,并沒有形成燎原之勢。目前主要集中于互聯(lián)網(wǎng)的市場營銷場景。盡管金融、電信、零售、制造、醫(yī)療、交通、物流、IT等行業(yè)對大數(shù)據(jù)應(yīng)用表現(xiàn)出極大熱情,但目前在媒體和各種論壇上所公開的大數(shù)據(jù)應(yīng)用案例仍然非常零散,這表明大家雖然都很關(guān)注大數(shù)據(jù),但推進(jìn)實際的應(yīng)用仍然存在一定的困難。唯一眾多企業(yè)都推出或者采納大數(shù)據(jù)應(yīng)用的領(lǐng)域是基于互聯(lián)網(wǎng)的市場營銷。
另外,從技術(shù)角度看,大數(shù)據(jù)仍以初級應(yīng)用為主,多數(shù)應(yīng)用仍然使用傳統(tǒng)分析流程和工具,只是擴(kuò)大了數(shù)據(jù)的來源、增加了數(shù)量。中國信息通信研究院調(diào)研發(fā)現(xiàn),與傳統(tǒng)數(shù)據(jù)分析相比,新的大數(shù)據(jù)應(yīng)用雖然開始使用非結(jié)構(gòu)化數(shù)據(jù),但在實際應(yīng)用過程中,這些非結(jié)構(gòu)化數(shù)據(jù)只是被壓縮、清洗和結(jié)構(gòu)化后,放入傳統(tǒng)的ETL 和分析流程中去。另一些大數(shù)據(jù)應(yīng)用通過采用云存儲和云處理技術(shù),提高了數(shù)據(jù)處理效率,從而增加了數(shù)據(jù)處理的規(guī)模,但這些應(yīng)用也仍然采用原有的ETL和分析流程。缺乏應(yīng)用模式上的創(chuàng)新,使得目前大數(shù)據(jù)應(yīng)用仍停留在初級技術(shù)階段。
陳偉也認(rèn)為,目前我國數(shù)據(jù)資源建設(shè)和應(yīng)用水平較低?!澳壳?,用戶普遍不重視數(shù)據(jù)資源的建設(shè),即使有數(shù)據(jù)意識的機(jī)構(gòu)也大多只重視數(shù)據(jù)的簡單存儲,很少針對后續(xù)應(yīng)用需求進(jìn)行加工整理。數(shù)據(jù)資源普遍存在質(zhì)量差,標(biāo)準(zhǔn)規(guī)范缺乏,管理能力弱,數(shù)據(jù)價值難以被有效挖掘利用。”陳偉說。
與新一代信息技術(shù)集成應(yīng)用勢在必行
物聯(lián)網(wǎng)、3D打印等新一代信息技術(shù)與大數(shù)據(jù)相互作用,促進(jìn)應(yīng)用落地。
業(yè)界認(rèn)為,新一代信息技術(shù)與經(jīng)濟(jì)社會各領(lǐng)域的深度融合,引發(fā)了數(shù)據(jù)量的爆發(fā)式增長,使得數(shù)據(jù)資源成為國家重要的戰(zhàn)略資源和核心創(chuàng)新要素。利用大數(shù)據(jù)分析,能夠總結(jié)經(jīng)驗、發(fā)現(xiàn)規(guī)律、預(yù)測趨勢、輔助決策,充分釋放和利用海量數(shù)據(jù)資源中蘊(yùn)含的巨大價值,推動新一代信息技術(shù)與各行業(yè)的深度耦合、交叉創(chuàng)新。
事實上,國家戰(zhàn)略層面也已經(jīng)意識到這個趨勢。國務(wù)院正式印發(fā)的《促進(jìn)大數(shù)據(jù)發(fā)展行動綱要》指出,推動大數(shù)據(jù)與新一代信息技術(shù)融合發(fā)展。抓住互聯(lián)網(wǎng)跨界融合機(jī)遇,促進(jìn)大數(shù)據(jù)、物聯(lián)網(wǎng)、云計算和3D打印技術(shù)、個性化定制等在制造業(yè)全產(chǎn)業(yè)鏈集成運(yùn)用,推動制造模式變革和工業(yè)轉(zhuǎn)型升級。
記者從工信部獲悉,工信部將組織實施“工業(yè)和新興產(chǎn)業(yè)大數(shù)據(jù)工程”,促進(jìn)大數(shù)據(jù)、云計算、工業(yè)互聯(lián)網(wǎng)、3D打印、個性化定制等的融合集成,推動制造模式變革和工業(yè)轉(zhuǎn)型升級。
對于大數(shù)據(jù)與新一代信息技術(shù)集成應(yīng)用,三迪時空網(wǎng)絡(luò)科技股份有限公司董事長李培學(xué)在接受《中國電子報》記者采訪時表示,以大數(shù)據(jù)為中心的3D打印分布式智能制造將是趨勢。在未來的云智造平臺上,任何人即使不具備建模的知識,但只要有創(chuàng)意,就可以和設(shè)計師溝通,設(shè)計出自己想要的三維模型,然后通過3D打印機(jī)來實現(xiàn),同時,云智造平臺必須能夠確保設(shè)計師贏利,設(shè)計師的創(chuàng)造力、創(chuàng)意思維才能源源不斷地發(fā)揮出來。有了完善的設(shè)計師平臺,在人群聚集的互聯(lián)網(wǎng)上,創(chuàng)新就可以得到實現(xiàn),有了以3D打印機(jī)為工具的分布式制造單元,可以為周邊的普通用戶提供個性化定制的產(chǎn)品,而這一切都基于大數(shù)據(jù)。
例如,以大數(shù)據(jù)平臺為基礎(chǔ)的3D打印定制鞋是3D打印技術(shù)在垂直行業(yè)領(lǐng)域中的具體應(yīng)用。通過對人足部特征掃描、采樣,將三維數(shù)據(jù)和人員信息匯聚到數(shù)據(jù)中心,構(gòu)建大數(shù)據(jù)平臺,再結(jié)合3D打印定制化生產(chǎn)的特點(diǎn)和傳統(tǒng)制造批量生產(chǎn)的優(yōu)勢,將虛擬的三維數(shù)據(jù)對象轉(zhuǎn)化為實體成品?!坝脩艨梢岳么髷?shù)據(jù)平臺的查詢檢索功能,找到真正適合自己的鞋類,實現(xiàn)個性化定制;鞋類廠商則可以根據(jù)大數(shù)據(jù)分析,精確地定位消費(fèi)群體的需求,包括特殊人群的腳型數(shù)據(jù),將精確估算出產(chǎn)品的訂單需求,更加精確地批量生產(chǎn)。定制化數(shù)據(jù)可以跟蹤人們足部生長的階段來進(jìn)行調(diào)整,用戶可以根據(jù)數(shù)據(jù)分析來選擇不同的品牌不同的類型?!崩钆鄬W(xué)表示。
PTC全球副總裁兼中國區(qū)總裁壽宇澄在接受《中國電子報》記者采訪時也表示,大數(shù)據(jù)在物聯(lián)網(wǎng)中起到至關(guān)重要的作用,相互依賴。
“在制造業(yè)一些核心技術(shù)領(lǐng)域,例如飛機(jī)發(fā)動機(jī)的研發(fā),我國的研發(fā)水平要追上國際先進(jìn)水平還需要一定的時間積累,但是我們?nèi)舭研畔⒒瘮U(kuò)大到產(chǎn)品全生命周期尤其是重視產(chǎn)品出廠后的流程優(yōu)化,把產(chǎn)品出廠前的虛擬世界和出廠后的實體世界并行發(fā)展,那么我國的制造業(yè)整體實力也能得到有效提升,而物聯(lián)網(wǎng)恰恰能實現(xiàn)這一點(diǎn)。物聯(lián)網(wǎng)的初衷之一就是把信息化延伸到產(chǎn)品全生命周期,不僅包括研發(fā)環(huán)節(jié),還包括產(chǎn)品出廠后的流程。當(dāng)然,物聯(lián)網(wǎng)應(yīng)用的形態(tài)也發(fā)生了變化。
以前是過程驅(qū)動模式,是以企業(yè)家的經(jīng)驗為主,但當(dāng)企業(yè)發(fā)展到一定階段,面臨的市場環(huán)境更為復(fù)雜,企業(yè)產(chǎn)生的數(shù)據(jù)量更大,面對這些龐大的數(shù)據(jù),公司管理者很難再像以前那樣以事先定好的流程和經(jīng)驗進(jìn)行處理和決策,必須要依靠機(jī)器的智能幫助人們進(jìn)行大數(shù)據(jù)分析,這就需要數(shù)據(jù)驅(qū)動模式。從流程的驅(qū)動變?yōu)閿?shù)據(jù)的驅(qū)動,產(chǎn)品出廠前以研發(fā)為主的數(shù)據(jù)只是一類數(shù)據(jù),但當(dāng)這類產(chǎn)品出廠后每個產(chǎn)品流向市場后的數(shù)據(jù)則成幾何規(guī)模擴(kuò)大,這就形成了大數(shù)據(jù)。這時,企業(yè)就需要對這些大量的數(shù)據(jù)進(jìn)行分析,從而對公司決策進(jìn)行支持。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
訓(xùn)練與驗證損失驟升:機(jī)器學(xué)習(xí)訓(xùn)練中的異常診斷與解決方案 在機(jī)器學(xué)習(xí)模型訓(xùn)練過程中,“損失曲線” 是反映模型學(xué)習(xí)狀態(tài)的核心指 ...
2025-09-19解析 DataHub 與 Kafka:數(shù)據(jù)生態(tài)中兩類核心工具的差異與協(xié)同 在數(shù)字化轉(zhuǎn)型加速的今天,企業(yè)對數(shù)據(jù)的需求已從 “存儲” 轉(zhuǎn)向 “ ...
2025-09-19CDA 數(shù)據(jù)分析師:讓統(tǒng)計基本概念成為業(yè)務(wù)決策的底層邏輯 統(tǒng)計基本概念是商業(yè)數(shù)據(jù)分析的 “基礎(chǔ)語言”—— 從描述數(shù)據(jù)分布的 “均 ...
2025-09-19CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-19SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計學(xué)領(lǐng)域,假設(shè)檢驗是驗證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點(diǎn)數(shù)據(jù)的科學(xué)計數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點(diǎn)數(shù)據(jù)時的科學(xué)計數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當(dāng)下,精準(zhǔn)營銷成為企業(yè)突圍的核心方 ...
2025-09-11