
大數(shù)據(jù)與分析是企業(yè)創(chuàng)新的核心
在全球的IT發(fā)展上,大數(shù)據(jù)這個領(lǐng)域是最活躍的領(lǐng)域。IBM正在加速向大數(shù)據(jù)方向轉(zhuǎn)型。“IBM大中華區(qū)大數(shù)據(jù)與分析事業(yè)部總經(jīng)理鐘澤敏在最近的媒體溝通會上談及年初成立了大數(shù)據(jù)分析事業(yè)部的初衷。他表示,IBM此次全球性的調(diào)整是根據(jù)市場大數(shù)據(jù)分析做的,把不同的部門重新放在同一個地方。這樣對客戶的需求反應(yīng)更快,更合理。另外,他介紹,數(shù)據(jù)分析部門,主要分三塊,一是數(shù)據(jù)分析的平臺。二是解決方案。大數(shù)據(jù)分析未來發(fā)展的方向是以行業(yè)為主導(dǎo)的。三是包括行業(yè)專家和云服務(wù),包括軟件功能、云服務(wù)戰(zhàn)略、服務(wù)團隊和市場推廣。
在談及IBM在大數(shù)據(jù)領(lǐng)域的優(yōu)勢時,鐘澤敏認(rèn)為,IBM比其他公司比較有利的地方,是在于我們對未來市場需求的看法在轉(zhuǎn)變。比如,IBM最近宣布與美國的的Weather company達成合作,通過天氣的分析為各行業(yè)的商家提供預(yù)測的商業(yè)數(shù)據(jù)。
“多年來,IBM在市場上其實最多的積累就是客戶的積累,對于各行各業(yè)的了解非常深刻,從產(chǎn)品部門到服務(wù)部門,對國內(nèi)的銀行、電信、政府、制造、醫(yī)療等等各個行業(yè)都做過大量的項目,了解客戶的業(yè)務(wù)流程。真正要做到企業(yè)級,還是要對企業(yè)的業(yè)務(wù)進行了解,這是IBM的優(yōu)勢?!?/span>
認(rèn)識大數(shù)據(jù)的兩大誤區(qū)
當(dāng)我們談?wù)摯髷?shù)據(jù)時往往會形成很多的誤區(qū),IBM大中華區(qū)大數(shù)據(jù)與分析事業(yè)部數(shù)據(jù)平臺方案總經(jīng)理劉勝利認(rèn)為,Hadoop系統(tǒng)的確是大數(shù)據(jù)有代表性的平臺,但是大數(shù)據(jù)并不等于Hadoop。近2年Spark很熱門,是大數(shù)據(jù)非常火的平臺,但是也不意味著大數(shù)據(jù)就是Spark。
IBM非常強調(diào)大數(shù)據(jù)的分析和挖掘能力,數(shù)據(jù)多并不是價值,只有把數(shù)據(jù)里面的商業(yè)流程挖掘出來才是大數(shù)據(jù)的價值。
“一兩個抽樣數(shù)據(jù)拿出來,,這不叫大數(shù)據(jù)?!?劉勝利表示,抽樣數(shù)據(jù)是典型的在計算機產(chǎn)生之前就存在的抽樣調(diào)查,美國總統(tǒng)選舉前做抽樣調(diào)查,數(shù)百年前就已經(jīng)存在了。
企業(yè)級挖掘大數(shù)據(jù)的價值
毋庸置疑,大數(shù)據(jù)是當(dāng)前的潮流,在互聯(lián)網(wǎng)的應(yīng)用層出不窮,企業(yè)管理決策也越來越受預(yù)測性分析和大數(shù)據(jù)分析的影響,依靠直覺做決定的情況將會被徹底改變。那么,企業(yè)級的客戶會關(guān)心如何應(yīng)用技術(shù)來實現(xiàn)創(chuàng)新?會關(guān)心用應(yīng)用大數(shù)據(jù)分析系統(tǒng)以后,如何實現(xiàn)高可用性、穩(wěn)定性、可靠性?
開源可以解決一些問題嗎?“開源里面沒有一個正式的支持體系,劉勝利認(rèn)為,太開放了,里面很新,匹配性做得不一定好,這需要做開源的人要有非常高的水平?!?“國內(nèi)能夠用開源的這些代碼去開發(fā),做二次開發(fā)和支撐的企業(yè)級用戶,不超過10家。劉勝利認(rèn)為,因為企業(yè)的核心競爭力不在IT上,企業(yè)的精力應(yīng)該在核心應(yīng)用,而不是花大量的時間研究開源。他表示,開源是一件好事,但是對于企業(yè)級來講要打一個問號,要慎重的考慮是不是要用開源,要養(yǎng)最少10個人的團隊去做。
劉勝利表示,“IBM在大數(shù)據(jù)的領(lǐng)域的策略是把大數(shù)據(jù)應(yīng)用于企業(yè)級。IBM在全球100多年的歷史,一直把自己的策略定位為服務(wù)于企業(yè)級的客戶,幫助他們提高競爭力,幫助他們?nèi)赍X?!?/span>
企業(yè)使用大數(shù)據(jù)和互聯(lián)網(wǎng)的企業(yè)使用大數(shù)據(jù)顯然有非常明顯的不一樣,企業(yè)級的客戶非常關(guān)注流程。劉勝利解釋,“就是說大數(shù)據(jù)來了,企業(yè)原有的業(yè)務(wù)流程需要整合。會關(guān)注數(shù)據(jù)的挖掘,而不是堆積數(shù)據(jù)。更重要的是如何用大數(shù)據(jù),不是說技術(shù)如何先進,而是技術(shù)對于行業(yè)創(chuàng)新有什么樣的幫助,這是客戶最關(guān)注的核心?!?/span>
“IBM非常強調(diào)大數(shù)據(jù)的分析和挖掘能力,數(shù)據(jù)多并不是價值,只有把數(shù)據(jù)里面的商業(yè)流程挖掘出來才是大數(shù)據(jù)的價值?!?劉勝利這樣認(rèn)為。IBM在美國,跟Facebook、Twitter開展戰(zhàn)略合作,針對大量的社交數(shù)據(jù),幫助企業(yè)用戶勾勒一個客戶360度的視圖,做更好、更精準(zhǔn)的營銷。
流,大數(shù)據(jù)的熱門技術(shù)
流是當(dāng)前大數(shù)據(jù)當(dāng)中的一個熱門的技術(shù)。在9?11之后IBM最早做出來,就是把當(dāng)前攝像信息、錄像信息、監(jiān)控信息抓出來,能夠快速分析、及時預(yù)警。目前已經(jīng)進行了商業(yè)化,變成了所謂的流技術(shù)。
流可以做什么?劉勝利舉三個例子。天氣預(yù)報的瞬間變換數(shù)據(jù)采集量非常大,IBM在國內(nèi)某一個大的河流流域幫助做天氣預(yù)報的預(yù)測,以便于做水力發(fā)電和流域自然環(huán)境的控制。在航空領(lǐng)域?qū)嵤┝鞯慕鉀Q方案。大家一上飛機,空姐就拿上來一張報紙說你是我們的什么客戶,送你一張報紙,或者你想吃什么餐。這覺得挺平常的服務(wù),其實背后是采用流計算技術(shù),針對進行毫秒級處理,實時拿到VIP客戶的名單。更關(guān)鍵的不光是對于旅客的服務(wù),飛機本身實時數(shù)據(jù)的監(jiān)控處理數(shù)據(jù)量非常大,飛機在飛行過程當(dāng)中,飛機本身以及飛機相關(guān)的各種子系統(tǒng),和外界交流的這種控制系統(tǒng)產(chǎn)生了大量的信息,這些信息被送到流處理的系統(tǒng),非常實時的處理,另外,在公共場所、重大節(jié)日,一些公園,通過流技術(shù)實時采集人流的手機移動信息進行人流監(jiān)控方面。
“IBM做出來這樣的產(chǎn)品,能夠迅速把大數(shù)據(jù)平臺搭建起來,聚焦在做行業(yè)的應(yīng)用,做大數(shù)據(jù)的業(yè)務(wù)流程改造以及業(yè)務(wù)的創(chuàng)新,而不是很細(xì)節(jié)的這些某個產(chǎn)品的技術(shù)?!眲倮硎?,“這就是IBM希望做到的,而且已經(jīng)幫助企業(yè)做到的技術(shù)?!?/span>
IBM的大數(shù)據(jù)分析產(chǎn)品SPSS
IBM很關(guān)注大數(shù)據(jù)分析,劉勝利認(rèn)為“IBM關(guān)注的是大數(shù)據(jù)之下的分析,強調(diào)的重點是在分析、挖掘、預(yù)測?!?/span>
他介紹,大數(shù)據(jù)分析和挖掘用SPSS產(chǎn)品是非常有效的,包括對于客戶的保留,同時針對本身的一些運營計劃、門類、銷售種類、銷售預(yù)測等等,做到很細(xì)節(jié)的分析。
對于機器和設(shè)備的挖掘也是在廣泛使用。在一些產(chǎn)品的制造過程中都會產(chǎn)生次品,這些分析挖掘,及早發(fā)現(xiàn)問題,也有利于這些次品早下線,讓企業(yè)降低生產(chǎn)成本。這是一個制造業(yè)的例子,也會廣泛的應(yīng)用到新一代的智能制造當(dāng)中。保險行業(yè)當(dāng)中,包括客戶投訴等等也是廣泛應(yīng)用的。
大數(shù)據(jù)分析應(yīng)用于物聯(lián)網(wǎng)
互聯(lián)網(wǎng)+是傳統(tǒng)行業(yè)和互聯(lián)網(wǎng)的滲透,互相提升?!罢劦交ヂ?lián)網(wǎng)+概念,其實在所有的概念里面,在所有的戰(zhàn)略、方針和趨勢當(dāng)中討論的是一個核心的技術(shù)基礎(chǔ)?!?IBM大中華區(qū)大數(shù)據(jù)分析事業(yè)部行業(yè)解決方案總經(jīng)理劉詠梅認(rèn)為,是物聯(lián)網(wǎng)。她介紹,物聯(lián)網(wǎng)發(fā)展重要的趨勢就是兩化融合就是信息化和工業(yè)化的融合。就是因為從信息化的角度和工業(yè)化的角度不融合,達不到提高層次,達不到去創(chuàng)新。隨著工業(yè)4.0 和中國制造2025的發(fā)展,會真正加快兩化融合的腳步,或者說真正能夠從一定程度上實現(xiàn)兩化融合。
IBM的物聯(lián)網(wǎng)是萬物互聯(lián),強調(diào)一個新的生態(tài)系統(tǒng),IBM大中華區(qū)大數(shù)據(jù)與分析事業(yè)部市場總監(jiān)孫麗軍認(rèn)為,“沒有任何一個人能夠在外部互聯(lián)中獨自完成任務(wù),只有在生態(tài)鏈才能共同完成IoT?!?/span>
中國制造2025比較著重于在工業(yè)領(lǐng)域、制造領(lǐng)域、消費電子領(lǐng)域等的拓展。劉詠梅認(rèn)為,中國制造2025或是智能制造,應(yīng)該是以物聯(lián)網(wǎng)為基礎(chǔ)在某些行業(yè)的實踐。這么去定位它們之間相互的關(guān)系。
IBM在全球是跟其他非常多的相關(guān)領(lǐng)域的領(lǐng)導(dǎo)者或者公司在物聯(lián)網(wǎng)的研究、創(chuàng)新和實踐聯(lián)盟組織中占了非常重要的位置。劉詠梅介紹,在業(yè)界有一個工業(yè)4.0平臺組織,IBM是非常關(guān)鍵的一個組織成員,擁有智慧工廠研究平臺,智慧的數(shù)據(jù)創(chuàng)新實驗室和工業(yè)互聯(lián)網(wǎng)聯(lián)盟。在這個平臺貢獻想法,交流創(chuàng)新,把自己的想法通過不同的方式去落地和實踐,這就是一個組織要去做的事情。
劉詠梅通過某品牌汽車研究汽缸的零件的具體案例,來介紹IBM大數(shù)據(jù)分析在物聯(lián)網(wǎng)應(yīng)用。有兩個生產(chǎn)線,其中一條的次品率比別的次品率高。大家都在一個地方,怎么它的次品率就比別的高呢?于是IBM抓取了非常多的歷史基礎(chǔ)數(shù)據(jù),包含環(huán)境的數(shù)據(jù)。最后發(fā)現(xiàn),這個生產(chǎn)線在下午兩點的次品率比較高。這是什么原因呢?是因為陽光照射進來溫度會高,零件生產(chǎn)之后是液體的應(yīng)在30秒內(nèi)固化,因為受溫度的影響,這個零件會發(fā)脆,嚴(yán)重影響生產(chǎn)。劉詠梅表示,在生產(chǎn)過程當(dāng)中IBM提供相應(yīng)的大數(shù)據(jù)解決方案,在工業(yè)4.0和物聯(lián)網(wǎng)充分釋放價值。
大數(shù)據(jù)分析給生產(chǎn)制造行業(yè)帶來的價值。在中國怎么往前走?劉詠梅認(rèn)為,“其實在過程中是不斷演進的,要邊學(xué)習(xí)、邊研究、邊探討。”她介紹目前普遍認(rèn)知的過程是,第一階段,把智能工廠做起來,接下來,把智能工廠和相應(yīng)的供應(yīng)鏈集成在一起,最后,把多個供應(yīng)鏈集成在一起。
“在整個打通合作鏈的過程當(dāng)中,IBM都有相應(yīng)的解決方案幫助客戶去做?!?劉詠梅認(rèn)為,在這個場景中進行協(xié)同合作,從而進行創(chuàng)新,提升競爭力。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
訓(xùn)練與驗證損失驟升:機器學(xué)習(xí)訓(xùn)練中的異常診斷與解決方案 在機器學(xué)習(xí)模型訓(xùn)練過程中,“損失曲線” 是反映模型學(xué)習(xí)狀態(tài)的核心指 ...
2025-09-19解析 DataHub 與 Kafka:數(shù)據(jù)生態(tài)中兩類核心工具的差異與協(xié)同 在數(shù)字化轉(zhuǎn)型加速的今天,企業(yè)對數(shù)據(jù)的需求已從 “存儲” 轉(zhuǎn)向 “ ...
2025-09-19CDA 數(shù)據(jù)分析師:讓統(tǒng)計基本概念成為業(yè)務(wù)決策的底層邏輯 統(tǒng)計基本概念是商業(yè)數(shù)據(jù)分析的 “基礎(chǔ)語言”—— 從描述數(shù)據(jù)分布的 “均 ...
2025-09-19CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-19SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動態(tài)隨機一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計學(xué)領(lǐng)域,假設(shè)檢驗是驗證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進行 HTTP 網(wǎng)絡(luò)請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數(shù)據(jù)的科學(xué)計數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點數(shù)據(jù)時的科學(xué)計數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當(dāng)下,精準(zhǔn)營銷成為企業(yè)突圍的核心方 ...
2025-09-11