
大數(shù)據(jù)的大熱潮催生出了現(xiàn)下很多新技術(shù)的市場(chǎng),但真正的價(jià)值在于這些技術(shù)之間的相互連接、以及技術(shù)和工具與應(yīng)用之間的連接,這種連接能讓我們的工具和應(yīng)用向終端用戶傳遞更多的珍貴洞察。
據(jù)IDC預(yù)測(cè),大數(shù)據(jù)分析及其相關(guān)的市場(chǎng)的復(fù)合年增長(zhǎng)率達(dá)到26.4%,將在2018年發(fā)展到415億美元的規(guī)模。實(shí)際上,IDC認(rèn)為到2020年分析技術(shù)將成為所有國家經(jīng)濟(jì)增長(zhǎng)的關(guān)鍵動(dòng)力。
Teradata公司的SunilJose,他將說明大數(shù)據(jù)分析行業(yè)的現(xiàn)狀、其發(fā)展的主要?jiǎng)恿吞魬?zhàn)以及大數(shù)據(jù)在2016年的發(fā)展。
1.2015年大數(shù)據(jù)分析行業(yè)的狀況是怎樣的?現(xiàn)在大數(shù)據(jù)領(lǐng)域中的哪一方面還待改善?
大數(shù)據(jù)再也不只是代指數(shù)據(jù)量很大的數(shù)據(jù),其實(shí)它是能夠決定一家公司成敗的關(guān)鍵要素。各類組織都開始意識(shí)到,采取大數(shù)據(jù)分析將能夠改變游戲規(guī)則,它同樣也是市場(chǎng)領(lǐng)先者和失敗者之間存在的重要區(qū)別。2015年,整個(gè)印度市場(chǎng)以及當(dāng)?shù)氐钠髽I(yè)大體上都相信大數(shù)據(jù)能為IT組織帶來便利,但整個(gè)市場(chǎng)卻還未能確認(rèn)大數(shù)據(jù)將為他們的業(yè)務(wù)功能帶來哪些具體的便利。
然而,每個(gè)垂直行業(yè)中少數(shù)幾個(gè)的頂尖創(chuàng)新者都在促成這件好事的發(fā)生,他們通過將大數(shù)據(jù)整合到現(xiàn)有的數(shù)據(jù)和分析生態(tài)系統(tǒng)當(dāng)中,從而不斷地為公司創(chuàng)造價(jià)值。當(dāng)企業(yè)即將開始自己的大數(shù)據(jù)之旅時(shí),考慮現(xiàn)有的計(jì)算能力是非常重要的。
如果在運(yùn)行大型的低頻工作的同時(shí)必須處理其他工作流,那么即使是對(duì)于最強(qiáng)大的系統(tǒng),這仍然是一種消耗。企業(yè)應(yīng)該勇于創(chuàng)新,因?yàn)榇髷?shù)據(jù)可以而且也能夠改變所有事情。好的大數(shù)據(jù)工具組能夠在最低成本、近乎于實(shí)時(shí)地提供可拓展、高性能的分析技術(shù),滿足商業(yè)用戶不斷增長(zhǎng)的數(shù)據(jù)存取需要。
此外,數(shù)據(jù)自由化帶來了新技術(shù)和新的數(shù)據(jù)采集方式,通過獲取洞察支持決策制定、提高運(yùn)營(yíng)效率,開創(chuàng)了前所未有的新業(yè)務(wù)場(chǎng)景。
2.您能舉幾個(gè)例子,說說過去幾年里大數(shù)據(jù)為哪些行業(yè)創(chuàng)造了價(jià)值、帶來了改變嗎?
2015年,大數(shù)據(jù)在客戶、金融、風(fēng)險(xiǎn)管理和運(yùn)營(yíng)方面都嶄露頭角;2016年我們將重點(diǎn)關(guān)注這幾個(gè)領(lǐng)域的分析技術(shù)。我們又再次強(qiáng)調(diào)了云技術(shù),同時(shí)數(shù)據(jù)安全也成為了每個(gè)組織的必需品。此外,開源技術(shù)和移動(dòng)商業(yè)智能將改變行業(yè)。最重要的是,預(yù)測(cè)性分析和規(guī)范分析將是下一顆冉冉升起的明日之星。
在2016年,我們將看到很多重要的發(fā)展趨勢(shì),比如多極分析、數(shù)據(jù)民主化、分析消費(fèi)化、對(duì)物聯(lián)網(wǎng)的更高關(guān)注,然而最重要的是,我們將看到分析技術(shù)將超越對(duì)事實(shí)的復(fù)述,而能夠?qū)⒍鄠€(gè)有影響力的分析結(jié)果進(jìn)行結(jié)合,推動(dòng)人們的行動(dòng)。
3.就您剛才說到的可能在2016年產(chǎn)生影響的關(guān)鍵領(lǐng)域,您能挑選幾個(gè)詳細(xì)說說嗎?
接下來的一年里我們將看到大數(shù)據(jù)分析領(lǐng)域有很多大動(dòng)作,這就包括:
云端的大數(shù)據(jù)分析:有分析師預(yù)計(jì),由于我們已經(jīng)在不斷地產(chǎn)生并收集大量的數(shù)據(jù),并且在不同組織及組織間不同的部門當(dāng)中需求也在不斷增長(zhǎng),未來的大數(shù)據(jù)將會(huì)是本地部署和云端部署的結(jié)合。
多極分析:根據(jù)數(shù)據(jù)類型和所需分析的不同,需要經(jīng)過不同的流程和不同的場(chǎng)所才能完成數(shù)據(jù)的收集和分析。這個(gè)過程不僅關(guān)系到處于兩級(jí)中的常規(guī)數(shù)據(jù)流,同時(shí)也需要聯(lián)合分析,這樣才能跨越組織部門創(chuàng)造連續(xù)的視圖。
Connectionanalytics的商業(yè)價(jià)值:Connectionanalytics能夠分析每個(gè)個(gè)體的行為以及他們與其他個(gè)體或群體間的聯(lián)系。這種信息對(duì)于尋求向目標(biāo)群體進(jìn)一步推廣產(chǎn)品和服務(wù)的企業(yè)來說具有非常關(guān)鍵的價(jià)值。我們也同樣觀察到,有越來越多的企業(yè)正通過社交媒體來突顯他們的客戶關(guān)懷。
雖然社交媒體分析并不是什么太新的事情,但正在重要的是在這些關(guān)鍵的平臺(tái)上分析并理解消費(fèi)者的行為——了解溝通的渠道是什么、跟消費(fèi)者交談的是誰、他們?cè)谡務(wù)摰氖鞘裁础?/span>
社交聯(lián)系變得越來越復(fù)雜,用戶數(shù)量也呈指數(shù)增長(zhǎng),它們共同向運(yùn)算規(guī)模提出了挑戰(zhàn),為數(shù)據(jù)處理和結(jié)果解讀帶來了困難。數(shù)據(jù)的爆發(fā)實(shí)際上加劇了這種問題,不管現(xiàn)在的科技進(jìn)步如何努力迎頭趕上、引領(lǐng)潮流都無濟(jì)于事。
“探索區(qū)域”的發(fā)展:客戶不斷在社交媒體上進(jìn)行互動(dòng),公司就越來越需要不僅僅是記錄這些對(duì)話,更要理解客戶在網(wǎng)上的行為究竟如何。在2016年,高級(jí)分析和數(shù)據(jù)存儲(chǔ)速度將帶來巨大改變。數(shù)據(jù)存取的速度將保證信息的實(shí)時(shí)處理,從而保持公司的競(jìng)爭(zhēng)優(yōu)勢(shì)。在印度和其他地區(qū),對(duì)這項(xiàng)技術(shù)的需求預(yù)計(jì)將會(huì)穩(wěn)步上升,最后逐漸發(fā)展為一個(gè)全新的數(shù)據(jù)研發(fā)和分析的樞紐,這個(gè)樞紐就是“探索區(qū)域”。
4.能分享幾個(gè)Teradata在最近幾個(gè)月里為了優(yōu)化產(chǎn)品組合而做出的關(guān)鍵決策嗎?
我們做出的關(guān)鍵而意義重大的決定都在大數(shù)據(jù)分析和物聯(lián)網(wǎng)領(lǐng)域。我們專注于幫助客戶以無縫對(duì)接且可拓展的方式,同時(shí)使用開源技術(shù)和我們的分析平臺(tái)。我將提到幾個(gè)我們最近做出的公告僅供參考。
Teradata的開源咨詢公司ThinkBig是我們?cè)谌ツ晔召彽淖庸?。ThinkBig是第一家提供了綜合的Hadoop管理服務(wù)的公司。在去年10月,Teradata宣布新加入兩項(xiàng)軟件功能,旨在幫助客戶操作物聯(lián)網(wǎng)數(shù)據(jù)。這兩項(xiàng)功能分別是TeradataListener和基于Hadoop的TeradataAster分析。
接下來,Teradata還將把自己有名的數(shù)據(jù)庫對(duì)接服務(wù)于亞馬遜網(wǎng)絡(luò)服務(wù)云(AmazonWebServicescloud)。這將是第一個(gè)針對(duì)公有云的數(shù)據(jù)庫,它是從專有的硬件根系中研發(fā)出來的。正如迪納研究公司的研究總監(jiān)TonyCosentino所說,這將為Teradata帶來更多的優(yōu)勢(shì)。
最后,今年六月,Teradata向開源的Presto社區(qū)做了重大投資。Presto是一套基于Hadoop的SQL框架,最初是針對(duì)Facebook開發(fā),用來支持其大型數(shù)據(jù)倉庫中的交互式查詢。Presto可以利用Hadoop之外的數(shù)據(jù)存儲(chǔ)進(jìn)行查詢,就包括NoSQL、關(guān)系型數(shù)據(jù)庫和專有數(shù)據(jù)庫。所以,Teradata將Presto定義為一款能對(duì)數(shù)據(jù)庫查詢進(jìn)行快速應(yīng)答的工具。
5.在未來的1到2年間,Teradata主要工作的方向在哪里呢?
Teradata正致力于開發(fā)開源的大數(shù)據(jù)技術(shù),讓各類組織能夠更快、以更低風(fēng)險(xiǎn)地實(shí)現(xiàn)技術(shù)部署。今年,我們?cè)诤脦讉€(gè)領(lǐng)域取得了重大進(jìn)展,就包括Hadoop和其他數(shù)據(jù)庫之間的數(shù)據(jù)交換。
同時(shí),我們還為基于Hadoop的有效數(shù)據(jù)管理提供整合的大數(shù)據(jù)解決方案,這也是我們最關(guān)注的領(lǐng)域,在該領(lǐng)域當(dāng)中的還有大數(shù)據(jù)存儲(chǔ)應(yīng)用、利用極致壓縮、數(shù)據(jù)安全和數(shù)據(jù)治理。
我們正積極投資于大數(shù)據(jù)項(xiàng)目的安裝及咨詢的托管業(yè)務(wù)。重要的不僅僅是擁有技術(shù)解決方案,還要有為客戶成功施行項(xiàng)目的技能。所以,我們?cè)谶@一塊做了非常重大的投資。我們還將繼續(xù)支持多系統(tǒng)環(huán)境以及事件驅(qū)動(dòng)的系統(tǒng),來實(shí)現(xiàn)整個(gè)分析環(huán)境的有效監(jiān)管、預(yù)警和控制。
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實(shí)戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動(dòng)態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價(jià)值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實(shí)戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時(shí),“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗(yàn)與 t 檢驗(yàn):差異、適用場(chǎng)景與實(shí)踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計(jì)學(xué)領(lǐng)域,假設(shè)檢驗(yàn)是驗(yàn)證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計(jì)劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計(jì)劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對(duì)象的 text 與 content:區(qū)別、場(chǎng)景與實(shí)踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請(qǐng)求開發(fā)時(shí)(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價(jià)值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請(qǐng)求工具對(duì)比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請(qǐng)求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)的科學(xué)計(jì)數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)時(shí)的科學(xué)計(jì)數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價(jià)值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營(yíng)問題、提升執(zhí)行效率的核心手段,其價(jià)值 ...
2025-09-12用 SQL 驗(yàn)證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實(shí)戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計(jì)” 與 “用戶體驗(yàn) ...
2025-09-11塔吉特百貨孕婦營(yíng)銷案例:數(shù)據(jù)驅(qū)動(dòng)下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當(dāng)下,精準(zhǔn)營(yíng)銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價(jià)值 在數(shù)據(jù)驅(qū)動(dòng)決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實(shí)踐到業(yè)務(wù)價(jià)值挖掘 在數(shù)據(jù)分析場(chǎng)景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計(jì)模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價(jià)值導(dǎo)向 統(tǒng)計(jì)模型作為數(shù)據(jù)分析的核心工具,并非簡(jiǎn)單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10