
大數(shù)據(jù)技術(shù)與應(yīng)用案例詳解:獲取有價(jià)值信息
大數(shù)據(jù)技術(shù)與應(yīng)用是人們值得關(guān)注的事情,因?yàn)樗苡锌赡軐?duì)你的生活帶來友好的改變。
大數(shù)據(jù)技術(shù),就是從各種類型的數(shù)據(jù)中快速獲得有價(jià)值信息的技術(shù)。大數(shù)據(jù)領(lǐng)域已經(jīng)涌現(xiàn)出了大量新的技術(shù),它們成為大數(shù)據(jù)采集、存儲(chǔ)、處理和呈現(xiàn)的有力武器。
大數(shù)據(jù)處理關(guān)鍵技術(shù)一般包括:大數(shù)據(jù)采集、大數(shù)據(jù)預(yù)處理、大數(shù)據(jù)存儲(chǔ)及管理、大數(shù)據(jù)分析及挖掘、大數(shù)據(jù)展現(xiàn)和應(yīng)用(大數(shù)據(jù)檢索、大數(shù)據(jù)可視化、大數(shù)據(jù)應(yīng)用、大數(shù)據(jù)安全等)。
一、大數(shù)據(jù)采集技術(shù)
數(shù)據(jù)是指通過RFID射頻數(shù)據(jù)、傳感器數(shù)據(jù)、社交網(wǎng)絡(luò)交互數(shù)據(jù)及移動(dòng)互聯(lián)網(wǎng)數(shù)據(jù)等方式獲得的各種類型的結(jié)構(gòu)化、半結(jié)構(gòu)化(或稱之為弱結(jié)構(gòu)化)及非結(jié)構(gòu)化的海量數(shù)據(jù),是大數(shù)據(jù)知識(shí)服務(wù)模型的根本。重點(diǎn)要突破分布式高速高可靠數(shù)據(jù)爬取或采集、高速數(shù)據(jù)全映像等大數(shù)據(jù)收集技術(shù);突破高速數(shù)據(jù)解析、轉(zhuǎn)換與裝載等大數(shù)據(jù)整合技術(shù);設(shè)計(jì)質(zhì)量評(píng)估模型,開發(fā)數(shù)據(jù)質(zhì)量技術(shù)。
大數(shù)據(jù)采集一般分為大數(shù)據(jù)智能感知層:主要包括數(shù)據(jù)傳感體系、網(wǎng)絡(luò)通信體系、傳感適配體系、智能識(shí)別體系及軟硬件資源接入系統(tǒng),實(shí)現(xiàn)對(duì)結(jié)構(gòu)化、半結(jié)構(gòu)化、非結(jié)構(gòu)化的海量數(shù)據(jù)的智能化識(shí)別、定位、跟蹤、接入、傳輸、信號(hào)轉(zhuǎn)換、監(jiān)控、初步處理和管理等。必須著重攻克針對(duì)大數(shù)據(jù)源的智能識(shí)別、感知、適配、傳輸、接入等技術(shù)?;A(chǔ)支撐層:提供大數(shù)據(jù)服務(wù)平臺(tái)所需的虛擬服務(wù)器,結(jié)構(gòu)化、半結(jié)構(gòu)化及非結(jié)構(gòu)化數(shù)據(jù)的數(shù)據(jù)庫及物聯(lián)網(wǎng)絡(luò)資源等基礎(chǔ)支撐環(huán)境。重點(diǎn)攻克分布式虛擬存儲(chǔ)技術(shù),大數(shù)據(jù)獲取、存儲(chǔ)、組織、分析和決策操作的可視化接口技術(shù),大數(shù)據(jù)的網(wǎng)絡(luò)傳輸與壓縮技術(shù),大數(shù)據(jù)隱私保護(hù)技術(shù)等。
二、大數(shù)據(jù)預(yù)處理技術(shù)
主要完成對(duì)已接收數(shù)據(jù)的辨析、抽取、清洗等操作。1)抽?。阂颢@取的數(shù)據(jù)可能具有多種結(jié)構(gòu)和類型,數(shù)據(jù)抽取過程可以幫助我們將這些復(fù)雜的數(shù)據(jù)轉(zhuǎn)化為單一的或者便于處理的構(gòu)型,以達(dá)到快速分析處理的目的。2)清洗:對(duì)于大數(shù)據(jù),并不全是有價(jià)值的,有些數(shù)據(jù)并不是我們所關(guān)心的內(nèi)容,而另一些數(shù)據(jù)則是完全錯(cuò)誤的干擾項(xiàng),因此要對(duì)數(shù)據(jù)通過過濾“去噪”從而提取出有效數(shù)據(jù)。
三、大數(shù)據(jù)存儲(chǔ)及管理技術(shù)
大數(shù)據(jù)存儲(chǔ)與管理要用存儲(chǔ)器把采集到的數(shù)據(jù)存儲(chǔ)起來,建立相應(yīng)的數(shù)據(jù)庫,并進(jìn)行管理和調(diào)用。重點(diǎn)解決復(fù)雜結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化大數(shù)據(jù)管理與處理技術(shù)。主要解決大數(shù)據(jù)的可存儲(chǔ)、可表示、可處理、可靠性及有效傳輸?shù)葞讉€(gè)關(guān)鍵問題。開發(fā)可靠的分布式文件系統(tǒng)(DFS)、能效優(yōu)化的存儲(chǔ)、計(jì)算融入存儲(chǔ)、大數(shù)據(jù)的去冗余及高效低成本的大數(shù)據(jù)存儲(chǔ)技術(shù);突破分布式非關(guān)系型大數(shù)據(jù)管理與處理技術(shù),異構(gòu)數(shù)據(jù)的數(shù)據(jù)融合技術(shù),數(shù)據(jù)組織技術(shù),研究大數(shù)據(jù)建模技術(shù);突破大數(shù)據(jù)索引技術(shù);突破大數(shù)據(jù)移動(dòng)、備份、復(fù)制等技術(shù);開發(fā)大數(shù)據(jù)可視化技術(shù)。
開發(fā)新型數(shù)據(jù)庫技術(shù),數(shù)據(jù)庫分為關(guān)系型數(shù)據(jù)庫、非關(guān)系型數(shù)據(jù)庫以及數(shù)據(jù)庫緩存系統(tǒng)。其中,非關(guān)系型數(shù)據(jù)庫主要指的是NoSQL數(shù)據(jù)庫,分為:鍵值數(shù)據(jù)庫、列存數(shù)據(jù)庫、圖存數(shù)據(jù)庫以及文檔數(shù)據(jù)庫等類型。關(guān)系型數(shù)據(jù)庫包含了傳統(tǒng)關(guān)系數(shù)據(jù)庫系統(tǒng)以及NewSQL數(shù)據(jù)庫。
開發(fā)大數(shù)據(jù)安全技術(shù)。改進(jìn)數(shù)據(jù)銷毀、透明加解密、分布式訪問控制、數(shù)據(jù)審計(jì)等技術(shù);突破隱私保護(hù)和推理控制、數(shù)據(jù)真?zhèn)巫R(shí)別和取證、數(shù)據(jù)持有完整性驗(yàn)證等技術(shù)。
四、大數(shù)據(jù)分析及挖掘技術(shù)
大數(shù)據(jù)分析技術(shù)。改進(jìn)已有數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)技術(shù);開發(fā)數(shù)據(jù)網(wǎng)絡(luò)挖掘、特異群組挖掘、圖挖掘等新型數(shù)據(jù)挖掘技術(shù);突破基于對(duì)象的數(shù)據(jù)連接、相似性連接等大數(shù)據(jù)融合技術(shù);突破用戶興趣分析、網(wǎng)絡(luò)行為分析、情感語義分析等面向領(lǐng)域的大數(shù)據(jù)挖掘技術(shù)。
數(shù)據(jù)挖掘就是從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的實(shí)際應(yīng)用數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識(shí)的過程。數(shù)據(jù)挖掘涉及的技術(shù)方法很多,有多種分類法。根據(jù)挖掘任務(wù)可分為分類或預(yù)測(cè)模型發(fā)現(xiàn)、數(shù)據(jù)總結(jié)、聚類、關(guān)聯(lián)規(guī)則發(fā)現(xiàn)、序列模式發(fā)現(xiàn)、依賴關(guān)系或依賴模型發(fā)現(xiàn)、異常和趨勢(shì)發(fā)現(xiàn)等等;根據(jù)挖掘?qū)ο罂煞譃殛P(guān)系數(shù)據(jù)庫、面向?qū)ο髷?shù)據(jù)庫、空間數(shù)據(jù)庫、時(shí)態(tài)數(shù)據(jù)庫、文本數(shù)據(jù)源、多媒體數(shù)據(jù)庫、異質(zhì)數(shù)據(jù)庫、遺產(chǎn)數(shù)據(jù)庫以及環(huán)球網(wǎng)Web;根據(jù)挖掘方法分,可粗分為:機(jī)器學(xué)習(xí)方法、統(tǒng)計(jì)方法、神經(jīng)網(wǎng)絡(luò)方法和數(shù)據(jù)庫方法。機(jī)器學(xué)習(xí)中,可細(xì)分為:歸納學(xué)習(xí)方法(決策樹、規(guī)則歸納等)、基于范例學(xué)習(xí)、遺傳算法等。統(tǒng)計(jì)方法中,可細(xì)分為:回歸分析(多元回歸、自回歸等)、判別分析(貝葉斯判別、費(fèi)歇爾判別、非參數(shù)判別等)、聚類分析(系統(tǒng)聚類、動(dòng)態(tài)聚類等)、探索性分析(主元分析法、相關(guān)分析法等)等。神經(jīng)網(wǎng)絡(luò)方法中,可細(xì)分為:前向神經(jīng)網(wǎng)絡(luò)(BP算法等)、自組織神經(jīng)網(wǎng)絡(luò)(自組織特征映射、競(jìng)爭(zhēng)學(xué)習(xí)等)等。數(shù)據(jù)庫方法主要是多維數(shù)據(jù)分析或OLAP方法,另外還有面向?qū)傩缘臍w納方法。
從挖掘任務(wù)和挖掘方法的角度,著重突破:1.可視化分析。數(shù)據(jù)可視化無論對(duì)于普通用戶或是數(shù)據(jù)分析專家,都是最基本的功能。數(shù)據(jù)圖像化可以讓數(shù)據(jù)自己說話,讓用戶直觀的感受到結(jié)果。2.數(shù)據(jù)挖掘算法。圖像化是將機(jī)器語言翻譯給人看,而數(shù)據(jù)挖掘就是機(jī)器的母語。分割、集群、孤立點(diǎn)分析還有各種各樣五花八門的算法讓我們精煉數(shù)據(jù),挖掘價(jià)值。這些算法一定要能夠應(yīng)付大數(shù)據(jù)的量,同時(shí)還具有很高的處理速度。3.預(yù)測(cè)性分析。預(yù)測(cè)性分析可以讓分析師根據(jù)圖像化分析和數(shù)據(jù)挖掘的結(jié)果做出一些前瞻性判斷。4.語義引擎。語義引擎需要設(shè)計(jì)到有足夠的人工智能以足以從數(shù)據(jù)中主動(dòng)地提取信息。語言處理技術(shù)包括機(jī)器翻譯、情感分析、輿情分析、智能輸入、問答系統(tǒng)等。5.數(shù)據(jù)質(zhì)量和數(shù)據(jù)管理。數(shù)據(jù)質(zhì)量與管理是管理的最佳實(shí)踐,透過標(biāo)準(zhǔn)化流程和機(jī)器對(duì)數(shù)據(jù)進(jìn)行處理可以確保獲得一個(gè)預(yù)設(shè)質(zhì)量的分析結(jié)果。
六、大數(shù)據(jù)展現(xiàn)與應(yīng)用技術(shù)
大數(shù)據(jù)技術(shù)能夠?qū)㈦[藏于海量數(shù)據(jù)中的信息和知識(shí)挖掘出來,為人類的社會(huì)經(jīng)濟(jì)活動(dòng)提供依據(jù),從而提高各個(gè)領(lǐng)域的運(yùn)行效率,大大提高整個(gè)社會(huì)經(jīng)濟(jì)的集約化程度。在我國(guó),大數(shù)據(jù)將重點(diǎn)應(yīng)用于以下三大領(lǐng)域:商業(yè)智能、政府決策、公共服務(wù)。例如:商業(yè)智能技術(shù),政府決策技術(shù),電信數(shù)據(jù)信息處理與挖掘技術(shù),電網(wǎng)數(shù)據(jù)信息處理與挖掘技術(shù),氣象信息分析技術(shù),環(huán)境監(jiān)測(cè)技術(shù),警務(wù)云應(yīng)用系統(tǒng)(道路監(jiān)控、視頻監(jiān)控、網(wǎng)絡(luò)監(jiān)控、智能交通、反電信詐騙、指揮調(diào)度等公安信息系統(tǒng)),大規(guī)模基因序列分析比對(duì)技術(shù),Web信息挖掘技術(shù),多媒體數(shù)據(jù)并行化處理技術(shù),影視制作渲染技術(shù),其他各種行業(yè)的云計(jì)算和海量數(shù)據(jù)處理應(yīng)用技術(shù)等。
大數(shù)據(jù)應(yīng)用的九個(gè)領(lǐng)域
大數(shù)據(jù)應(yīng)用在生活中可以幫助我們獲取到有用的價(jià)值。
隨著大數(shù)據(jù)的應(yīng)用越來越廣泛,應(yīng)用的行業(yè)也越來越低,我們每日都可以看到大數(shù)據(jù)的一些新穎的應(yīng)用,從而幫助人們從中獲取到真正有用的價(jià)值。許多組織或者個(gè)人都會(huì)受到大數(shù)據(jù)的剖析影響,但是大數(shù)據(jù)是怎樣幫助人們挖掘出有價(jià)值的信息呢?下面就讓我們一起來看看九個(gè)價(jià)值極度高的大數(shù)據(jù)的應(yīng)用,這些都是大數(shù)據(jù)在剖析應(yīng)用上的關(guān)鍵領(lǐng)域:
1.理解客戶、滿足客戶服務(wù)需求
大數(shù)據(jù)的應(yīng)用現(xiàn)在在這領(lǐng)域是最廣為人知的。重點(diǎn)是怎樣應(yīng)用大數(shù)據(jù)更好的了解客戶以及他們的喜好和行為。企業(yè)極度喜歡搜集社交方面的數(shù)據(jù)、瀏覽器的日志、剖析出文本和傳感器的數(shù)據(jù),為了更加全面的了解客戶。在通常情況下,創(chuàng)建出數(shù)據(jù)模型進(jìn)行預(yù)測(cè)。好比美國(guó)的著名零售商Target就是通過大數(shù)據(jù)的剖析,獲得有價(jià)值的信息,精準(zhǔn)得預(yù)測(cè)到客戶在什么時(shí)間想要小孩。另外,通過大數(shù)據(jù)的應(yīng)用,電信公司可以更好預(yù)測(cè)出流失的客戶,沃爾瑪則更加精準(zhǔn)的預(yù)測(cè)哪個(gè)產(chǎn)品會(huì)大賣,汽車保險(xiǎn)行業(yè)會(huì)了解客戶的需求和駕駛水平,政府也能了解到選民的偏好。
2.業(yè)務(wù)流程優(yōu)化
大數(shù)據(jù)也更多的幫助業(yè)務(wù)流程的優(yōu)化。可以通過利用社交媒體數(shù)據(jù)、網(wǎng)絡(luò)搜索以及天氣預(yù)告挖掘出有價(jià)值的數(shù)據(jù),其中大數(shù)據(jù)的應(yīng)用最廣泛的就是供應(yīng)鏈以及配送路線的優(yōu)化。在這2個(gè)方面,地理定位和無線電頻率的識(shí)別追蹤貨物和送貨車,利用實(shí)時(shí)交通路線數(shù)據(jù)制訂更加優(yōu)化的路線。人力資源業(yè)務(wù)也通過大數(shù)據(jù)的剖析來進(jìn)行改良,這其中就包括了人才招聘的優(yōu)化。
3.大數(shù)據(jù)正在改善我們的生活
大數(shù)據(jù)不但單只是應(yīng)用于企業(yè)和政府,同樣也適用我們生活當(dāng)中的每個(gè)人。我們可以利用穿著的裝備(如智能手表或者智能手環(huán))生成最新的數(shù)據(jù),這讓我們可以憑據(jù)我們熱量的消耗以及睡眠模式來進(jìn)行追蹤。而且還利用利用大數(shù)據(jù)剖析來尋找屬于我們的愛情,大多數(shù)時(shí)間交友網(wǎng)站就是大數(shù)據(jù)應(yīng)用工具來幫助需要的人匹配合適的對(duì)象。
4.提高醫(yī)療和研發(fā)
大數(shù)據(jù)剖析應(yīng)用的計(jì)算能力可以讓我們能夠在幾分鐘內(nèi)就可以解碼整個(gè)DNA。而且讓我們可以制訂出最新的治療方案。同時(shí)可以更好的去理解和預(yù)測(cè)疾病。就好像人們戴上智能手表等可以形成的數(shù)據(jù)一樣,大數(shù)據(jù)同樣可以幫助病人對(duì)于病情進(jìn)行更好的治療。大數(shù)據(jù)技術(shù)現(xiàn)在已經(jīng)在醫(yī)院應(yīng)用監(jiān)視早產(chǎn)嬰兒和患病嬰兒的情況,通過記錄和剖析嬰兒的心跳,醫(yī)生針對(duì)嬰兒的身體可能會(huì)出現(xiàn)不適癥狀做出預(yù)測(cè)。這樣可以幫助醫(yī)生更好的救助嬰兒。
5.提高體育成績(jī)
現(xiàn)在許多運(yùn)發(fā)動(dòng)在訓(xùn)練的時(shí)間應(yīng)用大數(shù)據(jù)剖析技術(shù)了。好比例如用于網(wǎng)球鼻塞的IBM SlamTracker工具,我們使用視頻剖析來追蹤足球或棒球比賽中每個(gè)球員的表現(xiàn),而運(yùn)動(dòng)器材中的傳感器技術(shù)(例如籃球或高爾夫俱樂部)讓我們可以獲得對(duì)比賽的數(shù)據(jù)以及怎樣改良。許多精英運(yùn)動(dòng)隊(duì)還追蹤比賽環(huán)境外運(yùn)發(fā)動(dòng)的活動(dòng)-通過使用智能技術(shù)來追蹤其營(yíng)養(yǎng)情況以及睡眠,以及社交對(duì)話來監(jiān)控其情感情況。
6.優(yōu)化機(jī)器和設(shè)備性能
大數(shù)據(jù)剖析還可以讓積極和設(shè)備在應(yīng)用上更加智能化和自主化。例如,大數(shù)據(jù)工具曾經(jīng)就被谷歌公司利用研發(fā)谷歌自駕汽車。豐田的普瑞就配有相機(jī)、GPS以及傳感器,在交通上能夠安全的駕駛,不需要人類的敢于。大數(shù)據(jù)工具還可以應(yīng)用優(yōu)化智能電話。
7.改善安全和執(zhí)法
大數(shù)據(jù)現(xiàn)在已經(jīng)廣泛應(yīng)用到安全執(zhí)法的過程當(dāng)中。想必大師都知道美國(guó)安全局利用大數(shù)據(jù)進(jìn)行恐怖主義打擊,甚至監(jiān)控人們的日常生活。而企業(yè)則應(yīng)用大數(shù)據(jù)技術(shù)進(jìn)行防御網(wǎng)絡(luò)攻擊。警察應(yīng)用大數(shù)據(jù)工具進(jìn)行捕捉罪犯,信用卡公司應(yīng)用大數(shù)據(jù)工具來檻車敲詐性買賣。
8.改善我們的城市
大數(shù)據(jù)還被應(yīng)用改善我們?nèi)粘I畹某鞘?。例如基于城市?shí)時(shí)交通訊息、利用社交網(wǎng)絡(luò)和天氣數(shù)據(jù)來優(yōu)化最新的交通情況?,F(xiàn)在許多城市都在進(jìn)行大數(shù)據(jù)的剖析和試點(diǎn)。
9.金融買賣
大數(shù)據(jù)在金融行業(yè)主要是應(yīng)用金融買賣。高頻買賣(HFT)是大數(shù)據(jù)應(yīng)用比較多的領(lǐng)域。其中大數(shù)據(jù)算法應(yīng)用于買賣決議。現(xiàn)在許多股權(quán)的買賣都是利用大數(shù)據(jù)算法進(jìn)行,這些算法現(xiàn)在越來越多的考慮了社交媒體和網(wǎng)站新聞來決議在未來幾秒內(nèi)是買出還是賣出。
以上九個(gè)是大數(shù)據(jù)應(yīng)用最多的九個(gè)領(lǐng)域,當(dāng)然隨著大數(shù)據(jù)的應(yīng)用越來越普及,另有許多新的大數(shù)據(jù)的應(yīng)用領(lǐng)域,以及新的大數(shù)據(jù)應(yīng)用。
大數(shù)據(jù)應(yīng)用的八個(gè)典型案例
什么是大數(shù)據(jù)?不要再舉例說啤酒和尿布的例子了,Gartner的分析師Doug Laney在講解大數(shù)據(jù)案例時(shí)提到過8個(gè)更有新意更典型的案例,可幫助更清晰的理解大數(shù)據(jù)時(shí)代的到來。
1. 梅西百貨的實(shí)時(shí)定價(jià)機(jī)制。根據(jù)需求和庫存的情況,該公司基于SAS的系統(tǒng)對(duì)多達(dá)7300萬種貨品進(jìn)行實(shí)時(shí)調(diào)價(jià)。
2. Tipp24 AG針對(duì)歐洲博彩業(yè)構(gòu)建的下注和預(yù)測(cè)平臺(tái)。該公司用KXEN軟件來分析數(shù)十億計(jì)的交易以及客戶的特性,然后通過預(yù)測(cè)模型對(duì)特定用戶進(jìn)行動(dòng)態(tài)的營(yíng)銷活動(dòng)。這項(xiàng)舉措減少了90%的預(yù)測(cè)模型構(gòu)建時(shí)間。SAP公司正在試圖收購KXEN。
3. 沃爾瑪?shù)乃阉?。這家零售業(yè)寡頭為其網(wǎng)站W(wǎng)almart.com自行設(shè)計(jì)了最新的搜索引擎Polaris,利用語義數(shù)據(jù)進(jìn)行文本分析、機(jī)器學(xué)習(xí)和同義詞挖掘等。根據(jù)沃爾瑪?shù)恼f法,語義搜索技術(shù)的運(yùn)用使得在線購物的完成率提升了10%到15%。“對(duì)沃爾瑪來說,這就意味著數(shù)十億美元的金額?!盠aney說。
4. 快餐業(yè)的視頻分析。該公司通過視頻分析等候隊(duì)列的長(zhǎng)度,然后自動(dòng)變化電子菜單顯示的內(nèi)容。如果隊(duì)列較長(zhǎng),則顯示可以快速供給的食物;如果隊(duì)列較短,則顯示那些利潤(rùn)較高但準(zhǔn)備時(shí)間相對(duì)長(zhǎng)的食品。
5. Morton牛排店的品牌認(rèn)知。當(dāng)一位顧客開玩笑地通過推特向這家位于芝加哥的牛排連鎖店訂餐送到紐約Newark機(jī)場(chǎng)(他將在一天工作之后抵達(dá)該處)時(shí),Morton就開始了自己的社交秀。首先,分析推特?cái)?shù)據(jù),發(fā)現(xiàn)該顧客是本店的常客,也是推特的常用者。根據(jù)客戶以往的訂單,推測(cè)出其所乘的航班,然后派出一位身著燕尾服的侍者為客戶提供晚餐。
6. PredPol Inc.。PredPol公司通過與洛杉磯和圣克魯斯的警方以及一群研究人員合作,基于地震預(yù)測(cè)算法的變體和犯罪數(shù)據(jù)來預(yù)測(cè)犯罪發(fā)生的幾率,可以精確到500平方英尺的范圍內(nèi)。在洛杉磯運(yùn)用該算法的地區(qū),盜竊罪和暴力犯罪分布下降了33%和21%。
7. Tesco PLC(特易購)和運(yùn)營(yíng)效率。這家超市連鎖在其數(shù)據(jù)倉庫中收集了700萬部冰箱的數(shù)據(jù)。通過對(duì)這些數(shù)據(jù)的分析,進(jìn)行更全面的監(jiān)控并進(jìn)行主動(dòng)的維修以降低整體能耗。
8. American Express(美國(guó)運(yùn)通,AmEx)和商業(yè)智能。以往,AmEx只能實(shí)現(xiàn)事后諸葛式的報(bào)告和滯后的預(yù)測(cè)?!皞鹘y(tǒng)的BI已經(jīng)無法滿足業(yè)務(wù)發(fā)展的需要?!盠aney認(rèn)為。于是,AmEx開始構(gòu)建真正能夠預(yù)測(cè)忠誠(chéng)度的模型,基于歷史交易數(shù)據(jù),用115個(gè)變量來進(jìn)行分析預(yù)測(cè)。該公司表示,對(duì)于澳大利亞將于之后四個(gè)月中流失的客戶,已經(jīng)能夠識(shí)別出其中的24%。
大數(shù)據(jù)技術(shù)與應(yīng)用可能在未來發(fā)揮它更大的作用,我們拭目以待!
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
LSTM 模型輸入長(zhǎng)度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長(zhǎng)序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報(bào)考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計(jì)的實(shí)用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強(qiáng)大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠(chéng)摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實(shí)施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價(jià)值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡(jiǎn)稱 BI)深度融合的時(shí)代,BI ...
2025-07-10SQL 在預(yù)測(cè)分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢(shì)預(yù)判? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代,預(yù)測(cè)分析作為挖掘數(shù)據(jù)潛在價(jià)值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價(jià)值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點(diǎn),而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報(bào)考到取證的全攻略? 在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭(zhēng)搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢(shì)性檢驗(yàn):捕捉數(shù)據(jù)背后的時(shí)間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢(shì)性檢驗(yàn)如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時(shí)間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時(shí)間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實(shí)戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗(yàn):數(shù)據(jù)趨勢(shì)與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢(shì)變化以及識(shí)別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國(guó)內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對(duì)策略? 長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨(dú)特的門控機(jī)制,在 ...
2025-07-07統(tǒng)計(jì)學(xué)方法在市場(chǎng)調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場(chǎng)調(diào)研是企業(yè)洞察市場(chǎng)動(dòng)態(tài)、了解消費(fèi)者需求的重要途徑,而統(tǒng)計(jì)學(xué)方法則是市場(chǎng)調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動(dòng)力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動(dòng)力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價(jià)值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03