
誰在讀你的微博 大數(shù)據(jù)分析將給出答案
現(xiàn)在,你的推文(Tweets)正在被哪些人閱讀?他們往往是你所購產(chǎn)品的制造商。最近一項融合了許多學(xué)科知識的有趣實驗正在用于分析淹沒在推特(Twitter)宇宙大數(shù)據(jù)中的各種觀點。Esri、IBM等致力于大數(shù)據(jù)研究的各個廠家目前都在挖掘Twitter內(nèi)容,并且運(yùn)用自己開發(fā)的方法對其進(jìn)行分析。近年來,這種合作開啟了一個研究的新時代,Esri公司的地理信息系統(tǒng)(GIS)技術(shù)聯(lián)合IBM的語言與心理分析,可以共同解碼互聯(lián)網(wǎng)上那些浩如煙海的信息。
社交媒體地圖
眾所周知,我們處在信息爆炸的時代,大多數(shù)IT大佬都承認(rèn),如果不能盡快地控制數(shù)據(jù)的泛濫成災(zāi),將會對人類進(jìn)步形成巨大的威脅。馴服大數(shù)據(jù)需要發(fā)明新的技術(shù),通過分析和可視化來更好地了解這個龐然大物。
多年來,社交媒體為Esri地圖提供了豐富的數(shù)據(jù)源。2011年,Esri推出了日本地震圖,這是一份概念驗證(proof-of-concept)地圖,來自日本數(shù)百萬Tweets信息為地圖的繪制提供了數(shù)據(jù)源,9.0級的本州地震后來自Tweets的數(shù)據(jù)幫助揭示了在危機(jī)中的那些急需物資救援的地點。從此,用社交媒體的內(nèi)容充實各種地圖就成了司空見慣的做法。2013年,Esri正式進(jìn)入大數(shù)據(jù)領(lǐng)域,將大數(shù)據(jù)工作流程整合進(jìn)該公司的ArcGIS產(chǎn)品中,并推出包括GIS Tools for Hadoop在內(nèi)的數(shù)個GitHub開源項目,這些項目使大數(shù)據(jù)獲得了地理空間能力。
品牌監(jiān)測
社交媒體的高容量、多樣化、高速度及真實性滿足大數(shù)據(jù)的4大典型特征。每天都有超過5億的Tweets信息發(fā)布以及超過35億類似的自媒體信息發(fā)布,社交媒體是一個具有超大信息量并且充滿噪聲的數(shù)據(jù)源范例。在這些喋喋不休中,Twitter用戶可分享其酸甜苦辣的各種經(jīng)歷和各種觀點。但是過濾掉噪聲,依然可以從那些充滿觀點的Tweets中窺見買家的心態(tài)和想法。
通過與IBM阿爾馬登研究中心的加速發(fā)現(xiàn)實驗室合作,Esri創(chuàng)建了一種稱為輿情監(jiān)控的交互式概念驗證(proof-of-concept)地圖,使用Tweets和地理空間技術(shù)來了解客戶情感并聚焦于品牌管理。IBM阿爾馬登研究中心的加速發(fā)現(xiàn)實驗室是進(jìn)行跨行業(yè)大數(shù)據(jù)分析的最先進(jìn)的實驗室。
Esri總裁Jack Dangermond說,“和GIS的出現(xiàn)一樣,大數(shù)據(jù)分析的出現(xiàn)也是因為需要對出現(xiàn)的問題提供正確的答案。通過分析,我們提取了某些的答案并幫助各機(jī)構(gòu)能更好地了解其客戶。Esri/IBM聯(lián)合輿情監(jiān)控示范則結(jié)合了GIS系統(tǒng)和輿情監(jiān)控領(lǐng)域的最新研究成果?!?/span>
Esri Tapestry數(shù)據(jù)為品牌管理提供有用的客戶生活方式信息
解碼Decahose
Tweets內(nèi)容包含了大量的客戶觀點信息,因此早在2010年,Twitter就將其每日的用戶輸出內(nèi)容進(jìn)行商品化。Twitter建立了Tweets流許可制,各個企業(yè)以及咨詢公司都可從這些數(shù)據(jù)中淘金。為了著手進(jìn)行社交媒體分析,IBM從第三方經(jīng)銷商手中獲得了Twitter DecaHose授權(quán)(特定時間段內(nèi)隨機(jī)抽取特定范圍內(nèi)百分之十的Tweets信息)。
針對這些信息,服裝零售商所關(guān)心的是品牌管理工具是否可以監(jiān)控Tweets中所有的客戶觀點。IBM加速發(fā)現(xiàn)實驗室的研究員們準(zhǔn)備利用品牌管理工具,從多個角度來回答這個有趣的問題。2013年3月,8家全國性服裝品牌被選作樣本,IBM與Esri合作進(jìn)行聯(lián)合輿情監(jiān)控示范項目。
為了設(shè)計輿情監(jiān)控示范系統(tǒng),Esri的開發(fā)人員花了一天的時間與IBM的研究員們進(jìn)行討論,實驗室中所有的軟件、數(shù)據(jù)和專利技術(shù)都對其開放。最后,利用Portal for ArcGIS和ArcGIS for Server,Esri開發(fā)了一套交互式地圖應(yīng)用,通過位置和時間可視化Twitter用戶數(shù)據(jù)。這有助于實驗室定義Tweets內(nèi)容模式,對人口統(tǒng)計資料和客戶類型進(jìn)行更直觀的認(rèn)識。IBM的社交媒體分析方法可以解碼客戶觀點、位置及心理語言等各種屬性,可以按地區(qū)對服裝品牌形象進(jìn)行評價。通過IBM加速發(fā)現(xiàn)實驗室的算法,可推測出未包括在Tweets中的Tweets發(fā)送者的概要信息,如性別及個性特點等,并顯示在地圖底部。從下拉菜單中選擇參與服裝品牌,在不同零售商之間輕松比較Tweets提及率和及其客戶特點。從更微觀的角度,實驗室的心理分析與來自Esri Tapestry人口統(tǒng)計數(shù)據(jù)分析可以并發(fā)執(zhí)行分析得出結(jié)果,這個結(jié)果可以整合買主本質(zhì)特征,在個體層面進(jìn)行數(shù)據(jù)梳理,為品牌經(jīng)理提供了一個客戶關(guān)系管理的超強(qiáng)工具。
監(jiān)控危機(jī)范圍
Esri及IBM輿情監(jiān)控示范實驗分別按照品牌的正面提及和負(fù)面提及做了劃分,并在地圖上顯示出來
對參加輿情監(jiān)控實驗的一家服裝零售商而言,2013年的某一周就像是永遠(yuǎn)。2013年,該公司因某簽名品牌的服裝的一個瑕疵而遭到了連珠炮式的投訴。
可以預(yù)見的是,在美國某些地區(qū),通過Tweets活動進(jìn)行品牌監(jiān)測的現(xiàn)象會增加,這些地區(qū)的位置將在輿情監(jiān)控地圖上表示出來。通過地理位置顯示Tweets信息,可以了解不同地域的人們對產(chǎn)品瑕疵的反映,對社交媒體進(jìn)行分析可以為在出現(xiàn)危機(jī)時第一時間實施品牌管理提供有利的實時信息。
“GIS可幫助確定問題的范圍?!盜BM加速發(fā)現(xiàn)實驗室研究人員兼數(shù)據(jù)整合專家Mary Roth說,“結(jié)合我們的分析,Esri可快速確定這股Tweets風(fēng)暴來自何方,比如說,如果只是來自羅德島,地理處理數(shù)據(jù)會顯示出該問題只是地方性問題而沒有蔓延至全國。重要的是,這樣的信息最終會降低響應(yīng)成本。”
輿情監(jiān)控示范是從Twitter信息源中提取和展示分析結(jié)果的最簡單有效的方法。一旦Tweets信息的價值被發(fā)現(xiàn),品牌經(jīng)理就可通過研究Tweets發(fā)送者的個性特點和人口統(tǒng)計資料進(jìn)行深入的數(shù)據(jù)挖掘,但是顯示在地圖中的數(shù)據(jù)不會泄露任何用戶的隱私。這種方法為各公司徹底了解其客戶提供了依據(jù),并借此量身定制其品牌形象,更快、更有針對性地對品牌危機(jī)做出反應(yīng)。
針對所有人的大數(shù)據(jù)分析
盡管有點嚇人,但數(shù)據(jù)洪流仍為以前不可能進(jìn)行的研究創(chuàng)造了新的機(jī)遇,而不再是陳舊零碎的分析。輿情監(jiān)控僅是大數(shù)據(jù)研究的冰山一角,Esri和IBM目前正在設(shè)計新的大數(shù)據(jù)分析方法,該方法將地理分析與其合作研發(fā)的方法體系結(jié)合在一起。今年,Esri將在進(jìn)一步加強(qiáng)在此領(lǐng)域的研究,并將發(fā)布一系列革命性的針對大數(shù)據(jù)研究的新工具和方法。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計學(xué)領(lǐng)域,假設(shè)檢驗是驗證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數(shù)據(jù)的科學(xué)計數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點數(shù)據(jù)時的科學(xué)計數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當(dāng)下,精準(zhǔn)營銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價值 在數(shù)據(jù)驅(qū)動決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實踐到業(yè)務(wù)價值挖掘 在數(shù)據(jù)分析場景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價值導(dǎo)向 統(tǒng)計模型作為數(shù)據(jù)分析的核心工具,并非簡單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10