
所有關于用戶數(shù)據(jù)的收集,都是為了對數(shù)據(jù)進行智能分析,期待發(fā)現(xiàn)新的趨勢和不可預見的行為。考慮到商業(yè)智能應用能夠從PB級別數(shù)據(jù)中篩選數(shù)據(jù)的日子可能永遠不會到來,一些企業(yè)以天為單位收集數(shù)據(jù),但是這不能成為企業(yè)大數(shù)據(jù)分析狹隘觀點的借口。但如何才能使企業(yè)在條件有限的情況下,最好地利用他們積累的新資料和統(tǒng)計數(shù)據(jù)?這需要時間,耐心,而且你將看到,投資必要資金的負責人將可以為企業(yè)實施正確的計劃。
選擇正確的負責人
大數(shù)據(jù)本身到成熟期也就只花了幾年時間,這意味著大分析(Big Analytics)才開始孵化。這意味著,在這個浩大的技術舞臺上存在一個相當大的缺口,尋找合適的專家將是一個挑戰(zhàn)。最近一次信息周刊關于“分析,商業(yè)智能和信息管理”的調查中, 47%的受訪者列出了作為使用大數(shù)據(jù)軟件的首要問題是‘專業(yè)知識既稀缺且昂貴’?!钡_地使用商業(yè)智能(BI) ,找到合適的人才是絕對必要的。
在O’Reilly 2012 Strata 大會上生機勃勃的數(shù)據(jù)科學論戰(zhàn)確認,要確定聘請誰來為大洞察挖掘大數(shù)據(jù)不是件容易的事情,人工智能領域專家或機器學習專家將能夠為企業(yè)提供更多的價值。
數(shù)據(jù)科學家只專注于數(shù)字和模式就能取得顯著成績的歲月已經(jīng)過去,他們需要結合機器學習,嘗試真正的算法來找到大多數(shù)經(jīng)驗豐富的專家都錯過的數(shù)據(jù)相關性。但大數(shù)據(jù)顧問Drew Conway做出了一個強有力的證明,機器學習作為一種工具可以提供一些有趣的答案,但這些答案需要滿足一個重要的條件。 “你能以任何有意義的方式解釋這個結果嗎?”Conway說。 “我猜測也許不是。一個專業(yè)領域專家將不得不看那個模型,并決定所選擇功能,以及傳遞的輸出和回歸系數(shù),是否真正與訓練集和測試集之外的樣本相關。這是專業(yè)領域的基礎知識?!?/span>
企業(yè)將需要建立一個團隊,其中包括這兩個學科的專家。為了數(shù)據(jù)挖掘的準確性,需要一位某個專業(yè)領域的專家來開發(fā)問題,然后依賴一個機器學習專家開發(fā)并且實施查詢或創(chuàng)建分析,然后才有兩個領域專家結合得出的正確結果。
舊酒裝新瓶
大分析不只是因為大數(shù)據(jù)時代的來臨企業(yè)才用于挖掘信息。 “我們已經(jīng)看到客戶以全新的商業(yè)模式出現(xiàn),他們使用與社交媒體相關的歷史數(shù)據(jù)集,這些曾經(jīng)是免費的,現(xiàn)在他們把變現(xiàn)或定價,”英特爾的Girish Juneja在最近舊金山舉行的亞馬遜AWS峰會上說。但是,新技術永遠是洞察用戶行為最有力的工具,尤其移動用戶更是一個特別需要培養(yǎng)的肥沃資源。 “我們所看到的是,隨著越來越多應用正在被移動用戶推動,正因如此生成的數(shù)據(jù)量越來越大。大部分數(shù)據(jù)是被收集在云環(huán)境中,比如AWS。然后,新的商業(yè)模型正在利用這些數(shù)據(jù),并基于這些數(shù)據(jù)提供新的服務?!?/span>
在大分析競賽中先拔頭籌
企業(yè)都使用什么類型的工具來篩選他們的大數(shù)據(jù),以發(fā)現(xiàn)一些大分析?亞馬遜的Elastic MapReduce一直是很受歡迎的選擇,它幫助客戶挖掘當前未充分利用大數(shù)據(jù)源,然后利用BI展示。從幾年前就開始被經(jīng)常吹捧的一個的案例,Yelp開始整理其巨大的編輯日志文件,以尋找隱藏的關聯(lián)性。 “他們通過分析這些數(shù)據(jù)找出的一件事情是,人們是通過移動設備上訪問這個站點,”亞馬遜高級產(chǎn)品經(jīng)理John Einkauf在2014年舊金山舉行的AWS峰會上表示。 “這已經(jīng)是幾年前的事情,那時候很多公司還不曾開始了解向移動轉移。因此,他們在移動上做了很好的投資,為他們的服務取得了很好的流動性。截至2013年1月,他們正為950萬獨特移動設備提供服務。這一切都歸功于這個最初的洞察力,他們能夠分析出TB的日志數(shù)據(jù)。“識別數(shù)據(jù)的競爭者是最近被忽略的,并創(chuàng)建一個策略來挖掘它。這些途徑和策略就能區(qū)分出市場領導者和競爭失敗者。
生成正確的結果
進行數(shù)據(jù)分析的另一個經(jīng)常尚未開發(fā)的數(shù)據(jù)源是社會渠道的非結構化數(shù)據(jù)。處理非結構化數(shù)據(jù)始終是一個巨大的挑戰(zhàn),因為在判斷數(shù)據(jù)相關性方面非常困難,但盡管如此,非結構化數(shù)據(jù)在商業(yè)智能和大數(shù)據(jù)分析領域越來越重要。那么,企業(yè)組織在非結構化數(shù)據(jù)分析時如何濾掉干擾呢?大多數(shù)處理非結構化文本策略包含一個反饋回路,用以隨著時間推移產(chǎn)生更多具有高度針對性的數(shù)據(jù)用于測試。從現(xiàn)有的社會資源收集然后可以變成可使用的社交媒體參與者,作為測試對象進行實驗。在企業(yè)層面,這可能意味著啟動了提出問題,各種社會媒體宣傳,邀請解說,或挑釁,然后可以測量和分析一些其他的回應。這是一個費時且高度復雜的過程,而是通過社交媒體獲得有意義的信息可以是金色的,當涉及到了解客戶真正想要的。
諷刺的是,許多能夠使大分析更有效的解決方案,都需要收集和創(chuàng)造更多的數(shù)據(jù)。然而,與其被動承受不如主動出擊,企業(yè)能夠自己定位,從而利用隱藏在過去,現(xiàn)在和未來大數(shù)據(jù)的洞察力。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關鍵? 在循環(huán)神經(jīng)網(wǎng)絡(RNN)家族中,長短期記憶網(wǎng)絡(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準備指南? ? 在數(shù)據(jù)驅動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認 ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務的價值轉化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預測分析中的應用:從數(shù)據(jù)查詢到趨勢預判? ? 在數(shù)據(jù)驅動決策的時代,預測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結束)并非工作的終點,而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報考到取證的全攻略? 在數(shù)字經(jīng)濟蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗:捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準 ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應用與實戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗:數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領域中,準確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認證作為國內權威的數(shù)據(jù)分析能力認證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應對策略? 長短期記憶網(wǎng)絡(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(RNN)的一種變體,憑借獨特的門控機制,在 ...
2025-07-07統(tǒng)計學方法在市場調研數(shù)據(jù)中的深度應用? 市場調研是企業(yè)洞察市場動態(tài)、了解消費者需求的重要途徑,而統(tǒng)計學方法則是市場調研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉日期:解鎖數(shù)據(jù)處理的關鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準確性的基礎 ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅動力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03