
大數(shù)據(jù)VS小數(shù)據(jù):9種數(shù)據(jù)類型及利用方法
如今,具有壓倒性的數(shù)據(jù)量使得市場(chǎng)營(yíng)銷人員和廣告商們已經(jīng)難以理解哪些信息非常重要,哪些信息是純粹的噪音,哪些數(shù)據(jù)是正確的?而哪些數(shù)據(jù)又是可以信賴的?不同類型的數(shù)據(jù)具有什么作用,又應(yīng)該如何被使用?下面筆者根據(jù)專注以數(shù)據(jù)為基礎(chǔ)的多渠道營(yíng)銷自動(dòng)化智能化機(jī)構(gòu)webpower的數(shù)據(jù)客觀可信度排名,給大家介紹9種不同類型的數(shù)據(jù),以及它們應(yīng)該如何被有效使用。
1.試驗(yàn)性數(shù)據(jù)
通過客觀的專業(yè)第三方精心設(shè)計(jì)和嚴(yán)格控制的試驗(yàn),得到最可靠的數(shù)據(jù)。并且全程和專業(yè)熟練的分析人員一起,對(duì)數(shù)據(jù)中的噪聲進(jìn)行了分離。
2.調(diào)查研究數(shù)據(jù)
由經(jīng)驗(yàn)豐富的專業(yè)第三方專業(yè)人士做科學(xué)研究,產(chǎn)生的可靠數(shù)據(jù)。研究設(shè)計(jì),規(guī)范的數(shù)據(jù),數(shù)學(xué)建模,刺激控制,統(tǒng)計(jì)控制,歷史經(jīng)驗(yàn),質(zhì)量保證標(biāo)準(zhǔn)等使得數(shù)據(jù)往往非常精確,噪聲往往最小。
3.營(yíng)銷組合模型數(shù)據(jù)
創(chuàng)造一個(gè)分析數(shù)據(jù)庫(kù),并清理和規(guī)范這些數(shù)據(jù),采用多元統(tǒng)計(jì)和建模去隔離和消除部分噪音,以使?fàn)I銷組合模型數(shù)據(jù)比實(shí)際銷售數(shù)據(jù)更好。營(yíng)銷組合建模數(shù)據(jù)中的信號(hào)更穩(wěn)定,更可靠,更加可測(cè)量。這種類型的數(shù)據(jù)可以幫助企業(yè)了解哪些變量推動(dòng)了他們業(yè)務(wù),如是媒體廣告,或者銷售人員的數(shù)量,或定價(jià)差異?但通常需要多年的數(shù)據(jù)積累來(lái)從營(yíng)銷混合建模中獲得最大價(jià)值。
4.媒體組合建模數(shù)據(jù)
這和營(yíng)銷組合建模是相同的概念,規(guī)則相同,只是應(yīng)用了一組不同的變量。一個(gè)分析數(shù)據(jù)庫(kù),數(shù)據(jù)清洗,建模和使數(shù)據(jù)中噪聲被最小化,從而使各種媒體的影響被分離開來(lái)。同樣,如果再與控制實(shí)驗(yàn)結(jié)合,那么這些數(shù)據(jù)和分析將更具有解釋說(shuō)明性。
5.銷售數(shù)據(jù)
webpower認(rèn)為銷售數(shù)據(jù)一定程度上可以被信任,但以銷售數(shù)據(jù)衡量實(shí)際銷售效果并不完美。因?yàn)殇N售可能還受廣告效果、最佳媒體花費(fèi)、產(chǎn)品質(zhì)量、服務(wù)效率、有競(jìng)爭(zhēng)力活動(dòng)等等影響。經(jīng)濟(jì),競(jìng)爭(zhēng)活動(dòng),天氣,通貨膨脹,度假周期,新聞事件,政治事件,庫(kù)存和分銷偏差,定價(jià)紊亂等因素也制造了錯(cuò)誤的反饋和歪曲的景象,所以銷售數(shù)據(jù)并不是衡量原因和效果的最好方法,而只是理智的衡量什么已經(jīng)發(fā)生,它并不會(huì)告知為什么發(fā)生以及什么使之發(fā)生。
6.眼球追蹤數(shù)據(jù)
眼球追蹤主要是研究眼球運(yùn)動(dòng)信息的獲取、建模和模擬。而獲取眼球運(yùn)動(dòng)信息的設(shè)備除了紅外設(shè)備之外,還可以是圖像采集設(shè)備,甚至一般電腦或手機(jī)上的攝像頭,其在軟件的支持下也可以實(shí)現(xiàn)眼球跟蹤。隨著測(cè)量設(shè)備和軟件的穩(wěn)步改善,您可以利用眼球追蹤技術(shù)獲取及生成有用的診斷信息,以幫助理解為什么一個(gè)項(xiàng)目、網(wǎng)站或廣告沒有成功引起用戶注意或注冊(cè)某些消息或圖像。
7.生物識(shí)別或生理測(cè)量
皮膚電反應(yīng),眼睛的瞳孔擴(kuò)張,心臟率,腦電圖(腦電波)測(cè)量,面部情緒識(shí)別等都非常有趣和令人興奮,他們都可能將來(lái)成為進(jìn)入人的靈魂的門戶,但目前,這些措施在很大程度上是推測(cè)性的和未經(jīng)證實(shí)的。其中一些措施在跟蹤人的意識(shí)覺醒上相當(dāng)不錯(cuò),但如果沒有引入測(cè)量或定性研究,就沒有精確的方法去知道這個(gè)覺醒是否積極或者消極。
8.群體或咨詢小組數(shù)據(jù)
許多大公司都購(gòu)買了一些能夠使其經(jīng)常對(duì)一小組目標(biāo)客戶進(jìn)行調(diào)研及對(duì)話的系統(tǒng)。企業(yè)的各類人群每天或每周都在持續(xù)地進(jìn)行這種小眾的調(diào)查。如果不把結(jié)果的質(zhì)量考在內(nèi),每次調(diào)查或測(cè)量的成本相對(duì)比較低。但是由于這樣的群體并不真正具有代表性,也不是隨機(jī)選擇的,且很少驗(yàn)證過,所以隨著時(shí)間的推移,條件反射和慣性學(xué)習(xí)的風(fēng)險(xiǎn)將破壞群體的代表意義。
9.社會(huì)化媒體數(shù)據(jù)
社交媒體數(shù)據(jù)非常受歡迎。因?yàn)樵摂?shù)據(jù)往往比較便宜的,數(shù)量大,并且實(shí)時(shí)(每天或每時(shí))。許多新的軟件工具和系統(tǒng)也比較容易對(duì)數(shù)據(jù)進(jìn)行分析。社交媒體數(shù)據(jù)也許作為早期預(yù)警系統(tǒng)最有價(jià)值,但是,必須始終以懷疑和質(zhì)疑的態(tài)度去對(duì)外社交媒體數(shù)據(jù),webpower認(rèn)為有以下幾個(gè)原因:
1)許多產(chǎn)品類別和品牌幾乎從來(lái)沒有在社會(huì)化媒體上被提及,使得樣本量太小,數(shù)據(jù)的可靠性無(wú)法確定。
2)社交媒體評(píng)論受復(fù)雜因素影響,如新聞,特別活動(dòng),媒體廣告,促銷,宣傳,電影,競(jìng)爭(zhēng)活動(dòng)和電視節(jié)目等,因此數(shù)據(jù)中的噪音很多。
3)社交媒體數(shù)據(jù)受到操作。你可能會(huì)認(rèn)為你正在跟隨一個(gè)重要的數(shù)據(jù)趨勢(shì),后來(lái)才得知這只是競(jìng)爭(zhēng)對(duì)手混淆你的一個(gè)聰明的計(jì)謀。越來(lái)越多的企業(yè)和其他組織都在努力創(chuàng)造社會(huì)媒體內(nèi)容和管理社會(huì)化媒體評(píng)論,因此數(shù)據(jù)的研究?jī)r(jià)值也正在迅速減少。
社交媒體評(píng)論是通過網(wǎng)頁(yè)抓取識(shí)別和收集的,我們幾乎從來(lái)不知道確切的來(lái)源,背景,刺激因素,或評(píng)論背后的歷史。這些未知因素使得詮釋社交媒體數(shù)據(jù)變得危險(xiǎn)。這就是為什么我們要以畏懼的精神和充滿懷疑的眼光去審視社交媒體數(shù)據(jù)。
小數(shù)據(jù)
筆者曾經(jīng)也說(shuō)過,在目前階段,如果企業(yè)決策者能夠依靠一些小數(shù)據(jù)工具和系統(tǒng),而不是大數(shù)據(jù)的設(shè)想,數(shù)據(jù)將能夠更好地服務(wù)于你的企業(yè)。抽樣理論告訴我們,如果樣本是隨機(jī)的,企業(yè)可以通過與很少量的人群進(jìn)行交談,以測(cè)量整個(gè)目標(biāo)群體的行為或心理。
一個(gè)包含1500的樣本足以預(yù)測(cè)誰(shuí)將會(huì)贏得總統(tǒng)選舉。200-300受訪者的樣本通常足以預(yù)知整個(gè)人口喜歡一個(gè)新的產(chǎn)品或服務(wù)的程度。對(duì)一個(gè)包含200個(gè)用戶的樣本進(jìn)行一個(gè)新的家用花生醬測(cè)試,可以精確地確定該產(chǎn)品是否是最優(yōu),一旦推出之后占有的市場(chǎng)份額。
這些都是小數(shù)據(jù)的例子。調(diào)查研究是相對(duì)便宜,但非常準(zhǔn)確,因?yàn)閷I(yè)研究人員知道來(lái)源,刺激因素,背景和歷史,并具有可靠的測(cè)量?jī)x器,數(shù)據(jù)規(guī)范,質(zhì)量保證和控制。盡管大家都在談?wù)摷般裤酱髷?shù)據(jù),但小數(shù)據(jù)往往為企業(yè)決策提供了更完善、更準(zhǔn)確的依據(jù)。少量(?。?shù)據(jù)又應(yīng)如何正確地被分析被理解,以獲得更高的成本效益,提供更好的營(yíng)銷洞察力,在以數(shù)據(jù)為基礎(chǔ)的多渠道營(yíng)銷自動(dòng)化智能化機(jī)構(gòu)。
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實(shí)戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無(wú)論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫(kù)管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫(kù)表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動(dòng)態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價(jià)值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫(kù)表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實(shí)戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫(kù))處理 Excel 數(shù)據(jù)時(shí),“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗(yàn)與 t 檢驗(yàn):差異、適用場(chǎng)景與實(shí)踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計(jì)學(xué)領(lǐng)域,假設(shè)檢驗(yàn)是驗(yàn)證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計(jì)劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計(jì)劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對(duì)象的 text 與 content:區(qū)別、場(chǎng)景與實(shí)踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請(qǐng)求開發(fā)時(shí)(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價(jià)值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫(kù)表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請(qǐng)求工具對(duì)比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請(qǐng)求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)的科學(xué)計(jì)數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)時(shí)的科學(xué)計(jì)數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價(jià)值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營(yíng)問題、提升執(zhí)行效率的核心手段,其價(jià)值 ...
2025-09-12用 SQL 驗(yàn)證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實(shí)戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計(jì)” 與 “用戶體驗(yàn) ...
2025-09-11塔吉特百貨孕婦營(yíng)銷案例:數(shù)據(jù)驅(qū)動(dòng)下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當(dāng)下,精準(zhǔn)營(yíng)銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價(jià)值 在數(shù)據(jù)驅(qū)動(dòng)決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實(shí)踐到業(yè)務(wù)價(jià)值挖掘 在數(shù)據(jù)分析場(chǎng)景中,聚類分析作為 “無(wú)監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計(jì)模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價(jià)值導(dǎo)向 統(tǒng)計(jì)模型作為數(shù)據(jù)分析的核心工具,并非簡(jiǎn)單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10