
可能是因?yàn)槊襟w人長期需要保持對新聞的敏感性,對社會(huì)熱點(diǎn)的持續(xù)關(guān)注,有時(shí)候也需要間中制造一些社會(huì)熱點(diǎn),或許這就是媒體人的職業(yè)病,也正式因?yàn)檫@種職業(yè)特性,使得傳統(tǒng)媒體人對于社會(huì)熱門概念有著異常的敏感性和關(guān)注力,直到“新媒體”、“互聯(lián)網(wǎng)思維”、“大數(shù)據(jù)”等概念被創(chuàng)造和傳播出來的時(shí)候,很多媒體從業(yè)者也許就是幕后實(shí)際的推手。
然而卻鮮有幾個(gè)媒體人能夠真正深切領(lǐng)會(huì)這些熱門詞匯的背后深意,更無法知曉自己與這些熱門詞匯的真正關(guān)系,以至于雖然有時(shí)候是自己親手創(chuàng)造了這些熱詞,卻迷失在對于這些熱詞之上,本期道哥就要針對媒體人熱衷談?wù)摰摹按髷?shù)據(jù)”這個(gè)關(guān)鍵詞來一個(gè)深入的剖析,看看傳統(tǒng)媒體人應(yīng)該有的數(shù)據(jù)思維是怎樣的?又應(yīng)該有怎樣的數(shù)據(jù)方法論去指導(dǎo)自己的實(shí)踐。
干貨即將登場……
大數(shù)據(jù)概念的報(bào)道現(xiàn)在遍及你能夠接觸到的所有媒體渠道平臺(tái)之上,一些數(shù)據(jù)服務(wù)提供商也嗅到商機(jī),不斷向媒體掌舵者推銷其的解決方案,一些新聞事件,諸如用機(jī)器人寫新聞等的新聞事件的報(bào)道又讓這種推銷接近達(dá)到效果,一系列的帶有政績工程色彩的設(shè)備和解決方案即將被加入購物車,一群大忽悠的“詭計(jì)”即將得逞。
其實(shí)在這里不是否定大數(shù)據(jù)服務(wù)提供商的產(chǎn)品和服務(wù)不好,只是想闡明一個(gè)基本的立場,那就是雖然大數(shù)據(jù)如此的有用,供應(yīng)商的整套解決方案如此的完美,但是卻未必適用于傳統(tǒng)媒體現(xiàn)有業(yè)務(wù)體系,或者說傳統(tǒng)媒體還不具備實(shí)施這些高大上解決方案的基礎(chǔ)條件;
與此同時(shí),本質(zhì)上,傳統(tǒng)媒體從業(yè)者包括掌舵者,本身對于標(biāo)準(zhǔn)意義上的大數(shù)據(jù)戰(zhàn)略的理解,以及對于自身數(shù)據(jù)內(nèi)容和實(shí)際的需求的理解和掌握程度十分有限,以至于無法做到知己,也無法做到知彼,整個(gè)一個(gè)需求不對稱的尷尬局面,如何破局?還是需要從知己知彼開始。
啰嗦終于結(jié)束了,這才是真正的前戲。
一、回望傳統(tǒng)媒體與大數(shù)據(jù)
1、大數(shù)據(jù)從何而來?概念和現(xiàn)實(shí)
大數(shù)據(jù)從何而來?無論從概念還是實(shí)踐角度,無疑的答案都自互聯(lián)網(wǎng),信息技術(shù)革命的三劍客——電腦(硬件工具)、網(wǎng)絡(luò)(渠道和載體)、信息(數(shù)據(jù)和主體)的發(fā)展成熟,使得信息技術(shù)革命開始對一切圍繞信息流,或者擴(kuò)展到一切以“流”和核心業(yè)務(wù)流程的產(chǎn)業(yè)領(lǐng)域展開影響和變革,傳媒(信息流)、商業(yè)(信息流、物流、資金流)、金融(信息流、資金流)、社交(情感流),而所有的“流”在信息技術(shù)通道上進(jìn)行交換流轉(zhuǎn)的過程就是數(shù)據(jù)產(chǎn)生的過程,在互聯(lián)網(wǎng)產(chǎn)業(yè)興起的前期,一些曾經(jīng)存量的非數(shù)字化的信息數(shù)字化后也成為重要的數(shù)據(jù),包括傳統(tǒng)媒體最早先為新聞門戶提供的數(shù)字報(bào)內(nèi)容,但是由于后來的UGC模式產(chǎn)生內(nèi)容數(shù)據(jù)越來越多,以至于數(shù)量和質(zhì)量都超過了傳統(tǒng)媒體提供的轉(zhuǎn)過過的數(shù)據(jù),也使得傳統(tǒng)媒體“內(nèi)容為王”的美夢徹底破滅。
2、傳統(tǒng)媒體的數(shù)據(jù)有多少?從何而來?
1)、數(shù)字化存量,傳統(tǒng)媒體本身就是非數(shù)字化的媒體,因此從一開始就與互聯(lián)網(wǎng)數(shù)據(jù)存在于兩個(gè)不同的體系之中,由于互聯(lián)網(wǎng)發(fā)展初期自動(dòng)生成的數(shù)據(jù)內(nèi)容的缺失,導(dǎo)致了對傳統(tǒng)媒體所擁有的存量內(nèi)容有了數(shù)字化的需求,因此傳統(tǒng)媒體的數(shù)據(jù)中,來自傳統(tǒng)非數(shù)字化內(nèi)容的數(shù)字化產(chǎn)生的數(shù)據(jù)就成為一個(gè)增量部分。
2)、互聯(lián)網(wǎng)增量,后來基于最初完成數(shù)字化的數(shù)字報(bào)網(wǎng)站之上,傳統(tǒng)媒體有了自己的所謂新聞網(wǎng)站,并正式開始生產(chǎn)完全基于互聯(lián)網(wǎng)數(shù)字平臺(tái)的增量數(shù)據(jù),包括一些滾動(dòng)新聞、新聞轉(zhuǎn)載、用戶交互數(shù)據(jù)、用戶行為數(shù)據(jù)等。
3)、物聯(lián)網(wǎng)數(shù)據(jù),隨著移動(dòng)互聯(lián)網(wǎng)技術(shù)發(fā)展,互聯(lián)網(wǎng)連接的范圍和層次深度越來越高,以至于數(shù)據(jù)的生產(chǎn)和產(chǎn)生已經(jīng)從專業(yè)化,專職化的局限中解放出來,脫離基于PC互聯(lián)網(wǎng)而來的,人、終端設(shè)備、聯(lián)網(wǎng)設(shè)備,都可以實(shí)時(shí)產(chǎn)生數(shù)據(jù),這些數(shù)據(jù)是構(gòu)成未來數(shù)據(jù)改變?nèi)祟惿畹闹匾M成部分,這些才是未來大數(shù)據(jù)的核心組成部分。
3、大數(shù)據(jù)的新時(shí)代特征
從以上分析可以得知,數(shù)字化存量數(shù)據(jù)這一過度數(shù)據(jù)類型成為傳統(tǒng)媒體數(shù)據(jù)的主體,而物聯(lián)網(wǎng)數(shù)據(jù)對于傳統(tǒng)媒體基本是空白,而互聯(lián)網(wǎng)增量數(shù)據(jù)由于其新媒體網(wǎng)站的孱弱也無法有力支撐,由此可以看到,用數(shù)字化、大數(shù)量、多維度、交互性等幾個(gè)基本特征去審視傳統(tǒng)媒體已經(jīng)有的大數(shù)據(jù)已經(jīng)基本能夠得出可以忽略傳統(tǒng)媒體現(xiàn)有數(shù)據(jù)的結(jié)論,在真正的大數(shù)據(jù)面前,傳統(tǒng)媒體的數(shù)據(jù)幾乎可以忽略不計(jì)。
與此同時(shí),隨著云技術(shù)的普及和推廣,以及移動(dòng)互聯(lián)網(wǎng)技術(shù)的普及和應(yīng)用,在以上四個(gè)基本的特征之上,當(dāng)下的大數(shù)據(jù)還必須具備一個(gè)基本的特性,那就是“實(shí)時(shí)在線”,也就是數(shù)據(jù)已經(jīng)不是靜態(tài)的數(shù)據(jù),而是可以通過隨時(shí)隨地的互聯(lián)網(wǎng)連接,隨時(shí)進(jìn)行數(shù)據(jù)交互和共享,以及實(shí)現(xiàn)數(shù)據(jù)的實(shí)時(shí)互通,實(shí)時(shí)在線讓數(shù)據(jù)價(jià)值挖掘亦呈現(xiàn)動(dòng)態(tài)特性,而傳統(tǒng)媒體的不同種類數(shù)據(jù)相互是獨(dú)立的,不但不具備實(shí)時(shí)在線的特征,互相之間也是無法實(shí)現(xiàn)互通的。
4、重新認(rèn)識(shí)大數(shù)據(jù)
再用國際上大量、高速、多樣、價(jià)值四個(gè)V屬性來審視和衡量傳統(tǒng)媒體的數(shù)據(jù),我們可以得出一些驚人的結(jié)論,或者每個(gè)傳統(tǒng)媒體從業(yè)者都可以自問下自己的數(shù)據(jù),是否有足夠符合這四個(gè)基本特征的數(shù)據(jù),或者說是大數(shù)據(jù)。
首先,歷史報(bào)紙,是大數(shù)據(jù)的重要基石,但是請問,又有多少個(gè)報(bào)社所有的歷史報(bào)紙已經(jīng)完成了數(shù)字化,并且分類完整的存放于數(shù)據(jù)庫中;
其次,所有的用戶數(shù)據(jù),是否分立于不同的數(shù)據(jù)庫和不同應(yīng)用之中,而且,所有的用戶數(shù)據(jù)在傳統(tǒng)媒體的數(shù)字平臺(tái)之上,是否有統(tǒng)一的ID,是否可以統(tǒng)一登陸認(rèn)證和數(shù)據(jù)自由調(diào)取和交互;
再次,網(wǎng)站數(shù)據(jù)是否擁有10萬以上的PV或者是一定的并發(fā)量基礎(chǔ),是否可以用肉眼都可以分析出流量的走勢或者可以用手指數(shù)出前十名的瀏覽量數(shù)據(jù);
再次,經(jīng)營系統(tǒng)擁有的客戶資料等商業(yè)數(shù)據(jù)是否有效,是否在數(shù)據(jù)庫中標(biāo)識(shí)用戶年齡為靜態(tài)的32,卻沒有出生年月或者數(shù)據(jù)寫入時(shí)間現(xiàn)象?是否有大量和無數(shù)的“你撥打的電話是空號(hào)”的客戶電話號(hào)碼;
最后,對于用戶行為的監(jiān)控,以及傳統(tǒng)報(bào)紙讀者閱讀行為收集的數(shù)據(jù),傳播效果監(jiān)控?cái)?shù)據(jù)是否有完整的精細(xì)化數(shù)據(jù),還是購買了數(shù)據(jù)公司可以同時(shí)賣給無數(shù)家報(bào)社使用的所謂的用戶行為以及傳播效果監(jiān)控?cái)?shù)據(jù)呢?
其實(shí)分析到如下,用基礎(chǔ)的大數(shù)據(jù)標(biāo)準(zhǔn)特征去分析傳統(tǒng)媒體自己擁有的數(shù)據(jù)內(nèi)容,基本上有兩個(gè)結(jié)論方向,傳統(tǒng)媒體是否有數(shù)據(jù),或者算得上有數(shù)據(jù),如果有,那么這些數(shù)據(jù)是否有價(jià)值,到底是垃圾數(shù)據(jù)還是金子般的數(shù)據(jù)?
5、必須面對的基本事實(shí)
用不上的數(shù)據(jù),有多少都是沒有用的,只會(huì)浪費(fèi)我們的存儲(chǔ)空間。數(shù)據(jù)再大,沒有價(jià)值也是零。大數(shù)據(jù)是你可以關(guān)注的概念,卻不是你能夠玩得起的東西。一切讓你對大數(shù)據(jù)進(jìn)行大規(guī)模投入的人都近乎是騙子。大數(shù)據(jù)是石油,但是你坐的是牛車,拉車的牛只喝水吃草不和石油。這就是傳統(tǒng)媒體遭遇的大數(shù)據(jù)尷尬。
二、傳統(tǒng)媒體的大數(shù)據(jù)方法論
正確理解并面對這些基本的事實(shí),那就是大數(shù)據(jù)概念再花俏,大數(shù)據(jù)戰(zhàn)略再實(shí)用都不是傳統(tǒng)媒體的菜,起碼在當(dāng)下不是,因?yàn)閭鹘y(tǒng)媒體還不具備進(jìn)行大數(shù)據(jù)戰(zhàn)略和實(shí)踐的基本或者是基礎(chǔ)條件。
靠譜的大數(shù)據(jù)策略或許應(yīng)該是這樣的,那就是直面現(xiàn)實(shí),通過借數(shù)據(jù)挖數(shù)據(jù)滿足數(shù)據(jù)的需求,放棄大數(shù)據(jù)轉(zhuǎn)投小數(shù)據(jù)。
而在實(shí)施數(shù)據(jù)策略的時(shí)候要堅(jiān)持“思維、價(jià)值、多維、交互、進(jìn)化”這十字關(guān)鍵詞,堅(jiān)持三大原則和步驟,心存基本的數(shù)據(jù)價(jià)值觀,那就是“別人大數(shù)據(jù),我要小數(shù)據(jù);別人搶數(shù)據(jù),我來洗數(shù)據(jù);別人挖數(shù)據(jù),我來整數(shù)據(jù)”。
而在方法上,首先,要堅(jiān)持用數(shù)據(jù),用小數(shù)據(jù)的思維,開始對數(shù)據(jù)進(jìn)行洗白,對存量數(shù)據(jù)中有價(jià)值的數(shù)據(jù)進(jìn)行清理,完成基于全新數(shù)據(jù)理念基礎(chǔ)上的數(shù)據(jù)重新梳理和洗白,并將這些數(shù)據(jù)轉(zhuǎn)化到一個(gè)基于數(shù)字業(yè)務(wù)基礎(chǔ)的新平臺(tái)之上,完成基于互聯(lián)網(wǎng)的數(shù)據(jù)基礎(chǔ)平臺(tái)的搭建,從而開始全新的數(shù)據(jù)策略。
其次,堅(jiān)持最小單元的方法,通過精益的方法,對數(shù)據(jù)進(jìn)行挖掘和洗白,以階段性成果為追求目標(biāo),通過局部小范圍的試水進(jìn)行數(shù)據(jù)洗白和驗(yàn)證,完成短平快的數(shù)據(jù)挖掘過程。
最后,建立數(shù)據(jù)對內(nèi)和對外交互共享的機(jī)制,通過開放平臺(tái)進(jìn)行共享合作,借船出海,以解決自身數(shù)據(jù)體量以及維度單一的致命傷。
如此,通過洗白、平臺(tái)、交互、挖掘幾個(gè)步驟對數(shù)據(jù)思維進(jìn)行升級(jí),對存量數(shù)據(jù)進(jìn)行洗白,對數(shù)據(jù)平臺(tái)進(jìn)行搭建,對最小單元數(shù)據(jù)進(jìn)行交互挖掘,可以實(shí)現(xiàn)數(shù)據(jù)戰(zhàn)略的重新起步,其中洗白是這一個(gè)過程的起點(diǎn),而一個(gè)新的數(shù)字平臺(tái)是重要支撐,而對內(nèi)對外的交互是重要的保證,最后價(jià)值的挖掘是整個(gè)過程的核心。
三、借勢開放挖掘你的數(shù)據(jù)價(jià)值
當(dāng)下,擁有實(shí)施大數(shù)據(jù)戰(zhàn)略的平臺(tái)和互聯(lián)網(wǎng)巨頭,通過收購合作等的方式,將更多的涉及用戶經(jīng)濟(jì)生活中的所有行為數(shù)據(jù)等都完成了收集,并且不斷完成數(shù)據(jù)的更新和互動(dòng),已經(jīng)能夠建立起一個(gè)基于用戶的多維度的數(shù)據(jù)用戶虛擬畫像能力,而這些能力會(huì)隨著數(shù)據(jù)量和維度的不斷擴(kuò)展而精確,而其一定是愿意通過開放平臺(tái)吸收更多的數(shù)據(jù)提供者加入到大數(shù)據(jù)的建設(shè)中來,而此時(shí)傳統(tǒng)媒體的基礎(chǔ)垂直行業(yè)數(shù)據(jù)就是這個(gè)大平臺(tái)的數(shù)據(jù)重要組成部分。
與此同時(shí),大平臺(tái)和互聯(lián)網(wǎng)巨頭,要實(shí)現(xiàn)大數(shù)據(jù)的真正價(jià)值,必須結(jié)合行業(yè)和區(qū)域的垂直落地伙伴的支撐,才能夠最大限度的挖掘這些大數(shù)據(jù)的商業(yè)和社會(huì)價(jià)值,因此未來一定是開放的方式將數(shù)據(jù)進(jìn)行共享和交互,并為傳統(tǒng)媒體提供了基于自身優(yōu)勢發(fā)揮大數(shù)據(jù)商業(yè)價(jià)值的機(jī)會(huì)。
開放是互聯(lián)網(wǎng)的根本的核心精神,在大數(shù)據(jù)策略執(zhí)行的過程中,不具備自身獨(dú)立大數(shù)據(jù)戰(zhàn)略部署的傳統(tǒng)媒體,唯有通過數(shù)據(jù)的自我洗白和理順,堅(jiān)持小數(shù)據(jù)策略,建立起基本的數(shù)據(jù)平臺(tái)和體量數(shù)據(jù)庫,通過與外部平臺(tái)進(jìn)行數(shù)據(jù)交互共享的方式,實(shí)現(xiàn)資源的互補(bǔ)利用,進(jìn)而以數(shù)據(jù)價(jià)值的挖掘,以及區(qū)域和行業(yè)垂直領(lǐng)域的大數(shù)據(jù)價(jià)值挖掘?yàn)楹诵倪M(jìn)行商業(yè)價(jià)值開發(fā),或許才是當(dāng)下能想到的幾乎是唯一的解決方案。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
訓(xùn)練與驗(yàn)證損失驟升:機(jī)器學(xué)習(xí)訓(xùn)練中的異常診斷與解決方案 在機(jī)器學(xué)習(xí)模型訓(xùn)練過程中,“損失曲線” 是反映模型學(xué)習(xí)狀態(tài)的核心指 ...
2025-09-19解析 DataHub 與 Kafka:數(shù)據(jù)生態(tài)中兩類核心工具的差異與協(xié)同 在數(shù)字化轉(zhuǎn)型加速的今天,企業(yè)對數(shù)據(jù)的需求已從 “存儲(chǔ)” 轉(zhuǎn)向 “ ...
2025-09-19CDA 數(shù)據(jù)分析師:讓統(tǒng)計(jì)基本概念成為業(yè)務(wù)決策的底層邏輯 統(tǒng)計(jì)基本概念是商業(yè)數(shù)據(jù)分析的 “基礎(chǔ)語言”—— 從描述數(shù)據(jù)分布的 “均 ...
2025-09-19CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-19SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實(shí)戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動(dòng)態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價(jià)值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實(shí)戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時(shí),“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗(yàn)與 t 檢驗(yàn):差異、適用場景與實(shí)踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計(jì)學(xué)領(lǐng)域,假設(shè)檢驗(yàn)是驗(yàn)證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計(jì)劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計(jì)劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實(shí)踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請求開發(fā)時(shí)(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價(jià)值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點(diǎn)數(shù)據(jù)的科學(xué)計(jì)數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點(diǎn)數(shù)據(jù)時(shí)的科學(xué)計(jì)數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價(jià)值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營問題、提升執(zhí)行效率的核心手段,其價(jià)值 ...
2025-09-12用 SQL 驗(yàn)證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實(shí)戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計(jì)” 與 “用戶體驗(yàn) ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動(dòng)下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當(dāng)下,精準(zhǔn)營銷成為企業(yè)突圍的核心方 ...
2025-09-11