
大數(shù)據(jù)的現(xiàn)象分析價值
大數(shù)據(jù)是指無法再可承受的時間范圍內(nèi)用常規(guī)軟件進行捕捉、管理和處理的數(shù)據(jù)集合,是需要新的處理模式才能具有更強的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力來適應(yīng)海量、高增長率和多樣化的信息資產(chǎn)。在本次高峰論壇上,有一部分專家學(xué)者就針對大數(shù)據(jù)的現(xiàn)象分析價值進行了闡釋,掌握大數(shù)據(jù)的規(guī)律,有效抓取和準確分析才是挖開大數(shù)據(jù)礦藏的關(guān)鍵。
大數(shù)據(jù)更準確
觀數(shù)科技創(chuàng)始人、前阿里巴巴副總裁涂子沛認為所有的信息可以分成兩個部分,第一是事實,第二是觀點。然而信息一經(jīng)產(chǎn)生,通過傳播就會加上立場、感情,所以事實和觀點往往是摻雜的。
以不同方式報道,效果不一樣。最近新聞領(lǐng)域發(fā)生了很多事件,側(cè)面反映社會進入了新聞消費的時代。比如雷陽案,事件的標題直接影響了人們?nèi)绾闻袛嗍聦崱=裉斓墓娦畔⑵脚_實際上不僅僅是社交平臺,也已經(jīng)具備媒體屬性。在徐子沛看來,人們常??吹降臉祟}黨,是一種雍眾的勝利。
以不同方式提問,效果不一樣。今年是切爾諾貝利三十周年,若問“核事故幾十萬人死亡,你支不支持核電站”或問“核電站可以節(jié)省排放6億噸,減少環(huán)境的污染,你是否支持”,得到的結(jié)果是不一樣的,這就是語言的迷惑性。語言是不精確的,帶有片面性和感情色彩,導(dǎo)致傳播過程中事實的失真。
除了語言,圖片也永遠代表的是局部。很多人在見到網(wǎng)絡(luò)真人后,會產(chǎn)生落差感,因為他們在傳播中的形象已經(jīng)在受眾的思想和精神中建立起來,所有的信息是帶有立場和偏見的。所以最精確的就是數(shù)據(jù),數(shù)據(jù)是對事實最客觀、最銳利的描述。
大數(shù)據(jù)更具說服力
兩年美國普林獎的一位獲得者,他在發(fā)現(xiàn)警察開快車肇事后,大膽懷疑警察開快車是常態(tài)。在嘗試諸多方法不利后,他申請數(shù)據(jù)開放,獲得100萬條警車給收費站的記錄,根據(jù)兩個收費站之間的距離除以時間就是車輛在路上平均行駛速度,記者最終發(fā)現(xiàn)一年中有5100輛警車超速,平均140公里/小時,而且很多是下班時間。報道引起了當?shù)氐年P(guān)注,而除了利用大數(shù)據(jù),似乎沒有其他有效的辦法能證明警察開快車的普遍性。
用數(shù)據(jù)做新聞其實并不是從現(xiàn)在才開始的。南丁格爾在1850年代用數(shù)據(jù)分析發(fā)現(xiàn)了戰(zhàn)爭死亡的人數(shù)遠遠少于醫(yī)務(wù)條件惡劣的非戰(zhàn)爭死亡人數(shù),最終催生了野戰(zhàn)醫(yī)院的建立。
數(shù)據(jù)很重要。因為數(shù)據(jù)是對客觀世界的測量和記錄。而大數(shù)據(jù)和小數(shù)據(jù)又是有區(qū)別的,傳統(tǒng)小數(shù)據(jù)是測量,而大數(shù)據(jù)不僅僅包括傳統(tǒng)的小數(shù)據(jù),還包括現(xiàn)代的大記錄。大數(shù)據(jù)的魅力在于:事實只有一個,但大數(shù)據(jù)可以從無數(shù)個維度,無數(shù)個方向去描述一個事實,讓它無限的逼近真相。傳播的本質(zhì)就是收集信息、處理信息、生產(chǎn)信息、分發(fā)信息,而信息就是數(shù)據(jù),就是基于事實,所以大數(shù)據(jù)的出現(xiàn)一定有利于傳媒的發(fā)展,更好去反映現(xiàn)實。
大數(shù)據(jù)是未來
未來基于傳媒的變化,徐子沛認為傳媒將出現(xiàn)三種階層,即產(chǎn)生數(shù)據(jù)的人、收集數(shù)據(jù)的人和分析數(shù)據(jù)的人。而記者也相應(yīng)地會分成三類,即收集數(shù)據(jù)的記者、呈現(xiàn)數(shù)據(jù)的記者、分析數(shù)據(jù)的記者。會不會用數(shù)據(jù)、會不會分析數(shù)據(jù),將會成為一個記者水平的分水嶺。
未來媒體是什么樣子?所有的公司都已成為傳媒公司,所有傳媒公司都將成為數(shù)據(jù)公司。而媒體的核心競爭力:一是數(shù)據(jù),即擁有大數(shù)據(jù)的量;二是算法,即處理數(shù)據(jù)的能力。未來好的傳媒公司首先是擁有大數(shù)據(jù)的公司,然后是能處理大數(shù)據(jù)的公司。
未來媒體怎么轉(zhuǎn)型?媒體公司不僅僅是傳播事實和觀點的公司,更應(yīng)該要提供服務(wù),提供知識和情報的服務(wù)。事實上,整個互聯(lián)網(wǎng)是一個開源的情報系統(tǒng),傳媒公司發(fā)展到一定階段后,實際上可以提供情報服務(wù)。
怎么提供情報服務(wù)?具體來看,所謂的情報機構(gòu)都在做一個事情——監(jiān)控所有的新聞報道。從對美國的新聞報道監(jiān)控來看,一個重大項目開始實施時會有新聞報道,實施的過程中新聞也有報道,但是突然有一天沒有報道了,只有兩種可能,第一是該項目行不通停止實施了,第二是它已經(jīng)成功劃了句號,并具有戰(zhàn)略意義所以不報了,這就是情報。
所以,我們現(xiàn)在應(yīng)該做的是,喚醒媒體領(lǐng)域沉睡的數(shù)據(jù)庫。
新榜創(chuàng)始人、CEO徐達內(nèi)則帶來了一系列真實的大數(shù)據(jù)以及數(shù)據(jù)背后的現(xiàn)象。
新榜從2014年8月份起開始做微信號評估。近期完成了對1000萬個公眾號的分析,占據(jù)了中國內(nèi)容端分享的40%流量。微信公布的數(shù)據(jù)顯示,公眾號日PV是30億,今日頭條包括文字和視頻播放量是10億左右,微博計算方法不一樣,以微信來算是30億日PV,每天保持20萬的同步,大概是8億PV,1%的同步卻占據(jù)了1/3的流量。從這些數(shù)據(jù)可以窺見,自媒體領(lǐng)域不遵循二八定律,而是一九定律。
集體意識使得大眾生產(chǎn)內(nèi)容的成本降低了,現(xiàn)如今流量在移動端的入口主要分為四類——媒體機構(gòu)、自媒體、政務(wù)和企業(yè)。據(jù)統(tǒng)計,2015年微信500強公眾號分布中90%是來自自媒體,民間的傳媒公司甚至個人是主體;10%是來自傳統(tǒng)傳播機構(gòu),最有勢頭的是人民日報。
在不斷進行數(shù)據(jù)匯總和大數(shù)據(jù)分析的過程中,新榜也發(fā)現(xiàn),2016年自媒體從圖文向視頻直播領(lǐng)域的轉(zhuǎn)變,已然形成風口。在另外一個層面上,網(wǎng)絡(luò)視頻直播利用了真實感對抗專業(yè)度,在未來一段時間一定會實現(xiàn)對電視臺的顛覆,至少說是對抗。
大數(shù)據(jù)驗證地域特性
除了平臺類型,平臺的地域性也能通過大數(shù)據(jù)精準分析出來。目前來看,最活躍的自媒體分布在長三角和珠三角地區(qū)。而結(jié)論的來源則是經(jīng)過數(shù)據(jù)驗證的大的公眾號坐標以及高收入的自媒體坐標。
徐達內(nèi)說,身邊的這些自媒體人,很多都是從草根中走出來的,天天網(wǎng)、人人網(wǎng)的創(chuàng)始人都是草根中運營良好、獲得較高收入的。一年多來,長三角和珠三角內(nèi)容創(chuàng)業(yè)占比很大,而較為活躍的創(chuàng)業(yè)者基本上是在南京、杭州、上海、深圳等地區(qū)。比如微信公號中的秦朔朋友圈和吳曉波,就在長三角和珠三角,還有浙江地區(qū)的電商創(chuàng)業(yè)、珠三角地區(qū)的汽車品牌等。
大數(shù)據(jù)厘清廣告價值
廣告收入仍然是中國自媒體的最主要收入構(gòu)成,媒體的廣告模式包括自媒體端基本的盈利邏輯并沒有變化。
如今廣告主投向自媒體的預(yù)算比例正在由個位數(shù)向20%-30%提升,大家越來越重視在自媒體上的投產(chǎn)。單個頂尖自媒體全年廣告收入峰值是3000萬人民幣左右。假設(shè)300天有廣告,一條單12塊錢,頂尖的賬號圖文類最高是40萬人民幣,視頻是100萬左右。除了廣告收入,內(nèi)容電商、線下活動、IP授權(quán)構(gòu)成了自媒體的新錢包。
互聯(lián)網(wǎng)的核心是流量,現(xiàn)在流量越來越貴,通過內(nèi)容來做流量這個邏輯是走得通的,淘寶頭條就采取了這種戰(zhàn)術(shù)。新榜從針對VC做的調(diào)研和訪談中發(fā)現(xiàn),對VC來說只依賴廣告模式的自媒體投資價值有限。
如果按CPM的傳統(tǒng)廣告計價模式,自媒體廣告能達到兩三百萬,且主要來自汽車、金融和時尚行業(yè)。因此很多自媒體人會專門參加各種展會,邀請企業(yè)決策者觀看自媒體運營效果,從而能形成一種新的商業(yè)模式。
中國商業(yè)文明研究中心、秦朔朋友圈發(fā)起人秦朔則更多從傳播規(guī)律的角度,分析了對大數(shù)據(jù)的理解。三十年以前秦朔也跟很多傳統(tǒng)媒體人一樣,很少考慮傳播的問題,因為傳播的載體、傳播的介質(zhì)是永恒的,主要形式就是報紙。
延伸與連接能力
說到傳播的問題,眾所周知媒介即延伸,一切媒介的根本是人的能力的延伸,而延伸在今天互聯(lián)網(wǎng)環(huán)境里又變成了連接。
對于今天的傳統(tǒng)媒體來說,其災(zāi)難就在于,缺乏連接的能力,可能只在自發(fā)訂閱少數(shù)的定單里能看到殘缺不全的畫像,而絕大多數(shù)的畫像都在郵局。
那么,需要如何理解媒介呢?今天,站在新聞意義上看待,衰敗是必然的,因為從媒介即內(nèi)容和媒介即延伸的角度來思考傳統(tǒng)媒體都過時了。建立在傳統(tǒng)價值鏈上,由國家發(fā)放牌照進行生產(chǎn)的特殊傳輸方式已經(jīng)一去不復(fù)返。
現(xiàn)在用戶的力量極大提升,所有人用最便捷的方法爭取一天24小時中最大的內(nèi)容消費時間時,需求就極大上升了。最后誰跟用戶最近,廣告就是往那個方向偏離。所以可以理解今天機器化、程序化的購買變成了流行,而不是以前廣告策劃和廣告購買的方式。
媒體形態(tài)根本改變
從PC到移動、存儲到大數(shù)據(jù)和云計算,再到LT和VR,新的傳播模式和技術(shù)在過去幾年里加速發(fā)展,以往媒體的形態(tài)在九個方面發(fā)生了根本性改變。
第一是從樣本變成添量。過去通過樣本收集用戶反映,而且從前的很多信息都無法完整保留下來。但是通過今天的微信訂閱號,盡管每天搜到的是淺度的信息,但是全樣板,會完整保留瀏覽、保存、點贊量,同時又是全流程,它會基于這樣沒有殘缺、沒有斷裂、沒有空白的數(shù)據(jù)礦產(chǎn)進行這個時代的傳播。
第二是是實時。第三是去中介。一切公司是媒體公司,一切人都可以成為媒體人。分析師可以在自己的公眾號上傳播分析,央行發(fā)布信息半個小時后,分析師已經(jīng)有很簡單的報道,而且寫的比媒體人再加工還要好。
第四是整個傳輸發(fā)生了巨大的改變。第五是社交化趨勢日益明顯。第六是整個內(nèi)容變現(xiàn)模式的顛覆,例如超級IP這樣的爆款。
第七是從內(nèi)容生產(chǎn)的免費時代到付費時代的到來,90后已經(jīng)習慣為內(nèi)容付費。第八是每個用戶都成為一組標簽所包含的方程式,這個方程式永遠在動態(tài)調(diào)整的過程中,所以用戶變成了實時動態(tài)調(diào)整的方程式。
最后一個方面就是速度在加快,時代不會允許傳統(tǒng)媒體這種慢吞吞的調(diào)整與轉(zhuǎn)型。
在大數(shù)據(jù)年代,經(jīng)驗式、片斷式的生產(chǎn)模式已經(jīng)過時了,與未來高度相關(guān)聯(lián)的是媒體革命,特別是移動互聯(lián)網(wǎng)領(lǐng)域?qū)⒂懈喔锩鼇碇敢藗兏淖儭?/span>
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
數(shù)據(jù)分析師的技能圖譜:從數(shù)據(jù)到價值的橋梁? 在數(shù)據(jù)驅(qū)動決策的時代,數(shù)據(jù)分析師如同 “數(shù)據(jù)翻譯官”,將冰冷的數(shù)字轉(zhuǎn)化為清晰的 ...
2025-07-17Pandas 寫入指定行數(shù)據(jù):數(shù)據(jù)精細化管理的核心技能? 在數(shù)據(jù)處理的日常工作中,我們常常需要面對這樣的場景:在龐大的數(shù)據(jù)集里精 ...
2025-07-17解碼 CDA:數(shù)據(jù)時代的通行證? 在數(shù)字化浪潮席卷全球的今天,當企業(yè)決策者盯著屏幕上跳動的數(shù)據(jù)曲線尋找增長密碼,當科研人員在 ...
2025-07-17CDA 精益業(yè)務(wù)數(shù)據(jù)分析:數(shù)據(jù)驅(qū)動業(yè)務(wù)增長的實戰(zhàn)方法論 在企業(yè)數(shù)字化轉(zhuǎn)型的浪潮中,“數(shù)據(jù)分析” 已從 “加分項” 成為 “必修課 ...
2025-07-16MySQL 中 ADD KEY 與 ADD INDEX 詳解:用法、差異與優(yōu)化實踐 在 MySQL 數(shù)據(jù)庫表結(jié)構(gòu)設(shè)計中,索引是提升查詢性能的核心手段。無論 ...
2025-07-16解析 MySQL Update 語句中 “query end” 狀態(tài):含義、成因與優(yōu)化指南? 在 MySQL 數(shù)據(jù)庫的日常運維與開發(fā)中,開發(fā)者和 DBA 常會 ...
2025-07-16如何考取數(shù)據(jù)分析師證書:以 CDA 為例? ? 在數(shù)字化浪潮席卷各行各業(yè)的當下,數(shù)據(jù)分析師已然成為企業(yè)挖掘數(shù)據(jù)價值、驅(qū)動決策的 ...
2025-07-15CDA 精益業(yè)務(wù)數(shù)據(jù)分析:驅(qū)動企業(yè)高效決策的核心引擎? 在數(shù)字經(jīng)濟時代,企業(yè)面臨著前所未有的數(shù)據(jù)洪流,如何從海量數(shù)據(jù)中提取有 ...
2025-07-15MySQL 無外鍵關(guān)聯(lián)表的 JOIN 實戰(zhàn):數(shù)據(jù)整合的靈活之道? 在 MySQL 數(shù)據(jù)庫的日常操作中,我們經(jīng)常會遇到需要整合多張表數(shù)據(jù)的場景 ...
2025-07-15Python Pandas:數(shù)據(jù)科學(xué)的瑞士軍刀? ? 在數(shù)據(jù)驅(qū)動的時代,面對海量、復(fù)雜的數(shù)據(jù),如何高效地進行處理、分析和挖掘成為關(guān)鍵。 ...
2025-07-15用 SQL 生成逆向回滾 SQL:數(shù)據(jù)操作的 “后悔藥” 指南? 在數(shù)據(jù)庫操作中,誤刪數(shù)據(jù)、錯改字段或誤執(zhí)行批量更新等問題時有發(fā)生。 ...
2025-07-14t檢驗與Wilcoxon檢驗的選擇:何時用t.test,何時用wilcox.test? t 檢驗與 Wilcoxon 檢驗的選擇:何時用 t.test,何時用 wilcox. ...
2025-07-14AI 浪潮下的生存與進階: CDA數(shù)據(jù)分析師—開啟新時代職業(yè)生涯的鑰匙(深度研究報告、發(fā)展指導(dǎo)白皮書) 發(fā)布機構(gòu):CDA數(shù)據(jù)科 ...
2025-07-13LSTM 模型輸入長度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準備指南? ? 在數(shù)據(jù)驅(qū)動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認 ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預(yù)測分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢預(yù)判? ? 在數(shù)據(jù)驅(qū)動決策的時代,預(yù)測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點,而是將數(shù) ...
2025-07-10