
大數(shù)據(jù)改變傳統(tǒng)內(nèi)容生產(chǎn), 數(shù)據(jù)新聞就是未來
提到“大數(shù)據(jù)”,現(xiàn)在對于很多人來說并不陌生。最近幾年,這個詞在不同行業(yè)、不同領(lǐng)域被頻繁提及,并對人們的生活產(chǎn)生了影響。這種影響在傳媒業(yè)同樣深刻。
有人說大數(shù)據(jù)是第四生產(chǎn)要素,也有人預(yù)言大數(shù)據(jù)將來的價值會超過石油,成為未來新的“能源”。那么,大數(shù)據(jù)究竟是什么,他給傳媒業(yè)帶來了哪些深刻的變化,大數(shù)據(jù)時代的新聞報道又該何去何從?
你眼中的“大數(shù)據(jù)”是什么?
“就像一團(tuán)混沌的石頭和土,數(shù)據(jù)挖掘就是從這團(tuán)土和石頭中提煉出黃金、鐵甚至是鉆石。”人民日報媒體技術(shù)公司總經(jīng)理葉蓁蓁用了一個形象的比喻來描述他眼中大數(shù)據(jù)的概念。
在人民日報媒體技術(shù)公司的數(shù)據(jù)新聞實驗室,大家內(nèi)部討論的時候,葉蓁蓁經(jīng)常會打斷同事說:“你這不是大數(shù)據(jù),不要亂用,我們要嚴(yán)謹(jǐn)?!敝詴霈F(xiàn)這種情況,是因為在葉蓁蓁看來,大數(shù)據(jù)熱潮中很多人并沒有把概念搞清楚,類似于Excel表格類型的數(shù)據(jù)或者是統(tǒng)計數(shù)據(jù)等那些基于小數(shù)據(jù)做的產(chǎn)品經(jīng)常被冠以大數(shù)據(jù)的名義。葉蓁蓁認(rèn)為,能夠從中提煉出黃金或者鉆石的那團(tuán)初始的混沌的東西才是大數(shù)據(jù)。
作為九次方大數(shù)據(jù)創(chuàng)始人,同時身兼貴陽大數(shù)據(jù)交易所執(zhí)行總裁的王叁壽切身感受到大家對于大數(shù)據(jù)理解的變遷:從2010年到2012年,很多人認(rèn)為大數(shù)據(jù)就是服務(wù)器的存儲;2012年到2013年,人們認(rèn)為大數(shù)據(jù)存在于Excel表格里;2014年大家對大數(shù)據(jù)的理解上升為統(tǒng)計數(shù)據(jù)……直到今天,大數(shù)據(jù)被視為“黃金”“石油”。“我認(rèn)為大數(shù)據(jù)既不是石油,也不是黃金?!痹谕跞劭磥恚秃忘S金是一種不可再生的資源,而數(shù)據(jù)恰好是一種生生不息又無限次循環(huán)的資源。
對于大數(shù)據(jù)的討論,即使在學(xué)界,也并沒有形成統(tǒng)一的共識。中國社科院網(wǎng)絡(luò)新媒體研究室主任孟威說,從微觀上講,大數(shù)據(jù)是以云計算為基礎(chǔ),是信息在物理空間的運動,投射到數(shù)字空間的表現(xiàn)。從中觀上說,大數(shù)據(jù)是一種新的生產(chǎn)要素,它是一種新的生產(chǎn)力和生產(chǎn)關(guān)系的基礎(chǔ)性的力量,對于新聞傳播來說也是這樣。而從宏觀上,實際上是認(rèn)識論的一種提升。依據(jù)大數(shù)據(jù),能夠重新定位我們看待和認(rèn)識世界的一種視角。
給傳媒業(yè)帶來了哪些改變?
由大數(shù)據(jù)帶來的變革將轉(zhuǎn)型中的傳媒業(yè)推向了風(fēng)口,無論是傳統(tǒng)主流媒體還是新興媒體抑或是門戶網(wǎng)站,都在不斷嘗試?yán)么髷?shù)據(jù)對新聞報道做全新的詮釋。
“大數(shù)據(jù)應(yīng)用在新聞領(lǐng)域,一個最大的變化就是產(chǎn)生數(shù)據(jù)新聞的數(shù)據(jù)樣式?!痹诿贤磥恚侣劦纳谟谡鎸嵤氰F的法則。大數(shù)據(jù)作為一種技術(shù)的手段、科學(xué)的方法,為受眾更加接近于真實、客觀的新聞提供了很好的手段。
而在新聞生產(chǎn)領(lǐng)域中,也就是常說的新聞生產(chǎn)流程上,孟威認(rèn)為,傳統(tǒng)的新聞內(nèi)容生產(chǎn)是以人工生產(chǎn)為主導(dǎo)的,數(shù)據(jù)新聞并非是之前精確新聞或者計算機(jī)輔助新聞報道的一種延伸,而是在數(shù)據(jù)量的積累、挖掘的過程中,能夠生成一種新的新聞樣式,實現(xiàn)一種質(zhì)的變化?!耙簿褪钦f,數(shù)據(jù)新聞給我們帶來的內(nèi)容生產(chǎn)上的變化遠(yuǎn)遠(yuǎn)大于只用技術(shù)手段來幫助我們生產(chǎn)新聞這樣一種概念?!泵贤f道。
最近人民日報媒體技術(shù)公司和去哪兒網(wǎng)合作做中國人親子旅游的熱度調(diào)查,結(jié)果發(fā)現(xiàn)泰國從原來比較靠后的位置上升到第一位。在探究這種現(xiàn)象出現(xiàn)的原因時,如果按照傳統(tǒng)新聞生產(chǎn)模式,找游客采訪、發(fā)放問卷等形式抽樣都會比較局限。但他們利用旅游平臺后臺抓取的數(shù)據(jù)分析,卻發(fā)現(xiàn)了一個關(guān)鍵詞——“微笑”。
通過大數(shù)據(jù)可以發(fā)現(xiàn),很多人喜歡去泰國旅游不是因為美麗的沙灘和風(fēng)景,而是泰國人和善、真誠的微笑。葉蓁蓁通過這個事例想說明:通常說的數(shù)據(jù)新聞并非一定要有數(shù)字。此外,基于數(shù)字新聞的產(chǎn)品常常會有互動化的消費模式,有參與而且具備個性化。比如,今年全國兩會期間的數(shù)據(jù)新聞“誰在代表我”——通過對全國人大代表的基礎(chǔ)數(shù)據(jù)抓取成庫,網(wǎng)友輸入自己的信息就可以找到與其最匹配的人大代表。
“這就是數(shù)據(jù)新聞對傳統(tǒng)新聞的改變和提升,其中重要的一點就是其對于數(shù)據(jù)的應(yīng)用、對于生產(chǎn)的新聞、對個人關(guān)聯(lián)性的影響?!泵贤f,數(shù)據(jù)新聞的來源有多種成分,但如何利用各種各樣的數(shù)據(jù)來講故事,并且講得更深入更好,才是數(shù)據(jù)新聞生產(chǎn)后要取得傳播效果最重要的東西。
王叁壽說,如果沒有大數(shù)據(jù)的支持,很多新聞都難以呈現(xiàn)。比如,天津發(fā)生氰化鈉爆炸的新聞,在數(shù)據(jù)庫中輸入“氰化鈉”后,一秒鐘就會告訴你全中國氰化鈉產(chǎn)業(yè)的分布狀況,這些公司分布在哪個省、哪個市、哪個街道,每一家氰化鈉公司到底什么時候注冊的,每一家氰化鈉公司整個規(guī)模到底有多大……而這,在傳統(tǒng)的新聞報道中簡直難以想象。用王叁壽的話說,大數(shù)據(jù)與新聞報道的關(guān)系不是說誰改變了誰,而是通過大數(shù)據(jù)讓新聞報道的方法產(chǎn)生了變化。
該如何處理 與大數(shù)據(jù)的關(guān)系?
相較于人工,機(jī)器對于大數(shù)據(jù)的處理能力自然遠(yuǎn)遠(yuǎn)居上。機(jī)器新聞將來會不會代替?zhèn)鹘y(tǒng)新聞報道,大數(shù)據(jù)時代,媒體人將面對怎樣的挑戰(zhàn),又該如何應(yīng)對呢?
在孟威看來,數(shù)據(jù)新聞環(huán)境下,對媒體人的挑戰(zhàn)主要有兩個方面:一是人工智能是否能夠代替人類智力的潛能,不是一個絕對的答案;二是人的文化素養(yǎng)和專業(yè)化素養(yǎng)在今后將成為與人工智能競爭的核心要素。
盡管在很多人的觀念中,人工智能完全代替?zhèn)鹘y(tǒng)報道很難實現(xiàn)。但同樣也意味著,不是沒有可能。王叁壽用一個例子加以說明:炒股的人都知道,在華爾街做高頻交易的人最關(guān)鍵的就是要在很短的時間內(nèi)快速獲取50字以內(nèi)的資訊,虧與賺之間很可能就是0.1和0.01秒的區(qū)別,這樣的工作人工絕對難以完成。而現(xiàn)在美國華爾街,一條5000字的信息,人工智能機(jī)器一秒鐘就可以學(xué)習(xí)完畢并提取50字的關(guān)鍵信息。
對于人工智能會否代替記者寫稿,葉蓁蓁同樣抱以謹(jǐn)慎的態(tài)度。他認(rèn)為,當(dāng)我們足夠了解人工智能背后的機(jī)理時,目前看似不可能的事情其實未必不能實現(xiàn)?!盀槭裁床豢梢詫憚?chuàng)造性的文字,不能寫評論,不可以有人類共同認(rèn)可的倫理在它的表達(dá)中體現(xiàn)?”葉蓁蓁表示,在嘗試了多種人工智能產(chǎn)品之后,他愈加相信有些東西會遠(yuǎn)遠(yuǎn)超出原有的想象。“只要人類社會在發(fā)聲、只要在虛擬世界里傳播,機(jī)器都可以學(xué)會,只是還沒有往這個方向去開發(fā)?!比~蓁蓁說道。
其實,大家都理解“數(shù)據(jù)新聞就是未來”這句充滿雄心壯志的話背后所蘊(yùn)含的意義。但是,涉獵數(shù)據(jù)新聞也并非一件易事。孟威認(rèn)為,在做數(shù)據(jù)新聞的過程中,除了數(shù)據(jù)源、數(shù)據(jù)質(zhì)量上的困境,資金和技術(shù)也將是困擾媒體的重要方面。此外,媒體人本身的技術(shù)素養(yǎng)也需提升。在數(shù)據(jù)生產(chǎn)過程匯總中,大多媒體人對于簡單的數(shù)據(jù)獲取,數(shù)據(jù)的清洗,數(shù)據(jù)的分析、挖掘以至于最后生成的技術(shù),完全是一無所知,或者說所知甚少,這也是造成我們今天數(shù)據(jù)技術(shù)恐懼,以至于數(shù)據(jù)障礙的原因。
對此,孟威認(rèn)為,媒體人應(yīng)當(dāng)重視數(shù)據(jù)素養(yǎng)的培養(yǎng)。當(dāng)然,在重視數(shù)據(jù)素養(yǎng)的同時,人文素養(yǎng)同樣不能放松。因為,在網(wǎng)絡(luò)媒體上,有些“標(biāo)題黨”或者大尺度的東西通過技術(shù)設(shè)置無法回避的時候,作為專業(yè)人士,需要科學(xué)的人文素質(zhì)和專業(yè)精神,這些同樣需要加強(qiáng)。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強(qiáng)大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預(yù)測分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢預(yù)判? ? 在數(shù)據(jù)驅(qū)動決策的時代,預(yù)測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點,而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報考到取證的全攻略? 在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗:捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗:數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對策略? 長短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨特的門控機(jī)制,在 ...
2025-07-07統(tǒng)計學(xué)方法在市場調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場調(diào)研是企業(yè)洞察市場動態(tài)、了解消費者需求的重要途徑,而統(tǒng)計學(xué)方法則是市場調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03