
在大數(shù)據(jù)概念下,美國視頻網(wǎng)站Netflix豪賭1億美元制作的連續(xù)劇《紙牌屋》迅速走紅。這讓國內(nèi)視頻網(wǎng)站蠢蠢欲動。
數(shù)據(jù)的力量能否指導(dǎo)他們自制劇的拍攝?
愛奇藝數(shù)據(jù)研究院院長葛承志告訴記者,愛奇藝目前正在籌拍三部網(wǎng)絡(luò)劇,而選擇這三個熱門的網(wǎng)絡(luò)小說題材,統(tǒng)統(tǒng)是基于大數(shù)據(jù)分析。
在此基礎(chǔ)上,愛奇藝每天會收集網(wǎng)站上產(chǎn)生的用戶行為:包括用戶會在哪里暫停、回放、快進等,如果大量觀眾都在某一個節(jié)點做了快進或者回放的動作,愛奇藝就能判斷用戶喜歡或討厭的橋段,并以此指導(dǎo)自制劇的生產(chǎn)。
此外,愛奇藝還會搜集用戶在網(wǎng)站上的收視行為,根據(jù)這些行為將用戶進行分類和畫像,并據(jù)此進行針對性的廣告投放。
即便如此,葛承志坦言,網(wǎng)絡(luò)劇的成功與題材本身、劇本以及精良的制作分不開,不能過度夸大數(shù)據(jù)所產(chǎn)生的影響力。況且在實際操作中,國內(nèi)視頻網(wǎng)站的主要盈利模式還是廣告,用戶的付費習(xí)慣尚未養(yǎng)成,這就意味著很難完全讓用戶去決定影視劇的演員、導(dǎo)演、劇本。另一廂,大數(shù)據(jù)的挖掘、建模和分析門檻,依然很高。
大數(shù)據(jù)的兩個維度
《21世紀》:眼下,大數(shù)據(jù)是個非?;馃岬母拍睢燮嫠囋诖髷?shù)據(jù)方面目前有哪些研究與進展?
葛承志:愛奇藝對于大數(shù)據(jù)的研究主要是兩方面。
一是大數(shù)據(jù)的內(nèi)容如何為用戶服務(wù)。對用戶來講,我們的終極目標是讓用戶看到他想看的,而不必從一堆內(nèi)容挑選他想看的。我們通過對個人的收視習(xí)慣的分析,智能推薦他所感興趣的內(nèi)容。
此外,大數(shù)據(jù)也在為內(nèi)容生產(chǎn)提供一些幫助,傳統(tǒng)影視在制作的時候,更多關(guān)注的是大的題材本身和劇本本身的撰寫,包括導(dǎo)演、演員的使用。到了互聯(lián)網(wǎng)的時代,我們甚至可以用其中的一個情節(jié)或綜藝節(jié)目的一個橋段來進行分析,用戶對該情節(jié)的觀看量是高還是低,從而得出用戶的喜好,來指導(dǎo)更細的一些操作。
除了用戶的緯度,大數(shù)據(jù)的另一個緯度是如何服務(wù)廣告主,即幫助廣告客戶找到適合的受眾人群,或找到他的消費者及他的潛在消費者,甚至幫助客戶找到他競爭對手的消費者,并對消費者進行營銷。比如,通過和百度的合作,我們能夠獲知觀看視頻的用戶過去都在百度上搜索過哪些內(nèi)容,從而在次基礎(chǔ)上進行廣告推送。
《21世紀》:眾所周知,Netfilx推出的《紙牌屋》是大數(shù)據(jù)運用在視頻網(wǎng)站上的一個成功典型。那么在自制劇大熱的當下,愛奇藝是否也通過大數(shù)據(jù)分析來指導(dǎo)自制劇的題材?
葛承志:對于《紙牌屋》這部劇,Netflix之所以把它包裝成一個大數(shù)據(jù)成功的典范,核心目的是Netflix需要把自己和傳統(tǒng)的影視劇制作公司,如HBO等區(qū)別開來。
他需要宣傳出自己的特色,這個特色就是互聯(lián)網(wǎng)大數(shù)據(jù)的特色。
其實仔細分析一下,這部劇最引人入勝的地方應(yīng)該還是這個題材本身和劇本。某種程度上,《紙牌屋》的成功是題材和編劇的成功,與大數(shù)據(jù)、導(dǎo)演、演員等關(guān)系不是特別密切,因此,我們應(yīng)該客觀看待《紙牌屋》的成功和大數(shù)據(jù)在影視創(chuàng)作中所起的作用。
當然,大數(shù)據(jù)確實能幫助我們來分析什么樣的題材是用戶關(guān)注的,感興趣的。愛奇藝本身也用大數(shù)據(jù)來挖掘題材。我們現(xiàn)在已經(jīng)開機拍攝的三部網(wǎng)絡(luò)劇,實際上就是基于互聯(lián)網(wǎng)的數(shù)據(jù)分析。這三部作品來自國內(nèi)知名的網(wǎng)絡(luò)小說,不管線上的閱讀還是線下的銷量,這三部小說都是關(guān)注度非常高的。在這個基礎(chǔ)上,我們果斷地購買了版權(quán),將其轉(zhuǎn)化為電視劇搬上熒幕。此外,哪些演員具有比較好的口碑,演員和電視劇題材間關(guān)聯(lián)度,都需要我們利用大數(shù)據(jù)進行分析。
《21世紀》:在影視劇或綜藝節(jié)目的采購方面,愛奇藝是如何進行數(shù)據(jù)分析?
葛承志:在影視劇采購方面,我們背后有一套大數(shù)據(jù)的分析流程。通過對以往類似的題材、類似的編劇、類似的導(dǎo)演、類似的演員所演出的劇,在愛奇藝上的播放量,我們來推測即將采購的電視劇在未來可能產(chǎn)生播放成績,從而評估這個劇是否值得購買。
很多影視劇在發(fā)售的時候,其實還沒有拍完,甚至一些比較熱門的劇還沒有開拍,只有一個劇本的時候就開始賣。作為視頻網(wǎng)站,我們肯定要有一個相對準確的分析和預(yù)測,從這個角度講,我們的歷史數(shù)據(jù)能幫很大的忙。
用戶畫像的價值
《21世紀》:在廣告推送方面,你們是怎么樣通過數(shù)據(jù)分析來進行人群的定位和畫像的?
葛承志:在廣告推送上,我們近兩年開發(fā)了不少產(chǎn)品。舉一個簡單例子,如果你最近一個月在百度上搜過寶馬汽車,當你來到愛奇藝看任何一個內(nèi)容的時候,我都知道你曾經(jīng)搜索過寶馬汽車,我就可以給你投放寶馬的廣告,當然也可以投放奔馳的廣告。這就是一搜百映這個產(chǎn)品的核心價值。
我們今年還開發(fā)出了一款叫做追星族的產(chǎn)品,眾所周知,很多明星都有自己的粉絲群,比如說鄧超的粉絲會看鄧超相關(guān)的廣告,也會看鄧超的電視劇和電影,甚至可能還會看和鄧超相關(guān)的綜藝節(jié)目。當我們捕捉到用戶有這樣多重收看的行為,我們就會把他定義為鄧超的粉絲。緊接著,我們就會向他投放由鄧超代言的廣告。
總體來說,用戶的信息分為兩大類,一是用戶的自然數(shù)據(jù),比如性別、年齡、地區(qū)等;另一類是他在互聯(lián)網(wǎng)上的行為數(shù)據(jù),包括他的搜索行為、收視行為等。我們認為用戶的行為數(shù)據(jù)比他的自然數(shù)據(jù)更加重要。
《21世紀》:那么,愛奇藝目前把用戶分為幾大類,或是為用戶貼了多少種標簽?zāi)?
葛承志:標簽肯定會有幾百個,因為這其中有不同的層面。比如說,我們根據(jù)百度的搜索數(shù)據(jù),可以給他打上他喜歡不同種類的消費品的標簽。比如這個人喜歡汽車,那個人喜歡保健養(yǎng)生,另外一個人喜歡美麗護膚等,這是按照他的興趣和關(guān)注的領(lǐng)域來貼的一種標簽,這樣的標簽可能有幾十個,甚至上百個。
另一種標簽是關(guān)于用戶喜歡看何種類型的影視劇。有的用戶喜歡槍戰(zhàn)類的題材,有的用戶喜歡美劇,還有用戶喜歡愛情片等等。這個系列的標簽可能又有幾十個。
除此之外,還有和用戶追星相關(guān)的標簽,比如這個人喜歡鄧超,那個人喜歡孫紅雷。這些標簽被分為不同的維度,每個維度下都有幾十個甚至上百個標簽。一些用戶同時可以貼五六種標簽,也就是說,他其實適合五六種不同類型的廣告。
《21世紀》:在用戶分類的基礎(chǔ)上,廣告主一般會如何選擇受眾進行投放呢?
葛承志:通常來說,如果是美容日化、食品飲料等大眾消費品行業(yè),廣告主不會只挑一類用戶,而是會挑好幾類標簽的用戶。但如果你是一個高端品牌,或是針對特定人群的產(chǎn)品品牌,比如你是賣服務(wù)器的,那么你的受眾對象肯定不是普通老百姓。能夠有服務(wù)器采購需求的,可能也就那么幾萬人,幾十萬人。這時,廣告主需要把幾類標簽疊加,找出重合部分的人,這些用戶會很有價值。因此,如何投放廣告和品牌所處的行業(yè)及他的受眾范圍有著密切關(guān)系。
優(yōu)酷投奔阿里的大數(shù)據(jù)視角
《21世紀》:愛奇藝目前的大數(shù)據(jù)分析方式,你覺得準確率高嗎?
葛承志:這個不能一概而論。舉個例子,就節(jié)目采購而言,通過歷史的流量數(shù)據(jù)來推斷國內(nèi)電視劇的熱度,目前的準確率大概可以達到80%以上。這一塊數(shù)據(jù)分析的規(guī)律性還是比較強的,因此準確度比較高。
對于一些海外劇,我們更多會看它在海外的播出情況,主要是收視率和它在海外社交媒體上傳播的狀況。通過海外播出情況能夠預(yù)測在國內(nèi)的播出情況,但因為各地區(qū)文化不太一樣,也有30%的可能會有意外。像我們今年年初播出的《來自星星的你》這部韓劇,它在韓國播出的熱度遠遠沒有在國內(nèi)高。
綜藝節(jié)目的情況和電視劇還不太一樣。由于這些年綜藝節(jié)目不斷推陳出新,熱點切換得非??臁G皟赡昊鸬氖歉璩x秀類的節(jié)目,去年開始又是親子類的節(jié)目,今年又成了明星真人秀類的節(jié)目。這種新的題材更加考驗我們對于數(shù)據(jù)系統(tǒng)的分析,因為這些題材沒出現(xiàn)過,沒有歷史數(shù)據(jù)積累,分析這方面就有一定難度。我們也會參考類似的節(jié)目在海外的播出情況,來進行預(yù)測。這方面我們還在不斷積累經(jīng)驗。
《21世紀》:你認為,在大數(shù)據(jù)的挖掘和運用方面,視頻網(wǎng)站面臨的主要挑戰(zhàn)是什么?
葛承志:目前比較大的挑戰(zhàn)是,視頻網(wǎng)站所能覆蓋的用戶行為,相對還是在一個有限的范圍內(nèi)?;蛘哒f,視頻網(wǎng)站主要覆蓋的是用戶的休閑時光。那么用戶在非休閑娛樂的時候,他在工作中、購物中的時候,他的興趣愛好、消費習(xí)慣,作為一個視頻網(wǎng)站是無法獲取的。
這也是為什么愛奇藝是百度的子公司,而阿里入股了優(yōu)酷。
你會發(fā)現(xiàn)這些視頻網(wǎng)站,多多少少和BAT有關(guān)。因為從視頻網(wǎng)站本身的角度,我們也需要更多層面的用戶數(shù)據(jù)。換言之,大數(shù)據(jù)的核心目的是描繪用戶,我們在描繪一個人的時候你不能只對他的一個方面了解透徹,你必須在各個方面都對他有所了解。這是視頻網(wǎng)站在大數(shù)據(jù)方面的一個挑戰(zhàn),目前大家都在著力去解決這個問題。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準備指南? ? 在數(shù)據(jù)驅(qū)動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認 ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預(yù)測分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢預(yù)判? ? 在數(shù)據(jù)驅(qū)動決策的時代,預(yù)測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點,而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報考到取證的全攻略? 在數(shù)字經(jīng)濟蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗:捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準 ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗:數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認證作為國內(nèi)權(quán)威的數(shù)據(jù)分析能力認證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對策略? 長短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨特的門控機制,在 ...
2025-07-07統(tǒng)計學(xué)方法在市場調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場調(diào)研是企業(yè)洞察市場動態(tài)、了解消費者需求的重要途徑,而統(tǒng)計學(xué)方法則是市場調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03