
CDA數(shù)據(jù)分析師 出品
作者:Mika
數(shù)據(jù):真達(dá)
后期:Mika
【導(dǎo)讀】
Show me data,用數(shù)據(jù)說話
今天我們聊一聊 《演員請就位2》,最近開播的國綜里面,熱度最高的一定是《演員請就位》了。從第一季起這部綜藝就話題不斷,金句頻出,前有李誠儒老師的“如坐針氈,如芒刺背,如鯁在喉”;這一季,李誠儒老師再出金句,“味同嚼蠟,味如雞肋,如此乏味”一度刷爆網(wǎng)絡(luò)。
《演員請就位2》導(dǎo)師方面,除了上一季的陳凱歌、趙薇、郭敬明,還有這季加入的爾冬升導(dǎo)演,陣容上就十分有看點(diǎn)。參加的演員方面也有胡杏兒、黃奕、婁藝瀟等熟悉的身影。
《演員2》一開播就熱搜話題不斷,無論是李誠儒老師、爾冬升導(dǎo)演的犀利點(diǎn)評,郭敬明給演技小白何昶希發(fā)S卡都能引起大量的討論。
我們今天就用Python分析了《演員2》的視頻彈幕,看看大家都在吐槽些什么。
01、豆瓣6.5分 《演員2》為啥差強(qiáng)人意?
《演員請就位》目前為止已經(jīng)播出了兩季,第一季在豆瓣為6.8分,共有4萬余人評分。
而目前正在播出的第二季,已有1萬9千多人評分,分?jǐn)?shù)為6.5分,比上一季還低了0.3分。
分?jǐn)?shù)占比
我們用Python分析了豆瓣的500條熱評數(shù)據(jù),從評分分布可以看到:
分?jǐn)?shù)占比方面,37%的人給出1星,20.8%的人給出2星。給出5星好評的僅有5%。
豆瓣短評
那么短評中都在說些什么呢?
從評價詞云圖中可見,話題主要集中在郭敬明、爾冬升、陳凱歌、李誠儒幾位嘉賓上。這也是《演員2》被詬病的一點(diǎn),嘉賓導(dǎo)師比參賽的演員更出圈,更有話題。此外,"節(jié)目"、"演技"、"點(diǎn)評"等也是短評中常出現(xiàn)的。
導(dǎo)演提及
幾位嘉賓導(dǎo)師中,誰被提到的次數(shù)最多呢?
進(jìn)一步分析可見,郭敬明占據(jù)著最高的話題度,其次是爾冬升和陳凱歌。
導(dǎo)演評價
在對導(dǎo)演和主持嘉賓的評價也十分有意思,對郭敬明的差評達(dá)到60.66%,超過的半數(shù),好評僅為14.22%。這與爾冬升的評價差距很大,后者的差評僅為28.83%,好評度也是最高的,達(dá)到了29.73%。而有趣的是,作為主持人的大鵬差評度居然比郭敬明還高,達(dá)到了67.27%。
02、分析45萬條彈幕數(shù)據(jù),看看大家都在吐槽什么
我們使用Python獲取并分析了《演員請就位2》的騰訊彈幕數(shù)據(jù),分析了目前播放的前五期。
1.1 數(shù)據(jù)讀入
首先導(dǎo)入所需庫。
# 導(dǎo)入庫 import os import jieba import numpy as np import pandas as pd from pyecharts.charts import Bar, Pie, Line, WordCloud, Page from pyecharts import options as opts from pyecharts.globals import SymbolType, WarningType WarningType.ShowWarning = False import stylecloud from IPython.display import Image # 用于在jupyter lab中顯示本地圖
使用pandas循環(huán)讀取數(shù)據(jù)。
# 讀入數(shù)據(jù) data_list = os.listdir('../data/') df_all = pd.DataFrame() for i in data_list: # print(i) df_one = pd.read_csv(f'../data/{i}', engine='python', encoding='utf-8', index_col=0) df_all = df_all.append(df_one, ignore_index=False) df_all.info()
<class 'pandas.core.frame.DataFrame'> Int64Index: 449762 entries, 0 to 44317 Data columns (total 7 columns): # Column Non-Null Count Dtype --- ------ -------------- ----- 0 episodes 449762 non-null object 1 comment_id 449762 non-null int64 2 oper_name 183066 non-null object 3 vip_degree 449762 non-null int64 4 content 449762 non-null object 5 time_point 449762 non-null int64 6 up_count 449762 non-null int64 dtypes: int64(4), object(3) memory usage: 27.5+ MB
共獲取了前五期449762條彈幕數(shù)據(jù)。字段主要包括:期數(shù)、評論id、用戶名、vip等級、評論內(nèi)容、評論時間點(diǎn)和點(diǎn)贊數(shù),數(shù)據(jù)預(yù)覽如下:
df_all.head()
# 刪除彈幕角色 df_all['content'] = df_all['content'].str.replace('(.*?:)', '') df_all.head()
1.3 數(shù)據(jù)可視化
彈幕走勢圖
先看到視頻彈幕走勢圖,從數(shù)量上可以看到,彈幕數(shù)量前三的分別是:第一期上、第三期上、第五期上。而第一期下和第五期下的彈幕較少。
df_epinum = df_all['episodes'].value_counts().reset_index()
df_epinum['num'] = [1, 5, 3, 7, 6, 8, 4, 9, 2, 10]
df_epinum = df_epinum.sort_values('num')
df_epinum
x_data = df_epinum['index'].tolist()
y_data = df_epinum['episodes'].tolist()
# 條形圖
bar1 = Bar(init_opts=opts.InitOpts(width='1350px', height='750px'))
bar1.add_xaxis(xaxis_data=x_data)
bar1.add_yaxis('', y_axis=y_data)
bar1.set_global_opts(title_opts=opts.TitleOpts(title='前五期的彈幕數(shù)走勢圖'),
visualmap_opts=opts.VisualMapOpts(max_=60000, is_show=False) ) bar1.render()
人物彈幕詞云
我們接著再分別看到幾位導(dǎo)演導(dǎo)師的彈幕詞云。
——熱門課程推薦:
想學(xué)習(xí)PYTHON數(shù)據(jù)分析與金融數(shù)字化轉(zhuǎn)型精英訓(xùn)練營,您可以點(diǎn)擊>>>“人才轉(zhuǎn)型”了解課程詳情;
想從事業(yè)務(wù)型數(shù)據(jù)分析師,您可以點(diǎn)擊>>>“數(shù)據(jù)分析師”了解課程詳情;
想從事大數(shù)據(jù)分析師,您可以點(diǎn)擊>>>“大數(shù)據(jù)就業(yè)”了解課程詳情;
想成為人工智能工程師,您可以點(diǎn)擊>>>“人工智能就業(yè)”了解課程詳情;
想了解Python數(shù)據(jù)分析,您可以點(diǎn)擊>>>“Python數(shù)據(jù)分析師”了解課程詳情;
想咨詢互聯(lián)網(wǎng)運(yùn)營,你可以點(diǎn)擊>>>“互聯(lián)網(wǎng)運(yùn)營就業(yè)班”了解課程詳情;
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強(qiáng)大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預(yù)測分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢預(yù)判? ? 在數(shù)據(jù)驅(qū)動決策的時代,預(yù)測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點(diǎn),而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報考到取證的全攻略? 在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗:捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗:數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對策略? 長短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨(dú)特的門控機(jī)制,在 ...
2025-07-07統(tǒng)計學(xué)方法在市場調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場調(diào)研是企業(yè)洞察市場動態(tài)、了解消費(fèi)者需求的重要途徑,而統(tǒng)計學(xué)方法則是市場調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03