
CDA數(shù)據(jù)分析師 出品
作者:Mika
數(shù)據(jù):真達(dá)
后期:Mika
【導(dǎo)讀】
Show me data,用數(shù)據(jù)說(shuō)話
今天我們聊一聊 《演員請(qǐng)就位2》,最近開(kāi)播的國(guó)綜里面,熱度最高的一定是《演員請(qǐng)就位》了。從第一季起這部綜藝就話題不斷,金句頻出,前有李誠(chéng)儒老師的“如坐針氈,如芒刺背,如鯁在喉”;這一季,李誠(chéng)儒老師再出金句,“味同嚼蠟,味如雞肋,如此乏味”一度刷爆網(wǎng)絡(luò)。
《演員請(qǐng)就位2》導(dǎo)師方面,除了上一季的陳凱歌、趙薇、郭敬明,還有這季加入的爾冬升導(dǎo)演,陣容上就十分有看點(diǎn)。參加的演員方面也有胡杏兒、黃奕、婁藝瀟等熟悉的身影。
《演員2》一開(kāi)播就熱搜話題不斷,無(wú)論是李誠(chéng)儒老師、爾冬升導(dǎo)演的犀利點(diǎn)評(píng),郭敬明給演技小白何昶希發(fā)S卡都能引起大量的討論。
我們今天就用Python分析了《演員2》的視頻彈幕,看看大家都在吐槽些什么。
01、豆瓣6.5分 《演員2》為啥差強(qiáng)人意?
《演員請(qǐng)就位》目前為止已經(jīng)播出了兩季,第一季在豆瓣為6.8分,共有4萬(wàn)余人評(píng)分。
而目前正在播出的第二季,已有1萬(wàn)9千多人評(píng)分,分?jǐn)?shù)為6.5分,比上一季還低了0.3分。
分?jǐn)?shù)占比
我們用Python分析了豆瓣的500條熱評(píng)數(shù)據(jù),從評(píng)分分布可以看到:
分?jǐn)?shù)占比方面,37%的人給出1星,20.8%的人給出2星。給出5星好評(píng)的僅有5%。
豆瓣短評(píng)
那么短評(píng)中都在說(shuō)些什么呢?
從評(píng)價(jià)詞云圖中可見(jiàn),話題主要集中在郭敬明、爾冬升、陳凱歌、李誠(chéng)儒幾位嘉賓上。這也是《演員2》被詬病的一點(diǎn),嘉賓導(dǎo)師比參賽的演員更出圈,更有話題。此外,"節(jié)目"、"演技"、"點(diǎn)評(píng)"等也是短評(píng)中常出現(xiàn)的。
導(dǎo)演提及
幾位嘉賓導(dǎo)師中,誰(shuí)被提到的次數(shù)最多呢?
進(jìn)一步分析可見(jiàn),郭敬明占據(jù)著最高的話題度,其次是爾冬升和陳凱歌。
導(dǎo)演評(píng)價(jià)
在對(duì)導(dǎo)演和主持嘉賓的評(píng)價(jià)也十分有意思,對(duì)郭敬明的差評(píng)達(dá)到60.66%,超過(guò)的半數(shù),好評(píng)僅為14.22%。這與爾冬升的評(píng)價(jià)差距很大,后者的差評(píng)僅為28.83%,好評(píng)度也是最高的,達(dá)到了29.73%。而有趣的是,作為主持人的大鵬差評(píng)度居然比郭敬明還高,達(dá)到了67.27%。
02、分析45萬(wàn)條彈幕數(shù)據(jù),看看大家都在吐槽什么
我們使用Python獲取并分析了《演員請(qǐng)就位2》的騰訊彈幕數(shù)據(jù),分析了目前播放的前五期。
1.1 數(shù)據(jù)讀入
首先導(dǎo)入所需庫(kù)。
# 導(dǎo)入庫(kù) import os import jieba import numpy as np import pandas as pd from pyecharts.charts import Bar, Pie, Line, WordCloud, Page from pyecharts import options as opts from pyecharts.globals import SymbolType, WarningType WarningType.ShowWarning = False import stylecloud from IPython.display import Image # 用于在jupyter lab中顯示本地圖
使用pandas循環(huán)讀取數(shù)據(jù)。
# 讀入數(shù)據(jù) data_list = os.listdir('../data/') df_all = pd.DataFrame() for i in data_list: # print(i) df_one = pd.read_csv(f'../data/{i}', engine='python', encoding='utf-8', index_col=0) df_all = df_all.append(df_one, ignore_index=False) df_all.info()
<class 'pandas.core.frame.DataFrame'> Int64Index: 449762 entries, 0 to 44317 Data columns (total 7 columns): # Column Non-Null Count Dtype --- ------ -------------- ----- 0 episodes 449762 non-null object 1 comment_id 449762 non-null int64 2 oper_name 183066 non-null object 3 vip_degree 449762 non-null int64 4 content 449762 non-null object 5 time_point 449762 non-null int64 6 up_count 449762 non-null int64 dtypes: int64(4), object(3) memory usage: 27.5+ MB
共獲取了前五期449762條彈幕數(shù)據(jù)。字段主要包括:期數(shù)、評(píng)論id、用戶名、vip等級(jí)、評(píng)論內(nèi)容、評(píng)論時(shí)間點(diǎn)和點(diǎn)贊數(shù),數(shù)據(jù)預(yù)覽如下:
df_all.head()
# 刪除彈幕角色 df_all['content'] = df_all['content'].str.replace('(.*?:)', '') df_all.head()
1.3 數(shù)據(jù)可視化
彈幕走勢(shì)圖
先看到視頻彈幕走勢(shì)圖,從數(shù)量上可以看到,彈幕數(shù)量前三的分別是:第一期上、第三期上、第五期上。而第一期下和第五期下的彈幕較少。
df_epinum = df_all['episodes'].value_counts().reset_index()
df_epinum['num'] = [1, 5, 3, 7, 6, 8, 4, 9, 2, 10]
df_epinum = df_epinum.sort_values('num')
df_epinum
x_data = df_epinum['index'].tolist()
y_data = df_epinum['episodes'].tolist()
# 條形圖
bar1 = Bar(init_opts=opts.InitOpts(width='1350px', height='750px'))
bar1.add_xaxis(xaxis_data=x_data)
bar1.add_yaxis('', y_axis=y_data)
bar1.set_global_opts(title_opts=opts.TitleOpts(title='前五期的彈幕數(shù)走勢(shì)圖'),
visualmap_opts=opts.VisualMapOpts(max_=60000, is_show=False) ) bar1.render()
人物彈幕詞云
我們接著再分別看到幾位導(dǎo)演導(dǎo)師的彈幕詞云。
——熱門(mén)課程推薦:
想學(xué)習(xí)PYTHON數(shù)據(jù)分析與金融數(shù)字化轉(zhuǎn)型精英訓(xùn)練營(yíng),您可以點(diǎn)擊>>>“人才轉(zhuǎn)型”了解課程詳情;
想從事業(yè)務(wù)型數(shù)據(jù)分析師,您可以點(diǎn)擊>>>“數(shù)據(jù)分析師”了解課程詳情;
想從事大數(shù)據(jù)分析師,您可以點(diǎn)擊>>>“大數(shù)據(jù)就業(yè)”了解課程詳情;
想成為人工智能工程師,您可以點(diǎn)擊>>>“人工智能就業(yè)”了解課程詳情;
想了解Python數(shù)據(jù)分析,您可以點(diǎn)擊>>>“Python數(shù)據(jù)分析師”了解課程詳情;
想咨詢互聯(lián)網(wǎng)運(yùn)營(yíng),你可以點(diǎn)擊>>>“互聯(lián)網(wǎng)運(yùn)營(yíng)就業(yè)班”了解課程詳情;
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實(shí)戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無(wú)論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫(kù)管理中,“大表” 始終是性能優(yōu)化繞不開(kāi)的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫(kù)表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動(dòng)態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開(kāi)始提取前,需先判斷 TIF 文件的類(lèi)型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價(jià)值的專(zhuān)業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫(kù)表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實(shí)戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫(kù))處理 Excel 數(shù)據(jù)時(shí),“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗(yàn)與 t 檢驗(yàn):差異、適用場(chǎng)景與實(shí)踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計(jì)學(xué)領(lǐng)域,假設(shè)檢驗(yàn)是驗(yàn)證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專(zhuān)業(yè)操盤(pán)手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計(jì)劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計(jì)劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對(duì)象的 text 與 content:區(qū)別、場(chǎng)景與實(shí)踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請(qǐng)求開(kāi)發(fā)時(shí)(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價(jià)值的核心操盤(pán)手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫(kù)表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請(qǐng)求工具對(duì)比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請(qǐng)求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)的科學(xué)計(jì)數(shù)法問(wèn)題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)時(shí)的科學(xué)計(jì)數(shù)法問(wèn)題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價(jià)值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營(yíng)問(wèn)題、提升執(zhí)行效率的核心手段,其價(jià)值 ...
2025-09-12用 SQL 驗(yàn)證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實(shí)戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過(guò)程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計(jì)” 與 “用戶體驗(yàn) ...
2025-09-11塔吉特百貨孕婦營(yíng)銷(xiāo)案例:數(shù)據(jù)驅(qū)動(dòng)下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見(jiàn)頂” 的當(dāng)下,精準(zhǔn)營(yíng)銷(xiāo)成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價(jià)值 在數(shù)據(jù)驅(qū)動(dòng)決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類(lèi)分析:從操作實(shí)踐到業(yè)務(wù)價(jià)值挖掘 在數(shù)據(jù)分析場(chǎng)景中,聚類(lèi)分析作為 “無(wú)監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計(jì)模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價(jià)值導(dǎo)向 統(tǒng)計(jì)模型作為數(shù)據(jù)分析的核心工具,并非簡(jiǎn)單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10