
作者:Mika
數(shù)據(jù):真達(dá)
后期:澤龍
【導(dǎo)讀】
最近《三十而已》這部劇頻頻霸占微博熱搜,今天我們就來聊一聊。
Python技術(shù)部分請(qǐng)直接看第四部分。
Show me data,用數(shù)據(jù)說話
今天我們聊一聊 《三十而已》
《乘風(fēng)破浪的姐姐》已成為這個(gè)夏天最火爆的話題,前有國(guó)綜"浪姐"高歌猛進(jìn),后有這部劇版"浪姐"《三十而已》讓人眼前一亮。
最近微博熱搜幾乎都被這部劇承包了,幾乎是每播一集就能上熱搜的那種,讓你沒追劇都能知道劇情進(jìn)展到哪兒了。
在這部劇中,江疏影、童瑤和毛曉彤三人攜手演繹了30歲都市女性的3種人生以及所面對(duì)的3種困境。劇中各種名場(chǎng)面也是讓這部劇徹底出圈了。
童瑤飾演的全職太太顧佳,江湖人稱:許子言媽媽、散打教練、特級(jí)甜品師、情商管理專家、育兒專家、兒童心理學(xué)者、中國(guó)好閨蜜、頂級(jí)宮斗高手、幻山煙花公司幕后老。
為了保護(hù)兒子,手撕傷害兒子的人
為融入貴婦圈
掏家底也要買愛馬仕鴕鳥皮Kelly28
江疏影飾演的是奢侈品店的銷售王漫妮,妥妥的一名滬漂。演繹了目前社會(huì)上很多“社畜”的真實(shí)生活,生病了身邊照顧自己的人都沒有,只能一個(gè)人住院。
毛曉彤飾演的鐘曉芹是一個(gè)普通的上海小囡nan,她的婚姻看似穩(wěn)定,但與丈夫卻貌合神離,一個(gè)大大咧咧神經(jīng)大條,另一個(gè)沉默寡言、不愿溝通。
那么這部《三十而已》是怎么火起來的?
哪些點(diǎn)最戳中觀眾的心呢?
今天我們就來用數(shù)據(jù)帶你盤一盤。
01女性角色不斷霸屏
近幾年這類聚焦女性的影視劇層出不窮:
美劇方面
而今年夏天,屏幕上活躍的女性身影更是不少。前有《乘風(fēng)破浪的姐姐們》引發(fā)的全民討論,之后的國(guó)產(chǎn)劇《二十不惑》和《三十而已》不約而同把話題指向女性的年齡問題。
02《三十而已》怎么突然火了
一開始也許沒人想到,這樣一部聚焦女性角度的國(guó)產(chǎn)都市劇能在這個(gè)夏天徹底火了??吹桨俣戎笖?shù),對(duì)比同期播出也是圍繞女性話題的《二十不惑》,《三十而已》的熱度和搜索度都要高出很多,從7月17日首播起熱度就高居不下。
目前微博話題《三十而已》閱讀量達(dá)到42.2億,討論達(dá)到148.8萬。該劇也頻頻霸占微博熱搜,幾乎更新一集就會(huì)有新的熱搜,讓你忍不住去追劇。
看劇中,你會(huì)折服于顧佳的強(qiáng)大家庭女性人設(shè);
劇中鐘曉芹的老公陳嶼是非常有爭(zhēng)議的角色。他在婚姻中對(duì)妻子不關(guān)心不溝通的態(tài)度讓很多人氣憤不已,一度微博話題被#陳嶼氣死#還上了熱搜。
甚至還有像“眾盼芹離”這樣的詞都出來了。
03《三十而已》中是什么最戳中觀眾的心?
1豆瓣數(shù)據(jù)
接著我們分析了豆瓣的短評(píng)數(shù)據(jù)。目前這部劇豆瓣上共有4萬2千余人進(jìn)行評(píng)分,分?jǐn)?shù)為8分。在國(guó)產(chǎn)劇中是很不錯(cuò)的成績(jī)了。
在評(píng)分方面,我們以其中500條數(shù)據(jù)為代表。
評(píng)論中提到最多的主演
我們進(jìn)行排序發(fā)現(xiàn)位居首位的是王漫妮,然后是顧佳和鐘曉芹。
豆瓣小組主演話題熱度
對(duì)比一下在《三十而已》的豆瓣小組里,討論話題度最高的就屬陳嶼了。
豆瓣評(píng)論詞云
豆瓣評(píng)論中主要圍繞的關(guān)鍵詞有"女性"、"劇情"、"喜歡"等方面。演員中"江疏影"、"童瑤"也被多次提到。
2騰訊視頻彈幕
接下來我們還分析整理了騰訊視頻彈幕數(shù)據(jù),目前共出了 15集,共整理了271049條彈幕。
首先,看到用戶在發(fā)彈幕時(shí)最喜歡選用的角色標(biāo)簽排名:
用戶喜歡用的彈幕角色
其中王漫妮排名第一,顧佳、鐘曉芹分別位居二三。這方面與豆瓣一致。男性角色排名是陳嶼以及許幻山。
再看到不同角色的彈幕詞云:
王漫妮彈幕詞云
江疏影飾演的王漫妮討論度很高,這也與演員的演技和本身的人氣是分不開的。氣質(zhì)這塊拿捏的死死的,而且作為奢侈品店銷售,王漫妮在話術(shù)和專業(yè)度上也讓人感覺很真實(shí)。
顧佳彈幕詞云
下面是童瑤飾演的全職太太顧佳。顧佳諧音這個(gè)名字照顧家庭,不僅要照顧孩子,把家里打理的井井有條,還有扶持老公的煙花公司,這個(gè)女人實(shí)在是太不一般了。關(guān)鍵詞中 "厲害"、"聰明"、"完美"被多次提到。
鐘曉芹彈幕詞云
鐘曉芹作為普通的上海本地小姑娘,性格"單純可愛"。而面對(duì)一點(diǎn)也不善解人意的老公,彈幕中感嘆"怎么還不離婚"的也特別多。
陳嶼彈幕詞云
陳嶼和許幻山兩個(gè)丈夫都有各自的問題。陳嶼性格冷漠,關(guān)心自己養(yǎng)的魚勝過老婆。
許幻山彈幕詞云
許幻山是純粹的煙花設(shè)計(jì)藝術(shù)家,在公司運(yùn)營(yíng)方面顯得"幼稚",不懂"人情世故",這些方面還真不如他的老婆顧佳。
04如何用Python獲取彈幕數(shù)據(jù)
我們使用Python獲取并分析了《三十而已》的騰訊彈幕數(shù)據(jù),來分析看看哪個(gè)角色最受歡迎。分析流程分為以下幾步:
1 數(shù)據(jù)讀入
首先導(dǎo)入所需包。
# 導(dǎo)入庫(kù) import os import jieba import numpy as np import pandas as pd from pyecharts.charts import Bar, Pie, Line, WordCloud, Page from pyecharts import options as opts from pyecharts.globals import SymbolType import stylecloud from IPython.display import Image # 用于在jupyter lab中顯示本地圖
然后使用pandas循環(huán)讀取數(shù)據(jù)。
# 讀入數(shù)據(jù) data_list = os.listdir('../data/') df_all = pd.DataFrame() for i in data_list: # 判斷 if i.split('.')[-1] == 'csv': df_one = pd.read_csv(f'../data/{i}', engine='python', encoding='utf-8', index_col=0) df_all = df_all.append(df_one, ignore_index=False) df_all.info()
pandas.core.frame.dataframe'> Int64Index: 271049 entries, 0 to 17637 Data columns (total 7 columns): # Column Non-Null Count Dtype --- ------ -------------- ----- 0 episodes 271049 non-null int64 1 comment_id 271049 non-null int64 2 oper_name 139035 non-null object 3 vip_degree 271049 non-null int64 4 content 271049 non-null object 5 time_point 271049 non-null int64 6 up_count 271049 non-null int64 dtypes: int64(5), object(2) memory usage: 16.5+ MB pandas.core.frame.dataframe'>
此次一共獲取了15集2271049條彈幕數(shù)據(jù),每集平均18069條,按照每集平均45分鐘計(jì)算,每分鐘平均401條彈幕,數(shù)據(jù)預(yù)覽如下:
豆瓣數(shù)據(jù)# 提取數(shù)據(jù) pattern = r'(王漫妮\s*|鐘曉芹\s*|顧佳\s*|陳嶼\s*|許幻山\s*|颯颯\s*|浪浪\s*):.*' df_all['danmu_role'] = df_all['content'].str.extract(pattern)[0].str.strip() # 定義函數(shù) def transform_name(x): if x=='王漫妮' or x=='顧佳' or x=='鐘曉芹' or x=='陳嶼' or x=='許幻山' or x=='颯颯' or x=='浪浪': return 'VIP用戶' elif x=='NaN': return '未知用戶' else: return '普通用戶' df_all['danmu_level'] = df_all['danmu_role'].apply(transform_name) df_all.head()
2 數(shù)據(jù)預(yù)處理
此處對(duì)彈幕角色和VIP用戶進(jìn)行處理。
豆瓣數(shù)據(jù)# 提取數(shù)據(jù) pattern = r'(王漫妮\s*|鐘曉芹\s*|顧佳\s*|陳嶼\s*|許幻山\s*|颯颯\s*|浪浪\s*):.*' df_all['danmu_role'] = df_all['content'].str.extract(pattern)[0].str.strip() # 定義函數(shù) def transform_name(x): if x=='王漫妮' or x=='顧佳' or x=='鐘曉芹' or x=='陳嶼' or x=='許幻山' or x=='颯颯' or x=='浪浪': return 'VIP用戶' elif x=='NaN': return '未知用戶' else: return '普通用戶' df_all['danmu_level'] = df_all['danmu_role'].apply(transform_name) df_all.head()
level_num = df_all['danmu_level'].value_counts() data_pair = [list(z) for z in zip(level_num.index.tolist(), level_num.values.tolist())] # 繪制餅圖 pie1 = Pie(init_opts=opts.InitOpts(width='1350px', height='750px')) pie1.add('', data_pair, radius=['35%', '60%']) pie1.set_global_opts(title_opts=opts.TitleOpts(title='彈幕發(fā)送人群等級(jí)分布'), legend_opts=opts.LegendOpts(orient='vertical', pos_top='15%', pos_left='2%')) pie1.set_series_opts(label_opts=opts.LabelOpts(formatter=":geybsqlxm7mc%")) pie1.set_colors(['#6FB27C', '#FFAF34']) pie1.render()
role_num = df_all['danmu_role'].value_counts() role_num.drop(['颯颯', '浪浪'], inplace=True) # 柱形圖 bar1 = Bar(init_opts=opts.InitOpts(width='1350px', height='750px')) bar1.add_xaxis(role_num.index.tolist()) bar1.add_yaxis("", role_num.values.tolist(), category_gap='5%') bar1.set_global_opts(title_opts=opts.TitleOpts(title="VIP用戶最喜歡使用的彈幕角色"), visualmap_opts=opts.VisualMapOpts(max_=21027), ) bar1.render()
content_series1 = df_all[df_all.content.str.replace(pattern, '').str.contains('漫妮|疏影')]['content'] text1 = get_cut_words(content_series1) # 繪制詞云圖 stylecloud.gen_stylecloud(text=' '.join(text1), max_words=1000, collocations=False, font_path=r'?C:\Windows\Fonts\msyh.ttc', icon_name='fas fa-heart', size=653, output_name='./html/彈幕角色王漫妮-詞云圖.png')
結(jié)語:
一直以來在世俗的眼光下,婚姻、事業(yè)、家庭,是30+女性繞不開的話題。年過三十,不是結(jié)婚生子,就是在結(jié)婚生子的路上,但對(duì)于沒有結(jié)婚的很可能被稱“大齡剩女”。
近年來,關(guān)于女性年齡的討論更是被推到了風(fēng)口浪尖。綜藝《浪姐》播出后,看到一位位30+的女嘉賓在舞臺(tái)上"興風(fēng)作浪",彈幕中有女生留言“好像沒那么害怕變老了“而《三十而已》更是展現(xiàn)了30+女性的不同生活狀態(tài)和機(jī)遇,其實(shí)女性的人生,不應(yīng)該被年齡所定義。
三十而已,年華正好!
無論哪個(gè)年齡階段都有不同的精彩!
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
LSTM 模型輸入長(zhǎng)度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長(zhǎng)序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報(bào)考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計(jì)的實(shí)用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強(qiáng)大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠(chéng)摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實(shí)施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價(jià)值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡(jiǎn)稱 BI)深度融合的時(shí)代,BI ...
2025-07-10SQL 在預(yù)測(cè)分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢(shì)預(yù)判? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代,預(yù)測(cè)分析作為挖掘數(shù)據(jù)潛在價(jià)值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價(jià)值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點(diǎn),而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報(bào)考到取證的全攻略? 在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭(zhēng)搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢(shì)性檢驗(yàn):捕捉數(shù)據(jù)背后的時(shí)間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢(shì)性檢驗(yàn)如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時(shí)間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時(shí)間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實(shí)戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗(yàn):數(shù)據(jù)趨勢(shì)與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢(shì)變化以及識(shí)別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國(guó)內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對(duì)策略? 長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨(dú)特的門控機(jī)制,在 ...
2025-07-07統(tǒng)計(jì)學(xué)方法在市場(chǎng)調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場(chǎng)調(diào)研是企業(yè)洞察市場(chǎng)動(dòng)態(tài)、了解消費(fèi)者需求的重要途徑,而統(tǒng)計(jì)學(xué)方法則是市場(chǎng)調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動(dòng)力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動(dòng)力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價(jià)值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03