99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

熱線電話:13121318867

登錄
首頁精彩閱讀頒獎烏龍就算了,怎么還性別歧視,好萊塢電影怎么了?數(shù)據(jù)笑而不語
頒獎烏龍就算了,怎么還性別歧視,好萊塢電影怎么了?數(shù)據(jù)笑而不語
2017-03-01
收藏


一、頒獎烏龍

第 89 屆奧斯卡頒獎典禮昨日落幕,《愛樂之城》無非是最大的贏家。但原本波瀾不驚未現(xiàn)黑馬的頒獎典禮居然在最后一刻爆出史上最大烏龍:先是宣布《愛樂之城》獲得最佳影片獎,然而劇組獲獎感言都快說完了,又被突然攔住說獎項(xiàng)頒錯了,最佳影片獎應(yīng)是《月光男孩》。

真是隔著屏幕都能感到尷尬。
無緣影帝,又被假最佳影片叫上臺的高司令,還要在臺上祝賀《月光男孩》劇組。心疼高司令一秒。

那么昨天頒獎烏龍對網(wǎng)絡(luò)熱搜產(chǎn)生了什么影響呢?頒獎烏龍時約為北京時間 13 點(diǎn)左右,根據(jù)谷歌指數(shù)此時奧斯卡搜索指數(shù)達(dá)到最高點(diǎn)。

入圍最佳電影的熱搜變化如下,在頒獎烏龍后,獲得最佳影片的《月光男孩》搜索逐漸趕超《愛樂之城》。

奧斯卡相關(guān)搜索可見,關(guān)于奧斯卡頒獎烏龍的搜索量特別高。

主辦方解釋頒獎烏龍的原因是因?yàn)楣ぷ魅藛T錯把“最佳女主角”的備用信封當(dāng)成了“最佳影片”的信封,給了頒獎嘉賓沃倫·比蒂,而備用信封上寫著“艾瑪·斯通,《愛樂之城》”。

不可否認(rèn)石頭姐獲得最佳女主角實(shí)至名歸,但石頭姐表示這個鍋我不背。

奧斯卡頒獎烏龍,就算把最佳女主角的頒獎卡拿出來當(dāng)作最佳影片念一遍,也擋不住電影里面的女性角色戲份越來越少。


二、好萊塢電影背后的性別歧視

透過數(shù)據(jù),我們看到頒獎烏龍帶來的蝴蝶效應(yīng)。

同樣,通過數(shù)據(jù)美國有個女程序員 Amber Thomas 發(fā)現(xiàn)了好萊塢電影中居然還存在性別歧視。

這一切的起因還要從這張《星球大戰(zhàn)外傳:俠盜一號》(以下簡稱《星戰(zhàn)》)的海報說起。
有這么一個不成文的定律:
 
一般在海報中當(dāng)一個人的照片比其他人大好幾倍時,那這個人多半是主角。
 
這張海報中可以清楚的看到主角就是 Jyn Erso 。
 
但容易忽略 Jyn 是這種海報上唯一的女性角色。這也同樣反映到這部電影中,不僅女性角色屈指可數(shù),很多時候 Jyn 是眾多場景中唯一的女性。
 
此情此景如 1977 年《星球大戰(zhàn)》中 Princess Leia 的情況如出一轍。
 
那么在 39 年后的今天,
 
好萊塢電影中性別比例失衡的改觀了嗎?
 
好萊塢電影中女性逐漸掌握話語權(quán)了嗎?
 
帶著這些質(zhì)疑,Amber 開始了她的數(shù)據(jù)分析。她根據(jù) the numbers 提供的2016年全球票房前十的影片為研究對象,這十部電影分別是:

美國隊(duì)長 3 :內(nèi)戰(zhàn)
海底總動員 2 :多莉去哪兒
瘋狂動物城
奇幻森林
愛寵大機(jī)密
蝙蝠俠大戰(zhàn)超人:正義黎明
星球大戰(zhàn)外傳:俠盜一號
死侍
神奇動物在哪里
X特遣隊(duì)
 
這些電影中都有許多令人印象深刻的女性角色,那么從中自然能看到些性別的平等吧?

出于程序員的嚴(yán)謹(jǐn),Amber 決定用數(shù)據(jù)說話。證明這個觀點(diǎn),我們需要這幾步:
 
數(shù)據(jù)
代碼


三、數(shù)據(jù)

現(xiàn)在確定了研究對象,還需要確定數(shù)據(jù)來源。有些類似的數(shù)據(jù)分析項(xiàng)目常常根據(jù)人物臺詞和出鏡時間為判斷的標(biāo)準(zhǔn)。這都是不錯的選擇,但是 Amber 希望更深入的探討電影和角色的關(guān)系。
 
最終她選擇了男女角色的臺詞比重這一角度切入。這樣能夠?qū)W⒂谠诠适轮邪l(fā)揮積極作用的角色,并去除沒有臺詞的角色。
 
有很多粉絲會整理電影中臺詞,并且免費(fèi)分享。對于找不到臺詞的電影,Amber 只能對照字幕文件一個個整理。顯然這一過程是費(fèi)時的,但是結(jié)果證明這都是值得的。


四、分析

一旦有了臺詞,只需要把 txt 文件導(dǎo)入 R,然后把角色和臺詞分開分析。以《星戰(zhàn)》為例,操作如下:
 
# Installing Necessary Packages
 
# For Web Scraping Transcripts
library(rvest)
library(curl)
 
# For Data Frame Manipulation
library(dplyr)
library(tidyr)
library(stringr)
library(stringi)
# Import Transcript (with formatting)
RO <- readLines("RogueOneTranscript.txt")
 
# Convert to Data Frame
RO <- as.data.frame(RO)
 
# Remove empty rows
RO <- RO %>%
        filter(!(RO == ""))
 
# Separating Character from words
RO_full <- RO %>%
          separate(col = RO, into = c("Character", "Words"), sep = ":", extra = "merge") %>%
          # Eliminate script notes
          filter(!is.na(Words)) %>%
          # Trim white space and convert Character to factor
          mutate(Character = as.factor(str_trim(Character)),
                 Words = str_trim(Words))
 
現(xiàn)在我們有了角色和臺詞的數(shù)據(jù)框架,然后需要判定每個角色的性別。

為了保證分類的一致性,制定了以下規(guī)則:
 
1. 盡可能根據(jù)指稱角色的代詞來分判定配性別。 如果一個角色被稱為“ he ”或“ him ”,則他被歸類為“男性”。
 
2. 如果電影該角色沒有代詞指稱,但是角色在 IMDB 上有被標(biāo)注,則使用演員或女演員的性別。
注:演員的性別根據(jù)截止至 2017 年 1 月的公開信息判定。(美帝程序員真是嚴(yán)謹(jǐn))
 
3. 如果沒有角色代詞指稱,并且角色未標(biāo)明演員,則參考字幕(有時會表明角色性別)。
 
4. 如果以上規(guī)則都不適用,則根據(jù)角色的聲音判定性別。
 
顯然這些規(guī)則存在著缺陷,這里有一些注意事項(xiàng):
 
1. 如果男性角色由女演員配音(反之亦然),且該角色從未用代詞指稱,他可能被判斷錯誤。 (這里可能性很小,但是不排除。)
 
2. 電影中若出現(xiàn)不具有實(shí)體角色的聲音(例如,電影中電腦的聲音),則根據(jù)配音演員的性別分類。
 
3. 真正判定所以角色的性別有一定,但將盡可能利用所擁有的提示和信息。
 
所以現(xiàn)在我們只需要計(jì)算每個角色的臺詞數(shù)。 這些通過 dplyr 和 stringipackages 在 R 中就能輕松實(shí)現(xiàn)。
 
# Counting words per character
RO_full2 <- RO_full %>%
                mutate(count = stri_count(Words, regex = "\\S+")) %>%
                group_by(Character, Gender) %>%
                summarise(Total_Words = sum(count)) %>%
                filter(!(Gender == "unknown"))


五、數(shù)據(jù)可視化

現(xiàn)在我們得到了數(shù)據(jù)結(jié)果。但是,僅僅顯示臺詞數(shù)量和角色的表不僅枯燥,而且也不直觀。
 
哪種形式最利于展現(xiàn)結(jié)果呢?
 
散點(diǎn)圖條形圖顯然不太合適。


一個簡單的氣泡圖似乎是不錯的選擇,但很看清不同角色的臺詞比重。

最終, Amber 決定用 d3.js 來制作交互式圖形。 每個氣泡表示一個角色,并且氣泡的面積等同于該角色的臺詞比重。 同時男女臺詞的的氣泡可以分開,表現(xiàn)更清晰。下方的條形也清晰的表明了電影中角色性別占比以及性別臺詞占比的信息。

六、結(jié)論
最終我們得到的結(jié)論如下圖:
在 2016 年全球票房前十影片中:
 
沒有一部影片中(有臺詞的)女性角色占比達(dá)到 50% 。
《海底總動員 2 :多莉去哪兒》性別比重最為平等,(有臺詞的)女性角色占 43% 。但要完全實(shí)現(xiàn)平等的話,起碼還需要 8 個(有臺詞的)女性角色。
 
《星戰(zhàn)》在這點(diǎn)上是最糟糕的,(有臺詞的)女性角色僅占 9% 。 且所出現(xiàn)的 10 個女性角色中,有 1 個是電腦的聲音; 1 個在屏幕上出現(xiàn)不足 5 秒;還有 1 個是只說了一個詞的 CGI 角色。
 
只有一部影片中 50% 的臺詞是女性角色所說的。
《海底總動員 2 :多莉去哪兒》中女性臺詞比重 53% 。 但是,這些臺詞的 76% 都來自多莉這一個角色。
 
最后一名是《奇幻森林》,女性臺詞僅占 10% 。 注意:電影中斯嘉麗·約翰遜作為雄性蛇 Kaa 的配音。(心疼女神一秒)

我們還可以看到:
·《海底總動員 2 :多莉去哪兒》和《瘋狂動物城》是 2016 年全球票房前十中唯一的兩部電影中女性角色臺詞最多的。
 
·《美國隊(duì)長 3 :內(nèi)戰(zhàn)》中的女角色遠(yuǎn)遠(yuǎn)低于男性角色,僅占 5 分之一。在整個電影中,女性角色只貢獻(xiàn)了 16% 的臺詞。
 
·《蝙蝠俠大戰(zhàn)超人:正義黎明》中蝙蝠俠的臺詞比超人多 2.4 倍,比神奇女俠多6倍。
 
·《星戰(zhàn)》中 78% 的女性臺詞都來自 Jyn Erso 。
 
·雖然小丑女 Harley Quinn 是《X特遣隊(duì)》中大力宣傳的角色,但是她的臺詞只有威爾史密斯飾演的 Floyd/Deadshot 的 42% 。同時影片中另一個女性角色, Viola Davis 飾演的 boss ——  Amanda Waller 僅說了 222 個單詞,僅為 Deadshot 臺詞的 16% 。
 
開始這個項(xiàng)目時,只是感覺《星戰(zhàn)》中臺詞男女分配不均。結(jié)果分析完發(fā)現(xiàn) 16 年的十大熱門電影中幾乎沒有一部是性別平等的。
 

好萊塢,我們可以做得更好。


原作者  Amber Thomas
編譯 CDA 編譯團(tuán)隊(duì) Mika
本文為 CDA 數(shù)據(jù)分析師原創(chuàng)作品,轉(zhuǎn)載需授權(quán)


數(shù)據(jù)分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數(shù)據(jù)分析師資訊
更多

OK
客服在線
立即咨詢
客服在線
立即咨詢
') } function initGt() { var handler = function (captchaObj) { captchaObj.appendTo('#captcha'); captchaObj.onReady(function () { $("#wait").hide(); }).onSuccess(function(){ $('.getcheckcode').removeClass('dis'); $('.getcheckcode').trigger('click'); }); window.captchaObj = captchaObj; }; $('#captcha').show(); $.ajax({ url: "/login/gtstart?t=" + (new Date()).getTime(), // 加隨機(jī)數(shù)防止緩存 type: "get", dataType: "json", success: function (data) { $('#text').hide(); $('#wait').show(); // 調(diào)用 initGeetest 進(jìn)行初始化 // 參數(shù)1:配置參數(shù) // 參數(shù)2:回調(diào),回調(diào)的第一個參數(shù)驗(yàn)證碼對象,之后可以使用它調(diào)用相應(yīng)的接口 initGeetest({ // 以下 4 個配置參數(shù)為必須,不能缺少 gt: data.gt, challenge: data.challenge, offline: !data.success, // 表示用戶后臺檢測極驗(yàn)服務(wù)器是否宕機(jī) new_captcha: data.new_captcha, // 用于宕機(jī)時表示是新驗(yàn)證碼的宕機(jī) product: "float", // 產(chǎn)品形式,包括:float,popup width: "280px", https: true // 更多配置參數(shù)說明請參見:http://docs.geetest.com/install/client/web-front/ }, handler); } }); } function codeCutdown() { if(_wait == 0){ //倒計(jì)時完成 $(".getcheckcode").removeClass('dis').html("重新獲取"); }else{ $(".getcheckcode").addClass('dis').html("重新獲取("+_wait+"s)"); _wait--; setTimeout(function () { codeCutdown(); },1000); } } function inputValidate(ele,telInput) { var oInput = ele; var inputVal = oInput.val(); var oType = ele.attr('data-type'); var oEtag = $('#etag').val(); var oErr = oInput.closest('.form_box').next('.err_txt'); var empTxt = '請輸入'+oInput.attr('placeholder')+'!'; var errTxt = '請輸入正確的'+oInput.attr('placeholder')+'!'; var pattern; if(inputVal==""){ if(!telInput){ errFun(oErr,empTxt); } return false; }else { switch (oType){ case 'login_mobile': pattern = /^1[3456789]\d{9}$/; if(inputVal.length==11) { $.ajax({ url: '/login/checkmobile', type: "post", dataType: "json", data: { mobile: inputVal, etag: oEtag, page_ur: window.location.href, page_referer: document.referrer }, success: function (data) { } }); } break; case 'login_yzm': pattern = /^\d{6}$/; break; } if(oType=='login_mobile'){ } if(!!validateFun(pattern,inputVal)){ errFun(oErr,'') if(telInput){ $('.getcheckcode').removeClass('dis'); } }else { if(!telInput) { errFun(oErr, errTxt); }else { $('.getcheckcode').addClass('dis'); } return false; } } return true; } function errFun(obj,msg) { obj.html(msg); if(msg==''){ $('.login_submit').removeClass('dis'); }else { $('.login_submit').addClass('dis'); } } function validateFun(pat,val) { return pat.test(val); }