99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

熱線電話:13121318867

登錄
首頁精彩閱讀我分析了 6.5W 字的歌詞,看到了這樣的周杰倫!
我分析了 6.5W 字的歌詞,看到了這樣的周杰倫!
2017-05-23
收藏
前一段時間分析民謠歌詞的那邊文章特別火,剛好在研究使用python處理數(shù)據(jù),就也想弄個類似東西練練手。于是乎,拉上自己親妹妹 @張小黑 就開始分工。

一、準備歌詞素材

歌詞選擇:杰倫至今的所有專輯(從最開始的<JAY>到最新的<周杰倫的床邊故事>)
由于爬蟲木有學會,就只能手動收集歌詞。經(jīng)過一系列的google、baidu,終于找到別人整理好的歌詞全集。ok,就這樣歌詞文件搞定了,一共也沒多大,也就207K(想想周董這么多年唱的歌詞大半都在這207K的txt文件里就不免有些感慨)。


二、對歌詞文件完成分詞

這是最難的部分,產(chǎn)品汪只會跟程序猿們相愛相殺,哪會寫代碼呀!??!


沒辦法,硬著頭皮也要寫。網(wǎng)上goolge各種關鍵字,看博客,花了半天的時間,連蒙帶猜,勉勉強強看懂了網(wǎng)上的代碼示例,比著葫蘆畫瓢寫了一點點寫。


千難萬險,終于寫完調(diào)通,最終主要的部分一共也就12行,沒有任何注釋(簡直乞丐版代碼,根本看不出來哪里sexy ~~~~(>_<)~~~~)


三、對分詞的結(jié)果進行分析

好,我們終于到了正文,以上都是廢話,下邊才是重要結(jié)論。(如果以這種方式寫郵件一定會被老板打死 ?(^?^*) )

結(jié)論一:杰倫最喜歡的唱的主題 --- 情歌 (我自己也知道這是廢話 O(∩_∩)O)


拉了下出現(xiàn)頻率 top20的詞語,滿滿的都是文藝、傷感、愛情 :

我們 / 怎么 / 沒有 / 微笑 / 離開 / 愛情 / 回憶 / 不要 / 開始 / 如果 / 怎么 / 開始
我擦,感覺隨機排列組合都能成歌詞,方文山以后是不是就可以下崗了 ?(^?^*)

結(jié)論二:杰倫喜歡媽媽勝過爸爸,喜歡外婆勝過爺爺以及外公(歌詞中沒有出現(xiàn)奶奶)


大家應該都聽過<聽媽媽的話>。

杰倫專門為外婆寫了一首歌<外婆>,其中也就1句歌詞提到了外公。

至于爺爺,杰倫也有那首<爺爺泡的茶>

結(jié)論三:杰倫喜歡黑色、白色勝過其他顏色


很符合周董的形象,歌詞里高大上的黑色&白色力壓其他顏色??吹胶诎變缮l率這么高,我第一時間想到的是<以父之名>,感覺很符合那個氣質(zhì)。還有就是青色出現(xiàn)了6次,大概率是因為<青花瓷>吧。

結(jié)論四:杰倫最喜歡的語氣詞是 oh~


毋庸置疑,杰倫最喜歡 oh~ ,排除大小寫的因素,[oh] 出現(xiàn)的頻率甚至超過 [我們] 成為出現(xiàn)詞頻最高的詞匯。此外杰倫經(jīng)典的 "哎呦不錯哦~" 中的 [哎呦] 也名列前茅,看來杰倫真的很喜歡講這句話。

總結(jié):只是從歌詞來看,大概杰倫就是一個穿著黑白帽衫,表面上酷酷的,但是骨子里滿是深情、文藝, 只喜歡喝爺爺泡的茶,聽媽媽的話,愛自己外婆的 ,嘴里時不時地冒出一句‘哎呦,不錯哦’ 的 五好青年 ^_^

注:以上內(nèi)容純屬胡說八道,如有雷同,純屬巧合。


作者  張東鑫
本文轉(zhuǎn)自雷鋒網(wǎng),轉(zhuǎn)載需授權(quán)


數(shù)據(jù)分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數(shù)據(jù)分析師資訊
更多

OK
客服在線
立即咨詢
客服在線
立即咨詢
') } function initGt() { var handler = function (captchaObj) { captchaObj.appendTo('#captcha'); captchaObj.onReady(function () { $("#wait").hide(); }).onSuccess(function(){ $('.getcheckcode').removeClass('dis'); $('.getcheckcode').trigger('click'); }); window.captchaObj = captchaObj; }; $('#captcha').show(); $.ajax({ url: "/login/gtstart?t=" + (new Date()).getTime(), // 加隨機數(shù)防止緩存 type: "get", dataType: "json", success: function (data) { $('#text').hide(); $('#wait').show(); // 調(diào)用 initGeetest 進行初始化 // 參數(shù)1:配置參數(shù) // 參數(shù)2:回調(diào),回調(diào)的第一個參數(shù)驗證碼對象,之后可以使用它調(diào)用相應的接口 initGeetest({ // 以下 4 個配置參數(shù)為必須,不能缺少 gt: data.gt, challenge: data.challenge, offline: !data.success, // 表示用戶后臺檢測極驗服務器是否宕機 new_captcha: data.new_captcha, // 用于宕機時表示是新驗證碼的宕機 product: "float", // 產(chǎn)品形式,包括:float,popup width: "280px", https: true // 更多配置參數(shù)說明請參見:http://docs.geetest.com/install/client/web-front/ }, handler); } }); } function codeCutdown() { if(_wait == 0){ //倒計時完成 $(".getcheckcode").removeClass('dis').html("重新獲取"); }else{ $(".getcheckcode").addClass('dis').html("重新獲取("+_wait+"s)"); _wait--; setTimeout(function () { codeCutdown(); },1000); } } function inputValidate(ele,telInput) { var oInput = ele; var inputVal = oInput.val(); var oType = ele.attr('data-type'); var oEtag = $('#etag').val(); var oErr = oInput.closest('.form_box').next('.err_txt'); var empTxt = '請輸入'+oInput.attr('placeholder')+'!'; var errTxt = '請輸入正確的'+oInput.attr('placeholder')+'!'; var pattern; if(inputVal==""){ if(!telInput){ errFun(oErr,empTxt); } return false; }else { switch (oType){ case 'login_mobile': pattern = /^1[3456789]\d{9}$/; if(inputVal.length==11) { $.ajax({ url: '/login/checkmobile', type: "post", dataType: "json", data: { mobile: inputVal, etag: oEtag, page_ur: window.location.href, page_referer: document.referrer }, success: function (data) { } }); } break; case 'login_yzm': pattern = /^\d{6}$/; break; } if(oType=='login_mobile'){ } if(!!validateFun(pattern,inputVal)){ errFun(oErr,'') if(telInput){ $('.getcheckcode').removeClass('dis'); } }else { if(!telInput) { errFun(oErr, errTxt); }else { $('.getcheckcode').addClass('dis'); } return false; } } return true; } function errFun(obj,msg) { obj.html(msg); if(msg==''){ $('.login_submit').removeClass('dis'); }else { $('.login_submit').addClass('dis'); } } function validateFun(pat,val) { return pat.test(val); }