99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

熱線電話:13121318867

登錄
首頁精彩閱讀知乎核心用戶大數(shù)據(jù)報(bào)告
知乎核心用戶大數(shù)據(jù)報(bào)告
2017-01-24
收藏
最近寫了個(gè)爬蟲,將知乎 3W 核心用戶的公開資料爬了下來。雖然知乎聲稱注冊(cè)用戶有 6500 萬,日活躍用戶有 1850 萬,但其中很大一部分用戶是三無用戶。由于該部分用戶公開的數(shù)據(jù)并不多,再且新版知乎服務(wù)器對(duì)于單 IP 最大請(qǐng)求量有限制(大概每秒一次左右),所以我只爬了最核心的 3W 用戶。

我的爬蟲規(guī)則是這樣的:從關(guān)注量上萬的知乎大 V 中隨機(jī)抽取 10 個(gè)作為種子,依次爬取其關(guān)注的人,再從其關(guān)注的人爬取關(guān)注的人的關(guān)注的人,如此遞歸。也就是說爬蟲的規(guī)則保證了進(jìn)入數(shù)據(jù)庫的每一個(gè)人至少有一個(gè)關(guān)注者。以下的數(shù)據(jù)分析均來自于爬蟲所得到的資料,所以要是報(bào)道上面出了偏差,還請(qǐng)大家見諒。

首先是對(duì)知乎用戶的職業(yè)描述進(jìn)行詞云分析,列出前一百的高頻詞,結(jié)果如下。


在職業(yè)描述中進(jìn)行高頻詞分析,“互聯(lián)網(wǎng)”以 4552 次頻率完勝,然后是”大學(xué)“緊隨其后,其頻率是 2163 。這和我們平時(shí)所看到的互聯(lián)網(wǎng)從業(yè)者和名校學(xué)生占領(lǐng)內(nèi)容輸出的主力一致。這一百個(gè)高頻詞也囊括了知乎用戶的興趣,居住地等信息,不過這些我們以后還會(huì)仔細(xì)分析。

我們先來看看知乎的各種“最”。最高贊同數(shù),最多關(guān)注者,寫得最多答案,分別是哪些呢?

首先是最高贊同數(shù)的排行榜。


在贊同數(shù)上面, @張佳瑋 老師以一己之力超越了第二名一倍不止,可謂是穩(wěn)拿的冠軍。然后前五名是 @肥肥貓 ,@朱炫 ,@唐缺 ,@馬前卒 。輪子哥排在了第六名。 

然后我們來看最多關(guān)注者排行榜


在關(guān)注者排行榜上, @張佳瑋 老師還是遙遙領(lǐng)先于 @李開復(fù) 老師。再往后走就是知乎的大佬 @黃繼新 和 @周源 ,再往后是 @yolfilm 。

我們?cè)賮砜磳懙?strong>答案最多排行榜。


@Phil  以極高的產(chǎn)量勇奪答案數(shù)最高 Top1,而素有”輪帶逛“之稱的 @vczh 只能屈居第二。排行前五的有 @王若楓 、@柴健翌 、@zhen-liang 等大 V 。

再來看看提問最多排行榜。


@David Chang  以 2684 個(gè)提問排行第一,以未來知識(shí)圖譜聞名的 @圖靈Don  排行第二。排行前五的還有 @歆鹽 , @程瀚 、 @張亮 。

然后是 BAT 三廠的員工數(shù)量比較,這個(gè)比較基于爬取到的的用戶職業(yè)描述詞頻進(jìn)行統(tǒng)計(jì)。


可以看到鵝廠員工在知乎比例最高,阿里次之(詞頻: 0.004554 ),熊廠稍稍落后。

都說知乎是 985 / 211 滿天飛的地方,那么清北復(fù)交浙到底哪家強(qiáng)呢? 


可以看到北京大學(xué)和清華大學(xué)的詞頻不相上下,后面那三位還需加把勁啊。

在移動(dòng)智能時(shí)代,Android 、iOS 、WEB 前端工程師在當(dāng)今軟件開發(fā)中簡(jiǎn)直大放異彩。那么知乎哪一種程序員最多呢?


結(jié)果是前端詞頻遠(yuǎn)高于 Android 和 iOS ,其實(shí)差那么一點(diǎn)點(diǎn)就是 Android 和 iOS 的和了。這么說吧,你可能是堅(jiān)定喬布斯 less is more 信念的果粉,也可能是擁抱開源的 Android 粉,可是所有人都需要瀏覽網(wǎng)頁,不是嗎:)

然后我還比較好奇知乎用戶的普遍興趣愛好是什么。


結(jié)果發(fā)現(xiàn)健身獨(dú)占鰲頭般占領(lǐng)榜首??磥碇跎线€是普遍推崇健身提高顏值提高自身吸引力??墒菫槭裁撮喿x的比例是最底的呢?為此我只能假設(shè)知乎上的同學(xué)學(xué)習(xí)效率都比較高,在完成基本的閱讀任務(wù)后去了另外的領(lǐng)域探索更大的世界。又或者說閱讀,相對(duì)于旅游健身攝影來說,對(duì)于提升自身的價(jià)值性價(jià)比并不是很高,因而大家更傾向于去健身房,去旅游,去拍照吧。

知乎用戶地域分布。


詞頻集中分布在北上廣深杭四川浙江江蘇等地方。和個(gè)人的主觀印象是相似的。畢竟以上顏色較深的都是互聯(lián)網(wǎng)行業(yè)比較發(fā)達(dá)的省份。

然后就是大家最關(guān)心的知乎男女比例問題了。 



在爬到的用戶數(shù)據(jù)中,男性比例占了67.8%,女性只占了32.2%。也就是說男女比例比2:1還要大。

看到這里,你可能會(huì)反駁我說知乎初始用戶的性別就是男性啊,這樣子搞個(gè)大新聞是不行的。我也覺得挺有道理的,于是進(jìn)一步篩選了核心中的核心部分用戶,篩選條件為粉絲數(shù)大于200且贊同數(shù)大于400的用戶,這下采樣應(yīng)該準(zhǔn)確了吧。然后有了下圖。


女性的比例降到了30.1%,男性比例相應(yīng)為69.9%。這個(gè)數(shù)據(jù)比之前的數(shù)據(jù)更為不平衡。所以說女性用戶在知乎更為稀缺,也顯得更為珍貴。

所以,與其說知乎是一個(gè)高質(zhì)量的問答社區(qū),還不如說: 



作者:彭家進(jìn)
來源:知乎


數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼

若不方便掃碼,搜微信號(hào):CDAshujufenxi

數(shù)據(jù)分析師資訊
更多

OK
客服在線
立即咨詢
客服在線
立即咨詢
') } function initGt() { var handler = function (captchaObj) { captchaObj.appendTo('#captcha'); captchaObj.onReady(function () { $("#wait").hide(); }).onSuccess(function(){ $('.getcheckcode').removeClass('dis'); $('.getcheckcode').trigger('click'); }); window.captchaObj = captchaObj; }; $('#captcha').show(); $.ajax({ url: "/login/gtstart?t=" + (new Date()).getTime(), // 加隨機(jī)數(shù)防止緩存 type: "get", dataType: "json", success: function (data) { $('#text').hide(); $('#wait').show(); // 調(diào)用 initGeetest 進(jìn)行初始化 // 參數(shù)1:配置參數(shù) // 參數(shù)2:回調(diào),回調(diào)的第一個(gè)參數(shù)驗(yàn)證碼對(duì)象,之后可以使用它調(diào)用相應(yīng)的接口 initGeetest({ // 以下 4 個(gè)配置參數(shù)為必須,不能缺少 gt: data.gt, challenge: data.challenge, offline: !data.success, // 表示用戶后臺(tái)檢測(cè)極驗(yàn)服務(wù)器是否宕機(jī) new_captcha: data.new_captcha, // 用于宕機(jī)時(shí)表示是新驗(yàn)證碼的宕機(jī) product: "float", // 產(chǎn)品形式,包括:float,popup width: "280px", https: true // 更多配置參數(shù)說明請(qǐng)參見:http://docs.geetest.com/install/client/web-front/ }, handler); } }); } function codeCutdown() { if(_wait == 0){ //倒計(jì)時(shí)完成 $(".getcheckcode").removeClass('dis').html("重新獲取"); }else{ $(".getcheckcode").addClass('dis').html("重新獲取("+_wait+"s)"); _wait--; setTimeout(function () { codeCutdown(); },1000); } } function inputValidate(ele,telInput) { var oInput = ele; var inputVal = oInput.val(); var oType = ele.attr('data-type'); var oEtag = $('#etag').val(); var oErr = oInput.closest('.form_box').next('.err_txt'); var empTxt = '請(qǐng)輸入'+oInput.attr('placeholder')+'!'; var errTxt = '請(qǐng)輸入正確的'+oInput.attr('placeholder')+'!'; var pattern; if(inputVal==""){ if(!telInput){ errFun(oErr,empTxt); } return false; }else { switch (oType){ case 'login_mobile': pattern = /^1[3456789]\d{9}$/; if(inputVal.length==11) { $.ajax({ url: '/login/checkmobile', type: "post", dataType: "json", data: { mobile: inputVal, etag: oEtag, page_ur: window.location.href, page_referer: document.referrer }, success: function (data) { } }); } break; case 'login_yzm': pattern = /^\d{6}$/; break; } if(oType=='login_mobile'){ } if(!!validateFun(pattern,inputVal)){ errFun(oErr,'') if(telInput){ $('.getcheckcode').removeClass('dis'); } }else { if(!telInput) { errFun(oErr, errTxt); }else { $('.getcheckcode').addClass('dis'); } return false; } } return true; } function errFun(obj,msg) { obj.html(msg); if(msg==''){ $('.login_submit').removeClass('dis'); }else { $('.login_submit').addClass('dis'); } } function validateFun(pat,val) { return pat.test(val); }