
談?wù)劸W(wǎng)絡(luò)時代大數(shù)據(jù)及分析起訴韓寒小實例
隨著阿里巴巴的上市,馬云成為中國首富,貓眼看人里關(guān)于阿里巴巴的大數(shù)據(jù)分析的內(nèi)容層出不窮。大多是用聳人聽聞的言論,指責(zé)阿里巴巴境外上市導(dǎo)致大數(shù)據(jù)外泄,影響國家安全,對中國經(jīng)濟運行造成不可估量的損失。
很多貓友從以往的常識和邏輯方面判斷能夠得出阿里巴巴的大數(shù)據(jù)并不影響國家安全的結(jié)論,但是,對于大數(shù)據(jù)概念認知比較少,評論起來無從入手。
本文希望用最樸實的語言描述大數(shù)據(jù),讓大家能對大數(shù)據(jù)有基本認識。同時,后面附大數(shù)據(jù)統(tǒng)計的應(yīng)用實例:即通過大數(shù)據(jù)統(tǒng)計分析網(wǎng)友司馬3忌對韓寒起訴的影響。
所謂數(shù)據(jù)統(tǒng)計,就是用統(tǒng)計學(xué)的方法分析概率和趨勢
由于傳統(tǒng)方法無法對每一個終端樣本詳細取樣,導(dǎo)致很多經(jīng)濟社會數(shù)據(jù)只能通過抽樣調(diào)查統(tǒng)計。
例如,收視率調(diào)查。電視臺無法得到每戶家庭的收看節(jié)目的數(shù)據(jù),所以只能抽樣調(diào)查。
在網(wǎng)絡(luò)時代,每一個網(wǎng)絡(luò)服務(wù)提供商不需要做抽樣調(diào)查,而是建立龐大的數(shù)據(jù)庫,記錄一切用戶的行為特征,用這些特征作為數(shù)據(jù)基礎(chǔ)。這就是大數(shù)據(jù),用不同的方式對這些數(shù)據(jù)進行提取、整理、分析的手段就是大數(shù)據(jù)分析。
最簡單的例子就是你打開任何一款炒股軟件,它都是基于大數(shù)據(jù)的。每只股票從上市起所有相關(guān)數(shù)字全部被精準(zhǔn)記錄,從無遺漏。
阿里巴巴的大數(shù)據(jù)是否會影響國家安全?
個人認為不會,并且大數(shù)據(jù)無法隱藏。原因如下:
1.阿里巴巴的大數(shù)據(jù)是每種產(chǎn)品的購買記錄,只說明產(chǎn)品的銷量趨勢。
2.每個公司對自己的大數(shù)據(jù)是企業(yè)的核心資產(chǎn),如美國任何投資者、美國國務(wù)院希望獲得阿里巴巴的大數(shù)據(jù),也需要通過法院的批文,即使拿到,企業(yè)也有權(quán)拒絕。美國國務(wù)院屢次索要用戶資料以便反恐需要都被蘋果拒絕。
3.大數(shù)據(jù)本身就沒有辦法隱藏,如阿里巴巴的產(chǎn)品銷售情況是在每一個商品的展示頁面清楚明白的呈現(xiàn)出來。只要會最簡單的網(wǎng)絡(luò)及編程技術(shù),都可以編寫軟件,借助大型服務(wù)器矩陣,放出無數(shù)爬蟲,對每個頁面進行信息提取和整理,得到大數(shù)據(jù)。
舉個例子:比如如果想獲得貓眼看人的大數(shù)據(jù),用20m光纖寬帶約2天即可完成對整個論壇數(shù)據(jù)的鏡像保存。
4.如中國政府認為被美國搜集了大數(shù)據(jù),一樣可以如前面所述,通過對美國亞馬遜、facebook、推特等進行爬蟲提取搜集信息得到美國的大數(shù)據(jù)進行反制。
接下來通過大數(shù)據(jù)分析 司馬三忌起訴韓寒,對韓寒的影響。
可以看到在10月09日,如紅圈所示,媒體的報道從之前的一平如水,到出現(xiàn)一波小高潮。韓黑是否覺得有點小激動呢?
嘿嘿,上圖只是9月12日到10月11日的。我們換個圖,看看最近半年的大數(shù)據(jù)。
從這張圖就可以看出,司馬三忌起訴韓寒對媒體的影響力。
紅圈1是韓寒的后會無期宣傳期間的媒體報道力度。
紅圈3是司馬三忌起訴的媒體報道力度。
那么,紅圈2比紅圈3的媒體報道力度更大。
紅圈2是9月11日的媒體報道,那一天韓寒發(fā)生了什么事呢?
看下面的圖就一目了然了:
原來司馬三忌起訴的影響力還不如韓寒老婆生二胎,哈哈!
以上就是對大數(shù)據(jù)的介紹和分析,以及實例應(yīng)用。
大數(shù)據(jù)是個好東西,只要隨便挖掘數(shù)據(jù),就可以讓我們對事物的認知突破我們自己視野的局限,起碼不會表現(xiàn)的很愚昧了。
例如很多韓黑認為司馬三忌起訴韓寒,會給韓寒帶來致命打擊。
但大數(shù)據(jù)就告訴我們,我們的認知是局限在只上貓眼,而大數(shù)據(jù)挖掘整個互聯(lián)網(wǎng),互聯(lián)網(wǎng)的大部分媒體關(guān)注國民岳父老婆生二胎更多一點。
同樣,大數(shù)據(jù)也可以有利于作出決策,試著證明如下:
如很多腦殘黑粉所臆想的,關(guān)于韓寒代筆的輿論鋪天蓋地,對韓寒造成很大打擊而事實上,通過挖掘數(shù)據(jù)以韓寒代筆和韓寒 進行分析可以看到, 韓寒代筆的關(guān)注度(藍線)始終是一條接近X軸的直線這說明韓寒代筆的質(zhì)疑的聲音基本沒有變化,不變高,也不變低這也揭示了孜孜不倦的揭示韓寒代筆的這部分聲音沒有減少,沒有增加而韓寒的關(guān)注度隨著他的動向呈現(xiàn)高低起伏。
取韓寒關(guān)注度最低的點,關(guān)注指數(shù)為5720,韓寒代筆的關(guān)注指數(shù)為132,占總關(guān)注比例為2.308%
假如你是韓寒,或者韓寒的經(jīng)紀(jì)公司,那么,你會得出如下結(jié)論:
1.對韓寒代筆的關(guān)注度占的比例只有2%
2.質(zhì)疑韓寒的人是堅決的、持之以恒的,但他們的質(zhì)疑并沒有擴散。
那么,你會做如下論斷和決策:
1.你改變不了質(zhì)疑韓寒的人,他們過去會,未來也會堅持咬定韓寒代筆。
2.上述人群不會變多、也不會變少。
3.你不需要試圖去改變,因為你的試圖的成本和收益不成正比。
4.最好的辦法就是由這些人去質(zhì)疑吧,因為他們只占2%,相比任何一個明星的anti-fan,都不多。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
AI 浪潮下的生存與進階: CDA數(shù)據(jù)分析師—開啟新時代職業(yè)生涯的鑰匙(深度研究報告、發(fā)展指導(dǎo)白皮書) 發(fā)布機構(gòu):CDA數(shù)據(jù)科 ...
2025-07-13LSTM 模型輸入長度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認 ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預(yù)測分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢預(yù)判? ? 在數(shù)據(jù)驅(qū)動決策的時代,預(yù)測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點,而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報考到取證的全攻略? 在數(shù)字經(jīng)濟蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗:捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗:數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認證作為國內(nèi)權(quán)威的數(shù)據(jù)分析能力認證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對策略? 長短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨特的門控機制,在 ...
2025-07-07統(tǒng)計學(xué)方法在市場調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場調(diào)研是企業(yè)洞察市場動態(tài)、了解消費者需求的重要途徑,而統(tǒng)計學(xué)方法則是市場調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動力,CDA(Certifie ...
2025-07-04