
“大數(shù)據(jù)時(shí)代”是最好的時(shí)代也是最壞的時(shí)代(3)
“這是一個(gè)數(shù)據(jù)的時(shí)代,什么都要靠數(shù)據(jù)說話,數(shù)據(jù)是必須的?!?/span>
C.與專家對(duì)話“大數(shù)據(jù)”
為了對(duì)大數(shù)據(jù)有一個(gè)更全面和準(zhǔn)確的理解,記者找到了嘉興學(xué)院計(jì)算機(jī)系主任何豐教授,他眼里的“大數(shù)據(jù)”扮演的是怎么樣的角色?
記者:什么是大數(shù)據(jù)?
何豐:我們的生活中,時(shí)時(shí)刻刻在產(chǎn)生數(shù)據(jù),只是我們平常沒有留意到而已。國際數(shù)據(jù)公司(IDC)的研究結(jié)果表明,2008年全球產(chǎn)生的數(shù)據(jù)量為0.49ZB(澤字節(jié),等于270字節(jié)),2009年的數(shù)據(jù)量為0.8ZB,2010年增長(zhǎng)為1.2ZB,2011年的數(shù)量更是高達(dá)1.82ZB,相當(dāng)于全球每人產(chǎn)生200GB以上的數(shù)據(jù)。而到2012年為止,人類生產(chǎn)的所有印刷材料的數(shù)據(jù)量是200PB(拍字節(jié),等于250字節(jié)),全人類歷史上說過的所有話的數(shù)據(jù)量大約是5EB(艾字節(jié),等于260字節(jié))。IBM的研究稱,整個(gè)人類文明所獲得的全部數(shù)據(jù)中,有90%是過去兩年內(nèi)產(chǎn)生的。而到了2020年,全世界所產(chǎn)生的數(shù)據(jù)規(guī)模將達(dá)到今天的44倍。
大數(shù)據(jù)就是需要人們通過對(duì)數(shù)據(jù)的采集、分析、管理等手段,讓原本淹沒在數(shù)據(jù)海洋中的信息浮出水面,為生活提供信息和知識(shí)。
大數(shù)據(jù)并不是一個(gè)現(xiàn)成的數(shù)據(jù)庫,而是個(gè)人在不同的網(wǎng)上操作后留下數(shù)據(jù),這些數(shù)據(jù)經(jīng)過分析整合后,能形成對(duì)個(gè)人特性的描述。簡(jiǎn)單來說,例如一個(gè)人既上了淘寶,又瀏覽了新聞,發(fā)了微博,還與朋友發(fā)了郵件,這種種的網(wǎng)上行為,都是數(shù)據(jù),將它們整合起來,就能獲取此人的喜好、所在地、近況等種種信息。
記者:大數(shù)據(jù)的作用具體有哪些?
何豐:大數(shù)據(jù)為人們提供的,是一種工具,目的是方便生活,其本質(zhì)是追求更好的服務(wù)。
例如我們?cè)诰W(wǎng)購時(shí),頁面下方常常會(huì)跳出來“看了該寶貝的人還看了”、“買了該寶貝的人還買了”這些選項(xiàng),這其實(shí)是調(diào)用了別人的數(shù)據(jù);而第二天我們就會(huì)發(fā)現(xiàn),在瀏覽別的網(wǎng)頁時(shí),“Google提供的廣告”中,會(huì)出現(xiàn)我們前一天想要購買的東西,這其實(shí)是我們自己的數(shù)據(jù)被記錄和運(yùn)用了。
電商或網(wǎng)站能根據(jù)用戶的喜好、行為規(guī)律來提供特定的服務(wù)。用戶喜歡什么,它就推送什么,達(dá)到精準(zhǔn)營銷。
記者:數(shù)據(jù)的取得者們是通過何種渠道獲取數(shù)據(jù)的?
何豐:一是通過電腦,二是手機(jī)。在我國,電腦方面的大數(shù)據(jù)處理較手機(jī)成熟,手機(jī)大多仍停留在位置服務(wù)層面。
比如團(tuán)購網(wǎng)站,就會(huì)根據(jù)用戶所在的位置,為其提供附近的餐飲、娛樂等信息,這些信息也極有可能是針對(duì)該用戶個(gè)性化細(xì)分的,因?yàn)樗綍r(shí)的搜索項(xiàng)數(shù)據(jù)都已被記錄下來。而社交網(wǎng)站上,常有“附近的人”、“周邊”等選項(xiàng),也都是利用了手機(jī)的定位數(shù)據(jù)而為用戶提供的服務(wù)。
記者:大數(shù)據(jù)時(shí)代會(huì)如何改變我們的生活?
何豐:如今,所有的活動(dòng)都可以被數(shù)據(jù)化,相比過去,現(xiàn)在的數(shù)據(jù)在層次上、范圍上都要深層、廣泛得多。過去的信息是局部的、零散的,現(xiàn)在的信息則是全面的、準(zhǔn)確的,這中間有一個(gè)整合提煉的過程。由于大數(shù)據(jù)的出現(xiàn),使得服務(wù)的范圍和對(duì)象都有所改變。
具體到生活中,這樣的改變有很多。有人舉例說:通過大數(shù)據(jù),醫(yī)療機(jī)構(gòu)能實(shí)時(shí)監(jiān)測(cè)用戶的身體健康狀況;
教育機(jī)構(gòu)有針對(duì)性的制定用戶喜歡的教育培訓(xùn)計(jì)劃;
社交網(wǎng)絡(luò)能提供合適的交友對(duì)象,并為志同道合的人群組織各種聚會(huì)活動(dòng);
政府能在用戶的心理健康出現(xiàn)問題時(shí)有效干預(yù),防范自殺、刑事案件的發(fā)生;
金融機(jī)構(gòu)能幫助用戶進(jìn)行有效的理財(cái)管理,為用戶的資金提供更有效的使用建議和規(guī)劃;
道路交通、汽車租賃及運(yùn)輸行業(yè)可以為用戶提供更合適的出行線路和路途服務(wù)安排。
記者:是否存在隱私泄露的問題?應(yīng)該如何最大程度保護(hù)自己的隱私?
何豐:的確會(huì)有隱私泄露的問題。因?yàn)橹灰行畔⒔换?,就一定?huì)有數(shù)據(jù)留下,所以一不注意,自己的信息就會(huì)散布各地。
因此針對(duì)用戶來說,一定要培養(yǎng)自己的保密意識(shí),不要在公共網(wǎng)絡(luò)環(huán)境下留下個(gè)人信息,多選擇可信的網(wǎng)絡(luò)環(huán)境。
其次,服務(wù)的提供商要嚴(yán)格遵守相關(guān)規(guī)定,保證不泄露用戶的個(gè)人隱私。許多網(wǎng)站是需要實(shí)名認(rèn)證的,例如購買機(jī)票、火車票,而有的服務(wù)則是關(guān)系錢財(cái)?shù)?,如移?dòng)支付,這些針對(duì)特定服務(wù)提供的信息,若整合到一起,再被不法分子利用,那么后果不堪設(shè)想。
再次,相關(guān)部門也應(yīng)該加強(qiáng)監(jiān)管。
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
LSTM 模型輸入長(zhǎng)度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長(zhǎng)序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報(bào)考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計(jì)的實(shí)用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強(qiáng)大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實(shí)施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價(jià)值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡(jiǎn)稱 BI)深度融合的時(shí)代,BI ...
2025-07-10SQL 在預(yù)測(cè)分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢(shì)預(yù)判? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代,預(yù)測(cè)分析作為挖掘數(shù)據(jù)潛在價(jià)值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價(jià)值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點(diǎn),而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報(bào)考到取證的全攻略? 在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭(zhēng)搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢(shì)性檢驗(yàn):捕捉數(shù)據(jù)背后的時(shí)間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢(shì)性檢驗(yàn)如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時(shí)間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時(shí)間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實(shí)戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗(yàn):數(shù)據(jù)趨勢(shì)與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢(shì)變化以及識(shí)別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對(duì)策略? 長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨(dú)特的門控機(jī)制,在 ...
2025-07-07統(tǒng)計(jì)學(xué)方法在市場(chǎng)調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場(chǎng)調(diào)研是企業(yè)洞察市場(chǎng)動(dòng)態(tài)、了解消費(fèi)者需求的重要途徑,而統(tǒng)計(jì)學(xué)方法則是市場(chǎng)調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動(dòng)力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動(dòng)力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價(jià)值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03