
2015年對(duì)于大數(shù)據(jù)來說,是個(gè)值得紀(jì)念的一年,大數(shù)據(jù)在這一年得到了認(rèn)可。同時(shí),這一年中也經(jīng)歷了很多發(fā)展的低潮,這就像是一次次的警 告,或許某一天大數(shù)據(jù)就不再具有改變世界的力量了。因此讓我們一起來回顧一下今年最重要或者最具價(jià)值的相關(guān)新聞,一起回味這一年大數(shù)據(jù)發(fā)展所經(jīng)歷的起起落 落。
一月
2015 年,全球通過手機(jī)或移動(dòng)裝置接入互聯(lián)網(wǎng)的用戶超過了通過電腦或者筆記本接入電腦的用戶。其實(shí)移動(dòng)網(wǎng)絡(luò)的用戶在 2014 年后期就超過了通過臺(tái)式電腦訪問網(wǎng)絡(luò)的用戶,而這種用戶習(xí)慣的改變對(duì)于 App 設(shè)計(jì)人員、公司甚至政府如何收集數(shù)據(jù)都會(huì)產(chǎn)生巨大的影響。2015 年伊始,就有 Microsoft 購(gòu)買 Revolution Analytics 公司。開源程序語(yǔ)言將會(huì)成為統(tǒng)計(jì)計(jì)算和預(yù)測(cè)分析領(lǐng)域最流行的語(yǔ)言。大規(guī)模數(shù)據(jù)泄露(其規(guī)模和頻率在過去十年間以指數(shù)形式增長(zhǎng))并沒有減弱的趨勢(shì)。美國(guó)政府 在今年年初就宣布,400 萬(wàn)政府雇員的信息被人通過人事管理局竊取。
二月
白宮發(fā)布的一份關(guān)于“大數(shù)據(jù)創(chuàng)造的機(jī)會(huì)和危機(jī)”的報(bào)告總結(jié)了雖然當(dāng)今技術(shù)為大數(shù)據(jù)的發(fā)展和改變提供了無法估量的潛力,但是仍然有很多 與隱私和數(shù)據(jù)保護(hù)相關(guān)的問題亟待解決。該報(bào)告還提到,《消費(fèi)者隱私權(quán)利法案》(也稱為“請(qǐng)勿追蹤”的法規(guī))的持續(xù)發(fā)展更為重要。這意味著法律賦予了個(gè)人這 樣的權(quán)利——你可以拒絕另一個(gè)人或者組織來追蹤以及記錄你的個(gè)人信息。
三月
IBM 宣布將會(huì)在接下來的四年中向物聯(lián)網(wǎng)技術(shù)投資 30 億美元。所有設(shè)備可以對(duì)話、在線分享信息、并且可以互動(dòng),從而使得我們的生活更加輕松的概念在 2015 年仍然非常重要,IBM 將會(huì)致力于在實(shí)時(shí)分析領(lǐng)域取得新突破。
四月
期待已久的 Apple Watch 終于問世了,并且迅速成為了全球首款人人“必備”的物聯(lián)網(wǎng)裝 置。自從上市以來,盡管人們知道在上市當(dāng)天的 6 小時(shí)內(nèi)有 100 萬(wàn)的訂單(大致相當(dāng)于 iPad 一個(gè)月的銷量,iPhone 兩個(gè)月的銷量。),但是 Apple 一直對(duì) Apple Watch 的銷量守口如瓶。大數(shù)據(jù)這個(gè)“池塘”的“幾條大魚”推出了新的服務(wù)或者對(duì)原服務(wù)進(jìn)行了擴(kuò)展,其中亞馬遜網(wǎng)頁(yè)服務(wù)(AWS)宣布其客戶將很快可以通過亞馬遜 機(jī)器學(xué)習(xí)體驗(yàn)到機(jī)器學(xué)習(xí)的優(yōu)勢(shì),與之相對(duì)的具有機(jī)器學(xué)習(xí)產(chǎn)品的公司包括微軟小冰和 IBM 的沃森,以及 Google。
五月
Computing Research (計(jì)算研究) 發(fā)布了“2015 大數(shù)據(jù)市場(chǎng)評(píng)論”,該評(píng)論發(fā)現(xiàn)在過去的一年中,沒有將大數(shù)據(jù)和大數(shù)據(jù)分析集成到其運(yùn)營(yíng)過程的企業(yè)的比例從 33% 降到了 16%。在對(duì) 400 位各行各業(yè)的決策者(包括政府、零售商、金融服務(wù)、科技和教育領(lǐng)域)的調(diào)查中,76% 的人認(rèn)為他們的組織分析更多集中于內(nèi)部運(yùn)營(yíng)數(shù)據(jù)而不是外部數(shù)據(jù)。
六月
德國(guó)總理默克爾提醒德國(guó)國(guó)內(nèi)民眾不需要擔(dān)心公共數(shù)據(jù)的收集,以及在全球大數(shù)據(jù)淘金熱中德國(guó)被落下的風(fēng)險(xiǎn)。在柏林的一次會(huì)議中,默克爾說道,“無論誰(shuí)將數(shù)據(jù)視為威脅,或者認(rèn)為每一份數(shù)據(jù)都可能意味著一份破壞,這樣的人將永遠(yuǎn)無法利用數(shù)字化所潛藏的巨大優(yōu)勢(shì)?!?
七月
繼 2014 年企業(yè)數(shù)據(jù)丟失和被盜案件頻繁發(fā)生之后,2015 年再次成為大規(guī)模數(shù)據(jù)泄露事件頻發(fā)的一年。今年 7 月交友網(wǎng)站 Ashley Maddison 遭到大規(guī)模攻擊。使得該事件如此受關(guān)注的原因是由于該網(wǎng)站的天性造成的,因?yàn)檫@有可能與人們對(duì)家庭的忠誠(chéng)聯(lián)系起來。這些被盜數(shù)據(jù)潛在的色情內(nèi)容使得這成為 了一個(gè)大事件,同時(shí)手機(jī)零售商 Carphone Warehouse、集資網(wǎng)站 Patreon、電信運(yùn)營(yíng)商 T-Mobile、醫(yī)療服務(wù)提供商 Anthem 和信貸資料服務(wù)機(jī)構(gòu)等也有數(shù)百萬(wàn)顧客成為受害者。
八月
中國(guó)零售商和網(wǎng)絡(luò)服務(wù)商阿里巴巴推出阿里云,這也是阿里巴巴自己的云分析系統(tǒng),該系統(tǒng)允許企業(yè)可以在自己的硬件上以機(jī)器學(xué)習(xí)為技術(shù)基 礎(chǔ)進(jìn)行數(shù)據(jù)分析。這也是向西方科技巨頭看齊的一步,因?yàn)槲鞣娇萍季揞^已經(jīng)全部推出了自己的大數(shù)據(jù)服務(wù)系統(tǒng)。阿里巴巴將阿里云視為“中國(guó)第一個(gè)人工智能平 臺(tái)”,并稱其可以在 6 小時(shí)內(nèi)處理 100PB 的數(shù)據(jù),相當(dāng)于 1 億部高清電影。
九月
歐洲隱私保護(hù)活動(dòng)家在本月慶祝了一項(xiàng)勝利——?dú)W盟法院宣布所謂的“安全港”的協(xié)議無效。在奧地利隱私保護(hù)倡導(dǎo)者 Max Schrem 起訴 Facebook 的案例中,鑒于斯諾登案件的啟示,美國(guó)公司關(guān)于保護(hù)歐洲公民數(shù)據(jù)隱私的承諾并沒有保障。此案對(duì)于任何美國(guó)和歐洲之間基于數(shù)據(jù)傳輸?shù)臉I(yè)務(wù)都有深遠(yuǎn)意義。
十月
史上最大的科技交易發(fā)生在本月。硬件制造商戴爾宣布其將斥資 670 億美元收購(gòu)數(shù)據(jù)存儲(chǔ)、云計(jì)算和分析供應(yīng)商 EMC 及其子公司——虛擬化技術(shù)專家 VMWare。
十一月
英國(guó)金融行為監(jiān)管局(FCA)宣布將調(diào)查保險(xiǎn)公司對(duì)于大數(shù)據(jù)的使用行為。FCA 將深入調(diào)查客戶數(shù)據(jù)(通過大規(guī)模收集和分析獲得)的日益增加的使用行為,尤其是作為保險(xiǎn)費(fèi)收費(fèi)標(biāo)準(zhǔn)的參考方面的用途。將要解決的問題包括以大數(shù)據(jù)為基礎(chǔ)的 保險(xiǎn)費(fèi)收費(fèi)標(biāo)準(zhǔn)是否會(huì)導(dǎo)致保險(xiǎn)公司會(huì)根據(jù)投保人采取歧視性做法。
十二月
歐洲在政府和公司應(yīng)該如何對(duì)待個(gè)人數(shù)據(jù)方面邁出了重要步伐?!锻ㄓ脭?shù)據(jù)保護(hù)條例》(GDPR)草案獲得通過,接下來的三年是進(jìn)一步討 論和研究。該法案將會(huì)對(duì)個(gè)人數(shù)據(jù)的使用設(shè)置更為嚴(yán)厲的規(guī)則。更重要的是,該草案(有望在 2017 年成為法律)強(qiáng)調(diào)公司在收集個(gè)人數(shù)據(jù)時(shí),必須獲得數(shù)據(jù)所有者的允許,并且只能將數(shù)據(jù)用于已經(jīng)被允許的方面。任何誘導(dǎo)用戶對(duì)數(shù)據(jù)授權(quán)的做法(例如進(jìn)行某些操 作就意味著同意等的做法)將會(huì)被取締,而違反相關(guān)規(guī)定的公司將要繳納其全球收入的 4% 作為罰款。
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
訓(xùn)練與驗(yàn)證損失驟升:機(jī)器學(xué)習(xí)訓(xùn)練中的異常診斷與解決方案 在機(jī)器學(xué)習(xí)模型訓(xùn)練過程中,“損失曲線” 是反映模型學(xué)習(xí)狀態(tài)的核心指 ...
2025-09-19解析 DataHub 與 Kafka:數(shù)據(jù)生態(tài)中兩類核心工具的差異與協(xié)同 在數(shù)字化轉(zhuǎn)型加速的今天,企業(yè)對(duì)數(shù)據(jù)的需求已從 “存儲(chǔ)” 轉(zhuǎn)向 “ ...
2025-09-19CDA 數(shù)據(jù)分析師:讓統(tǒng)計(jì)基本概念成為業(yè)務(wù)決策的底層邏輯 統(tǒng)計(jì)基本概念是商業(yè)數(shù)據(jù)分析的 “基礎(chǔ)語(yǔ)言”—— 從描述數(shù)據(jù)分布的 “均 ...
2025-09-19CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫(kù)表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-19SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實(shí)戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫(kù)管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動(dòng)態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價(jià)值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫(kù)表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實(shí)戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫(kù))處理 Excel 數(shù)據(jù)時(shí),“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗(yàn)與 t 檢驗(yàn):差異、適用場(chǎng)景與實(shí)踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計(jì)學(xué)領(lǐng)域,假設(shè)檢驗(yàn)是驗(yàn)證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計(jì)劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計(jì)劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對(duì)象的 text 與 content:區(qū)別、場(chǎng)景與實(shí)踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請(qǐng)求開發(fā)時(shí)(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價(jià)值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫(kù)表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請(qǐng)求工具對(duì)比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請(qǐng)求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)的科學(xué)計(jì)數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)時(shí)的科學(xué)計(jì)數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價(jià)值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營(yíng)問題、提升執(zhí)行效率的核心手段,其價(jià)值 ...
2025-09-12用 SQL 驗(yàn)證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實(shí)戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計(jì)” 與 “用戶體驗(yàn) ...
2025-09-11塔吉特百貨孕婦營(yíng)銷案例:數(shù)據(jù)驅(qū)動(dòng)下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當(dāng)下,精準(zhǔn)營(yíng)銷成為企業(yè)突圍的核心方 ...
2025-09-11