99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

熱線電話:13121318867

登錄
首頁(yè)職業(yè)發(fā)展讀書(shū)筆記 | 大數(shù)據(jù)時(shí)代
讀書(shū)筆記 | 大數(shù)據(jù)時(shí)代
2017-02-17
收藏

讀書(shū)筆記 | 大數(shù)據(jù)時(shí)代

大數(shù)據(jù)這個(gè)概念在最近這幾年很火,大家也大概知道大數(shù)據(jù)到底是個(gè)什么東西,它是如何運(yùn)作的。現(xiàn)在好多產(chǎn)品上面都會(huì)有“猜你喜歡”這一功能,這就是利用大數(shù)據(jù)實(shí)現(xiàn)的。我們每天都在利用大數(shù)據(jù)或被大數(shù)據(jù)利用,但是我們當(dāng)中應(yīng)該沒(méi)有多少人真正知道大數(shù)據(jù)時(shí)代給我們帶來(lái)什么改變。這本書(shū)主要從大數(shù)據(jù)帶來(lái)的思維變革、商業(yè)變革、管理變革三個(gè)方面來(lái)寫。我主要會(huì)把這本書(shū)中的思維變革和商業(yè)變革寫出來(lái)(因管理變革目前我們中大部分人還用不到,所以就先不寫),本篇寫思維變革、商業(yè)變革下篇連載。

本書(shū)框架圖

思維變革

1.要全體數(shù)據(jù)、不要樣本

在信息處理能力受限的年代,世界需要數(shù)據(jù)分析,卻缺少用來(lái)分析所收集數(shù)據(jù)的工具,所以只能用隨機(jī)抽樣的方式進(jìn)行數(shù)據(jù)分析。

但是真正的大數(shù)據(jù)時(shí)代是指不用隨機(jī)分析法這樣的捷徑,而采用所有數(shù)據(jù)的分析方法。通過(guò)觀察所有數(shù)據(jù),來(lái)尋找異常值進(jìn)行分析。

比如:信用卡詐騙是通過(guò)異常情況來(lái)識(shí)別的,只有掌握了所有數(shù)據(jù)才能做到這一點(diǎn),在這種情況下,異常值是最有用的信息,你可以把他與正常交易情況作對(duì)比從而發(fā)現(xiàn)問(wèn)題。

2.要效率、不要精確性

在如今的信息時(shí)代。我們掌握的數(shù)據(jù)庫(kù)越來(lái)越全面,她不再只包括我們手頭那一點(diǎn)可憐的數(shù)據(jù),而是包括了與這些現(xiàn)象相關(guān)的大量甚至全部的數(shù)據(jù)。數(shù)據(jù)量的大幅增加會(huì)造成結(jié)果的不準(zhǔn)確,與此同時(shí),一些錯(cuò)誤的數(shù)據(jù)也會(huì)混進(jìn)數(shù)據(jù)庫(kù)。但是正因?yàn)槲覀冋莆樟藥缀跛械臄?shù)據(jù),所以我們不再擔(dān)心某個(gè)數(shù)據(jù)點(diǎn)對(duì)整套分析的不利影響。我們要做的就是要接受這些紛繁的數(shù)據(jù)并從中受益,而不是以高昂的代價(jià)消除所有的不確定性。這就是由“小數(shù)據(jù)”到“大數(shù)據(jù)”的改變。

有時(shí)候當(dāng)我們掌握了大量新型數(shù)據(jù)時(shí),精確性就不那么重要了,我們同樣可以掌握食物的發(fā)展趨勢(shì),大數(shù)據(jù)不僅讓我們不再期待準(zhǔn)確性,也讓我們無(wú)法實(shí)現(xiàn)準(zhǔn)確性。

值得注意的是,錯(cuò)誤并不是大數(shù)據(jù)本身固有的。他只是我們用來(lái)衡量、記錄和交流數(shù)據(jù)的工具的一個(gè)缺陷。如果說(shuō)哪一天技術(shù)完美無(wú)缺了,不精確度的問(wèn)題就不復(fù)存在了。錯(cuò)誤不是大數(shù)據(jù)固有的特性,而是一個(gè)需要我們?nèi)ヌ幚淼膶?shí)際問(wèn)題,并且可能長(zhǎng)期存在。

混雜性不是竭力避免,有的時(shí)候可以為我們所用?;ヂ?lián)網(wǎng)最火的產(chǎn)品都會(huì)表明,不精確性、混雜性要更好點(diǎn)。

比如微信朋友圈:朋友的發(fā)動(dòng)態(tài)時(shí)間,在一小時(shí)之內(nèi)的會(huì)顯示多少分鐘之前,在一小時(shí)以外的就只顯示幾小時(shí)前。

在微信公眾號(hào)閱讀量顯示,為什么超過(guò)十萬(wàn)以后顯示地是100000+,而不是具體數(shù)據(jù),因?yàn)槌^(guò)十萬(wàn)以后的數(shù)據(jù),我們心中或許就沒(méi)啥概念了,沒(méi)有一個(gè)參考衡量的標(biāo)準(zhǔn)了,十萬(wàn)已經(jīng)會(huì)讓我們覺(jué)得這篇文章很厲害了,能達(dá)到目的,就沒(méi)必要精確。

3.要相關(guān)關(guān)系、不要因果關(guān)系

知道是很什么就夠了,沒(méi)必要知道為什么。在大數(shù)據(jù)時(shí)代,我們不必非得知道現(xiàn)象背后的原因,而是要讓數(shù)據(jù)自己發(fā)聲。

比如:知道用戶對(duì)什么感興趣即可,沒(méi)必要去研究用戶為什么感興趣。

相關(guān)關(guān)系的核心是量化兩個(gè)數(shù)據(jù)值之間的數(shù)據(jù)關(guān)系。相關(guān)關(guān)系強(qiáng)是指當(dāng)一個(gè)數(shù)據(jù)值增加時(shí),其他數(shù)據(jù)值很有可能也會(huì)隨之增加。

相關(guān)關(guān)系是通過(guò)識(shí)別關(guān)聯(lián)物來(lái)幫助我們分析某一現(xiàn)象,而不是揭示其內(nèi)部的運(yùn)作。

注意:即使很強(qiáng)的相關(guān)關(guān)系也不一定能揭示每一種情況,比如兩個(gè)事物看上去行為相似,很有可能只是巧合。相關(guān)關(guān)系沒(méi)有絕對(duì),只有相似。

通過(guò)給我們找到一個(gè)現(xiàn)象良好的關(guān)聯(lián)物,相關(guān)關(guān)系可以幫助我們捕捉現(xiàn)在和預(yù)測(cè)未來(lái)。

比如:如果A和B經(jīng)常一起發(fā)生,我們只需要注意到B發(fā)生了,就可以預(yù)測(cè)A也發(fā)生了。

在小數(shù)據(jù)時(shí)代,數(shù)據(jù)分析專家會(huì)使用一些建立在理論基礎(chǔ)上的假想來(lái)指導(dǎo)自己選擇適當(dāng)?shù)年P(guān)聯(lián)物。然后收集與關(guān)聯(lián)物相關(guān)的數(shù)據(jù)來(lái)進(jìn)行分析,以證明假設(shè)是否正確。但是由于這是建立在假設(shè)的基礎(chǔ)上,那么分析結(jié)果也是有受偏見(jiàn)影響的可能。

在大數(shù)據(jù)時(shí)代,我們擁有如此多的數(shù)據(jù),如此好的計(jì)算機(jī)能力,所以不再需要人工選擇一個(gè)關(guān)聯(lián)物或者一小部分相似數(shù)據(jù)來(lái)逐一分析。通過(guò)去探求“是什么”而不是“為什么”,相關(guān)關(guān)系幫助我們更好的了解這個(gè)世界。

商業(yè)變革

1.數(shù)據(jù)化—量化一切

首先我們需要明確兩個(gè)概念就是數(shù)字化和數(shù)據(jù)化

數(shù)據(jù)化、是指一種把現(xiàn)象轉(zhuǎn)變?yōu)榭芍票矸治龅牧炕问降倪^(guò)程。

數(shù)字化、是指把模擬數(shù)據(jù)轉(zhuǎn)換成0和1表示的二進(jìn)制碼。

計(jì)算機(jī)的出現(xiàn)帶來(lái)了數(shù)字測(cè)量和存儲(chǔ)設(shè)備,數(shù)字化帶來(lái)了數(shù)據(jù)化,但是數(shù)字化無(wú)法取代數(shù)據(jù)化。

數(shù)據(jù)化的核心是量化一切,常見(jiàn)的被量化的有文字、方位和溝通。

當(dāng)文字變成圖書(shū),拿電子書(shū)為例,未數(shù)據(jù)化的電子書(shū)只能夠被展示出來(lái),讀者并不能通過(guò)搜索關(guān)鍵詞被查找到,也不能被分析。

當(dāng)方位變成數(shù)據(jù),就是將地理信息進(jìn)行,比如百度地圖、各種網(wǎng)站的獲取位置都是將方位變成數(shù)據(jù)。

當(dāng)溝通變成數(shù)據(jù),一些社交平臺(tái)通過(guò)添加各種心情表情,來(lái)收集我們的心情狀態(tài),還有人們的喜好,年齡什么的都可以變成數(shù)據(jù)。

2.價(jià)值—數(shù)據(jù)創(chuàng)新

不同于物質(zhì)性的東西,數(shù)據(jù)的價(jià)值不會(huì)隨著它的使用而減少。數(shù)據(jù)就像一個(gè)神奇的磚石礦,當(dāng)他的首要價(jià)值被發(fā)掘后仍能不斷給予。它的真實(shí)價(jià)值就像漂浮在海洋中的冰山,第一眼只能看到冰山的一角,而絕大部分隱藏在表面之下。他可以為了同一目標(biāo)被多次使用,也用于其他目的。這就需要我們選擇性的對(duì)數(shù)據(jù)進(jìn)行創(chuàng)新,下面主要介紹幾點(diǎn)數(shù)據(jù)創(chuàng)新

數(shù)據(jù)再利用

就是數(shù)據(jù)在實(shí)現(xiàn)了基本用途以后的進(jìn)一步利用。

比如搜索關(guān)鍵詞,基本用途是可以通過(guò)消費(fèi)搜索關(guān)鍵詞來(lái)定向推送廣告,就是我們?cè)谔詫毨锩嫠阉麝P(guān)鍵詞以后,會(huì)收到猜你喜歡的物品提醒。

而他的再利用:根據(jù)客戶搜索關(guān)鍵詞的流量,來(lái)判斷哪款產(chǎn)品或哪種顏色會(huì)成為爆款。

重組數(shù)據(jù)

有的時(shí)候可能從某一組數(shù)據(jù)上看不出什么價(jià)值,我們需要把他和其他數(shù)據(jù)進(jìn)行組合以后,才能利用其價(jià)值。

比如,美國(guó)房地產(chǎn)網(wǎng)站Zillow.com將房地產(chǎn)信息和價(jià)格添加在美國(guó)社區(qū)地圖上,同時(shí)還壓縮了大量的信息,如社區(qū)近期的交易和物業(yè)價(jià)格,以此來(lái)預(yù)測(cè)區(qū)域內(nèi)具體每套住宅的價(jià)值。

可擴(kuò)展數(shù)據(jù)

促成數(shù)據(jù)再利用的方法之一是從一開(kāi)始就設(shè)計(jì)它的可擴(kuò)展性。收集多個(gè)數(shù)據(jù)流或每個(gè)數(shù)據(jù)流中更多數(shù)據(jù)點(diǎn)的額外成本往往較低,因此,收集盡可能多的數(shù)據(jù)并在一開(kāi)始的時(shí)候就考慮到其各種潛在的二次用途,使其具有擴(kuò)展性是非常有意義的。

比如:超市的攝像頭在一開(kāi)始的時(shí)候只是為了防止小偷,但事實(shí)上還可以跟蹤商店的客戶流和她們停留的位置??梢愿鶕?jù)這些信息來(lái)設(shè)計(jì)店面的最佳布局。

數(shù)據(jù)的折舊值

隨著時(shí)間的推移,可能一些比較久遠(yuǎn)的數(shù)據(jù)就會(huì)失去其原有的價(jià)值,在這種情況下,繼續(xù)依賴于舊的數(shù)據(jù)不僅不能增加價(jià)值,實(shí)際上還會(huì)破壞新數(shù)據(jù)的價(jià)值。

比如,十年前你在亞馬遜上買了一本書(shū),而現(xiàn)在你已經(jīng)完全對(duì)他不感興趣了,如果亞馬遜繼續(xù)使用這個(gè)數(shù)據(jù)來(lái)向你推薦其他書(shū)籍就會(huì)有些不合理。

數(shù)據(jù)廢氣

就是收集數(shù)據(jù)中的一些錯(cuò)誤值來(lái)進(jìn)行利用。

比如:搜索引擎的輸入法,有的時(shí)候你會(huì)發(fā)現(xiàn)你輸入的關(guān)鍵詞時(shí)錯(cuò)誤的,但是系統(tǒng)會(huì)彈出你想要的正確的結(jié)果。這就是數(shù)據(jù)廢氣所起的作用。搜素引擎后臺(tái)會(huì)收集每天后臺(tái)收到的錯(cuò)誤關(guān)鍵詞和用戶最終查找的正確關(guān)鍵詞的內(nèi)容。這樣以后一旦出現(xiàn)類似的錯(cuò)誤,系統(tǒng)就可以推送正確的內(nèi)容給用戶,匹配度很高。

3.角色定位—數(shù)據(jù)、技術(shù)、思維

根據(jù)所提供價(jià)值的不同來(lái)源,分別出現(xiàn)了三種大數(shù)據(jù)公司。這三種來(lái)源是指:數(shù)據(jù)本身、技能與思維。

第一種是基于數(shù)據(jù)本身的公司。這些公司擁有大量數(shù)據(jù)或至少可以收集到大量數(shù)據(jù),卻不一定有從數(shù)據(jù)中提取價(jià)值或用數(shù)據(jù)催生創(chuàng)新思想的技能。

第二種是基于技能的公司。他們通常是咨詢公司、技術(shù)創(chuàng)新或分析公司。他們掌握了專業(yè)技能但并不一定擁有數(shù)據(jù)或提出數(shù)據(jù)創(chuàng)新性用途的才能。

第三種是基于思維的公司。通過(guò)利用大數(shù)據(jù)思維提出一些創(chuàng)新性指導(dǎo)意見(jiàn)。


數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼

若不方便掃碼,搜微信號(hào):CDAshujufenxi

數(shù)據(jù)分析師資訊
更多

OK
客服在線
立即咨詢
客服在線
立即咨詢
') } function initGt() { var handler = function (captchaObj) { captchaObj.appendTo('#captcha'); captchaObj.onReady(function () { $("#wait").hide(); }).onSuccess(function(){ $('.getcheckcode').removeClass('dis'); $('.getcheckcode').trigger('click'); }); window.captchaObj = captchaObj; }; $('#captcha').show(); $.ajax({ url: "/login/gtstart?t=" + (new Date()).getTime(), // 加隨機(jī)數(shù)防止緩存 type: "get", dataType: "json", success: function (data) { $('#text').hide(); $('#wait').show(); // 調(diào)用 initGeetest 進(jìn)行初始化 // 參數(shù)1:配置參數(shù) // 參數(shù)2:回調(diào),回調(diào)的第一個(gè)參數(shù)驗(yàn)證碼對(duì)象,之后可以使用它調(diào)用相應(yīng)的接口 initGeetest({ // 以下 4 個(gè)配置參數(shù)為必須,不能缺少 gt: data.gt, challenge: data.challenge, offline: !data.success, // 表示用戶后臺(tái)檢測(cè)極驗(yàn)服務(wù)器是否宕機(jī) new_captcha: data.new_captcha, // 用于宕機(jī)時(shí)表示是新驗(yàn)證碼的宕機(jī) product: "float", // 產(chǎn)品形式,包括:float,popup width: "280px", https: true // 更多配置參數(shù)說(shuō)明請(qǐng)參見(jiàn):http://docs.geetest.com/install/client/web-front/ }, handler); } }); } function codeCutdown() { if(_wait == 0){ //倒計(jì)時(shí)完成 $(".getcheckcode").removeClass('dis').html("重新獲取"); }else{ $(".getcheckcode").addClass('dis').html("重新獲取("+_wait+"s)"); _wait--; setTimeout(function () { codeCutdown(); },1000); } } function inputValidate(ele,telInput) { var oInput = ele; var inputVal = oInput.val(); var oType = ele.attr('data-type'); var oEtag = $('#etag').val(); var oErr = oInput.closest('.form_box').next('.err_txt'); var empTxt = '請(qǐng)輸入'+oInput.attr('placeholder')+'!'; var errTxt = '請(qǐng)輸入正確的'+oInput.attr('placeholder')+'!'; var pattern; if(inputVal==""){ if(!telInput){ errFun(oErr,empTxt); } return false; }else { switch (oType){ case 'login_mobile': pattern = /^1[3456789]\d{9}$/; if(inputVal.length==11) { $.ajax({ url: '/login/checkmobile', type: "post", dataType: "json", data: { mobile: inputVal, etag: oEtag, page_ur: window.location.href, page_referer: document.referrer }, success: function (data) { } }); } break; case 'login_yzm': pattern = /^\d{6}$/; break; } if(oType=='login_mobile'){ } if(!!validateFun(pattern,inputVal)){ errFun(oErr,'') if(telInput){ $('.getcheckcode').removeClass('dis'); } }else { if(!telInput) { errFun(oErr, errTxt); }else { $('.getcheckcode').addClass('dis'); } return false; } } return true; } function errFun(obj,msg) { obj.html(msg); if(msg==''){ $('.login_submit').removeClass('dis'); }else { $('.login_submit').addClass('dis'); } } function validateFun(pat,val) { return pat.test(val); }