99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

熱線電話:13121318867

登錄
首頁精彩閱讀用 PHP 使 Web 數(shù)據(jù)分析進(jìn)入更高境界
用 PHP 使 Web 數(shù)據(jù)分析進(jìn)入更高境界
2015-06-11
收藏

用 PHP 使 Web 數(shù)據(jù)分析進(jìn)入更高境界


設(shè)計(jì)您的數(shù)據(jù)分析,做比簡(jiǎn)單原始計(jì)數(shù)更多的事 對(duì) Web 數(shù)據(jù)進(jìn)行有效和多層次的分析是許多面向 Web 企業(yè)能夠生存的關(guān)鍵因素,數(shù)據(jù)分析檢驗(yàn)的設(shè)計(jì)(和決策)通常是系統(tǒng)管理員和內(nèi)部應(yīng)用程序設(shè)計(jì)人員的工作,而他們可能除了能夠把原始計(jì)數(shù)制成表格之外,對(duì)統(tǒng)計(jì)學(xué)沒有更多的了解。在本文中,Paul Meagher 向 Web 開發(fā)人員傳授了將推論統(tǒng)計(jì)學(xué)應(yīng)用到 Web 數(shù)據(jù)流所需的技能和概念。 動(dòng)態(tài)網(wǎng)站不斷生成大量的數(shù)據(jù) ― 訪問日志、民意測(cè)驗(yàn)和調(diào)查結(jié)果、客戶概要信息、訂單及其它,Web 開發(fā)人員的工作不僅是創(chuàng)建生成這些數(shù)據(jù)的應(yīng)用程序,而且還要開發(fā)使這些數(shù)據(jù)流有意義的應(yīng)用程序和方法。 通常,對(duì)于由管理站點(diǎn)所產(chǎn)生的不斷增長的數(shù)據(jù)分析需求,Web 開發(fā)人員的應(yīng)對(duì)是不夠的。

一般而言,除了報(bào)告各種描述性統(tǒng)計(jì)信息之外,Web 開發(fā)人員并沒有其它更好的方法來反映數(shù)據(jù)流特征。有許多推論統(tǒng)計(jì)步驟(根據(jù)樣本數(shù)據(jù)估計(jì)總體參數(shù)的方法)可以被充分利用,但目前卻沒有應(yīng)用它們。 例如,Web 訪問統(tǒng)計(jì)信息(按當(dāng)前所編輯的)只不過是以各種方式進(jìn)行分組的頻率計(jì)數(shù)。以原始計(jì)數(shù)和百分比表示民意測(cè)驗(yàn)和調(diào)查結(jié)果的情況比比皆是。 開發(fā)人員用比較淺顯的方法處理數(shù)據(jù)流的統(tǒng)計(jì)分析或許已經(jīng)足夠了,我們不應(yīng)期望太多。畢竟,有從事較復(fù)雜的數(shù)據(jù)流分析的專業(yè)人士;他們是統(tǒng)計(jì)師和受過訓(xùn)練的分析師。當(dāng)組織需要的不僅僅是描述性統(tǒng)計(jì)時(shí),可以請(qǐng)他們加入。 

但另一種應(yīng)對(duì)是承認(rèn)對(duì)推論統(tǒng)計(jì)學(xué)日益加深的了解正成為 Web 開發(fā)人員工作描述的一部分。動(dòng)態(tài)站點(diǎn)正在生成越來越多的數(shù)據(jù),事實(shí)表明,設(shè)法將這些數(shù)據(jù)變成有用的知識(shí)正是 Web 開發(fā)人員和系統(tǒng)管理員的責(zé)任。 我提倡采取后一種應(yīng)對(duì);本文旨在幫助 Web 開發(fā)人員和系統(tǒng)管理員學(xué)習(xí)(或重溫,如果知識(shí)已遺忘的話)將推論統(tǒng)計(jì)學(xué)應(yīng)用到 Web 數(shù)據(jù)流所需的設(shè)計(jì)和分析技能。 使 Web 數(shù)據(jù)與實(shí)驗(yàn)設(shè)計(jì)相關(guān) 將推論統(tǒng)計(jì)學(xué)應(yīng)用到 Web 數(shù)據(jù)流需要的不僅僅是學(xué)習(xí)作為各種統(tǒng)計(jì)檢驗(yàn)基礎(chǔ)的數(shù)學(xué)知識(shí)。

將數(shù)據(jù)收集過程與實(shí)驗(yàn)設(shè)計(jì)中的關(guān)鍵差別關(guān)聯(lián)起來的能力同樣很重要:測(cè)量尺度是什么?樣本的代表性如何?總體是什么?正在檢驗(yàn)的假設(shè)是什么? 要將推論統(tǒng)計(jì)學(xué)應(yīng)用到 Web 數(shù)據(jù)流,需要先把結(jié)果看作是由實(shí)驗(yàn)設(shè)計(jì)生成的;然后選擇適用于該實(shí)驗(yàn)設(shè)計(jì)的分析過程。即使您可能認(rèn)為將 Web 民意測(cè)驗(yàn)和訪問日志數(shù)據(jù)看作實(shí)驗(yàn)的結(jié)果是多此一舉,但這樣做確實(shí)很重要。為什么? 1.這將幫助您選擇適當(dāng)?shù)慕y(tǒng)計(jì)檢驗(yàn)方法。 2.這將幫助您從收集的數(shù)據(jù)中得出適當(dāng)?shù)慕Y(jié)論。 在確定要使用哪些適當(dāng)?shù)慕y(tǒng)計(jì)檢驗(yàn)時(shí),實(shí)驗(yàn)設(shè)計(jì)的一個(gè)重要方面是選擇數(shù)據(jù)收集的衡量尺度。 衡量標(biāo)準(zhǔn)的示例 測(cè)量尺度只是指定了一個(gè)對(duì)所感興趣的現(xiàn)象分配符號(hào)、字母或數(shù)字的步驟。

例如,千克尺度允許您給一個(gè)物體分配數(shù)字,根據(jù)測(cè)量儀器的標(biāo)準(zhǔn)化的偏移量指示該物體的重量。 有四種重要的衡量標(biāo)準(zhǔn): 定比尺度(ratio)― 千克尺度是定比尺度的一個(gè)示例 ? 分配給物體屬性的符號(hào)具有數(shù)字意義。您可以對(duì)這些符號(hào)執(zhí)行各種運(yùn)算(如計(jì)算比率),而對(duì)于通過使用功能不那么強(qiáng)大的衡量標(biāo)準(zhǔn)獲得的數(shù)值,您不能使用這些運(yùn)算。 定距尺度(interval)― 在定距尺度中,任意兩個(gè)相鄰測(cè)量單位之間的距離(也稱為間距)是相等的,但零點(diǎn)是任意的。定距尺度的示例包括對(duì)經(jīng)度和潮汐高度的度量,以及不同年份始末的度量。定距尺度的值可以加減,但乘除則沒有意義。 定序尺度(rank)― 定序尺度可應(yīng)用于一組有順序的數(shù)據(jù),有順序指的是屬于該尺度的值和觀察值可以按順序排列或附帶有評(píng)級(jí)尺度。常見的示例包括“好惡”民意測(cè)驗(yàn),其中將數(shù)字分配給各個(gè)屬性(從 1 = 非常厭惡到 5 = 非常喜歡)。

通常,一組有序數(shù)據(jù)的類別有自然的順序,但尺度上相鄰點(diǎn)之間的差距不必總是相同的。對(duì)于有順序的數(shù)據(jù),您可以計(jì)數(shù)和排序,但不能測(cè)量。 定類尺度(nominal)― 衡量標(biāo)準(zhǔn)的定類尺度是衡量標(biāo)準(zhǔn)中最弱的一種形式,主要指將項(xiàng)目分配給組或類別。這種測(cè)量不帶數(shù)量信息,并且不表示對(duì)項(xiàng)目進(jìn)行排序。對(duì)定類尺度數(shù)據(jù)執(zhí)行的主要數(shù)值運(yùn)算是每一類別中項(xiàng)目的頻率計(jì)數(shù)。 下表對(duì)比了每種衡量標(biāo)準(zhǔn)的特征: 衡量標(biāo)準(zhǔn)尺度 屬性具有絕對(duì)的數(shù)字含義嗎? 能執(zhí)行大多數(shù)數(shù)學(xué)運(yùn)算嗎? 定比尺度 是。 是。 定距尺度 對(duì)于定距尺度是這樣;零點(diǎn)是任意的。 加和減。 定序尺度 不是。 計(jì)數(shù)和排序。 定類尺度 不是。 只能計(jì)數(shù)。 在本文中,我將主要討論通過使用測(cè)量的定類尺度收集的數(shù)據(jù),以及適用于定類數(shù)據(jù)的推論技術(shù)。

 使用定類尺度 幾乎所有 Web 用戶 ― 設(shè)計(jì)人員、客戶和系統(tǒng)管理員 ― 都熟悉定類尺度。Web 民意測(cè)驗(yàn)和訪問日志類似,因?yàn)樗鼈兂3J褂枚惓叨茸鳛楹饬繕?biāo)準(zhǔn)。在 Web 民意測(cè)驗(yàn)中,用戶常常通過請(qǐng)求人們選擇回答選項(xiàng)(如“您偏愛品牌 A、品牌 B,還是品牌 C?”)來衡量人們的偏好。通過對(duì)各類回答的頻率進(jìn)行計(jì)數(shù)來匯總數(shù)據(jù)。 類似的,測(cè)量網(wǎng)站流量的常用方法是對(duì)一個(gè)星期內(nèi)一天之中的每次點(diǎn)擊或訪問都劃分給這一天,然后對(duì)每一天出現(xiàn)的點(diǎn)擊或訪問的數(shù)目計(jì)數(shù)。另外,您可以(也確實(shí)可以)通過瀏覽器類型、操作系統(tǒng)類型和訪問者所在的國家或地區(qū) ― 以及任何您想得到的分類尺度 ― 對(duì)點(diǎn)擊計(jì)數(shù)。 因?yàn)?Web 民意測(cè)驗(yàn)和訪問統(tǒng)計(jì)信息都需要對(duì)數(shù)據(jù)歸入某一特定性質(zhì)類別的次數(shù)進(jìn)行計(jì)數(shù),所以可以用相似的無參數(shù)統(tǒng)計(jì)檢驗(yàn)(允許您根據(jù)分布形狀而不是總體參數(shù)作出推論的檢驗(yàn))來分析它們。 David Sheskin 在他的 Handbook of Parametric and Non-Parametric Statistical Procedures 一書(第 19 頁, 1997)中,是這樣區(qū)分參數(shù)檢驗(yàn)和非參數(shù)檢驗(yàn)的: 本書中將過程分類為參數(shù)檢驗(yàn)和非參數(shù)檢驗(yàn)所使用的區(qū)別主要基于被分析數(shù)據(jù)所代表的測(cè)量級(jí)別。

作為通用規(guī)則,評(píng)估類別/定類尺度數(shù)據(jù)和順序/等級(jí)-順序數(shù)據(jù)的推論統(tǒng)計(jì)檢驗(yàn)被歸類為非參數(shù)檢驗(yàn),而那些評(píng)估定距尺度數(shù)據(jù)或定比尺度數(shù)據(jù)的檢驗(yàn)則被歸類為參數(shù)檢驗(yàn)。 當(dāng)作為參數(shù)檢驗(yàn)基礎(chǔ)的某些假設(shè)值得懷疑時(shí),非參數(shù)檢驗(yàn)也很有用;當(dāng)不滿足參數(shù)假設(shè)時(shí),非參數(shù)檢驗(yàn)在檢測(cè)總體差異時(shí)有很大的作用。對(duì)于 Web 民意測(cè)驗(yàn)的示例,我使用了非參數(shù)分析過程,因?yàn)?Web 民意測(cè)驗(yàn)通常使用定類尺度來記錄投票者的偏好。 我并不是在建議 Web 民意測(cè)驗(yàn)和 Web 訪問統(tǒng)計(jì)信息應(yīng)該始終使用定類尺度衡量標(biāo)準(zhǔn),或者說非參數(shù)統(tǒng)計(jì)檢驗(yàn)是唯一可用于分析這類數(shù)據(jù)的方法。不難設(shè)想有(譬如)這樣的民意測(cè)驗(yàn)和調(diào)查,它們要求用戶對(duì)每個(gè)選項(xiàng)提供數(shù)值評(píng)分(從 1 到 100),對(duì)此,參數(shù)性的統(tǒng)計(jì)檢驗(yàn)就比較合適。 盡管如此,許多 Web 數(shù)據(jù)流包括編輯類別計(jì)數(shù)數(shù)據(jù),而且通過定義定距尺度(譬如從 17 到 21)并將每個(gè)數(shù)據(jù)點(diǎn)分配給一個(gè)定距尺度(如“年輕人”),可以將這些數(shù)據(jù)(通過使用功能更強(qiáng)大的衡量標(biāo)準(zhǔn)測(cè)量)變成定類尺度數(shù)據(jù)。頻率數(shù)據(jù)的普遍存在(已經(jīng)是 Web 開發(fā)人員經(jīng)驗(yàn)的一部分),使得專注于非參數(shù)統(tǒng)計(jì)學(xué)成為學(xué)習(xí)如何將推論技術(shù)應(yīng)用到數(shù)據(jù)流的良好起點(diǎn)。 為了使本文保持合理的篇幅,我將把對(duì) Web 數(shù)據(jù)流分析的討論局限于 Web 民意測(cè)驗(yàn)。但是請(qǐng)記住,許多 Web 數(shù)據(jù)流都可以用定類計(jì)數(shù)數(shù)據(jù)表示,而我討論的推論技術(shù)將使您能做比報(bào)告簡(jiǎn)單的計(jì)數(shù)數(shù)據(jù)更多的事情。 從抽樣開始 假設(shè)您在您的站點(diǎn)...

 上進(jìn)行每周一次的民意測(cè)驗(yàn),詢問成員對(duì)各種主題的意見。您已經(jīng)創(chuàng)建了一個(gè)民意測(cè)驗(yàn),詢問成員喜愛的啤酒品牌(在加拿大新斯科舍省(Nova Scotia)有三種知名的啤酒品牌:Keiths、Olands 和 Schooner)。為了使調(diào)查盡可能范圍廣泛,您在回答中包括“其它”。 您收到 1,000 條回答,請(qǐng)觀察到表 1 中的結(jié)果。(本文顯示的結(jié)果只作為演示之用,并不基于任何實(shí)際調(diào)查。) 表 1. 啤酒民意測(cè)驗(yàn)Keiths Olands Schooner 其它 285(28.50%) 250(25.00%) 215(21.50%) 250(25.00%) 這些數(shù)據(jù)看上去支持這樣的結(jié)論:Keiths 是最受新斯科舍省居民歡迎的品牌。根據(jù)這些數(shù)字,您能得出這一結(jié)論嗎?

換句話說,您能根據(jù)從樣本獲得的結(jié)果對(duì)新斯科舍省的啤酒消費(fèi)者總體作出推論嗎? 許多與樣本收集方式有關(guān)的因素會(huì)使相對(duì)受歡迎程度的推論不正確??赡軜颖局邪诉^多 Keiths 釀酒廠的雇員;可能您沒有完全預(yù)防一個(gè)人投多次票的情況,而這個(gè)人可能使結(jié)果出現(xiàn)偏差;或許被挑選出來投票的人與沒有被挑選出來投票的人不同;或許上網(wǎng)的投票人與不上網(wǎng)的投票人不同。 大多數(shù) Web 民意測(cè)驗(yàn)都存在這些解釋上的困難。當(dāng)您試圖從樣本統(tǒng)計(jì)數(shù)據(jù)得出有關(guān)總體參數(shù)的結(jié)論時(shí),就會(huì)出現(xiàn)這些解釋上的困難。

從實(shí)驗(yàn)設(shè)計(jì)觀點(diǎn)看,在收集數(shù)據(jù)之前首先要問的一個(gè)問題是:能否采取步驟幫助確保樣本能夠代表所研究的總體

數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼

若不方便掃碼,搜微信號(hào):CDAshujufenxi

數(shù)據(jù)分析師資訊
更多

OK
客服在線
立即咨詢
客服在線
立即咨詢
') } function initGt() { var handler = function (captchaObj) { captchaObj.appendTo('#captcha'); captchaObj.onReady(function () { $("#wait").hide(); }).onSuccess(function(){ $('.getcheckcode').removeClass('dis'); $('.getcheckcode').trigger('click'); }); window.captchaObj = captchaObj; }; $('#captcha').show(); $.ajax({ url: "/login/gtstart?t=" + (new Date()).getTime(), // 加隨機(jī)數(shù)防止緩存 type: "get", dataType: "json", success: function (data) { $('#text').hide(); $('#wait').show(); // 調(diào)用 initGeetest 進(jìn)行初始化 // 參數(shù)1:配置參數(shù) // 參數(shù)2:回調(diào),回調(diào)的第一個(gè)參數(shù)驗(yàn)證碼對(duì)象,之后可以使用它調(diào)用相應(yīng)的接口 initGeetest({ // 以下 4 個(gè)配置參數(shù)為必須,不能缺少 gt: data.gt, challenge: data.challenge, offline: !data.success, // 表示用戶后臺(tái)檢測(cè)極驗(yàn)服務(wù)器是否宕機(jī) new_captcha: data.new_captcha, // 用于宕機(jī)時(shí)表示是新驗(yàn)證碼的宕機(jī) product: "float", // 產(chǎn)品形式,包括:float,popup width: "280px", https: true // 更多配置參數(shù)說明請(qǐng)參見:http://docs.geetest.com/install/client/web-front/ }, handler); } }); } function codeCutdown() { if(_wait == 0){ //倒計(jì)時(shí)完成 $(".getcheckcode").removeClass('dis').html("重新獲取"); }else{ $(".getcheckcode").addClass('dis').html("重新獲取("+_wait+"s)"); _wait--; setTimeout(function () { codeCutdown(); },1000); } } function inputValidate(ele,telInput) { var oInput = ele; var inputVal = oInput.val(); var oType = ele.attr('data-type'); var oEtag = $('#etag').val(); var oErr = oInput.closest('.form_box').next('.err_txt'); var empTxt = '請(qǐng)輸入'+oInput.attr('placeholder')+'!'; var errTxt = '請(qǐng)輸入正確的'+oInput.attr('placeholder')+'!'; var pattern; if(inputVal==""){ if(!telInput){ errFun(oErr,empTxt); } return false; }else { switch (oType){ case 'login_mobile': pattern = /^1[3456789]\d{9}$/; if(inputVal.length==11) { $.ajax({ url: '/login/checkmobile', type: "post", dataType: "json", data: { mobile: inputVal, etag: oEtag, page_ur: window.location.href, page_referer: document.referrer }, success: function (data) { } }); } break; case 'login_yzm': pattern = /^\d{6}$/; break; } if(oType=='login_mobile'){ } if(!!validateFun(pattern,inputVal)){ errFun(oErr,'') if(telInput){ $('.getcheckcode').removeClass('dis'); } }else { if(!telInput) { errFun(oErr, errTxt); }else { $('.getcheckcode').addClass('dis'); } return false; } } return true; } function errFun(obj,msg) { obj.html(msg); if(msg==''){ $('.login_submit').removeClass('dis'); }else { $('.login_submit').addClass('dis'); } } function validateFun(pat,val) { return pat.test(val); }