99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

熱線電話:13121318867

登錄
首頁精彩閱讀更多的數(shù)據(jù)勝過更好的算法 _數(shù)據(jù)分析師
更多的數(shù)據(jù)勝過更好的算法 _數(shù)據(jù)分析師
2014-11-18
收藏

Google更多的數(shù)據(jù)勝過更好的算法 _數(shù)據(jù)分析師


      時(shí)下數(shù)據(jù)的關(guān)注是越來越高,關(guān)于大數(shù)據(jù)的討論也是火熱異常。而作為玩轉(zhuǎn)大數(shù)據(jù)的巨頭之一Google對數(shù)據(jù)的重視更是非同一般,這次Google給我們帶來的是更多是數(shù)據(jù)意味著更好的語音識別。其產(chǎn)品研發(fā)總監(jiān)Peter Norvig更認(rèn)為:更多的數(shù)據(jù)勝過更好的算法!

  Google發(fā)布的新研究論文詳述了語音識別程序幕后的數(shù)據(jù)科學(xué),包含了語音搜索和向YouTube視頻中添加文字說明和標(biāo)簽。雖然其中的算法多數(shù)人都無法掌握,但是思想?yún)s是完全可以理解的。論文的出發(fā)點(diǎn)在于人們對大數(shù)據(jù)熱衷的原因及為工作選擇合適數(shù)據(jù)集的重要性。

  Google自始至終都認(rèn)為數(shù)據(jù)是越多越好,用產(chǎn)品研發(fā)總監(jiān)Peter Norvig的話就是:更多的數(shù)據(jù)勝過更好的算法。盡管Norvig的評價(jià)中還有一些對算法的吹毛求疵,但是顯然更多的人接受了這篇論文并在大數(shù)據(jù)領(lǐng)域引起了熱烈的討論。模型用來學(xué)習(xí)的數(shù)據(jù)越多,模型就會變的越精確 即使開始時(shí)不是最尖端的。

  言歸正傳,下面我們來看一下更多的數(shù)據(jù)在語音識別系統(tǒng)的改善中所起到的作用。研究人員發(fā)現(xiàn)數(shù)據(jù)集和大型語言模型(維基百科對Google 研發(fā)中涉及到的n-gram模型的解釋)可以降低在收到第一個(gè)單詞時(shí)推測下一個(gè)單詞時(shí)的錯(cuò)誤率。比如Google高級研究員在10月31日關(guān)于這項(xiàng)研究的博客中給出的例子:一個(gè)好的模型在前兩個(gè)單詞是New York時(shí)推測下一個(gè)詞時(shí)會更多的選擇pizza而不是granola。在做語音搜索時(shí),他的團(tuán)隊(duì)發(fā)現(xiàn):模型的大小每增加兩個(gè)數(shù)量級就可以減少10%的關(guān)系詞錯(cuò)誤率。

  這里的關(guān)鍵在于什么類型的數(shù)據(jù)集對你的模型有益,不管它們是什么。對于搜索的測試,Google使用google.com匿名查詢的隨機(jī)樣本中抽取沒有出現(xiàn)拼寫校正的230個(gè)單詞。因?yàn)槿藗冎v話和寫作不同于普通的打字搜索,所以YouTube模型的數(shù)據(jù)都是來自新聞報(bào)道的錄音和大型網(wǎng)站上的抓取。他們寫道:單純的就語言建模而言,各種各樣的話題和口語風(fēng)格讓大型網(wǎng)站抓取成為語言模型建立的很好選擇。

  雖然這個(gè)研究并不一定具有突破性,但是卻道出了大數(shù)據(jù)和數(shù)據(jù)科學(xué)為什么會在今天引起這么多的注意。隨著消費(fèi)者需求更智能的應(yīng)用程序和更無縫的用戶體驗(yàn),每一塊數(shù)據(jù)的選擇及每一塊數(shù)據(jù)對應(yīng)分析方案無疑都是重中之重!(文章來源:CDA數(shù)據(jù)分析師

數(shù)據(jù)分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數(shù)據(jù)分析師資訊
更多

OK
客服在線
立即咨詢
客服在線
立即咨詢
') } function initGt() { var handler = function (captchaObj) { captchaObj.appendTo('#captcha'); captchaObj.onReady(function () { $("#wait").hide(); }).onSuccess(function(){ $('.getcheckcode').removeClass('dis'); $('.getcheckcode').trigger('click'); }); window.captchaObj = captchaObj; }; $('#captcha').show(); $.ajax({ url: "/login/gtstart?t=" + (new Date()).getTime(), // 加隨機(jī)數(shù)防止緩存 type: "get", dataType: "json", success: function (data) { $('#text').hide(); $('#wait').show(); // 調(diào)用 initGeetest 進(jìn)行初始化 // 參數(shù)1:配置參數(shù) // 參數(shù)2:回調(diào),回調(diào)的第一個(gè)參數(shù)驗(yàn)證碼對象,之后可以使用它調(diào)用相應(yīng)的接口 initGeetest({ // 以下 4 個(gè)配置參數(shù)為必須,不能缺少 gt: data.gt, challenge: data.challenge, offline: !data.success, // 表示用戶后臺檢測極驗(yàn)服務(wù)器是否宕機(jī) new_captcha: data.new_captcha, // 用于宕機(jī)時(shí)表示是新驗(yàn)證碼的宕機(jī) product: "float", // 產(chǎn)品形式,包括:float,popup width: "280px", https: true // 更多配置參數(shù)說明請參見:http://docs.geetest.com/install/client/web-front/ }, handler); } }); } function codeCutdown() { if(_wait == 0){ //倒計(jì)時(shí)完成 $(".getcheckcode").removeClass('dis').html("重新獲取"); }else{ $(".getcheckcode").addClass('dis').html("重新獲取("+_wait+"s)"); _wait--; setTimeout(function () { codeCutdown(); },1000); } } function inputValidate(ele,telInput) { var oInput = ele; var inputVal = oInput.val(); var oType = ele.attr('data-type'); var oEtag = $('#etag').val(); var oErr = oInput.closest('.form_box').next('.err_txt'); var empTxt = '請輸入'+oInput.attr('placeholder')+'!'; var errTxt = '請輸入正確的'+oInput.attr('placeholder')+'!'; var pattern; if(inputVal==""){ if(!telInput){ errFun(oErr,empTxt); } return false; }else { switch (oType){ case 'login_mobile': pattern = /^1[3456789]\d{9}$/; if(inputVal.length==11) { $.ajax({ url: '/login/checkmobile', type: "post", dataType: "json", data: { mobile: inputVal, etag: oEtag, page_ur: window.location.href, page_referer: document.referrer }, success: function (data) { } }); } break; case 'login_yzm': pattern = /^\d{6}$/; break; } if(oType=='login_mobile'){ } if(!!validateFun(pattern,inputVal)){ errFun(oErr,'') if(telInput){ $('.getcheckcode').removeClass('dis'); } }else { if(!telInput) { errFun(oErr, errTxt); }else { $('.getcheckcode').addClass('dis'); } return false; } } return true; } function errFun(obj,msg) { obj.html(msg); if(msg==''){ $('.login_submit').removeClass('dis'); }else { $('.login_submit').addClass('dis'); } } function validateFun(pat,val) { return pat.test(val); }