99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

熱線電話:13121318867

登錄
首頁精彩閱讀專訪 | 神策數(shù)據(jù)CEO桑文鋒:誰說大數(shù)據(jù)不需要「小而美」
專訪 | 神策數(shù)據(jù)CEO桑文鋒:誰說大數(shù)據(jù)不需要「小而美」
2016-08-04
收藏
從前任百度大數(shù)據(jù)部門的技術(shù)經(jīng)理,到今天神策數(shù)據(jù)CEO,9年時間,桑文鋒身上發(fā)生了許多變化。他笑稱,這種變化從他的微信好友數(shù)量就能看出來。創(chuàng)業(yè)之前,他只有200多個好友,現(xiàn)在已經(jīng)迅速逼近5000人的上限。

大數(shù)據(jù)行業(yè)9年的歷程帶給他很多挑戰(zhàn),也改變了他的很多看法,但讓他對自己所選擇的道路愈加堅定了。前不久,神策數(shù)據(jù)拿到了400萬美元的A輪融資,桑文鋒與他團(tuán)隊的堅持得到了認(rèn)可。

近期,CDA約訪到了桑文鋒先生,聽他聊聊他對大數(shù)據(jù)行業(yè)的看法。

下文根據(jù)采訪實錄整理:



 CDA:大數(shù)據(jù)領(lǐng)域的創(chuàng)業(yè)公司日漸增多,您怎么看待目前市場中的機遇和挑戰(zhàn)?

桑文鋒:我自2007年從浙江大學(xué)研究生畢業(yè)之后進(jìn)入百度,一開始在百度知道做研發(fā)工作,第二年就開始做數(shù)據(jù)領(lǐng)域的工作。

百度推崇用數(shù)據(jù)說話,它本身的數(shù)據(jù)規(guī)模也比較大,懂?dāng)?shù)據(jù),對數(shù)據(jù)也比較重視。從2008年開始,我負(fù)責(zé)一個小團(tuán)隊,基于Hadoop搭建了一些數(shù)據(jù)處理平臺,主要用來處理百度的產(chǎn)品數(shù)據(jù),比如它的用戶量、訪問量等等。

那個時候沒有大數(shù)據(jù)的概念,大家談?wù)摰亩际?a href='/map/yunjisuan/' style='color:#000;font-size:inherit;'>云計算。到2011年、2012年左右,大數(shù)據(jù)的概念就比較火了,當(dāng)時意識到大數(shù)據(jù)技術(shù)很有價值,但是數(shù)據(jù)基本都集中在BAT。

最近三四年業(yè)內(nèi)比較大,主要表現(xiàn)在:

一是移動互聯(lián)網(wǎng)的發(fā)展,傳感器的發(fā)展,讓以前收集不到的數(shù)據(jù)現(xiàn)在可以收集到了,線下的行為轉(zhuǎn)移到線上,這讓一些規(guī)模比較小的公司也能夠獲取數(shù)據(jù);

二是大數(shù)據(jù)處理的軟硬件基礎(chǔ)在不斷成熟,摩爾定律,機器越來越便宜,性能越來越高,像Hadoop這種基礎(chǔ)的大數(shù)據(jù)處理平臺越來越成熟,很容易搭建并使用;

三是,雖然前幾年大數(shù)據(jù)不乏炒作概念之嫌,但也有一點好處,就是提高了人們對于數(shù)據(jù)的重視程度,你不用再跟對方科普數(shù)據(jù)有多重要了,他已經(jīng)開始自覺地關(guān)注如何讓數(shù)據(jù)發(fā)揮更大的價值。

在這種大環(huán)境下,大數(shù)據(jù)技術(shù)能夠在很多領(lǐng)域被很多企業(yè)利用。而我最終出來創(chuàng)業(yè),其實賭了兩個潮流:一個是創(chuàng)業(yè)潮,國家鼓勵創(chuàng)業(yè),重視創(chuàng)業(yè),創(chuàng)業(yè)公司的數(shù)量不斷增多,代表著企業(yè)對于數(shù)據(jù)的潛在需求越來越大。另外一個是互聯(lián)網(wǎng)+,許多傳統(tǒng)企業(yè)面臨轉(zhuǎn)型,從線下轉(zhuǎn)到線上,轉(zhuǎn)型過程中必定也會產(chǎn)生數(shù)據(jù)的需求。吳軍在他的《浪潮之巔》中提到,科技領(lǐng)域的發(fā)展趨勢就是一波波浪潮,跟著浪潮走會更容易把事情做成。目前互聯(lián)網(wǎng)創(chuàng)業(yè)的浪潮能夠推動我們?nèi)グl(fā)現(xiàn)和把握時機。

 CDA:什么樣的數(shù)據(jù)分析產(chǎn)品能在競爭中存活?

桑文鋒:數(shù)據(jù)分析不是一個新概念,早些年就已經(jīng)有不少公司在這個領(lǐng)域發(fā)力,覆蓋的用戶量也很高。目前市場上的部分?jǐn)?shù)據(jù)分析產(chǎn)品有優(yōu)點,也存在著問題。好處在于一是簡單免費,不足的地方在于數(shù)據(jù)采集能力比較弱,一般只能采集客戶端的數(shù)據(jù),服務(wù)端、數(shù)據(jù)庫的數(shù)據(jù)不多,這就會影響后期的分析;第二點在分析能力,一般做宏觀分析都沒有問題,比較難實現(xiàn)的是多維度的交叉分析;第三點是數(shù)據(jù)安全,用戶會對數(shù)據(jù)存儲產(chǎn)生安全顧慮。

神策數(shù)據(jù)的定位是針對互聯(lián)網(wǎng)公司的用戶行為分析。有這么幾個特點:

第一,提供私有化部署,用戶可以把他需要的服務(wù)部署到自己的服務(wù)器上,數(shù)據(jù)不會出他自己的環(huán)境,打消了他們的安全顧慮。

第二,強調(diào)全端數(shù)據(jù)接入。不管是客戶端的數(shù)據(jù),還是服務(wù)端數(shù)據(jù)庫的數(shù)據(jù)都可以接入,提供可視化埋點、代碼埋點、工具導(dǎo)入等等,有了數(shù)據(jù)才能更好地分析。

第三,神策基于PaaS平臺,一般比較常用的是SaaS服務(wù),二者的區(qū)別在于SaaS很難進(jìn)行二次開發(fā)和深度利用,它不提供接口,你也很難建模,而用戶在PaaS平臺可以進(jìn)行二次開發(fā)和存儲利用。從數(shù)據(jù)采集、存儲、建模分析到可視化,用PaaS平臺可以做到每一個環(huán)節(jié)對用戶開放,把數(shù)據(jù)讀取出來,進(jìn)行深度利用。用Hadoop、Spark搭建的大數(shù)據(jù)框架也可以直接訪問。

另外,用戶的每一個行為就是一個事件,比如提交訂單,瀏覽網(wǎng)頁,可以理解為一系列事件。我們的平臺可以自定義用戶的事件以及事件相關(guān)的維度。要分析的產(chǎn)品各不相同,但事件的本質(zhì)是一樣的,我們有靈活的機制去適配。所以,所有的用戶只需要用同一個數(shù)據(jù)分析平臺就可以滿足需求,沒有太多定制化的東西,節(jié)省了很大成本。

大數(shù)據(jù)的概念很寬泛,專注于某一個領(lǐng)域更容易成功。比如我們專注于用戶行為分析,把這一個點做好就可以了,如果泛泛地什么都去嘗試,反而不能夠垂直深入。

2015年是大數(shù)據(jù)落地的一個年份,前兩年雖然有很多人在炒概念,但近期出現(xiàn)的數(shù)據(jù)公司都開始從某一個點切入,這是一種更務(wù)實更科學(xué)的方式??赡軐頃霈F(xiàn)行業(yè)的整合,但是目前那些小而精、小而美的產(chǎn)品存活下來的機會比較大。

很多人傾向于在現(xiàn)階段要掌握數(shù)據(jù),怎么能拿到數(shù)據(jù)怎么干,但我認(rèn)為這種思路背離了以用戶為中心的理念。不能只想著自己掌握數(shù)據(jù),更重要的是要知道用戶真正需要什么。所以我認(rèn)為大數(shù)據(jù)本身發(fā)展大概會分成兩個階段:第一個階段是能力階段,第二個階段是價值階段。現(xiàn)在大家知道數(shù)據(jù)很重要,但是不知道怎么做,你要提供好的數(shù)據(jù)分析工具,讓他有能力做,這是第一個階段。這個階段過后,工具普及了,人們更關(guān)注怎么從數(shù)據(jù)中挖掘更多的價值,這是第二個階段。

 CDA:企業(yè)怎樣才能真正利用數(shù)據(jù)產(chǎn)生價值?

桑文鋒:不能把數(shù)據(jù)太神話了,一定要結(jié)合業(yè)務(wù)看待。我們最早從電商類的企業(yè)切入,因為對電商類的企業(yè)而言數(shù)據(jù)最關(guān)鍵,每一種商品的瀏覽情況、下單情況,用戶的轉(zhuǎn)化情況,每一種數(shù)據(jù)都直接與它的業(yè)務(wù)相關(guān)。在我們看來跟訂單與交易相關(guān)的數(shù)據(jù)價值會更明顯一些。比如,你去投放廣告,你去衡量在不同平臺投放廣告的效果如何,就要去對比不同渠道轉(zhuǎn)化的付費用戶的比例有多少,平均客單價有多高、復(fù)購情況如何,只有經(jīng)過這些分析,你才能知道不同廣告平臺的價值區(qū)別在哪里,就可以從拍腦袋的方式轉(zhuǎn)化到數(shù)據(jù)驅(qū)動的方式。

現(xiàn)階段對于創(chuàng)業(yè)公司來說,數(shù)據(jù)采集是比較難的。一方面是不知道怎么采集數(shù)據(jù),另一方面是不知道應(yīng)該采集哪些數(shù)據(jù),更不知道怎樣把這些數(shù)據(jù)建模。所以我們一方面提供全端接入的模式,一方面也建立了數(shù)據(jù)分析團(tuán)隊,幫助用戶理清思路,梳理維度,讓他們比較容易得落地;另外就是數(shù)據(jù)分析的理念問題,很多用戶不知道怎么做數(shù)據(jù)分析,那么我們在產(chǎn)品之外還需要灌輸理念,做一些科普的工作。這方面也是個坎,但是在過個三五年,數(shù)據(jù)驅(qū)動增長的理念應(yīng)該就能夠更廣泛地被接受。

(小編插播:桑文鋒先生將在CDAS2016中國數(shù)據(jù)分析師行業(yè)峰會上繼續(xù)深入探討這個問題,敬請期待?。?/span>


 CDA:給想要投身這個行業(yè)的人留下一些建議吧

桑文鋒:大數(shù)據(jù)不是聽一兩次課或者看一兩本書就能摸清楚的,還是需要有實踐經(jīng)驗,比如說我之所以對大數(shù)據(jù)有信心,就是在百度的那幾年接觸過各種技術(shù),知道各種場景應(yīng)該怎樣做處理,你本身要有機會去處理一些數(shù)據(jù)相關(guān)的問題。如果想做數(shù)據(jù)工程師,就以開發(fā)平臺架構(gòu)已出發(fā)點,多去尋找這樣的機會,對于分析師來說,則要首先培養(yǎng)自己數(shù)據(jù)驅(qū)動的理念,基于這種理念去做分析,自然能力就提升了。

對于大數(shù)據(jù)分析師這個崗位,我可以推薦一本書叫《精益數(shù)據(jù)分析》,主要講互聯(lián)網(wǎng)公司是如何做數(shù)據(jù)分析的。其實大數(shù)據(jù)分析的分析方法不難,難的是如何基于業(yè)務(wù)場景靈活運用,所以要先構(gòu)建理念。這本書在應(yīng)用上可以給你一些啟發(fā)。也不要把自己局限于分析工作,多了解業(yè)務(wù)。


CDA也推出了大數(shù)據(jù)和數(shù)據(jù)挖掘相關(guān)的課程,感興趣的筒子們可以掃碼直達(dá)店鋪購買課程:


  (CDA微店二維碼)                (CDA數(shù)據(jù)分析師服務(wù)號)



數(shù)據(jù)分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數(shù)據(jù)分析師資訊
更多

OK
客服在線
立即咨詢
客服在線
立即咨詢
') } function initGt() { var handler = function (captchaObj) { captchaObj.appendTo('#captcha'); captchaObj.onReady(function () { $("#wait").hide(); }).onSuccess(function(){ $('.getcheckcode').removeClass('dis'); $('.getcheckcode').trigger('click'); }); window.captchaObj = captchaObj; }; $('#captcha').show(); $.ajax({ url: "/login/gtstart?t=" + (new Date()).getTime(), // 加隨機數(shù)防止緩存 type: "get", dataType: "json", success: function (data) { $('#text').hide(); $('#wait').show(); // 調(diào)用 initGeetest 進(jìn)行初始化 // 參數(shù)1:配置參數(shù) // 參數(shù)2:回調(diào),回調(diào)的第一個參數(shù)驗證碼對象,之后可以使用它調(diào)用相應(yīng)的接口 initGeetest({ // 以下 4 個配置參數(shù)為必須,不能缺少 gt: data.gt, challenge: data.challenge, offline: !data.success, // 表示用戶后臺檢測極驗服務(wù)器是否宕機 new_captcha: data.new_captcha, // 用于宕機時表示是新驗證碼的宕機 product: "float", // 產(chǎn)品形式,包括:float,popup width: "280px", https: true // 更多配置參數(shù)說明請參見:http://docs.geetest.com/install/client/web-front/ }, handler); } }); } function codeCutdown() { if(_wait == 0){ //倒計時完成 $(".getcheckcode").removeClass('dis').html("重新獲取"); }else{ $(".getcheckcode").addClass('dis').html("重新獲取("+_wait+"s)"); _wait--; setTimeout(function () { codeCutdown(); },1000); } } function inputValidate(ele,telInput) { var oInput = ele; var inputVal = oInput.val(); var oType = ele.attr('data-type'); var oEtag = $('#etag').val(); var oErr = oInput.closest('.form_box').next('.err_txt'); var empTxt = '請輸入'+oInput.attr('placeholder')+'!'; var errTxt = '請輸入正確的'+oInput.attr('placeholder')+'!'; var pattern; if(inputVal==""){ if(!telInput){ errFun(oErr,empTxt); } return false; }else { switch (oType){ case 'login_mobile': pattern = /^1[3456789]\d{9}$/; if(inputVal.length==11) { $.ajax({ url: '/login/checkmobile', type: "post", dataType: "json", data: { mobile: inputVal, etag: oEtag, page_ur: window.location.href, page_referer: document.referrer }, success: function (data) { } }); } break; case 'login_yzm': pattern = /^\d{6}$/; break; } if(oType=='login_mobile'){ } if(!!validateFun(pattern,inputVal)){ errFun(oErr,'') if(telInput){ $('.getcheckcode').removeClass('dis'); } }else { if(!telInput) { errFun(oErr, errTxt); }else { $('.getcheckcode').addClass('dis'); } return false; } } return true; } function errFun(obj,msg) { obj.html(msg); if(msg==''){ $('.login_submit').removeClass('dis'); }else { $('.login_submit').addClass('dis'); } } function validateFun(pat,val) { return pat.test(val); }