
電商平臺由于承載大量用戶數(shù)據(jù)和交互行為,往往是云計算和大數(shù)據(jù)的重度用戶,諸如國外的亞馬遜和國內(nèi)的阿里巴巴都在這方面不吝投入。
京東自然也不例外。在京東創(chuàng)始人、CEO劉強東屢屢提及的“倒三角”戰(zhàn)略中,財務(wù)、物流和技術(shù)三大核心系統(tǒng)就是其中的重要內(nèi)容。
不過,在京東的自建物流能力以及由此帶來的用戶體驗在消費者中留下深刻印象的同時,居于幕后的技術(shù)體系,并不容易直接讓用戶感知。對此,京東自身過往亦著墨不多。
“京東技術(shù)體系的特點就是涵蓋電商全流程、全價值鏈,這是與很多廠商不一樣的地方?!?1月27日,京東集團副總裁李大學在接受21世紀經(jīng)濟報道記者采訪時表示,除了部分財務(wù)系統(tǒng)之外,京東從前端的交易系統(tǒng)到供應(yīng)鏈,到倉儲、配送、客服以及售后等的技術(shù)支撐體系,全部由自己研發(fā),“這樣全流程數(shù)據(jù)的積累,也是京東大數(shù)據(jù)區(qū)別于其他廠商的地方”。
李大學對記者表示,其2008年剛加入京東時,技術(shù)團隊僅有30多人,現(xiàn)在短短幾年已經(jīng)發(fā)展到4000多人的隊伍,其中負責大數(shù)據(jù)部分的團隊有300多人。
“基于大數(shù)據(jù)對客戶情緒的判斷,京東甚至可以把不同情緒的客戶自動接入到擅長處理相對應(yīng)情緒的客服?!崩畲髮W說。
要把大數(shù)據(jù)玩小
《21世紀》:外界對京東物流的覆蓋、速度和服務(wù)印象比較深刻,相對而言對京東技術(shù)板塊了解不多。是不愿意說,還是沒什么可說?
李大學:京東送貨速度快,給用戶很好的體驗,再加上正品,買東西放心,沒假貨,發(fā)展速度特別快。
至于技術(shù),我們確實說得不多,這和老劉(劉強東)的習慣有關(guān)系,我們愿意做一個務(wù)實的企業(yè)。我們的技術(shù)人員也更愿意用事實和結(jié)果來說話。
其實物流,背后也是技術(shù)。我們雙11前上線的亞洲一號,處理量很厲害,里面很多自動化設(shè)備的流程就是靠技術(shù)系統(tǒng)實現(xiàn),包括揀貨的路徑、貨品暫存區(qū)域等,通過大數(shù)據(jù)的使用可以大大提升庫房的效率。這就是技術(shù)。今天我們談大數(shù)據(jù),其實京東在大數(shù)據(jù)方面有很多目標和戰(zhàn)略,我認為其中不少在業(yè)界是比較超前的。
《21世紀》:京東的整個技術(shù)架構(gòu)是怎樣的?大數(shù)據(jù)在其中處于什么位置?
李大學:現(xiàn)在京東技術(shù)團隊4000多人,大概有300多人在負責整個大數(shù)據(jù)的平臺,以及大數(shù)據(jù)的一些創(chuàng)新。
從技術(shù)架構(gòu)來看,最底層是基礎(chǔ)設(shè)施,就像電信運營商要鋪光纖一樣,我們也要網(wǎng)絡(luò)和服務(wù)器,機柜和機架等。這些基礎(chǔ)的設(shè)施我們會用云的方式給它管理起來。
再往上的話,就是我們的數(shù)據(jù)層,解決數(shù)據(jù)的存儲、運輸、加密,以及加工處理、挖掘。大數(shù)據(jù)的工作就在這一層。
再上面我們叫API層,就是應(yīng)用接口層。我們把功能、數(shù)據(jù)、接口等全部抽象成API,大家可以公用。一個團隊可以共享很多知識產(chǎn)權(quán),而且相互之間接口變簡單了。比如說有三個部門,你的功能我要,我的功能你想調(diào),怎么辦?我們做一個API層,大家都可以寫都可以調(diào)。
第四層才是應(yīng)用層,就是與用戶交互層了,有時候是APP程序,有時候是網(wǎng)站,他都是應(yīng)用。
《21世紀》:京東的數(shù)據(jù)有什么特征?
李大學:講大數(shù)據(jù)大家都知道四個V。其實,京東的數(shù)據(jù)最大特征還不是四個V,而是我們數(shù)據(jù)的價值鏈特別長。
你到我網(wǎng)站上來看了什么東西,停留多長時間,看沒看評論,有沒有把他加入購物車,加入購物車買沒買,每天看了幾次,乃至買了以后的行為全部都有。然后下了訂單到庫房、配送的過程都有,數(shù)據(jù)鏈最完整。如果你有售后問題和返修問題,我也有數(shù)據(jù)。不像一些友商,就是一個網(wǎng)站,一個點擊流。
京東為什么敢做白條業(yè)務(wù)?因為我們有信息。所以京東數(shù)據(jù)的特征,就是一個“全”字。很多人談大數(shù)據(jù),一上來強調(diào)數(shù)據(jù)量大,其實我不認為量大是一個問題。
我有一個觀點,其實要把大數(shù)據(jù)玩小,不要整天強調(diào)大數(shù)據(jù),但是根本落不了地。就像小時候?qū)懽魑?,不要寫長篇大論,而是要從小處著手,以小見大。
傳統(tǒng)的大數(shù)據(jù)組織都是按照主題來,商品、訂單、物流、廣告都是不同的主題。這樣是有缺陷的。我的理念是數(shù)據(jù)要按照用戶來。每一個用戶到京東,我都給你開一個數(shù)據(jù)銀行,圍繞著用戶來存儲、處理。
當然以用戶為中心,看起來小,其實也很大,就是要做到完整。如果這個過程完成了,用戶體驗還可以優(yōu)化,技術(shù)架構(gòu)還可以有一個升級,這是我們最近在研究的東西。當然,現(xiàn)在還沒有正式形成成果,只是做一些研究,但是這是方向。
京東大數(shù)據(jù)的五個價值
《21世紀》:大數(shù)據(jù)對京東具體帶來了什么價值?
李大學:大數(shù)據(jù)最核心的還是用戶畫像。這一點做好以后,我們對用戶更了解,接下來就可以做一系列工作,比如圍繞著用戶進行精準營銷,然后圍繞網(wǎng)站和APP可以做千人千面,讓用戶轉(zhuǎn)化率更高。目前千人千面在移動端已經(jīng)上線,網(wǎng)站在測試后也將上線。
有了用戶畫像技術(shù)還可以對用戶分群,我們就知道哪個人群可以賺錢,發(fā)優(yōu)惠券的時候就更有針對性。
第二個層面的大數(shù)據(jù)應(yīng)用是預(yù)測。對銷量的預(yù)測決定我們定多少貨,從而提高庫存管理能力和資金周轉(zhuǎn)能力。再比如,對用戶的行為也可以預(yù)測,算出你下一個點擊是什么。
第三個我們比較重視的應(yīng)用,就是圍繞著商品的價格彈性,進行采銷互動。盲目的降價不一定帶來銷量,以前讓我銷售額增長就降毛利,讓我毛利增長銷售額就不增長。大數(shù)據(jù)告訴你兩個都可以增長,通過采銷互動可以模擬給你看,毛利有多少,銷售額漲了多少,沒有采購之前給你模擬出來。
第四個方面,大數(shù)據(jù)應(yīng)用就是在運營的其他環(huán)節(jié)里面,去提高效率,去降成本。比如說庫房里優(yōu)化檢貨的路徑,貨架上的擺貨邏輯。還有我們的配送網(wǎng)絡(luò),一個配送站或自提點該不該開,怎么開,怎么覆蓋用戶,全國的配送網(wǎng)絡(luò)怎么優(yōu)化,全部可以大數(shù)據(jù)算出來。電商里面成本效率這件事情,沒有大數(shù)據(jù)做不到的。
第五個就是大數(shù)據(jù)影響我們的決策。通過大數(shù)據(jù)來判斷品類怎么去拓展,未來的機會點在哪,公司是否要做戰(zhàn)略調(diào)整等。領(lǐng)導腦子里面想的東西要經(jīng)過大數(shù)據(jù)驗證,到底是不是這回事。
京東的決策過程已經(jīng)漸漸成為用數(shù)據(jù)說話。
《21世紀》:京東的大數(shù)據(jù)能力,形成了哪些具體的產(chǎn)品?
李大學:產(chǎn)品有很多,可以說涵括電商的全價值鏈。我具體講一個。大家都知道京東有一個JDPhone計劃。京東通過這個計劃與很多手機廠商合作,通過大數(shù)據(jù)來決定下一代產(chǎn)品的方向。這背后所涉及的就是我們的一個大數(shù)據(jù)產(chǎn)品——慧眼。
傳統(tǒng)的制造商要做一款手機,先去做用戶調(diào)研,然后閉門造車在家里設(shè)計,設(shè)計完了生產(chǎn)一堆庫存,把庫存發(fā)到各個零售渠道。我們認為大數(shù)據(jù)時代,這個模式要變。我們和手機廠商合作,把京東的大數(shù)據(jù)開放給他們,手機廠商就可以以此為參考,決定他們的產(chǎn)品定位、配置和設(shè)計。努比亞和榮耀通過這個計劃發(fā)展得都很好。
這里面的關(guān)鍵是長期的數(shù)據(jù)積累,如果沒有這個數(shù)據(jù)積累,大數(shù)據(jù)技術(shù)再牛也沒用。
大數(shù)據(jù)開放考慮API模式
《21世紀》:京東現(xiàn)在的大數(shù)據(jù)平臺也是基于Hadoop,那么發(fā)展的過程中是否存在從集中式到分布式變化的過程,或者說“去IOE”的過程?
李大學:大數(shù)據(jù)平臺非常復雜,Hadoop本身解決的是分布式大數(shù)據(jù)存儲,在這上面還要有實時計算的技術(shù)、分布式的挖掘系統(tǒng)。當然這里面還有安全。
所以企業(yè)沒到一定的規(guī)模,沒有一定的研發(fā)投入很難管理大數(shù)據(jù)平臺。僅僅抓一個Hadoop容易,但是要把他玩轉(zhuǎn)比較難了。你可能幾百臺Hadoop容易管,像我們上萬臺的Hadoop集群,就必須有二次開發(fā)能力。
京東也在想,未來這些技術(shù),怎么為業(yè)界所用,把它開放給行業(yè)去用,這是我們未來想去做的,我們希望2015年能在這方面有更多探討。
至于你說的“去IOE”,這個過程并不明顯。京東從中關(guān)村起家,最初服務(wù)器就是DIY,自己來定義規(guī)格。而且我們即將宣布和IT產(chǎn)業(yè)核心企業(yè)的合作,讓更多電商和互聯(lián)網(wǎng)行業(yè)的伙伴分享京東在這方面的成果。基于我們對電商的這種理解,現(xiàn)在市場上的服務(wù)器存在很大的浪費,表現(xiàn)在內(nèi)存和CPU不匹配。
《21世紀》:京東包括大數(shù)據(jù)在內(nèi)的技術(shù)系統(tǒng)幾乎采取自研的模式,這是否與社會分工理論相悖?
李大學:其實我們也跟業(yè)界不斷做交流,我們研發(fā)團隊有一句話,“請進來,走出去”。我們的技術(shù)開放日,報名的人人滿為患。
但是對于京東這樣規(guī)模的公司來說,我們基本上找不到服務(wù)商能解決自己的大數(shù)據(jù)問題。互聯(lián)網(wǎng)行業(yè)有個規(guī)律,叫冪律分布。放在電商行業(yè)也一樣,“高個子”就那幾家,市場上的電商解決方案提供商,只能也只會為“矮個子”服務(wù),因為這部分企業(yè)數(shù)量大,有規(guī)模效應(yīng),而為高個子服務(wù)它掙不了多少錢。因此,京東這樣的企業(yè)只能自己發(fā)展,自己摸索。市面上服務(wù)商的產(chǎn)品和技術(shù),也沒有機會在京東這種級別的平臺上進行驗證和演化。
沒人能為京東提供解決方案,市場上的成熟解決方案也解決不了京東的問題。但是反過來京東技術(shù)可以為他們所用,高個子都能用,矮個子用就沒有什么問題,無非剪短一點。
《21世紀》:那么,京東在開放自己的大數(shù)據(jù)能力方面有什么具體想法?
李大學:應(yīng)該說開放的話,我們目前還處在一個初級階段,未來還要深化。我的考慮是“數(shù)據(jù)API化”,你要數(shù)據(jù)可以調(diào),調(diào)了就可以用,而不用管后臺的模型。
目前業(yè)界在這方面的所謂對外開放,主要還是開放計算能力和存儲能力,屬于基礎(chǔ)設(shè)施層面。我認為應(yīng)該再往上走一個層次,在應(yīng)用層和商業(yè)層去做,而不是在底層拼價格。
京東明年5月會落成一個非常大的數(shù)據(jù)中心,在萬事俱備的時候,我們會公布具體的商業(yè)策略
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準備指南? ? 在數(shù)據(jù)驅(qū)動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認 ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預(yù)測分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢預(yù)判? ? 在數(shù)據(jù)驅(qū)動決策的時代,預(yù)測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點,而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報考到取證的全攻略? 在數(shù)字經(jīng)濟蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗:捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準 ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗:數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認證作為國內(nèi)權(quán)威的數(shù)據(jù)分析能力認證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對策略? 長短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨特的門控機制,在 ...
2025-07-07統(tǒng)計學方法在市場調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場調(diào)研是企業(yè)洞察市場動態(tài)、了解消費者需求的重要途徑,而統(tǒng)計學方法則是市場調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03