
自曝其短、奮起補(bǔ)課的事兒還是靜悄悄地進(jìn)行。
當(dāng)攝像師不斷變換機(jī)位尋找最佳視角拍攝時(shí),潘寶坤有點(diǎn)憤怒了。你們出去!別拍了!等我們做好再回來!他吼道。
這一幕發(fā)生在1月13日晚,在阿里巴巴杭州西溪園區(qū),一個(gè)被稱為DNA項(xiàng)目的秘密計(jì)劃正進(jìn)入最關(guān)鍵的時(shí)刻。為了記錄關(guān)鍵的場(chǎng)景,阿里專門安排了攝像師跟拍了整個(gè)項(xiàng)目的關(guān)鍵環(huán)節(jié)。偏偏在這個(gè)時(shí)候,技術(shù)后臺(tái)的代碼出了點(diǎn)狀況,人人都急出一身冷汗。潘寶坤是當(dāng)晚技術(shù)團(tuán)隊(duì)的一員。
DNA項(xiàng)目的核心是阿里C2C和B2C兩大電商交易平臺(tái)淘寶、天貓對(duì)商品SKU(商品統(tǒng)一編號(hào))的底層技術(shù)架構(gòu)更新。它在天貓對(duì)商品類目信息重新梳理的達(dá)爾文計(jì)劃的基礎(chǔ)上延展而來。如果說達(dá)爾文計(jì)劃是一顆蘋果,DNA項(xiàng)目則是一棵蘋果樹,是阿里電商生態(tài)系統(tǒng)的生命之樹。阿里集團(tuán)IPO代號(hào)不是叫阿凡達(dá)(Avatar)嗎?如果不做達(dá)爾文計(jì)劃和DNA項(xiàng)目,它是不可能成為智慧星球的,馬云的外號(hào)外星人也將名不符實(shí)。
大數(shù)據(jù)(Big Data)革命在美國有幾種典型表現(xiàn):亞馬遜有個(gè)性化搜索A9,A即算法(Algorithms)的縮寫。Netflix有76897種電影分類,內(nèi)部叫量子論、微標(biāo)簽。Facebook有新聞收集系統(tǒng)。潘多拉電臺(tái)有音樂基因工程。算法是一種神奇的掌握人類消費(fèi)行為和內(nèi)心活動(dòng)的系統(tǒng),如何將人工分類與機(jī)器智能推薦相結(jié)合,一直是互聯(lián)網(wǎng)頂級(jí)之戰(zhàn)。
簡單理解,每個(gè)超市都有很多貨架,商品分門別類擺放,如果標(biāo)簽混亂、指向不清,會(huì)影響銷售效率和購物體驗(yàn)。而作為中國最大的網(wǎng)上商店,淘寶從 2004年5月誕生起,平臺(tái)上的每一款商品都有一個(gè)特定數(shù)字代碼,2008年在淘寶內(nèi)部培育的天貓延續(xù)了這種技術(shù)架構(gòu),十年積累,阿里電商體系里的商品已經(jīng)超過了20億。與此同時(shí),商品信息的混亂、冗余、不規(guī)范越來越明顯。
一個(gè)典型的例子:在蘋果公司尚未推出iPhone 5c之前,淘寶上居然有人賣綠色版iPhone,這讓人哭笑不得,傷害了淘寶系多年建立起來的信任度。阿里巴巴共享事業(yè)群副總裁王曦若對(duì)記者說。
與美國的eBay、亞馬遜相比,淘寶的商品類目基礎(chǔ)架構(gòu)和分類管理不是一開始就標(biāo)準(zhǔn)化的,部分SKU的屬性值(如規(guī)格、型號(hào)、顏色、尺碼等)可以由賣家自定義編輯,難免會(huì)亂七八糟、混淆用戶、甚至發(fā)生SKU作弊行為(比如將常規(guī)商品和配件輔料、瑕疵品等放在一個(gè)寶貝鏈接里出售)。
對(duì)于淘寶、天貓來說,商品信息數(shù)據(jù)系統(tǒng)就像基因之于細(xì)胞那么重要,它決定著所有線上交易的進(jìn)化程度:如果類目規(guī)范整齊,交易就簡單快捷高效,進(jìn)而推動(dòng)自我革新;如果系統(tǒng)雜亂無章,玩不了算法和個(gè)性化,影響用戶體驗(yàn),甚至給阿里自身拖后腿。今年3月,馬云內(nèi)部郵件稱:云和端(Cloud +App)將是未來移動(dòng)互聯(lián)網(wǎng)的關(guān)鍵,阿里十年的目標(biāo)是建立DT(Data Technology),數(shù)據(jù)時(shí)代中國商業(yè)發(fā)展的基礎(chǔ)設(shè)施。
王曦若將阿里從達(dá)爾文計(jì)劃到DNA項(xiàng)目的最后一步操作稱為在飛行著的飛機(jī)上換引擎,來形容重整商品類目的風(fēng)險(xiǎn)之高和壓力之大。她是DNA項(xiàng)目的總負(fù)責(zé)人,帶領(lǐng)一個(gè)近百人的團(tuán)隊(duì)。
整個(gè)項(xiàng)目的關(guān)鍵是底層后臺(tái)的數(shù)據(jù)遷移,他們需要將阿里商品信息開發(fā)團(tuán)隊(duì)做好的全新模型,鏈接到無時(shí)無刻不在使用的淘寶、天貓平臺(tái)上。而所有這一切,得穩(wěn)定平滑過渡,不能驚擾賣家和用戶。
商品信息進(jìn)化
瘦死的駱駝比馬大。阿里后臺(tái)病了,商品類目信息出現(xiàn)了病菌,但它仍然是中國最大的電商平臺(tái),以沃爾瑪+亞馬遜的模式,以電商、金融和數(shù)據(jù)平臺(tái)在中國經(jīng)濟(jì)扮演著重要的角色。
阿里用來整理和存儲(chǔ)商品信息的系統(tǒng)是一個(gè)樹狀結(jié)構(gòu),在內(nèi)部叫類目。作為第三方交易平臺(tái),阿里把商品分成70多個(gè)大類,在每一個(gè)大類下分出很多子類目,子類目下又有一層層的分類。就像一顆枝繁葉茂的大樹,在樹干分出很多枝椏后,葉子已經(jīng)難以計(jì)數(shù)。
沒人否認(rèn)這套系統(tǒng)的重要性,但即便在阿里內(nèi)部,對(duì)它有了解的人也不多,因?yàn)樗诩夹g(shù)底層,不直接影響前端交易,不像阿里每年雙11的創(chuàng)紀(jì)錄銷售額那樣吸引普通人的目光。
每年雙11交易額都刷新紀(jì)錄的天貓,是阿里集團(tuán)最先推行達(dá)爾文進(jìn)化論的部門。2012年5月,天貓更名剛剛4個(gè)多月,就被發(fā)現(xiàn)有了病癥。技術(shù)人員通過后臺(tái)看到,越來越多的買家留言說很難在天貓上找到自己最初想要的商品,無論通過類目(比如服飾、電器、化妝品)還是搜索這是天貓商品的兩大流量入口。要么指向不精準(zhǔn),要么信息過于龐雜,你需要手動(dòng)翻閱好幾頁信息頁面。
對(duì)于剛剛打響名號(hào)的天貓來說,這并不是件可以忽略不計(jì)的小事。馬云對(duì)天貓的期許是,專注做B2C業(yè)務(wù)的天貓就像挺進(jìn)大別山的劉鄧大軍,是整個(gè)阿里集團(tuán)在B2C領(lǐng)域的正面作戰(zhàn)部隊(duì)。B2C是比C2C更高級(jí)的一種零售業(yè)態(tài)。原淘寶商城總經(jīng)理、獨(dú)立電商分析師黃若告訴記者,B2C平臺(tái)應(yīng)該是一個(gè) Shopping Mall,商品豐富而正規(guī),信息透明而規(guī)范。
電商發(fā)展早期,商品與信息組合的重要性被忽視。億歐網(wǎng)聯(lián)合創(chuàng)始人、電商分析師黃淵普對(duì)記者說,隨著商品數(shù)量增加,其組合方式是電商精細(xì)化運(yùn)營最重要的體現(xiàn)之一。同樣的商品有多種信息描述,既浪費(fèi)各方資源,很多時(shí)候也助長了商品的不實(shí)宣傳。電商平臺(tái)方有必要把類目規(guī)范化,這是電商購物回歸產(chǎn)品本身,促進(jìn)公平競(jìng)爭(zhēng)的必然措施。
王曦若著手讓團(tuán)隊(duì)一點(diǎn)點(diǎn)去核查,試圖厘清到底是哪個(gè)環(huán)節(jié)出了問題,最終商品信息的不確定性被定性為核心問題。他們發(fā)現(xiàn),即便是在天貓上,同一款商品的信息也未必相同,比如一款綠色的保溫杯,有的賣家描述為淡綠色塑料保溫杯,有的則是淺綠色塑膠保溫杯。
某種程度上,天貓已經(jīng)不像個(gè)Shopping Mall了。王曦若說。天貓的商品信息延續(xù)了淘寶的風(fēng)格,由賣家填寫,天貓只負(fù)責(zé)簡單審核(商品基本屬性準(zhǔn)確以及符合法律法規(guī)),這就造成了商品描述五花八門,在后臺(tái)的倉庫不便管理,前端柜臺(tái)信息混亂,買家找不到想要的商品,賣家銷售庫存管理日益繁雜。
王曦若把問題報(bào)告給時(shí)任天貓總裁張勇。張勇在高層會(huì)上說,一定要把問題盡快解決掉。他們花了幾個(gè)月調(diào)研討論,張勇拍板決定啟動(dòng)信息重整項(xiàng)目,但當(dāng)時(shí)還沒起名字。要不就叫達(dá)爾文計(jì)劃,代表著我們商品信息的一種進(jìn)化?王曦若的提議得到贊同。
阿里共享事業(yè)部派出了兩個(gè)團(tuán)隊(duì)負(fù)責(zé)達(dá)爾文計(jì)劃的運(yùn)作。天貓產(chǎn)品部的何家瓊被抽離出來,組織了一個(gè)10人團(tuán)隊(duì),叫達(dá)爾文基礎(chǔ)運(yùn)營團(tuán)隊(duì)。2012年8月,他們從手機(jī)和化妝品兩種相對(duì)簡單的商品開始,正式啟動(dòng)達(dá)爾文計(jì)劃。
從天貓開始
習(xí)慣一旦養(yǎng)成很難改變,更何況你動(dòng)的是利益。阿里先在天貓而不是在淘寶做商品類目重整,就考慮到它平臺(tái)上大多是知名品牌入駐,調(diào)整和規(guī)范的成本相對(duì)低,不至于擾亂淘寶的賣家信息海洋。
2012年8月,在天貓的后臺(tái)系統(tǒng),手機(jī)和化妝品賣家都看到了一則關(guān)于達(dá)爾文計(jì)劃的公告,詳情及需要賣家怎樣配合。如同總裁張勇謹(jǐn)慎的行事風(fēng)格,天貓?jiān)擁?xiàng)目運(yùn)作也小心翼翼。運(yùn)營團(tuán)隊(duì)先進(jìn)行調(diào)研,一是對(duì)淘寶天貓賣家和買家數(shù)據(jù)收集,內(nèi)部也與阿里負(fù)責(zé)類目的管理者(俗稱小二)溝通,二是向國外同行亞馬遜和eBay學(xué)習(xí),三是對(duì)淘寶十年來經(jīng)驗(yàn)總結(jié)。
聞思圖書專營店店主溫興歌曾經(jīng)為這樣的問題糾結(jié):某一本書的內(nèi)容既涉及商業(yè)故事,也屬于旅行見聞,到底放在商業(yè)子類目下好賣,還是放在旅游子類目下更好賣?達(dá)爾文團(tuán)隊(duì)圍繞一個(gè)基礎(chǔ)的問題開展:某個(gè)商品的類目理想中應(yīng)該是什么樣子的。他們討論這些差別,一步步涉及到最基礎(chǔ)最瑣碎的問題:為什么商家會(huì)放錯(cuò)類目?商家什么情況下會(huì)設(shè)置錯(cuò)的關(guān)鍵字?每個(gè)商品的顏色、尺碼、款式都用一串獨(dú)立的數(shù)字來表示,為什么還信息混亂?
天貓的運(yùn)營團(tuán)隊(duì)給平臺(tái)上手機(jī)和化妝品類目的前10名賣家打電話,介紹正在進(jìn)行中的達(dá)爾文計(jì)劃,征得對(duì)方同意后,拋出一系列問題:商品的材質(zhì)是什么?一共有幾個(gè)型號(hào)?多少種顏色?一般每個(gè)月生產(chǎn)多少銷售多少?放在天貓倉庫又有多少?這些看似不太相關(guān)的問題,命中的才是商品最核心的信息。何家瓊說,商品信息最終是為交易服務(wù)。
第一輪商家調(diào)研完成后,天貓團(tuán)隊(duì)坐在一起總結(jié),得出一個(gè)令他們震撼的結(jié)論:天貓的類目結(jié)構(gòu)已經(jīng)遠(yuǎn)遠(yuǎn)不能滿足行業(yè)的發(fā)展?fàn)顩r了,很多商品早就更新?lián)Q代,或者豐富了款式型號(hào),類目卻還是2008年最初建成的樣子。
他們一鼓作氣開了賣家溝通會(huì)。2013年初,溫興歌從浙江金華趕到杭州,在位于西湖國際大廈的天貓辦公室參加了圖書類目的賣家溝通會(huì)。會(huì)場(chǎng)有20多個(gè)圖書經(jīng)銷同行,一個(gè)天貓圖書小二,一個(gè)達(dá)爾文基礎(chǔ)運(yùn)營團(tuán)隊(duì)成員,一個(gè)記錄員。討論的話題是以后我們?cè)趺刺顚憟D書信息。溫興歌說。以前都是賣家自由填寫,天貓簡單審核即可。現(xiàn)在天貓?zhí)岢鏊麄儠?huì)為每一類商品設(shè)置多種屬性,讓賣家進(jìn)行選擇而不是自由填寫,比如給名人傳記設(shè)置框架,中國的還是外國的,男人還是女人,政治的還是商業(yè)等,賣家在選項(xiàng)里勾一下就行。
因?yàn)檫@涉及到未來自家店鋪的生意,賣家們都暢所欲言,提出種種可能的困難或建議方案。他們也反駁天貓的某些做法。套裝書就曾陷入討論僵局。天貓認(rèn)為有統(tǒng)一條形碼、版權(quán)頁上印著叢書名的系列書才算套裝書,賣家們則堅(jiān)持可以自由搭配,把兩三本好看的書組合在一起就行,無需考慮是否同一出版社、條形碼或系列叢書。溫興歌把不同出版社出的《育兒圣經(jīng)》和《睡前胎教故事》組成套裝賣后,兩本書銷量都比以往增加近30%。
溝通會(huì)效果明顯。天貓圖書的子類目調(diào)整成既有天貓定義的套裝書,也有賣家自由搭配的自由組套。畢竟天貓是個(gè)交易平臺(tái),達(dá)爾文計(jì)劃在規(guī)范商品信息的同時(shí)是為了提升交易效率和品質(zhì)。這種既要規(guī)范有序、又不影響交易銷量的做法,在其他類目后來的操作中也不時(shí)出現(xiàn)。
王強(qiáng)在天貓經(jīng)營一家海爾授權(quán)網(wǎng)絡(luò)店,是最早參加達(dá)爾文計(jì)劃試點(diǎn)的商家之一。比起以前上架新商品需要自己費(fèi)盡心思去填寫商品描述信息,現(xiàn)在從天貓的庫中直接調(diào)用,我只要填價(jià)格、庫存數(shù)量等信息就可以了,對(duì)天貓店的維護(hù)更簡易了。
但由于品牌賣家的定位營銷策略不同,他們對(duì)達(dá)爾文計(jì)劃反應(yīng)也不一致。何家瓊就遇到一個(gè)問題,耐克和阿迪達(dá)斯對(duì)天貓商品描述的要求有不同意見:在耐克的商品描述中,一個(gè)商品下面既有尺碼選項(xiàng)也有顏色選項(xiàng),而阿迪達(dá)斯的只有尺碼選項(xiàng),如果要標(biāo)識(shí)顏色,代表商品屬性的是另外一串?dāng)?shù)字。
這背后有銷量的博弈。何家瓊說,在淘寶天貓的搜索因素中,銷量占很大權(quán)重,核心表現(xiàn)就是按照商品的銷量自動(dòng)排序。以慢跑鞋為例,耐克慢跑鞋的銷量是其各種顏色之和,阿迪達(dá)斯慢跑鞋則是按紅色、藍(lán)色、紫色等不同銷量各自呈現(xiàn)。在阿里平臺(tái)有個(gè)現(xiàn)象:用戶搜索慢跑鞋時(shí),耐克因其銷量高出現(xiàn)在較為靠前的頁面,阿迪達(dá)斯則會(huì)靠后。
兩個(gè)品牌都是天貓的重要賣家,何家瓊不敢掉以輕心,親自給對(duì)方負(fù)責(zé)人及前5名的專營店賣家打電話溝通。耐克希望達(dá)爾文計(jì)劃繼續(xù)保持原來的商品描述方式,阿迪達(dá)斯則分成兩派,官方旗艦店希望商品描述和阿迪達(dá)斯官網(wǎng)保持一致,不同顏色的商品有不同的屬性值;專營店賣家考慮銷量,希望取消顏色屬性值,讓買家在統(tǒng)一款號(hào)的商品下自行選擇顏色。
目前,達(dá)爾文團(tuán)隊(duì)還沒想到合適的方案來解決這個(gè)問題。何家瓊的設(shè)想是,對(duì)于服裝服飾等非標(biāo)準(zhǔn)化商品(非標(biāo)品),也許可以放開一些彈性空間,天貓負(fù)責(zé)較大比例的類目管理,賣家根據(jù)自身情況進(jìn)行個(gè)性化類目描述。耐克和阿迪達(dá)斯兩家天貓旗艦店負(fù)責(zé)人拒絕就此發(fā)表意見。
改變搜索邏輯
2013年,天貓陸續(xù)完成了對(duì)數(shù)碼、家電、手表等標(biāo)品,服裝、化妝品、農(nóng)產(chǎn)品等非標(biāo)品的類目重新調(diào)整。
普通用戶感受到的是在天貓購物更快速準(zhǔn)確了。王曦若說,如果用戶的搜索信息足夠明確,我們甚至能提供唯一符合要求的商品。比如輸入iPhone 5s,搜索頁面中心只會(huì)出現(xiàn)一款手機(jī),不再有手機(jī)殼、配件等無關(guān)信息,為用戶們節(jié)省大量時(shí)間。
如此精準(zhǔn)的推送來自天貓搜索系統(tǒng)的一套數(shù)據(jù)算法。當(dāng)用戶輸入iPhone 5s時(shí),搜索后臺(tái)會(huì)找到天貓賣家所有的iPhone 5s手機(jī),根據(jù)銷量、人氣、價(jià)格、顧客評(píng)價(jià)等算出綜合得分最好的一個(gè),系統(tǒng)再次評(píng)估后推送給用戶。這是一套相對(duì)公平的算法,面向所有賣家和用戶。
在類目之外,搜索是天貓最大的流量入口。過去5年,天貓搜索依賴的是模糊詞匯,你輸入一個(gè)關(guān)鍵詞,后臺(tái)系統(tǒng)會(huì)幫忙匹配很多商品,只要這些商品的標(biāo)簽中含有這個(gè)關(guān)鍵詞。天貓產(chǎn)品運(yùn)營部產(chǎn)品總監(jiān)胡秋根對(duì)記者說。他是天貓搜索業(yè)務(wù)的負(fù)責(zé)人,在達(dá)爾文計(jì)劃運(yùn)作過程中,搜索也配合商品信息的改變有了突破。
模糊詞匯匹配的好處不言而喻:盡可能一網(wǎng)打盡把相關(guān)的商品展示給用戶。余杭區(qū)的馬小姐想找一件真絲無袖連衣裙,理論上她只要輸入這7個(gè)字,不管翻多少頁,她都能從中找到自己想找的那一件。胡秋根說。
這其實(shí)是歷史遺留問題,跟天貓前期商品信息的模糊混亂息息相關(guān)。達(dá)爾文計(jì)劃使天貓補(bǔ)上了商品類目規(guī)范和升級(jí)的課,阿里愈加在大數(shù)據(jù)應(yīng)用上領(lǐng)先京東、當(dāng)當(dāng)、蘇寧等競(jìng)爭(zhēng)對(duì)手(這三家拒絕接受采訪)。如今在天貓,你搜索一件商品,其展示結(jié)果從原來的成百上千件,變?yōu)榫酆铣纱_定的一件或幾件。
搜索邏輯的變化對(duì)賣家影響很大,讓很多賣家改變了運(yùn)營邏輯。以前很多賣家為了銷量,會(huì)為商品添加很多標(biāo)簽,現(xiàn)在天貓更青睞推送信息精準(zhǔn)的優(yōu)質(zhì)商品,賣家們盡力運(yùn)營好某一款或幾款主打商品。爆款在天貓將成為過去時(shí)。天貓搜索不再推送多種同款商品給用戶,達(dá)不到賣家們跟風(fēng)的效果。胡秋根說,這也更加符合天貓的定位,這個(gè)平臺(tái)的核心競(jìng)爭(zhēng)力是品牌,而不是只以銷量取勝。
釜底抽薪
當(dāng)達(dá)爾文計(jì)劃逐漸開花結(jié)果時(shí),一項(xiàng)更有價(jià)值、同時(shí)也更有難度的項(xiàng)目也同時(shí)交錯(cuò)在開展。它觸及的是整個(gè)阿里電商平臺(tái)的底層數(shù)據(jù),是阿里發(fā)展大數(shù)據(jù)業(yè)務(wù)和未來DT目標(biāo)的根基。
2013年2月,這個(gè)項(xiàng)目由阿里共享事業(yè)群的商品技術(shù)開發(fā)平臺(tái)團(tuán)隊(duì)提出。該平臺(tái)負(fù)責(zé)人趙營苗告訴記者,從持續(xù)使用十年的經(jīng)驗(yàn)來看,淘寶平臺(tái)的樹形結(jié)構(gòu)對(duì)于賣家和買家都簡單易用,但是隨著環(huán)境變化,越來越多的新商品出現(xiàn),有的難以歸類,這棵生命之樹不再強(qiáng)壯如初,也就是說,現(xiàn)有的結(jié)構(gòu)類目已經(jīng)跟不上行業(yè)的發(fā)展了,跟時(shí)代比起來落伍啦。
阿里運(yùn)營部門的梳理結(jié)果更夸張。除了國家法律政策規(guī)定不能交易的,槍支彈藥毒品不能賣,在淘寶上,你注冊(cè)個(gè)賣家賬號(hào),什么都可以賣。DNA項(xiàng)目運(yùn)營負(fù)責(zé)人朱春勇說。趙營苗承認(rèn),這就是我們的商品數(shù)據(jù)庫模型出了問題,改變迫在眉睫。
在阿里大數(shù)據(jù)委員會(huì)會(huì)長車品覺看來,這不是阿里一家公司的問題,整個(gè)電商行業(yè)其實(shí)都存在商品信息管理的難題,在傳統(tǒng)零售行業(yè),這也是至關(guān)重要的一環(huán)。大數(shù)據(jù)應(yīng)用中最重要的三個(gè)因素是數(shù)據(jù)的可實(shí)時(shí)性、數(shù)據(jù)的可解釋性和數(shù)據(jù)質(zhì)量的準(zhǔn)確穩(wěn)定性。DNA項(xiàng)目涉及的是商品信息的準(zhǔn)確穩(wěn)定性,對(duì)于阿里大數(shù)據(jù)應(yīng)用來說是基礎(chǔ)而且重要的步驟。
2003年5月,淘寶創(chuàng)立10周年,每個(gè)部門都對(duì)業(yè)務(wù)做了大梳理。歷經(jīng)兩三個(gè)月,商品開發(fā)團(tuán)隊(duì)拿出了可行的整體項(xiàng)目方案。他們決定先從手機(jī)、3C產(chǎn)品、數(shù)碼配件、酒類、保健品5個(gè)類目開始,相對(duì)其他要遷移的69類商品來說,這些類目商品數(shù)據(jù)相對(duì)標(biāo)準(zhǔn)和規(guī)范。
但意義如此重大,項(xiàng)目開展時(shí)間卻遲遲未定。在阿里內(nèi)部,價(jià)值觀和企業(yè)文化影響每個(gè)員工,讓天下沒有難做的生意是統(tǒng)一口號(hào),但是每個(gè)業(yè)務(wù)線都有自己的業(yè)績?nèi)蝿?wù),短期內(nèi)并不一定合拍。從一開始,DNA項(xiàng)目被各個(gè)部門接受的程度也不一樣。
時(shí)任天貓總裁的張勇看完方案提了兩點(diǎn)意見:天貓將支持項(xiàng)目的進(jìn)展,但此項(xiàng)目不能開展于2013年11月11日之前。后一條用意很明顯,雙11是天貓最重要的消費(fèi)節(jié)點(diǎn),這一天的交易額代表著阿里交易業(yè)務(wù)甚至中國電商市場(chǎng)的繁榮程度。萬一DNA項(xiàng)目出現(xiàn)任何差錯(cuò),都會(huì)讓這一天的阿里顏面掃地。
時(shí)任淘寶負(fù)責(zé)人張宇也表態(tài)支持項(xiàng)目開展,她認(rèn)為此事對(duì)于淘寶系的交易平臺(tái)至關(guān)重要,但有沖突的是,她希望保持淘寶的強(qiáng)勢(shì),比如能夠整理清晰的類目一定要做到規(guī)范標(biāo)準(zhǔn),但對(duì)于暫時(shí)理不清的類目,她希望從淘寶剝離出去的天貓能夠遵循淘寶的規(guī)則。
阿里的搜索、廣告、聚劃算等業(yè)務(wù)部門的意見也各自不同。特別是廣告部門,年底要沖業(yè)績,極力希望大搬家推遲。最終,王曦若和趙營苗的團(tuán)隊(duì)用了兩三個(gè)月時(shí)間,說服集團(tuán)高層拍板決定2014年初啟動(dòng)DNA項(xiàng)目。
朱春勇帶領(lǐng)的運(yùn)營團(tuán)隊(duì)是2013年5月加入DNA項(xiàng)目組的。彼時(shí)移動(dòng)互聯(lián)網(wǎng)船票戰(zhàn)爭(zhēng)奪已經(jīng)火熱,騰訊的微信如日中天。淘寶系的后臺(tái)體系是以PC端為基礎(chǔ)構(gòu)建的,整體結(jié)構(gòu)謹(jǐn)慎安全,但在以輕和快為標(biāo)準(zhǔn)節(jié)奏的移動(dòng)互聯(lián)時(shí)代,它顯得繁瑣和沉重。朱春勇說,我們希望未來淘寶的商品信息架構(gòu)是輕便和靈活的。現(xiàn)在人人都可以是電商賣家,比如我家院子有棵石榴樹,可能就是一瞬間的想法,我用手機(jī)拍下來,發(fā)到淘寶上去賣。
DNA項(xiàng)目團(tuán)隊(duì)有30多人,分為兩批:一批是對(duì)商品或者賣家比較熟悉的人,及時(shí)和賣家溝通,把商品相關(guān)行業(yè)的現(xiàn)狀和趨勢(shì)摸透,為技術(shù)后臺(tái)重構(gòu)數(shù)據(jù)庫做準(zhǔn)備;另一批是對(duì)淘寶系產(chǎn)品比較熟悉的人,他們有良好的技術(shù)背景,做過產(chǎn)品經(jīng)理,能從產(chǎn)品和用戶體驗(yàn)方面對(duì)新的商品數(shù)據(jù)庫提供意見。
淘寶的類目數(shù)據(jù)梳理也交給了朱春勇的團(tuán)隊(duì)。在看似完備的類目體系上,他們發(fā)現(xiàn)了諸多瑣碎問題,比如材質(zhì)為牛皮的商品,有女裝,有男裝,有包,有鞋等,這些類目之下的牛皮屬性值都不一樣,商品數(shù)據(jù)就因此多出幾串不必要的數(shù)字,把整個(gè)商品數(shù)據(jù)庫撐得龐大冗余。把這些混亂的數(shù)據(jù)整理出來,在技術(shù)層面是很難實(shí)現(xiàn)的。我們都會(huì)人工去做,人肉輸入和整理。僅僅這項(xiàng)工作,就花費(fèi)了整個(gè)團(tuán)隊(duì)半年多的時(shí)間。
接下來,他們跟行業(yè)專家交流,還跟商標(biāo)網(wǎng)、國家物品編碼中心等專業(yè)機(jī)構(gòu)交流,要把淘寶系商品信息做得既有數(shù)據(jù)化屬性,又符合國家和行業(yè)規(guī)范。賣家的意見也非常重要。每一類的商品信息數(shù)據(jù)化之前,運(yùn)營團(tuán)隊(duì)都會(huì)聯(lián)系這類商品賣家集中的區(qū)域,做一兩次集中訪談。
2013年12月25日,圣誕節(jié),阿里西溪園區(qū)布滿圣誕樹和彩燈,很多員工放假回家過節(jié),但阿里DNA團(tuán)隊(duì)卻沒有這項(xiàng)福利,DNA項(xiàng)目最后也是最重要的環(huán)節(jié)更換技術(shù)后臺(tái)將于2014年1月13日晚正式啟動(dòng),他們必須加班加點(diǎn)。
阿里的野心
孔柏漢的神經(jīng)一直處于緊張狀態(tài)。從2013年12月25日開始,他所在的小組開始負(fù)責(zé)淘寶商品數(shù)據(jù)訂正,也就是把整個(gè)類目的商品屬性值進(jìn)行重新更改和修訂。在操作期間,賣家不能在后臺(tái)發(fā)布或更改商品信息,但買家可以正常交易。然而一旦訂正失誤,整個(gè)類目系統(tǒng)都會(huì)癱瘓。
整個(gè)淘寶系共有20億商品,每個(gè)商品都有自己的獨(dú)立代碼,一旦出現(xiàn)兩種商品代碼一致,可能整個(gè)類目都會(huì)凍結(jié)癱瘓。趙營苗說,如果發(fā)生這種情況,就會(huì)影響到前端用戶的交易,這會(huì)是很嚴(yán)重的事故,必須做好各種預(yù)案,沒人敢掉以輕心。這不僅僅與阿里整個(gè)平臺(tái)有關(guān),更關(guān)系到數(shù)百萬的淘寶系賣家、超過5億的注冊(cè)用戶,一定不能出問題,一定要把這個(gè)飛機(jī)引擎換好。
1月13日之前,齊國梁所在的5人小組負(fù)責(zé)技術(shù)底層風(fēng)險(xiǎn)點(diǎn)的梳理。阿里集團(tuán)涉及交易的20多個(gè)業(yè)務(wù)部門梳理出來300多個(gè)風(fēng)險(xiǎn)點(diǎn),齊國梁小組的任務(wù)就是拿出規(guī)避這些風(fēng)險(xiǎn)的預(yù)案。到了1月13日,我們的風(fēng)險(xiǎn)點(diǎn)梳理工作完成,又立即投入數(shù)據(jù)遷移。
好在這場(chǎng)不為人知的硬戰(zhàn)順利完成。1月13日到1月30日,歷經(jīng)每晚從7點(diǎn)到次日早晨7點(diǎn)的奮戰(zhàn),手機(jī)、3C等5大類目的數(shù)據(jù)遷移全部完成,而且沒有一次影響平臺(tái)前端的購物交易。阿里的生命之樹換上了部分新的血液。
2月12日下午,杭州下了2014年的第二場(chǎng)雪,阿里商品開發(fā)技術(shù)平臺(tái)團(tuán)隊(duì)所在的5號(hào)樓九天閣會(huì)議室,王曦若拍著趙營苗的肩膀說:哥們,今晚開始又是一場(chǎng)硬戰(zhàn),讓兄弟們加油啊!
12個(gè)日以繼夜的緊張過后,商品開發(fā)技術(shù)平臺(tái)團(tuán)隊(duì)終于松了口氣。趙營苗站在DNA項(xiàng)目會(huì)議室,對(duì)滿臉倦容的20多個(gè)員工說:兄弟們,回家睡覺吧,我們完工啦!
至此,淘寶20億商品的信息數(shù)據(jù)遷移全部完成。從用戶的角度來說,這個(gè)項(xiàng)目還暫時(shí)感受不到變化。我們第三個(gè)階段就是修訂子類目,項(xiàng)目完成后,用戶在使用搜索和類目時(shí)就會(huì)有新體驗(yàn),到時(shí)候淘寶商品將一改繁雜混亂的狀態(tài),以一種相對(duì)整齊、規(guī)范、清新的姿態(tài)出現(xiàn)在用戶面前。趙營苗說。
阿里并不止于做達(dá)爾文計(jì)劃和DNA項(xiàng)目,更有野心打造整個(gè)中國電商行業(yè)的標(biāo)準(zhǔn)商品體系,甚至有一天淘寶天貓的商品信息庫不僅服務(wù)于自身,也可以服務(wù)到站外,服務(wù)到愿意擁抱互聯(lián)網(wǎng)的傳統(tǒng)企業(yè)。朱春勇說,比如有一個(gè)賣家,他在線下有自己的品牌、專賣店、工廠,同時(shí)他也代理別的品牌,他可以做淘寶集市 C2C,他也可以給天貓供貨,他可能還走京東、當(dāng)當(dāng)?shù)那榔鋵?shí)整個(gè)互聯(lián)網(wǎng)目前沒有一個(gè)統(tǒng)一的商品標(biāo)準(zhǔn)。我們做DNA的愿景,就是建立一個(gè)全網(wǎng)甚至線下都能用的統(tǒng)一的商品信息體系。
達(dá)爾文在其進(jìn)化論的代表作《物種起源》里寫道:芽由于生長而生出新芽,這些新芽如果健壯,就會(huì)分出枝條遮蓋四周許多較弱枝條,所以我相信,這巨大的‘生命之樹’在其傳代中也是這樣,這株大樹用它的枯落的枝條填充了地殼,并用它的生生不息的美麗的枝條遮蓋了地面。
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報(bào)考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計(jì)的實(shí)用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強(qiáng)大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實(shí)施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價(jià)值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時(shí)代,BI ...
2025-07-10SQL 在預(yù)測(cè)分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢(shì)預(yù)判? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代,預(yù)測(cè)分析作為挖掘數(shù)據(jù)潛在價(jià)值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價(jià)值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點(diǎn),而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報(bào)考到取證的全攻略? 在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭(zhēng)搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢(shì)性檢驗(yàn):捕捉數(shù)據(jù)背后的時(shí)間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢(shì)性檢驗(yàn)如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時(shí)間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時(shí)間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實(shí)戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗(yàn):數(shù)據(jù)趨勢(shì)與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢(shì)變化以及識(shí)別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對(duì)策略? 長短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨(dú)特的門控機(jī)制,在 ...
2025-07-07統(tǒng)計(jì)學(xué)方法在市場(chǎng)調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場(chǎng)調(diào)研是企業(yè)洞察市場(chǎng)動(dòng)態(tài)、了解消費(fèi)者需求的重要途徑,而統(tǒng)計(jì)學(xué)方法則是市場(chǎng)調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動(dòng)力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動(dòng)力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價(jià)值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03