
作者 | 四月
來源 | 機(jī)器之能
過去五年,阿里在全球人工智能的激烈賽道上悄然跑進(jìn)了第一梯隊,背后一群以達(dá)摩院稱號對外示人的科學(xué)家群體愈發(fā)神秘撩人。
這是一群野心勃勃的科學(xué)家,親手打破旁人艷羨的舒適區(qū),踏入充滿禁忌的未知地,只為尋覓更廣闊的舞臺。他們一生都致力「求證」,或于學(xué)術(shù)理論,或于技術(shù)價值,并愿意承擔(dān)隨之而來的冒險和境遇窘迫。
這五年,阿里經(jīng)歷了人工智能技術(shù)長征的發(fā)端與突圍,而他們,也經(jīng)歷了一場巨大的冒險與自證。
初見之時,你或許會訝異他們滔滔不絕地談起「買單」、「落地」、「規(guī)?;沟壬虡I(yè)味濃厚的字眼,全然沒了學(xué)究氣,仿若一位身居一線的創(chuàng)業(yè)者心心念念……
直到你聽說過那段既艱難又幸運的歲月,一切便了然于心——唯有越了解真相,才會變得越務(wù)實。
人生的絕妙之處也在于此,改變他們的不是早年風(fēng)光的求學(xué)路,也并非當(dāng)下所擁有的物質(zhì)地位,而是源于一次又一次被質(zhì)疑和誤解后的絕地「自證」——不同于象牙塔里、試驗臺前的公示推理和仿真驗證,商業(yè)場上的「自證」需要拿出實實在在的業(yè)務(wù)指標(biāo)和實際效果,正如阿里辦公區(qū)里那句隨處可見的標(biāo)語——「NO DATA,NO BB」。
強(qiáng)壓之下的「自證」氛圍造就了科學(xué)家們近乎苛刻現(xiàn)實的技術(shù)價值觀。
待繁務(wù)卸下,他們重拾赤子之心,沉浸于算法公式和理論推理的樂趣。但人生并不總有自由浪漫的時刻,更漫長的是披荊斬棘的孤獨與煎熬。
通過和近十位阿里巴巴人工智能科學(xué)家的對話與交流,本文試圖還原阿里打造人工智能技術(shù)體系的荊棘路,以及路途中科學(xué)家們的內(nèi)心征途。
1 . 既艱難又幸運
多年以后,遇上北京的霧霾天,漆遠(yuǎn)沒準(zhǔn)依然會想起那個加班的春節(jié)——西大望路的阿里媽媽會議室里,一桌人戴著口罩開著會,工位上的空氣凈化器呼呼作響,窗外是望不到對面樓的霧霾天。
回國前,漆遠(yuǎn)已經(jīng)在腦海中羅列過一連串的適應(yīng)清單,以備回國后的各種挑戰(zhàn),而「迷霧危機(jī)」大概是被遺漏的最重要的一條,它不僅來自于北京的天氣,還包括那個大膽的決定。
漆遠(yuǎn)曾走過一條無數(shù)理工男夢想的坦途:31 歲麻省理工大學(xué)博士畢業(yè),39 歲成為一流大學(xué)終身教授,定居美國,擁有寬敞明亮的實驗室和獨棟別墅,一位美麗的太太以及兩個可愛的孩子,一年兩次固定的長假足以讓他兼顧工作和生活的完美平衡。
直到一次大膽的決定,漆遠(yuǎn)親手打破了這種平衡。在拒絕谷歌、Facebook、百度等公司的邀約后,漆遠(yuǎn)決定歸國到杭州工作,選擇了當(dāng)時看起來「最沒有技術(shù)范兒」的阿里。
2014 年 9 月 19 日,時任阿里巴巴合伙人的王堅帶著漆遠(yuǎn)來到紐交所,共同見證了阿里巴巴的上市,7 位敲鐘人全是阿里電商的買家和賣家,卻沒有一位是科學(xué)家。
面向華爾街,這家彼時市值 2400 億美金的公司并不滿足被定義為一家「電商公司」。他正在謀劃一個嶄新而宏偉的「想象力故事」,以便讓公司在未來獲得更強(qiáng)勁的增長動力。
他明白,前沿技術(shù)會是這個故事的主角,緊接著 iDST(數(shù)據(jù)科學(xué)與技術(shù)研究院 Institute of Data Science & Technologies)宣布成立,漆遠(yuǎn)和金榕成為早期創(chuàng)始人。
但彼時彼地,故事聽起來不免有些冒險主義——中國互聯(lián)網(wǎng)市場仍處在模式創(chuàng)新的初級階段,一家以商業(yè)利益為本的企業(yè)憑什么打造技術(shù)驅(qū)動的研究院?國內(nèi)幾乎沒有任何成功的營運模式可以參考。
未知的挑戰(zhàn)首先降臨到了早期創(chuàng)始人和研究機(jī)制身上。
▲漆遠(yuǎn),現(xiàn)達(dá)摩院金融智能實驗室
加入阿里后,漆遠(yuǎn)接到的首個任務(wù)是打造一套大規(guī)模機(jī)器學(xué)習(xí)平臺,落地到淘寶的廣告平臺阿里媽媽。他清楚地記得,當(dāng)時手里攥著兩千萬特征,14 天的數(shù)據(jù)。由于數(shù)據(jù)量太少,他計劃積累到半年數(shù)據(jù)后再啟動。
同時,他還提交了一份申請數(shù)千臺服務(wù)器的計劃。這并不是一筆小數(shù)目,直到現(xiàn)在一塊英偉達(dá)的計算卡仍然要價 2000 美金,計劃討論后就被否決了。
等了半年,服務(wù)器仍沒有撥下來,巧婦也難為無米之炊?!府?dāng)時沒有 GPU 集群,整個集團(tuán)都沒有」,漆遠(yuǎn)說道,「同事們認(rèn)為,『你們這幫教授老師過來,基本不懂業(yè)務(wù),也不懂技術(shù)』」。
秀才遇到兵,有理說不清。漆遠(yuǎn)的團(tuán)隊陷入了不能「自證」的悖論里:沒有 GPU 集群,如何證明自己的算法和技術(shù)高效?不能證明自己的算法和技術(shù)高效,如何爭取到 GPU 集群?
漆遠(yuǎn)曾試圖據(jù)理力爭,僵持狀態(tài)幾近半年,「團(tuán)隊一度走在解散的邊緣」。
金榕是 iDST 的另一位創(chuàng)始人,美國密歇根州立大學(xué)終身教授,曾獲得過美國國家科學(xué)基金會獎(漆遠(yuǎn)也獲得過該獎)——有超過 200 位諾貝爾獎得主都獲得過這個獎金的資助。
▲金榕,現(xiàn)達(dá)摩院機(jī)器智能研究領(lǐng)域 負(fù)責(zé)人
金榕帶領(lǐng)團(tuán)隊為「聚劃算」提供流量分發(fā)的技術(shù)優(yōu)化,團(tuán)隊很自然地把低價商品排列在搜索和推薦結(jié)果的前列以提升成交量,卻忽視了對業(yè)務(wù)本質(zhì)的理解——低價雖可刺激購買,卻讓目標(biāo)用戶群從二三城市轉(zhuǎn)移到三四線城市。
「雖然 GMV 上去了,但產(chǎn)品的價值都變了」,金榕說道。
業(yè)務(wù)為技術(shù)開路,科學(xué)家們卻在無意中篡改了產(chǎn)品的內(nèi)核,「短板暴露得非常明顯」,金榕談道。當(dāng)時團(tuán)隊多為研究背景,精通基礎(chǔ)理論,卻缺少業(yè)務(wù)理解和工程實踐經(jīng)驗,所以看不到技術(shù)到產(chǎn)品中間的巨大鴻溝。
「你們要想在阿里發(fā)揮出真正的價值,就必須克服這些困難」,當(dāng)時的阿里 COO 張勇找到金榕和幾個骨干說道。
既然不夠熟悉業(yè)務(wù),那就去到第一現(xiàn)場吧!
于是,iDST 的早期科學(xué)家們兵分多路,以電商和金融兩大核心業(yè)務(wù)為首,深入到產(chǎn)品和工程里。金榕帶著團(tuán)隊進(jìn)入到淘寶和天貓的搜索事業(yè)部,漆遠(yuǎn)和幾位同事去了螞蟻金服,做語音的團(tuán)隊則留在了阿里云。后來這被稱為阿里科學(xué)家們的「上山下鄉(xiāng)」運動。
技術(shù)的覺醒并不止于高層,更早些,一股從下至上的創(chuàng)新力量就竄上了頭,內(nèi)部創(chuàng)新的文化開始流行——「只要你的老大不反對,就是對你最大的支持」。
2013 年的十一國慶,李昊印象尤其深刻。他沒有旅游計劃,也不用回老家走街串巷,而是一人悶頭在辦公室里搗鼓。一連七天,他都在工位上敲打著鍵盤,像是著了魔。
終于,趕在假期結(jié)束前,他長舒一口氣——Demo 跑通了,由一塊 GPU 搭上一臺主機(jī),純手寫的用于圖像搜索的深度學(xué)習(xí)算法。再簡陋不過的裝置,但結(jié)果令人欣慰——比傳統(tǒng)算法的準(zhǔn)確度有了明顯提升。
正值第三次人工智能浪潮起勢,ImageNet 大賽進(jìn)入到第三屆,深度學(xué)習(xí)教父 Geoff Hinton 和他學(xué)生設(shè)計的 AlexNet 在賽事中大放異彩,基于深度神經(jīng)網(wǎng)絡(luò)的思路一舉解決了圖像分類的棘手難題,至此開啟神經(jīng)網(wǎng)絡(luò)百家爭鳴的盛況,更深、更寬的網(wǎng)絡(luò)層出不窮。
李昊從外文網(wǎng)站上讀到這些消息時備受鼓舞,他博士畢業(yè)于中科院光電技術(shù)研究所,來阿里不到一年,滿腔學(xué)以致用的迫切。
▲李昊,阿里巴巴資深算法專家
早在 2010 年,谷歌豪擲 1 億美金收購圖像購物搜索網(wǎng)站 Like.COM,掀起全球圖像搜索的風(fēng)口。文字搜索場景有限,圖片描述更為加精確,微軟、亞馬遜、百度紛紛出手,阿里也順勢投資了一家圖搜購物網(wǎng)站(現(xiàn)名為「淘淘搜」),通過識別圖片上的實體物品來索引網(wǎng)絡(luò)上對應(yīng)的店鋪鏈接。
遺憾的是,隨著移動互聯(lián)網(wǎng)時代的到來,圖搜風(fēng)口很快熄火,手機(jī)實拍圖的普及,讓搜索結(jié)果越來越不可控,圖搜應(yīng)用體驗大幅受挫,不少創(chuàng)業(yè)公司瀕臨倒閉。
「實拍圖的比對相比 PC 的原圖難得不是一星半點,已經(jīng)不是傳統(tǒng)圖搜技術(shù)能應(yīng)付過來的」,李昊說道。
既然傳統(tǒng)圖搜技術(shù)已經(jīng)無以為繼,那在視覺領(lǐng)域技驚四座的深度神經(jīng)網(wǎng)絡(luò)能否奏效?為此,李昊花了整個國慶假期來驗證這個想法。
「他很興奮,一直給這個看,給那個看,非常大力地推廣」,李昊回憶起將Demo交給主管時的場景。就這樣,團(tuán)隊爭取到一次向時任淘寶 CEO 展示的機(jī)會,這次是直接在手機(jī)端演示——手機(jī)拍照,實拍圖和庫里已有圖片做比對檢索,找到和相似的照片顯示——相比傳統(tǒng)算法提升了一倍。
很快,「圖像搜索」項目在 2014 年正式啟動,目標(biāo)是落地到手淘(手機(jī)淘寶應(yīng)用)平臺。
剛來阿里三個月的潘攀被任命為負(fù)責(zé)人,兼顧算法、工程、產(chǎn)品的統(tǒng)籌,團(tuán)隊力量充沛。潘攀畢業(yè)于美國伊利諾伊大學(xué)芝加哥分校博士,此前在美國三菱波士頓研究院、北京富士通研發(fā)中心從事視覺領(lǐng)域的研發(fā)工作。
▲潘攀,現(xiàn)達(dá)摩院視覺智能研究領(lǐng)域 資深算法專家
延續(xù)此前團(tuán)隊推動的技術(shù)路徑,「圖搜」采用深度學(xué)習(xí)技術(shù),隨之成為阿里歷史上最早采用深度學(xué)習(xí)技術(shù)并上線的 C 端應(yīng)用產(chǎn)品。
和大多數(shù)互聯(lián)網(wǎng)公司戰(zhàn)略先行的思路不同,阿里在技術(shù)探索的早期并沒有大刀闊斧地批項目,而是從現(xiàn)有的核心業(yè)務(wù)盤子上找切口,克制而謹(jǐn)慎地實驗性驗證,然后才推動落地。
「當(dāng)組織里的算法和研發(fā)比較少,更多是由業(yè)務(wù)和產(chǎn)品構(gòu)成時,就決定了大家對于技術(shù)不確定性的理解會非常有限」,潘攀說道,「對于一家互聯(lián)網(wǎng)公司,做項目就一定要做出來,看得到結(jié)果」。
這是一個又艱難又幸運的過程,當(dāng)行動早于認(rèn)知,缺少資源、無人信任、無法施展等困境便接踵而來,這既是商業(yè)公司的盈利性質(zhì)所決定的,也是新生事物萌芽期所必經(jīng)的考驗。
但幸運的是,無論是自上而下的理想主義,還是自下而上的創(chuàng)新力量都得以保留,幸免于曇花一現(xiàn)的口號和想法。
火種尚存便可以燎原。
2. 坐在金山上啃饅頭
「坐在金山上啃饅頭」,這是漆遠(yuǎn)加入 iDST 時聽馬云說過的話。金山就是阿里巴巴擁有的豐富數(shù)據(jù)。但是即便坐擁金山啃饅頭,也難以一口吃成個大胖子,「如果數(shù)據(jù)的價值不能被挖掘出來,那不過就是普通的土壤」。
隨著深度學(xué)習(xí)算法與模型的普及應(yīng)用,「調(diào)參」工作成為大部分算法工程師的日常,淘寶和天貓的搜索團(tuán)隊一開始也不例外。
因為深度學(xué)習(xí)算法的不可解釋性,很多基于該技術(shù)的方案就像是一個「黑盒」,模型中的參數(shù)選擇和調(diào)整成了一件難捉摸的事,往往意味著繁瑣而毫無頭緒,沒有技術(shù)含量。
在漆遠(yuǎn)看來,光是調(diào)參遠(yuǎn)不能建立起技術(shù)體系,「雖然屬于工程層面的工作,但仍需要科學(xué)的思想指導(dǎo)——最好的工程指導(dǎo)就是科學(xué),否則你就只能是一名調(diào)參工程師」。
與漆遠(yuǎn)秉持同一觀點的還有金榕。「原來我們都是做些調(diào)參工作,直到金榕老師來了之后才把我們帶上正軌」,李昊談道,「他常反問我們,深度學(xué)習(xí)為什么能奏效?你能從理論上解釋嗎?」
「圖搜」項目之后,李昊便來到了搜索技術(shù)部——阿里最為核心的算法部門之一。在這里,李昊遇到了前來深入業(yè)務(wù)第一線的金榕。
李昊當(dāng)時的主要工作是為深度學(xué)習(xí)模型進(jìn)行壓縮與加速優(yōu)化,一般做法是套用現(xiàn)有模型,但金榕通常會提供新的思路,「他給了我們一堆的公式,讓我們?nèi)ピ嚒梗@一試就是三個月,也沒出結(jié)果。
當(dāng)李昊和同事懷著忐忑的心情找到金榕,他并沒有因此責(zé)備,反而給予鼓勵,「如果三個月就能做出來,那就是太簡單了,繼續(xù)去做吧!」直到第四個月算法總算跑通。這套算法將Embedding 技術(shù)結(jié)合深度學(xué)習(xí)引入到搜索業(yè)務(wù)中,明顯提升了淘寶主搜索的 GMV。
李昊回憶,當(dāng)時金榕還做了一套非常長的理論證明,證明算法是可收斂的,并在內(nèi)部分享,「他當(dāng)時給予我們的理論指導(dǎo),正是我們所稀缺的」,李昊對此十分感激。
來到螞蟻金服的漆遠(yuǎn)則接到了智能客服的項目,通過智能交互機(jī)器人來解決支付寶的客服問題。這一次,他順利很多,獲得當(dāng)時集團(tuán)客戶服務(wù)部負(fù)責(zé)人戴珊的支持后(戴珊是阿里巴巴早期創(chuàng)始的十八羅漢之一),很快爭取到了資金和資源進(jìn)行技術(shù)的驗證。
在阿里科技發(fā)展早期,以阿里合伙人為代表,形成了一股來自理想主義的推動力量。
2015 年的雙十一,首次采用深度學(xué)習(xí)技術(shù)的支付寶客服實現(xiàn)了 94% 語音自助,這意味著有 94% 打來的電話不再需要轉(zhuǎn)接到人工服務(wù),次年,這個數(shù)字提升到 97%。去除掉人工智能團(tuán)隊的人員工資和計算資源成本,智能客服項目為公司節(jié)省了一個多億。
所謂「知人善用,人盡其才」,技術(shù)工具同樣如此,唯有了解 AI,才能用好 AI。
要在一家互聯(lián)網(wǎng)公司里樹立起對于新技術(shù)的認(rèn)知和信仰并非易事,這為科學(xué)家們設(shè)置了一道又一道的障礙欄,甚至不可避免地造成了人員流失。
但回過頭來看,或許正是有了「上山下山」的共事經(jīng)歷,才算是真正打通了「研發(fā)」和「業(yè)務(wù)」的對話體系,讓陽春白雪和下里巴人從此互融。
技術(shù)之后,便是產(chǎn)品工程化的進(jìn)階挑戰(zhàn)。
哪怕有高層支持,也不意味著就此被保駕護(hù)航,伴隨而來的反而是更大的壓力。圖搜立項的第一年就設(shè)定了明確目標(biāo)——日活過百萬,「打從立項之初就不再是實驗性的了」。
與初期的深度學(xué)習(xí)算法探索不同,后期的挑戰(zhàn)就像無底洞一樣填不滿。
「問題的關(guān)鍵在于,我們不是在做一個獨立的 APP,而是讓它落在手淘上」,潘攀說道,「而且還是阿里最為核心的業(yè)務(wù)平臺」。落地手淘,意味著圖搜需要調(diào)用手淘的底層接口,需要針對淘寶內(nèi)部的鏈路架構(gòu)做額外定制和調(diào)配,而淌通這些鏈路就是最大挑戰(zhàn)。
在視覺領(lǐng)域,大規(guī)模圖片的壓縮極其消耗算力,這為大規(guī)模的圖搜訪問埋下了隱患,一次意外報警讓潘攀記憶猶新。
一天,圖搜的服務(wù)器突然被拖垮,后臺出現(xiàn)報警。
經(jīng)過緊急排查,團(tuán)隊才發(fā)現(xiàn),原來是淘系后臺針對圖像上傳的默認(rèn)壓縮功能拖垮了服務(wù)器。默認(rèn)壓縮主要針對低頻、小訪問量的媒體上傳需求,但并沒有考慮到圖搜的特殊情況——數(shù)據(jù)規(guī)模大,且需要實時識別,所以已經(jīng)在前端預(yù)設(shè)壓縮功能。換句話說,淘系的圖片默認(rèn)壓縮對于圖搜反而是一種負(fù)擔(dān)。
在發(fā)生警報之前,大家都忽略了這么細(xì)微的接口。潘攀談道,「很多時候就是這樣,即使我們自己考慮到位了,但如果要連接到更大的系統(tǒng)上,還是會出問題」。
上線并不意味著挑戰(zhàn)結(jié)束,比如,還有深不可測的入口。潘攀清楚地記得,圖搜第一次上線的位置是手淘的一個四級菜單里?!杆募墶?,則意味著你首先要在首頁里找到「發(fā)現(xiàn)」,然后點開「特色服務(wù)」,點擊「更多」,再……
作為阿里最為核心的業(yè)務(wù)戰(zhàn)場,手淘的態(tài)度顯而易見——「愿意給技術(shù)機(jī)會,但也要求風(fēng)險可控」。
機(jī)會需要爭取,更需要「自證」其價值。
從最初上線的數(shù)千日活,過百萬,過千萬,一直到突破 2000 萬,圖搜應(yīng)用一路躍升為淘寶首頁導(dǎo)購類目的第一。但與此同時,外界的質(zhì)疑聲不斷,「我印象特別深,每一年大家都在問,數(shù)據(jù)還能增長嗎?……你還在做呀?做啥呢?」潘攀說道。
不被理解似乎成為開拓者的宿命,漆遠(yuǎn)回憶早期的探索時期,「當(dāng)時對我最大的鍛煉就是,不被理解是正常的」。
這或許可以稱之為某種樂觀主義,但毋庸置疑,對于技術(shù)的信仰正是面對困境和誤解時不可或缺的堅實力量。
經(jīng)歷過焦灼而艱難的資源「抗?fàn)帯购?,漆遠(yuǎn)手中的分布式機(jī)器學(xué)習(xí)平臺終于啟動,為了盡早讓平臺上線,團(tuán)隊放棄年底休假,春節(jié)期間留守奮戰(zhàn),骨干密集開會頭腦風(fēng)暴?!府?dāng)時切身地感受到了團(tuán)隊的戰(zhàn)斗力,大家真的是非常相信,只要上線效果一定能好」,漆遠(yuǎn)回憶。
雙十一期間,平臺首次實現(xiàn)淘寶、天貓個性化推薦的大規(guī)模應(yīng)用。那一年的阿里巴巴集團(tuán)算法大獎上,漆遠(yuǎn)帶領(lǐng) 80 人的團(tuán)隊包攬了 16 項獎中的 6 項。現(xiàn)在,漆遠(yuǎn)作為達(dá)摩院金融智能方向的負(fù)責(zé)人,帶領(lǐng)團(tuán)隊構(gòu)建面向金融經(jīng)濟(jì)場景的智能分析與決策技術(shù)。
另一邊,在經(jīng)歷了搜索類目擴(kuò)增、數(shù)據(jù)優(yōu)化、算法迭代等多方面的升級后,「圖搜」項目完成三次入口躍遷,終于在 2015 年雙十一期間進(jìn)入首頁。讓潘攀頗為自豪的是,圖搜的數(shù)據(jù)一直依靠自然增長,幾乎沒有調(diào)用過手淘的商業(yè)推廣資源。
入口升級的本質(zhì)是一個不斷「自證」的過程,由技術(shù)和技術(shù)背后的推動者們在一次又一次的挑戰(zhàn)中完成,繼而固化下來成為阿里技術(shù)產(chǎn)品的迭代傳統(tǒng)。
不同于象牙塔里、試驗臺前的公示推理和仿真驗證,商業(yè)場上的「自證」需要實實在在的業(yè)務(wù)指標(biāo)和實際效果,正如阿里辦公區(qū)里那句隨處可見的標(biāo)語——「NO DATA,NO BB」。
高速增長的背后是兩年一次的系統(tǒng)大改,「阿里其實非常講究創(chuàng)新,我們一般都不炒冷飯」,潘攀說道,他將圖搜系統(tǒng)的發(fā)展分為三個時期,「每一次升級不僅是算法進(jìn)步,而是整體思路的提升」。
「數(shù)據(jù)、系統(tǒng)、算法三個互為一體。對數(shù)據(jù)認(rèn)知和處理方法的不同視角,催生了與之匹配的算法和工程系統(tǒng),所以升級是整個系統(tǒng)層面的」。
項目早期,數(shù)據(jù)量少,還需要人工標(biāo)注,所以研究為之匹配的小模型的系統(tǒng)和算法;隨后訓(xùn)練數(shù)據(jù)解放,團(tuán)隊嘗試通過用戶行為的三類數(shù)據(jù)(查詢數(shù)據(jù)、點擊數(shù)據(jù)、未點擊數(shù)據(jù))分析出數(shù)據(jù)與排序間的邏輯關(guān)系,三元組的 Deep Ranking 框架生成,與之對應(yīng)的訓(xùn)練框架、系統(tǒng)升級迭代;去年,圖搜開始接入超大規(guī)模并行處理平臺,釋放數(shù)十億級數(shù)據(jù)的訓(xùn)練能力。
與百度識圖、微信掃一掃、京東拍照購等市面上的其他圖搜應(yīng)用不同,阿里更強(qiáng)調(diào)「通用化」能力,比如不僅能支持手淘所有的實體商品檢索,還包括二維碼、植物、垃圾等非商品的識別與分類。這些功能統(tǒng)統(tǒng)集成在圖搜一個窗口里,不用再二次跳轉(zhuǎn),平均日活達(dá)到 2000 萬以上。
在研究員的成長道路上,經(jīng)歷一次完整的技術(shù)工程化落地的意義重大,它不僅錘煉了實戰(zhàn)能力,更為其提供了深入了解業(yè)務(wù)所想、業(yè)務(wù)所需的窗口。
「這段經(jīng)歷讓我們明白了應(yīng)該創(chuàng)造和推動什么樣的技術(shù),知道哪些技術(shù)更有可能落地成為產(chǎn)品,以及如何讓一個產(chǎn)品能夠有效地支撐業(yè)務(wù)」,金榕談道。
可以說,從研發(fā)到業(yè)務(wù)的實戰(zhàn)積累正是阿里打造AI 技術(shù)落地體系的基石。
如今,這套思想貫徹到阿里大大小小的技術(shù)思路中。比如,在語音技術(shù)團(tuán)隊今年推出的語音合成技術(shù) KAN-TTS(Knowledge-Aware Neural TTS)中,團(tuán)隊就事先考慮到了不同環(huán)境下的模型部署環(huán)境,并進(jìn)行框架設(shè)計和效率優(yōu)化,綜合各項需求的關(guān)鍵算法改進(jìn)多達(dá)20余項,最終實現(xiàn)了無論是在云端還是終端,甚至是 CPU 存儲有限情況下的最快速度部署。
一項技術(shù)能否在設(shè)計之初就考慮到項目部署階段遇到的各種實際問題,正是技術(shù)落地體系成熟的重要標(biāo)志。
3. 中國研究院沒有Benchmark
「它是阿里巴巴國際化業(yè)務(wù)的技術(shù)生命線,如果沒有這些能力,阿里巴巴很難稱之為一家國際化公司」,這段底氣十足的話出自司羅。
他是阿里達(dá)摩院語言技術(shù)實驗室負(fù)責(zé)人,帶領(lǐng)百余人的隊伍進(jìn)行自然語言理解、機(jī)器翻譯、認(rèn)知智能等底層技術(shù)的開發(fā),這些技術(shù)被譽為人工智能皇冠上的明珠。
▲司羅,現(xiàn)達(dá)摩院語言技術(shù)實驗室 負(fù)責(zé)人
司羅專注于機(jī)器學(xué)習(xí)、NLP 等領(lǐng)域的研究,2012 年成為普渡大學(xué)計算機(jī)系終身教授后,一舉奠定了其在學(xué)術(shù)圈的地位。同金榕、漆遠(yuǎn)一批,司羅在 2014 年加入 iDST,是阿里建立人工智能技術(shù)體系的早期成員。
相較于視覺、語音更貼近前端用戶的技術(shù),語言則更偏向底層,以原子化能力的形式起作用,扮演著賦能和支撐的角色。正因為這個特點,它對于大型互聯(lián)網(wǎng)技術(shù)公司而言往往不可或缺,但技術(shù)團(tuán)隊卻又是極其分散的。
既然如此,為何不集中力量打通?
于是,語言技術(shù)恰好成為了技術(shù)平臺化的最佳試驗場。
2016 年 10 月,對于司羅和 NLP 團(tuán)隊而言是一個重要的時間節(jié)點。此前,他們忙于承接一個個「項目」,先后參與過「聚劃算」、「AIios」「淘寶頭條」等項目。
在這之后,司羅領(lǐng)到任務(wù)——將 NLP 的「大中臺」建立起來,換句話說,阿里各業(yè)務(wù)線的 NLP 不再各自為營。
為了讓其他業(yè)務(wù)線接入平臺,司羅采取了「品牌效應(yīng)」的打法。
是的,在公司內(nèi)部,同樣需要建立品牌,尤其在打造規(guī)?;脚_的過程中。
「首先要有非常貼身的服務(wù),然后讓重點的頭部用戶用起來,逐步地讓他們認(rèn)識到 NLP 平臺和解決方案的好處,再通過種子用戶將我們的技術(shù)價值傳播出去」,司羅知無不言地分享了品牌效應(yīng)的打造「套路」。
而正是因為技術(shù)平臺化的出現(xiàn),讓這只百余人的隊伍能夠支持阿里系 600余個業(yè)務(wù)方,每天調(diào)用量達(dá)到了兩萬億次。
這是 NLP 技術(shù)影響力從量變到質(zhì)變的飛躍。
沿用同樣的思路,司羅帶領(lǐng)的另一條技術(shù)分支——機(jī)器翻譯技術(shù)也實現(xiàn)了規(guī)?;臉I(yè)務(wù)支撐能力,為阿里全球化電商平臺上的買賣雙方提供 20 多種語言,48 種語言方向的機(jī)器翻譯服務(wù),覆蓋歐洲、亞洲、美洲與中東地區(qū)的絕大多數(shù)國家。
阿里的圖搜應(yīng)用在技術(shù)平臺化升級后,從最早的支持手淘平臺到目前落地到淘系的六個主流 APP,一舉成為全球最大的圖搜應(yīng)用系統(tǒng)?!高@是淘系業(yè)務(wù)的市場份額決定的」,潘攀說道。
從單個功能應(yīng)用,到十個、百個、數(shù)百個的業(yè)務(wù)方支持,每天被億級用戶使用,技術(shù)平臺化的戰(zhàn)略得到了有效驗證與認(rèn)可。尤其對于技術(shù)人員而言,通過平臺化的過程,單點技術(shù)的影響力不斷被泛化,技術(shù)的品牌效應(yīng)不斷地被放大。
但對于當(dāng)下的阿里而言,平臺化尚非終點,「上云」更是一片廣闊的天地。
阿里內(nèi)部的海量業(yè)務(wù)和長期實戰(zhàn)的檢驗,為技術(shù)與方案移植到阿里云平臺提供了硬核實力。司羅表示,NLP 平臺和機(jī)器翻譯平臺已經(jīng)先后在阿里云上的人工智能板塊上線,供第三方的云計算客戶使用。
從單純的技術(shù)算法,到集成為業(yè)務(wù)和應(yīng)用中的產(chǎn)品,再到平臺化和大規(guī)??蓮?fù)制化的云計算商品,這是一條阿里人自己走出來的 AI 落地路。
是時候?qū)⑦@條路子固化下來了!
2017 年 10 月 11 日,是阿里人工智能技術(shù)體系開宗明義的日子。
▲阿里巴巴 CTO 張建鋒宣布成立達(dá)摩院
杭州云棲大會現(xiàn)場,阿里巴巴 CTO 張建鋒宣布達(dá)摩院正式成立,計劃未來 3 年里投入超過 1000 億元,用于涵蓋基礎(chǔ)科學(xué)和顛覆式技術(shù)創(chuàng)新的研究。iDST 作為達(dá)摩院旗下最大的機(jī)器智能實驗室分支,由金榕任帶隊。
時至今日,再談大公司建立研究院已不是新鮮事,但適應(yīng)于中國本土市場環(huán)境的成功模板仍然寥寥可數(shù)。
培養(yǎng)出中國最早一批 AI 研究員的微軟亞洲研究院被冠以「黃埔軍?!怪l頻提起,投入巨大過于前沿的谷歌 X 實驗室、DeepMind,IBM Waston 研究院形象「高大上」卻不夠接地氣。
中國互聯(lián)網(wǎng)公司已經(jīng)開始重點布局,但難以與公司業(yè)務(wù)平起平坐,百度幾大研究體系已被收編進(jìn)技術(shù)平臺,騰訊四大實驗室依附于各大業(yè)務(wù)呈分散狀。
至于阿里,在達(dá)摩院之前的三年探索和走過的彎路為其積累了不少寶貴經(jīng)驗,但如何乘勝追擊更進(jìn)一步成為領(lǐng)導(dǎo)者的新命題。
在金榕看來,達(dá)摩院的設(shè)立主要有兩個目標(biāo):一是把達(dá)摩院的 AI 基礎(chǔ)能力(原子能力)放到平臺上支撐所有業(yè)務(wù)。比如阿里內(nèi)部跟語音識別有關(guān)的業(yè)務(wù)都會使用達(dá)摩院的底層語音平臺,但會根據(jù)具體業(yè)務(wù)做定制化的改變。
二是上云,通過內(nèi)部核心業(yè)務(wù)驗證后,用戶的接受度和滿意度達(dá)到一定指標(biāo),產(chǎn)品上云商業(yè)化,進(jìn)一步放大價值,服務(wù)整個社會。
說到這,四年前王堅為金榕描繪 iDST 藍(lán)圖,三句不離「Benchmark」的畫面在我眼前浮現(xiàn)。
「我記得從第一天起,王堅就一直跟我們說 iDST 的 Benchmark 的是什么?」金榕說道。(Benchmark,基準(zhǔn),常用于性能測試中的表達(dá)。)
王堅認(rèn)為是斯坦福研究院(簡稱 SRI,1970 年脫離斯坦福大學(xué)后,更名為「斯坦福國際咨詢研究院」)?!改抢锏幕A(chǔ)研究和其他地方都不一樣,不僅創(chuàng)造出了最好的理論知識,還能把技術(shù)變成產(chǎn)品,產(chǎn)品收益再反哺到學(xué)術(shù)」,金榕回憶道,那時常舉的一個例子就是鼠標(biāo)的發(fā)明。
不止于鼠標(biāo),從手術(shù)機(jī)器人到航天靜電放電棒,從個人助理 Siri 再到癌癥治療,二戰(zhàn)后的斯坦福研究所幾乎成了硅谷高科技公司科技創(chuàng)新的「智慧之源」,不僅創(chuàng)造了新的行業(yè)、數(shù)十億美元的市場價值,還有持久的社會價值。
「一旦看到收益,人們很容易就聚焦在收割單個業(yè)務(wù)的成果上,而缺少更深入挑戰(zhàn)的動力」,金榕認(rèn)為這也是達(dá)摩院——阿里 AI 技術(shù)中臺設(shè)立的意義——跳出單個業(yè)務(wù)成果,讓技術(shù)更深入,再往前跨一步,用更少的人力實現(xiàn)價值最大化。
經(jīng)過兩年的建設(shè),達(dá)摩院人才濟(jì)濟(jì),超過半數(shù)科學(xué)家具有名校博士學(xué)位,部分是美國、歐洲學(xué)成回國,辦公室分布在四個國家、八個主要城市,其中機(jī)器智能團(tuán)隊擁有 20 多位知名大學(xué)教授,近 10 位 IEEE FELLOW。
而在達(dá)摩院之外,阿里還有一些更為分散化、業(yè)務(wù)化的人工智能能力,并非走中臺化的路子,但仍是不可或缺的一環(huán)。比如天貓精靈、搜索和廣告部的人工智能技術(shù)應(yīng)用、螞蟻金服的客服機(jī)器人等,它們與核心業(yè)務(wù)方貼合地更為緊密,以便技術(shù)更快地產(chǎn)生效益。
要為這樣一支龐大而高規(guī)格的研究團(tuán)隊設(shè)置課題并不是件容易事。
此前,我在與某公司 AI 實驗室負(fù)責(zé)人交流時,對方就曾透露過選題上的兩難局面——一方面既要兼顧業(yè)務(wù)需求和 KPI 導(dǎo)向,另一方面還不能忘記前瞻性研究和技術(shù)布局。
整日埋頭對接業(yè)務(wù)需求容易退化為業(yè)務(wù)部門的附屬團(tuán)隊?但面對前沿課題的不確定性,究竟該冒多大的險,才能保證既有結(jié)果又具備開創(chuàng)性?
當(dāng)我將同樣的問題拋給阿里的人工智能科學(xué)家時,得到了相似的回答,「這看起來是個問題,但在阿里就不是個問題」。
延續(xù)技術(shù)到產(chǎn)品、產(chǎn)品再到商業(yè)化的研究和落地機(jī)制,技術(shù)研發(fā)與商業(yè)利益的問題將得以平衡,而且必須平衡。
「在阿里如果只是發(fā)發(fā)論文、做做研究則意味著工作只做到了一半,無法獲得真正的認(rèn)可,或者是比較低的認(rèn)可」,潘攀說道。
與此同時,在技術(shù)平臺化與產(chǎn)品規(guī)模化的過程中,還伴隨著水到渠成的技術(shù)成果轉(zhuǎn)化。
在被譽為人工智能世界杯的 CVPR 2019 WebVision 競賽中圖像分類競賽中,阿里以 82.54% 的識別準(zhǔn)確率獲得冠軍,而這背后的技術(shù)能力正是阿里「圖搜」應(yīng)用開出的果實。
談到更為宏觀的議題布局,金榕認(rèn)為投資者思維或許是一個思路。
作為一名投資人,標(biāo)的無非兩種,一是比較切實可靠的項目,但是收益比較少;另一種則是高風(fēng)險,但回報高,即所謂的「High Risk High Take Off」。幾乎所有投資公司的投資組合都是這兩種的混合。
作為研發(fā)部門,金榕會將技術(shù)資源進(jìn)行分層。一部分投資在相對較容易見到結(jié)果的領(lǐng)域上,具備確定性;還有一部分投入在可長周期回報的項目?!冈谶@樣一個投資組合中,肯定有項目要失敗,但能保證團(tuán)隊整體的成長和健康」,金榕談道。
正好,他剛帶隊打完了一場「High Risk」的戰(zhàn)役。
那是阿里正在研發(fā)的自主云上人工智能加速芯片 NPU,達(dá)摩院承擔(dān)了部分算法工作,讓 NPU 在阿里的技術(shù)架構(gòu)上跑出最高性能。
為了能拿到 CTO 的「戰(zhàn)投」,金榕預(yù)先設(shè)置了一個非常高的指標(biāo),即假設(shè)所有條件都處于非常理想的條件下,相比 GPU 的性能有了不小的提升。
硬著頭皮上,一年多下來,終于收獲了理想結(jié)果。在金榕看來,設(shè)定高目標(biāo)雖然可能會引發(fā)焦慮和不適,但高目標(biāo)的每一次落地都將為團(tuán)隊實力帶來顯著提升,「這對于打造榮譽感,提振團(tuán)隊士氣非常奏效」。
在阿里內(nèi)部有一句話,「最好的團(tuán)建就是打一場勝仗」,融入阿里文化后的科學(xué)家們也開始明白這個道理了。
金榕身上所展現(xiàn)的冒險精神,一部分來自他的個人性格,一部分還受到阿里早期技術(shù)氛圍的感染。早年間,王堅力排眾議主導(dǎo)開發(fā)阿里云計算平臺時,就常以一個「瘋子」的形象活躍在公司內(nèi)部。
「如果你當(dāng)真要解決難題,就需要調(diào)動你所有的膽量和勇氣去接受挑戰(zhàn)」,金榕談道。
在計算機(jī)研究領(lǐng)域,通常將非常棘手的問題稱之為「NP-Hard」,大多數(shù)研究員一旦碰到這樣的問題都會給出否定的結(jié)論。但金榕的團(tuán)隊所推崇的恰是「Solve The Ban Problem」。
「在商業(yè)社會,用戶和商家才不會在乎這個,你不能因為 NP-hard 就止步」,金榕談道,「這對我來講是非常重要的原則,但凡這個研究是能夠產(chǎn)生巨大價值,就應(yīng)該全身心投入」。
不畏「禁忌」、冒險而大膽——這是我從他人口中未曾聽說過的達(dá)摩院。
一脈相承的風(fēng)格不可避免地將滲透進(jìn)團(tuán)隊,一旦拔得頭籌就將能讓每個成員體會到以一當(dāng)十的驚險,擁有勝者的姿態(tài),繼而發(fā)展成為阿里 AI 精神內(nèi)核的一部分。
當(dāng)上層建筑搭建完整,更為底層的技術(shù)正亟待突破,最為核心的指標(biāo)在于算力。
早年間漆遠(yuǎn)接手的首個項目大規(guī)模分布式機(jī)器學(xué)習(xí)平臺,隨后由達(dá)摩院智能計算實驗室負(fù)責(zé)人周靖人帶隊不斷迭代和完善,已經(jīng)進(jìn)入到第三代版本 PAI 3.0。今年三月加盟阿里的 AI 知名青年科學(xué)家賈揚清還將為 PAI 注入更多力量。
賈揚清畢業(yè)于美國加州大學(xué)伯克利分校計算機(jī)科學(xué)博士,加入阿里前在 Facebook 擔(dān)任工程總監(jiān),負(fù)責(zé)大規(guī)模人工智能平臺的架構(gòu)。他是 AI 深度學(xué)習(xí)框架 Caffe、Caffe2、Pytorch 的重要貢獻(xiàn)者之一,并曾參與谷歌人工智能平臺 TensorFlow 的工作,GoogleNet 作者的之一。
因為深度學(xué)習(xí)框架領(lǐng)域的諸多貢獻(xiàn),賈揚清在人工智能開發(fā)者群體中具有頗高人氣,在今年 7 月的阿里云峰會上,賈揚清首次以阿里人身份亮相,不斷有年輕人過來和他談話與合影。
▲賈揚清,現(xiàn)阿里巴巴計算平臺事業(yè)部 總裁
正值浙江一帶的酷暑,采訪室十分悶熱?!肝沂墙B興人,沒法抱怨這天氣」,賈揚清笑著說道。清華碩士畢業(yè)后,賈揚清就長居海外,因為轉(zhuǎn)戰(zhàn)阿里而經(jīng)?;貒?。紹興距離杭州不到 80 公里,來到阿里,不僅是回國,更是回鄉(xiāng),賈揚清臉上有些止不住的喜悅。
和賈揚清前后腳來到阿里的還有黃非,在金榕和司羅兩位老師的力薦下加入。黃非畢業(yè)于卡內(nèi)基梅隆大學(xué)博士,曾任 ACL、NLPCC 等領(lǐng)域主席、IJCAI 資深程序委員,在 Facebook 時負(fù)責(zé)機(jī)器翻譯和知識平臺。加入阿里后負(fù)責(zé)組建和領(lǐng)導(dǎo)國際化機(jī)器翻譯創(chuàng)新團(tuán)隊。
一如當(dāng)年的漆遠(yuǎn)、金榕一樣,這些年輕科學(xué)家們帶著由衷的使命感和期待來到「金山」,期待著實現(xiàn)自我價值的同時,也為阿里經(jīng)濟(jì)體和中國互聯(lián)網(wǎng)做出應(yīng)有的貢獻(xiàn)。
4. 阿里的底牌
當(dāng)一件事物愈發(fā)完美或者強(qiáng)大,外界在其身上所寄托的期望值也將越來越高。
「最開始,公司只是希望技術(shù)能用在業(yè)務(wù)上得到一個好效果。今天,是真正希望我們能夠用技術(shù)創(chuàng)造未來,一個新的由技術(shù)驅(qū)動的阿里巴巴」,金榕停了一會繼續(xù)說道,「這個期望遠(yuǎn)高于技術(shù)難題,是一個非常大的命題」。
一個技術(shù)驅(qū)動的阿里巴巴?可能嗎?
在絕大部分人的眼中,對于阿里的定義仍然是一家依靠電商業(yè)務(wù)驅(qū)動的互聯(lián)網(wǎng)公司。在 2019 財年的財報里,阿里的核心業(yè)務(wù)包括電商業(yè)務(wù)、阿里云、大文娛和創(chuàng)新業(yè)務(wù)四大板塊,其重要性依次排開。其中,電商業(yè)務(wù)創(chuàng)造了 3234 億收入,總營收占比高達(dá) 86%。
「這正是外界看不太懂的地方,我們可不可能創(chuàng)造未來?」
在金榕眼里,這個未來似乎已經(jīng)依稀可見,「我給你舉個例子,至少我自己是非常受激勵的,5G 技術(shù)就是突破口之一。隨著 5G 和高清視頻技術(shù)的發(fā)展,整個視頻內(nèi)容產(chǎn)業(yè)鏈都會帶來全新的變化,是對每一個環(huán)節(jié)的重塑……」
AI 之后,5G 之前,前瞻性的技術(shù)布局和技術(shù)融合或?qū)榘⒗锊葴?zhǔn)下一個時代節(jié)點。
讓我們把時間線拉近一些,現(xiàn)在或者近期的幾年內(nèi),在阿里的主營業(yè)務(wù)之下,還有什么能稱之為源動力或者底牌的東西?
▲歐文武,阿里巴巴資深算法專家
眼前這位入職阿里 12 年的算法專家或許知道答案。
他叫歐文武,娃娃臉上時常掛著微笑,憨態(tài)可掬。他被視為「最懂中國女人的男人」,因為他好像總能猜到你想買點什么,然后在恰當(dāng)?shù)臅r候送到你眼皮底下。
歐文武是阿里巴巴搜索事業(yè)部總監(jiān),資深算法專家,負(fù)責(zé)淘寶推薦算法團(tuán)隊,利用搜索和推薦技術(shù)讓電商產(chǎn)品推薦流,也就是人們常說的「千人千面」。
談到推薦業(yè)務(wù),賈揚清曾在他的內(nèi)部分享《關(guān)于人工智能的一點淺見》中這樣描述:在阿里和很多互聯(lián)網(wǎng)企業(yè)中有一個「沉默的大多數(shù)」的應(yīng)用,就是推薦系統(tǒng):它常常占據(jù)了超過 80% 甚至 90% 的機(jī)器學(xué)習(xí)算力,如何將深度學(xué)習(xí)和傳統(tǒng)推薦系統(tǒng)進(jìn)一步整合,如何尋找新的模型,如何對搜索和推薦的效果建模,這些可能沒有像語音和圖像那么為人所知,卻是公司不可缺少的技能。
在阿里就有兩支重要團(tuán)隊負(fù)責(zé)這個「沉默的大多數(shù)」的應(yīng)用——搜索事業(yè)部與阿里媽媽。
雖然都做推薦系統(tǒng),技術(shù)與平臺相通,但和阿里媽媽強(qiáng)調(diào)變現(xiàn)的屬性不同,搜索事業(yè)部的推薦業(yè)務(wù)更看重用戶體驗,強(qiáng)調(diào)探索和發(fā)現(xiàn)的樂趣以增加平臺粘性,商業(yè)味道
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強(qiáng)大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預(yù)測分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢預(yù)判? ? 在數(shù)據(jù)驅(qū)動決策的時代,預(yù)測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點,而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報考到取證的全攻略? 在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗:捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗:數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對策略? 長短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨特的門控機(jī)制,在 ...
2025-07-07統(tǒng)計學(xué)方法在市場調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場調(diào)研是企業(yè)洞察市場動態(tài)、了解消費者需求的重要途徑,而統(tǒng)計學(xué)方法則是市場調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03