99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

熱線電話:13121318867

登錄
2023-03-23 閱讀量: 1361
人工智能快速發(fā)展趨勢下,中國該如何應(yīng)對?
圖片

人工智能 | 深度學(xué)習(xí) | GPT-4

文心一言 | 機器學(xué)習(xí) | ChatGPT


近日,隨著ChatGPT-4和百度的文心一言的出臺,人工智能技術(shù)得到迅猛發(fā)展。人工智能(AI)是一種模擬人類智能的技術(shù),它可以通過學(xué)習(xí)和自我改進來執(zhí)行各種任務(wù)。ChatGPT是一種基于AI的聊天機器人,它可以與人類進行自然語言交互,回答問題和提供信息。


人工智能是通過模擬人類大腦的方式來工作的。它使用算法和數(shù)據(jù)來學(xué)習(xí)和自我改進,以便更好地執(zhí)行任務(wù)。人工智能可以分為弱人工智能和強人工智能。弱人工智能是指只能執(zhí)行特定任務(wù)的AI,例如語音識別或圖像識別。強人工智能是指可以像人類一樣思考和決策的AI。


2023年政府工作報告指出“過去五年極不尋常、極不平凡,我們經(jīng)受了世界變局加快演變、新冠疫情沖擊、國內(nèi)經(jīng)濟下行等多重考驗,經(jīng)濟社會發(fā)展取得舉世矚目的重大成就?!本劢沟娇萍碱I(lǐng)域,“全社會研發(fā)經(jīng)費投入強度從2.1%提高到2.5%以上,科技進步貢獻率提高到60%以上??萍紕?chuàng)新成果豐碩,人工智能領(lǐng)域的創(chuàng)新成果也不斷涌現(xiàn)?!?/span>


縱覽人工智能產(chǎn)業(yè)近年發(fā)展,雖然一定程度上突破了深度學(xué)習(xí)等各類算法革新、技術(shù)產(chǎn)品化落地、應(yīng)用場景打磨、市場教育等難點;但如今也仍需致力解決可信、業(yè)務(wù)持續(xù)、盈利、部署的投資回報率等商業(yè)化卡點。


聚焦于2022年,這一歷史上極為重要一年中我國AI產(chǎn)業(yè)參與者的特征表現(xiàn)、探討AI產(chǎn)業(yè)在我國經(jīng)濟發(fā)展中的價值與地位、洞察各技術(shù)賽道參與者的發(fā)展路徑與產(chǎn)業(yè)進階突破點。


圖片1.png


人工智能產(chǎn)業(yè)發(fā)展環(huán)境演變


一、人工智能參與社會建設(shè)的千行百業(yè)——價值性、通用性、效率化為產(chǎn)業(yè)發(fā)展戰(zhàn)略方向


人工智能已成為推動產(chǎn)業(yè)發(fā)展的主流趨勢,其產(chǎn)品形態(tài)和應(yīng)用邊界不斷拓寬,包括軟件服務(wù)、云服務(wù)、硬件基礎(chǔ)設(shè)施等形式,應(yīng)用場景涵蓋消費、制造業(yè)、互聯(lián)網(wǎng)、金融、元宇宙和數(shù)字孿生等領(lǐng)域。據(jù)艾瑞預(yù)測,到2022年,我國人工智能產(chǎn)業(yè)規(guī)模將達到1958億元,同時,人工智能產(chǎn)學(xué)研界在通用大模型、行業(yè)大模型等方向上取得了一定突破,促進技術(shù)通用性和效率化生產(chǎn)。AI技術(shù)的商業(yè)價值塑造、通用性提升和效率化應(yīng)用是其助力產(chǎn)業(yè)發(fā)展、社會進步和自身造血的關(guān)鍵。



二、企業(yè)積極部署AI戰(zhàn)略以實現(xiàn)業(yè)務(wù)增長——對AI應(yīng)用的比率及數(shù)量持續(xù)走高; AI提升營收能力進步


縱觀近五年來的AI技術(shù)商業(yè)落地發(fā)展脈絡(luò),產(chǎn)品及服務(wù)提供商圍繞技術(shù)深耕、場景創(chuàng)新、商業(yè)價值創(chuàng)造、精細化服務(wù)不斷努力;需求側(cè)企業(yè)也在從單點試驗、數(shù)據(jù)積累到戰(zhàn)略改革的發(fā)展路線上,與AI技術(shù)逐漸深度綁定。AI成為企業(yè)數(shù)字化、智能化改革的重要抓手,也是各行業(yè)領(lǐng)軍企業(yè)打造營收護城河的重要方向。


麥肯錫2022年對企業(yè)應(yīng)用AI技術(shù)的調(diào)研表明:相較于2017年的20%,2022年企業(yè)至少在一個業(yè)務(wù)領(lǐng)域采用AI技術(shù)的比率增加了一倍多,達到50%;應(yīng)用的AI產(chǎn)品數(shù)量也從2018年的平均1.9個增加到2022年的3.8個。除了應(yīng)用數(shù)量上的提升,AI產(chǎn)生的商業(yè)價值也不斷增長,企業(yè)部署AI的動力顯著。


埃森哲商業(yè)研究院針對中國250家領(lǐng)先企業(yè)的調(diào)研顯示,2018-2021年,企業(yè)營收中“由AI推動的份額”平均增加了一倍,預(yù)計到2024年將進一步增加至36%。落地AI應(yīng)用對企業(yè)業(yè)務(wù)運營的商業(yè)價值與戰(zhàn)略意義越來越明確。


三、城市算腦建設(shè)推動區(qū)域發(fā)展與產(chǎn)業(yè)升級——各地加速布局區(qū)域智算中心,夯實AI算力基礎(chǔ)設(shè)施


基于對支撐AI應(yīng)用及研發(fā)的智能算力需求擴大、以及全國算力樞紐一體化和“東數(shù)西算”的工程建設(shè)方向。近兩年來,各地對人工智能計算/超算中心(智算中心)的關(guān)注度和投資增多。智算中心是指基于最新AI理論,采用領(lǐng)先的AI計算架構(gòu),提供AI應(yīng)用所需算力服務(wù)、數(shù)據(jù)服務(wù)和算法服務(wù)的公共算力新型基礎(chǔ)設(shè)施。目前,我國有超過30個城市建設(shè)或提出建設(shè)智算中心,其中已有近10個城市的智算中心投入運營,為當(dāng)?shù)馗餍袠I(yè)領(lǐng)域提供算力支撐。智算中心建設(shè)對區(qū)域經(jīng)濟發(fā)展和產(chǎn)業(yè)升級有明顯推動作用,同時可提高城市治理智能化水平和城市競爭力。從政府投資角度看,智算中心產(chǎn)業(yè)發(fā)展尚處于初期階段,建設(shè)、運營、應(yīng)用推廣與生態(tài)建設(shè)、節(jié)能環(huán)保要求等投入較大,需結(jié)合地方財政能力合理評估,根據(jù)實際需求適度超前部署機柜。



四、政策引導(dǎo)解決AI重大應(yīng)用和產(chǎn)業(yè)化問題——著力打造人工智能重大場景,形成可復(fù)制推廣的標(biāo)桿應(yīng)用


盡管我國在數(shù)據(jù)、算力、算法及模型的基礎(chǔ)層資源與研究積累日益豐富,為開展下游人工智能場景創(chuàng)新應(yīng)用打下了堅實基礎(chǔ),但在應(yīng)用場景上仍存在“對場景創(chuàng)新認識不到位,重大場景系統(tǒng)設(shè)計不足,場景機會開放程度不夠,場景創(chuàng)新生態(tài)不完善”等問題。為此,2022年,我國陸續(xù)出臺一系列指導(dǎo)意見及通知,持續(xù)加強對人工智能場景創(chuàng)新工作的統(tǒng)籌指導(dǎo),規(guī)范與加強人工智能應(yīng)用建設(shè),實現(xiàn)AI與實體產(chǎn)業(yè)經(jīng)濟的深度融合。其中,政策引導(dǎo)是解決AI重大應(yīng)用和產(chǎn)業(yè)化問題的重要手段之一。著力打造人工智能重大場景,形成可復(fù)制推廣的標(biāo)桿應(yīng)用,是政策引導(dǎo)的重要方向之一。通過政策引導(dǎo),加強對人工智能場景創(chuàng)新工作的統(tǒng)籌指導(dǎo),規(guī)范與加強人工智能應(yīng)用建設(shè),將有助于實現(xiàn)AI與實體產(chǎn)業(yè)經(jīng)濟的深度融合。



五、科技倫理治理持續(xù)引導(dǎo)AI “向善”——全球AI倫理治理邁入法治時代,我國積極倡導(dǎo)框架規(guī)范


隨著人工智能與社會產(chǎn)業(yè)的融合應(yīng)用,其帶來的安全、法律和倫理方面的風(fēng)險不容忽視。2022年,科技倫理治理的約束力和影響力持續(xù)提升。從全球范圍來看,主要發(fā)達國家和地區(qū)的人工智能倫理治理從政策建議正式進入法律范疇,相關(guān)立法逐步完善,國際組織也在凝聚共識的基礎(chǔ)上,啟動大規(guī)模深入研討。而在中國,在吸取發(fā)達國家治理經(jīng)驗和思路的基礎(chǔ)上,2022年首次將人工智能倫理治理上升到國家政策層面,提出科技倫理治理的原則和行動方案,具體治理舉措將會不斷細化和完善。同時,我國也在科技倫理問題上通過國際組織積極表態(tài),增強國際影響力和話語權(quán),防止在科技倫理問題上陷入被動。



六、人工智能產(chǎn)業(yè)投資熱度仍在——融資向中后期過渡,視覺賽道上市浪潮涌動


人工智能產(chǎn)業(yè)一直是投資市場的熱門領(lǐng)域,而最近的數(shù)據(jù)顯示,這一趨勢仍在持續(xù)。統(tǒng)計數(shù)據(jù)顯示,Pre-A~A+輪人工智能產(chǎn)業(yè)創(chuàng)投輪次數(shù)量最多,但整體而言,Pre-B~B輪+及以后輪次的人工智能產(chǎn)業(yè)創(chuàng)投數(shù)量逐漸成長,資本流向穩(wěn)定發(fā)展企業(yè),融資逐漸向中后期過渡。此外,視覺賽道上市浪潮也在涌動,商湯科技、格靈深瞳、云從科技、創(chuàng)新奇智等企業(yè)都已實現(xiàn)上市目標(biāo)。雖然2022年我國人工智能產(chǎn)業(yè)資本市場投資金額整體縮水,但投資標(biāo)的更加豐富,孵化出AIGC、元宇宙、虛擬數(shù)字人等新投資賽道,認知與決策智能類企業(yè)也吸引更多關(guān)注,智能機器人、自動駕駛兩類無人系統(tǒng)是融資的熱門賽道。



七、區(qū)域與獨角獸企業(yè)融資分布特點——北上廣與江浙地帶融資密度高;獨角獸企業(yè)聚集于自動駕駛、醫(yī)療、工業(yè)、芯片賽道


從區(qū)域分布看,統(tǒng)計時間內(nèi)融資事件集中分布于北上廣、江浙地帶。北京的融資事件密度最高,融資事件數(shù)量占全國的31.1%。除北上廣、江浙地帶以外區(qū)域融資密度較低且分散,相應(yīng)融資事件數(shù)量占全國不超過10%。這可能是因為北上廣、江浙地帶人工智能人才密集、具備產(chǎn)業(yè)園區(qū)進行產(chǎn)學(xué)研成果轉(zhuǎn)化、風(fēng)投機構(gòu)密布等因素,為孵化創(chuàng)投項目提供了有利條件。


從獨角獸企業(yè)融資情況看,統(tǒng)計時間內(nèi)獨角獸企業(yè)占比6.7%,但對應(yīng)的融資金額比例高達32.3%。獨角獸融資事件集中分布于自動駕駛、醫(yī)療、工業(yè)、芯片行業(yè)賽道,分別孵化出L3及以上智能駕駛解決方案、AIDD藥物研發(fā)服務(wù)、工業(yè)機器人、云端大規(guī)模訓(xùn)練或端側(cè)推理芯片等產(chǎn)品或服務(wù)。隨著市場資金向獨角獸企業(yè)持續(xù)流入,AI產(chǎn)業(yè)未來或?qū)⒅鸩匠霈F(xiàn)一批明星上市企業(yè)。



八、人工智能產(chǎn)業(yè)市場規(guī)?!?022年市場平穩(wěn)向好,市場規(guī)模近2000億元


根據(jù)艾瑞的定義,我國人工智能產(chǎn)業(yè)規(guī)模涵蓋AI應(yīng)用軟件、硬件及服務(wù),主要包括AI芯片、智能機器人(商用)、AI基礎(chǔ)數(shù)據(jù)服務(wù)、面向AI的數(shù)據(jù)治理、計算機視覺、智能語音與人機交互、機器學(xué)習(xí)、知識圖譜和自然語言處理等核心產(chǎn)業(yè)。預(yù)計到2022年,中國人工智能產(chǎn)業(yè)規(guī)模將達到1958億元,年增長率為7.8%,整體平穩(wěn)向好。2022年的業(yè)務(wù)增長主要依靠智算中心建設(shè)以及大模型訓(xùn)練等應(yīng)用需求拉動的AI芯片市場、無接觸服務(wù)需求拉動的智能機器人及對話式AI市場,除此之外的增長動力將在第三章詳細闡述。目前,中國大型企業(yè)基本都已在持續(xù)規(guī)劃投入實施人工智能項目,未來隨著中小型企業(yè)的普遍嘗試和大型企業(yè)的穩(wěn)健部署,在AI成為數(shù)字經(jīng)濟時代核心生產(chǎn)力的背景下,AI芯片、自動駕駛及車聯(lián)網(wǎng)視覺解決方案、智能機器人、智能制造、決策智能應(yīng)用等細分領(lǐng)域增長強勁。預(yù)計到2027年,人工智能產(chǎn)業(yè)整體規(guī)模可達6122億元,2022-2027年的相關(guān)CAGR為25.6%。



人工智能的底層基礎(chǔ)


一、AI芯片


1、AI芯片針對機器學(xué)習(xí)算法設(shè)計開發(fā),廣泛應(yīng)用于云、邊、端各類場景


AI芯片(AI Chip)是一種專門用于處理人工智能相關(guān)的計算任務(wù)的芯片。它的架構(gòu)是專門為人工智能算法和應(yīng)用進行優(yōu)化的,能夠高效地處理大量結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)。AI芯片能夠高效地支持視覺、語音、自然語言處理等智能處理任務(wù)。目前,AI芯片主要分為GPU、FPGA、TPU、IPU、DPU、NPU等類型。AI芯片廣泛應(yīng)用于云端、邊緣端、終端等各種場景。云端AI芯片具有高性能特征,終端AI芯片具有低功耗和高能效特性,而邊緣端AI芯片的性能介于云端和終端之間。



2、AI芯片性能指標(biāo)評價評價AI芯片性能需重點關(guān)注TOPS/W、時延、功耗等相關(guān)指標(biāo)


目前,評價AI芯片性能的指標(biāo)主要包括TOPS、TOPS/W、時延、成本、功耗、可擴展性、精度、適用性、吞吐量和熱管理等。其中,TOPS/W是用于度量在1W功耗的情況下,芯片能進行多少萬億次操作的關(guān)鍵指標(biāo)。近年來,MIT、Nvidia等研發(fā)人員開發(fā)了專門的芯片軟件評價工具,如Accelergy(評估芯片架構(gòu)級能耗)和Timeloop(評估芯片運算執(zhí)行情況),對于AI芯片的性能做出了系統(tǒng)、全面評價。此外,MLPerf是由來自學(xué)術(shù)界、研究實驗室和相關(guān)行業(yè)的AI領(lǐng)導(dǎo)者組成的聯(lián)盟,旨在“構(gòu)建公平和有用的基準(zhǔn)測試”,可用于衡量深度學(xué)習(xí)軟件框架、AI芯片和云平臺性能。



3、AI芯片:云端場景數(shù)據(jù)中心


1)GPU具備矩陣和大規(guī)模并行計算優(yōu)勢,適合數(shù)據(jù)中心場景


CPU是一種通用處理器,它由控制單元(負責(zé)指令讀取和指令譯碼)、存儲單元(包括CPU片內(nèi)緩存和寄存器)以及運算單元(ALU約占20%CPU空間)三個主要模塊組成。然而,由于成本、功耗、技術(shù)難度和算力瓶頸等問題的限制,目前還沒有出現(xiàn)適用于AI高算力要求的主流CPU產(chǎn)品。


相比之下,GPU是一種由大量核心組成的大規(guī)模并行計算架構(gòu),它具有較多的運算單元(ALU)和較少的緩存(cache),是專門為同時處理多重任務(wù)而設(shè)計的芯片。GPU擁有良好的矩陣計算能力和并行計算優(yōu)勢,能夠滿足深度學(xué)習(xí)等AI算法的處理需求,因此成為主流云端AI芯片。



2)張量計算單元是GPU進行深度學(xué)習(xí)運算的核心組成部分


英偉達A100芯片是一種并發(fā)多核處理器,由多個SM單元(Streaming Multiprocessors,流式多處理器)構(gòu)成。不同的SM單元共享L2 Cache存儲資源,以便進行數(shù)據(jù)訪問。該芯片采用安培架構(gòu),擁有128個SM核,其中SM結(jié)構(gòu)是芯片架構(gòu)升級的核心。此外,英偉達GPU架構(gòu)中還設(shè)置了Tensor Core,這是專為深度學(xué)習(xí)矩陣運算設(shè)計的張量計算單元,也是英偉達GPU系列深度學(xué)習(xí)運算加速的核心。Tensor Core主要處理大型矩陣運算,執(zhí)行一種專門的矩陣數(shù)學(xué)運算,適用于深度學(xué)習(xí)和某些類型的高性能計算。其功能是執(zhí)行融合乘法和加法的運算,其中兩個4*4 FP16矩陣相乘,然后將結(jié)果添加到4*4 FP32或FP64矩陣中,最終輸出新的4*4 FP32或FP64矩陣。



4、邊緣端場景—AIoT。邊緣端集成AI芯片可以實現(xiàn)本地化數(shù)據(jù)的實時處理


AIoT是一種融合了人工智能和物聯(lián)網(wǎng)技術(shù)的新型智能化系統(tǒng),它可以實現(xiàn)萬物智聯(lián),涉及到安防、移動互聯(lián)網(wǎng)等多種場景。在智慧安防方面,由于終端攝像頭每天產(chǎn)生大量的視頻數(shù)據(jù),若全部回傳到云數(shù)據(jù)中心將會對網(wǎng)絡(luò)帶寬和數(shù)據(jù)中心資源造成極大占用。為了解決這個問題,可以在終端加裝AI芯片,實現(xiàn)數(shù)據(jù)本地化實時處理,即僅將經(jīng)過結(jié)構(gòu)化處理、關(guān)鍵信息提取后帶有關(guān)鍵信息的數(shù)據(jù)回傳云端,從而大大降低網(wǎng)絡(luò)傳輸帶寬壓力。目前,主流解決方案是在前端攝像頭設(shè)備內(nèi)集成AI芯片,在邊緣端采用智能服務(wù)器級產(chǎn)品,后端在邊緣服務(wù)器中集成智能推理芯片。為了推動這項技術(shù)的發(fā)展,國內(nèi)外企業(yè)正在加大對邊緣端AI視覺處理芯片的研發(fā)和投入,相關(guān)芯片產(chǎn)品如英偉達Jetson AGX Xavier、地平線旭日3、華為海思Hi3559A V100等。



5、終端場景—智能駕駛。隨著智能駕駛等級的提高,技術(shù)不斷迭代促使車用AI芯片性能逐步增強


SAE(國際自動機工程師學(xué)會)將自動駕駛分為六個級別,從L0(非自動化)到L5(完全自動化)。每一級別需要強大的算力進行實時分析、處理大量數(shù)據(jù)和執(zhí)行復(fù)雜的邏輯運算,對計算能力有著極高的要求。L1(駕駛員輔助)和L2(部分自動化)需要的計算能力相對較低,而L3(有條件自動化)需要約250TOPS的計算能力,L4(高度自動化)需要超過500TOPS,L5(全場景自動駕駛)需要超過1,000TOPS。隨著芯片設(shè)計和制造工藝的提高,車用AI芯片正朝著高算力、低功耗的方向發(fā)展。



6、終端場景—智能駕駛。預(yù)計到2025年,全球車用AI芯片市場規(guī)模將突破17億美元


隨著汽車控制方式逐漸由機械式轉(zhuǎn)向電子式,每輛汽車對車用AI芯片需求提升,帶動車用AI芯片長期發(fā)展。據(jù)市場研究機構(gòu)Yole預(yù)測,到2025年,全球車用AI芯片產(chǎn)量將達到67.19億顆,市場規(guī)模將達到17.76億美元,年復(fù)合增速分別達到99.28%和59.27%。此外,車用AI芯片逐漸往高能效方向發(fā)展。例如,英特爾計劃于2022年推出EyeQ Ultra自動駕駛汽車芯片,該芯片基于經(jīng)過驗證的Mobileye EyeQ架構(gòu)而打造,含有8個PMA、16個VMP、24個MPC、2個CNN Accelerator視覺處理單元(VPU),通過優(yōu)化算力和效能以達到176TOPS,可滿足L4自動駕駛場景。該產(chǎn)品將于2023年底供貨,預(yù)計在2025年全面實現(xiàn)車規(guī)級量產(chǎn)。



7、終端場景—消費電子。2026年全球消費電子AI芯片市場規(guī)模將突破55億美元


AI芯片在圖像識別、語音識別和快速建立用戶畫像等方面具有重要作用。根 據(jù)Yole預(yù)測,2026年全球消費電子AI芯片市場規(guī)模將達到55.8億美元,其中筆記本電腦、平板電腦和智能手機AI芯片滲透率將分別達到100%、100%和91%, 未來全球消費電子AI芯片市場規(guī)模和滲透率呈現(xiàn)逐步增長態(tài)勢。


微信圖片_20230322154012.jpg


二、深度學(xué)習(xí)開源框架


深度學(xué)習(xí)開源框架是一種標(biāo)準(zhǔn)接口、特性庫和工具包,用于設(shè)計、訓(xùn)練和驗證AI算法模型。它們集成了數(shù)據(jù)調(diào)用、算法封裝和計算資源的使用,是AI開發(fā)的重要工具。目前,國際上廣泛使用的深度學(xué)習(xí)開源框架包括Google TensorFlow、Facebook PyTorch、Amazon MXNet和微軟CNTK等。在中國,也有一些深度學(xué)習(xí)開源框架,如百度PaddlePaddle、華為MindSpore等。這些框架已經(jīng)初步應(yīng)用于工業(yè)、服務(wù)業(yè)等場景,服務(wù)200余萬開發(fā)者。



三、數(shù)據(jù)服務(wù)以AI訓(xùn)練與調(diào)優(yōu)為目的,涉及數(shù)據(jù)采集、標(biāo)注與質(zhì)檢等環(huán)節(jié)


人工智能數(shù)據(jù)服務(wù)是指提供數(shù)據(jù)庫設(shè)計、數(shù)據(jù)采集、數(shù)據(jù)清洗、數(shù)據(jù)標(biāo)注和數(shù)據(jù)質(zhì)檢等服務(wù),以滿足客戶的需求。這個服務(wù)流程是圍繞客戶需求展開的,最終產(chǎn)出的產(chǎn)品是數(shù)據(jù)集和數(shù)據(jù)資源定制服務(wù),為AI模型訓(xùn)練提供可靠、可用的數(shù)據(jù)。隨著短視頻、直播、社交電商等應(yīng)用的快速興起,全球數(shù)據(jù)量也在快速增長。根據(jù)IDC的預(yù)測,全球數(shù)據(jù)量將從2015年的9ZB增加到2025年的175ZB,這為人工智能技術(shù)的持續(xù)迭代提供了重要的底層基礎(chǔ)。



四、云計算服務(wù)顯著降低人工智能算法開發(fā)成本,縮短產(chǎn)品開發(fā)周期


由于人工智能的開發(fā)和應(yīng)用對于算力和數(shù)據(jù)有較大需求,云計算服務(wù)可以為開發(fā)者提供智能服務(wù)器集群等強大算力設(shè)施的租用。同時,云計算服務(wù)還可以直接提供已經(jīng)訓(xùn)練好的人工智能功能模塊等產(chǎn)品,通過多元化的服務(wù)模式,降低開發(fā)者的開發(fā)成本和產(chǎn)品開發(fā)周期,為客戶提供AI賦能。


例如,亞馬遜SageMaker可以提供圖片/圖像分析、語音處理、自然語言理解等相關(guān)服務(wù)。使用者無需了解參數(shù)和算法即可實現(xiàn)功能的應(yīng)用。隨著底層技術(shù)的發(fā)展,IBM推出深度學(xué)習(xí)即服務(wù)(DLaaS),借助此項服務(wù)用戶可以使用主流框架來訓(xùn)練神經(jīng)網(wǎng)絡(luò),如TensorFlow、PyTorch及Caffe。用戶無需購買和維護成本高昂的硬件,每一個云計算處理單元都遵循簡單易用的原則而設(shè)置,無需用戶對基礎(chǔ)設(shè)施進行管理。用戶可以根據(jù)支持的深度學(xué)習(xí)框架、神經(jīng)網(wǎng)絡(luò)模型、訓(xùn)練數(shù)據(jù)、成本約束等條件進行挑選,然后DLaaS服務(wù)會幫助完成其余的事情,提供交互式、可迭代的訓(xùn)練體驗。



人工智能的核心技術(shù)


機器學(xué)習(xí)作為人工智能技術(shù)的核心,近年來實現(xiàn)了明顯的突破。它與計算機視覺、自然語言處理、語音處理和知識圖譜等關(guān)鍵技術(shù)緊密結(jié)合,相關(guān)機器學(xué)習(xí)算法主要應(yīng)用于圖像分類、語音識別、文本分類等相關(guān)場景中。這些應(yīng)用場景的不斷發(fā)展和完善,不僅提升了人工智能技術(shù)的整體應(yīng)用效果,也使得人工智能技術(shù)在金融、醫(yī)療、交通等各領(lǐng)域?qū)崿F(xiàn)了廣泛的應(yīng)用。



一、機器學(xué)習(xí)


機器學(xué)習(xí)是實現(xiàn)人工智能的核心方法,專門研究計算機如何模擬/實現(xiàn)生物體的學(xué)習(xí)行為,獲取新的知識技能,利用經(jīng)驗來改善特定算法的性能。根據(jù)學(xué)習(xí)范式的不同,機器學(xué)習(xí)可劃分為有監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)、強化學(xué)習(xí)三類。有監(jiān)督學(xué)習(xí)是指通過給計算機提供標(biāo)注數(shù)據(jù),讓計算機學(xué)習(xí)如何將輸入映射到輸出的過程。無監(jiān)督學(xué)習(xí)則是指在沒有標(biāo)注數(shù)據(jù)的情況下,讓計算機自行學(xué)習(xí)數(shù)據(jù)的特征和結(jié)構(gòu)。強化學(xué)習(xí)則是通過讓計算機在與環(huán)境的交互中不斷試錯,從而學(xué)習(xí)如何最大化獎勵的過程。深度學(xué)習(xí)是機器學(xué)習(xí)算法的一種,具有多層神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),其在圖像識別、語音處理等領(lǐng)域取得了劃時代的成果。


微信圖片_20230322153820.jpg


1、有監(jiān)督學(xué)習(xí):從有標(biāo)注訓(xùn)練數(shù)據(jù)中推導(dǎo)出預(yù)測函數(shù)


有監(jiān)督學(xué)習(xí)是機器學(xué)習(xí)任務(wù)的一種類型,其目的是從給定的訓(xùn)練數(shù)據(jù)集中學(xué)習(xí)出一個函數(shù)(模型參數(shù)),以便在新的數(shù)據(jù)到來時,能夠根據(jù)該函數(shù)預(yù)測結(jié)果。訓(xùn)練集中包括輸入和輸出,也稱為特征和目標(biāo),其中目標(biāo)是由人工標(biāo)注的。有監(jiān)督學(xué)習(xí)的過程一般包括確定訓(xùn)練類型、收集訓(xùn)練集、確定特征提取方法、選擇算法、訓(xùn)練算法、評估準(zhǔn)確性六個環(huán)節(jié)。通過已有的訓(xùn)練樣本去訓(xùn)練得到一個最優(yōu)模型,再利用該模型將所有的輸入映射為相應(yīng)的輸出,從而實現(xiàn)分類目的。



1)邏輯回歸


邏輯回歸是一種用于學(xué)習(xí)某事件發(fā)生概率的算法,它可以對某個事件的發(fā)生或不發(fā)生進行二元分類。邏輯回歸使用 Sigmoid 函數(shù)來輸出結(jié)果,其輸出結(jié)果的范圍在 [0,1] 之間。邏輯回歸的主要目標(biāo)是發(fā)現(xiàn)特征與特定結(jié)果可能性之間的聯(lián)系。例如,我們可以使用邏輯回歸來根據(jù)學(xué)習(xí)時長來預(yù)測學(xué)生是否通過考試,其中響應(yīng)變量為“通過”和“未通過”考試。



2)支持向量機:以間隔最大化為基準(zhǔn)學(xué)習(xí)遠離數(shù)據(jù)的決策邊界


支持向量機(Support Vector Machine,SVM)是一種基于間隔最大化的決策邊界算法。其主要目的是學(xué)習(xí)一個盡可能遠離數(shù)據(jù)的決策邊界,以確保分類的準(zhǔn)確性。在SVM中,支持向量是決策邊界的重要數(shù)據(jù)點,其位置對于分類結(jié)果具有重要的影響。


當(dāng)訓(xùn)練樣本線性可分時,SVM采用硬間隔最大化的方法學(xué)習(xí)線性可分支持向量機;當(dāng)訓(xùn)練樣本近似線性可分時,SVM采用軟間隔最大化的方法學(xué)習(xí)線性支持向量機。在解決線性不可分問題時,SVM引入核函數(shù),將數(shù)據(jù)映射到另一個特征空間,然后進行線性回歸。通過采用核方法的支持向量機,原本線性不可分的數(shù)據(jù)在特征空間內(nèi)變?yōu)榫€性可分,從而實現(xiàn)了分類的準(zhǔn)確性。



3)決策樹:以樹結(jié)構(gòu)形式表達的預(yù)測分析模型


決策樹是一種樹狀結(jié)構(gòu),用于對數(shù)據(jù)進行劃分。它通過一系列決策(選擇)來劃分?jǐn)?shù)據(jù),類似于針對一系列問題進行選擇。一棵決策樹通常包含一個根節(jié)點、若干個內(nèi)部節(jié)點和若干個葉節(jié)點。每個內(nèi)部節(jié)點表示一個屬性上的測試,每個分支代表一個測試輸出,每個葉節(jié)點代表一種類別。


決策樹的生成是一個遞歸過程。在決策樹基本算法中,有三種情況會導(dǎo)致遞歸返回:

  • 當(dāng)前節(jié)點包含的樣本全屬于同一類別,無需劃分。

  • 當(dāng)前屬性集為空或是所有樣本在所有屬性上取值相同,無法劃分。

  • 當(dāng)前節(jié)點包含的樣本集合為空,不能劃分。

這些情況都是決策樹生成過程中的終止條件。



4)隨機森林:利用多決策樹模型,提高模型預(yù)測精度


隨機森林是一種分類器,它利用多棵決策樹對樣本進行訓(xùn)練和預(yù)測。在隨機森林算法中,每個決策樹的輸出被收集起來,通過多數(shù)表決的方式得到最終的分類結(jié)果。這種方法類似于找人商量事情,不只聽一個人的意見,而是在聽取多人意見后綜合判斷。隨機森林的每棵樹都是通過以下步驟生成的:

  • 從訓(xùn)練集中隨機且有放回地抽取N個訓(xùn)練樣本,作為該樹的訓(xùn)練集,重復(fù)K次,生成K組訓(xùn)練樣本集;

  • 從M個特征中隨機選取m個特征,其中m<<M;

  • 利用m個特征實現(xiàn)每棵樹最大程度的生長,并且沒有剪枝過程。

這種方法可以有效地避免過擬合問題,并且在處理大型數(shù)據(jù)集時表現(xiàn)良好。



5)樸素貝葉斯是常用于自然語言分類問題的算法


樸素貝葉斯是一種基于概率進行預(yù)測的算法,主要用于分類問題。在實踐中,它被廣泛應(yīng)用于文本分類和垃圾郵件判定等自然語言處理領(lǐng)域。具體來說,該算法通過計算數(shù)據(jù)為某個標(biāo)簽的概率,將其分類為概率值最大的標(biāo)簽。例如,假設(shè)訓(xùn)練數(shù)據(jù)類別為電影(包括那部讓人感動的電影名作重映、華麗的動作電影首映和復(fù)映的名作感動了世界),訓(xùn)練數(shù)據(jù)類別為宇宙(包括沙塵暴籠罩著火星、火星探測終于重新開始和VR中看到的火星沙塵暴讓人感動),而驗證數(shù)據(jù)為“復(fù)映的動作電影名作讓人感動”。在這種情況下,樸素貝葉斯算法將通過計算“復(fù)映的動作電影名作讓人感動”屬于電影或宇宙的概率,來判斷該數(shù)據(jù)屬于哪個類別。以下為樸素貝葉斯算法過程:



2、無監(jiān)督學(xué)習(xí):對無標(biāo)簽樣本進行學(xué)習(xí)揭示數(shù)據(jù)內(nèi)在規(guī)律


無監(jiān)督學(xué)習(xí)是一種機器學(xué)習(xí)方法,其主要目的是在沒有標(biāo)記的訓(xùn)練數(shù)據(jù)的情況下生成模型。這種方法通常用于缺乏足夠的先驗知識難以進行人工標(biāo)注類別或進行人工類別標(biāo)注成本高的情況下。無監(jiān)督學(xué)習(xí)的目標(biāo)是通過對無標(biāo)簽樣本的學(xué)習(xí)來揭示數(shù)據(jù)的內(nèi)在特性及規(guī)律。該方法主要涉及聚類和降維問題。聚類問題包括K-means聚類、概念聚類、模糊聚類等算法,其目標(biāo)是為數(shù)據(jù)點分組,使得不同聚類中的數(shù)據(jù)點不相似,同一聚類中的數(shù)據(jù)點則是相似的。降維問題主要是主成分分析、線性判別分析、多維尺度分析等算法,其中主成分分析將數(shù)據(jù)中存在的空間重映射成一個更加緊湊的空間,此種變換后的維度比原來維度更小。無監(jiān)督學(xué)習(xí)適用于發(fā)現(xiàn)異常數(shù)據(jù)、用戶類別劃分、推薦系統(tǒng)等場景。



1)策略梯度:有效處理高維及連續(xù)動作空間問題


策略梯度(Policy Gradient,PG)是一種基于策略優(yōu)化的強化學(xué)習(xí)算法。在強化學(xué)習(xí)中,機器通過判斷在特定狀態(tài)下采取不同動作所得環(huán)境回報大小來評價采取該動作的優(yōu)劣。PG的核心思想是,當(dāng)一個動作的環(huán)境回報較大時,增加其被選擇的概率;反之,減少該動作被選擇的概率。每個動作選擇概率由神經(jīng)網(wǎng)絡(luò)決定,以參數(shù)化神經(jīng)網(wǎng)絡(luò)表示策略(記為????)。通過調(diào)整參數(shù)??,使總體回報期望值最大化,從而實現(xiàn)最優(yōu)策略的學(xué)習(xí)。最大化問題可轉(zhuǎn)化為求取回報函數(shù)關(guān)于參數(shù)??的梯度,一般使用梯度上升算法,即為策略梯度算法。為提高算法的收斂性和效率,通常采取引入基線(baseline)、修改因果關(guān)系(當(dāng)前策略不影響該時間點之前的回報)和引入回報權(quán)重等方式。



2)時序差分學(xué)習(xí):結(jié)合蒙特卡羅方法與動態(tài)規(guī)劃特點,提升策略優(yōu)化速度


時序差分學(xué)習(xí)(Temporal Difference,TD)是一種無需具體環(huán)境模型,可直接從經(jīng)驗中學(xué)習(xí)的方法。它結(jié)合了動態(tài)規(guī)劃和蒙特卡羅方法的優(yōu)點,能夠在每執(zhí)行一步策略后即進行Q函數(shù)更新,而不必等到完成一個采樣軌跡后才進行更新。根據(jù)算法中采樣策略和更新Q值策略是否相同,TD學(xué)習(xí)可分為同策略算法(on-policy)和異策略算法(off-policy)。同策略代表算法為Sarsa,其行為策略和目標(biāo)策略均為貪心策略;異策略代表算法為Q-Learning(或稱SarsaMax),其行為策略為貪心策略,而目標(biāo)策略為確定性策略。Sarsa收斂速度較快,但可能無法得到全局最優(yōu)解;Q-Learning可找到全局最優(yōu)解,但收斂速度較慢,因此需要根據(jù)具體問題選擇合適的算法。



3)深度Q網(wǎng)絡(luò):神經(jīng)網(wǎng)絡(luò)與Q-Learning結(jié)合,有效應(yīng)對復(fù)雜狀態(tài)空間


深度Q網(wǎng)絡(luò)(Deep Q-network, DQN)是一種基于深度學(xué)習(xí)的Q-Learning算法,由Google DeepMind團隊于2013年提出,并在2015年進一步完善。傳統(tǒng)的強化學(xué)習(xí)算法(如動態(tài)規(guī)劃、蒙特卡羅方法、時序差分學(xué)習(xí)等)的狀態(tài)均為離散、有限的,并使用查找表存儲狀態(tài)價值或Q函數(shù)。然而,現(xiàn)實生活中的狀態(tài)多為連續(xù)的,即使離散化后狀態(tài)空間(系統(tǒng)全部可能狀態(tài)的集合)仍十分龐大,因而產(chǎn)生內(nèi)存不足、表格搜索耗時過長等問題。DQN則通過DNN、CNN或RNN等神經(jīng)網(wǎng)絡(luò)對價值函數(shù)做近似表示,利用經(jīng)驗回放方式替代查找表,令最終結(jié)果無限逼近全局最優(yōu)解,有效解決Q-Learning狀態(tài)空間有限問題。



4)Actor-Critic算法:綜合策略梯度與Q-Learning優(yōu)勢,提高學(xué)習(xí)效率和準(zhǔn)確性


Actor-Critic算法(AC)是一種強化學(xué)習(xí)算法,也被稱為“演員-評論家”算法。它由兩個神經(jīng)網(wǎng)絡(luò)組成:策略網(wǎng)絡(luò)Actor和評價網(wǎng)絡(luò)Critic。Actor使用基于策略優(yōu)化的算法,如策略梯度,來決定在當(dāng)前狀態(tài)下采取何種動作。Critic使用基于值優(yōu)化的算法,如Q-Learning,對Actor所選動作進行評分,Actor根據(jù)Critic評分改進動作選擇概率。AC算法結(jié)合了策略梯度和Q-Learning算法的優(yōu)點,既可以做到單步更新,又可以擴展至連續(xù)狀態(tài)空間,提高策略更新效率同時解決高偏差問題。目前,AC算法已經(jīng)發(fā)展出了Advantage Actor-Critic(A2C)以及Asynchronous advantage Actor-Critic(A3C)等改進型,進一步提高了策略準(zhǔn)確性,降低了內(nèi)存需求。



3、遷移學(xué)習(xí):將知識由源域遷移至目標(biāo)域,提高機器學(xué)習(xí)效率


遷移學(xué)習(xí)(Transfer Learning, TL)是一種機器學(xué)習(xí)方法,其核心目標(biāo)是將已訓(xùn)練好的模型參數(shù)遷移到新的模型來幫助新模型訓(xùn)練。這種方法可以將知識從源域遷移到目標(biāo)域,讓機器也可以做到“觸類旁通”。遷移學(xué)習(xí)的主要優(yōu)點是節(jié)省模型訓(xùn)練時間,且在目標(biāo)域訓(xùn)練數(shù)據(jù)不足時,模型仍能取得較好的性能。遷移學(xué)習(xí)的訓(xùn)練框架可以概括為:

1)選擇源模型,從可用模型中挑選出預(yù)訓(xùn)練模型;

2)重用模型,在目標(biāo)域中使用源模型進行訓(xùn)練;

3)調(diào)整模型。模型可以在目標(biāo)數(shù)據(jù)集中對輸入-輸出進行選擇性微調(diào),以讓其適應(yīng)目標(biāo)任務(wù)。

實現(xiàn)遷移學(xué)習(xí)的方式主要包括樣本遷移、特征遷移、模型遷移。目前,遷移學(xué)習(xí)主要應(yīng)用在計算機視覺、自然語言處理等領(lǐng)域。



4、聯(lián)邦學(xué)習(xí):以分布式機器學(xué)習(xí)方式,有效化解信息孤島問題


聯(lián)邦學(xué)習(xí)(Federated Learning,FL)是由Google公司首次提出的一種學(xué)習(xí)機制,它允許多個數(shù)據(jù)持有方協(xié)同訓(xùn)練模型,而不需要共享數(shù)據(jù),僅在中間階段交換訓(xùn)練參數(shù)。根據(jù)數(shù)據(jù)分布情況,聯(lián)邦學(xué)習(xí)可分為橫向聯(lián)邦學(xué)習(xí)、縱向聯(lián)邦學(xué)習(xí)和聯(lián)邦遷移學(xué)習(xí)。聯(lián)邦學(xué)習(xí)的基本流程包括:

1)客戶端從服務(wù)器下載全局模型;

2)訓(xùn)練本地數(shù)據(jù)得到本地模型;

3)上傳模型更新信息;

4)中心服務(wù)器加權(quán)聚合本地模型,得到更新后的全局模型。

通過多次迭代,聯(lián)邦學(xué)習(xí)可以得到趨近于集中式機器學(xué)習(xí)結(jié)果的模型。聯(lián)邦學(xué)習(xí)是一項新興技術(shù),在物聯(lián)網(wǎng)、智慧醫(yī)療、金融風(fēng)控、智慧城市等領(lǐng)域都有廣闊的應(yīng)用前景。



二、深度學(xué)習(xí)


1、神經(jīng)網(wǎng)絡(luò):具有適應(yīng)性簡單單元組成的廣泛并行互聯(lián)網(wǎng)絡(luò)


神經(jīng)網(wǎng)絡(luò)是一種由數(shù)千甚至數(shù)百萬個緊密互連的簡單處理節(jié)點組成的模型。它主要包括輸入層、中間層/隱藏層和輸出層。輸入層接收輸入數(shù)據(jù),中間層使用非線性函數(shù)對輸入數(shù)據(jù)進行計算,輸出層使用非線性函數(shù)對中間層數(shù)據(jù)進行計算,最終輸出結(jié)果。神經(jīng)網(wǎng)絡(luò)可以用于回歸,但主要應(yīng)用于分類問題。通過設(shè)置中間層的數(shù)量和層的深度,神經(jīng)網(wǎng)絡(luò)可以學(xué)習(xí)更復(fù)雜的邊界特征,從而得出更加準(zhǔn)確的結(jié)果。



2、卷積神經(jīng)網(wǎng)絡(luò):以圖像識別為核心的深度學(xué)習(xí)算法


卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)是一種由數(shù)千甚至數(shù)百萬個緊密互連的簡單處理節(jié)點組成的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),主要用于處理圖片、視頻等類型數(shù)據(jù)。該網(wǎng)絡(luò)結(jié)構(gòu)主要包括輸入層、卷積層、池化層、全連接層和輸出層。早在1980年,日本科學(xué)家福島邦彥就提出了一個包含卷積層、池化層的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。隨后,Yann Lecun將BP算法應(yīng)用到該神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的訓(xùn)練上,形成了當(dāng)代卷積神經(jīng)網(wǎng)絡(luò)的雛形。在1998年,Yann LeCun及其合作者構(gòu)建了更加完備的卷積神經(jīng)網(wǎng)絡(luò)LeNet-5,并在手寫數(shù)字的識別問題中取得了成功。此外,1998年Wei Zhang提出了第一個二維卷積神經(jīng)網(wǎng)絡(luò):平移不變?nèi)斯ど窠?jīng)網(wǎng)絡(luò)(SIANN),并將其應(yīng)用于檢測醫(yī)學(xué)影像。



卷積層、池化層、全連接層和輸出層是卷積神經(jīng)網(wǎng)絡(luò)中的四個主要組成部分。在卷積層中,輸入的圖片會被轉(zhuǎn)化成RGB對應(yīng)的數(shù)字,并通過卷積核進行卷積操作,以提取輸入中的主要特征。池化層的作用是壓縮特征映射圖尺寸,從而降低后續(xù)網(wǎng)絡(luò)處理的負載。全連接層計算激活值,并通過激活函數(shù)計算各單元輸出值,常用的激活函數(shù)包括Sigmoid、tanh、ReLU等。輸出層使用似然函數(shù)計算各類別似然概率。



3、循環(huán)神經(jīng)網(wǎng)絡(luò):用于處理序列數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò)


循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network, RNN)是一種神經(jīng)網(wǎng)絡(luò),其輸入為序列數(shù)據(jù),例如時間序列數(shù)據(jù)、信息性字符串或?qū)υ挼?。該網(wǎng)絡(luò)在序列的演進方向進行遞歸,并通過鏈?zhǔn)竭B接所有節(jié)點(循環(huán)單元)。RNN在語言建模和文本生成、機器翻譯、語音識別、生成圖像描述和視頻標(biāo)記等領(lǐng)域得到廣泛應(yīng)用。



4、圖神經(jīng)網(wǎng)絡(luò):用于處理圖結(jié)構(gòu)數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò)


圖神經(jīng)網(wǎng)絡(luò)(Graph Neural Networks,GNN)是一種將圖數(shù)據(jù)和神經(jīng)網(wǎng)絡(luò)進行結(jié)合的新型機器學(xué)習(xí)方法。它能夠在圖數(shù)據(jù)上進行端對端的計算,具備端對端學(xué)習(xí)、擅長推理、可解釋性強的特點。目前,圖神經(jīng)網(wǎng)絡(luò)已經(jīng)發(fā)展出多個分支,主要包括圖卷積網(wǎng)絡(luò)、圖注意力網(wǎng)絡(luò)、圖自編碼器、圖生成網(wǎng)絡(luò)和圖時空網(wǎng)絡(luò)等。


圖神經(jīng)網(wǎng)絡(luò)的訓(xùn)練框架如下:首先,每個節(jié)點獲取其相鄰節(jié)點的所有特征信息,將聚合函數(shù)(如求和或取平均)應(yīng)用于這些信息。聚合函數(shù)的選擇必須不受節(jié)點順序和排列的影響。之后,將前一步得到的向量傳入一個神經(jīng)網(wǎng)絡(luò)層(通常是乘以某個矩陣),然后使用非線性激活函數(shù)(如ReLU)來獲得新的向量表示。


圖神經(jīng)網(wǎng)絡(luò)在許多領(lǐng)域的實際應(yīng)用中都展現(xiàn)出強大的表達能力和預(yù)測能力。例如,在物理仿真、科學(xué)研究、生物醫(yī)藥、金融風(fēng)控等領(lǐng)域,圖神經(jīng)網(wǎng)絡(luò)已經(jīng)被廣泛應(yīng)用。它不僅能夠?qū)D數(shù)據(jù)進行分類、回歸和聚類等任務(wù),還能夠進行圖生成、圖表示學(xué)習(xí)和圖推理等任務(wù)。因此,圖神經(jīng)網(wǎng)絡(luò)被認為是一種非常有前途的機器學(xué)習(xí)方法。



5、長短期記憶神經(jīng)網(wǎng)絡(luò):在RNN中加入門控機制,解決梯度消失問題


長短期記憶神經(jīng)網(wǎng)絡(luò)(Long Short-Term Memory,LSTM)是一種特殊的循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN),它可以有效地解決傳統(tǒng)RNN在訓(xùn)練中出現(xiàn)的“長期依賴”問題。在訓(xùn)練時間加長和層數(shù)增多的情況下,傳統(tǒng)RNN很容易出現(xiàn)梯度爆炸或梯度消失問題,導(dǎo)致無法處理長序列數(shù)據(jù)。LSTM由狀態(tài)單元、輸入門、遺忘門和輸出門組成,通過這些門的控制,可以實現(xiàn)長期記憶與短期記憶的結(jié)合,從而達到序列學(xué)習(xí)的目的。LSTM的應(yīng)用領(lǐng)域非常廣泛,包括文本生成、機器翻譯、語音識別、生成圖像描述和視頻標(biāo)記等。



6、自編碼器:通過期望輸出等同于輸入樣本的過程,實現(xiàn)對輸入樣本抽象特征學(xué)習(xí) 典型深度無監(jiān)督學(xué)習(xí)模型包括自編碼器、受限波爾茲曼機與生成對抗網(wǎng)絡(luò)。


自編碼器(Autoencoder,AE)是一種神經(jīng)網(wǎng)絡(luò)模型,由編碼器和解碼器兩部分組成。編碼器將高維輸入樣本映射到低維抽象表示,實現(xiàn)樣本壓縮和降維;解碼器將抽象表示轉(zhuǎn)換為期望輸出,實現(xiàn)輸入樣本的復(fù)現(xiàn)。自編碼器的輸入和期望輸出均為無標(biāo)簽樣本,隱藏層輸出則作為樣本的抽象特征表示。自編碼器通過最小化輸入樣本與重構(gòu)樣本之間的誤差來獲取輸入樣本的抽象特征表示,但無法保證自編碼器提取到樣本的本質(zhì)特征。為避免這個問題,需要對自編碼器添加約束或修改網(wǎng)絡(luò)結(jié)構(gòu),進而產(chǎn)生稀疏自編碼器、去噪自編碼器、收縮自編碼器等改進算法。自編碼器憑借其優(yōu)異的特征提取能力,主要應(yīng)用于目標(biāo)識別、文本分類、圖像重建等領(lǐng)域。



7、生成對抗網(wǎng)絡(luò):通過對抗訓(xùn)練機制使得生成器生成以假亂真的樣本


生成對抗網(wǎng)絡(luò)(GAN)是一種通過對抗訓(xùn)練機制對兩個神經(jīng)網(wǎng)絡(luò)進行訓(xùn)練的方法,以避免反復(fù)應(yīng)用馬爾可夫鏈學(xué)習(xí)機制帶來的配分函數(shù)計算,從而明顯提高應(yīng)用效率。GAN包含一組相互對抗的模型,即判別器和生成器。判別器的目的是正確區(qū)分真實數(shù)據(jù)和生成數(shù)據(jù),使得判別準(zhǔn)確率最大化;而生成器則是盡可能逼近真實數(shù)據(jù)的潛在分布。類比于造假鈔的人和警察的博弈,生成器類似于造假鈔的人,其制造出以假亂真的假鈔;而判別器則類似于警察,盡可能鑒別出假鈔。在這個博弈中,雙方不斷提升各自的能力,以達到更高的準(zhǔn)確率和更逼真的生成數(shù)據(jù)。



三、計算機視覺


1、U-Net:在有限數(shù)據(jù)集圖像分割方面獨具優(yōu)勢


U-Net是一種由Olaf Ronneberger、Philipp Fischer等人于2015年首次提出的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),最初應(yīng)用于醫(yī)學(xué)圖像分割領(lǐng)域。該網(wǎng)絡(luò)結(jié)構(gòu)可視化的結(jié)果形如字母“U”,由左側(cè)的收縮路徑和右側(cè)的擴展路徑兩部分組成。相較于傳統(tǒng)模型,U-Net在架構(gòu)和基于像素的圖像分割方面更具優(yōu)勢,且在有限數(shù)據(jù)集圖像上更加有效。在生物醫(yī)學(xué)圖像領(lǐng)域,U-Net通過彈性變形方法幫助擴充數(shù)據(jù)集,從而提高學(xué)習(xí)效果。此外,U-Net在衛(wèi)星圖像遙感和無人駕駛系統(tǒng)等相關(guān)領(lǐng)域也有應(yīng)用。因此,圖像分割不僅限于醫(yī)學(xué)圖像領(lǐng)域,其在其他領(lǐng)域也有廣泛的應(yīng)用。




2、R-CNN:基于深度學(xué)習(xí)模型的目標(biāo)檢測算法


目標(biāo)檢測算法主要分為兩類:R-CNN和Yolo。R-CNN(Region-CNN)最早將深度學(xué)習(xí)應(yīng)用在目標(biāo)檢測任務(wù)中。目標(biāo)檢測任務(wù)是計算機視覺中的重要組成部分,其在人臉識別、自動駕駛等領(lǐng)域有著廣泛應(yīng)用。傳統(tǒng)目標(biāo)檢測方法大多以圖像識別為基礎(chǔ),在圖片上使用窮舉法選出所有物體可能出現(xiàn)的區(qū)域框,對這些區(qū)域框提取特征并使用圖像識別方法分類,得到所有分類成功的區(qū)域后,通過非極大值抑制算法得到輸出結(jié)果。R-CNN遵循傳統(tǒng)目標(biāo)檢測的思路,但在提取特征這一步,將傳統(tǒng)特征換成深度卷積網(wǎng)絡(luò)提取的特征。雖然R-CNN準(zhǔn)確度高,但速度慢。相比之下,Yolo算法速度快但準(zhǔn)確性相對低。



3、Yolo:采用CNN模型實現(xiàn)端到端的目標(biāo)檢測算法


以往的目標(biāo)檢測算法通常采用滑動窗口的方式,將檢測問題轉(zhuǎn)化為圖像分類問題,但存在計算量過大等弊端。為了解決這個問題,Yolo算法應(yīng)運而生。Yolo算法直接將原始圖片分割成互不重合的小方塊,然后通過卷積產(chǎn)生特征圖。具體而言,Yolo算法采用單獨的CNN模型實現(xiàn)端到端的目標(biāo)檢測,包含24個卷積層和2個全連接層。卷積層主要使用1x1卷積來做通道縮減,然后緊跟3x3卷積。卷積層和全連接層采用Leaky ReLU激活函數(shù),最后一層采用線性激活函數(shù)。Yolo算法的優(yōu)點在于采用CNN實現(xiàn)檢測,訓(xùn)練和預(yù)測都是端到端過程,因此該算法比較簡潔且速度快。同時,由于Yolo是對整張圖片做卷積,因此在檢測目標(biāo)時擁有更大的視野且不容易對背景誤判。然而,Yolo算法的缺點是其在物體的寬高比方面泛化率相對較低,無法定位不尋常比例的物體。



四、自然語言處理


1、自然語言處理:用于分析、理解和生成自然語言,便于人機間交流


自然語言處理(NLP)是一種通過對詞、句子、篇章進行分析,理解其中的人物、時間、地點等內(nèi)容,從而支持一系列核心技術(shù)的技術(shù)。這些技術(shù)包括跨語言的翻譯、問答系統(tǒng)、閱讀理解、知識圖譜等,可以應(yīng)用于搜索引擎、客服、金融、新聞等領(lǐng)域。例如,在機器翻譯中,輸入的源語言句子經(jīng)過詞法和句法分析得到句法樹,然后通過轉(zhuǎn)換規(guī)則將源語言句子句法樹進行轉(zhuǎn)換,生成目標(biāo)語言的句法樹,最后得到目標(biāo)語言句子。



2、Word2Vec:以分布式方法表示詞向量,有效降低維度,豐富詞語間關(guān)系


Word2Vec,即Word to Vector,是一種高效的詞向量訓(xùn)練模型,由Google團隊Tomas Mikolov等人于2013年提出。在自然語言處理任務(wù)中,需要將單詞或詞語轉(zhuǎn)化為數(shù)值向量(詞向量)以供計算機識別,這一過程稱為詞嵌入。早期的One-Hot編碼方法簡單易懂、有較好的魯棒性,但存在維度爆炸問題,且無法表示詞語相關(guān)關(guān)系。Word2Vec使用分布式詞向量表示方法,有效降低詞向量維度,豐富單詞間關(guān)系。Word2Vec主要使用CBOW(連續(xù)詞袋)模型和Skip-Gram(跳詞)模型兩種預(yù)測方法。前者根據(jù)上下文預(yù)測當(dāng)前詞,適用于小語庫;后者根據(jù)當(dāng)前詞預(yù)測上下文,在大型語料庫中表現(xiàn)更好。



3、Seq2Seq:基于循環(huán)神經(jīng)網(wǎng)絡(luò)輸出非固定長度語句


Seq2Seq(Sequence to Sequence)是一種神經(jīng)網(wǎng)絡(luò)模型,由Google Brain和Yoshua Bengio團隊在2014年分別獨立提出。它的主要應(yīng)用場景是解決機器翻譯任務(wù)中輸出語句長度不確定的問題。Seq2Seq模型基于RNN或LSTM等神經(jīng)網(wǎng)絡(luò)算法,由編碼器(Encoder)和解碼器(Decoder)兩部分構(gòu)成。編碼器負責(zé)將輸入序列壓縮為指定長度的語義向量,而解碼器則根據(jù)語義向量生成指定序列。這種模型可以實現(xiàn)序列信號轉(zhuǎn)化為無固定長度序列輸出,而傳統(tǒng)的RNN只能將序列信號轉(zhuǎn)化為固定長度序列輸出。除了機器翻譯,Seq2Seq還被應(yīng)用于文本摘要、圖像描述文本生成、語音識別等場景。



4、門控卷積神經(jīng)網(wǎng)絡(luò):應(yīng)用于語言建模,以并行計算方式加速學(xué)習(xí)過程


門控卷積神經(jīng)網(wǎng)絡(luò)(Gated Convolutional Neural Networks):由Facebook團隊Yann等人在2016年提出,使用基于門控機制的卷積神 經(jīng)網(wǎng)絡(luò)處理語言建模問題。與循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)相比,門控卷積神經(jīng)網(wǎng)絡(luò)可實現(xiàn)并行計算,有效縮短運行時長。由于卷積神經(jīng)網(wǎng)絡(luò) 不存在梯度消失問題,因而門控卷積神經(jīng)網(wǎng)絡(luò)中的門控機制更加簡化,僅需保留輸出門用于判定信息是否傳遞至下一層,可實現(xiàn)更高精 度及更快收斂速度。目前,門控卷積神經(jīng)網(wǎng)絡(luò)模型已被應(yīng)用于光學(xué)字符識別(OCR)、機器閱讀理解等多個領(lǐng)域。



五、語音處理


1、語音識別:將語音自動轉(zhuǎn)換為文字的過程


語音識別(Speech Recognition,SR)是將語音自動轉(zhuǎn)換為文字的過程,目的是將語音信號轉(zhuǎn)變?yōu)橛嬎銠C可讀的文本字符或命令。動態(tài)規(guī)劃匹配方法是最具代表性的研究成果之一,該方法能夠?qū)⑤斎胝Z音與樣本語音的各自特征,按時間軸進行伸縮、匹配。隨著時間的推移,基于隱馬爾可夫模型的統(tǒng)計建模方法逐漸取代了基于模版匹配的方法,基于高斯混合模型-隱馬爾可夫模型的混合聲學(xué)建模技術(shù)推動語音識別技術(shù)的蓬勃發(fā)展。到21世紀(jì)初,深度學(xué)習(xí)技術(shù)在語音識別中發(fā)揮重要作用,使語音識別的研究獲得突破性進展。語音識別技術(shù)主要包括特征提取、模式匹配和模型訓(xùn)練三個方面。特征提取是將語音信號轉(zhuǎn)化為計算機能夠處理的語音特征向量,常用的特征參數(shù)有基音周期、共振峰、短時平均能量或幅度等;模式匹配是根據(jù)一定的準(zhǔn)則,使未知模式與模型庫中的某一個模型獲得最佳匹配的過程;模型訓(xùn)練是提取語音庫中語音樣本的特征參數(shù)作為訓(xùn)練數(shù)據(jù),合理設(shè)置模型參數(shù)初始值,對模型參數(shù)進行重估,使識別系統(tǒng)具有更佳的識別效果。



2、基于深度神經(jīng)網(wǎng)絡(luò)-隱馬爾可夫模型的聲學(xué)模型成為主流聲學(xué)建模技術(shù)


聲學(xué)模型承載著聲學(xué)特征與建模單元之間的映射關(guān)系,其中建模單元包括音素、音節(jié)、詞語等,其單元粒度依次增加。然而,若采用詞語作為建模單元,每個詞語的長度不等,導(dǎo)致聲學(xué)建模缺少靈活性,很難充分訓(xùn)練基于詞語的模型。相比之下,詞語中包含的音素是確定且有限的,利用大量的訓(xùn)練數(shù)據(jù)可以充分訓(xùn)練基于音素的模型。因此,目前大多數(shù)聲學(xué)模型一般采用音素作為建模單元。


混合聲學(xué)模型是比較經(jīng)典的聲學(xué)模型,通??梢苑譃閮煞N:基于高斯混合模型-隱馬爾可夫模型的聲學(xué)模型和基于深度神經(jīng)網(wǎng)絡(luò)-隱馬爾可夫模型的聲學(xué)模型。后者具有兩方面優(yōu)勢:一是深度神經(jīng)網(wǎng)絡(luò)能利用語音特征的上下文信息;二是深度神經(jīng)網(wǎng)絡(luò)能學(xué)習(xí)非線性的更高層次特征表達。因此,基于深度神經(jīng)網(wǎng)絡(luò)-隱馬爾可夫模型的聲學(xué)模型已成為目前主流的聲學(xué)建模技術(shù)。



3、語音合成:將任意輸入的文本轉(zhuǎn)換成自然流暢的語音輸出


語音合成(Text To Speech, TTS)是一種將文本轉(zhuǎn)換為語音的技術(shù),賦予機器像人一樣自如說話的能力,是人機語音交互中重要的一環(huán)。語音合成系統(tǒng)分為文本前端和聲學(xué)后端兩個部分。文本前端主要負責(zé)在語言層、語法層、語義層對輸入文本進行預(yù)處理,如為文本添加韻律信息,并將文本詞面轉(zhuǎn)化為語言學(xué)特征序列。聲學(xué)后端可以分為聲學(xué)特征生成網(wǎng)絡(luò)和聲碼器。聲學(xué)特征生成網(wǎng)絡(luò)根據(jù)文本前端輸出的信息產(chǎn)生聲學(xué)特征。聲碼器利用頻譜等聲學(xué)特征,生成語音樣本點并重建時域波形。近年來出現(xiàn)的端到端語音合成系統(tǒng)則將聲學(xué)后端合并為一個整體,可直接將語言學(xué)特征序列,甚至字符直接合成語音。


目前,語音合成技術(shù)已經(jīng)廣泛應(yīng)用于銀行、醫(yī)院信息播報系統(tǒng)、自動應(yīng)答呼叫中心等領(lǐng)域。這些應(yīng)用場景需要機器能夠快速、準(zhǔn)確地將大量的文本信息轉(zhuǎn)化為語音,以提供更好的用戶體驗。隨著技術(shù)的不斷發(fā)展,語音合成系統(tǒng)的語音質(zhì)量和性能也在不斷提高,未來將會有更多的應(yīng)用場景涌現(xiàn)。



六、知識圖譜:利用圖模型來描述知識和建模萬物關(guān)系的語義網(wǎng)絡(luò)


知識圖譜是一種結(jié)構(gòu)化描述客觀世界中概念、實體之間關(guān)系的方式,旨在提高搜索引擎的能力,提高用戶搜索質(zhì)量,改善用戶搜索體驗。其最常見的表示形式是RDF(三元組),即“實體x關(guān)系x另一實體”或“實體x屬性x屬性值”集合,其中節(jié)點代表實體或概念,邊代表實體/概念之間的各種語義關(guān)系。知識圖譜的構(gòu)建過程旨在讓計算機更好地理解各行業(yè)領(lǐng)域信息,使其具備人的認知能力。基本構(gòu)建流程包括知識抽?。ㄈ鐚嶓w抽取、關(guān)系抽取)、知識融合(如數(shù)據(jù)整合、實體對齊)、知識加工(如知識推理)等。由于圖數(shù)據(jù)相對于傳統(tǒng)的關(guān)系型數(shù)據(jù)具有更強大的表達能力,善于處理大量、復(fù)雜、互聯(lián)、多變的網(wǎng)狀數(shù)據(jù),因此圖數(shù)據(jù)的計算與推理逐漸成為知識圖譜的重要研究任務(wù)之一。



人工智能產(chǎn)業(yè)企業(yè)案例


一、格靈深瞳


1、以三維視覺技術(shù)為核心,致力開發(fā)高價值A(chǔ)I應(yīng)用場景


格靈深瞳成立于2013年,專注于人工智能領(lǐng)域,致力于將先進的計算機視覺、大數(shù)據(jù)分析、機器人和人機交互技術(shù)與應(yīng)用場景深度融合,以“讓計算機看懂世界,讓AI造福人類”為愿景,為智慧金融、體育健康、軌交運維、城市管理、商業(yè)零售、元宇宙等領(lǐng)域提供人工智能產(chǎn)品及解決方案。


格靈深瞳在三維計算機視覺技術(shù)方面處于行業(yè)頭部水平,未來主要應(yīng)用場景的人工智能產(chǎn)品均依托三維視覺技術(shù),可實現(xiàn)對場景中人員位置和姿態(tài)、三維物體的精準(zhǔn)檢測和識別。2022年,格靈深瞳成功上市科創(chuàng)板,成為一家備受關(guān)注的人工智能賽道上市企業(yè)。



2、軌交運維領(lǐng)域及體育健康領(lǐng)域解決方案展示


格靈深瞳推出了兩款智能解決方案,分別是列車智能檢測解決方案和校園體育訓(xùn)練考試產(chǎn)品。列車智能檢測解決方案由智能巡檢機器人、車輛360動態(tài)圖像監(jiān)測系統(tǒng)和深瞳鷹眼列車智能檢測系統(tǒng)組成。通過對列車各零部件的多維數(shù)據(jù)的高質(zhì)量采集與智能分析,實現(xiàn)自動化的故障或缺陷檢測,助力軌道交通更加的智慧高效。校園體育訓(xùn)練考試產(chǎn)品面向“教、練、考、賽”四大場景,對人員過程性數(shù)據(jù)進行采集分析,精準(zhǔn)評估輔助決策,構(gòu)建綜合性學(xué)生體能提升路徑。包括搭載視覺交互體能訓(xùn)練系統(tǒng)的體能訓(xùn)練交互屏、智能視覺訓(xùn)練考核分析服務(wù)、體育大數(shù)據(jù)分析平臺等軟硬件產(chǎn)品,助力智慧校園體育建設(shè)。



二、百應(yīng)科技


百應(yīng)科技是一家專注于對話式AI技術(shù)的產(chǎn)品服務(wù)商,致力于為客戶提供全面的智能對話、語音和虛擬人等核心領(lǐng)域的全棧技術(shù)能力。我們推出了六大AI對話機器人應(yīng)用,并根據(jù)政企客戶在溝通運營方面的需求,提供了豐富的產(chǎn)品方案。我們已經(jīng)深度布局金融、政務(wù)、零售三大行業(yè),并在教育、電商、醫(yī)美、家居等20多個行業(yè)領(lǐng)域為客戶提供高易用性的場景化落地方案。



三、94AI


九四智能是一家成立于2018年的智能運營產(chǎn)品和服務(wù)提供商,以AI語音技術(shù)為核心,聚焦語音識別與合成、NLP、數(shù)據(jù)挖掘等關(guān)鍵技術(shù)。結(jié)合團隊在多行業(yè)的精細化運營實操經(jīng)驗,為客戶提供智能用戶運營SaaS平臺,應(yīng)用于金融營銷、催收、電商大促等多種用戶運營場景。九四智能自主研發(fā)的語音半合成技術(shù)讓AI語音流暢自然高度擬人,配合行業(yè)針對性話術(shù)策略,能有效提升業(yè)務(wù)效果。在人機交互方面,九四智能根據(jù)業(yè)務(wù)場景需要提供AI與人工相結(jié)合的解決方案及全套調(diào)度運營服務(wù),賦能企業(yè)的智能化轉(zhuǎn)型和業(yè)績提升。目前,九四智能在金融、電商零售、教育、大健康、政府/事業(yè)單位等多個行業(yè)擁有眾多客戶。


四、思必馳


1、專注人性化語音交互,布局全鏈路對話式AI產(chǎn)品方案


思必馳是一家專業(yè)的人工智能平臺企業(yè),致力于通過智能對話系統(tǒng)定制開發(fā)平臺和人工智能語音芯片,提供軟硬件結(jié)合的人工智能技術(shù)與產(chǎn)品服務(wù),實現(xiàn)普適的智能人機信息交互。公司主要業(yè)務(wù)包括智能人機交互軟件產(chǎn)品、軟硬一體化人工智能產(chǎn)品以及對話式人工智能技術(shù)服務(wù),覆蓋智能家電、智能汽車、消費電子等物聯(lián)網(wǎng)領(lǐng)域,以及數(shù)字政企類客戶為主的生產(chǎn)、生活和社會治理領(lǐng)域(包括金融服務(wù)、交通物流、地產(chǎn)酒店、政務(wù)民生、醫(yī)療健康)等行業(yè)場景。



2、深化車聯(lián)網(wǎng)領(lǐng)域人機交互服務(wù),推動汽車產(chǎn)業(yè)智能化升級


思必馳是一家專注于車聯(lián)網(wǎng)領(lǐng)域的企業(yè),致力于為用戶提供智能化交互服務(wù),以大幅提升行車的安全性、便利性和娛樂性。同時,思必馳不斷創(chuàng)新出行陪伴方式,推動汽車產(chǎn)業(yè)走向高端化和綠色化發(fā)展。該公司基于自研全鏈路語音交互技術(shù),為兩輪車和汽車前裝、后裝設(shè)備提供語音技術(shù)SDK、天琴車載語音助手(國內(nèi)版/海外版)以及軟硬一體化解決方案,以滿足主機廠、車廠和Tier1廠商對語音交互的需求。此外,思必馳還提供場景化大數(shù)據(jù)運營服務(wù)能力,以推進車聯(lián)網(wǎng)智能化升級。目前,思必馳已成功與哪吒汽車、小鵬汽車、理想汽車、北汽集團、一汽奔騰、上汽通用五菱、雅迪等企業(yè)合作,推出包括哪吒汽車V/U/S、小鵬汽車P7/P5/G3、理想汽車ONE/L7/L8/L9、宏光MINIEV系列、雅迪VFLY流星隼N系列等多款車型。



五、中關(guān)村科金


1、以對話式AI為技術(shù)底座,打造企業(yè)級AI應(yīng)用場景,激發(fā)產(chǎn)業(yè)新動能


中關(guān)村科金成立于2014年,總部位于北京,在上海、重慶、深圳、成都等地設(shè)有分支機構(gòu)。作為對話式AI技術(shù)解決方案提供商,中關(guān)村科金是國家高新技術(shù)企業(yè)、中關(guān)村高新技術(shù)企業(yè)、北京市專精特新“小巨人”企業(yè)。公司堅持自主研發(fā),在人工智能、大數(shù)據(jù)、實時音視頻等前沿技術(shù)領(lǐng)域形成多項核心能力。其中,人臉識別、聲紋識別等人工智能前沿技術(shù)成果屢獲國際比賽大獎。中關(guān)村科金以“得助”系列智能產(chǎn)品為支撐,圍繞智能營銷、智能運營、智能分析、智慧能效等場景為企業(yè)打造端到端的場景解決方案體系,成功服務(wù)于金融、零售、教育、醫(yī)療、政務(wù)、智能制造等行業(yè)900余家頭部企業(yè)的200多個應(yīng)用場景,激發(fā)產(chǎn)業(yè)新動能。



2、人機協(xié)同的會話式營銷,助力企業(yè)業(yè)務(wù)價值全面提升


中關(guān)村科金以對話式AI技術(shù)為核心,為企業(yè)提供全域營銷解決方案。該解決方案依托人機協(xié)同的會話式營銷,圍繞客戶全生命周期,打造具有數(shù)據(jù)認知能力、自動化執(zhí)行能力的營銷解決方案。通過預(yù)訓(xùn)練對話語言模型、知識中臺、會話分析和流程挖掘等認知技術(shù)的加持,企業(yè)全域營銷解決方案充分運用客戶對話和行為數(shù)據(jù),驅(qū)動引流獲客、新客促轉(zhuǎn)、存客復(fù)購、售后服務(wù)、需求挖掘和企業(yè)內(nèi)部運營優(yōu)化閉環(huán),幫助企業(yè)實現(xiàn)持續(xù)增長。該解決方案已應(yīng)用于金融、零售、政務(wù)、教育、醫(yī)療、汽車、快消等多個行業(yè),助力企業(yè)業(yè)務(wù)價值全面提升。



六、竹間智能


1、運用NLP、知識工程與情感計算技術(shù),服務(wù)企業(yè)數(shù)智化變革


竹間智能是一家以NLP、知識工程與情感計算為核心的人工智能公司,憑借自主研發(fā)的差異化AI技術(shù),創(chuàng)建了三大平臺級產(chǎn)品——Sales AI、Service AI及Knowledge AI,為客戶服務(wù)、銷售、培訓(xùn)、企業(yè)內(nèi)部服務(wù)、知識管理、數(shù)據(jù)分析、企業(yè)運營等豐富場景提供全方位的數(shù)智化轉(zhuǎn)型解決方案。為了將AI能力快速且低成本地整合到客戶業(yè)務(wù)中,竹間智能全力推動成熟產(chǎn)品上云,打造Emoti Cloud竹間云,提供一站式AI-as-a-Service產(chǎn)品服務(wù)。同時,竹間智能積極布局大語言模型與生成式AI領(lǐng)域,旨在通過大小模型的NLP雙引擎驅(qū)動來加速技術(shù)升級、產(chǎn)品迭代和服務(wù)模式變革,以更強技術(shù)力及產(chǎn)品力推動企業(yè)數(shù)智化變革的深化開展。至今,竹間智能已服務(wù)數(shù)百家大客戶,覆蓋金融、企業(yè)服務(wù)、制造、零售、政務(wù)、能源、醫(yī)藥等多個行業(yè)領(lǐng)域。



2、與某國內(nèi)頭部證券商強強聯(lián)手,打造企業(yè)級服務(wù)操作系統(tǒng)


竹間智能結(jié)合Emoti-X、Emoti-V和Gemini三大主力產(chǎn)品為基礎(chǔ),為某國內(nèi)頭部證券商成功打造貫穿企業(yè)內(nèi)外部的智能化場景應(yīng)用方案。該方案包括智能客服機器人、知識工程建設(shè)和RPA故障智能推薦解決方案等多個方面。


首先,竹間智能為客戶建設(shè)了智能客服機器人,提供智能知識輔助、培訓(xùn)、質(zhì)檢等服務(wù),問題有效攔截率超過70%。同時,竹間智能將對話機器人滲透延伸到企業(yè)內(nèi)部HR、運營、托管等部門機構(gòu),實現(xiàn)全方位的智能化服務(wù)。


在知識工程建設(shè)方面,竹間智能基于Gemini認知知識平臺,為客戶提供結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)的圖譜構(gòu)建能力,優(yōu)化了企業(yè)RPA業(yè)務(wù)流程,實現(xiàn)RPA故障智能推薦解決方案。這些技術(shù)手段的應(yīng)用,大大提高了企業(yè)的效率和智能化水平。


未來,竹間智能將與客戶展開更深入合作,在客服營銷方面深入私域流量運營管理,在知識管理方面打造Gemini企業(yè)級知識工廠。通過認知智能實現(xiàn)數(shù)據(jù)的實時可見、風(fēng)險提前預(yù)判和解決方案推薦,讓AI大腦實現(xiàn)更多高價值業(yè)務(wù)場景的轉(zhuǎn)型賦能。這將為客戶帶來更多的商業(yè)價值和競爭優(yōu)勢。



七、第四范式


1、SHIFT數(shù)字化轉(zhuǎn)型平臺與服務(wù),支撐企業(yè)全方位數(shù)字化


當(dāng)前,企業(yè)數(shù)字化已經(jīng)不僅僅是大數(shù)據(jù)建設(shè)和業(yè)務(wù)創(chuàng)新的試點,而是從戰(zhàn)略、策略、執(zhí)行和評價的全流程數(shù)字化。為此,第四范式運用智能決策技術(shù),開發(fā)了端到端的企業(yè)級人工智能產(chǎn)品,推出SHIFT數(shù)字化轉(zhuǎn)型咨詢與服務(wù),旨在解決企業(yè)智能化轉(zhuǎn)型過程中面臨的效率、成本、價值等問題。


在戰(zhàn)略數(shù)字化階段,第四范式為企業(yè)提供數(shù)字化戰(zhàn)略咨詢服務(wù),幫助企業(yè)識別核心競爭力指標(biāo);在策略數(shù)字化階段,為企業(yè)構(gòu)建科學(xué)策略決策體系,通過智能決策技術(shù),基于實驗、迭代、分而治之的科技運營體系方法,實現(xiàn)北極星指標(biāo)體系中各個指標(biāo)的優(yōu)化迭代;在執(zhí)行數(shù)字化階段,圍繞企業(yè)中各部門共識,制定各項指標(biāo)的數(shù)據(jù)采集規(guī)則,構(gòu)建一整套新的經(jīng)營管理平臺,并不斷完善前置系統(tǒng)的布局情況;在評價數(shù)字化階段,第四范式提供樹狀指標(biāo)體系明確各部門工作重心及協(xié)同關(guān)系,通過適合的量化數(shù)值進行策略有效性評估,形成端到端數(shù)字化的系統(tǒng)以及人機協(xié)同的智能決策能力,構(gòu)建了企業(yè)核心競爭優(yōu)勢。



2、SHIFT全棧產(chǎn)品與服務(wù),助力營銷拓客與電力管理數(shù)字化


在商業(yè)營銷領(lǐng)域,第四范式基于北極星指標(biāo)方法論,依托AI技術(shù)算法的融合機器學(xué)習(xí)、大規(guī)模運籌優(yōu)化等技術(shù),為來伊份公司提供智能供應(yīng)鏈解決方案。該解決方案從品類規(guī)劃、價盤管理、智能全網(wǎng)預(yù)測、補貨和調(diào)撥等關(guān)鍵場景切入,根據(jù)時效優(yōu)先、成本優(yōu)先、最小包裹量等履約規(guī)則確定提升策略,通過反復(fù)實驗、快速迭代提升策略的有效性,從而實現(xiàn)供應(yīng)鏈體系的自動化智能決策。


在能源領(lǐng)域,第四范式與健新科技(第四范式子公司)為桂冠電力公司提供智能數(shù)字化轉(zhuǎn)型服務(wù)。利用數(shù)據(jù)支撐決策、驅(qū)動運營、優(yōu)化創(chuàng)新,打造“數(shù)字桂冠”生態(tài)云平臺,實現(xiàn)電廠無人化、平臺生態(tài)化、業(yè)務(wù)數(shù)字化、運營智慧化,推動桂冠電力數(shù)字化轉(zhuǎn)型升級。



八、蜜度


1、語言智能科技企業(yè),為政企賦能增效提供數(shù)智化解決方案


蜜度是一家專注于人工智能技術(shù)研究的企業(yè),致力于為數(shù)字政府、數(shù)字營銷、數(shù)字媒體、數(shù)字城市的建設(shè)提供全方位的語言智能應(yīng)用產(chǎn)品和解決方案。在跨模態(tài)檢索(CMR)、多語言校對(MLC)、計算機視覺(CV)、自然語言處理(NLP)、內(nèi)容生成(AIGC)、知識圖譜(KG)等前沿技術(shù)領(lǐng)域深耕十余年,針對當(dāng)前海量多模態(tài)數(shù)據(jù),蜜度發(fā)揮自身優(yōu)勢,打通多模態(tài)數(shù)據(jù)壁壘,自主研發(fā)MiduCMR、MiduMLC、MiduCV、MiduNLP、MiduAIGC、MiduKG六大語言智能能力引擎,構(gòu)建智能檢索、智能校對、智能生成三大核心應(yīng)用,打造由11款跨領(lǐng)域多功能語言智能軟件所組成的產(chǎn)品矩陣,為30000+家政企機構(gòu)提供服務(wù)。在互聯(lián)網(wǎng)跨模態(tài)信息檢索和智能校對SaaS服務(wù)細分領(lǐng)域,2021年市場占有率超過15%,深度賦能企業(yè)和政府?dāng)?shù)字化、智能化轉(zhuǎn)型升級。



2、校對通:依托昇騰Atlas 200邊緣計算,打造辦公桌上的專屬 智能校對產(chǎn)品


蜜度校對通是一款智能校對工具,以中文語言特點和使用習(xí)慣為基礎(chǔ),結(jié)合行業(yè)先進的自然語言處理、知識圖譜與圖像識別等技術(shù),實現(xiàn)中文文本錯誤和語義關(guān)系的自動發(fā)現(xiàn)與糾正處理。該工具基于百億級訓(xùn)練語料,能夠有效提高文本校對的效率和準(zhǔn)確性。隨著互聯(lián)網(wǎng)信息規(guī)模的不斷擴大,文本信息中產(chǎn)生錯誤和風(fēng)險的概率也不斷提高。為了滿足智能化辦公需求,蜜度聯(lián)手華為昇騰,發(fā)布校對通AI-Box作為集軟硬件為一體的本地化智能校對解決方案。該方案完整移植了SaaS版本檢測功能,兼顧了檢測類型、檢測速度、檢測精度和內(nèi)容的隱私性。除了基礎(chǔ)文字標(biāo)點差錯外,重點建設(shè)了時政內(nèi)容安全模塊,為涉密辦公場景校對提供專屬解決方案。



九、數(shù)之聯(lián)


1、數(shù)據(jù)+AI算法+多場景應(yīng)用,助力政企客戶構(gòu)建完整數(shù)智體系


數(shù)之聯(lián)成立于2012年,是一家專注于“智能制造”與“智慧城市”領(lǐng)域的大數(shù)據(jù)、AI解決方案提供商。憑借20多年的行業(yè)經(jīng)驗,數(shù)之聯(lián)形成了成熟完善的數(shù)據(jù)治理、數(shù)據(jù)分析與可視化平臺能力,以及自主可控的計算機視覺、數(shù)據(jù)挖掘、NLP等AI算法能力,構(gòu)建了一體化云原生平臺。同時,數(shù)之聯(lián)還推出了面向工廠和政法機關(guān)各類場景的成熟解決方案,能夠快速幫助客戶搭建從底層數(shù)據(jù)到上層應(yīng)用的全流程數(shù)智化體系。目前,數(shù)之聯(lián)已經(jīng)服務(wù)了京東方、四川省高級人民法院、國家電網(wǎng)等上百家政府、企事業(yè)單位。



2、AI視覺質(zhì)檢—良率分析,打造閉環(huán)式解決方案


目前,工業(yè)品質(zhì)檢主要采用人工和傳統(tǒng)機器視覺兩種方式。然而,人工質(zhì)檢不穩(wěn)定、精度低,傳統(tǒng)機器視覺質(zhì)檢準(zhǔn)確率低,需要人工復(fù)檢等問題導(dǎo)致工業(yè)質(zhì)檢成本居高不下,質(zhì)檢數(shù)據(jù)留存差,難以發(fā)揮作用。為了解決這些問題,數(shù)之聯(lián)提出了AI工業(yè)視覺質(zhì)檢+良率分析一體化解決方案,能夠?qū)崿F(xiàn)圖像采集、智能檢測分類、復(fù)判到數(shù)據(jù)分析的全流程閉環(huán)。


該方案中,AI Camera是軟硬一體的視覺檢測分類產(chǎn)品,采用自主生產(chǎn)的AOI(自動光學(xué)檢測)設(shè)備,配合自研的ADC缺陷識別與分類軟件,內(nèi)置多種針對性AI算法,能夠?qū)崿F(xiàn)在產(chǎn)線的在制、成品等狀態(tài)的外觀表面的毫秒級實時拍出、精確檢測一體化,準(zhǔn)確率達到99%以上,同時支持設(shè)備與產(chǎn)線改造兩種部署方式。


在此基礎(chǔ)上,數(shù)之聯(lián)YMES良率分析系統(tǒng)通過對產(chǎn)線人、機、料、法、環(huán)、測、時各維度數(shù)據(jù)及具體case的綜合分析,快速精準(zhǔn)進行問題溯源,指導(dǎo)工廠有效改善良率。此外,數(shù)之聯(lián)具備面板、家電、汽車、PCBA等多行業(yè)的know-how及工程化經(jīng)驗,能夠針對客戶個性需求提供定制服務(wù)的同時確保快速上線。



十、中科聞歌


1、構(gòu)建2+N數(shù)據(jù)與決策智能產(chǎn)品體系,服務(wù)近千家政企客戶


中科聞歌是一家人工智能認知與決策智能平臺型企業(yè),專注于多模態(tài)(文本、圖片、視頻、語音)融合語義分析智能技術(shù)的研發(fā)。我們致力于構(gòu)建具有自主知識產(chǎn)權(quán)的DIOS數(shù)據(jù)操作系統(tǒng)及決策智能引擎,以應(yīng)對互聯(lián)網(wǎng)數(shù)據(jù)指數(shù)級增長的挑戰(zhàn)。隨著半結(jié)構(gòu)化數(shù)據(jù)(主要包括文本、圖像、音頻、視頻)在互聯(lián)網(wǎng)中的應(yīng)用越來越廣泛,多模態(tài)大數(shù)據(jù)分析技術(shù)市場潛力巨大。作為數(shù)據(jù)與決策智能服務(wù)商,中科聞歌依托多模態(tài)人工智能技術(shù)譜系,搭建了聞海數(shù)據(jù)操作系統(tǒng)和天湖決策智能引擎兩大核心技術(shù)底座。我們面向媒體、金融、治理等細分領(lǐng)域,構(gòu)建了2+N數(shù)據(jù)智能產(chǎn)品體系,為政企客戶智能決策提供有利支撐。



2、發(fā)力多模態(tài)大數(shù)據(jù),深耕媒體、社會治理與金融領(lǐng)域


“泛媒體+多模態(tài)+大數(shù)據(jù)”技術(shù)將顛覆當(dāng)前單一模型對應(yīng)單一任務(wù)的人工智能研發(fā)范式,成為不同領(lǐng)域的共性平臺技術(shù)。中科聞歌深耕多模態(tài)大數(shù)據(jù)領(lǐng)域多年,產(chǎn)品應(yīng)用廣泛。針對媒體宣傳行業(yè)中跨模態(tài)數(shù)據(jù)量增多的現(xiàn)狀、多語言信息整合的需要以及智能化選題與創(chuàng)作的訴求,中科聞歌推出紅旗融媒體平臺,推動“融媒體+行業(yè)”智能化轉(zhuǎn)型。同時,針對目前信息監(jiān)控與治理的難點,中科聞歌推出聞?!で缣於嗄B(tài)內(nèi)容監(jiān)測分析平臺,監(jiān)控100+風(fēng)控場景、實現(xiàn)實時預(yù)警與一鍵視頻溯源等功能,滿足更高效的跨模態(tài)信息監(jiān)測分析要求。此外,數(shù)智金融平臺以天鏡金融知識大腦為核心,提供一站式、網(wǎng)絡(luò)化、全周期、智能化產(chǎn)業(yè)鏈及投研分析、企業(yè)金融風(fēng)險監(jiān)測分析等金融科技服務(wù),為金融行業(yè)提供更加智能化的支持。



人工智能的發(fā)展趨勢


人工智能(AI)是一種模擬人類智能的技術(shù),它可以通過學(xué)習(xí)、推理和自我改進來執(zhí)行任務(wù)。隨著技術(shù)的不斷發(fā)展,人工智能的應(yīng)用范圍也在不斷擴大。


一、更加智能化


人工智能的發(fā)展趨勢之一是更加智能化。隨著機器學(xué)習(xí)和深度學(xué)習(xí)技術(shù)的不斷發(fā)展,人工智能系統(tǒng)可以更好地理解和處理自然語言、圖像和聲音等信息。這將使得人工智能系統(tǒng)能夠更好地執(zhí)行復(fù)雜的任務(wù),如自動駕駛、語音識別和自然語言處理等。


二、更加普及化


人工智能的發(fā)展趨勢之二是更加普及化。隨著人工智能技術(shù)的不斷成熟和普及,越來越多的企業(yè)和組織開始將人工智能應(yīng)用于其業(yè)務(wù)中。例如,人工智能可以幫助企業(yè)提高生產(chǎn)效率、優(yōu)化供應(yīng)鏈和提高客戶滿意度等。


三、更加個性化


人工智能的發(fā)展趨勢之三是更加個性化。隨著人工智能技術(shù)的不斷發(fā)展,人工智能系統(tǒng)可以更好地理解和分析用戶的行為和偏好。這將使得人工智能系統(tǒng)能夠更好地為用戶提供個性化的服務(wù)和建議,如個性化推薦、智能客服和智能家居等。


四、更加安全化


人工智能的發(fā)展趨勢之四是更加安全化。隨著人工智能技術(shù)的不斷發(fā)展,人工智能系統(tǒng)的安全性也成為了一個重要的問題。人工智能系統(tǒng)需要具備強大的安全性能,以保護用戶的隱私和數(shù)據(jù)安全。例如,人工智能系統(tǒng)需要具備防止黑客攻擊和數(shù)據(jù)泄露的能力。


人工智能趨勢下中國該如何做?


隨著人工智能在數(shù)據(jù)、算力、算法、工具、模型等方面的技術(shù)推進, AI已實現(xiàn)由實驗室到產(chǎn)業(yè)應(yīng)用的層級躍升,更廣范圍、更深層次地影響著中國的經(jīng)濟發(fā)展與生產(chǎn)生活方式變革。


作為可承擔(dān)發(fā)展引擎功能的新興技術(shù),AI已成為國際科技競爭的焦點。 順應(yīng)生成式AI、預(yù)訓(xùn)練大模型、國產(chǎn)AI芯片商業(yè)化落地、虛擬數(shù)字人等技術(shù)熱潮,中國將持續(xù)加強人工智能布局,發(fā)揮政府及市場的積極性,共同推動普惠AI高質(zhì)量發(fā)展。


如何在AI新一輪發(fā)展熱潮中搶抓機遇,是AI產(chǎn)業(yè)鏈各環(huán)節(jié)企業(yè)關(guān)注的 核心議題。從業(yè)務(wù)持續(xù)的角度考慮,把握技術(shù)變革與產(chǎn)品應(yīng)用的融合 界限,致力解決質(zhì)量、ROI、安全可信等核心瓶頸;根據(jù)企業(yè)產(chǎn)業(yè)鏈角色和應(yīng)用場景特點,定位各類型廠商的差異化路徑深耕實踐,或是AI 企業(yè)的制勝之路。


在這個全球競爭激烈的時代,中國必須積極應(yīng)對人工智能的發(fā)展趨勢,加強技術(shù)研發(fā)和人才培養(yǎng),推動人工智能技術(shù)的應(yīng)用和創(chuàng)新,以實現(xiàn)經(jīng)濟社會的可持續(xù)發(fā)展。


一、加強人工智能技術(shù)研發(fā)


人工智能技術(shù)的發(fā)展需要大量的技術(shù)研發(fā)和創(chuàng)新。中國應(yīng)該加強人工智能技術(shù)的研究和開發(fā),提高技術(shù)水平和創(chuàng)新能力。同時,還應(yīng)該加強與國際先進技術(shù)的交流和合作,吸收和借鑒國際先進技術(shù),推動人工智能技術(shù)的發(fā)展。


二、加強人才培養(yǎng)


人工智能技術(shù)的發(fā)展需要大量的高素質(zhì)人才。中國應(yīng)該加強人才培養(yǎng),培養(yǎng)一批具有國際水平的人工智能專家和技術(shù)人才。同時,還應(yīng)該加強人才引進和留用,吸引國內(nèi)外優(yōu)秀的人工智能人才來到中國,為中國的人工智能事業(yè)做出貢獻。


三、推動人工智能技術(shù)的應(yīng)用和創(chuàng)新


人工智能技術(shù)的應(yīng)用和創(chuàng)新是人工智能發(fā)展的關(guān)鍵。中國應(yīng)該積極推動人工智能技術(shù)的應(yīng)用和創(chuàng)新,加強與各行業(yè)的合作,推動人工智能技術(shù)在各個領(lǐng)域的應(yīng)用,為經(jīng)濟社會的發(fā)展做出貢獻。


四、加強人工智能技術(shù)的監(jiān)管和管理


人工智能技術(shù)的發(fā)展也帶來了一些風(fēng)險和挑戰(zhàn)。中國應(yīng)該加強人工智能技術(shù)的監(jiān)管和管理,制定相關(guān)的法律法規(guī)和標(biāo)準(zhǔn),保障人工智能技術(shù)的安全和可靠性,防止人工智能技術(shù)的濫用和誤用。


總之,人工智能技術(shù)的迅猛發(fā)展為中國帶來了巨大的機遇和挑戰(zhàn)。中國應(yīng)該積極應(yīng)對人工智能的發(fā)展趨勢,加強技術(shù)研發(fā)和人才培養(yǎng),推動人工智能技術(shù)的應(yīng)用和創(chuàng)新,加強人工智能技術(shù)的監(jiān)管和管理,以實現(xiàn)經(jīng)濟社會的可持續(xù)發(fā)展。



21.8182
0
關(guān)注作者
收藏
評論(0)

發(fā)表評論

暫無數(shù)據(jù)
推薦帖子