
來(lái)源|AIT News Desk
編譯|CDA數(shù)據(jù)分析師
Dotscience Emerges from Stealth to Eliminate the Biggest Pain Points of Operationalizing AI in the Enterprise
Dotscience是DevOps機(jī)器學(xué)習(xí)(ML)的先驅(qū),憑借其用于協(xié)作,端到端ML數(shù)據(jù)和模型管理的平臺(tái)而脫穎而出。通過(guò)為團(tuán)隊(duì)提供協(xié)作跟蹤運(yùn)行的獨(dú)特能力,培訓(xùn)AI模型時(shí)使用的數(shù)據(jù),代碼和參數(shù)記錄Dotscience為包括金融科技,自動(dòng)駕駛汽車,醫(yī)療保健和咨詢?cè)趦?nèi)的行業(yè)的ML和數(shù)據(jù)科學(xué)團(tuán)隊(duì)授權(quán),以實(shí)現(xiàn)可重復(fù)性,問(wèn)責(zé)制,協(xié)作跨AI模型生命周期的持續(xù)交付。Dotscience平臺(tái)現(xiàn)在可以作為SaaS或本地提供,并在8月份的亞馬遜網(wǎng)絡(luò)服務(wù)(AWS)市場(chǎng)上提供。
“人工智能開(kāi)發(fā)的現(xiàn)狀很像20世紀(jì)90年代的軟件開(kāi)發(fā)。在稱為DevOps的運(yùn)動(dòng)之前,版本控制,持續(xù)集成和持續(xù)交付等現(xiàn)代最佳實(shí)踐遠(yuǎn)沒(méi)有那么普遍,軟件需要六個(gè)月才能發(fā)貨是正常的。現(xiàn)在,軟件只需幾分鐘即可完成,“ Dotscience創(chuàng)始人兼首席執(zhí)行官Luke Marsden表示?!霸贒otscience,我們正在應(yīng)用相同的協(xié)作,控制和持續(xù)交付DevOps的原則到AI,以簡(jiǎn)化,加速和控制AI開(kāi)發(fā)?!?/span>
人工智能開(kāi)發(fā)和運(yùn)營(yíng)挑戰(zhàn)
數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)團(tuán)隊(duì)通常面臨眾多問(wèn)題,這些問(wèn)題使ML項(xiàng)目更有可能失敗并為業(yè)務(wù)創(chuàng)造財(cái)務(wù),聲譽(yù)或法律風(fēng)險(xiǎn)。這些包括浪費(fèi)時(shí)間,協(xié)作困難,手動(dòng)跟蹤數(shù)據(jù)時(shí)出錯(cuò),無(wú)可重復(fù)性或來(lái)源,缺乏自動(dòng)化測(cè)試,手動(dòng)部署模型,不受監(jiān)控的模型以及丟失正在運(yùn)行的內(nèi)容以及它來(lái)自哪里導(dǎo)致“雪花部署”。
根據(jù)德勤的“企業(yè)人工智能狀況,第2版”,大多數(shù)受訪者表示“實(shí)施,整合到角色和功能,以及衡量和證明人工智能解決方案的商業(yè)價(jià)值是人工智能計(jì)劃的最大挑戰(zhàn)。”根據(jù)Dotscience的“ 人工智能應(yīng)用開(kāi)發(fā)和運(yùn)營(yíng)狀況2019 ”市場(chǎng)研究結(jié)果今天發(fā)布的調(diào)查結(jié)果顯示,受訪者在AI工作負(fù)載中遇到的三大挑戰(zhàn)是重復(fù)工作(33.2%),在團(tuán)隊(duì)成員離職后重寫(xiě)模型(27.8%)并且難以證明價(jià)值(27%)。該報(bào)告評(píng)估了企業(yè)如何在今天部署AI,并在構(gòu)建,部署和迭代AI時(shí)調(diào)查問(wèn)責(zé)制和協(xié)作的需求。
“數(shù)據(jù)科學(xué)家和ML工程師可能甚至都沒(méi)有意識(shí)到他們已經(jīng)存在的問(wèn)題,因?yàn)樗麄兞?xí)慣于使用破碎的流程,并且不了解可以更好地完成ML的解決方案,”Marsden解釋道?!敖鉀Q這些問(wèn)題將帶來(lái)更高效,更有效的AI團(tuán)隊(duì)以及更好,更安全的ML模型?!?/span>
“如果你將機(jī)器學(xué)習(xí)應(yīng)用程序投入生產(chǎn),再現(xiàn)性就變得非常重要,” 人工智能和DevOps首席分析師James Kobielus表示,他們使用SiliconANGLE的Wikibon團(tuán)隊(duì)。“Dotscience能夠跟蹤人工智能培訓(xùn),保持完整的審計(jì)跟蹤,并提供對(duì)機(jī)器學(xué)習(xí)應(yīng)用程序來(lái)源的全面可見(jiàn)性,使其非常適合這種不斷增長(zhǎng)的企業(yè)需求。同樣重要的是,Dotscience確??缁旌显破脚_(tái)的可重復(fù)性的能力確保了當(dāng)今企業(yè)AI環(huán)境中復(fù)雜的DevOps工具鏈的可重復(fù)性?!?/span>
Dotscience平臺(tái)提供端到端的ML數(shù)據(jù)和模型管理
Dotscience提供了一種工具,通過(guò)授權(quán)數(shù)據(jù)科學(xué)家和ML工程師以他們熟悉的方式工作來(lái)管理完整的AI生命周期。數(shù)據(jù)科學(xué)和ML團(tuán)隊(duì)可以利用易于使用的平臺(tái),并提供一個(gè)單獨(dú)的地方來(lái)協(xié)作,開(kāi)發(fā),測(cè)試,監(jiān)控和交付他們的ML項(xiàng)目。
“實(shí)際上,與市場(chǎng)上的其他產(chǎn)品不同,這意味著團(tuán)隊(duì)可以繼續(xù)使用相同的開(kāi)發(fā)工具,ML框架,語(yǔ)言,數(shù)據(jù)源和計(jì)算,而不是被迫進(jìn)入有圍墻的花園,這可能導(dǎo)致供應(yīng)商鎖定和陡峭學(xué)習(xí)曲線,“ Dotscience產(chǎn)品和營(yíng)銷副總裁Mark Coleman說(shuō)?!坝捎贒otscience會(huì)跟蹤并打包進(jìn)入數(shù)據(jù)工程和模型創(chuàng)建過(guò)程的每次運(yùn)行,因此用戶可以復(fù)制彼此的工作,輕松協(xié)作并根據(jù)需要進(jìn)行跟蹤。”
Dotscience為數(shù)據(jù)科學(xué)和ML團(tuán)隊(duì)提供以下主要優(yōu)勢(shì):
無(wú)縫靈活性和集成均來(lái)自一個(gè)平臺(tái): Dotscience用戶可以輕松地將任何計(jì)算連接到平臺(tái),無(wú)論是他們自己的筆記本電腦,基于云的VM還是本地裸機(jī)。在用戶訓(xùn)練模型后,Dotscience與持續(xù)集成和監(jiān)控工具集成,以便他們可以部署并監(jiān)控生產(chǎn)中的模型,將所有相關(guān)信息保存在一個(gè)位置。
?最佳的團(tuán)隊(duì)生產(chǎn)力:通過(guò)提供自動(dòng)化的ML知識(shí)庫(kù)來(lái)消除孤島,Dotscience消除了“關(guān)鍵人物風(fēng)險(xiǎn)”,使任何數(shù)據(jù)科學(xué)家或ML工程師都可以輕松地從另一個(gè)人那里找到一個(gè)在當(dāng)今競(jìng)爭(zhēng)中特別重要的屬性招聘景觀。Dotscience不僅允許團(tuán)隊(duì)無(wú)縫協(xié)作,還可以通過(guò)跟蹤模型開(kāi)發(fā)階段中每個(gè)元素的每個(gè)版本來(lái)發(fā)現(xiàn)以前的工作并確切了解它是如何構(gòu)建的。
?靈活地訪問(wèn)ML開(kāi)發(fā)環(huán)境的計(jì)算,混合云可移植性:團(tuán)隊(duì)成員可以開(kāi)始使用他們的筆記本電腦,然后將他們的AI工作負(fù)載轉(zhuǎn)移到更大的云計(jì)算機(jī)或裸機(jī)GPU平臺(tái),當(dāng)他們需要額外的電源時(shí),所有這些都可以無(wú)縫地完成,而無(wú)需創(chuàng)建支持請(qǐng)求。重現(xiàn)開(kāi)發(fā)環(huán)境所需的整個(gè)代碼,數(shù)據(jù),環(huán)境和超參數(shù)包以這樣的方式捆綁在一起,即從一個(gè)云移動(dòng)到另一個(gè)云或在本地是無(wú)縫的。
?能夠處理來(lái)自任何來(lái)源的數(shù)據(jù):Dotscience可以處理直接存儲(chǔ)在Dotscience中的平面文件,遠(yuǎn)程對(duì)象存儲(chǔ)中的數(shù)據(jù)(即S3或S3兼容,Azure或GCS)以及來(lái)自SQL,NoSQL和Spark數(shù)據(jù)湖的數(shù)據(jù)。這種靈活性允許數(shù)據(jù)科學(xué)和ML團(tuán)隊(duì)立即開(kāi)始使用已經(jīng)使用的數(shù)據(jù)源。Dotscience不強(qiáng)制攝取所有數(shù)據(jù); 在給定兼容的對(duì)象存儲(chǔ)庫(kù)的情況下,它可以跟蹤已存在的數(shù)據(jù)的來(lái)源。
?允許AI和數(shù)據(jù)科學(xué)團(tuán)隊(duì)使用他們關(guān)心的工具,同時(shí)消除對(duì)生產(chǎn)力不重要的障礙:使用Dotscience的跟蹤工作流程,數(shù)據(jù)科學(xué)家和ML工程師可以使用開(kāi)源工具進(jìn)行他們熟悉的模型培訓(xùn)愛(ài),如PyTorch,Keras和TensorFlow。他們可以在應(yīng)用程序中原生使用Jupyter筆記本,或者選擇在命令行上工作,使他們能夠使用他們選擇的任何IDE。
?保證遵守當(dāng)前和未來(lái)的法規(guī):ML模型用于通過(guò)設(shè)計(jì)做出決策,但如果做出的決策不正確,則可能導(dǎo)致嚴(yán)重的財(cái)務(wù),聲譽(yù)和法律風(fēng)險(xiǎn)。Dotscience既可以監(jiān)控ML模型,也可以及早發(fā)現(xiàn)問(wèn)題,還可以在法律上重現(xiàn)發(fā)生的任何問(wèn)題,以便快速解決這些問(wèn)題,并可以自信地進(jìn)行部署。
用于ML平臺(tái)的Dotscience DevOps現(xiàn)在可作為SaaS,本地或通過(guò)AWS Marketplace提供
Dotscience提供端到端的ML生命周期管理,無(wú)需強(qiáng)制用戶更改其工作實(shí)踐,此方法也擴(kuò)展到安裝選項(xiàng)。 客戶可以選擇部署托管SaaS并自帶計(jì)算,或者手動(dòng)安裝完全私有版本的Dotscience,也可以通過(guò)AWS Marketplace中的Dotscience安裝程序安裝,該安裝程序?qū)⒂?月上市。Microsoft Azure和Google Cloud Platform的安裝程序也將很快推出。這種靈活性意味著廣泛的用戶群可以訪問(wèn)集成的ML平臺(tái),為數(shù)據(jù)科學(xué)家提供統(tǒng)一的版本控制和協(xié)作。
Dotscience受到AI領(lǐng)導(dǎo)者的信任
“ML的世界可以從過(guò)去10年中為處理軟件工程生命周期而開(kāi)發(fā)的所有最佳實(shí)踐中學(xué)到很多東西。Dotscience有可能將一些艱苦學(xué)習(xí)的課程帶入ML世界,而不會(huì)迫使數(shù)據(jù)科學(xué)家和研究人員完全放棄他們選擇的工具,如Jupyter Notebooks。這是一個(gè)大膽的主張,有可能產(chǎn)生巨大影響?!?/span>
“在工業(yè)規(guī)模上合作和維護(hù)ML項(xiàng)目的流程和工具尚不像傳統(tǒng)軟件項(xiàng)目那樣成熟。ML工作流程帶來(lái)了一些額外的挑戰(zhàn),這些挑戰(zhàn)并不完全適合軟件DevOps流程。我很高興與Dotscience合作,在我們即將開(kāi)展的項(xiàng)目中應(yīng)對(duì)這些挑戰(zhàn),因?yàn)樗麄兎e極致力于協(xié)作的結(jié)構(gòu)化和集中化,以便擴(kuò)展到更大的團(tuán)隊(duì)和項(xiàng)目規(guī)模。“
“Dotscience產(chǎn)品在確保機(jī)器學(xué)習(xí)模型的數(shù)據(jù)來(lái)源方面填補(bǔ)了一個(gè)關(guān)鍵性的空白。通過(guò)提供數(shù)據(jù)源作為服務(wù),Dotscience可以在不降低數(shù)據(jù)科學(xué)團(tuán)隊(duì)速度的情況下跟蹤工作,并提供對(duì)數(shù)據(jù)完整性以及確保關(guān)鍵業(yè)務(wù)利益相關(guān)者可信度所需的流程的高度可視性。
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
LSTM 模型輸入長(zhǎng)度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長(zhǎng)序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報(bào)考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計(jì)的實(shí)用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強(qiáng)大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠(chéng)摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實(shí)施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價(jià)值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡(jiǎn)稱 BI)深度融合的時(shí)代,BI ...
2025-07-10SQL 在預(yù)測(cè)分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢(shì)預(yù)判? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代,預(yù)測(cè)分析作為挖掘數(shù)據(jù)潛在價(jià)值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價(jià)值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點(diǎn),而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報(bào)考到取證的全攻略? 在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭(zhēng)搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢(shì)性檢驗(yàn):捕捉數(shù)據(jù)背后的時(shí)間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢(shì)性檢驗(yàn)如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時(shí)間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時(shí)間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實(shí)戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗(yàn):數(shù)據(jù)趨勢(shì)與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢(shì)變化以及識(shí)別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國(guó)內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對(duì)策略? 長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨(dú)特的門控機(jī)制,在 ...
2025-07-07統(tǒng)計(jì)學(xué)方法在市場(chǎng)調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場(chǎng)調(diào)研是企業(yè)洞察市場(chǎng)動(dòng)態(tài)、了解消費(fèi)者需求的重要途徑,而統(tǒng)計(jì)學(xué)方法則是市場(chǎng)調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書(shū)考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動(dòng)力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動(dòng)力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開(kāi)啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價(jià)值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03