
Top10 機(jī)器學(xué)習(xí)開源項(xiàng)目發(fā)布,歷時一個月評出(附 GitHub 地址)
從將近 250 個機(jī)器學(xué)習(xí)開源項(xiàng)目中,綜合各種條件進(jìn)行打分排序,最終 Mybridge 團(tuán)隊(duì)評選出十大最新、最棒的機(jī)器學(xué)習(xí)開源項(xiàng)目。
這份 Top10 名單中包括對象檢測、換臉、預(yù)測等等最熱的 AI 明星、話題性研究和代碼。它們在 GitHub 上的平均標(biāo)星數(shù)量是 2500 多顆。希望這 10 大開源項(xiàng)目,對你有所幫助。
Rank 10
作者:Posenhuang 等(微軟研究院)
GitHub:https://github.com/posenhuang/NPMT
★ Star:68
NPMT ,基于短語的神經(jīng)機(jī)器翻譯,這是一項(xiàng)來自微軟研究院團(tuán)隊(duì)的研究。這個機(jī)器翻譯領(lǐng)域的新突破,沒有使用任何注意力機(jī)制。
這個方法通過 Sleep - WAke 網(wǎng)絡(luò)( SWAN )明確地建模輸出序列中的短語結(jié)構(gòu)。SWAN 是一種基于分割的序列模型方法。
NPMT 的源代碼基于 Torch 中的 fairseq 工具箱建立。fairseq 是 Facebook AI 研究院開源的序列到序列工具箱,這個方法使用卷積神經(jīng)網(wǎng)絡(luò)來做語言翻譯,比循環(huán)神經(jīng)網(wǎng)絡(luò)提速 9 倍。
Rank 9
Deep-neuroevolution
作者:Uber AI 實(shí)驗(yàn)室
GitHub:https://github.com/uber-common/deep-neuroevolution
★ Star:392
這是共享出行巨頭 Uber 開源的算法,他們此前集中發(fā)布了 5 篇論文,支持一種正在興起的認(rèn)識:通過用進(jìn)化算法來優(yōu)化神經(jīng)網(wǎng)絡(luò)的神經(jīng)進(jìn)化( neuroevolution )也是為強(qiáng)化學(xué)習(xí)( RL )訓(xùn)練深度神經(jīng)網(wǎng)絡(luò)的一種有效方法。
而這次 GitHub 中公布的代碼,包括以下算法的分布式實(shí)現(xiàn):
1、Deep Neuroevolution: Genetic Algorithms Are a Competitive Alternative for Training Deep Neural Networks for Reinforcement Learning
論文地址:https://arxiv.org/abs/1712.06567
2、Improving Exploration in Evolution Strategies for Deep Reinforcement Learning via a Population of Novelty-Seeking Agents
論文地址:https://arxiv.org/abs/1712.06560
這些代碼基于 OpenAI 此前公布的源代碼和論文。
Rank 8
Simple
作者:chrisstroemel
GitHub:https://github.com/chrisstroemel/Simple
★ Star:235
Simple 是貝葉斯優(yōu)化的更具可擴(kuò)展性的替代方法。像貝葉斯優(yōu)化一樣,它的樣本效率很高,能用盡可能少的樣本收斂到全局最優(yōu)。
對于典型的優(yōu)化工作負(fù)載,貝葉斯優(yōu)化消耗的 CPU 時間以分鐘計,而 Simple 使用的 CPU 時間以毫秒計。如下圖所示:
Rank 7
作者:Henry Mao 等(加州大學(xué)圣迭戈分校)
GitHub:https://github.com/calclavia/DeepJ
★ Star:313
DeepJ 是一種端到端生成模型,能夠以特定的混合風(fēng)格來實(shí)時創(chuàng)作鋼琴曲。這個算法能夠生成可以調(diào)整參數(shù)的音樂,這種可調(diào)整的屬性,能為藝術(shù)家、電影制作人、作曲家等帶來實(shí)際的幫助。
使用這套代碼需要 Python 3.5 。
訪問下面的 Demo 地址,可玩、可感受,亦可當(dāng)背景音聽。
Demo 地址:https://deepj.ai/
Rank 6
作者:Charles Beattie 等(DeepMind)
GitHub:https://github.com/deepmind/lab/tree/master/game_scripts/levels/contributed/psychlab
★ Star:4774
Psychlab ,DeepMind 為 AI 開設(shè)的心理學(xué)實(shí)驗(yàn)室。
其實(shí)就是個第一人稱視角 3D 游戲世界,這個心理學(xué)實(shí)驗(yàn)室當(dāng)然也是個模擬環(huán)境,研究對象是其中的深度強(qiáng)化學(xué)習(xí)智能體( Agents )。Psychlab 能夠?qū)崿F(xiàn)傳統(tǒng)實(shí)驗(yàn)室中的經(jīng)典心理學(xué)實(shí)驗(yàn),讓這些本來用來研究人類心理的實(shí)驗(yàn),也可以用在 AI 智能體上。
Rank 5
作者:DeepMind
GitHub:https://github.com/deepmind/dm_control
★ Star:882
火遍全球的 AlphaGo 讓我們知道了強(qiáng)化學(xué)習(xí)打游戲究竟有多厲害,這么強(qiáng)大的算法什么時候才能打破次元壁,走進(jìn)現(xiàn)實(shí)、控制物理世界中的物體呢?
DeepMind 已經(jīng)開始往這方面努力。他們此前發(fā)布的控制套件“ DeepMind Control Suite ”,就為設(shè)計和比較用來控制物理世界的強(qiáng)化學(xué)習(xí)算法開了個頭。
Control Suite 設(shè)計了一組有著標(biāo)準(zhǔn)化結(jié)構(gòu)、可解釋獎勵的連續(xù)控制任務(wù),還為強(qiáng)化學(xué)習(xí) Agent 提供一組性能測試指標(biāo)。
Control Suite 中的任務(wù)可以分為 14 個領(lǐng)域,也就是 14 類物理模型,上排從左到右分別是:
體操機(jī)器人 Acrobot ,(兩節(jié)鐘擺)、杯中小球、倒立擺、獵豹形機(jī)器人、手指、魚、單足跳躍機(jī)器人,下排從左到右分別是人形機(jī)器人、機(jī)械手、鐘擺、質(zhì)點(diǎn)、形似兩節(jié)手臂的 Reacher 、游泳機(jī)器人、步行者。
Rank 4
作者:Marco Ribeiro 等(華盛頓大學(xué))
GitHub:https://github.com/marcotcr/lime
★ Star:3148
在這次的 Top10 項(xiàng)目中,這個算是“老資格”了。主要基于 KDD2016 上發(fā)表的論文:《“為什么我應(yīng)該相信你?”解釋任何分類器的預(yù)測》。
這個研究提出了局部可理解的與模型無關(guān)的解釋技術(shù)( Local Interpretable Model-Agnostic Explanations: LIME ),一種用于解釋任何機(jī)器學(xué)習(xí)分類器的預(yù)測的技術(shù),并在多種與信任相關(guān)的任務(wù)中評估了它的可用性。
下面這段視頻,是一個更直觀的解釋。
Rank 3
Gradient-checkpointing
作者:OpenAI
GitHub:https://github.com/openai/gradient-checkpointing
★ Star:1107
GPU 內(nèi)存太小可能是神經(jīng)網(wǎng)絡(luò)訓(xùn)練過程中最大的攔路虎。
不怕,用這個 OpenAI 推出的 gradient-checkpointing 工具程序包,對于前饋模型來說,僅僅需要增加 20% 的計算時間,就能讓 GPU 處理十倍大的模型。
這個工具包的開發(fā)者是 OpenAI 的研究科學(xué)家 Tim Salimans 和前 Google Brain 工程師的數(shù)據(jù)科學(xué)家 Yaroslav Bulatov 。
這個工具包使用了“用亞線性的存儲成本訓(xùn)練神經(jīng)網(wǎng)絡(luò)”的技術(shù),為簡單的前饋網(wǎng)絡(luò)提供了等價的內(nèi)存存儲,同時能為一般的神經(jīng)網(wǎng)絡(luò)節(jié)省內(nèi)存,比如多層架構(gòu)。
Rank 2
作者:Hidde Jansen
GitHub:https://github.com/deepfakes/faceswap
★ Star:3629
最近 Deepfakes 在 AI 、AV 兩屆掀起軒然大波。簡單的說,就是 AI 可以幫你給 AV 小片換臉,替換成任何你想看的明星。
而 FaceSwap 是一個基于 deepfakes 的非官方開源項(xiàng)目。
Rank 1
作者:Facebook AI 研究院
GitHub:https://github.com/facebookresearch/Detectron
★ Star:11248
這個應(yīng)該是當(dāng)之無愧的第一吧。
Detectron 是 Facebook 的物體檢測平臺,今年初宣布開源,它基于 Caffe2 ,用 Python 寫成,這次開放的代碼中就包含了 Mask R-CNN 的實(shí)現(xiàn)。
除此之外,Detectron 還包含了 ICCV 2017 最佳學(xué)生論文 RetinaNet ,Ross Girshick( RBG )此前的研究 Faster R-CNN 和 RPN 、Fast R-CNN 、以及 R-FCN 的實(shí)現(xiàn)。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實(shí)用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強(qiáng)大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實(shí)施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預(yù)測分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢預(yù)判? ? 在數(shù)據(jù)驅(qū)動決策的時代,預(yù)測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點(diǎn),而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報考到取證的全攻略? 在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗(yàn):捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗(yàn)如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實(shí)戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗(yàn):數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對策略? 長短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨(dú)特的門控機(jī)制,在 ...
2025-07-07統(tǒng)計學(xué)方法在市場調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場調(diào)研是企業(yè)洞察市場動態(tài)、了解消費(fèi)者需求的重要途徑,而統(tǒng)計學(xué)方法則是市場調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03