
Top10 機器學(xué)習(xí)開源項目發(fā)布,歷時一個月評出(附 GitHub 地址)
從將近 250 個機器學(xué)習(xí)開源項目中,綜合各種條件進行打分排序,最終 Mybridge 團隊評選出十大最新、最棒的機器學(xué)習(xí)開源項目。
這份 Top10 名單中包括對象檢測、換臉、預(yù)測等等最熱的 AI 明星、話題性研究和代碼。它們在 GitHub 上的平均標(biāo)星數(shù)量是 2500 多顆。希望這 10 大開源項目,對你有所幫助。
Rank 10
作者:Posenhuang 等(微軟研究院)
GitHub:https://github.com/posenhuang/NPMT
★ Star:68
NPMT ,基于短語的神經(jīng)機器翻譯,這是一項來自微軟研究院團隊的研究。這個機器翻譯領(lǐng)域的新突破,沒有使用任何注意力機制。
這個方法通過 Sleep - WAke 網(wǎng)絡(luò)( SWAN )明確地建模輸出序列中的短語結(jié)構(gòu)。SWAN 是一種基于分割的序列模型方法。
NPMT 的源代碼基于 Torch 中的 fairseq 工具箱建立。fairseq 是 Facebook AI 研究院開源的序列到序列工具箱,這個方法使用卷積神經(jīng)網(wǎng)絡(luò)來做語言翻譯,比循環(huán)神經(jīng)網(wǎng)絡(luò)提速 9 倍。
Rank 9
Deep-neuroevolution
作者:Uber AI 實驗室
GitHub:https://github.com/uber-common/deep-neuroevolution
★ Star:392
這是共享出行巨頭 Uber 開源的算法,他們此前集中發(fā)布了 5 篇論文,支持一種正在興起的認(rèn)識:通過用進化算法來優(yōu)化神經(jīng)網(wǎng)絡(luò)的神經(jīng)進化( neuroevolution )也是為強化學(xué)習(xí)( RL )訓(xùn)練深度神經(jīng)網(wǎng)絡(luò)的一種有效方法。
而這次 GitHub 中公布的代碼,包括以下算法的分布式實現(xiàn):
1、Deep Neuroevolution: Genetic Algorithms Are a Competitive Alternative for Training Deep Neural Networks for Reinforcement Learning
論文地址:https://arxiv.org/abs/1712.06567
2、Improving Exploration in Evolution Strategies for Deep Reinforcement Learning via a Population of Novelty-Seeking Agents
論文地址:https://arxiv.org/abs/1712.06560
這些代碼基于 OpenAI 此前公布的源代碼和論文。
Rank 8
Simple
作者:chrisstroemel
GitHub:https://github.com/chrisstroemel/Simple
★ Star:235
Simple 是貝葉斯優(yōu)化的更具可擴展性的替代方法。像貝葉斯優(yōu)化一樣,它的樣本效率很高,能用盡可能少的樣本收斂到全局最優(yōu)。
對于典型的優(yōu)化工作負(fù)載,貝葉斯優(yōu)化消耗的 CPU 時間以分鐘計,而 Simple 使用的 CPU 時間以毫秒計。如下圖所示:
Rank 7
作者:Henry Mao 等(加州大學(xué)圣迭戈分校)
GitHub:https://github.com/calclavia/DeepJ
★ Star:313
DeepJ 是一種端到端生成模型,能夠以特定的混合風(fēng)格來實時創(chuàng)作鋼琴曲。這個算法能夠生成可以調(diào)整參數(shù)的音樂,這種可調(diào)整的屬性,能為藝術(shù)家、電影制作人、作曲家等帶來實際的幫助。
使用這套代碼需要 Python 3.5 。
訪問下面的 Demo 地址,可玩、可感受,亦可當(dāng)背景音聽。
Demo 地址:https://deepj.ai/
Rank 6
作者:Charles Beattie 等(DeepMind)
GitHub:https://github.com/deepmind/lab/tree/master/game_scripts/levels/contributed/psychlab
★ Star:4774
Psychlab ,DeepMind 為 AI 開設(shè)的心理學(xué)實驗室。
其實就是個第一人稱視角 3D 游戲世界,這個心理學(xué)實驗室當(dāng)然也是個模擬環(huán)境,研究對象是其中的深度強化學(xué)習(xí)智能體( Agents )。Psychlab 能夠?qū)崿F(xiàn)傳統(tǒng)實驗室中的經(jīng)典心理學(xué)實驗,讓這些本來用來研究人類心理的實驗,也可以用在 AI 智能體上。
Rank 5
作者:DeepMind
GitHub:https://github.com/deepmind/dm_control
★ Star:882
火遍全球的 AlphaGo 讓我們知道了強化學(xué)習(xí)打游戲究竟有多厲害,這么強大的算法什么時候才能打破次元壁,走進現(xiàn)實、控制物理世界中的物體呢?
DeepMind 已經(jīng)開始往這方面努力。他們此前發(fā)布的控制套件“ DeepMind Control Suite ”,就為設(shè)計和比較用來控制物理世界的強化學(xué)習(xí)算法開了個頭。
Control Suite 設(shè)計了一組有著標(biāo)準(zhǔn)化結(jié)構(gòu)、可解釋獎勵的連續(xù)控制任務(wù),還為強化學(xué)習(xí) Agent 提供一組性能測試指標(biāo)。
Control Suite 中的任務(wù)可以分為 14 個領(lǐng)域,也就是 14 類物理模型,上排從左到右分別是:
體操機器人 Acrobot ,(兩節(jié)鐘擺)、杯中小球、倒立擺、獵豹形機器人、手指、魚、單足跳躍機器人,下排從左到右分別是人形機器人、機械手、鐘擺、質(zhì)點、形似兩節(jié)手臂的 Reacher 、游泳機器人、步行者。
Rank 4
作者:Marco Ribeiro 等(華盛頓大學(xué))
GitHub:https://github.com/marcotcr/lime
★ Star:3148
在這次的 Top10 項目中,這個算是“老資格”了。主要基于 KDD2016 上發(fā)表的論文:《“為什么我應(yīng)該相信你?”解釋任何分類器的預(yù)測》。
這個研究提出了局部可理解的與模型無關(guān)的解釋技術(shù)( Local Interpretable Model-Agnostic Explanations: LIME ),一種用于解釋任何機器學(xué)習(xí)分類器的預(yù)測的技術(shù),并在多種與信任相關(guān)的任務(wù)中評估了它的可用性。
下面這段視頻,是一個更直觀的解釋。
Rank 3
Gradient-checkpointing
作者:OpenAI
GitHub:https://github.com/openai/gradient-checkpointing
★ Star:1107
GPU 內(nèi)存太小可能是神經(jīng)網(wǎng)絡(luò)訓(xùn)練過程中最大的攔路虎。
不怕,用這個 OpenAI 推出的 gradient-checkpointing 工具程序包,對于前饋模型來說,僅僅需要增加 20% 的計算時間,就能讓 GPU 處理十倍大的模型。
這個工具包的開發(fā)者是 OpenAI 的研究科學(xué)家 Tim Salimans 和前 Google Brain 工程師的數(shù)據(jù)科學(xué)家 Yaroslav Bulatov 。
這個工具包使用了“用亞線性的存儲成本訓(xùn)練神經(jīng)網(wǎng)絡(luò)”的技術(shù),為簡單的前饋網(wǎng)絡(luò)提供了等價的內(nèi)存存儲,同時能為一般的神經(jīng)網(wǎng)絡(luò)節(jié)省內(nèi)存,比如多層架構(gòu)。
Rank 2
作者:Hidde Jansen
GitHub:https://github.com/deepfakes/faceswap
★ Star:3629
最近 Deepfakes 在 AI 、AV 兩屆掀起軒然大波。簡單的說,就是 AI 可以幫你給 AV 小片換臉,替換成任何你想看的明星。
而 FaceSwap 是一個基于 deepfakes 的非官方開源項目。
Rank 1
作者:Facebook AI 研究院
GitHub:https://github.com/facebookresearch/Detectron
★ Star:11248
這個應(yīng)該是當(dāng)之無愧的第一吧。
Detectron 是 Facebook 的物體檢測平臺,今年初宣布開源,它基于 Caffe2 ,用 Python 寫成,這次開放的代碼中就包含了 Mask R-CNN 的實現(xiàn)。
除此之外,Detectron 還包含了 ICCV 2017 最佳學(xué)生論文 RetinaNet ,Ross Girshick( RBG )此前的研究 Faster R-CNN 和 RPN 、Fast R-CNN 、以及 R-FCN 的實現(xiàn)。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動態(tài)隨機一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計學(xué)領(lǐng)域,假設(shè)檢驗是驗證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進行 HTTP 網(wǎng)絡(luò)請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數(shù)據(jù)的科學(xué)計數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點數(shù)據(jù)時的科學(xué)計數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當(dāng)下,精準(zhǔn)營銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價值 在數(shù)據(jù)驅(qū)動決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實踐到業(yè)務(wù)價值挖掘 在數(shù)據(jù)分析場景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價值導(dǎo)向 統(tǒng)計模型作為數(shù)據(jù)分析的核心工具,并非簡單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10