
機器學習和數(shù)據(jù)分析在高性能計算和企業(yè)管理云平臺發(fā)揮舉足輕重的作用
計算能力的提升有望給高性能的計算空間和企業(yè)最終數(shù)據(jù)中心基礎架構的建立帶來重大的變化。全球多個國家正在建立一個系統(tǒng)。這個系統(tǒng)一旦建成,預計是目前20 千兆次能力的50倍。
并在能源效率和占用的物理空間等領域帶來相應的改進。工程師和科學家使用越來越多復雜的應用程序到這個系統(tǒng)中來,但是這個系統(tǒng)如此昂貴以至于我們不能僅僅在特定的條件下才可以使用到它。
與此同時,更高級別的數(shù)據(jù)分析和機器學習的出現(xiàn)正在迫使美國在進入百萬兆級運算方面做出一些改變。
這些改變從軟件的系統(tǒng)開發(fā)到一些有競爭力的中國公司都發(fā)揮著重要的作用,并且這些中國公司正在積極的推進百萬兆級運算。
上星期在德克薩斯州奧斯汀市談人工智能時代。從國家實驗室到云計算項目首席技術執(zhí)行官,概述了 企業(yè)管理云平臺未來幾年內(nèi)在云計算系統(tǒng)的相關工作。
在他的談話也提及到過去 18 個月中一些主流科學家腦中出現(xiàn)的關于數(shù)據(jù)分析和機器學習方法的思考,和企業(yè)實現(xiàn)云計算的實現(xiàn)做出的準備。
蓋斯特說,"在未來,會有越來越多的驅動力量,一臺機器可以解決更為廣度的問題。這就要求機器學習要在計算機內(nèi)部進行分析而不是依靠人為判斷再去進行分析。
大量數(shù)據(jù)的生成持續(xù)不斷的擴大數(shù)據(jù)規(guī)模,驅使移動設備的普及到云計算的迅速生成。高性能計算的組織和企業(yè)正在尋求一個方法去收集,儲存和實時的去分析這些數(shù)據(jù)。以便企業(yè)可以立即的去研究這些數(shù)據(jù)后再做決策。
機器學習和人工智能 (AI) 是越來越多地被用于幫助加速收集和分析數(shù)據(jù)。此外,人工智能,機器學習是是很多新興領域的核心技術,從新的網(wǎng)絡安全技術到無人駕駛技術。
蓋斯特說;在企業(yè)管理云平臺中數(shù)據(jù)分析和機器學習發(fā)揮著越來越重要的作用。在為百億億次計算開發(fā)的應用程序中,數(shù)據(jù)分析和機器學習的重要性得到了充分的印證。
例如, 應用程序的開發(fā)試圖涉及到一系列領域, 從氣候和化學到基因組學, 地震和宇宙論。還有一個項目正在進行, 以及癌癥研究和預防的應用程序的開發(fā), 越來越多的工作使用到了數(shù)據(jù)科學和機器學習。
此外,企業(yè)管理云平臺成立于2016年,最初開發(fā)的四個應用涉及面是相對較窄的。例如;如何高效的去計算百億億次離子和粒子的精準度的應用的開發(fā)、在線數(shù)據(jù)分析的問題和數(shù)據(jù)科工作在科技行業(yè)的不斷提高等方面的應用開發(fā)。
在過去的幾個月中,該程序添加了五個協(xié)同設計中心,為了啟動百億億次應用程序采用了目標曲線和組合函數(shù)的方法。
他說新中心的建立是為了處理更加具體的數(shù)據(jù)分析和機器學習所帶來的的挑戰(zhàn)。更普遍的意義是, 這兩種新興技術也對企業(yè)管理云平臺正在尋求的系統(tǒng)類型產(chǎn)生影響, 比如IBM、英特爾和英偉達的供應商,以及在百億億次競賽中與中國日益激烈的競爭。
企業(yè)管理云平臺正在尋找的系統(tǒng)不僅能夠百億億次級的計算, 而且可以被廣泛的組織使用,。這個想法產(chǎn)生于在高性能計算的開發(fā)和使用的環(huán)境下將會層疊到企業(yè)和大宗商品機器中,蓋斯特說。
他們應該可以用于廣泛的用戶, 而不僅僅是少數(shù) "英雄程序員"。鑒于此, 企業(yè)管理云平臺正在尋找供應商開發(fā)能夠滿足程序中規(guī)定的各種要求的系統(tǒng),。
如啟用極端并行性, 創(chuàng)建新的內(nèi)存和存儲技術, 可以處理縮放、可靠性高和能耗在20到30兆瓦之間等一系列規(guī)定。
然而,這樣做的目的并不是一味的去創(chuàng)建激進的設計或是創(chuàng)建先進的結構體系。蓋斯特說;如果供應商可以創(chuàng)建百億億次的系統(tǒng), 而不一味追求激進的解決方案,那便是最好的。
"事實上, 我們可能更喜歡這一點。同時,企業(yè)管理云平臺的官員也明白, 到2021按照計劃開發(fā)第一臺百億億次的計算機, 將必須采取一些新穎的設計和架構方法。但是他們希望在接下來的2023這樣的系統(tǒng)之后, 不需要采取這種激進的做法。
蓋斯特補充說,"我們不是在試圖制造一個特技的機器,"這些系統(tǒng)的目標不僅僅是他們能生產(chǎn)多少次浮點運算, 而是他們背后能生產(chǎn)多少科學。"我們想建立一些對國家和科學有用的東西。
這所以這樣去要求,是因為目前正在處于一個關鍵的階段。美國和中國如何接近百億億次計算。
中國已經(jīng)有三個百億億次項目正在進行中, 一個叫做 Tianhe-3 的原型,計劃準備就緒。關于中國的努力的大部分討論都是關于中國政府投資項目的資金數(shù)額。同時, 中國也不像美國一樣受到傳統(tǒng)技術的限制,蓋斯特說到。
蓋斯特說;中國可以建立一次性的芯片,并且低耗能、高性能還不用擔心應用程序的遺留問題-不在智能手機或是服務器市場上運營。
對于美國供應商來說, 他們必須構建能夠運行廣泛的新的和傳統(tǒng)的應用程序系統(tǒng), 以及可以在其他系統(tǒng)中使用的組件。他們必須能夠處理無數(shù)的工作量, 這就是為什么企業(yè)管理云平臺在數(shù)據(jù)分析和機器學習領域不斷創(chuàng)新的原因了。
他說, 這些越來越重要的技術將在高性能計算和企業(yè)計算以及消費者設備計算中得到廣泛應用。供應商知道, 在考慮百億億次計算的革新時, 他們必須考慮到這一點。
新興技術的應用將在廣泛的技術領域,至關重要,所以在體系結構中的創(chuàng)新需要能夠滿足世界超級計算和企業(yè)世界。例如,在高性能計算(HPC)空間中,組織轉向機器學習加快他們正在為這種任務作為質量保證的模擬工作負載,蓋斯特說。
"在美國, 這生態(tài)系統(tǒng)的健全是非常重要的," 蓋斯特說。"如果你一年只賣兩臺機器,那么這個生意你就不要做了,結果是你一定會破產(chǎn)的。因此, 這些芯片和這些技術需要擴展到新的市場。
這就是美國必須與之抗爭的, 以確保我們能夠滿足高性能的要求。這就是為什么我們將這種擴展轉化為數(shù)據(jù)分析和機器學習, 這似乎在高性能計算的世界有一個更大的市場。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
訓練與驗證損失驟升:機器學習訓練中的異常診斷與解決方案 在機器學習模型訓練過程中,“損失曲線” 是反映模型學習狀態(tài)的核心指 ...
2025-09-19解析 DataHub 與 Kafka:數(shù)據(jù)生態(tài)中兩類核心工具的差異與協(xié)同 在數(shù)字化轉型加速的今天,企業(yè)對數(shù)據(jù)的需求已從 “存儲” 轉向 “ ...
2025-09-19CDA 數(shù)據(jù)分析師:讓統(tǒng)計基本概念成為業(yè)務決策的底層邏輯 統(tǒng)計基本概念是商業(yè)數(shù)據(jù)分析的 “基礎語言”—— 從描述數(shù)據(jù)分布的 “均 ...
2025-09-19CDA 數(shù)據(jù)分析師:表結構數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結構數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-19SQL Server 中 CONVERT 函數(shù)的日期轉換:從基礎用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關聯(lián)查詢效率:打破 “拆分必慢” 的認知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18DSGE 模型中的 Et:理性預期算子的內(nèi)涵、作用與應用解析 動態(tài)隨機一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結構數(shù)據(jù)特征價值的專業(yè)核心 表結構數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結構化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實戰(zhàn)應用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應用 在數(shù)據(jù)分析與統(tǒng)計學領域,假設檢驗是驗證研究假設、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結構數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結構數(shù)據(jù)(以 “行 - 列” 存儲的結構化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數(shù)量的準確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進行 HTTP 網(wǎng)絡請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結構數(shù)據(jù)價值的核心操盤手 表格結構數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數(shù)據(jù)的科學計數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點數(shù)據(jù)時的科學計數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務數(shù)據(jù)分析是企業(yè)解決日常運營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務邏輯:從規(guī)則拆解到數(shù)據(jù)把關的實戰(zhàn)指南 在業(yè)務系統(tǒng)落地過程中,“業(yè)務邏輯” 是連接 “需求設計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅動下的精準零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當下,精準營銷成為企業(yè)突圍的核心方 ...
2025-09-11