
想玩大數據?這些專業(yè)術語你知道嗎(2)_數據分析師
平臺即服務(PaaS: Platform-as-a-Service)——為云計算解決方案提供所有必需的基礎平臺的一種服務
預測分析(Predictive analysis)——大數據分析方法中最有價值的一種分析方法,這種方法有助于預測個人未來(近期)的行為,例如某人很可能會買某些商品,可能會訪問某些網站,做某些事情或者產生某種行為。通過使用各種不同的數據集,例如歷史數據,事務數據,社交數據,或者客戶的個人信息數據,來識別風險和機遇
隱私(Privacy)——把具有可識別出個人信息的數據與其他數據分離開,以確保用戶隱私。
公共數據(Public data)——由公共基金創(chuàng)建的公共信息或公共數據集。
Q
數字化自我(Quantified Self)——使用應用程序跟蹤用戶一天的一舉一動,從而更好地理解其相關的行為
查詢(Query)——查找某個問題答案的相關信息
R
再識別(Re-identification)——將多個數據集合并在一起,從匿名化的數據中識別出個人信息
回歸分析(Regression analysis)——確定兩個變量間的依賴關系。這種方法假設兩個變量之間存在單向的因果關系(譯者注:自變量,因變量,二者不可互換)
RFID——射頻識別; 這種識別技術使用一種無線非接觸式射頻電磁場傳感器來傳輸數據
實時數據(Real-time data)——指在幾毫秒內被創(chuàng)建、處理、存儲、分析并顯示的數據
推薦引擎(Recommendation engine)——推薦引擎算法根據用戶之前的購買行為或其他購買行為向用戶推薦某種產品
路徑分析(Routing analysis)——針對某種運輸方法通過使用多種不同的變量分析從而找到一條最優(yōu)路徑,以達到降低燃料費用,提高效率的目的
S
半結構化數據(Semi-structured data)——半結構化數據并不具有結構化數據嚴格的存儲結構,但它可以使用標簽或其他形式的標記方式以保證數據的層次結構
情感分析(Sentiment Analysis)——通過算法分析出人們是如何看待某些話題
信號分析(Signal analysis)——指通過度量隨時間或空間變化的物理量來分析產品的性能。特別是使用傳感器數據。
相似性搜索(Similarity searches)——在數據庫中查詢最相似的對象,這里所說的數據對象可以是任意類型的數據
仿真分析(Simulation analysis)——仿真是指模擬真實環(huán)境中進程或系統(tǒng)的操作。仿真分析可以在仿真時考慮多種不同的變量,確保產品性能達到最優(yōu)
智能網格(Smart grid)——是指在能源網中使用傳感器實時監(jiān)控其運行狀態(tài),有助于提高效率
軟件即服務(SaaS: Software-as-a-Service)——基于Web的通過瀏覽器使用的一種應用軟件
空間分析(Spatial analysis)——空間分析法分析地理信息或拓撲信息這類空間數據,從中得出分布在地理空間中的數據的模式和規(guī)律SQL——在關系型數據庫中,用于檢索數據的一種編程語言
結構化數據(Structured data) -可以組織成行列結構,可識別的數據。這類數據通常是一條記錄,或者一個文件,或者是被正確標記過的數據中的某一個字段,并且可以被精確地定位到。
T
T字節(jié)(TB: Terabytes)——約等于1000 GB(gigabytes)。1 TB容量可以存儲約300小時的高清視頻。
時序分析(Time series analysis)——分析在重復測量時間里獲得的定義良好的數據。分析的數據必須是良好定義的,并且要取自相同時間間隔的連續(xù)時間點。
拓撲數據分析(Topological Data Analysis)——拓撲數據分析主要關注三點:復合數據模型、集群的識別、以及數據的統(tǒng)計學意義。
交易數據(Transactional data)——隨時間變化的動態(tài)數據透明性(Transparency)——消費者想要知道他們的數據有什么作用、被作何處理,而組織機構則把這些信息都透明化了。
U
非結構化數據(Un-structured data)——非結構化數據一般被認為是大量純文本數據,其中還可能包含日期,數字和實例。
V
價值(Value)——(譯者注:大數據4V特點之一) 所有可用的數據,能為組織機構、社會、消費者創(chuàng)造出巨大的價值。這意味著各大企業(yè)及整個產業(yè)都將從大數據中獲益。
可變性(Variability)——也就是說,數據的含義總是在(快速)變化的。例如,一個詞在相同的推文中可以有完全不同的意思。
多樣(Variety)——(譯者注:大數據4V特點之一) 數據總是以各種不同的形式呈現,如結構化數據,半結構化數據,非結構化數據,甚至還有復雜結構化數據
高速(Velocity)——(譯者注:大數據4V特點之一) 在大數據時代,數據的創(chuàng)建、存儲、分析、虛擬化都要求被高速處理。
真實性(Veracity)——組織機構需要確保數據的真實性,才能保證數據分析的正確性。因此,真實性(Veracity)是指數據的正確性。
可視化(Visualization)——只有正確的可視化,原始數據才可被投入使用。這里的“可視化”并非普通的圖型或餅圖,可視化指是的復雜的圖表,圖表中包含大量的數據信息,但可以被很容易地理解和閱讀。
大量(Volume)——(譯者注:大數據4V特點之一) 指數據量,范圍從Megabytes至BrontobytesW
天氣數據(Weather data)——是一種重要的開放公共數據來源,如果與其他數據來源合成在一起,可以為相關組織機構提供深入分析的依據X
XML數據庫(XML Databases)——XML數據庫是一種以XML格式存儲數據的數據庫。XML數據庫通常與面向文檔型數據庫相關聯,開發(fā)人員可以對XML數據庫的數據進行查詢,導出以及按指定的格式序列化Y
Y字節(jié) (Yottabytes)——約等于1000 ZB (Zettabytes), 約等于250萬億張DVD的數據容量?,F今,整個數字化宇宙的數據量為1 YB, 并且將每18年翻一番。
Z
Z字節(jié) (ZB: Zettabytes)——約等于1000 EB (Exabytes), 約等于1百萬 TB。據預測,到2016年全球范圍內每天網絡上通過的信息大約能達到1 ZB。
附:存儲容量單位換算表:
1 Bit(比特) = Binary Digit
8 Bits = 1 Byte(字節(jié))
1,000 Bytes = 1 Kilobyte
1,000 Kilobytes = 1 Megabyte
1,000 Megabytes = 1 Gigabyte
1,000 Gigabytes = 1 Terabyte
1,000 Terabytes = 1 Petabyte
1,000 Petabytes = 1 Exabyte
1,000 Exabytes = 1 Zettabyte
1,000 Zettabytes = 1 Yottabyte
1,000 Yottabytes = 1 Brontobyte
1,000 Brontobytes = 1 Geopbyte。
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關鍵? 在循環(huán)神經網絡(RNN)家族中,長短期記憶網絡(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數據分析師報考條件詳解與準備指南? ? 在數據驅動決策的時代浪潮下,CDA 數據分析師認證愈發(fā)受到矚目,成為眾多有志投身數 ...
2025-07-11數據透視表中兩列相乘合計的實用指南? 在數據分析的日常工作中,數據透視表憑借其強大的數據匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認 ...
2025-07-10BI 大數據分析師:連接數據與業(yè)務的價值轉化者? ? 在大數據與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預測分析中的應用:從數據查詢到趨勢預判? ? 在數據驅動決策的時代,預測分析作為挖掘數據潛在價值的核心手段,正被廣泛 ...
2025-07-10數據查詢結束后:分析師的收尾工作與價值深化? ? 在數據分析的全流程中,“query end”(查詢結束)并非工作的終點,而是將數 ...
2025-07-10CDA 數據分析師考試:從報考到取證的全攻略? 在數字經濟蓬勃發(fā)展的今天,數據分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗:捕捉數據背后的時間軌跡? 在數據分析的版圖中,單樣本趨勢性檢驗如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數據類型:時間維度的精準切片? ? 在數據的世界里,時間是最不可或缺的維度之一,而year_month數據類型就像一把精準 ...
2025-07-09CDA 備考干貨:Python 在數據分析中的核心應用與實戰(zhàn)技巧? ? 在 CDA 數據分析師認證考試中,Python 作為數據處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗:數據趨勢與突變分析的有力工具? ? ? 在數據分析的廣袤領域中,準確捕捉數據的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數據分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數據分析師認證作為國內權威的數據分析能力認證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應對策略? 長短期記憶網絡(LSTM)作為循環(huán)神經網絡(RNN)的一種變體,憑借獨特的門控機制,在 ...
2025-07-07統(tǒng)計學方法在市場調研數據中的深度應用? 市場調研是企業(yè)洞察市場動態(tài)、了解消費者需求的重要途徑,而統(tǒng)計學方法則是市場調研數 ...
2025-07-07CDA數據分析師證書考試全攻略? 在數字化浪潮席卷全球的當下,數據已成為企業(yè)決策、行業(yè)發(fā)展的核心驅動力,數據分析師也因此成為 ...
2025-07-07剖析 CDA 數據分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數據分析師考試作為衡量數據專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉日期:解鎖數據處理的關鍵技能? 在數據處理與分析工作中,數據格式的規(guī)范性是保證后續(xù)分析準確性的基礎 ...
2025-07-04CDA 數據分析師視角:從數據迷霧中探尋商業(yè)真相? 在數字化浪潮席卷全球的今天,數據已成為企業(yè)決策的核心驅動力,CDA(Certifie ...
2025-07-04CDA 數據分析師:開啟數據職業(yè)發(fā)展新征程? ? 在數據成為核心生產要素的今天,數據分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03