
測試:你是否具備企業(yè)的數據挖掘能力_數據分析師
1.某超市研究銷售紀錄數據后發(fā)現,買啤酒的人很大概率也會購買尿布,這種屬于數據挖掘的哪類問題?
A. 關聯(lián)規(guī)則發(fā)現
B. 聚類
C. 分類
D. 自然語言處理
2.以下兩種描述分別對應哪兩種對分類算法的評價標準?
(a)警察抓小偷,描述警察抓的人中有多少個是小偷的標準。
(b)描述有多少比例的小偷給警察抓了的標準。
A. Precision, Recall
B. Recall, Precision
C. Precision, ROC
D. Recall, ROC
3.將原始數據進行集成、變換、維度規(guī)約、數值規(guī)約是在以下哪個步驟的任務?
A. 頻繁模式挖掘
B. 分類和預測
C. 數據預處理
D. 數據流挖掘
4.當不知道數據所帶標簽時,可以使用哪種技術促使帶同類標簽的數據與帶其他標簽的數據相分離?
A. 分類
B. 聚類
C. 關聯(lián)分析
D. 隱馬爾可夫鏈
5. 什么是KDD?
A. 數據挖掘與知識發(fā)現
B. 領域知識發(fā)現
C. 文檔知識發(fā)現
D. 動態(tài)知識發(fā)現
6.使用交互式的和可視化的技術,對數據進行探索屬于數據挖掘的哪一類任務?
A. 探索性數據分析
B. 建模描述
C. 預測建模
D. 尋找模式和規(guī)則
7.為數據的總體分布建模;把多維空間劃分成組等問題屬于數據挖掘的哪一類任務?
A. 探索性數據分析
B. 建模描述
C. 預測建模
D. 尋找模式和規(guī)則
8.建立一個模型,通過這個模型根據已知的變量值來預測其他某個變量值屬于數據挖掘的哪一類任務?
A. 根據內容檢索
B. 建模描述
C. 預測建模
D. 尋找模式和規(guī)則
9.用戶有一種感興趣的模式并且希望在數據集中找到相似的模式,屬于數據挖掘哪一類任務?
A. 根據內容檢索
B. 建模描述
C. 預測建模
D. 尋找模式和規(guī)則
10.下面哪種不屬于數據預處理的方法?
A變量代換
B離散化
C聚集
D估計遺漏值
11.假設12個銷售價格記錄組已經排序如下:5, 10, 11, 13, 15,35, 50, 55, 72, 92, 204, 215 使用如下每種方法將它們劃分成四個箱。等頻(等深)劃分時,15在第幾個箱子內?
A 第一個
B 第二個
C 第三個
D 第四個
12.上題中,等寬劃分時(寬度為50),15又在哪個箱子里?
A 第一個
B 第二個
C 第三個
D 第四個
13.下面哪個不屬于數據的屬性類型:
A 標稱
B 序數
C 區(qū)間
D相異
14. 在上題中,屬于定量的屬性類型是:
A 標稱
B 序數
C 區(qū)間
D 相異
15. 只有非零值才重要的二元屬性被稱作:
A 計數屬性
B 離散屬性
C非對稱的二元屬性
D 對稱屬性
16. 以下哪種方法不屬于特征選擇的標準方法:
A 嵌入
B 過濾
C 包裝
D 抽樣
17.下面不屬于創(chuàng)建新屬性的相關方法的是:
A特征提取
B特征修改
C映射數據到新的空間
D特征構造
18. 考慮值集{1、2、3、4、5、90},其截斷均值(p=20%)是
A 2
B 3
C 3.5
D 5
19.下面哪個屬于映射數據到新的空間的方法?
A 傅立葉變換
B 特征加權
C 漸進抽樣
D 維歸約
20.熵是為消除不確定性所需要獲得的信息量,投擲均勻正六面體骰子的熵是:
A 1比特
B 2.6比特
C 3.2比特
D 3.8比特
21.假設屬性income的最大最小值分別是12000元和98000元。利用最大最小規(guī)范化的方法將屬性的值映射到0至1的范圍內。對屬性income的73600元將被轉化為:
A 0.821
B 1.224
C 1.458
D 0.716
22.假定用于分析的數據包含屬性age。數據元組中age的值如下(按遞增序):13,15,16,16,19,20,20,21,22,22,25,25,25,30,33,33,35,35,36,40,45,46,52,70, 問題:使用按箱平均值平滑方法對上述數據進行平滑,箱的深度為3。第二個箱子值為:
A 18.3
B 22.6
C 26.8
D 27.9
23. 考慮值集{12 24 33 2 4 55 68 26},其四分位數極差是:
A 31
B 24
C 55
D 3
24. 一所大學內的各年紀人數分別為:一年級200人,二年級160人,三年級130人,四年級110人。則年級屬性的眾數是:
A 一年級
B二年級
C 三年級
D 四年級
25. 下列哪個不是專門用于可視化時間空間數據的技術:
A 等高線圖
B 餅圖
C 曲面圖
D 矢量場圖
26. 在抽樣方法中,當合適的樣本容量很難確定時,可以使用的抽樣方法是:
A 有放回的簡單隨機抽樣
B 無放回的簡單隨機抽樣
C 分層抽樣
D 漸進抽樣
27. 數據倉庫是隨著時間變化的,下面的描述不正確的是
A.數據倉庫隨時間的變化不斷增加新的數據內容;
B. 捕捉到的新數據會覆蓋原來的快照;
C.數據倉庫隨事件變化不斷刪去舊的數據內容;
D.數據倉庫中包含大量的綜合數據,這些綜合數據會隨著時間的變化不斷地進行重新綜合.
28. 關于基本數據的元數據是指:
A.基本元數據與數據源,數據倉庫,數據集市和應用程序等結構相關的信息;
B.基本元數據包括與企業(yè)相關的管理方面的數據和信息;
C.基本元數據包括日志文件和簡歷執(zhí)行處理的時序調度信息;
D.基本元數據包括關于裝載和更新處理,分析處理以及管理方面的信息.
29. 下面關于數據粒度的描述不正確的是:
A.粒度是指數據倉庫小數據單元的詳細程度和級別;
B.數據越詳細,粒度就越小,級別也就越高;
C.數據綜合度越高,粒度也就越大,級別也就越高;
D.粒度的具體劃分將直接影響數據倉庫中的數據量以及查詢質量.
30. 有關數據倉庫的開發(fā)特點,不正確的描述是:
A. 數據倉庫開發(fā)要從數據出發(fā);
B.數據倉庫使用的需求在開發(fā)出去就要明確;
C.數據倉庫的開發(fā)是一個不斷循環(huán)的過程,是啟發(fā)式的開發(fā);
D.在數據倉庫環(huán)境中,并不存在操作型環(huán)境中所固定的和較確切的處理流,數據倉庫中數據分析和處理更靈活,且沒有固定的模式
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
SQL Server 中 CONVERT 函數的日期轉換:從基礎用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數據處理中,日期格式轉換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關聯(lián)查詢效率:打破 “拆分必慢” 的認知誤區(qū) 在 MySQL 數據庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數據分析師:表結構數據 “獲取 - 加工 - 使用” 全流程的賦能者 表結構數據(如數據庫表、Excel 表、CSV 文件)是企業(yè)數字 ...
2025-09-18DSGE 模型中的 Et:理性預期算子的內涵、作用與應用解析 動態(tài)隨機一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數據分析師:解鎖表結構數據特征價值的專業(yè)核心 表結構數據(以 “行 - 列” 規(guī)范存儲的結構化數據,如數據庫表、Excel 表、 ...
2025-09-17Excel 導入數據含缺失值?詳解 dropna 函數的功能與實戰(zhàn)應用 在用 Python(如 pandas 庫)處理 Excel 數據時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應用 在數據分析與統(tǒng)計學領域,假設檢驗是驗證研究假設、判斷數據差異是否 “ ...
2025-09-16CDA 數據分析師:掌控表格結構數據全功能周期的專業(yè)操盤手 表格結構數據(以 “行 - 列” 存儲的結構化數據,如 Excel 表、數據 ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數量的準確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進行 HTTP 網絡請求開發(fā)時(如使用requests ...
2025-09-15CDA 數據分析師:激活表格結構數據價值的核心操盤手 表格結構數據(如 Excel 表格、數據庫表)是企業(yè)最基礎、最核心的數據形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調用、數據爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數據的科學計數法問題 為幫助 Python 數據從業(yè)者解決pd.read_csv讀取長浮點數據時的科學計數法問題 ...
2025-09-12CDA 數據分析師:業(yè)務數據分析步驟的落地者與價值優(yōu)化者 業(yè)務數據分析是企業(yè)解決日常運營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務邏輯:從規(guī)則拆解到數據把關的實戰(zhàn)指南 在業(yè)務系統(tǒng)落地過程中,“業(yè)務邏輯” 是連接 “需求設計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數據驅動下的精準零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當下,精準營銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數據分析師與戰(zhàn)略 / 業(yè)務數據分析:概念辨析與協(xié)同價值 在數據驅動決策的體系中,“戰(zhàn)略數據分析”“業(yè)務數據分析” 是企業(yè) ...
2025-09-11Excel 數據聚類分析:從操作實踐到業(yè)務價值挖掘 在數據分析場景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數據中挖 ...
2025-09-10統(tǒng)計模型的核心目的:從數據解讀到決策支撐的價值導向 統(tǒng)計模型作為數據分析的核心工具,并非簡單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10