
《數(shù)據(jù)分析專項練習題庫》
《CDA數(shù)據(jù)分析認證考試模擬題庫》
《企業(yè)數(shù)據(jù)分析面試題庫》
75.利用Apriori算法計算頻繁項集可以有效降低計算頻繁集的時間復雜度。在以下的購物籃中產(chǎn)生支持度不小于3的候選3-項集,在候選2-項集中需要剪枝的是(BD)
ID 項集
1 面包、牛奶
2 面包、尿布、啤酒、雞蛋
3 牛奶、尿布、啤酒、可樂
4 面包、牛奶、尿布、啤酒
5 面包、牛奶、尿布、可樂
A、啤酒、尿布
B、啤酒、面包
C、面包、尿布
D、啤酒、牛奶
76.下表是一個購物籃,假定支持度閾值為40%,其中__(A D)__是頻繁閉項集。
TID 項
1 abc
2 abcd
3 bce
4 acde
5 de
A、abc
B、ad
C、cd
D、de
77.Apriori算法的計算復雜度受__(ABCD)__影響。
A、支持度閥值
B、項數(shù)(維度)
C、事務數(shù)
D、事務平均寬度
78. 我們可以用哪種方式來避免決策樹過度擬合 (Overfitting)的問題? (AB)
A、利用修剪法來限制樹的深度
B、利用盆栽法規(guī)定每個節(jié)點下的最小的記錄數(shù)目
C、利用逐步回歸法來刪除部分數(shù)據(jù)
D、目前并無適合的方法來處理這問題
79.以下屬于分類器評價或比較尺度的有: (ACD)
A、預測準確度
B、召回率
C、模型描述的簡潔度
D、計算復雜度
80.在評價不平衡類問題分類的度量方法有如下幾種:(ABCD)
A、F1度量
B、召回率(recall)
C、精度(precision)
D、真正率(ture positive rate,TPR)
81.貝葉斯信念網(wǎng)絡(BBN)有如下哪些特點:(AB)
A、構(gòu)造網(wǎng)絡費時費力
B、對模型的過分問題非常魯棒
C、貝葉斯網(wǎng)絡不適合處理不完整的數(shù)據(jù)
D、網(wǎng)絡結(jié)構(gòu)確定后,添加變量相當麻煩
82.如下哪些不是最近鄰分類器的特點: (C)
A、它使用具體的訓練實例進行預測,不必維護源自數(shù)據(jù)的模型
B、分類一個測試樣例開銷很大
C、最近鄰分類器基于全局信息進行預測
D、可以生產(chǎn)任意形狀的決策邊界
83.如下那些不是基于規(guī)則分類器的特點:(AC)
A、規(guī)則集的表達能力遠不如決策樹好
B、基于規(guī)則的分類器都對屬性空間進行直線劃分,并將類指派到每個劃分
C、無法被用來產(chǎn)生更易于解釋的描述性模型
D、非常適合處理類分布不平衡的數(shù)據(jù)集
84.以下屬于聚類算法的是( ABD )。
A、K均值
B、DBSCAN
C、Apriori
D、Jarvis-Patrick(JP)
85.( CD )都屬于簇有效性的監(jiān)督度量。
A、輪廓系數(shù)
B、共性分類相關(guān)系數(shù)
C、熵
D、F度量
86. 下列對ID3算法的描述,何者為真?(A, B, D)
A、每個節(jié)點的分支度都不相同
B、使用Information Gain作為節(jié)點分割的依據(jù)
C、可以處理數(shù)值型態(tài)的字段
D、無法處理空值的字段
87.( ABCD )這些數(shù)據(jù)特性都是對聚類分析具有很強影響的。
A、高維性
B、規(guī)模
C、稀疏性
D、噪聲和離群點
88.在聚類分析當中,( AD )等技術(shù)可以處理任意形狀的簇。
A、MIN(單鏈)
B、MAX(全鏈)
C、組平均
D、Chameleon
89.( AB )都屬于分裂的層次聚類算法。
A、二分K均值
B、MST
C、Chameleon
D、組平均
90.下列哪種算法可同時用來做分類以及預測數(shù)值?(A, B)
A、Neural Network
B、Decision Tree
C、Logistic Regression
D、Linear Regression
三、內(nèi)容相關(guān)題
(一)、根據(jù)相同的背景材料回答若干道題目,每道題的答案個數(shù)不固定。下列各題A)、B)、C)、D)四個選項中,每題至少有一個選項是正確的,多選或少選,均不能得分。
I、下圖為類神經(jīng)元的示意圖,請回答1至3題:
1、【答案(A)】
請問虛線的部分為?
A、類神經(jīng)元
B、 鍵結(jié)值(Weight)
C、閥值(Bias)
D、激發(fā)函數(shù)(Activation Function)
2、【答案(D)】
請問請問( )為?
A、類神經(jīng)元
B、鍵結(jié)值(Weight)
C、閥值(Bias)
D、激發(fā)函數(shù)(Activation Function)
3、【答案(B)】
請問W1, W2, …, Wm為?
A、類神經(jīng)元
B、鍵結(jié)值(Weight)
C、閥值(Bias)
D、激發(fā)函數(shù)(Activation Function)
II、根據(jù)下表的混亂矩陣(Confusion Matrix),回答4至5題:
4、【答案(A)】
對于屬性值YES的響應率(Precision)應如何計算?
A. B. C. D.
5、【答案(B)】
對于屬性值YES的捕捉率(Recall)應如何計算?
A. B. C. D.
(二)、6-10題略
四、案例操作題
帶數(shù)據(jù),數(shù)據(jù)請見***
(一)、根據(jù)相同的背景材料和數(shù)據(jù)回答若干道題目,每道題的答案個數(shù)不固定。在做題過程中需要使用統(tǒng)計軟件進行相應的操作。提供SAS、SPSS和CSV三種格式的數(shù)據(jù),統(tǒng)計軟件不受限制。下列各題A)、B)、C)、D)四個選項中,每題至少有一個選項是正確的,多選或少選,均不能得分。
I、一家銀行希望使用自有業(yè)務數(shù)據(jù)和外部征信局數(shù)據(jù)來構(gòu)造信用評分模型。該數(shù)據(jù)保存在Credit這張表中。其變量描述如下:
分析過程需要使用軟件進行,可以使用任何軟件完成以下題目:
1、 (AB)
以下哪個變量是分類變量
A. TARGET
B. BanruptcyInd
C. InqFinanceCnt24
D. TLBadDerogCnt
2、 (B)
這些變量中,有多少個變量具有缺失值
A. 7
B. 11
C. 12
D. 27
3、(B)
InqCnt06的中位數(shù)是
A.0
B.2
C.40
D.3.11
4、(AC)
以下四個變量中,哪兩個右偏嚴重
A. TLCnt24
B. TlOpenPct
C. TLSatCnt
D. TLSatPct
5、(B)
將數(shù)據(jù)按7:3的比例分為訓練集和驗證集,對有缺失值的變量使用中位數(shù)進行填補后,使用逐步回歸法以Target為被解釋變量構(gòu)造邏輯回歸,以下哪些變量的解釋力度最強
A.TLBadCnt24
B.TLBalHCPct
C.TLCnt03
D.TLDel60Cnt24
6-10略
(二)、11-20題略
立刻掃碼
看更多數(shù)據(jù)分析師認證試題
——學數(shù)據(jù)分析技能一定要了解的大廠入門券,CDA數(shù)據(jù)分析師認證證書!
CDA(數(shù)據(jù)分析師認證),與CFA相似,由國際范圍內(nèi)數(shù)據(jù)科學領(lǐng)域行業(yè)專家、學者及知名企業(yè)共同制定并修訂更新,迅速發(fā)展成行業(yè)內(nèi)長期而穩(wěn)定的全球大數(shù)據(jù)及數(shù)據(jù)分析人才標準,具有專業(yè)化、科學化、國際化、系統(tǒng)化等特性。
同時,CDA全??荚嚥季趾驼J證體系已得到社會認可,并由為IBM、華為等提供全球認證服務的Pearson VUE面向全球提供靈活的考試服務。
報名方式
登錄CDA認證考試官網(wǎng)注冊報名>>點擊報名
報名費用
Level Ⅰ:1200 RMB
Level Ⅱ:1700 RMB
Level Ⅲ:2000 RMB
考試地點
Level Ⅰ + Level Ⅱ:中國區(qū)30+省市,70+城市,250+考場,考生可就近考場預約考試 >看看我所在的地哪里報名<
Level Ⅲ:中國區(qū)30所城市,北京/上海/天津/重慶/成都/深圳/廣州/濟南/南京/杭州/蘇州/福州/太原/武漢/長沙/西安/貴陽/鄭州/南寧/昆明/烏魯木齊/沈陽/哈爾濱/合肥/石家莊/呼和浩特/南昌/長春/大連/蘭州>看看我所在的地哪里報名<
報考條件
CDA Level I >了解更多<
? 報考條件:無要求。
? 考試時間:隨報隨考。
CDA Level II >了解更多<
? 報考條件:獲得 CDA Level Ⅰ 認證證書;
? 考試時間:隨報隨考。
CDA Level III >了解更多<
? 獲得CDA Level Ⅱ 認證證書;
? 考試時間:
一年四屆 3月、6月、9月、12月的最后一個周六。
——熱門課程推薦:
想學習PYTHON數(shù)據(jù)分析與金融數(shù)字化轉(zhuǎn)型精英訓練營,您可以點擊>>>“人才轉(zhuǎn)型”了解課程詳情;
想從事業(yè)務型數(shù)據(jù)分析師,您可以點擊>>>“數(shù)據(jù)分析師”了解課程詳情;
想從事大數(shù)據(jù)分析師,您可以點擊>>>“大數(shù)據(jù)就業(yè)”了解課程詳情;
想成為人工智能工程師,您可以點擊>>>“人工智能就業(yè)”了解課程詳情;
想了解Python數(shù)據(jù)分析,您可以點擊>>>“Python數(shù)據(jù)分析師”了解課程詳情;
想咨詢互聯(lián)網(wǎng)運營,你可以點擊>>>“互聯(lián)網(wǎng)運營就業(yè)班”了解課程詳情;
更多考試介紹及備考福利請點擊:CDA 認證考試中心官網(wǎng)
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預期算子的內(nèi)涵、作用與應用解析 動態(tài)隨機一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實戰(zhàn)應用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應用 在數(shù)據(jù)分析與統(tǒng)計學領(lǐng)域,假設(shè)檢驗是驗證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數(shù)量的準確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進行 HTTP 網(wǎng)絡請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數(shù)據(jù)的科學計數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點數(shù)據(jù)時的科學計數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務數(shù)據(jù)分析是企業(yè)解決日常運營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實戰(zhàn)指南 在業(yè)務系統(tǒng)落地過程中,“業(yè)務邏輯” 是連接 “需求設(shè)計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動下的精準零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當下,精準營銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務數(shù)據(jù)分析:概念辨析與協(xié)同價值 在數(shù)據(jù)驅(qū)動決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實踐到業(yè)務價值挖掘 在數(shù)據(jù)分析場景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價值導向 統(tǒng)計模型作為數(shù)據(jù)分析的核心工具,并非簡單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10