
《數(shù)據(jù)分析專項練習題庫》
《CDA數(shù)據(jù)分析認證考試模擬題庫》
《企業(yè)數(shù)據(jù)分析面試題庫》
推薦學習書籍
《CDA一級教材》適合CDA一級考生備考,也適合業(yè)務及數(shù)據(jù)分析崗位的從業(yè)者提升自我。完整電子版已上線CDA網(wǎng)校,累計已有10萬+在讀~
免費加入閱讀:https://edu.cda.cn/goods/show/3151?targetId=5147&preview=0
一、單選題
1.統(tǒng)計圖中的散點圖主要用來( A )。
A.觀察變量之間的相關關系 B.主要用來表示總體各部分所占的比例
C.主要用來表示次數(shù)分布 D.主要用來反映分類數(shù)據(jù)的頻數(shù)分布
2.抽樣誤差是指( D )
A.在調(diào)查過程中由于觀察、測量等差錯所引起的誤差
B.人為原因所造成的誤差
C.在調(diào)查中違反隨機原則出現(xiàn)的系統(tǒng)誤差
D.隨機抽樣而產(chǎn)生的代表性誤差
3.檢查異常值常用的統(tǒng)計圖形:( B )
A、條形圖
B、箱體圖
C、帕累托圖
D、線圖
4.線性回歸里的殘差分析不可能用于診斷( D )
A、殘差獨立性
B、變量分布
C、異常值偵察
D、最大迭代次數(shù)
5.擬合logistic回歸模型時有兩個分類變量,分別是Gender(水平為female和male),Class(水平為1 、2和3),下表為輸出結(jié)果,下面哪個選項的說法是正確的?(C)
A.變量Gender和Class采用效應編碼
B.變量Gender采用引用編碼,引用水平為female
C.變量Class采用引用編碼,引用水平為3
D.變量Gender和Class采用全量編碼
6.因子分析的主要作用:( A )
A、對變量進行降維
B、對變量進行判別
C、對變量進行聚類
D、以上都不對
7.關于K-means 聚類過程正確的是:( A )
A、使用的是迭代的方法
B、均適用于對變量和個案的聚類
C、對變量進行聚類
D、以上都不對
8.東北人養(yǎng)了一只雞和一頭豬。一天雞問豬:"主人呢?"豬說:"出去買蘑菇了。"雞聽了撒丫子就跑。豬說:"你跑什么?"雞叫道:“有本事主人買粉條的時候你小子別跑!"
以上對話體現(xiàn)了數(shù)據(jù)分析方法中的( A )
A. 關聯(lián) B. 聚類 C. 分類 D. 自然語言處理
9.已知甲班學生“統(tǒng)計學”的平均成績?yōu)?6分,標準差是12.8分,乙班學生“統(tǒng)計學”的平均成績是90分,標準差是10.3分,下列表述正確的是( A )
A. 乙班平均成績的代表性高于甲班
B. 甲班平均成績的代表性高于乙班
C. 甲、乙兩班平均成績的代表性相同
D. 甲、乙兩班平均成績的代表性無法比較
10.根據(jù)樣本資料估計得出人均消費支出Y對人均收入X的回歸模型,表明人均收入每增加1%,人均消費支出將增加( B )
A. 0.2% B. 0.75% C. 2% D. 7.5%
11.某企業(yè)根據(jù)對顧客隨機抽樣的信息得到對該企業(yè)產(chǎn)品表示滿意的顧客比率的95%置信度的置信區(qū)間是(56%,64%)。下列正確的表述是( A )
A.總體比率的95%置信度的置信區(qū)間為(56%,64%)
B.總體真實比率有95%的可能落在(56%,64%)中
C.區(qū)間(56%,64%)有95%的概率包含了總體真實比率
D.由100次抽樣構造的100個置信區(qū)間中,約有95個覆蓋了總體真實比率
12.以下哪個語句可以將字符型數(shù)值date(示例:“2001-02-19”)轉(zhuǎn)換為數(shù)值類型? ( A )
A、INPUT(date,YYMMDD10.)
B、PUT(date,YYMMDD10)
C、INPUT(date,YYMMDD10.)
D、PUT(date,YYMMDD10)
13. ,取值范圍在[0,1],反映回歸曲線的擬合優(yōu)度,當
趨近于0,則回歸曲線擬合優(yōu)度( B )
A.越好 B. 越差 C. 適中 D. 以上都不對
14.分析購買不同產(chǎn)品的頻次時,使用以下哪個任務? ( D )
A、列表數(shù)據(jù)
B、匯總表
C、匯總統(tǒng)計量
D、單因子頻數(shù)
15.當你用跑步時間(RunTime)、年齡(Age)、跑步時脈搏(Run_Pulse)以及最高脈搏(Maximum_Pulse)作為預測變量來對耗氧量(Oxygen_Consumption )進行回歸時,年齡(Age)的參數(shù)估計是-2.78. 這意味著什么?( B )
A、年齡每增加一歲,耗氧量就增大2.78.
B、年齡每增加一歲,耗氧量就降低2.78.
C、年齡每增加2.78歲,耗氧量就翻倍。
D、年齡每減少2.78歲,耗氧量就翻倍。
16.ROC曲線凸向哪個角,代表模型約理想?( A )
A、左上角
B、左下角
C、右上角
D、右下角
17.在所有兩位數(shù)(10-99)中任取一兩位數(shù),則此數(shù)能被2或3整除的概率為 ( B )
A. 6/5 B. 2/3 C. 83/100 D.均不對
18.對事件A和B,下列正確的命題是 ( D )
A.如A,B互斥,則,
也互斥
B. 如A,B相容,則,
也相容
C. 如A,B互斥,且P(A)>0,P(B)>0,則A.B獨立
D. 如A,B獨立,則,
也獨立
19.擲二枚骰子,事件A為出現(xiàn)的點數(shù)之和等于3的概率為 ( B )
A.1/11 B. 1/18 C. 1/6 D. 都不對
20.A和B兩事件,若 P(AUB)=0.8,P(A)=0.2,P()=0.4 則下列 ( B )成立。
A. P()=0.32 B. P(
)=0.2
C. P(AB)=0.4 D. P()=0.48
21.隨機地擲一骰子兩次,則兩次出現(xiàn)的點數(shù)之和等于8的概率為 ( C )
A. 3/36 B. 4/36 C. 5/36 D. 2/36
22.抽樣推斷中,可計算和控制的誤差是 ( D )
A.登記誤差 B.系統(tǒng)性誤差(偏差)
C.抽樣實際誤差 D.抽樣平均誤差
23.假設檢驗中顯著性水平是 ( B )
A.推斷時犯取偽錯誤的概率 B.推斷時犯取偽棄真的概率
C.正確推斷的概率 D.推斷時視情況而定
24.抽樣調(diào)查中,無法消除的誤差是 ( A )
A.隨機誤差 B.工作誤差 C.登記誤差 D.偏差
25.當時,兩個相關變量 ( C )
A.低度相關 B.中度相關
C.高度相關 D.不相關
26.描述一組對稱(或正態(tài))分布資料的離散趨勢時,最適宜選擇的指標是(B)
A.極差 B.標準差 C.均數(shù) D.變異系數(shù)
27.以下指標中那一項可用來描述計量資料離散程度(D)
A.算術均數(shù) B.幾何均數(shù) C.中位數(shù) D.極差
28.偏態(tài)分布資料宜用下面那一項描述其分布的集中趨勢(C)
A.算術均數(shù) B.標準差 C.中位數(shù) D.四分位數(shù)間距
29.下面那一項可用于比較身高和體重的變異度(C)
30.正態(tài)曲線下,橫軸上從均數(shù)到+∞的面積為(C)
A.97.5% B.95% C.50% D.5%
31.橫軸上,標準正態(tài)曲線下從0到1.96的面積為: (D)
A.95% B.45% C.97.5% D.47.5%
32.下面那一項分布的資料,均數(shù)等于中位數(shù)。(D)
A.對數(shù)正態(tài) B.左偏態(tài) C.右偏態(tài) D.正態(tài)
33.K-均值類別偵測要求輸入的數(shù)據(jù)類型必須是( B )。
A整型 B數(shù)值型 C字符型 D邏輯型
34.某一特定的X水平上,總體Y分布的離散度越大,即σ2越大,則( A )。
A.預測區(qū)間越寬,精度越低 B.預測區(qū)間越寬,預測誤差越小
C 預測區(qū)間越窄,精度越高 D.預測區(qū)間越窄,預測誤差越大
35.如果X和Y在統(tǒng)計上獨立,則相關系數(shù)等于( C )。
A.1 B.-1 C.0 D.∞
36.根據(jù)決定系數(shù)R2與F統(tǒng)計量的關系可知,當R2=1時,有( D )。
A.F=1 B.F=-1 C.F=0 D.F=∞
37.假設兩變量線性相關,兩變量是等距或等比的數(shù)據(jù),但不呈正態(tài)分布,計算它們的相關系數(shù)時應選用( B )。
A. 積差相關 B.斯皮爾曼等級相關
C.二列相關 D.點二列相關
38.回歸模型中,關于檢驗
所用的統(tǒng)計量
,下列說法正確的是( D )。
A.服從 B.服從
C.服從 D.服從
39.下面有關HAVING子句描述錯誤的是(B)。
A:HAVING子句必須與GROUP BY 子句同時使用,不能單獨使用
B:使用HAVING子句的同時不能使用WHERE子句
C:使用HAVING子句的同時可以使用WHERE子句
D:使用HAVING子句的作用是限定分組的條件
40. 是( C )分布的密度函數(shù)。
A.指數(shù) B. 二項 C. 均勻 D. 泊松
41.根據(jù)判定系數(shù)R2與F統(tǒng)計量的關系可知,當R2=1時有( C )。
A.F=1 B.F=-1 C.F=∞ D.F=0
42.在SQL查詢時,使用WHERE子句指出的是(C)。
A:查詢目標
B:查詢結(jié)果
C:查詢條件
D:查詢視圖
43.SQL查詢語句中HAVING子句的作用是(C)。
A:指出分組查詢的范圍
B:指出分組查詢的值
C:指出分組查詢的條件
D:指出分組查詢的字段
44.SQL的數(shù)據(jù)操作語句不包括(D)。
A:INSERT
B:UPDATE
C:DELETE
D:CHANGE
45.SQL語句中查詢條件短語的關鍵字是(A)。
A:WHERE
B:FOR
C:WHILE
D:CONDITION
A:MODIFY TABLE
B:MODIFY STRUCTURE
C:ALTER TABLE
D:ALTER STRUCTURE
47.SQL語句中刪除表的命令是(A)。
A:DROP TABLE
B:DELETE TABLE
C:ERASE TABLE
D:DELETE DBF
二、多選題
48.相關有以下幾種(ABC)。
A.正相關 B.負相關 C.零相關 D.常相關
49.相關系數(shù)的取值可以是(ABC)。
A. 0 B.-1 C. 1 D. 2
50.某種產(chǎn)品的生產(chǎn)總費用2003年為50萬元,比2002年多2萬元,而單位產(chǎn)品成本2003年比2002年降低5%,則( ACDE )
A、生產(chǎn)費用總指數(shù)為104.17% B、生產(chǎn)費用指數(shù)為108.56%
C、單位成本指數(shù)為95% D、產(chǎn)量指數(shù)為109.65%
E、由于成本降低而節(jié)約的生產(chǎn)費用為2.63萬元
51.三個地區(qū)同一種商品的價格報告期為基期的108%,這個指數(shù)是( BE )
A、個體指數(shù) B、總指數(shù) C、綜合指數(shù)
D、平均數(shù)指數(shù) E、質(zhì)量指標指數(shù)
52.有關數(shù)據(jù)庫的說法正確的是(ABCD)
A.元數(shù)據(jù)是描述數(shù)據(jù)的數(shù)據(jù)
B.使用索引可以快速訪問數(shù)據(jù)庫中的數(shù)據(jù),所以可以在數(shù)據(jù)庫中盡量多的建立索引
C.數(shù)據(jù)庫中一行叫做記錄
D.數(shù)據(jù)庫中的每一個項目叫做字段
53.統(tǒng)計數(shù)據(jù)按來源分類,可以分為(BD)
A.類別數(shù)據(jù) B.二手數(shù)據(jù)
C.序列數(shù)據(jù) D.一手數(shù)據(jù)
E.數(shù)值數(shù)據(jù)
53.以下哪些變量代表RFM方法中的M:( AB )
A.最近3期境外消費金額
B.最近6期網(wǎng)銀平均消費金額
C.信用卡的消費額度
D.距最近一次逾期的月數(shù)
54.在作邏輯回歸時,如果區(qū)域這個變量,當Region=A時Y取值均為1,無法確定是否出現(xiàn)的是哪個問題?(ABD)
A. 共線性
B. 異常值
C. 擬完全分離(Quasi-complete separation)
D. 缺失值
55.下列Z值( BCD )可以被認為是異常值。
A、0 B、-3 C、6 D、10
56.下列問題( ABC )使用參數(shù)檢驗分析方法。
A、評估燈泡使用壽命 B、檢驗食品某種成分的含量
C、全國小學一年級學生一學期的平均課外作業(yè)時間 D、全國省市小康指數(shù)高低
57.兩獨立樣本t檢驗的前提( ABC )
A、樣本來自的總體服從或近似服從正態(tài)分布 B、兩樣本相互獨立
C、兩樣本的數(shù)量可以不相等 D、兩樣本的數(shù)量相等
58.兩配對樣本t檢驗的前提( ABD )
A、樣本來自的總體服從或近似服從正態(tài)分布 B、兩樣本觀察值的先后順序一一對應
C、兩樣本的數(shù)量可以不相等 D、兩樣本的數(shù)量相等
59.下面給出的t檢驗的結(jié)果,( CD )表明接受原假設,顯著性水平為0.05。
A、0.000 B、0.039 C、0.092 D、0.124
60.方差分析的基本假設前提包括( AC )
A、各總體服從正態(tài)分布 B、各總體相互獨立
61.下列( ABC )屬于多選項問題。
A、購買保險原因調(diào)查 B、高考志愿調(diào)查
C、儲蓄原因調(diào)查 D、各省市現(xiàn)代化指數(shù)分析
A、凝聚方式聚類 B、分解方式聚類 C、Q型聚類 D、R型聚類
——學數(shù)據(jù)分析技能一定要了解的大廠入門券,CDA數(shù)據(jù)分析師認證證書!
CDA(數(shù)據(jù)分析師認證),與CFA相似,由國際范圍內(nèi)數(shù)據(jù)科學領域行業(yè)專家、學者及知名企業(yè)共同制定并修訂更新,迅速發(fā)展成行業(yè)內(nèi)長期而穩(wěn)定的全球大數(shù)據(jù)及數(shù)據(jù)分析人才標準,具有專業(yè)化、科學化、國際化、系統(tǒng)化等特性。
“CDA數(shù)據(jù)分析師認證”是一套專業(yè)化,科學化,國際化,系統(tǒng)化的人才考核標準,分為CDA LEVELⅠ ,LEVEL Ⅱ,LEVEL Ⅲ,涉及金融、電商、醫(yī)療、互聯(lián)網(wǎng)、電信等行業(yè)大數(shù)據(jù)及數(shù)據(jù)分析從業(yè)者所需要具備的技能,符合當今全球大數(shù)據(jù)及數(shù)據(jù)分析技術潮流,為各界企業(yè)、機構提供數(shù)據(jù)分析人才參照標準。
報名方式
登錄CDA認證考試官網(wǎng)注冊報名>>點擊報名
報名費用
Level Ⅰ:1200 RMB
Level Ⅱ:1700 RMB
Level Ⅲ:2000 RMB
考試地點
Level I+II:中國區(qū)30+省市,70+城市,250+考場,考生可就近考場預約考試 >看看我所在的地哪里報名<
Level III:中國區(qū)30所城市,北京/上海/天津/重慶/成都/深圳/廣州/濟南/南京/杭州/蘇州/福州/太原/武漢/長沙/西安/貴陽/鄭州/南寧/昆明/烏魯木齊/沈陽/哈爾濱/合肥/石家莊/呼和浩特/南昌/長春/大連/蘭州>看看我所在的地哪里報名<
報考條件
CDA Level I >了解更多<
? 報考條件:無要求。
? 考試時間:隨報隨考。
CDA Level II >了解更多<
? 報考條件:獲得CDA Level I 認證證書;
? 考試時間:隨報隨考。
CDA Level III >了解更多<
? 報考條件:獲得CDA Level II認證證書
? 考試時間:一年四屆 3月、6月、9月、12月的最后一個周六。
——熱門課程推薦:
推薦學習書籍
《CDA一級教材》適合CDA一級考生備考,也適合業(yè)務及數(shù)據(jù)分析崗位的從業(yè)者提升自我。完整電子版已上線CDA網(wǎng)校,累計已有10萬+在讀~
免費加入閱讀:https://edu.cda.cn/goods/show/3151?targetId=5147&preview=0
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關聯(lián)查詢效率:打破 “拆分必慢” 的認知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預期算子的內(nèi)涵、作用與應用解析 動態(tài)隨機一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構數(shù)據(jù)特征價值的專業(yè)核心 表結(jié)構數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結(jié)構化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實戰(zhàn)應用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應用 在數(shù)據(jù)分析與統(tǒng)計學領域,假設檢驗是驗證研究假設、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構數(shù)據(jù)(以 “行 - 列” 存儲的結(jié)構化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數(shù)量的準確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進行 HTTP 網(wǎng)絡請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構數(shù)據(jù)價值的核心操盤手 表格結(jié)構數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數(shù)據(jù)的科學計數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點數(shù)據(jù)時的科學計數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務數(shù)據(jù)分析是企業(yè)解決日常運營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務邏輯:從規(guī)則拆解到數(shù)據(jù)把關的實戰(zhàn)指南 在業(yè)務系統(tǒng)落地過程中,“業(yè)務邏輯” 是連接 “需求設計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動下的精準零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當下,精準營銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務數(shù)據(jù)分析:概念辨析與協(xié)同價值 在數(shù)據(jù)驅(qū)動決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實踐到業(yè)務價值挖掘 在數(shù)據(jù)分析場景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價值導向 統(tǒng)計模型作為數(shù)據(jù)分析的核心工具,并非簡單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10