
一、單選題
1.統(tǒng)計圖中的散點圖主要用來( A )。
A.觀察變量之間的相關關系 B.主要用來表示總體各部分所占的比例
C.主要用來表示次數分布 D.主要用來反映分類數據的頻數分布
2.抽樣誤差是指( D )
A.在調查過程中由于觀察、測量等差錯所引起的誤差
B.人為原因所造成的誤差
C.在調查中違反隨機原則出現的系統(tǒng)誤差
D.隨機抽樣而產生的代表性誤差
3.檢查異常值常用的統(tǒng)計圖形:( B )
A、條形圖
B、箱體圖
C、帕累托圖
D、線圖
4.線性回歸里的殘差分析不可能用于診斷( D )
A、殘差獨立性
B、變量分布
C、異常值偵察
D、最大迭代次數
5.擬合logistic回歸模型時有兩個分類變量,分別是Gender(水平為female和male),Class(水平為1 、2和3),下表為輸出結果,下面哪個選項的說法是正確的?(C)
A.變量Gender和Class采用效應編碼
B.變量Gender采用引用編碼,引用水平為female
C.變量Class采用引用編碼,引用水平為3
D.變量Gender和Class采用全量編碼
6.因子分析的主要作用:( A )
A、對變量進行降維
B、對變量進行判別
C、對變量進行聚類
D、以上都不對
7.關于K-means 聚類過程正確的是:( A )
A、使用的是迭代的方法
B、均適用于對變量和個案的聚類
C、對變量進行聚類
D、以上都不對
8.東北人養(yǎng)了一只雞和一頭豬。一天雞問豬:"主人呢?"豬說:"出去買蘑菇了。"雞聽了撒丫子就跑。豬說:"你跑什么?"雞叫道:“有本事主人買粉條的時候你小子別跑!"
以上對話體現了數據分析方法中的( A )
9.已知甲班學生“統(tǒng)計學”的平均成績?yōu)?6分,標準差是12.8分,乙班學生“統(tǒng)計學”的平均成績是90分,標準差是10.3分,下列表述正確的是( A )
A. 乙班平均成績的代表性高于甲班
B. 甲班平均成績的代表性高于乙班
C. 甲、乙兩班平均成績的代表性相同
D. 甲、乙兩班平均成績的代表性無法比較
10.根據樣本資料估計得出人均消費支出Y對人均收入X的回歸模型,表明人均收入每增加1%,人均消費支出將增加( B )
A. 0.2% B. 0.75% C. 2% D. 7.5%
11.某企業(yè)根據對顧客隨機抽樣的信息得到對該企業(yè)產品表示滿意的顧客比率的95%置信度的置信區(qū)間是(56%,64%)。下列正確的表述是( A )
A.總體比率的95%置信度的置信區(qū)間為(56%,64%)
B.總體真實比率有95%的可能落在(56%,64%)中
C.區(qū)間(56%,64%)有95%的概率包含了總體真實比率
D.由100次抽樣構造的100個置信區(qū)間中,約有95個覆蓋了總體真實比率
12.以下哪個語句可以將字符型數值date(示例:“2001-02-19”)轉換為數值類型? ( A )
A、INPUT(date,YYMMDD10.)
B、PUT(date,YYMMDD10)
C、INPUT(date,YYMMDD10.)
D、PUT(date,YYMMDD10)
13. ,取值范圍在[0,1],反映回歸曲線的擬合優(yōu)度,當
趨近于0,則回歸曲線擬合優(yōu)度( B )
A.越好 B. 越差 C. 適中 D. 以上都不對
14.分析購買不同產品的頻次時,使用以下哪個任務? ( D )
A、列表數據
B、匯總表
C、匯總統(tǒng)計量
D、單因子頻數
15.當你用跑步時間(RunTime)、年齡(Age)、跑步時脈搏(Run_Pulse)以及最高脈搏(Maximum_Pulse)作為預測變量來對耗氧量(Oxygen_Consumption )進行回歸時,年齡(Age)的參數估計是-2.78. 這意味著什么?( B )
A、年齡每增加一歲,耗氧量就增大2.78.
B、年齡每增加一歲,耗氧量就降低2.78.
C、年齡每增加2.78歲,耗氧量就翻倍。
D、年齡每減少2.78歲,耗氧量就翻倍。
16.ROC曲線凸向哪個角,代表模型約理想?( A )
A、左上角
B、左下角
C、右上角
D、右下角
17.在所有兩位數(10-99)中任取一兩位數,則此數能被2或3整除的概率為 ( B )
A. 6/5 B. 2/3 C. 83/100 D.均不對
18.對事件A和B,下列正確的命題是 ( D )
A.如A,B互斥,則,
也互斥
B. 如A,B相容,則,
也相容
C. 如A,B互斥,且P(A)>0,P(B)>0,則A.B獨立
D. 如A,B獨立,則,
也獨立
19.擲二枚骰子,事件A為出現的點數之和等于3的概率為 ( B )
A.1/11 B. 1/18 C. 1/6 D. 都不對
20.A和B兩事件,若 P(AUB)=0.8,P(A)=0.2,P()=0.4 則下列 ( B )成立。
A. P()=0.32 B. P(
)=0.2
C. P(AB)=0.4 D. P()=0.48
21.隨機地擲一骰子兩次,則兩次出現的點數之和等于8的概率為 ( C )
A. 3/36 B. 4/36 C. 5/36 D. 2/36
22.抽樣推斷中,可計算和控制的誤差是 ( D )
A.登記誤差 B.系統(tǒng)性誤差(偏差)
C.抽樣實際誤差 D.抽樣平均誤差
23.假設檢驗中顯著性水平是 ( B )
A.推斷時犯取偽錯誤的概率 B.推斷時犯取偽棄真的概率
C.正確推斷的概率 D.推斷時視情況而定
24.抽樣調查中,無法消除的誤差是 ( A )
A.隨機誤差 B.工作誤差 C.登記誤差 D.偏差
25.當時,兩個相關變量 ( C )
A.低度相關 B.中度相關
C.高度相關 D.不相關
26.描述一組對稱(或正態(tài))分布資料的離散趨勢時,最適宜選擇的指標是(B)
A.極差 B.標準差 C.均數 D.變異系數
27.以下指標中那一項可用來描述計量資料離散程度(D)
A.算術均數 B.幾何均數 C.中位數 D.極差
28.偏態(tài)分布資料宜用下面那一項描述其分布的集中趨勢(C)
A.算術均數 B.標準差 C.中位數 D.四分位數間距
29.下面那一項可用于比較身高和體重的變異度(C)
30.正態(tài)曲線下,橫軸上從均數到+∞的面積為(C)
A.97.5% B.95% C.50% D.5%
31.橫軸上,標準正態(tài)曲線下從0到1.96的面積為: (D)
A.95% B.45% C.97.5% D.47.5%
32.下面那一項分布的資料,均數等于中位數。(D)
A.對數正態(tài) B.左偏態(tài) C.右偏態(tài) D.正態(tài)
33.K-均值類別偵測要求輸入的數據類型必須是( B )。
A整型 B數值型 C字符型 D邏輯型
34.某一特定的X水平上,總體Y分布的離散度越大,即σ2越大,則( A )。
A.預測區(qū)間越寬,精度越低 B.預測區(qū)間越寬,預測誤差越小
C 預測區(qū)間越窄,精度越高 D.預測區(qū)間越窄,預測誤差越大
35.如果X和Y在統(tǒng)計上獨立,則相關系數等于( C )。
A.1 B.-1 C.0 D.∞
36.根據決定系數R2與F統(tǒng)計量的關系可知,當R2=1時,有( D )。
A.F=1 B.F=-1 C.F=0 D.F=∞
37.假設兩變量線性相關,兩變量是等距或等比的數據,但不呈正態(tài)分布,計算它們的相關系數時應選用( B )。
A. 積差相關 B.斯皮爾曼等級相關
C.二列相關 D.點二列相關
38.回歸模型中,關于檢驗
所用的統(tǒng)計量
,下列說法正確的是( D )。
A.服從 B.服從
C.服從 D.服從
39.下面有關HAVING子句描述錯誤的是(B)。
A:HAVING子句必須與GROUP BY 子句同時使用,不能單獨使用
B:使用HAVING子句的同時不能使用WHERE子句
C:使用HAVING子句的同時可以使用WHERE子句
D:使用HAVING子句的作用是限定分組的條件
40. 是( C )分布的密度函數。
A.指數 B. 二項 C. 均勻 D. 泊松
41.根據判定系數R2與F統(tǒng)計量的關系可知,當R2=1時有( C )。
A.F=1 B.F=-1 C.F=∞ D.F=0
42.在SQL查詢時,使用WHERE子句指出的是(C)。
A:查詢目標
B:查詢結果
C:查詢條件
D:查詢視圖
43.SQL查詢語句中HAVING子句的作用是(C)。
A:指出分組查詢的范圍
B:指出分組查詢的值
C:指出分組查詢的條件
D:指出分組查詢的字段
44.SQL的數據操作語句不包括(D)。
A:INSERT
B:UPDATE
C:DELETE
D:CHANGE
45.SQL語句中查詢條件短語的關鍵字是(A)。
A:WHERE
B:FOR
C:WHILE
D:CONDITION
A:MODIFY TABLE
B:MODIFY STRUCTURE
C:ALTER TABLE
D:ALTER STRUCTURE
47.SQL語句中刪除表的命令是(A)。
A:DROP TABLE
B:DELETE TABLE
C:ERASE TABLE
D:DELETE DBF
二、多選題
48.相關有以下幾種(ABC)。
A.正相關 B.負相關 C.零相關 D.常相關
49.相關系數的取值可以是(ABC)。
A. 0 B.-1 C. 1 D. 2
50.某種產品的生產總費用2003年為50萬元,比2002年多2萬元,而單位產品成本2003年比2002年降低5%,則( ACDE )
A、生產費用總指數為104.17% B、生產費用指數為108.56%
C、單位成本指數為95% D、產量指數為109.65%
E、由于成本降低而節(jié)約的生產費用為2.63萬元
51.三個地區(qū)同一種商品的價格報告期為基期的108%,這個指數是( BE )
A、個體指數 B、總指數 C、綜合指數
D、平均數指數 E、質量指標指數
52.有關數據庫的說法正確的是(ABCD)
A.元數據是描述數據的數據
B.使用索引可以快速訪問數據庫中的數據,所以可以在數據庫中盡量多的建立索引
C.數據庫中一行叫做記錄
D.數據庫中的每一個項目叫做字段
53.統(tǒng)計數據按來源分類,可以分為(BD)
A.類別數據 B.二手數據
C.序列數據 D.一手數據
E.數值數據
53.以下哪些變量代表RFM方法中的M:( AB )
A.最近3期境外消費金額
B.最近6期網銀平均消費金額
C.信用卡的消費額度
D.距最近一次逾期的月數
54.在作邏輯回歸時,如果區(qū)域這個變量,當Region=A時Y取值均為1,無法確定是否出現的是哪個問題?(ABD)
A. 共線性
B. 異常值
C. 擬完全分離(Quasi-complete separation)
D. 缺失值
55.下列Z值( BCD )可以被認為是異常值。
A、0 B、-3 C、6 D、10
56.下列問題( ABC )使用參數檢驗分析方法。
A、評估燈泡使用壽命 B、檢驗食品某種成分的含量
C、全國小學一年級學生一學期的平均課外作業(yè)時間 D、全國省市小康指數高低
57.兩獨立樣本t檢驗的前提( ABC )
A、樣本來自的總體服從或近似服從正態(tài)分布 B、兩樣本相互獨立
C、兩樣本的數量可以不相等 D、兩樣本的數量相等
58.兩配對樣本t檢驗的前提( ABD )
A、樣本來自的總體服從或近似服從正態(tài)分布 B、兩樣本觀察值的先后順序一一對應
C、兩樣本的數量可以不相等 D、兩樣本的數量相等
59.下面給出的t檢驗的結果,( CD )表明接受原假設,顯著性水平為0.05。
A、0.000 B、0.039 C、0.092 D、0.124
60.方差分析的基本假設前提包括( AC )
A、各總體服從正態(tài)分布 B、各總體相互獨立
61.下列( ABC )屬于多選項問題。
A、購買保險原因調查 B、高考志愿調查
C、儲蓄原因調查 D、各省市現代化指數分析
A、凝聚方式聚類 B、分解方式聚類 C、Q型聚類 D、R型聚類
——學數據分析技能一定要了解的大廠入門券,CDA數據分析師認證證書!
CDA(數據分析師認證),與CFA相似,由國際范圍內數據科學領域行業(yè)專家、學者及知名企業(yè)共同制定并修訂更新,迅速發(fā)展成行業(yè)內長期而穩(wěn)定的全球大數據及數據分析人才標準,具有專業(yè)化、科學化、國際化、系統(tǒng)化等特性。
同時,CDA全棧考試布局和認證體系已得社會認可,并由為IBM、華為等提供全球認證服務的Pearson VUE面向全球提供靈活的考試服務。
報名方式
登錄CDA認證考試官網注冊報名>>點擊報名
報名費用
Level Ⅰ:1200 RMB
Level Ⅱ:1700 RMB
Level Ⅲ:2000 RMB
考試地點
Level Ⅰ + Level Ⅱ:中國區(qū)30+省市,70+城市,250+考場,考生可就近考場預約考試 >看看我所在的地哪里報名<
Level Ⅲ:中國區(qū)30所城市,北京/上海/天津/重慶/成都/深圳/廣州/濟南/南京/杭州/蘇州/福州/太原/武漢/長沙/西安/貴陽/鄭州/南寧/昆明/烏魯木齊/沈陽/哈爾濱/合肥/石家莊/呼和浩特/南昌/長春/大連/蘭州>看看我所在的地哪里報名<
報考條件
CDA Level I >了解更多<
? 報考條件:無要求。
? 考試時間:隨報隨考。
CDA Level II >了解更多<
? 報考條件:獲得CDA Level Ⅰ認證證書;
? 考試時間:隨報隨考。
CDA Level III >了解更多<
? 報考條件:獲得CDA Level Ⅱ認證證書;
? 考試時間:一年四屆 3月、6月、9月、12月的最后一個周六。
推薦學習書籍
《CDA一級教材》適合CDA一級考生備考,也適合業(yè)務及數據分析崗位的從業(yè)者提升自我。完整電子版已上線CDA網校,累計已有10萬+在讀~
免費加入閱讀:https://edu.cda.cn/goods/show/3151?targetId=5147&preview=0
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關鍵? 在循環(huán)神經網絡(RNN)家族中,長短期記憶網絡(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數據分析師報考條件詳解與準備指南? ? 在數據驅動決策的時代浪潮下,CDA 數據分析師認證愈發(fā)受到矚目,成為眾多有志投身數 ...
2025-07-11數據透視表中兩列相乘合計的實用指南? 在數據分析的日常工作中,數據透視表憑借其強大的數據匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認 ...
2025-07-10BI 大數據分析師:連接數據與業(yè)務的價值轉化者? ? 在大數據與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預測分析中的應用:從數據查詢到趨勢預判? ? 在數據驅動決策的時代,預測分析作為挖掘數據潛在價值的核心手段,正被廣泛 ...
2025-07-10數據查詢結束后:分析師的收尾工作與價值深化? ? 在數據分析的全流程中,“query end”(查詢結束)并非工作的終點,而是將數 ...
2025-07-10CDA 數據分析師考試:從報考到取證的全攻略? 在數字經濟蓬勃發(fā)展的今天,數據分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗:捕捉數據背后的時間軌跡? 在數據分析的版圖中,單樣本趨勢性檢驗如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數據類型:時間維度的精準切片? ? 在數據的世界里,時間是最不可或缺的維度之一,而year_month數據類型就像一把精準 ...
2025-07-09CDA 備考干貨:Python 在數據分析中的核心應用與實戰(zhàn)技巧? ? 在 CDA 數據分析師認證考試中,Python 作為數據處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗:數據趨勢與突變分析的有力工具? ? ? 在數據分析的廣袤領域中,準確捕捉數據的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數據分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數據分析師認證作為國內權威的數據分析能力認證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應對策略? 長短期記憶網絡(LSTM)作為循環(huán)神經網絡(RNN)的一種變體,憑借獨特的門控機制,在 ...
2025-07-07統(tǒng)計學方法在市場調研數據中的深度應用? 市場調研是企業(yè)洞察市場動態(tài)、了解消費者需求的重要途徑,而統(tǒng)計學方法則是市場調研數 ...
2025-07-07CDA數據分析師證書考試全攻略? 在數字化浪潮席卷全球的當下,數據已成為企業(yè)決策、行業(yè)發(fā)展的核心驅動力,數據分析師也因此成為 ...
2025-07-07剖析 CDA 數據分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數據分析師考試作為衡量數據專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉日期:解鎖數據處理的關鍵技能? 在數據處理與分析工作中,數據格式的規(guī)范性是保證后續(xù)分析準確性的基礎 ...
2025-07-04CDA 數據分析師視角:從數據迷霧中探尋商業(yè)真相? 在數字化浪潮席卷全球的今天,數據已成為企業(yè)決策的核心驅動力,CDA(Certifie ...
2025-07-04CDA 數據分析師:開啟數據職業(yè)發(fā)展新征程? ? 在數據成為核心生產要素的今天,數據分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03