2020-08-29
閱讀量:
1097
SEMMA范式
e.g. 常見的數據分析路徑之一是SAS公司提出的SEMMA范式:
1. Sample,數據抽樣,保證數據的效度和信度;
效度是指數據的準確性,也指選擇的數據和分析目標及業(yè)務目標是吻合的;
信度是指數據的穩(wěn)定性,要保證樣本數據有代表性,且在一定周期內不能有過大的波動(否則模型不穩(wěn)定);
2. Explore,數據特征探索及預處理,e.g. 看數據的分布情況、對數據進行標準化等;
3. Modefy,明確問題、模型選擇、方案調整;
4. Model,執(zhí)行建模方案;
5. Assess,結果評估(準確性、穩(wěn)定性、是否符合業(yè)務預期、效益如何)






評論(0)


暫無數據
推薦帖子
0條評論
0條評論
0條評論