99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

熱線電話:13121318867

登錄
首頁大數(shù)據(jù)時代CDA 數(shù)據(jù)分析師:巧用 SQL 多個聚合函數(shù),解鎖數(shù)據(jù)多維洞察
CDA 數(shù)據(jù)分析師:巧用 SQL 多個聚合函數(shù),解鎖數(shù)據(jù)多維洞察
2025-08-18
收藏

CDA 數(shù)據(jù)分析師:巧用 SQL 多個聚合函數(shù),解鎖數(shù)據(jù)多維洞察

在企業(yè)數(shù)據(jù)分析場景中,單一維度的統(tǒng)計(如 “總銷售額”“用戶總數(shù)”)往往無法滿足業(yè)務決策的深度需求。而 SQL 多個聚合函數(shù)的組合使用(如同時調(diào)用SUM、COUNT、AVG、MAX等),能幫助 CDA(Certified Data Analyst)數(shù)據(jù)分析師從 “量、率、值、極值” 等多維度拆解數(shù)據(jù),快速挖掘業(yè)務背后的量化規(guī)律。這種分析方式不僅提升了數(shù)據(jù)解讀的全面性,更成為 CDA 分析師連接技術與業(yè)務、輸出精準決策依據(jù)的核心工具。

一、SQL 多個聚合的核心價值:從 “單一統(tǒng)計” 到 “多維量化”

SQL 聚合函數(shù)是對數(shù)據(jù)進行匯總計算的基礎工具,而 “多個聚合” 并非簡單的函數(shù)疊加,而是結合GROUP BY(分組)、HAVING(聚合后篩選)等語法,實現(xiàn) “多指標同步計算 + 維度分層分析” 的高效分析模式。其核心價值體現(xiàn)在三大維度,完美適配企業(yè)業(yè)務決策的需求:

1. 多維指標同步量化,還原業(yè)務全貌

單一聚合函數(shù)僅能回答 “某一個問題”(如SUM(銷售額)回答 “總賣了多少錢”),而多個聚合可同時輸出 “一組關聯(lián)指標”,完整呈現(xiàn)業(yè)務現(xiàn)狀。例如,零售企業(yè)分析 “各門店銷售表現(xiàn)” 時,可通過SUM(銷售額)(總營收)、COUNT(訂單ID)(訂單總量)、AVG(客單價)(客單價 = 銷售額 / 訂單數(shù))、MAX(單筆金額)(最高訂單額)四個聚合函數(shù)同步計算,既知曉 “賣了多少”,也清楚 “訂單量如何”“用戶消費能力怎樣”“是否有高價值訂單”,避免因單一指標導致的決策片面性。

2. 分組篩選精準定位,聚焦核心問題

結合GROUP BYHAVING,多個聚合函數(shù)可實現(xiàn) “按維度分組計算 + 按聚合結果篩選”,快速定位業(yè)務中的核心群體或異常環(huán)節(jié)。例如,電商平臺分析 “用戶消費行為” 時,按 “用戶等級”(普通 / 銀卡 / 金卡 / 鉆石)分組,同時計算COUNT(DISTINCT 用戶ID)(該等級用戶數(shù))、SUM(消費金額)(總消費)、AVG(復購次數(shù))(平均復購),再通過HAVING SUM(消費金額) > 100萬篩選高貢獻等級,可直接鎖定 “金卡、鉆石用戶” 為核心客群,為后續(xù)精準運營提供明確方向。

3. 效率提升顯著,降低分析成本

在傳統(tǒng)分析中,若需獲取多維度指標,可能需編寫多段 SQL 分別計算(如先算總銷售額,再算訂單數(shù),最后手動關聯(lián)結果)。而多個聚合函數(shù)可通過一段 SQL 完成多指標計算,大幅減少代碼量與執(zhí)行時間。例如,分析 “月度商品銷售數(shù)據(jù)” 時,一段 SQL 即可同步輸出SUM(銷量)(總銷量)、AVG(售價)(平均售價)、MIN(庫存)(最低庫存)、MAX(上架時間)(最新上架商品時間),CDA 分析師無需反復操作,將更多精力投入到洞察解讀中。

二、CDA 分析師運用 SQL 多個聚合的關鍵場景:業(yè)務驅動的實戰(zhàn)落地

CDA 分析師對 SQL 多個聚合的運用,始終圍繞 “解決業(yè)務問題” 展開。以下三大核心場景,覆蓋了零售、電商、互聯(lián)網(wǎng)等多行業(yè)的高頻需求,且每個場景均需結合 “多聚合函數(shù) + 分組篩選” 實現(xiàn)深度分析:

1. 業(yè)務核心指標計算:構建完整的指標體系

企業(yè)日常運營需監(jiān)控 “營收、用戶、效率” 等多維度核心指標,SQL 多個聚合是指標計算的核心工具。以零售企業(yè) “月度運營分析” 為例,CDA 分析師需計算的指標及對應聚合組合如下:

業(yè)務指標 SQL 聚合函數(shù)組合 業(yè)務意義
月度總營收 SUM(訂單金額) 整體營收規(guī)模
月度訂單總量 COUNT(DISTINCT 訂單ID) 訂單增長趨勢
月度客單價 SUM(訂單金額) / COUNT(DISTINCT 訂單ID)(或AVG(訂單金額),需排除異常訂單) 用戶消費能力
高價值訂單占比 SUM(CASE WHEN 訂單金額 > 500 THEN 1 ELSE 0 END) / COUNT(DISTINCT 訂單ID) 高價值用戶貢獻度
庫存周轉效率 SUM(銷量) / AVG(庫存數(shù)量) 商品庫存消化速度

通過一段 SQL 即可同步輸出上述指標,例如:

SELECT

 DATE_FORMAT(下單時間, '%Y-%m') AS 月度,

 SUM(訂單金額) AS 月度總營收,

 COUNT(DISTINCT 訂單ID) AS 月度訂單總量,

 ROUND(SUM(訂單金額)/COUNT(DISTINCT 訂單ID), 2) AS 月度客單價,

 ROUND(SUM(CASE WHEN 訂單金額 > 500 THEN 1 ELSE 0 END)/COUNT(DISTINCT 訂單ID), 4) AS 高價值訂單占比,

 ROUND(SUM(銷量)/AVG(庫存數(shù)量), 2) AS 庫存周轉效率

FROM 銷售數(shù)據(jù)表

WHERE 下單時間 BETWEEN '2025-01-01' AND '2025-06-30'

GROUP BY 月度

ORDER BY 月度;

該結果可直接用于管理層月度復盤,快速判斷 “營收是否達標”“客單價是否提升”“庫存周轉是否正?!薄?/p>

2. 用戶分層分析:精準定位高價值群體

在用戶運營中,CDA 分析師需通過多個聚合函數(shù)按 “用戶屬性”(如等級、地域、注冊時間)分組,拆解不同群體的行為特征,實現(xiàn)用戶分層。以電商平臺 “用戶復購分析” 為例,目標是找到 “高復購、高消費” 的核心用戶,SQL 聚合組合如下:

SELECT

 用戶等級,

 COUNT(DISTINCT 用戶ID) AS 用戶數(shù),

 AVG(復購次數(shù)) AS 平均復購次數(shù),

 SUM(消費金額) AS 總消費金額,

 MAX(最近下單時間) AS 最近活躍時間

FROM 用戶消費表

WHERE 注冊時間 < '2025-01-01' -- 篩選老用戶

GROUP BY 用戶等級

HAVING AVG(復購次數(shù)) >= 3 -- 僅保留復購3次以上的群體

ORDER BY 總消費金額 DESC;

分析結果顯示:“鉆石等級用戶” 的平均復購次數(shù)達 5.2 次,總消費金額占老用戶的 45%,且最近活躍時間集中在近 7 天 —— 這一結論直接指導運營團隊針對鉆石用戶推出 “專屬會員日” 活動,進一步提升其復購率。

3. 異常數(shù)據(jù)監(jiān)控:快速定位業(yè)務風險點

企業(yè)業(yè)務中常出現(xiàn) “銷量突降”“成本異?!?等問題,CDA 分析師可通過多個聚合函數(shù)對比 “正常周期” 與 “異常周期” 的數(shù)據(jù),定位風險根源。以快消品牌 “某區(qū)域門店成本異?!?為例,通過多個聚合拆解成本構成:

SELECT

 門店ID,

 SUM(食材成本) AS 總食材成本,

 SUM(人力成本) AS 總人力成本,

 AVG(單店租金) AS 平均租金,

 SUM(食材成本+人力成本+租金) AS 總成本,

 SUM(銷售額) AS 總銷售額,

 ROUND((總成本/銷售額)*100, 2) AS 成本率

FROM 門店經(jīng)營表

WHERE 經(jīng)營時間 BETWEEN '2025-07-01' AND '2025-07-31' -- 異常月份

GROUP BY 門店ID

HAVING 成本率 > 60% -- 篩選成本率超標的門店

ORDER BY 成本率 DESC;

結果發(fā)現(xiàn):“門店 A01” 的成本率高達 75%,進一步拆解顯示其 “食材成本” 是其他門店的 2 倍,且AVG(食材損耗率)達 15%(正常門店為 5%)—— 最終定位問題為 “門店 A01 食材存儲不當導致?lián)p耗過高”,企業(yè)據(jù)此優(yōu)化了該門店的食材管理流程,1 個月內(nèi)成本率降至 55%。

三、CDA 分析師運用 SQL 多個聚合的實操要點:避坑與效率提升

SQL 多個聚合雖高效,但實際使用中易因 “分組邏輯混亂”“函數(shù)搭配錯誤” 導致結果偏差。CDA 分析師需掌握三大實操要點,確保分析結果準確且高效:

1. 明確 “分組維度” 與 “聚合指標” 的對應關系

GROUP BY是多個聚合的核心,需遵循 “非聚合字段必須包含在 GROUP BY 中” 的規(guī)則(部分數(shù)據(jù)庫如 MySQL 可放寬,但易導致結果不可控)。例如,若需按 “月度” 和 “門店類型” 分組計算銷售額與訂單數(shù),GROUP BY必須同時包含這兩個字段

-- 正確寫法

SELECT 月度, 門店類型, SUM(銷售額), COUNT(訂單ID)

FROM 銷售表

GROUP BY 月度, 門店類型;

-- 錯誤寫法(門店類型未在GROUP BY中,結果隨機)

SELECT 月度, 門店類型, SUM(銷售額), COUNT(訂單ID)

FROM 銷售表

GROUP BY 月度;

CDA 分析師需根據(jù)業(yè)務目標確定分組維度,避免 “維度冗余”(如無需分組時強行 GROUP BY)或 “維度缺失”(如漏分組導致數(shù)據(jù)混淆)。

2. 合理搭配聚合函數(shù),避免邏輯沖突

不同聚合函數(shù)的計算邏輯不同,搭配時需符合業(yè)務邏輯:

  • 避免 “無關函數(shù)組合”:如SUM(訂單金額)COUNT(用戶ID)搭配時,需確認 “一個用戶可能有多筆訂單”,避免誤將 “訂單金額總和” 與 “用戶數(shù)” 直接關聯(lián);

  • CASE WHEN實現(xiàn)條件聚合:如需計算 “不同支付方式的銷售額占比”,可通過SUM(CASE WHEN 支付方式='支付寶' THEN 訂單金額 ELSE 0 END)實現(xiàn),無需多次查詢;

  • 注意數(shù)值精度:用ROUND()函數(shù)保留合理小數(shù)位(如客單價保留 2 位,占比保留 4 位),避免結果冗長。

3. 區(qū)分WHEREHAVING,精準控制篩選時機

WHERE用于 “聚合前篩選數(shù)據(jù)”(如排除測試訂單),HAVING用于 “聚合后篩選結果”(如篩選銷售額超 100 萬的門店),二者不可混淆。例如,篩選 “2025 年 Q2 正常訂單中,銷售額超 50 萬的門店”:

-- 正確寫法:WHERE先篩正常訂單,HAVING再篩銷售額

SELECT 門店ID, SUM(訂單金額) AS 總銷售額

FROM 銷售表

WHERE 訂單狀態(tài)='正常' AND 下單時間 BETWEEN '2025-04-01' AND '2025-06-30'

GROUP BY 門店ID

HAVING SUM(訂單金額) > 500000;

-- 錯誤寫法:用WHERE篩選聚合結果(語法錯誤)

SELECT 門店ID, SUM(訂單金額) AS 總銷售額

FROM 銷售表

WHERE 訂單狀態(tài)='正常' AND SUM(訂單金額) > 500000

GROUP BY 門店ID;

四、實踐案例:CDA 分析師用 SQL 多個聚合解決電商 “用戶留存率低” 問題

某電商平臺 2025 年 Q2 新用戶留存率環(huán)比下降 12%,CDA 分析師通過 SQL 多個聚合函數(shù)拆解留存問題,具體步驟如下:

1. 明確分析目標與數(shù)據(jù)范圍

目標:找到 “留存率低的用戶群體” 及 “影響留存的關鍵行為”;

數(shù)據(jù):新用戶注冊表(含用戶 ID、注冊時間、注冊渠道)、用戶行為表(含用戶 ID、訪問次數(shù)、下單次數(shù)、收藏商品數(shù))、訂單表(含用戶 ID、首單時間、首單金額)。

2. 用多個聚合拆解留存用戶特征

按 “注冊渠道” 和 “首單行為” 分組,計算留存率相關指標:

SELECT

 注冊渠道,

 是否首單(CASE WHEN 首單時間 IS NOT NULL THEN '有首單' ELSE '無首單' END),

 COUNT(DISTINCT 用戶ID) AS 新用戶總數(shù),

 COUNT(DISTINCT CASE WHEN 7天內(nèi)訪問次數(shù) >=1 THEN 用戶ID ELSE NULL END) AS 7天留存用戶數(shù),

 ROUND(COUNT(DISTINCT CASE WHEN 7天內(nèi)訪問次數(shù) >=1 THEN 用戶ID ELSE NULL END)/COUNT(DISTINCT 用戶ID), 4) AS 7天留存率,

 AVG(首單金額) AS 平均首單金額,

 AVG(收藏商品數(shù)) AS 平均收藏數(shù)

FROM 新用戶注冊表

LEFT JOIN 用戶行為表 ON 新用戶注冊表.用戶ID = 用戶行為表.用戶ID

LEFT JOIN 訂單表 ON 新用戶注冊表.用戶ID = 訂單表.用戶ID

WHERE 注冊時間 BETWEEN '2025-04-01' AND '2025-06-30'

GROUP BY 注冊渠道, 是否首單

ORDER BY 7天留存率 DESC;

3. 分析結果定位核心問題

  • 渠道差異:“短視頻廣告渠道” 的新用戶 7 天留存率僅 18%(其他渠道平均 35%),且 “無首單” 用戶占比達 60%;

  • 行為影響:“有首單” 用戶的 7 天留存率(45%)是 “無首單” 用戶(12%)的 3.75 倍,且首單金額 > 200 元的用戶留存率達 58%;

  • 關聯(lián)行為:“平均收藏數(shù)≥3” 的用戶留存率(42%)顯著高于 “收藏數(shù) = 0” 的用戶(15%)。

4. 輸出決策建議

基于分析,CDA 分析師提出:

  • 渠道優(yōu)化:減少短視頻廣告的低質投放,重點投放 “社交平臺渠道”(留存率 38%);

  • 首單激勵:對新用戶推出 “首單滿 200 減 50” 活動,提升首單轉化率;

  • 行為引導:新用戶注冊后推送 “收藏商品領優(yōu)惠券” 活動,增加用戶互動。

實施 1 個月后,平臺新用戶 7 天留存率提升至 32%,環(huán)比增長 20%。

五、總結:SQL 多個聚合 ——CDA 分析師的 “多維洞察利器”

在數(shù)據(jù)驅動決策的時代,SQL 多個聚合函數(shù)并非簡單的技術工具,而是 CDA 分析師將 “數(shù)據(jù)” 轉化為 “業(yè)務洞察” 的核心橋梁。它通過多指標同步量化,幫助分析師還原業(yè)務全貌;通過分組篩選,精準定位核心問題;通過高效計算,降低分析成本 —— 這些特性完美契合企業(yè)對 “快速、精準、全面” 的數(shù)據(jù)分析需求。

對于 CDA 分析師而言,掌握 SQL 多個聚合不僅需要熟悉語法規(guī)則,更需具備 “業(yè)務驅動技術” 的思維:明確分析目標后,選擇合適的聚合函數(shù)組合與分組維度,避免陷入 “為技術而技術” 的誤區(qū)。未來,隨著企業(yè)數(shù)據(jù)量的增長與業(yè)務復雜度的提升,SQL 多個聚合將與 AI 建模、可視化工具進一步結合,成為 CDA 分析師推動企業(yè)數(shù)字化轉型的重要能力之一。

學習入口:https://edu.cda.cn/goods/show/3814?targetId=6587&preview=0

推薦學習書籍 《CDA一級教材》適合CDA一級考生備考,也適合業(yè)務及數(shù)據(jù)分析崗位的從業(yè)者提升自我。完整電子版已上線CDA網(wǎng)校,累計已有10萬+在讀~ !

免費加入閱讀:https://edu.cda.cn/goods/show/3151?targetId=5147&preview=0

數(shù)據(jù)分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數(shù)據(jù)分析師資訊
更多

OK
客服在線
立即咨詢
客服在線
立即咨詢
') } function initGt() { var handler = function (captchaObj) { captchaObj.appendTo('#captcha'); captchaObj.onReady(function () { $("#wait").hide(); }).onSuccess(function(){ $('.getcheckcode').removeClass('dis'); $('.getcheckcode').trigger('click'); }); window.captchaObj = captchaObj; }; $('#captcha').show(); $.ajax({ url: "/login/gtstart?t=" + (new Date()).getTime(), // 加隨機數(shù)防止緩存 type: "get", dataType: "json", success: function (data) { $('#text').hide(); $('#wait').show(); // 調(diào)用 initGeetest 進行初始化 // 參數(shù)1:配置參數(shù) // 參數(shù)2:回調(diào),回調(diào)的第一個參數(shù)驗證碼對象,之后可以使用它調(diào)用相應的接口 initGeetest({ // 以下 4 個配置參數(shù)為必須,不能缺少 gt: data.gt, challenge: data.challenge, offline: !data.success, // 表示用戶后臺檢測極驗服務器是否宕機 new_captcha: data.new_captcha, // 用于宕機時表示是新驗證碼的宕機 product: "float", // 產(chǎn)品形式,包括:float,popup width: "280px", https: true // 更多配置參數(shù)說明請參見:http://docs.geetest.com/install/client/web-front/ }, handler); } }); } function codeCutdown() { if(_wait == 0){ //倒計時完成 $(".getcheckcode").removeClass('dis').html("重新獲取"); }else{ $(".getcheckcode").addClass('dis').html("重新獲取("+_wait+"s)"); _wait--; setTimeout(function () { codeCutdown(); },1000); } } function inputValidate(ele,telInput) { var oInput = ele; var inputVal = oInput.val(); var oType = ele.attr('data-type'); var oEtag = $('#etag').val(); var oErr = oInput.closest('.form_box').next('.err_txt'); var empTxt = '請輸入'+oInput.attr('placeholder')+'!'; var errTxt = '請輸入正確的'+oInput.attr('placeholder')+'!'; var pattern; if(inputVal==""){ if(!telInput){ errFun(oErr,empTxt); } return false; }else { switch (oType){ case 'login_mobile': pattern = /^1[3456789]\d{9}$/; if(inputVal.length==11) { $.ajax({ url: '/login/checkmobile', type: "post", dataType: "json", data: { mobile: inputVal, etag: oEtag, page_ur: window.location.href, page_referer: document.referrer }, success: function (data) { } }); } break; case 'login_yzm': pattern = /^\d{6}$/; break; } if(oType=='login_mobile'){ } if(!!validateFun(pattern,inputVal)){ errFun(oErr,'') if(telInput){ $('.getcheckcode').removeClass('dis'); } }else { if(!telInput) { errFun(oErr, errTxt); }else { $('.getcheckcode').addClass('dis'); } return false; } } return true; } function errFun(obj,msg) { obj.html(msg); if(msg==''){ $('.login_submit').removeClass('dis'); }else { $('.login_submit').addClass('dis'); } } function validateFun(pat,val) { return pat.test(val); }