
在企業(yè)數(shù)據(jù)分析場景中,單一維度的統(tǒng)計(如 “總銷售額”“用戶總數(shù)”)往往無法滿足業(yè)務決策的深度需求。而 SQL 多個聚合函數(shù)的組合使用(如同時調(diào)用SUM
、COUNT
、AVG
、MAX
等),能幫助 CDA(Certified Data Analyst)數(shù)據(jù)分析師從 “量、率、值、極值” 等多維度拆解數(shù)據(jù),快速挖掘業(yè)務背后的量化規(guī)律。這種分析方式不僅提升了數(shù)據(jù)解讀的全面性,更成為 CDA 分析師連接技術與業(yè)務、輸出精準決策依據(jù)的核心工具。
SQL 聚合函數(shù)是對數(shù)據(jù)進行匯總計算的基礎工具,而 “多個聚合” 并非簡單的函數(shù)疊加,而是結合GROUP BY
(分組)、HAVING
(聚合后篩選)等語法,實現(xiàn) “多指標同步計算 + 維度分層分析” 的高效分析模式。其核心價值體現(xiàn)在三大維度,完美適配企業(yè)業(yè)務決策的需求:
單一聚合函數(shù)僅能回答 “某一個問題”(如SUM(銷售額)
回答 “總賣了多少錢”),而多個聚合可同時輸出 “一組關聯(lián)指標”,完整呈現(xiàn)業(yè)務現(xiàn)狀。例如,零售企業(yè)分析 “各門店銷售表現(xiàn)” 時,可通過SUM(銷售額)
(總營收)、COUNT(訂單ID)
(訂單總量)、AVG(客單價)
(客單價 = 銷售額 / 訂單數(shù))、MAX(單筆金額)
(最高訂單額)四個聚合函數(shù)同步計算,既知曉 “賣了多少”,也清楚 “訂單量如何”“用戶消費能力怎樣”“是否有高價值訂單”,避免因單一指標導致的決策片面性。
結合GROUP BY
與HAVING
,多個聚合函數(shù)可實現(xiàn) “按維度分組計算 + 按聚合結果篩選”,快速定位業(yè)務中的核心群體或異常環(huán)節(jié)。例如,電商平臺分析 “用戶消費行為” 時,按 “用戶等級”(普通 / 銀卡 / 金卡 / 鉆石)分組,同時計算COUNT(DISTINCT 用戶ID)
(該等級用戶數(shù))、SUM(消費金額)
(總消費)、AVG(復購次數(shù))
(平均復購),再通過HAVING SUM(消費金額) > 100萬
篩選高貢獻等級,可直接鎖定 “金卡、鉆石用戶” 為核心客群,為后續(xù)精準運營提供明確方向。
在傳統(tǒng)分析中,若需獲取多維度指標,可能需編寫多段 SQL 分別計算(如先算總銷售額,再算訂單數(shù),最后手動關聯(lián)結果)。而多個聚合函數(shù)可通過一段 SQL 完成多指標計算,大幅減少代碼量與執(zhí)行時間。例如,分析 “月度商品銷售數(shù)據(jù)” 時,一段 SQL 即可同步輸出SUM(銷量)
(總銷量)、AVG(售價)
(平均售價)、MIN(庫存)
(最低庫存)、MAX(上架時間)
(最新上架商品時間),CDA 分析師無需反復操作,將更多精力投入到洞察解讀中。
CDA 分析師對 SQL 多個聚合的運用,始終圍繞 “解決業(yè)務問題” 展開。以下三大核心場景,覆蓋了零售、電商、互聯(lián)網(wǎng)等多行業(yè)的高頻需求,且每個場景均需結合 “多聚合函數(shù) + 分組篩選” 實現(xiàn)深度分析:
企業(yè)日常運營需監(jiān)控 “營收、用戶、效率” 等多維度核心指標,SQL 多個聚合是指標計算的核心工具。以零售企業(yè) “月度運營分析” 為例,CDA 分析師需計算的指標及對應聚合組合如下:
業(yè)務指標 | SQL 聚合函數(shù)組合 | 業(yè)務意義 |
---|---|---|
月度總營收 | SUM(訂單金額) |
整體營收規(guī)模 |
月度訂單總量 | COUNT(DISTINCT 訂單ID) |
訂單增長趨勢 |
月度客單價 | SUM(訂單金額) / COUNT(DISTINCT 訂單ID) (或AVG(訂單金額) ,需排除異常訂單) |
用戶消費能力 |
高價值訂單占比 | SUM(CASE WHEN 訂單金額 > 500 THEN 1 ELSE 0 END) / COUNT(DISTINCT 訂單ID) |
高價值用戶貢獻度 |
庫存周轉效率 | SUM(銷量) / AVG(庫存數(shù)量) |
商品庫存消化速度 |
通過一段 SQL 即可同步輸出上述指標,例如:
SELECT
DATE_FORMAT(下單時間, '%Y-%m') AS 月度,
SUM(訂單金額) AS 月度總營收,
COUNT(DISTINCT 訂單ID) AS 月度訂單總量,
ROUND(SUM(訂單金額)/COUNT(DISTINCT 訂單ID), 2) AS 月度客單價,
ROUND(SUM(CASE WHEN 訂單金額 > 500 THEN 1 ELSE 0 END)/COUNT(DISTINCT 訂單ID), 4) AS 高價值訂單占比,
ROUND(SUM(銷量)/AVG(庫存數(shù)量), 2) AS 庫存周轉效率
FROM 銷售數(shù)據(jù)表
WHERE 下單時間 BETWEEN '2025-01-01' AND '2025-06-30'
GROUP BY 月度
ORDER BY 月度;
該結果可直接用于管理層月度復盤,快速判斷 “營收是否達標”“客單價是否提升”“庫存周轉是否正?!薄?/p>
在用戶運營中,CDA 分析師需通過多個聚合函數(shù)按 “用戶屬性”(如等級、地域、注冊時間)分組,拆解不同群體的行為特征,實現(xiàn)用戶分層。以電商平臺 “用戶復購分析” 為例,目標是找到 “高復購、高消費” 的核心用戶,SQL 聚合組合如下:
SELECT
用戶等級,
COUNT(DISTINCT 用戶ID) AS 用戶數(shù),
AVG(復購次數(shù)) AS 平均復購次數(shù),
SUM(消費金額) AS 總消費金額,
MAX(最近下單時間) AS 最近活躍時間
FROM 用戶消費表
WHERE 注冊時間 < '2025-01-01' -- 篩選老用戶
GROUP BY 用戶等級
HAVING AVG(復購次數(shù)) >= 3 -- 僅保留復購3次以上的群體
ORDER BY 總消費金額 DESC;
分析結果顯示:“鉆石等級用戶” 的平均復購次數(shù)達 5.2 次,總消費金額占老用戶的 45%,且最近活躍時間集中在近 7 天 —— 這一結論直接指導運營團隊針對鉆石用戶推出 “專屬會員日” 活動,進一步提升其復購率。
企業(yè)業(yè)務中常出現(xiàn) “銷量突降”“成本異?!?等問題,CDA 分析師可通過多個聚合函數(shù)對比 “正常周期” 與 “異常周期” 的數(shù)據(jù),定位風險根源。以快消品牌 “某區(qū)域門店成本異?!?為例,通過多個聚合拆解成本構成:
SELECT
門店ID,
SUM(食材成本) AS 總食材成本,
SUM(人力成本) AS 總人力成本,
AVG(單店租金) AS 平均租金,
SUM(食材成本+人力成本+租金) AS 總成本,
SUM(銷售額) AS 總銷售額,
ROUND((總成本/銷售額)*100, 2) AS 成本率
FROM 門店經(jīng)營表
WHERE 經(jīng)營時間 BETWEEN '2025-07-01' AND '2025-07-31' -- 異常月份
GROUP BY 門店ID
HAVING 成本率 > 60% -- 篩選成本率超標的門店
ORDER BY 成本率 DESC;
結果發(fā)現(xiàn):“門店 A01” 的成本率高達 75%,進一步拆解顯示其 “食材成本” 是其他門店的 2 倍,且AVG(食材損耗率)
達 15%(正常門店為 5%)—— 最終定位問題為 “門店 A01 食材存儲不當導致?lián)p耗過高”,企業(yè)據(jù)此優(yōu)化了該門店的食材管理流程,1 個月內(nèi)成本率降至 55%。
SQL 多個聚合雖高效,但實際使用中易因 “分組邏輯混亂”“函數(shù)搭配錯誤” 導致結果偏差。CDA 分析師需掌握三大實操要點,確保分析結果準確且高效:
GROUP BY
是多個聚合的核心,需遵循 “非聚合字段必須包含在 GROUP BY 中” 的規(guī)則(部分數(shù)據(jù)庫如 MySQL 可放寬,但易導致結果不可控)。例如,若需按 “月度” 和 “門店類型” 分組計算銷售額與訂單數(shù),GROUP BY
必須同時包含這兩個字段:
-- 正確寫法
SELECT 月度, 門店類型, SUM(銷售額), COUNT(訂單ID)
FROM 銷售表
GROUP BY 月度, 門店類型;
-- 錯誤寫法(門店類型未在GROUP BY中,結果隨機)
SELECT 月度, 門店類型, SUM(銷售額), COUNT(訂單ID)
FROM 銷售表
GROUP BY 月度;
CDA 分析師需根據(jù)業(yè)務目標確定分組維度,避免 “維度冗余”(如無需分組時強行 GROUP BY)或 “維度缺失”(如漏分組導致數(shù)據(jù)混淆)。
不同聚合函數(shù)的計算邏輯不同,搭配時需符合業(yè)務邏輯:
避免 “無關函數(shù)組合”:如SUM(訂單金額)
與COUNT(用戶ID)
搭配時,需確認 “一個用戶可能有多筆訂單”,避免誤將 “訂單金額總和” 與 “用戶數(shù)” 直接關聯(lián);
用CASE WHEN
實現(xiàn)條件聚合:如需計算 “不同支付方式的銷售額占比”,可通過SUM(CASE WHEN 支付方式='支付寶' THEN 訂單金額 ELSE 0 END)
實現(xiàn),無需多次查詢;
注意數(shù)值精度:用ROUND()
函數(shù)保留合理小數(shù)位(如客單價保留 2 位,占比保留 4 位),避免結果冗長。
WHERE
與HAVING
,精準控制篩選時機WHERE
用于 “聚合前篩選數(shù)據(jù)”(如排除測試訂單),HAVING
用于 “聚合后篩選結果”(如篩選銷售額超 100 萬的門店),二者不可混淆。例如,篩選 “2025 年 Q2 正常訂單中,銷售額超 50 萬的門店”:
-- 正確寫法:WHERE先篩正常訂單,HAVING再篩銷售額
SELECT 門店ID, SUM(訂單金額) AS 總銷售額
FROM 銷售表
WHERE 訂單狀態(tài)='正常' AND 下單時間 BETWEEN '2025-04-01' AND '2025-06-30'
GROUP BY 門店ID
HAVING SUM(訂單金額) > 500000;
-- 錯誤寫法:用WHERE篩選聚合結果(語法錯誤)
SELECT 門店ID, SUM(訂單金額) AS 總銷售額
FROM 銷售表
WHERE 訂單狀態(tài)='正常' AND SUM(訂單金額) > 500000
GROUP BY 門店ID;
某電商平臺 2025 年 Q2 新用戶留存率環(huán)比下降 12%,CDA 分析師通過 SQL 多個聚合函數(shù)拆解留存問題,具體步驟如下:
目標:找到 “留存率低的用戶群體” 及 “影響留存的關鍵行為”;
數(shù)據(jù):新用戶注冊表(含用戶 ID、注冊時間、注冊渠道)、用戶行為表(含用戶 ID、訪問次數(shù)、下單次數(shù)、收藏商品數(shù))、訂單表(含用戶 ID、首單時間、首單金額)。
按 “注冊渠道” 和 “首單行為” 分組,計算留存率相關指標:
SELECT
注冊渠道,
是否首單(CASE WHEN 首單時間 IS NOT NULL THEN '有首單' ELSE '無首單' END),
COUNT(DISTINCT 用戶ID) AS 新用戶總數(shù),
COUNT(DISTINCT CASE WHEN 7天內(nèi)訪問次數(shù) >=1 THEN 用戶ID ELSE NULL END) AS 7天留存用戶數(shù),
ROUND(COUNT(DISTINCT CASE WHEN 7天內(nèi)訪問次數(shù) >=1 THEN 用戶ID ELSE NULL END)/COUNT(DISTINCT 用戶ID), 4) AS 7天留存率,
AVG(首單金額) AS 平均首單金額,
AVG(收藏商品數(shù)) AS 平均收藏數(shù)
FROM 新用戶注冊表
LEFT JOIN 用戶行為表 ON 新用戶注冊表.用戶ID = 用戶行為表.用戶ID
LEFT JOIN 訂單表 ON 新用戶注冊表.用戶ID = 訂單表.用戶ID
WHERE 注冊時間 BETWEEN '2025-04-01' AND '2025-06-30'
GROUP BY 注冊渠道, 是否首單
ORDER BY 7天留存率 DESC;
渠道差異:“短視頻廣告渠道” 的新用戶 7 天留存率僅 18%(其他渠道平均 35%),且 “無首單” 用戶占比達 60%;
行為影響:“有首單” 用戶的 7 天留存率(45%)是 “無首單” 用戶(12%)的 3.75 倍,且首單金額 > 200 元的用戶留存率達 58%;
關聯(lián)行為:“平均收藏數(shù)≥3” 的用戶留存率(42%)顯著高于 “收藏數(shù) = 0” 的用戶(15%)。
基于分析,CDA 分析師提出:
渠道優(yōu)化:減少短視頻廣告的低質投放,重點投放 “社交平臺渠道”(留存率 38%);
首單激勵:對新用戶推出 “首單滿 200 減 50” 活動,提升首單轉化率;
行為引導:新用戶注冊后推送 “收藏商品領優(yōu)惠券” 活動,增加用戶互動。
實施 1 個月后,平臺新用戶 7 天留存率提升至 32%,環(huán)比增長 20%。
在數(shù)據(jù)驅動決策的時代,SQL 多個聚合函數(shù)并非簡單的技術工具,而是 CDA 分析師將 “數(shù)據(jù)” 轉化為 “業(yè)務洞察” 的核心橋梁。它通過多指標同步量化,幫助分析師還原業(yè)務全貌;通過分組篩選,精準定位核心問題;通過高效計算,降低分析成本 —— 這些特性完美契合企業(yè)對 “快速、精準、全面” 的數(shù)據(jù)分析需求。
對于 CDA 分析師而言,掌握 SQL 多個聚合不僅需要熟悉語法規(guī)則,更需具備 “業(yè)務驅動技術” 的思維:明確分析目標后,選擇合適的聚合函數(shù)組合與分組維度,避免陷入 “為技術而技術” 的誤區(qū)。未來,隨著企業(yè)數(shù)據(jù)量的增長與業(yè)務復雜度的提升,SQL 多個聚合將與 AI 建模、可視化工具進一步結合,成為 CDA 分析師推動企業(yè)數(shù)字化轉型的重要能力之一。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉換:從基礎用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關聯(lián)查詢效率:打破 “拆分必慢” 的認知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結構數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結構數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預期算子的內(nèi)涵、作用與應用解析 動態(tài)隨機一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結構數(shù)據(jù)特征價值的專業(yè)核心 表結構數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結構化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實戰(zhàn)應用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應用 在數(shù)據(jù)分析與統(tǒng)計學領域,假設檢驗是驗證研究假設、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結構數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結構數(shù)據(jù)(以 “行 - 列” 存儲的結構化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數(shù)量的準確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進行 HTTP 網(wǎng)絡請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結構數(shù)據(jù)價值的核心操盤手 表格結構數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數(shù)據(jù)的科學計數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點數(shù)據(jù)時的科學計數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務數(shù)據(jù)分析是企業(yè)解決日常運營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務邏輯:從規(guī)則拆解到數(shù)據(jù)把關的實戰(zhàn)指南 在業(yè)務系統(tǒng)落地過程中,“業(yè)務邏輯” 是連接 “需求設計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅動下的精準零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當下,精準營銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務數(shù)據(jù)分析:概念辨析與協(xié)同價值 在數(shù)據(jù)驅動決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實踐到業(yè)務價值挖掘 在數(shù)據(jù)分析場景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價值導向 統(tǒng)計模型作為數(shù)據(jù)分析的核心工具,并非簡單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10