
Excel繪制指定區(qū)間的正態(tài)分布曲線下面積圖
正態(tài)分布曲線下面積是很有實際應(yīng)用價值的。在工程能力指數(shù)的評估、產(chǎn)品質(zhì)量分析和教育評估分析方面都發(fā)揮了很大作用。
在正態(tài)分布的密度函數(shù)中有上述兩個常數(shù):算數(shù)平均數(shù)μ和標準差σ。正態(tài)分布的值有99.74%落在(μ-3σ,μ+3σ)區(qū)間內(nèi),也就是說落在以平均值為中心的左右各3個σ(共六個σ)的范圍內(nèi),所謂管理學(xué)中的“三西格瑪”或“六西格瑪”就源于此。Excel中可以使用正態(tài)分布的密度函數(shù)NORMDIST(x,μ,σ,邏輯值),來表達正態(tài)分布,其中:x —“值”,是要求分布的隨機變量數(shù)值;μ—“平均數(shù)”,是分布的算數(shù)平均數(shù);σ—“標準差”,是分布的標準差;邏輯值—“積累與否”,是決定函數(shù)的邏輯值,其中取值為 “TRUE”(真),則返回累計分布函數(shù);取“FALSE”(偽),則NORMDIST會返回正態(tài)分布函數(shù)的高度。如果為了繪制正態(tài)分布曲線,就要取“FALSE”。
Mly網(wǎng)友來信問起我在《Excel:正態(tài)分布函數(shù)曲線下的面積及其應(yīng)用》中的圖-3. μ=60,σ=15,在(-∞,55)的正態(tài)分布曲線二維面積圖(藍斜紋)如下圖,是如何繪制的。
這篇《Excel:正態(tài)分布函數(shù)曲線下的面積及其應(yīng)用》主要是談正態(tài)分布及其曲線下面積的應(yīng)用,這張圖是運用的一個例子,至于圖表如何作出的具體步驟,文中就未作介紹。過后,正好有一位網(wǎng)友MZY來信問起了有關(guān)定積分的指定區(qū)間的曲線下面積的作圖,我又寫了一篇《答MZY:Excel指定區(qū)間的曲線下面積》,該文只是就Y=eX的曲線談了分幾個區(qū)間的曲線下面積的作圖,因為思路是一樣的,就未對分段的正態(tài)分布曲線作介紹。其實把這兩篇文章結(jié)合起來就可以解決類似于上圖的分區(qū)間的正態(tài)分布曲線下面積的繪制。
分區(qū)間段的面積圖有多種做法,一般使用覆蓋法,這樣對全程控制比較方便。但是要注意要先做全程的,然后從右到左,使后者逐次疊加覆蓋前者得一部分,每一系列的左端點應(yīng)該是重合的,只是右端點不同,否則會出錯。上圖是μ=60,σ=15的正態(tài)分布曲線二維面積圖,看起來是對三個不同的、但相連接的區(qū)間(-∞,55],(55,65]和(65,+∞)分別著色,其實是對(-∞,55],(-∞,65]和(-∞,+∞)三個互有重疊的區(qū)間實施不同的顏色填充,由于數(shù)據(jù)系列的前后順序遮擋掩蓋,而在視覺上形成是對首尾互相連接的三個區(qū)間填充內(nèi)部圖案的感覺。
首先,建立數(shù)據(jù)系列的表格,使用正態(tài)分布的密度函數(shù)NORMDIST(x,μ,σ,邏輯值),來表達區(qū)間(-∞,+∞)上的正態(tài)分布,其中:“平均數(shù)”μ=60;“標準差”σ=15;邏輯值“積累與否”取“FALSE”。A列設(shè)置隨機變量數(shù)值,在A2單元格設(shè)為0、A3單元格設(shè)1,等差值為1,選中A2:A3后,一直拖到A112得出數(shù)值為110為止。在B列設(shè)置正態(tài)分布的密度函數(shù)NORMDIST(x,μ,σ,邏輯值),使B2單元格的內(nèi)容為“=NORMDIST(A2,60,15,FALSE)”,向下拖曳復(fù)制公式到B112,如表-1所示,B列的顯示的是公式:
表-1
如果使B列顯示的是數(shù)值,即如表-2所示:
表-2
先作系列1:
將區(qū)間(-∞,+∞)作為系列1,也就是全程,放在最下一層,
選中單元格區(qū)間A2:B112,插入二維面積圖,這就繪出μ=60,σ=15,在(-∞,+∞)的正態(tài)分布曲線圖,如圖-1所示。可見該中間高兩頭低的鐘形圖形是以μ=60為對稱軸的軸對稱圖形,并以橫軸為漸近線:
圖-1
圖-1完成后,在2003版的“源數(shù)據(jù)”-“系列”中可以看到系列1的“值”和“分類(x)軸標志”設(shè)置,如圖-2所示:
圖-2
在2010版中點擊“圖表工具”-“數(shù)據(jù)”-“選擇數(shù)據(jù)”,如圖-2-2010-1所示:
圖-2-2010-1
在“選擇數(shù)據(jù)源”對話框中,可以看到系列1已設(shè)置,如圖-2-2010-2所示:
圖-2-2010-2
在“編輯數(shù)據(jù)系列”對話框中可以看到“系列值”中的設(shè)置,如圖-2-2010-3所示:
圖-2-2010-3
而“軸標簽”的設(shè)置,如圖-2-2010-4所示:
圖-2-2010-4
后續(xù)的數(shù)據(jù)系列必須在源數(shù)據(jù)中逐步添加。
添加系列2:
在“源數(shù)據(jù)”-“系列”-“系列”中添加系列2,將區(qū)間(-∞,65]作為系列2,“值”和“分類(x)軸標志”的設(shè)置如圖-3所示:
圖-3
圖-3中“值”的具體設(shè)置方法是:點擊“值”右側(cè)的拾取折疊按鈕,會彈出如圖-4所示的“源數(shù)據(jù)-數(shù)值”對話框,選取系列2數(shù)據(jù)所在的單元格B2:B67,“源數(shù)據(jù)-數(shù)值”對話框會出現(xiàn)設(shè)置如圖-4所示數(shù)據(jù),再點擊“源數(shù)據(jù)-數(shù)值”對話框右側(cè)的拾取折疊按鈕,則折疊復(fù)位到圖-3。分類(x)軸標志”的設(shè)置方法也是利用右側(cè)的拾取折疊按鈕,選擇的范圍還是全程A2:A112.
圖-4
在2010版中,類似的設(shè)置如圖-4-2010-1與圖-4-2010-2所示:
圖-4-2010-1
圖-4-2010-2
確定后,圖表如圖-5所示:
圖-5
添加系列3:
在“源數(shù)據(jù)”-“系列”-“系列”中添加系列3,將區(qū)間(-∞,55]作為系列3,“值”和“分類(x)軸標志”的設(shè)置如圖-6所示:
圖-6
圖-6中“值”的具體設(shè)置方法是:點擊“值”右側(cè)的拾取折疊按鈕,在彈出的“源數(shù)據(jù)-數(shù)值”對話框,選取系列3數(shù)據(jù)所在的單元格B2:B57,再點擊“源數(shù)據(jù)-數(shù)值”對話框右側(cè)的拾取折疊按鈕,則折疊復(fù)位。分類(x)軸標志”選擇的范圍還是全程A2:A112。
在2010版中,類似的設(shè)置如圖-6-2010-1與圖-6-2010-2所示:
圖-6-2010-1
圖-6-2010-2
確定后,圖表如圖-7所示:
圖-7
為了說明三個系列前后遮擋掩蓋的效果,可以用三維面積圖來說明。
當只有系列1時的三維圖,如圖-8所示:
圖-8
當添加系列2后的三維圖,如圖-9所示:
圖-9
當添加系列3后的三維圖,如圖-10所示:
圖-10
將三個系列的三維圖的三維變換角度調(diào)為0,相當于從側(cè)面正視這個三維圖,三維的遮擋掩蓋效果就成了二維的分段切割效果,如圖-11所示:
圖-11
最后要說明的是,這種分段區(qū)間的曲線下面積圖的制作是對若干個互有重疊的區(qū)間實施不同的顏色填充,由于數(shù)據(jù)系列的前后順序遮擋掩蓋,而在視覺上形成是對首尾互相連接的三個區(qū)間填充內(nèi)部圖案的感覺。因此在制作中如有覆蓋錯誤,很可能是數(shù)據(jù)系列的次序顛倒,可以在相關(guān)的數(shù)據(jù)系列次序調(diào)整的選項面板中進行調(diào)整。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動態(tài)隨機一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計學(xué)領(lǐng)域,假設(shè)檢驗是驗證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數(shù)量的準確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進行 HTTP 網(wǎng)絡(luò)請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數(shù)據(jù)的科學(xué)計數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點數(shù)據(jù)時的科學(xué)計數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動下的精準零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當下,精準營銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價值 在數(shù)據(jù)驅(qū)動決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實踐到業(yè)務(wù)價值挖掘 在數(shù)據(jù)分析場景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價值導(dǎo)向 統(tǒng)計模型作為數(shù)據(jù)分析的核心工具,并非簡單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10