
例6.1 不同裝配方式對生產(chǎn)的過濾系統(tǒng)數(shù)量的差異性檢驗
某城市過濾水系統(tǒng)生產(chǎn)公司,有A、B、C3種方式進行過濾水系統(tǒng)的裝配,該公司為了研究三種裝配方式生產(chǎn)的過濾系統(tǒng)數(shù)量是否有差異,從全體裝配工人中抽取了15名工人,然后隨機地指派一種裝配方式,這樣每個裝配方式就有5個工人。在指派裝配方法和培訓(xùn)工作都完成后,一周內(nèi)對每名工人的裝配過濾系統(tǒng)數(shù)量進行統(tǒng)計如下:
方法A | 方法B | 方法C |
---|---|---|
58 | 58 | 48 |
64 | 69 | 57 |
55 | 71 | 59 |
66 | 64 | 47 |
67 | 68 | 49 |
請根據(jù)數(shù)據(jù)判斷3種裝配方式有無差異
分析過程:由于目標(biāo)是判斷3種裝配方式有無差異,多樣本的檢驗用方差分析
于是我們有了原假設(shè)和備擇假設(shè)
:均值不全相等
import pandas as pd
import numpy as np
from scipy import stats
# 數(shù)據(jù)
A = [58,64,55,66,67]
B = [58,69,71,64,68]
C = [48,57,59,47,49]
data = [A, B, C]
# 方差的齊性檢驗
w, p = stats.levene(*data)
if p < 0.05:
print('方差齊性假設(shè)不成立')
# 成立之后, 就可以進行單因素方差分析
f_value, p_value = stats.f_oneway(*data)
# 輸出結(jié)果
print("F_value:", f_value)
print("p_value:", p_value)
F_value: 9.176470588235295
p_value: 0.0038184120755124806
結(jié)論 選擇顯著性水平 0.05 的話,p = 0.0038 < 0.05
,故拒絕原假設(shè)。支持三種裝配方式裝配數(shù)量均值不全相等的備則假設(shè)。
例6.2 不同優(yōu)惠金額對購買轉(zhuǎn)化率的差異性檢驗
某公司營銷中心為了提升銷量,針對某產(chǎn)品設(shè)計了3種不同金額的優(yōu)惠,想測試三種優(yōu)惠方式對于用戶的購買轉(zhuǎn)化率是否有顯著影響,先收集到了三種不同方式在6個月內(nèi)的轉(zhuǎn)化率數(shù)據(jù)
請根據(jù)數(shù)據(jù)判斷3種不同優(yōu)惠金額的轉(zhuǎn)化率有無差異
優(yōu)惠A | 優(yōu)惠B | 優(yōu)惠C |
---|---|---|
0.043 | 0.05 | 0.048 |
0.047 | 0.048 | 0.05 |
0.051 | 0.045 | 0.047 |
0.049 | 0.055 | 0.056 |
0.045 | 0.048 | 0.054 |
0.0469 | 0.0491 | 0.0509 |
分析過程:由于目標(biāo)是判斷3種不同金額的優(yōu)惠券對于轉(zhuǎn)化率有無差異,多樣本的檢驗用方差分析
于是我們有了原假設(shè)和備擇假設(shè)
:認為這幾組之間的購買率不一樣
P < 0.05 拒絕原假設(shè),傾向于支持不同優(yōu)惠金額購買率不一樣的備擇假設(shè)。認為不同優(yōu)惠金額會對購買率產(chǎn)生影響 P > 0.05 無法拒絕原假設(shè)。認為不同優(yōu)惠金額不會對購買率產(chǎn)生影響
import pandas as pd
import numpy as np
from scipy import stats
A = [0.043 , 0.047 , 0.051 , 0.049 , 0.045 , 0.0469]
B = [0.05 , 0.048 , 0.045 , 0.055 , 0.048 , 0.0491]
C = [0.048 , 0.05 , 0.047 , 0.056 , 0.054 , 0.0509]
data = [A, B, C]
# 方差的齊性檢驗
w, p = stats.levene(*data)
if p < 0.05:
print('方差齊性假設(shè)不成立')
# 成立之后, 就可以進行單因素方差分析
f_value, p_value = stats.f_oneway(*data)
# 輸出結(jié)果
print("F_value:", f_value)
print("p_value:", p_value)
# F_value: 2.332956563862427
# p_value: 0.13116820340181937
結(jié)論 選擇顯著性水平 0.05 的話,p = 0.1311 > 0.05
,故無法拒絕原假設(shè)。認為不同優(yōu)惠金額不會對購買率產(chǎn)生影響
這里的等重復(fù)實驗,意思就是針對每個組合做大于等于兩次的實驗,比如下方例子中表里A1和B1的組合里面有2個數(shù)字,即說明做了兩次實驗,如果是3個數(shù)字則說明3次實驗,依次類推。
例6.3 不同燃料種類和推進器的火箭射程差異性檢驗
火箭的射程與燃料的種類和推進器的型號有關(guān),現(xiàn)對四種不同的燃料與三種不同型號的推進器進行試驗,每種組合各發(fā)射火箭兩次,測得火箭的射程如表(以海里計)(設(shè)顯著性水平為0.05)
燃料 | B1 | B2 | B3 |
---|---|---|---|
A1 | 58.2 , 52.6 | 56.2 , 41.2 | 65.3 , 60.8 |
A2 | 49.1 , 42.8 | 54.1 , 50.5 | 51.6 , 48.4 |
A3 | 60.1 , 58.3 | 70.9 , 73.2 | 39.2 , 40.7 |
A4 | 75.8 , 71.5 | 58.2 , 51.0 | 48.7 , 41.0 |
import numpy as np
import pandas as pd
d = np.array([[58.2, 52.6, 56.2, 41.2, 65.3, 60.8],
[49.1, 42.8, 54.1, 50.5, 51.6, 48.4],
[60.1, 58.3, 70.9, 73.2, 39.2, 40.7],
[75.8, 71.5, 58.2, 51.0, 48.7,41.4]
])
data = pd.DataFrame(d)
data.index=pd.Index(['A1','A2','A3','A4'],name='燃料')
data.columns=pd.Index(['B1','B1','B2','B2','B3','B3'],name='推進器')
# pandas寬表轉(zhuǎn)長表
data = data.reset_index().melt(id_vars =['燃料'])
data = data.rename(columns={'value':'射程'})
data.sample(5)
燃料 | 推進器 | 射程 |
---|---|---|
A2 | B3 | 48.4 |
A3 | B2 | 73.2 |
A3 | B3 | 39.2 |
A4 | B1 | 71.5 |
A2 | B2 | 54.1 |
import statsmodels.api as sm
from statsmodels.formula.api import ols
# 進行雙因素方差分析
model = ols('射程~C(燃料) + C(推進器)+C(燃料):C(推進器)', data =data).fit()
# 打印方差分析表
anova_table = sm.stats.anova_lm(model, typ=2)
anova_table
sum_sq | df | F | PR(>F) | |
---|---|---|---|---|
C(燃料) | 261.675 | 3 | 4.41739 | 0.025969 |
C(推進器) | 370.981 | 2 | 9.3939 | 0.00350603 |
C(燃料):C(推進器) | 1768.69 | 6 | 14.9288 | 6.15115e-05 |
Residual | 236.95 | 12 | nan | nan |
結(jié)論:
對燃料因素來說,其p = 0.0259 < 0.05
所以拒絕,認為燃料對射程影響顯著;
對推進器因素來說,其p = 0.0035 < 0.05
,所以拒絕,認為推進器對射程影響顯著;
對燃料和推進器的交互因素來說,其p = 0.000062< 0.05
,所以拒絕,認為交互因素其對射程影響顯著。
在等重復(fù)實驗中,我們?yōu)榱藱z驗實驗中兩個因素的交互作用,針對每對組合至少要做2次以上實驗,才能夠?qū)⒔换プ饔门c誤差分離開來,在處理實際問題時候,如果我們一直不存在交互作用,或者交互作用對實驗指標(biāo)影響極小,則可以不考慮交互作用,此時每對組合只做一次實驗,類似下方例子中的表中數(shù)據(jù):
例6.4 不同時間、不同地點顆粒狀物含量差異性檢驗 無重復(fù)實驗
下面給出了在5個不同地點、不同時間空氣中的顆粒狀物(單位:mg/m°)含 量的數(shù)據(jù)記錄于表中,試在顯著性水平下檢驗不同時間、不同地點顆粒狀物含量有無顯著差異?(假設(shè)兩者沒有交互作用〉
因素B -地點 | ||||||
---|---|---|---|---|---|---|
因素A - 時間 | ||||||
1995年10月 | 76 | 67 | 81 | 56 | 51 | |
1996年01月 | 82 | 69 | 96 | 59 | 70 | |
1996年05月 | 68 | 59 | 67 | 54 | 42 | |
1996年08月 | 63 | 56 | 64 | 58 | 37 |
import numpy as np
import pandas as pd
d = np.array([
[76,67,81,56,51],
[82,69,96,59,70],
[68,59,67,54,42],
[63,56,64,58,37]])
data = pd.DataFrame(d)
data.index=pd.Index(['1995年10月','1996年01月','1996年05月','1996年08月'],name='時間')
data.columns=pd.Index(['B1','B2','B3','B4','B5'],name='地點')
# pandas寬表轉(zhuǎn)長表
data = data.reset_index().melt(id_vars =['時間'])
data = data.rename(columns={'value':'顆粒狀物含量'})
data.sample(5)
隨機查看5條轉(zhuǎn)化后的數(shù)據(jù):
時間 | 地點 | 顆粒狀物含量 |
---|---|---|
1996年05月 | B4 | 54 |
1995年10月 | B4 | 56 |
1996年05月 | B3 | 67 |
1996年01月 | B2 | 69 |
1996年01月 | B3 | 96 |
import statsmodels.api as sm
from statsmodels.formula.api import ols
# 進行雙因素方差分析
model = ols('顆粒狀物含量~C(時間) + C(地點)', data =data).fit()
# 打印方差分析表
anova_table = sm.stats.anova_lm(model, typ=2)
anova_table
sum_sq | df | F | PR(>F) | |
---|---|---|---|---|
C(時間) | 1182.95 | 3 | 10.7224 | 0.00103293 |
C(地點) | 1947.5 | 4 | 13.2393 | 0.000234184 |
Residual | 441.3 | 12 | nan | nan |
結(jié)論:
對時間因素來說,其p = 0.001033 < 0.05
所以拒絕,認為時間對顆粒狀物含量影響顯著;
對地點因素來說,其p = 0.000234 < 0.05
,所以拒絕,認為地點對顆粒狀物含量影響顯著;
下期將為大家?guī)?a href="http://www.3lll3.cn/bigdata/205067.html" style="text-decoration: none; color: #1e6bb8; word-wrap: break-word; font-weight: bold; border-bottom: 1px solid #1e6bb8;">《統(tǒng)計學(xué)極簡入門》之相關(guān)分析
這里分享一個你一定用得到的小程序——CDA數(shù)據(jù)分析師考試小程序。
它是專為CDA數(shù)據(jù)分析認證考試報考打造的一款小程序??梢詭湍憧焖賵竺荚?、查成績、查證書、查積分,通過該小程序,考生可以享受更便捷的服務(wù)。
掃碼加入CDA小程序,與圈內(nèi)考生一同學(xué)習(xí)、交流、進步!
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認 ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預(yù)測分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢預(yù)判? ? 在數(shù)據(jù)驅(qū)動決策的時代,預(yù)測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點,而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報考到取證的全攻略? 在數(shù)字經(jīng)濟蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗:捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗:數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認證作為國內(nèi)權(quán)威的數(shù)據(jù)分析能力認證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對策略? 長短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨特的門控機制,在 ...
2025-07-07統(tǒng)計學(xué)方法在市場調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場調(diào)研是企業(yè)洞察市場動態(tài)、了解消費者需求的重要途徑,而統(tǒng)計學(xué)方法則是市場調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03