首頁  |   網站導覽  |   會員登入  |  
首頁 » 分析方法 » (獨立)多樣本中位數差異檢定

(獨立)多樣本中位數差異檢定
Kruskal-Wallis test
此處的統計分析方法為Kruskal-Wallis檢定,是由William Kruskal與W. Allen Wallis兩位統計學家將無母數方法中雙樣本中位數檢定推廣至多組樣本後所提出。當資料中包含多組樣本(三組以上樣本),且想了解多組樣本間母體中位數是否有差異時,可使用此方法。當樣本數較大時(通常樣本個數≧30的樣本可視為樣本數較大),建議使用(獨立)多樣本平均數差異檢定(變異數分析)(ANalysis Of VAriance, ANOVA)檢定平均數差。
註:母體中位數經常和平均數一樣, 因此檢定中位數差即檢定平均數差。

本方法使用之R相關套件與參考文獻:
相關套件:stats、base
參考文獻:(依套件名稱排序)
  1. R Core Team (2013). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. URL:http://www.R-project.org/.
範例A-4:糖果銷售分析

兒童節快到了,某連鎖超商經理想趁著節日的到來舉辦促銷活動並藉此提高超商的業績,因此他針對店中販賣之三種糖果品牌的銷售狀況,蒐集了10天的銷售數資料(單位:公斤),想了解不同糖果品牌最受到兒童們的喜愛程度,資料列於表中。

天數 1 2 3 4 5 6 7 8 9 10
好吃牌 23 11 15 16 30 15 14 20 18 16
乾淨牌 11 12 19 12 13 15 17 11 13 9
快樂牌 18 12 11 11 19 19 20 24 22 20


Q3:由於各糖果商皆希望該連鎖超商能以自己的品牌為主打商品,店經理為了公平起見,以三個品牌的平均銷售量比較為基準來選出主打商品,哪一家會獲選呢?
問題解析:要了解三家糖果商的銷售量差異需比較三家的平均銷售量是否有差異,故討論問題"三個糖果品牌的平均銷售量是否有差異?"。
統計方法:此問題中,變數為糖果品牌的銷售狀況,為單一變數(一個變數,建議選擇單變數分析);品牌共有三種可視為有三組的資料且樣本數10小於30;三個品牌的銷售關聯性不大可視為獨立樣本;可採用分析方法:(獨立)多樣本中位數差異(Kruskal-Wallis test),檢定"三個糖果品牌的平均銷售量是否有差異?"。

解析:
1. 此題可建立虛無假設為"三個糖果品牌的平均銷售量無差異",即H0:m好吃牌= m乾淨牌= m快樂牌
2. 建立資料檔上傳,檔案格式請參照上傳檔案說明。
3. 依分析步驟說明分析資料。
4. 分析結果: kw test
(獨立)多樣本中位數差異檢定 - 分析結果
  • 分析方法:(獨立)多樣本中位數差異檢定
  • 資料名稱:範例A-4
  • 檢定變數:_NEW_
  • 分組變數:_GROUP_(好吃牌, 乾淨牌, 快樂牌)
  • 顯著水準:0.05
  • 計算時間:0.091秒

  • 樣本敘述統計量I
    變數名稱
    Variable
    分組變數(_GROUP_)
    Class Variable(_GROUP_)
    樣本數
    Count
    平均數
    Mean
    中位數
    Median
    最小值
    Minimum
    最大值
    Maximum
    標準差
    Std. dev.
    _NEW_好吃牌1017.81611305.4119
    乾淨牌1013.212.59193.0111
    快樂牌1017.61911244.6476
    不分組(Total)3016.215.59304.8238
    I:樣本敘述統計量皆不包含遺失值

  • 等級資訊:
    變數名稱
    variable
    分組變數(_GROUP_)
    class variable(_GROUP_)
    個數
    count
    等級平均
    mean rank
    等級和
    rank sum
    _NEW_好吃牌1017.95179.5
    乾淨牌1010100
    快樂牌1018.55185.5

  • 多樣本中位數差異檢定(獨立樣本)I
    虛無假設:各母體的中位數相同
    H0m1 = ... = m3
    變數名稱
    variable
    K-W卡方檢定統計量
    Kruskal-Wallis chi-squared statistics
    自由度
    d.f.
    臨界值
    Χ2(d.f.,1-α)
    p-值II
    p-value
    _NEW_ 5.9295 2 5.9915 0.051573 .
    I:分組變數為_GROUP_
    II:顯著性代碼:‘***’ : < 0.001, ‘**’ : < 0.01, ‘*’ : < 0.05, ‘#’ : < 0.1

  • 分析結果建議:由於檢定結果P-值(0.051573) > 顯著水準0.05,因此無法拒絕虛無假設。
[重新分析]
影音教學內容為本系統資料處理與分析方法之操作說明,
可供使用者即時參考及線上自學,
輕鬆上手「R資料分析暨導引系統」!

步驟一:資料匯入
選擇要進行分析的資料檔或上傳檔案
您所選擇的資料檔為: