首頁  |   網站導覽  |   會員登入  |  
首頁 » 分析方法 » (成對)雙樣本中位數差異檢定

(成對)雙樣本中位數差異檢定
Wilcoxon signed-rank test
此處使用的統計分析方法為美國統計學家Frank Wilcoxon所提出的無母數方法中的Wilcoxon符號等級(signed-rank)檢定,當資料包含兩組樣本且樣本兩兩成對時,若要檢定兩組樣本的母體中位數是否相同,可先計算資料中兩兩成對樣本的差異值(如減肥前體重與減肥後體重相減),此筆差異值資料即為單一組樣本,再利用此方法檢定此差異值資料的母體中位數是否大於、小於或等於某一特定數值。當樣本數夠大時(通常樣本個數≧30的樣本可視為樣本數夠大),建議可用(成對)雙樣本平均數差異t檢定(Two-sample t-test for paired data)檢定平均數差。
註:母體中位數經常和平均數一樣, 因此檢定中位數差即檢定平均數差。

本方法使用之R相關套件與參考文獻:
相關套件:stats、base
參考文獻:(依套件名稱排序)
  1. R Core Team (2013). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. URL:http://www.R-project.org/.
範例A-10:國安基金對穩定股市的功能

民國78年,台灣股市達到了萬點以上,曾有一段時間,股市可以說是全民運動,不管是甚麼職業,多少的收入,全民都關注著高利潤的股市。隨著經濟的泡沫化,萬點股市也成為隨之大跌,造成當時的一大堆散戶被套牢,損失慘重。全民瘋狂於股市的情況衝擊了當時的經濟,改變了民眾的社會價值觀,為避免重蹈覆轍,政府著手多項的政策來改變股市大起大落的影響及改變民眾投機的心理,如開徵證卷交易所得稅等政策。另外在1996年股市受到台海飛彈危機的非經濟因素影響時,政府責成七個單位組成非常設的「股市穩定小組」集資新台幣2000億成立股市穩定基金來穩定股市;在1999年股市因兩國論而暴跌,政府於2000年正式組成專責穩定股市的國安基金,在這以後,國安基金在許多重要時刻發揮了穩定股市的作用。某證卷研究機構欲知國安基金在投入股票市場後,對各種股票的影響有多大,是否真的有發揮了穩定股市的價值,共蒐集了8家上市公司的股票價格記錄在國安基金投入前後並分析。

表:國安基金進場前後上市公司的股價,單位:元。
上市公司編號 1 2 3 4 5 6 7 8
進場前 29.3 95.4 55.7 56.1 82.1 40.5 48.9 61.7
進場後 29.9 105.1 59.9 63.1 79.1 55.7 50.4 60.3

Q2:在國安基金進場護盤後,對於此8家上市公司股價是否會有影響呢?研究機構想了解國安基金是否真的有其穩定股市的作用呢?
問題解析:此處要了解國安基金是否發揮穩定股市的功能,須了解在進場前與進場後的股價差異,若進場後使得股價回升,表示國安基金能發揮穩定市場的機制,使得進場後的股價高於進場前的股價,可討論問題"進場後股價減去進場前股價是否大於0元?"。
統計方法:此問題中,變數為上市公司的股價,為單一變數(一個變數,建議選擇單變數分析);上市公司的股價有區分為進場前與進場後,視為兩組樣本,且僅有8家上市公司樣本數小於30,但此處討論國安基金投入股票市場後,對各種股票的影響,故資料需要被成對分析;可採用分析方法:(成對)雙樣本中位數差異檢定(Wilcoxon signed-rank test),檢定"進場後股價減去進場前股價是否大於0元?"。此處需注意,因為每之股票價格有進場前與進場後資料,此種資料的記錄方式稱為成對,故此時分析需注意資料須被"成對"使用,無法將資料分開討論。

解析:
1. 此題可建立虛無假設為"進場後股價減去進場前股價小於等於0",即H0: m進場後- m進場前≦0。
2. 建立資料檔上傳,檔案格式請參照上傳檔案說明。
3. 依分析步驟說明分析資料。
4. 分析結果: two sample signed rank test
(成對)雙樣本中位數差異檢定 - 分析結果
  • 分析方法:(成對)雙樣本中位數差異檢定
  • 資料名稱:範例A-10
  • 變數名稱:進場後 - 進場前
  • 顯著水準:0.05
  • 檢定中位數差異:0
  • 檢定方向:右尾檢定
  • 計算時間:0.084秒

  • 樣本敘述統計量I
    變數名稱
    Variable
    樣本數
    Count
    平均數
    Mean
    中位數
    Median
    最小值
    Minimum
    最大值
    Maximum
    標準差
    Std. dev.
    進場後862.937560.129.9105.121.8964
    進場前858.712555.929.395.421.4171
    I:樣本敘述統計量皆不包含遺失值

  • 等級資訊:
    變數名稱
    variable
    等級種類 個數
    count
    等級平均
    mean rank
    等級和
    rank sum
    進場後 - 進場前 正等級I
    positive rank
    6 5 30
    負等級II
    negative rank
    2 3 6
    等級結III
    tie rank
    0 - -
    I:進場後 - 進場前 > 0
    II:進場後 - 進場前 < 0
    III:進場後 - 進場前 = 0

  • 雙樣本中位數差異檢定(成對樣本):
    虛無假設:母體中位數差異 ≤ 0
    H0m1 - m2 ≤ 0
    變數名稱
    variable
    威爾考克森I
    T檢定統計量
    Wilcoxon-T
    statistics
    z檢定統計量
    z-statistics
    臨界值
    z(1-α)
    p-值II
    p-value
    進場後 - 進場前 30 1.6803 1.6449 0.046446 *
    I:以正等級為計算基礎
    II:顯著性代碼:‘***’ : < 0.001, ‘**’ : < 0.01, ‘*’ : < 0.05, ‘#’ : < 0.1

  • 分析結果建議:由於檢定結果P-值(0.046446) < 顯著水準0.05,因此可拒絕虛無假設。
[重新分析]
影音教學內容為本系統資料處理與分析方法之操作說明,
可供使用者即時參考及線上自學,
輕鬆上手「R資料分析暨導引系統」!

步驟一:資料匯入
選擇要進行分析的資料檔或上傳檔案
您所選擇的資料檔為: