範例參考


此為範例參考區,使用者可參考下表中的範例簡介並點選進入各範例的詳細說明來決定最適合你的資料分析方法。

單變數分析區
範例內容使用分析方法
A-1蜥蜴生長的研究Q1. 單一樣本平均數t檢定(one-sample t-test)
Q2. (成對)雙樣本平均數差異t檢定(two-sample t-test for paired data)
A-2石油定價差異的分析Q1. 單一樣本中位數檢定(Wilcoxon signed-rank test)
Q2. (獨立)雙樣本中位數差異檢定(Wilcoxon rank-sum test)
A-3網路成癮的研究Q1. 單一樣本比例檢定(one-sample test for proportion)
Q2. (獨立)雙樣本比例差異檢定(two-sample test for equality of proportion)
A-4糖果銷售分析Q1. 單一樣本中位數檢定(Wilcoxon signed-rank test)
Q2. (獨立)雙樣本中位數差異檢定(Wilcoxon rank-sum test)
Q3. (獨立)多樣本中位數差異檢定(Kruskal-Wallis test)
A-5醫院管理的分析Q1. 單一樣本變異數(標準差)檢定(one-sample test for variance)
Q2. (獨立)雙樣本變異數(標準差)差異檢定(two-sample test for equality of variance)
Q3. (獨立)多樣本變異數(標準差)檢定(Levene test)
A-6縱火次數的分析Q1. 卡方適合度檢定(chi-square for goodness of fit)
A-7電影市場的分析Q1. 單一樣本機率分配檢定(one-sample Kolmogorov-Smirov test)或卡方適合度檢定(chi-square test for goodness of fit)
Q2. (獨立)雙樣本機率分配檢定(two-sample Kolmogorov-Smirov test)
A-8咖啡店的經營分析Q1. 單一樣本連檢定(one-sample run test)
A-9考試的答案是否有規則可循?Q1. 單一樣本連檢定(one-sample run test)
A-10國安基金對穩定股市的功能Q1. 單一樣本中位數檢定(Wilcoxon signed-rank test)
Q2. (成對)雙樣本中位數差異檢定(Wilcoxon signed-rank test)
A-11新藥效益的分析Q1. 單一樣本平均數t檢定(one-sample t-test)
Q2. (獨立)雙樣本平均數差異t檢定(two-sample t-test)
Q3. (獨立)多樣本平均數差異檢定(或稱變異數分析)(ANalysis Of VAriance, ANOVA)
雙變數分析區I
範例內容使用分析方法
B-1收入與保險的相關性研究Q1. 費雪精確檢定(Fisher's exact test)或卡方獨立(或稱齊一性)檢定(chi-square test of independence or homogeneity)
B-2機位種類的選擇和旅途距離相關性的研究Q1. 費雪精確檢定(Fisher's exact test)或卡方獨立(或稱齊一性)檢定(chi-square test of independence or homogeneity)
B-3飲料偏愛的研究Q1. 費雪精確檢定(Fisher's exact test)或卡方獨立(或稱齊一性)檢定(chi-square test of independence or homogeneity)
B-4軌道哩數和載客量的相關研究Q1. 皮爾生相關係數(Pearson's correlation coefficient)
B-5服務人員的外表條件和業績的相關研究Q1. 斯皮爾曼等級相關係數(Spearman's rank correlation coefficient)
B-6棒球球員跑速和打擊率的相關分析Q1. 斯皮爾曼等級相關係數(Spearman's rank correlation coefficient)
雙變數分析區II
範例內容使用分析方法
C-1圖書館借書服務的分析Q1. 簡單迴歸分析(simple regression analysis)
C-2廣告效益的研究Q1. 簡單迴歸分析(simple regression analysis)
C-3飛機零件O環的受溫效應Q1. 簡單邏輯斯迴歸分析 (simple logistic regression analysis)
多變數分析區
範例內容使用分析方法
D-1疫苗安全的研究Q1. 多元邏輯斯迴歸分析 (multiple logistic regression analysis)
D-2BMI對第II型糖尿病的影響Q1. 多元邏輯斯迴歸分析(multiple logistic regression analysis)
Q2. 多元迴歸分析(multiple regression analysis)

存活分析區
範例內容使用分析方法
E-1抽菸對肺癌病患存活的影響Q1. Kaplan-Meier存活函數估計(Kaplan-Meier estimation for survival function)
Q2. 兩個(含)以上存活函數的估計(estimation for two or more survival functions)
Q3. 兩個(含)以上存活函數的比較(comparison for two or more survival functions)
Q4. Cox比例風險模型(Cox proportional hazards model)
E-2不同透析治療方法對洗腎病患存活的影響Q1. Kaplan-Meier存活函數估計(Kaplan-Meier estimation for survival function)
Q2. 兩個(含)以上存活函數的比較(comparison for two or more survival functions)
Q3. Cox比例風險模型(Cox proportional hazards model)

範例A-1:蜥蜴生長的研究 生物多樣性對於人類來說是一個重要的議題,地球上的物種豐富,各種的動植物都有,1992年聯合國在巴西的地球高峰會議通過『生物多樣性公約』,因此生物多樣性的議題受到了全球的關注,而保育的觀念也慢慢的深植於人心。台灣是一個美麗的寶島,地處於亞熱帶與熱帶之間,四季溫暖氣候宜人且雨量充沛,在峻嶺高山中蘊含著豐富的物種。但由於高度的經濟開發與都市建設,許多物種的棲息地被破壞殆盡,造成野生動植物數量大量減少,甚至於消失殆盡,有鑒於此,許多動物保育學家需至山林裡從事動物保育的工作,以避免一些台灣的特有品種絕種。 蜥蜴是日常生活中在野外常常可見的小型爬蟲類,非常的不起眼,但是蜥蜴可說是自遠古時代即存在的物種,因此引起許多的動物學家的研究興趣。有一位保育學家對於研究台灣特有種的短肢攀蜥相當熱衷,想了解該物種的生長速度,花了兩年的時間在中海拔的山區量測該品種蜥蜴的身長並記錄之,第一年補獲的蜥蜴共50隻,每隻皆記錄身長並於身上加以編號後放生,並於第二年再記錄這群蜥蜴的身長,兩年前的記錄顯示該地區該品種蜥蜴的平均身長為18公分,而一年前與今年所測量的資料共有50筆列於表中。

編號 123 4 5...48 4950
第一年身長 18.5 23 20.619 16 ... 2220.3 18.4
第二年身長 19.4 23.5 20.921.2 17.5 ... 22.823.3 21.1

Q1:保育學家想了解在第一年所捕獲的蜥蜴的平均身長是否有比前一年為長,該如何分析呢?
問題解析:因為在兩年前的資料中顯示當時所量測的蜥蜴平均身長為18公分,若保育學家想了解第一年量測的平均身長是否大於前一年的資料,僅需討論"一年前的蜥蜴身長平均是否大於18公分?"。
統計方法:此問題中變數為蜥蜴身長,為單一變數(一個變數,建議選擇單變數分析)。因僅一組樣本且此組樣本數大於30筆,可採用分析方法:單一樣本平均數t檢定(one-sample t-test),檢定"一年前的蜥蜴身長平均是否大於18公分?"。

Q2:因為第一年與第二年所記錄的蜥蜴皆為同一群體,可確知第二年的蜥蜴平均身長不會小於第一年。根據保育學家的經驗,該品種蜥蜴每年可成長2公分,保育學家想了解此組蜥蜴的資料是否也如此,該如何分析呢?
問題解析:直接比較第一年的平均身長與第二年的平均身長是否差異達2公分,因為第二年的平均身長必定大於第一年,故可討論"第二年的平均身長減去第一年平均身長是否大於2公分?"。
統計方法:此問題中變數為蜥蜴身長,為單一變數(一個變數,建議選擇單變數分析)。資料須比較第一年與第二年身長故樣本數二組,且需成對比較;另此份資料樣本數大於30筆,可採用分析方法:(成對)雙樣本平均數差異t檢定(two-sample t-test for paired data),檢定"第二年的平均身長減去第一年平均身長是否大於2公分?"。此處需注意,因為每一隻蜥蜴皆有第一年與第二年的身長資料,此種資料的記錄方式稱為成對,故此時分析需注意資料須被"成對"使用,無法將資料分開討論。

回單變數分析區

範例A-2:石油定價差異的分析 物價不斷上揚,舉凡各項與民生問題有關的物品都會受到關注,而每日上班需使用到交通工具使用的汽油與柴油對於大眾也是一個重要的支出。由於石油是一種具有戰略考量與民生問題雙重屬性的特殊物品,因此油價的波動會影響民生問題甚鉅,為了推動國內油價市場的公平性與合理性,降低非經濟因素的影響,使國內油價能回歸市場機制,負責部門於2007年1月開始實施浮動油價的機制,並經過多次的修訂與調整,此一計價制度推行至今。由於近幾個月來國際油價的波動劇烈,進而影響到一般百姓最關心的汽柴油價格,某研究民生議題的機構想了解該國主要兩個石油公司A公司及B公司的浮動油價訂立是否有差異,由北至南蒐集了A公司與B公司在該國9個地區的加油站標示油價(元/公升),如下表所示。

地區 1 2 3 4 5 6 7 8 9
A公司 30.3 30.1 31 29.6 29.9 32.3 30.3 29 31
B公司 30.4 30.1 31.5 30 30 31.9 30.5 29.1 31.3

Q1:在浮動油價制度訂立之前,國內的汽油價格為30元/公升,研究機構想了解在實施浮動油價制度後,國內的平均油價是否高於實施之前,並以A公司的資料加以比較。
問題解析:此問題可討論A公司的平均油價與制度實施前油價加以比較,故討論"A公司的平均油價是否大於30元/公升?"。
統計方法:此問題中變數為石油公司的油價,為單一變數(一個變數,建議選擇單變數分析);想了解A公司的油價,視為一組樣本且僅有樣本數9個,小於30筆;可採用分析方法:單一樣本中位數檢定(Wilcoxon signed-rank test),檢定"A公司的平均油價是否高於30元/公升?"。

Q2:由於浮動油價制度使得各石油公司可針對成本的差異而訂立不同的油價,研究機構想了解國內最大的兩油品供應商的訂定的油價平均是否有差異?
問題解析:此處可將兩油品供應商於各地所收集的油價資料加以比較,討論問題"A公司的平均油價減去B公司的平均油價是否不為0?"。
統計方法:此問題中變數為石油公司的油價,為單一變數(一個變數,建議選擇單變數分析);石油公司有兩家,可視為兩組樣本且僅有樣本數9個,小於30筆;另A公司與B公司油價訂定應無關係,故兩組資料可視為獨立;可採用分析方法:(獨立)雙樣本中位數差異檢定(Wilcoxon rank-sum test),檢定"A公司的平均油價減去B公司的平均油價是否不為0?"。

回單變數分析區

範例A-3:網路成癮的研究 網路遊戲是現在假日的熱門休閒娛樂,許多熱愛上網的網友還因此被稱為宅男,許多新興的行業都與網路有關,隨著電子3C產品的普及,可說是人手一機,走到哪都可以上網,而許多與網路有關的經濟活動因此稱為"宅經濟"。在一片經濟不景氣的哀嘆聲中,宅經濟可說是異軍突起,許多遊戲公司皆已上市上櫃且股價居高不下。看好這片宅經濟的影響力,某投資顧問公司欲了解台灣民眾的網路成癮程度,了解使用者的差異性,以提供遊戲業者參考使用,蒐集了一份資料,資料為喜歡玩線上遊戲的男性與女性人數,受訪男性有350人,女性有200人,皆載於表中。

性別受訪人數高度使用人數(註一)
男性35083
女性20016
註一:定義為每日使用網路時間超過12小時

Q1:一般而言,男性對於網路遊戲的喜好程度較高,投資顧問公司想了解喜好上網的男性比例高低以幫助遊戲業者來決定是否投入市場開發,遊戲業者認為若喜好上網的男性比例達3成以上則預期投入市場可獲得利潤,反之低於3成則無利潤可期。
問題解析:此處要了解男性喜好上網的比例高低,且比例是否高於0.3,可討論問題"男性喜好上網的比例是否高於0.3?"。
統計方法:此問題中變數可設為高度使用的人數比例,為單一變數(一個變數,建議選擇單變數分析);此處資料討論男性部分,為一組樣本;可採用分析方法:單一樣本比例檢定(one-sample test for proportion),檢定"男性喜好上網的比例是否高於0.3?"。

Q2:由於女性人口的成長快速,已經出現女性人數高於男性人數的現象,該業者認為女性的市場也具有開發的價值,故委託投資顧問公司分析並提供資料以訂定市場策略。投資顧問公司想要了解女性市場是否有與男性市場一樣的價值,不同性別間喜好上網的人數比例會有差異嗎?
問題解析:要了解不同性別間喜好上網人數比例差異,僅需比較男性與女性喜好上網的比例高低,可討論"男性喜好上網比例減去女性喜好上網比例是否不等於0?"
統計方法:此問題中變數為高度使用的人數比例,為單一變數(一個變數,建議選擇單變數分析);此處資料分為男與女兩部分,視為兩組樣本;另資料中受訪男性與女性是否玩遊戲應無關係,故兩樣本可視為獨立;可採用分析方法:(獨立)雙樣本比例差異檢定(two-sample test for equality of proportion),檢定"男性喜好上網比例減去女性喜好上網比例是否不等於0?"。

回單變數分析區

範例A-4:糖果銷售分析 兒童節快到了,某連鎖超商經理想趁著節日的到來舉辦促銷活動並藉此提高超商的業績,因此他針對店中販賣之三種糖果品牌的銷售狀況,蒐集了10天的銷售數資料(單位:公斤),想了解不同糖果品牌最受到兒童們的喜愛程度,資料列於表中。

天數 1 2 3 4 5 6 7 8 9 10
好吃牌 23 11 15 16 30 15 14 20 18 16
乾淨牌 11 12 19 12 13 15 17 11 13 9
快樂牌 18 12 11 11 19 19 20 24 22 20

Q1:該店以往最受歡迎的糖果為好吃牌,且製造商為鼓勵商店販賣該品牌商品,當每月平均銷售量達15公斤時即發予額外的獎金,店經理想了解當月目前的販售情況,是否有機會領到獎金。
問題解析:是否領到獎金,表示該月的好吃牌糖果平均銷售量必須超過15公斤,故可討論"好吃牌糖果平均銷售數量是否大於15公斤?"。
統計方法:此問題中,變數為糖果品牌的銷售狀況,為單一變數(一個變數,建議選擇單變數分析);僅討論好吃牌可視為一組的資料,且樣本數10小於30,可採用分析方法:單一樣本中位數檢定(Wilcoxon signed-rank test),檢定"好吃牌糖果平均銷售數量是否大於15公斤?"。

Q2:另一糖果商認為他們的商品在該店銷售較佳,因此說服店經理主打他們的商品"乾淨牌",但依據該超商店員的經驗"好吃牌較乾淨牌受歡迎",店經理該相信誰呢?
問題解析:要知道兩個品牌的銷售狀況,需比較兩種品牌的平均銷售量,故討論好吃牌的平均銷售量是否大於乾淨牌的平均銷售量,即為"好吃牌的平均銷售量減去乾淨牌的平均銷售量是否不為0?"。
統計方法:此問題中,變數為糖果品牌的銷售狀況,為單一變數(一個變數,建議選擇單變數分析);比較好吃牌與乾淨牌共有二種可視為有二組的資料,且樣本數10小於30;二個品牌的銷售關聯性不大可視為獨立樣本;可採用分析方法:(獨立)雙樣本中位數差異檢定(Wilcoxon rank-sum test),檢定"好吃牌的平均銷售量減去乾淨牌的平均銷售量是否不為0?"。

Q3:由於各糖果商皆希望該連鎖超商能以自己的品牌為主打商品,店經理為了公平起見,以三個品牌的平均銷售量比較為基準來選出主打商品,哪一家會獲選呢?
問題解析:要了解三家糖果商的銷售量差異需比較三家的平均銷售量是否有差異,故討論問題"三個糖果品牌的平均銷售量是否有差異?"。
統計方法:此問題中,變數為糖果品牌的銷售狀況,為單一變數(一個變數,建議選擇單變數分析);品牌共有三種可視為有三組的資料且樣本數10小於30;三個品牌的銷售關聯性不大可視為獨立樣本;可採用分析方法:(獨立)多樣本中位數差異(Kruskal-Wallis test),檢定"三個糖果品牌的平均銷售量是否有差異?"。

回單變數分析區

範例A-5:醫院管理的分析 現代的醫療科技發展迅速,且醫療的制度完善,每個地區都有許多的醫療院所。而便利的醫療設施再加上漸趨高齡化的人口結構,使得看病人口數一直成長,而季節的變化也可能會影響到依些季節性的疾病發生而使得醫院就醫人數的改變。由報章雜誌或電視新聞中常可見醫院人員短缺的新聞,故醫院員工的調配就成為醫院管理時很重要的一環,研究人員藉由觀察就醫人數的變化可作為醫院員工的調配的一個參考,若每月就醫人數的差異不大,則醫院即可確實的管控級調配所需要的員工人數,並有效的管理醫院。某研究型醫院中的研究人員想了解醫院就醫人數變化與醫院管理的關係,收集了該醫院三家分院的就醫人數資料,列於表中,資料中包含了一至十二月的就醫人數,共有北區、中區及南區三個分院。

表:三家分院的1-12月每月份就醫人數分配表
月份 1 2 3 4 5 6 7 8 9 101112
北區分院 6354 6920 5501 5023 5666 6800 7825 7830 6804 6202 6399 6054
中區分院 5544 5955 6017 5100 4562 4907 5600 5137 6020 5320 4457 4826
南區分院 5017 5391 5454 3998 4150 4406 4921 4882 4230 4128 4030 3854

Q1:以該醫院目前的規模,若每月的就醫人數變化在500人內,藉由調配院內人員休假即可因應就醫人數變多的狀況,不需再額外聘用人員,若變化超過500人則有必要增加額外的人手,研究人員想了解醫院目前的人手是否充足?該如何分析?
問題解析:想了解醫院目前的人手是否充足,代表需了解每月就醫人數的變化(變化在統計中以變異數高低來衡量)是否有少於500人,故討論問題"北區分院每月就醫人數的變異數是否少於500人?"。
統計方法:此問題中,變數為北區分院每月的就醫人數,為單一變數(一個變數,建議選擇單變數分析),且僅討論一家分院為一組樣本;可採用分析方法:單一樣本變異數(標準差)檢定(one-sample test for variance),檢定"北區分院每月就醫人數的變異數是否少於500人?"。

Q2:研究人員進一步想了解中區分院的就醫人數變化,藉此判斷若人手調配方式與北區分院無異是否可行?該如何分析?
問題解析:要判斷兩分院人手調配的方式可否相同,僅需了解北區與中區分院每月就醫人數的變化是否有差異,因變化在統計中以變異數高低來衡量,故討論問題"北區分院每月就醫人數的變異數與中區分院每月就醫人數的變異數是否有差異?"。
統計方法:此問題中,變數為北區與中區分院每月的就醫人數,可視為單一變數(一個變數,建議選擇單變數分析),討論兩家分院為兩組樣本,且分院的就醫病人之間無關聯,可視為獨立樣本;可採用分析方法:(獨立)雙樣本變異數(標準差)差異檢定(Two-sample test for equality of variance),檢定"北區分院每月就醫人數的變異數與中區分院每月就醫人數的變異數是否有差異?"。

Q3:研究人員想同時了解北、中、南三區分院的人員調配方式是否可一致,因此需探討此三區分院的就醫人數變化是否有差異?該如何分析?
問題解析:此處想了解北區、中區與南區三家分院每月就醫人數的變化(變化在統計中以變異數高低來衡量)是否有差異,故討論問題"北、中、南三家分院每月就醫人數的變異數是否有差異?"。
統計方法:此問題中,變數為北區、中區與南區分院每月的就醫人數,可視為單一變數(一個變數,建議選擇單變數分析),討論三家分院為三組樣本,且三區分院的就醫病人之間無關聯,可視為獨立樣本;可採用分析方法:(獨立)多樣本變異數(標準差)差異檢定(Levene test),檢定"北、中、南三家分院每月就醫人數的變異數是否有差異?"。
回單變數分析區

範例A-6:縱火次數的分析 隨著科技的進步,都市的現代化腳步加快,人類居住的環境已經與以前大不相同,大都市內的土地寸土寸金,每一個地方都是高樓林立且建築物密集。在這高密度的都市區域裡,雖然有很大的便利性,但是相反的卻很容易發生火警意外,當有火警意外時常常造成不可想像的巨大傷害。據內政部統計民國94年的火災發生次數達5139次,平均下來每天有14件的火災發生,造成死亡人數139人,受傷人數532人,財物損失更是巨大,因此對於火災的防治是很重要的。所幸在適當的防治下,已經有相當的成果,民國100年的統計數字顯示當年度的火災次數已降至1772次。在這麼多火災中,有一項是人為的縱火,防制人員為了解縱火事件發生的相關資訊,統計了一份資料顯示出過去360天每天發生的縱火案次數,依每天縱火案件發生的次數製成次數分配表,如下表。

表:發生縱火次數的天數分配表,單位:天。
縱火次數 0 1 2 3 4 5 >5
天數 154 83 61 33 15 8 6
系統中所提供的範例資料檔為原始資料(即未分組前的資料)

Q1:根據以往的資料顯示,此種在一段時間區間內發生某種特定事件的資料通常會是一個卜瓦松分配,該防制人員想了解此次收集的資料是否與以往有相同的情況。
問題解析:此處要分析所收集的資料與以往的資料是否有相同性質,即是討論該資料是否也服從卜瓦松分配,故討論問題"此資料是否服從卜瓦松分配?"。
統計方法:此問題中,變數為不同縱火次數的天數,為單一變數(一個變數,建議選擇單變數分析)且一組樣本;可採用分析方法:卡方適合度檢定(Chi-square test for goodness of fit),檢定"此資料是否服從卜瓦松分配?"。

回單變數分析區

範例A-7:電影市場的分析 看電影一直是現代人的重要休閒活動,隨著影音科技的日新月異,電影院的聲光效果更是一種高級享受,吸引著許多民眾前往消費。但是伴隨著享受的同時,電影的票價也是節節的升高,有最便宜的早場優待票220元,也有3D IMAX的400元票價,在消費與享受之間如何吸引民眾前往,也是業者的一個重要課題。影城工會為了瞭解電影院的市場是否已趨飽和,特別委託某研究機構調查,該機構抽查北部與南部各100家電影院,得到過去3個月的營業收入(單位:萬元),並製作一次數分配表,列出8個不同收入的區間,並將每家電影院依收入高低歸於各區間,列於表中。

表:電影院的收入區間次數分配表。
收入區間 1000以下 1001-2000 2001-3000 3001-4000 4001-5000 5001-6000 6001-7000 7001以上
北部 6 6 18 25 24 11 6 4
南部 12 8 30 22 16 6 5 1
系統中所提供的範例資料檔為原始資料(即未分組前的資料)

Q1:研究機構想了解各家電影院的收入高低是否有差異,並以北部的電影院為分析對象,希望以某種機率分配來描述收入的分布,若是資料屬於左偏分配,即可知道多數的電影院收入在平均收入之上,若資料屬於右偏分配可知多數的電影院收入在平均收入之下,若資料為對稱分配且多數於平均數(中位數)附近(如常態分配),則可知大多數的電影院收入在中間的區間。依據商業經營模式,店家的收入區間大多數成常態分配,電影院的收入區間也是如此嗎?
問題解析:此處討論電影院的收入資料是否也於其他的商業經營模式一致,會呈現常態分配,故討論問題"北部電影院的收入區間是否為常態分配?"。
統計方法:此問題中,變數為不同收入區間的電影院家數,為單一變數(一個變數,建議選擇單變數分析)且僅討論北部的電影院為一組樣本;可採用分析方法:單一樣本機率分配檢定(one-sample Kolmogorov-Smirov test)及卡方適合度檢定(Chi-square test for goodness of fit),檢定"北部電影院的收入區間是否為常態分配?"。

Q2:由於南北部民情的不同,再加上都市發展的差異性,故研究機構對於南部與北部電影院的收入差異非常的感興趣,想分析南北部電影院的收入區間分布是否有差異,以增加電影院業者對市場評估的訊息。
問題解析:分析南北部電影院的收入區間分布是否有差異,可討論"北部的電影院收入分布與南部電影院的收入分布是否有差異?"。
統計方法:此問題中,變數為不同收入區間的電影院家數,為單一變數(一個變數,建議選擇單變數分析),討論南部與北部電影院收入故視為二組樣本,且兩地區的電影院收入應無關聯,可視為獨立樣本;可採用分析方法:(獨立)雙樣本機率分配檢定(two-sample Kolmogorov-Smirov test),檢定"北部的電影院收入分布與南部電影院的收入分布是否有差異?"。

回單變數分析區

範例A-8:咖啡店的經營分析 對於忙碌的現代人而言,"咖啡"已經成為午後休閒、提神很重要的飲品了,隨著國人的接受度提高,不管是從事何種行業的人,走在路上常可見人手一杯咖啡,而咖啡店更是如雨後春筍般的四處林立,早餐店販賣咖啡、飲料店販賣咖啡、便利超商也投入這個商機蓬勃的市場。也因此,傳統的咖啡店受到了很大的衝擊,一家手沖咖啡店的老闆想了解他們的顧客來源受否有受到影響,記錄了一天中的顧客共有20位,並將顧客區分為老顧客與新顧客,資料如下

20位來訪顧客記錄:
老、新、老、新、新、新、老、老、新、老、老、新、新、老、新、老、新、老、新、老

Q1:來消費的顧客中以老顧客較多還是新顧客較多呢?或者是隨機?
問題解析:此處想了解來消費的顧客種類是否有某種規則,如老顧客的出現較多,或是新顧客的出現較多,或是老顧客與新顧客參雜交替來消費,此種情況稱之為隨機性,故此處討論問題為"來消費的顧客是否具有隨機性?"。
統計方法:此問題中,變數為來消費的顧客種類,為單一變數(一個變數,建議選擇單變數分析)且一組樣本,可採用分析方法:單一樣本連檢定(one-sample run test),檢定"來消費的顧客是否具有隨機性?"。

回單變數分析區

範例A-9:考試的答案是否有規則可循? 考試是測驗學生學習程度的一個方式,學生為了獲取好的成績需要付出相當的時間去學習並且獲得好的考試成績,某次統計學考試,有位考生想了解該科教師所出的試卷的答案是否有一定的規則及順序,於是將某次考古題中25題的答案依據題號順序排列如下。

試卷答案25題記錄:
是、非、是、是、是、是、非、非、是、非、非、非、是、非、非、是、是、非、是、非、非、是、非、是、非

Q1:該生想了解此試卷的答案是否有一定的規則或順序,該如何處理呢?
問題解析:想了解此試卷答案是否具有規則性,可討論出現的答案是否連續出現相同的結果或是交錯出現,即是討論問題"此試卷的答案結果是否具有隨機性?"。
統計方法:此問題中,變數為答案的結果,為單一變數(一個變數,建議選擇單變數分析)且一組樣本;可採用分析方法:單一樣本連檢定(one-sample run test),檢定此試卷的答案結果是否具有隨機性。

回單變數分析區

範例A-10:國安基金對穩定股市的功能 民國78年,台灣股市達到了萬點以上,曾有一段時間,股市可以說是全民運動,不管是甚麼職業,多少的收入,全民都關注著高利潤的股市。隨著經濟的泡沫化,萬點股市也成為隨之大跌,造成當時的一大堆散戶被套牢,損失慘重。全民瘋狂於股市的情況衝擊了當時的經濟,改變了民眾的社會價值觀,為避免重蹈覆轍,政府著手多項的政策來改變股市大起大落的影響及改變民眾投機的心理,如開徵證卷交易所得稅等政策。另外在1996年股市受到台海飛彈危機的非經濟因素影響時,政府責成七個單位組成非常設的「股市穩定小組」集資新台幣2000億成立股市穩定基金來穩定股市;在1999年股市因兩國論而暴跌,政府於2000年正式組成專責穩定股市的國安基金,在這以後,國安基金在許多重要時刻發揮了穩定股市的作用。某證卷研究機構欲知國安基金在投入股票市場後,對各種股票的影響有多大,是否真的有發揮了穩定股市的價值,共蒐集了8家上市公司的股票價格記錄在國安基金投入前後並分析。

表:國安基金進場前後上市公司的股價,單位:元。
上市公司編號 1 2 3 4 5 6 7 8
進場前 29.3 95.4 55.7 56.1 82.1 40.5 48.9 61.7
進場後 29.9 105.1 59.9 63.1 79.1 55.7 50.4 60.3

Q1:研究機構想了解在國安基金進場前被選定的公司股價是否低於當時的平均股價,且當時的股市平均股價為50元。
問題解析:討論進場前被選定的公司股價是否低於當時的平均股價而當時平均股價為50元,此問題只需討論"進場前8家公司的股價平均是否低於50元?"。
統計方法:此問題中,變數為上市公司的股價,為單一變數(一個變數,建議選擇單變數分析);僅使用進場前的股價資訊,視為一組樣本,且僅有8家上市公司樣本數小於30;可採用分析方法:單一樣本中位數檢定(Wilcoxon signed-rank test),檢定"進場前8家公司的股價平均是否低於50元?"。

Q2:在國安基金進場護盤後,對於此8家上市公司股價是否會有影響呢?研究機構想了解國安基金是否真的有其穩定股市的作用呢?
問題解析:此處要了解國安基金是否發揮穩定股市的功能,須了解在進場前與進場後的股價差異,若進場後使得股價回升,表示國安基金能發揮穩定市場的機制,使得進場後的股價高於進場前的股價,可討論問題"進場後股價減去進場前股價是否大於0元?"。
統計方法:此問題中,變數為上市公司的股價,為單一變數(一個變數,建議選擇單變數分析);上市公司的股價有區分為進場前與進場後,視為兩組樣本,且僅有8家上市公司樣本數小於30,但此處討論國安基金投入股票市場後,對各種股票的影響,故資料需要被成對分析;可採用分析方法:(成對)雙樣本中位數差異檢定(Wilcoxon signed-rank test),檢定"進場後股價減去進場前股價是否大於0元?"。此處需注意,因為每之股票價格有進場前與進場後資料,此種資料的記錄方式稱為成對,故此時分析需注意資料須被"成對"使用,無法將資料分開討論。

回單變數分析區

範例A-11:新藥效益的分析 藥物對於國人來說使用率可說是非常的高,從日常容易罹患的感冒、發燒、輕微皮膚疾病及足癬等,還有各種慢性病到嚴重的各種急症及致命的癌症等。藥物種類有內服與外用,顆粒、膠囊與藥膏、藥布等,還有較特殊者需以針筒注射等各種不同型式的藥品。雖然有這麼多的藥品種類,但對於藥品的使用與上市,事實上是非常的嚴格的,必須經過多次的動物與人體試驗及相關單位的審核及檢驗,才能得到上市的許可。在台灣,由於工作與經濟上的壓力,失眠已成為大多數人的夢靨,根據台灣睡眠學會統計,全台有超過200萬人睡不好,而健保局統計,台灣人一年吞掉13億顆具有安眠或鎮靜效果的藥丸,安眠藥已經是台灣藥物濫用榜排行第三的藥品【服用藥物請遵循醫師指示】。而此問題正代表著安眠藥具有廣大市場,因此引起某藥商的注意,想引進一款最新的安眠藥,實行一系列的人體試驗,在這試驗中廠商準備了三組受試者,每組各有40人,第一組使用廠商引進的新藥物,第二組則是使用坊間最受歡迎的藥物(稱為舊藥物),最後一組則是給予安慰劑。在使用藥物後記錄每個受試者自服藥後到入眠的時間長短(單位:分鐘),所有受試者的資料列於表中。

受試者編號 1 2 3 4 ... 38 39 40
第一組(新藥物) 22 18 12 8 ... 32 19 14
第二組(舊藥物) 29 34 31 20 ... 19 13 45
第三組(安慰劑) 35 39 25 26 ... 31 26 31

Q1:由於市面上有一款號稱服藥後20分鐘即可入眠的安眠藥,故該藥商想了解新藥物的藥效是否比該款藥物為佳,以便於廣告宣傳中能有宣稱更好的效果,該如何證實此療效呢?
問題解析:此問題須了解服用新藥物是否有低於20分鐘即可入眠的效果,討論問題"服用新藥物後的入眠時間是否少於20分鐘?"。
統計方法:此問題中,變數為受試者的入眠時間,為單一變數(一個變數,建議選擇單變數分析);僅使用新藥物資料可視為有一組的資料,樣本數40大於30;可採用分析方法:單一樣本平均數t檢定(one-sample t-test),檢定"服用新藥物後的入眠時間是否少於20分鐘?"。

Q2:廠商在推出新藥物之前,須先了解效果是否較原販賣的舊藥物為佳,才能決定是否販賣,請問廠商是否應販賣新的藥物呢?與舊藥物相比較,新藥是有效的嗎?
問題解析:此處要了解新藥的藥效與舊藥的藥效相比是否有差異,即比較服用新藥後的平均入眠時間是否少於服用舊藥後的平均入眠時間,討論問題"服用新藥後的平均入眠時間減去服用舊藥後的平均入眠時間是否小於0?"。
統計方法:此問題中,變數為受試者的入眠時間,為單一變數(一個變數,建議選擇單變數分析);使用新藥物與舊藥物比較可視為有二組的資料,樣本數40大於30;二組受試者之間並無關聯,為獨立樣本;可採用分析方法:(獨立)雙樣本平均數差異t檢定(two-sample t-test),檢定"服用新藥後的平均入眠時間減去服用舊藥後的平均入眠時間是否小於0?"。

Q3:為了確認安眠藥的藥效,廠商在人體試驗時將安慰劑一起加入,以避免受試者因心理作用而產生錯誤的結果,跟其他兩組比較,新藥是有效的嗎?
問題解析:此處要了解3種藥物的藥效是否有差異,需將新藥物、舊藥物與安慰劑服用後的入眠時間做一比較,討論問題"使用三種藥物後的入眠時間是否有差異?"。
統計方法:此問題中,變數為受試者的入眠時間,為單一變數(一個變數,建議選擇單變數分析);藥物共有三種可視為有三組的資料,樣本數40大於30;三組受試者之間並無關聯,為獨立樣本;可採用分析方法:(獨立)多樣本平均數差異檢定(或稱變異數分析)(ANalysis Of VAriance, ANOVA),檢定"使用三種藥物後的入眠時間是否有差異?"。

回單變數分析區

範例B-1:收入與保險的相關性研究 隨著時代的進步,現代人已經逐漸接受買保險的觀念,且隨著人口的增加,保險市場可以說是欣欣向榮、蓬勃發展。為了分食廣大的保險市場利益,某壽險公司想分析市場以了解民眾購買保險的習性,希望了解民眾所得收入的高低是否會影響到其參加壽險保障的意願,隨機調查了200人,搜集資料中包含有參加壽險及沒參加壽險,並將每個人的所得收入區分為高收入與低收入兩組,列於表中。

表:有否參加壽險與收入高低之列聯表。
收入高 收入低
有參加壽險 78 49
無參加壽險 31 42

Q1:壽險公司想了解所得高低是否會影響到參加壽險的意願來決定市場決策的方向,此處想了解所得高低是否會影響到參加壽險的意願?
問題解析:此處想了解是否較高所得的民眾會有較多的人參加壽險,而較低收入的民眾則參加壽險的人數較少,當有此關係時表示兩者之間是有相關的,此即為討論問題"收入高低與是否參加壽險是否有相關性?"。
統計方法:此問題中有兩個變數,分別是參加壽險情形及所得收入(兩個變數,不探討因果關係,建議選擇雙變數分析I);變數皆為類別變數,分別有兩種類別,可採用分析方法:費雪精確檢定(Fisher's exact test)或是卡方獨立性(或稱齊一性)檢定(chi-square test of independence or homogeneity),檢定"收入高低與是否參加壽險是否有相關性?"。

回雙變數分析區I

範例B-2:機位種類的選擇和旅途距離相關性的研究 隨著時代的進步以及科技的日新月異,人們賴以移動的交通工具不斷的進步,從早期的利用動物拖曳,到工業革命時期發明蒸氣機後以車、船代步,大大的縮短各地區之間交通往返的時間。有了這些技術之後,人們開始征服天空,發明了飛機能讓人們翱翔於天空,這個發明更讓地球間的距離縮短到一日之內,成了名副其實的地球村。現今工商發達,跨國之間的行業比比皆是,隨之衍生出必要的生意往來,對於航空交通的需求量相當龐大;而休閒產業的發展,出國旅遊更是成為國人每年的必安排的行程。有鑑於此龐大的商機,某航空公司想對市場民眾的需求加以了解,在機場隨機調查了300名旅客,將民眾購買飛機票的類型分為頭等艙、商務艙與經濟艙三種,飛行類型分為國內與國外兩種,分析購買飛機票的種類是否會受到飛行的類型影響;資料記錄於表中。

表:飛行類型與購買機票類型之列聯表。
頭等艙 商務艙 經濟艙
國內 50 49 63
國外 60 42 36

Q1:在長途旅行中常常會使得人產生很嚴重的疲累感,因此在搭乘交通工具時的舒適性就顯得非常重要,但由於飛機上的空間有限,較舒適的乘坐空間必須犧牲一些載客的人數才能達成,航空公司為了能妥善的規劃飛機上的不同艙等的座位數,想透過了解飛行的距離的差異(國內航線與國外航線)是否與乘客選擇不同的艙等有影響來決定,該如何訂定決策呢?
問題解析:此問題中想了解搭乘較遠距離的國外線是否會選擇較舒適的商務艙或頭等艙呢,而搭乘較近距離的國內線則會選擇便宜的經濟艙,此即是討論問題"飛行距離的長短與座艙的選擇是否有相關性?"。
統計方法:此問題中有兩個變數,分別是購買飛機票的類型及飛行類型(兩個變數,不探討因果關係,建議選擇雙變數分析I);變數皆為類別變數,可採用分析方法:費雪精確檢定(Fisher's exact test)或是卡方獨立性(或稱齊一性)檢定(chi-square test of independence or homogeneity),檢定"飛行距離的長短與座艙的選擇是否有相關性?"。

回雙變數分析區I

範例B-3:飲料偏愛的研究 炎炎夏日中清涼解渴的飲料一解人們的煩躁,街上冷飲店林立,各式冷飲琳瑯滿目,讓人不知如何選擇。有一廠商想加盟某飲料店,但不知哪個品牌較受顧客的喜愛且有較大的獲利可能,於是他精選了5家較知名的品牌並委請市調公司調查了各飲料品牌受到顧客喜愛程度的資料,5家廠商分別以A、B、C、D及E表示,顧客喜愛度則區分為不喜歡、普通及喜歡三種;資料記錄於表中。

表:飲料種類與顧客喜愛度之列聯表
A飲料 B飲料 C飲料 D飲料 E飲料
喜愛 55 65 62 19 35
普通 40 55 38 39 31
不喜愛 75 40 50 66 30

Q1:廠商想藉由此調查資料了解顧客對於不同品牌飲料的喜愛程度是否有關聯?有何種品牌的喜愛程度與其他不同嗎??
問題解析:此問題討論顧客的喜愛程度與飲料品牌是否有相關性
統計方法:此問題中有兩個變數,分別是變數一:飲料的種類,變數二:顧客喜愛的程度(兩個變數,不探討因果關係,建議選擇雙變數分析I);變數一與變數二皆為類別變數,可採用分析方法:費雪精確檢定(Fisher's exact test)或是卡方獨立性(或稱齊一性)檢定(chi-square test of independence or homogeneity)。

回雙變數分析區I

範例B-4:軌道哩數和載客量的相關研究 在美國由於幅員相當廣大,交通工具對於民眾是相當重要的,早期發展出許多的火車與電車做為都市間與都市內的運輸工具。隨著經濟的發展,汽車的大量生產與私人化特性,電車的使用量大幅的下降;另外在高密度發展的大都市大都建有高運量的捷運系統,可說是相當的便利。但是汽車的高密度普及使得都市的交通狀況非常壅擠,且地下化捷運興建的成本與時間花費皆高,並不是每個城市皆能興建此種大眾運輸系統,而電車的技術則有了新的發展,因此許多城市轉而發展輕軌電車為其主要的大眾交通運輸系統,輕軌電車被認為是安全性極高的運輸系統。某交通研究機構想了解輕軌電車在美國發展的狀況,記錄了七個城市中輕軌電車系統的軌道鋪設哩數及每週載客人數;資料記錄於表中。

表:各城市輕軌電車鋪設哩數與載客數。
城市 軌道哩數 載客數(千人)
克里弗蘭 15 15
丹佛 17 35
波特蘭 38 81
沙加緬度 21 31
聖地牙哥 47 75
聖荷西 31 30
聖路易斯 34 42

Q1:若城市有較密集的軌道鋪設,使得交通變得更為便利,則民眾搭乘的意願就會提高,但是較密集的鋪設代表著成本的提高,為了對成本與收入之間的關係有較確切的了解,故研究機構想研究鐵軌鋪設的哩數與載客量的關係?
問題解析:此處想了解比較長的鐵軌鋪設哩數會有較高的載客量嗎?或是根本沒有影響,想了解此情況可討論"鐵軌鋪設哩數與載客量的相關性"。
統計方法:此問題中有兩個變數,分別是軌道鋪設哩數與每周載客人數(兩個變數,不探討因果關係,建議選擇雙變數分析I);變數皆為連續變數,可採用分析方法:皮爾生相關係數(Pearson's correlation coefficient)分析,檢定"鐵軌鋪設哩數與載客量的相關性"。

回雙變數分析區I

範例B-5:服務人員的外表條件和業績的相關研究 科技的進步帶動著許多與以往不同的行業進步,電話的技術發展更是日新月異,帶給人們相當大的便利性,早期只有在固定的地方才可以利用電話做為聯繫的工具,但是行動電話的問世改變了現況,只要是訊號所及之處都能讓你隨時隨地的與人聯繫。且隨著技術的普及,成本的降低,現代人可說是人手一支行動電話,更有甚者超過兩隻以上,如此龐大的市場商機,讓電信業成為民眾求職的的熱門行業。某行動電話廠商想要招募一批新的銷售人員,負責招募員工的部門經理想了解何種條件較適合於電話銷售人員,於是針對該公司現有的銷售人員及其業績做一個調查與評比,希望能篩選出適合於銷售人員的條件。該部門經理選出3個銷售門市共15個銷售人員,並且認為銷售人員需與客戶做面對面的接觸,故外在的條件相當重要,他將外在條件依據銷售人員的容貌、服裝儀容及談吐應對的態度加以判定給與分數並排序,等級越高代表外在條件越佳,分為15級分,等級15為最具吸引力,等級1則為最不具吸引力;銷售業績則依業績高低進行排序,等級15為業績最佳者,等級1則為業績最低者。

表:業務員之外在條件與業績等級關係表。
業務編號1 23 4567 891011 12131415
外在條件等級9641513782 14121115310
業績等級83614129411 1071215135

Q1:一般而言,銷售員的容貌、服裝儀容及談吐應對的態度都會影響到銷售成功的與否,好的容貌、乾淨的服儀及良好的談吐對於銷售成功更是具有大大的加分作用。部門經理想了解此一種情況對於銷售電話的業務人員是否適用,該如何利用此資料分析呢?
問題解析:想了解銷售業績的好壞與外在條件的優劣是否有一定的關連,可討論問題"銷售業績與外在條件的相關性"。
統計方法:此問題中有兩個變數,分別是外在條件等級與銷售業績等級(兩個變數,不探討因果關係,建議選擇雙變數分析I);變數皆為類別變數(順序尺度),可採用分析方法:斯皮爾曼等級相關係數(Spearman's rank correlation coefficient)分析,檢定"銷售業績與外在條件的相關性"。

回雙變數分析區I

範例B-6:棒球球員跑速和打擊率的相關分析 棒球運動可以說是最受台灣民眾喜愛的運動之一,可稱為台灣的"國球",在六、七十年代各級棒球隊在國外的比賽可說是牽引著國人的心,由於時差的關係,當時的民眾常常熬夜為比賽球員加油,比賽的勝負也是民眾茶餘飯後的重要話題。某棒球隊教練為了安排比賽的上場棒次順序而傷腦筋,他僅有球員的打擊率及跑壘速度兩種資料可以參考,而他隊上共有12名球員,於是將球員的打擊率由低至高排列順序,等級越高者代表打擊率越高;而跑壘速度資料則是記錄球員由本壘跑至一壘的時間並按時間多寡排列順序,等級越高者代表所花時間越短,即是速度較快;資料列於表中。

表:棒球隊員之打擊率與跑壘速度等級關係表。
隊員編號1 23 4567 891011 12
打擊率等級6321171129 10584
跑壘速度等級5129123117 10468

Q1:在棒球比賽中,打擊率與跑壘的速度都是很重要的能力,高打擊率與跑壘速度較快的選手皆有較高的上壘機率,而跑的較快的球員常常有機會跑出內野安打,因此打擊率與跑壘速度是否有一定程度的關係呢?該教練如何利用此份資料充分了解球員的特性?
問題解析:此處想了解打擊率的高低與跑壘速度的快慢的關係,可探討"打擊率與跑壘速度的相關性"。
統計方法:此問題中有兩個變數,分別是打擊率等級與跑壘速度等級(兩個變數,不探討因果關係,建議選擇雙變數分析I);變數皆為類別變數(順序尺度),可採用分析方法:斯皮爾曼等級相關係數(Spearman's rank correlation coefficient)分析,檢定"打擊率與跑壘速度的相關性"。

回雙變數分析區I

範例C-1:圖書館借書服務的分析 閱讀是一個相當好習慣,有許多研究結果指出閱讀可以增進創造力、想像力與獨立思考能力,在幼兒身體發展的初期,需要不斷的刺激他們的神經元,而閱讀正是一個很好的刺激活動。良好的閱讀習慣是人類累積知識的一種方法,藉由閱讀學習前人所留下來寶貴的知識不斷的促使人類文明與科技進步。在世界上許多生活水準高的國家,其人民閱讀的風氣非常盛行,西方有一句諺語說,打開一本書,你就打開了一個世界,由此可知他們對於閱讀的重視程度。某圖書館館長為了提升附近居民的閱讀風氣,鼓勵民眾像圖書館借書閱讀,希望先了解民眾使用圖書館的習慣。由於現在的圖書館並不僅有圖書出借等單一功能,還提供有許多其他性質的服務,該館長想了解使用圖館的人數越多,是否意味著館內圖書借出的次數也越多,還是民眾僅利用圖書館其他設施。他收集了該館30天的每天入館人數及當天圖書的借出次數,資料列於表中。

表:圖書館入館人次與圖書借出次數分配表
天數 1 2 3 4 5 6 ... 28 29 30
入館人數 655 521 638 601 529 550 ... 668 530 588
借出次數 211 150 188 168 140 199 ... 200 168 179

Q1:館長想了解影響圖書館圖書借出率的原因,是否跟圖書館入館人數有關聯性?是否越多人使用圖書館代表越多的人借閱書籍呢?
問題解析:此處想了解圖書館入館人數與圖書的借出率是否有關係,並找出影響圖書借出率的原因,是否受到圖書館的入館人數多寡的影響,且影響的程度為何,可探討"圖書館入館人數是否會影響圖書的借出率?"。
統計方法:此問題中有兩個變數,分別是入館人數與圖書的借出次數(兩個變數,探討因果關係,建議選擇雙變數分析II)。此資料中想了解使用圖書館的人數(因)越多是否會使得館內圖書借出的次數(果)增減,故入館人數是自變數,而圖書的借出次數是依變數。依變數為連續型變數,可採用分析方法:簡單迴歸分析(simple regression analysis),分析"圖書館入館人數是否會影響圖書的借出率?"。

回雙變數分析區II

範例C-2:廣告效益的研究 一個商品的銷售成功與否並不僅商品本身需要十分的優良,尚需要結合許多其他的因素,如價格的訂定、行銷的通路及商品的知名度等,都是非常重要的。近年來電視的普及程度相當高,每個家庭都會有一台電視機,利用電視廣告的高曝光率來增加商品知名度已經是廠商行之有年的行銷方法,好的電視廣告讓人印象深刻,事半功倍;而不好的電視廣告則可能造成反效果,讓廠商花了大筆的廣告製作與電視台的時段購買費用卻沒有得到相對的獲利。某影印機製造商近年投入許多預算在電視廣告上推廣商品,他想了解此廣告行銷策略的成效如何,雇請了一名統計分析師來分析;表中列出自91年度起至100年度每年的廣告經費支出及年度銷售金額(單位:百萬元)。

表:電視廣告支出與產品銷售金額收入之分配表
年度 91 92 93 94 95 96 97 98 99 100
廣告支出 16.5 15.7 15 16 18 19.6 14 13 14 19.2
銷售金額 230 215 218 235 240 259 215 220 220 243

Q1:廣告商想了解廣告支出是否會影響銷售金額,來決定是否投入更多的廣告花費,越多的廣告支出會增加該廠商的銷售金額嗎?統計分析師會有何建議呢?
問題解析:此處想了解廣告支出與銷售金額是否有關係,並找出影響銷售金額的原因,是否受到廣告支出高低的影響,且影響的程度為何,可探討"廣告支出是否會影響銷售金額?"。
統計方法:此問題中有兩個變數,分別是廣告支出與影印機的銷售金額(兩個變數,探討因果關係,建議選擇雙變數分析II)。此範例中分析廣告支出(因)是否會影響到年度影印機的銷售金額(果),故廣告支出是自變數,而年度影印機的銷售金額則是依變數。依變數為連續型變數,可採用分析方法:簡單迴歸分析(simple regression analysis),分析"廣告支出是否會影響銷售金額?"。

回雙變數分析區II

範例C-3:飛機零件O環的受溫效應 大型的航空運輸工具由於擔負了許多乘載旅客的安全,因此對於機件的生產要求非常嚴格,在機件生產的過程中更需要有嚴格的品管來管控其生產的品質。航空空司委託某金屬研究機構製造一個新型的飛機專用零件O環,由於飛機飛行下該機件必須承載超高溫及高熱,且不能有任何損壞,該研究機構做了一系列的試驗,將新型O環曝露於高溫高熱的環境24小時,記載受熱的溫度及是否因受熱而產生損壞;溫度記錄單位為攝式,記錄有熱損壞變形者記錄值為1,無損壞情形則記錄為0,受試的機件共有20個;資料記錄於表中。

表:O環產生熱損壞與溫度之記錄
編號 1 2 3 4 5 6 7 8 9 10
溫度(攝式) 70 69 68 67 73 70 57 63 70 78
熱損壞 1 0 0 0 1 0 1 1 1 1
編號 11 12 13 14 15 16 17 18 19 20
溫度(攝式) 70 81 76 79 75 76 58 53 67 75
熱損壞 0 0 0 0 1 0 1 1 0 0

Q1:研究機構關心溫度的高低是否會影響新型O環的損壞,多高(低)的溫度會使得新型O環遭受破壞,此新型O環是否適合用於飛機上呢?能承受的溫度有多高(低)呢?
問題解析:此處想了解溫度的高低是否會破壞新型O環,且多高(低)的溫度會造成新型O環的損壞,可探討"溫度高低是否會影響新型O環的損壞?"。
統計方法:此問題中有兩個變數,分別是溫度與熱損壞(兩個變數,探討因果關係,建議選擇雙變數分析II)。此範例中欲了解高溫度(因)下是否會對零件O環產生熱損壞(果),故自變數是溫度,依變數是零件是否產生熱損壞,變數值1表有熱損壞,0表沒有熱損壞。依變數為類別變數,可採用分析方法:簡單邏輯斯迴歸分析(simple logistic regression analysis),分析"溫度高低是否會影響新型O環的損壞?"。

回雙變數分析區II

範例D-1:疫苗安全的研究 疾病對於幼兒而言是非常危險的,在幼兒出生以後都需要定時的接受許多的疫苗接種,疫苗接種的好處是可以使幼兒的體內產生抗體,當受到相同疾病的病毒侵襲時可以免於感染。幼兒出生後需要接種的有卡介苗、B型肝炎疫苗、五合一疫苗(註一)、水痘疫苗等非常多種的疾病疫苗,雖然疫苗可使幼兒體內產生抗體,但是卻可能引起幼兒發燒,導致其他的危險。因此因疫苗的接種而引起發燒症狀的機率一直為政府衛生單位所重視,某衛生單位為了解五合一疫苗的引發發燒症狀的機率以及,紀錄一批到衛生所接種疫苗後24小時內是否有發燒症狀及幼兒的性別與體重資料於表中,共有70位幼兒。

表:幼兒接種疫苗記錄
幼兒編號 1 2 3 4 ... 68 69 70
是否發燒(註二) 1 0 0 1 ... 0 0 1
性別(註三) 0 0 1 1 ... 1 0 1
體重 6.546.658.237.71...8.368.596.91
註一:五合一疫苗包括白喉、破傷風、非細胞性百日咳、B型嗜血桿菌及小兒麻痺。
註二:0表未發燒、1表發燒。
註三:0表女性、1表男性。

Q1:衛生單位想了解幼兒發燒與否是否受到幼兒性別差異與體重高低的影響?是否男(或女)性比較可能發燒?是否體重較輕(或重)的嬰兒比較可能發燒?或是男性且體重較輕的嬰兒比較可能發燒?
問題解析:此時討論影響幼兒發燒的原因,影響的原因有性別及體重的差異,想了解此兩種因素的改變是否會增加發燒的可能,且影響的程度有多大,可探討問題"性別差異與體重差異是否會影響發燒的可能?"。
統計方法:此問題中有三個變數,分別是發燒情況、性別與體重(三個變數,探討因果關係,建議選擇多變數分析)。此範例中幼兒性別差異(因)與體重高低(因)是否會因為接受疫苗接種而產生幼兒發燒(果)的情況,故自變數有二個為幼兒性別差異與體重高低,依變數是發燒情況。依變數為類別變數,可採用分析方法:多元邏輯斯迴歸分析(multiple logistic regression analysis),分析"性別差異與體重差異是否會影響發燒的可能?"。

回多變數分析區

範例D-2:BMI對第II型糖尿病的影響 現代人的生活富裕,大眾的飲食習慣已經與以前差異很大,大魚大肉與暴飲暴食再加上外國高熱量食物的引進,在這麼多的不健康食物與不良的飲食習慣下,隨之而來的是造成許多肥胖的身材,不管是兒童或是年輕人或是中老年人,肥胖所占的人數的比例已經較以前大大的提升。肥胖從醫學的觀點出發涉及到健康的問題,許多的疾病已經證明與肥胖有很大的關係,在肥胖者體內過多的脂肪組織可能是導致疾病的危險因子,據研究肥胖與多種疾病有關,如糖尿病、心臟病、脂肪肝與中風等。在測量是否為肥胖的工具中,最常利用的方法是身體質量指數(BMI),此方法考慮每個人體型的差異,將身高與體重同時納入衡量,適當的BMI介於18.5至24之間,當BMI高於27則有輕度肥胖的可能,當BMI大於35則是重度肥胖了,國防部規定BMI大於33即可免役。由此可知BMI的正確性相當高。在與肥胖有關的疾病中,第二型糖尿病算是比較常見的,此種糖尿病的盛行率隨著地區的差異而有所不同,即是此種並可能受到環境或是種族等因素影響,但是隨著肥胖人口的增加,各地方的盛行率也同時增加,因此普遍認為肥胖是依個重要的因素。某醫院研究單位為了解該市的居民身體健康狀況並了解肥胖與糖尿病的關係,特別為該市天居民男女各40人進行健康檢查,其中男女各有部份人員患有第二型糖尿病,測得資料如表中,共有性別、年齡、BMI、收縮壓及是否患有糖尿病。

表:受測市民健康資料
市民編號 1 2 3 ... 79 80
性別(註一) 1 0 0 ... 1 0
年齡 45 52 50 ... 38 33
BMI 19.926.523.5 ...24.620.1
糖尿病患病情況(註二) 011...10
註一:0表女性、1表男性。
註二:0表未患病、1表患病。

Q1:BMI指數在某種程度上常常能代表身體健康的程度,過高的BMI指數代表過胖的身體,而肥胖的人往往有很高的機會患有糖尿病;年齡較大者由於身體的老化進而新陳代謝功能變差,往往也是容易換有疾病的高危險群,依據以往研究結果顯示,此兩因素與糖尿病有一定程度的關係,除了此兩因素外,研究單位想了解性別是否也會與糖尿病有關聯?
問題解析:此處欲討論影響糖尿病的因素,且討論因素共有三個,分別是BMI指數、年齡與性別,想了解此三個因素對於糖尿病的影響,是否會增加罹患糖尿病的可能,可探討問題"BMI指數、年齡及性別是否會影響糖尿病患病可能?"。
統計方法:此問題中有四個變數,分別是BMI指數、年齡、性別及糖尿病患病情況(四個變數,探討因果關係,建議選擇多變數分析)。此範例中想了解BMI指數、年齡與性別(因)等不同條件是否就有可能罹患糖尿病(果),故自變數有三個為BMI指數、年齡與性別,依變數是糖尿病患病情況。依變數為類別變數,可採用分析方法:多元邏輯斯迴歸分析(multiple logistic regression analysis),分析"BMI指數、年齡及性別是否會影響糖尿病患病可能?"。

Q2: 一個人的BMI指數是由身高與體重換算而來的,但是對於不同性別與年齡,是否會使得BMI指數有所不同呢?研究單位想了解性別與年齡對於BMI指數的影響?是否有關聯呢?
問題解析:此處欲討論影BMI指數的的因素,且討論因素共有兩個,分別是年齡與性別,想了解此兩個因素對於BMI指數的影響,可探討問題"年齡與性別會影響BMI指數嗎?"。
統計方法:此問題中有三個變數,分別是性別、年齡及BMI指數(三個變數,探討因果關係,建議選擇多變數分析)。此問題中想了解性別與年齡(因)等不同條件是否對BMI指數(果)有影響,故自變數有兩個為性別與年齡,依變數是BMI指數。依變數為連續變數,可採用分析方法:多元迴歸分析(multiple regression analysis),分析"年齡與性別影響BMI指數嗎?"。

回多變數分析區

範例E-1:抽菸對肺癌病患存活的影響 隨著醫療科技的進步,最威脅人類生命的疾病已經從幾十年前的傳染病改變成癌症,癌症可以說是現代人的文明病,許多的癌症發生都與現代人的生活習慣有關,如口腔癌的發生有很大的機率與嚼食檳榔有關;而肺癌則與吸菸的習關有很大的關聯。依行政院衛生署所公佈的統計數據顯示因癌症死亡佔所有死亡人數的28.1%,連續28年為台灣十大死因榜首,在這麼多的癌症中,肺癌則是死亡人數最高的。因此對於癌症的治療,可以說是醫學研究中最不遺餘力的事,某醫學機構針對肺癌做了一個長期性的追蹤研究,歷時5年,共收集了80個患有肺癌的病人的資料,資料中記錄病患的性別、年齡等基本資料,以及抽菸習慣,手術及治療方式,並記載進入與離開追蹤研究的時間,詳細說明見表及註。

表:受測市民健康資料
病患編號 1 2 3 ... 79 80
性別(註一) 0 1 0 ... 1 0
年齡 40 48 39 ... 55 46
是否吸菸(註二) 011 ...01
是否接受手術治療(註三) 011...11
後續治療方式(註四) 122...23
追蹤研究時間(註五) 195027...3842
最後追蹤的狀態(註六) 010...01
註一: 0表女性、1表男性
註二: 0表未吸菸、1表吸菸
註三: 0表未接受手術治療、1表接受手術治療
註四: 1表化學治療、2表放射治療、3表兩者同時
註五: 以月份為單位,1代表進入研究1個月,60代表進入研究5年
註六: 0表存活、1表死亡

Q1:在醫學研究中,對於各種疾病的存活機率是相當重要的研究,此種研究可提供醫生診斷時的依據,故醫學機構想了解此組肺癌病患資料的存活率為何?該如何分析呢?
問題解析:此處想了解病患的存活率,在資料中須先了解兩個重要變數,一為時間變數:病人在研究中的停留的時間,一為事件變數:病人在研究中的狀態(死亡或者發病),有了此資料即可使用存活分析討論"肺癌病患存活函數的估計"。
統計方法:此問題中有兩個變數,分別是追蹤研究時間(時間變數)與最後追蹤的狀態(事件變數)。 此範例中想了解肺癌病患的存活函數,建議選擇存活分析。可採用分析方法:Kaplan-Meier存活函數估計(Kaplan-Meier estimation for survival function),分析"肺癌病患存活函數的估計"。

Q2:在分析肺癌病患的存活率後,醫學機構想進一步了解不同性別下的病患的存活率?且其存活函數為何?該如何分析呢?
問題解析:此處想了解不同性別下病患的存活率,並分析存活函數,在資料中須先暸解兩個重要變數,一為時間變數:病人在研究中的停留的時間,一為事件變數:病人在研究中的狀態(死亡或者發病),再加入性別的變數為分組變數,此分組資料即可使用存活分析討論"不同性別時存活函數的估計"。
統計方法:此問題中有三個變數,分別是追蹤研究時間(時間變數)、最後追蹤的狀態(事件變數)與性別(分組變數)。此範例中想了解不同性別肺癌病患的存活函數,建議選擇存活分析。性別為類別型共變數,將資料區分為兩組,可採用分析方法:兩個(含)以上存活函數的估計(estimation for two or more survival functions),分析"不同性別時存活函數的估計"。

Q3:吸菸有害健康,由其對於肺部疾病的影響甚鉅,這組肺癌病患是否反映出此種情況呢?吸菸與不吸菸的病患存活函數有差異嗎?
問題解析:此處想了解吸菸與否對於病患的存活率是否有影響,並分析存活函數的差異,在資料中暸解兩個重要變數,一為時間變數:病人在研究中的停留的時間,一為事件變數:病人在研究中的狀態(死亡或者發病),再加入吸菸與否的變數為分組變數,此分組資料即可使用存活分析討論"吸菸與否的存活函數是否有差異?"。
統計方法:此問題中有三個變數,分別是追蹤研究時間(時間變數)、最後追蹤的狀態(事件變數)與吸菸與否(分組變數)。此範例中想了解吸菸與否的肺癌病患的存活函數的差異,建議選擇存活分析。吸菸與否為類別型共變數,將資料區分為兩組,且需檢定兩組存活函數的差異,可採用分析方法:兩個(含)以上存活函數的比較(comparison for two or more survival functions),檢定"吸菸與否的存活函數是否有差異?"。

Q4:在討論影響疾病患者存活機率時,影響的因素通常不是唯一,且不是單獨的影響,若想同時了解不同性別、吸菸與否及年齡等因素對於肺癌病患存活率的影響,該如何分析較佳?
問題解析:此處想同時了解不同性別、吸菸與否及年齡等因素對於肺癌病患存活率的影響,可利用存活分析中的Cox比例風險模式來分析,將性別、吸菸與否及年齡等三個變數當作共變數,即可同時討論多個影響因素對於存活率的影響,分析"性別、吸菸與否及年齡是否會影響肺癌病患的存活函數?"。
統計方法:此問題中有五個變數,分別是追蹤研究時間(時間變數)、最後追蹤的狀態(事件變數)、性別(共變數)、吸菸(共變數)及年齡(共變數)。此範例中想同時了解不同性別、吸菸與否及年齡等三個因素對於肺癌存活率的影響,建議選擇存活分析,有三個共變數(類別與連續皆可),可採用分析方法:Cox比例風險模型(Cox proportional hazards model),分析"性別、吸菸與否及年齡是否會影響肺癌病患的存活函數?"。

回存活分析區

範例E-2:不同透析治療方法對洗腎病患存活的影響 國人十大死因中有一些疾病是較不為人所熟知,但卻已經對於生命有一定的威脅性,其中第七名的腎臟病即是如此,腎臟病的種類繁多,而且容易因其他疾病而引起腎臟的病變,如糖尿病及高血壓患者皆易發生。腎臟是人體內非常重要的器官,主要的功能是調節身體內的水份,且會分泌紅血球生成素及一些重要物質,當腎臟一旦受損,對於身體的健康影響巨大,也會影響到正常生活。而現代人的飲食習慣造成了腎臟巨大的負荷,進而罹患了腎臟的疾病,因此良好的飲食習慣及飲食內容是分常重要的。大部份的長期腎臟病治療方法為透析治療或是腎臟移植,由於器官的取得不易且費用昂貴,大部份的病患會選擇透析治療,透析治療又分為兩種,一種是血液透析治療,另一種稱為腹膜透析治療。這兩種治療方法各有其優點與缺點,對於不同狀況的病人,醫生可能會採取不同的透析方法,因此哪一種方法的醫療效果較佳就成為研究人員非常關心的議題。有一組醫療研究人員觀察醫院近十年的腎臟病洗腎患者進行透析治療的結果,詳細的記錄了洗腎病患的資料,共有80位洗腎病患,詳細說明見表及註。

表:受測市民健康資料
病患編號 1 2 3 ... 79 80
性別(註一) 0 1 0 ... 1 0
年齡 40 48 39 ... 55 46
透析治療方式(註二) 212...11
追蹤研究時間(註三) 321565...7230
最後追蹤的狀態(註四) 001...01
註一:0表女性、1表男性
註二: 1表血液透析治療、2表腹膜透析治療
註三: 該病患於研究中追蹤之時間長度(單位:月)
註四: 0表存活(或設限)、1表死亡

Q1:在醫學研究中,對於各種疾病的存活機率是相當重要的研究,此種研究可提供醫生診斷時的依據,研究人員想了解這組洗腎病患資料的存活函數為何?該如何分析呢?
問題解析:此處想了解病患的存活率,在資料中須先了解兩個重要變數,一為時間變數:病人在研究中的停留的時間,一為事件變數:病人在研究中的狀態(死亡或者發病),有了此資料即可使用存活分析討論"洗腎病患存活函數的估計"。
統計方法:此問題中有兩個變數,分別是追蹤研究時間(時間變數),最後追蹤的狀態(事件變數)。 此範例中想了解洗腎病患的存活函數,建議選擇存活分析。可採用分析方法:Kaplan-Meier存活函數估計(Kaplan-Meier estimation for survival function),分析"洗腎病患存活函數的估計"。

Q2:在洗腎病患的透析治療中,不同的治療其結果可能不同,故研究人員想了解在此組資料下兩種治療方法下的存活函數會有差異嗎?
問題解析:此處想了解不同的治療方法對於病患的存活率是否有影響,並分析存活函數的差異,在資料中暸解兩個重要變數,一為時間變數:病人在研究中的停留的時間,一為事件變數:病人在研究中的狀態(死亡或者發病),再加上不同透析治療方法的變數為分組變數,此分組資料即可使用存活分析討論"不同透析治療方法下的存活函數是否有差異?"。
統計方法:此問題中有三個變數,分別是最追蹤研究時間(時間變數)、最後追蹤的狀態(事件變數)及透析治療方法(共變數)。 此範例中想了解不同透析治療方法對於洗腎病患的存活是否有影響,建議選擇存活分析。透析治療方法為類別型共變數,將資料區分為兩組,並需檢定兩組存活函數的差異,可採用分析方法:兩個(含)以上存活函數的比較(comparison for two or more survival functions),檢定"不同透析治療方法下的存活函數是否有差異?"。

Q3:在討論影響疾病患者存活機率時,影響的因素通常不是唯一,且不是單獨的影響,若想同時了解性別、年齡及透析治療方法等因素對於洗腎病患存活率的影響,適合用何種方法?
問題解析:此處想同時了解性別、年齡及透析治療方法等因素對於洗腎病患存活率的影響,可利用存活分析中的Cox比例風險模式來分析,將性別、年齡及透析治療方法等三個變數當作共變數,即可同時討論多個影響因素對於存活率的影響,分析"性別、年齡即透析治療方法是否會影響洗腎病患的存活函數?"。
統計方法:此問題中有五個變數,分別是最追蹤研究時間(時間變數)、最後追蹤的狀態(事件變數)、性別(共變數)、年齡(共變數)及透析治療方法(共變數)。此範例中想同時了解不同性別、年齡以及透析治療方法等三個因素對於洗腎病患存活率的影響,建議選擇存活分析,有三個共變數(類別與連續皆可),可採用分析方法:Cox比例風險模型(Cox proportional hazards model),分析"性別、年齡即透析治療方法是否會影響洗腎病患的存活函數?"。

回存活分析區