#1110730318
#一、上次考試的媒體識讀平均成績為62分,請問本次考試是否有顯著進步?單一樣本T檢定
#先畫圖瞭解資料
#hist(grade$media)
#boxplot(grade$media, horizontal = TRUE)
# Step1:分析樣本平均數或建立交叉表
#summary(media)
# Step2:決定顯著水準( 0.1, 0.05, 0.01, 0.001)
# p<0.05
# Step3:寫出虛無假設與對立假設
# H0:μ = 62。平均成績小於等於62分。
# H1:μ != 62 .平均成績大於62分。
# Step4:決定檢定方法
# 單一樣本t檢定
# Step5:計算檢定值。
#t.test(media, mu=62, alternative="greater")#alternative="greater"右尾檢定
# t = 2.3482, df = 59。 #df叫做自由度(n-1)
# Step6:計算p值
# p-value =0.01112
# Step7:下決策
# 因為p-value(0.01112)<0.05,所以拒絕虛無假設,對立假設成立:本次考試有顯著進步
#二、不同性別的英文成績是否有顯著差異? 獨立樣本T檢定
#hist(grade$english)
#boxplot(grade$english, horizontal = TRUE)
#str(grade$gender)#必須是factor型態
#summary(grade$english)##必須是numeric型態
#str(grade$english)
#轉換格式:轉換為因子(factor)
#grade$gender<- factor(grade$gender, labels = c("男", "女"))
#str(grade$gender)
#先畫盒狀圖比較兩組樣本
#plot(grade$gender, grade$english)#分組盒狀圖:plot(類別變數,連續變數)
# 撰寫分析步驟
# Step1:分析樣本平均數或建立交叉表
#summary(grade$gender)
#summary(grade$english)
#先分組,再計算
#tapply(被分析的欄位(連續變數),分組依據欄位(類別變數),計算函數)
#tapply(grade$english, grade$gender, mean)
# Step2:決定顯著水準( 0.1, 0.05, 0.01, 0.001)
# p<0.05
# Step3:寫出虛無假設與對立假設
# H0:μ男 = μ女。不同性別的英文成績沒有顯著差異。
# H1:μ男!= μ女。不同性別的英文成績有顯著差異。
# Step4:決定檢定方法
# 獨立樣本T檢定
# Step5:計算檢定值。
#首先要檢定兩組樣本變異數是否相等
#var.test(依變數~自變數)
#var.test(grade$english~grade$gender)# (p-value = 0.04522)<0.05,變異數相等。
#獨立樣本T檢定(變異數相等設定為var.equal = TRUE,反之為var.equal = FALSE)
#t.test(依變數~自變數, var.equal = TRUE)
#t.test(grade$english~grade$gender, var.equal = TRUE,alternative="two.sided")
# Step6:計算p值
#p-value = 0.1397
# Step7:下決策
#因為(p-value = 0.1397)>0.05,所以無法拒絕虛無假設:不同性別的英文成績沒有顯著差異
#三、不同科系的媒體識讀成績是否有顯著差異? onewayanova
#hist(grade$media)
#boxplot(grade$media, horizontal = TRUE)
#summary(grade$department)
#str(grade$department)
#summary(grade$media)
#str(grade$media)
#Step1:分析樣本平均數或建立交叉表
#先分組,再計算
#library(dplyr)
#str(grade)
#mytable <- grade %>%
#group_by(grade$department) %>%
#summarise(次數= n(), 平均數 = mean(grade$media), 標準差 = sd(grade$media))
#mytable
# 品種 人數 平均數 標準差
# 1 品種1 10 84 4.55
# 2 品種2 10 74 4.45
# 3 品種3 10 82 5.27
# Step2:決定顯著水準( 0.1, 0.05, 0.01, 0.001)
# p<0.05
# Step3:寫出虛無假設與對立假設
# H0:不同科系的媒體視讀成績"沒有顯著差異"。
# H1:不同科系的媒體視讀成績"有顯著差異"。
# Step4:決定檢定方法
# 單因子變異數分析 one-way ANOVA
# Step5:計算檢定值。
#model_1w<-aov(grade$media~grade$department)
#summary(model_1w)
#檢定值F = 0.913
# Step6:計算p值
#p-value = 0.441
# Step7:下決策
#因為(p-value = 0.441)<0.05,所以無法拒絕虛無假設:不同科系的媒體視讀成績"沒有顯著差異"。
# Step8:事後比較 !!如果不能拒絕虛無假設,則不需事後比較!!
#四、男生的英文成績是否低於女生?ˊ獨立樣本T檢定
#u男大於等於u女
#str(grade$gender)#必須是factor型態
#summary(grade$english)##必須是numeric型態
#str(grade$english)
#轉換格式:轉換為因子(factor)
#grade$gender<- factor(grade$gender, labels = c("男", "女"))
#str(grade$gender)
#先畫盒狀圖比較兩組樣本
#plot(grade$gender, grade$english)#分組盒狀圖:plot(類別變數,連續變數)
# 撰寫分析步驟
# Step1:分析樣本平均數或建立交叉表
#summary(grade$gender)
#summary(grade$english)
#先分組,再計算
#tapply(被分析的欄位(連續變數),分組依據欄位(類別變數),計算函數)
#tapply(grade$english, grade$gender, mean)
# Step2:決定顯著水準( 0.1, 0.05, 0.01, 0.001)
# p<0.05
# Step3:寫出虛無假設與對立假設
# H0:男生的成績有低於女生。
# H1:男生的成績沒有低於女生。
# Step4:決定檢定方法
# 獨立樣本T檢定
# Step5:計算檢定值。
#首先要檢定兩組樣本變異數是否相等
#var.test(依變數~自變數)
#var.test(grade$english~grade$gender)# (p-value = 0.04522)<0.05,變異數相等。
#獨立樣本T檢定(變異數相等設定為var.equal = TRUE,反之為var.equal = FALSE)
#t.test(依變數~自變數, var.equal = TRUE)
#t.test(grade$english~grade$gender, var.equal = TRUE,alternative="greater")
# Step6:計算p值
#p-value = 0.9301
# Step7:下決策
#因為(p-value = 0.9301)>0.05,所以無法拒絕虛無假設:男生的成績有低於女生
#五、該校的男女比例是否有顯著差異?卡方適合度檢定
#step1
#table(gender)
#x <- table(gender)
# step2:決定顯著水準
# p<0.05
# Step3:寫出虛無假設與對立假設
# H0:男女比例沒有顯著差異。
# H1:男女比例有顯著差異。
# Step4:決定檢定方法
# 卡方適合度檢定
# Step5:計算檢定值。
#chisq.test(x)
# X-squared = 29.4, df = 1。
# Step6:計算p值
# p-value = 5.888e-08
# Step7:下決策
# 因為p-value (5.888e-08)<0.05,所以拒絕虛無假設,對立假設成立:男女比例有顯著差異。
#六、不同科系的男女比例是否有差異?
#step1
#y <- table(department,gender)
#y
# step2:決定顯著水準
# p<0.05
# Step3:寫出虛無假設與對立假設
# H0:不同科系男女比例沒有差異。
# H1:不同科系男女比例有差異。
# Step4:決定檢定方法
# 卡方獨立性檢定
# Step5:計算檢定值。
#chisq.test(y)
# X-squared = 4.0765, df = 3。
# Step6:計算p值
# p-value = 0.2533
# Step7:下決策
# 因為p-value (0.2533)>0.05,所以無法拒絕虛無假設:不同科系男女比例沒有明顯差異。