One Way Anova

pendidikan <- factor(rep(c("SMA", "Sarjana", "Pascasarjana"), each=10))
pendapatan <- c(3000, 3200, 3100, 3050, 2950, 3100, 3000, 3200, 3150, 3100, 5000, 5200, 5100,5300, 5400, 5100, 5000, 5150, 5250,5200,
7000, 7200, 7100, 7300, 7350, 7100, 7000, 7200, 7250, 7300)
data <- data.frame(pendidikan, pendapatan)
head(data)
##   pendidikan pendapatan
## 1        SMA       3000
## 2        SMA       3200
## 3        SMA       3100
## 4        SMA       3050
## 5        SMA       2950
## 6        SMA       3100
boxplot(pendapatan ~ pendidikan, data = data, main = "Pendapatan Berdasarkan Tingkat Pendidikan", xlab = "Tingkat Pendidikan", ylab = "Pendapatan", col = "purple")

par(mfrow = c(1, 3))  
qqnorm(data$pendapatan[data$pendidikan == "SMA"], main = "Normal Q-Q Plot SMA")
qqline(data$pendapatan[data$pendidikan == "SMA"], col = "red")

qqnorm(data$pendapatan[data$pendidikan == "Sarjana"], main = "Normal Q-Q Plot Sarjana")
qqline(data$pendapatan[data$pendidikan == "Sarjana"], col = "red")

qqnorm(data$pendapatan[data$pendidikan == "Pascasarjana"], main = "Normal Q-Q Plot Pascasarjana")
qqline(data$pendapatan[data$pendidikan == "Pascasarjana"], col = "red")

shapiro.test(data$pendapatan[data$pendidikan == "SMA"])
## 
##  Shapiro-Wilk normality test
## 
## data:  data$pendapatan[data$pendidikan == "SMA"]
## W = 0.9389, p-value = 0.5409
shapiro.test(data$pendapatan[data$pendidikan == "Sarjana"])
## 
##  Shapiro-Wilk normality test
## 
## data:  data$pendapatan[data$pendidikan == "Sarjana"]
## W = 0.9612, p-value = 0.7994
shapiro.test(data$pendapatan[data$pendidikan == "Pascasarjana"])
## 
##  Shapiro-Wilk normality test
## 
## data:  data$pendapatan[data$pendidikan == "Pascasarjana"]
## W = 0.92313, p-value = 0.3838
anova_result <- aov(pendapatan ~ pendidikan, data = data)
summary(anova_result)
##             Df   Sum Sq  Mean Sq F value Pr(>F)    
## pendidikan   2 83854500 41927250    3214 <2e-16 ***
## Residuals   27   352250    13046                   
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
TukeyHSD(anova_result)
##   Tukey multiple comparisons of means
##     95% family-wise confidence level
## 
## Fit: aov(formula = pendapatan ~ pendidikan, data = data)
## 
## $pendidikan
##                       diff       lwr       upr p adj
## Sarjana-Pascasarjana -2010 -2136.651 -1883.349     0
## SMA-Pascasarjana     -4095 -4221.651 -3968.349     0
## SMA-Sarjana          -2085 -2211.651 -1958.349     0