One Way Anova
pendidikan <- factor(rep(c("SMA", "Sarjana", "Pascasarjana"), each=10))
pendapatan <- c(3000, 3200, 3100, 3050, 2950, 3100, 3000, 3200, 3150, 3100, 5000, 5200, 5100,5300, 5400, 5100, 5000, 5150, 5250,5200,
7000, 7200, 7100, 7300, 7350, 7100, 7000, 7200, 7250, 7300)
data <- data.frame(pendidikan, pendapatan)
head(data)
## pendidikan pendapatan
## 1 SMA 3000
## 2 SMA 3200
## 3 SMA 3100
## 4 SMA 3050
## 5 SMA 2950
## 6 SMA 3100
boxplot(pendapatan ~ pendidikan, data = data, main = "Pendapatan Berdasarkan Tingkat Pendidikan", xlab = "Tingkat Pendidikan", ylab = "Pendapatan", col = "purple")

par(mfrow = c(1, 3))
qqnorm(data$pendapatan[data$pendidikan == "SMA"], main = "Normal Q-Q Plot SMA")
qqline(data$pendapatan[data$pendidikan == "SMA"], col = "red")
qqnorm(data$pendapatan[data$pendidikan == "Sarjana"], main = "Normal Q-Q Plot Sarjana")
qqline(data$pendapatan[data$pendidikan == "Sarjana"], col = "red")
qqnorm(data$pendapatan[data$pendidikan == "Pascasarjana"], main = "Normal Q-Q Plot Pascasarjana")
qqline(data$pendapatan[data$pendidikan == "Pascasarjana"], col = "red")

shapiro.test(data$pendapatan[data$pendidikan == "SMA"])
##
## Shapiro-Wilk normality test
##
## data: data$pendapatan[data$pendidikan == "SMA"]
## W = 0.9389, p-value = 0.5409
shapiro.test(data$pendapatan[data$pendidikan == "Sarjana"])
##
## Shapiro-Wilk normality test
##
## data: data$pendapatan[data$pendidikan == "Sarjana"]
## W = 0.9612, p-value = 0.7994
shapiro.test(data$pendapatan[data$pendidikan == "Pascasarjana"])
##
## Shapiro-Wilk normality test
##
## data: data$pendapatan[data$pendidikan == "Pascasarjana"]
## W = 0.92313, p-value = 0.3838
anova_result <- aov(pendapatan ~ pendidikan, data = data)
summary(anova_result)
## Df Sum Sq Mean Sq F value Pr(>F)
## pendidikan 2 83854500 41927250 3214 <2e-16 ***
## Residuals 27 352250 13046
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
TukeyHSD(anova_result)
## Tukey multiple comparisons of means
## 95% family-wise confidence level
##
## Fit: aov(formula = pendapatan ~ pendidikan, data = data)
##
## $pendidikan
## diff lwr upr p adj
## Sarjana-Pascasarjana -2010 -2136.651 -1883.349 0
## SMA-Pascasarjana -4095 -4221.651 -3968.349 0
## SMA-Sarjana -2085 -2211.651 -1958.349 0