##ANOVA
Se agregan las librerias necesarias para realizar un anova
library(ISLR)
## Warning: package 'ISLR' was built under R version 4.3.1
library(ggplot2)
Base de datos: Se generan las estadisticas de un torneo de CRICKET, donde se generan 5 equipos y sus carreras
set.seed(42) # Para reproducibilidad
equipos <- c("EquipoA", "EquipoB", "EquipoC", "EquipoD", "EquipoE")
runs <- sample(10:60, 50, replace = TRUE)
equipos_generados <- sample(equipos, 50, replace = TRUE)
DB_RUNS <- data.frame(team = equipos_generados, runs = runs)
str(DB_RUNS)
## 'data.frame': 50 obs. of 2 variables:
## $ team: chr "EquipoB" "EquipoC" "EquipoA" "EquipoE" ...
## $ runs: int 58 46 10 34 19 45 27 58 56 33 ...
Se genero la base de datos con los registros
table(DB_RUNS$team)
##
## EquipoA EquipoB EquipoC EquipoD EquipoE
## 8 13 6 10 13
aggregate(runs~team, data=DB_RUNS, FUN=mean)
## team runs
## 1 EquipoA 28.75000
## 2 EquipoB 36.46154
## 3 EquipoC 42.50000
## 4 EquipoD 39.20000
## 5 EquipoE 36.69231
ggplot(data=DB_RUNS, aes(x=team, y=runs, color= team)) + geom_boxplot()+ theme_bw()
anova=aov(DB_RUNS$runs ~ DB_RUNS$team)
summary(anova)
## Df Sum Sq Mean Sq F value Pr(>F)
## DB_RUNS$team 4 770 192.4 0.908 0.468
## Residuals 45 9541 212.0
plot(TukeyHSD(anova))