##ANOVA

Se agregan las librerias necesarias para realizar un anova

library(ISLR)
## Warning: package 'ISLR' was built under R version 4.3.1
library(ggplot2)

Base de datos: Se generan las estadisticas de un torneo de CRICKET, donde se generan 5 equipos y sus carreras

set.seed(42) # Para reproducibilidad

equipos <- c("EquipoA", "EquipoB", "EquipoC", "EquipoD", "EquipoE")

runs <- sample(10:60, 50, replace = TRUE)
equipos_generados <- sample(equipos, 50, replace = TRUE)

DB_RUNS <- data.frame(team = equipos_generados, runs = runs)
str(DB_RUNS)
## 'data.frame':    50 obs. of  2 variables:
##  $ team: chr  "EquipoB" "EquipoC" "EquipoA" "EquipoE" ...
##  $ runs: int  58 46 10 34 19 45 27 58 56 33 ...

Se genero la base de datos con los registros

table(DB_RUNS$team)
## 
## EquipoA EquipoB EquipoC EquipoD EquipoE 
##       8      13       6      10      13
aggregate(runs~team, data=DB_RUNS, FUN=mean)
##      team     runs
## 1 EquipoA 28.75000
## 2 EquipoB 36.46154
## 3 EquipoC 42.50000
## 4 EquipoD 39.20000
## 5 EquipoE 36.69231
ggplot(data=DB_RUNS, aes(x=team, y=runs, color= team)) + geom_boxplot()+ theme_bw()

anova=aov(DB_RUNS$runs ~ DB_RUNS$team)
summary(anova)
##              Df Sum Sq Mean Sq F value Pr(>F)
## DB_RUNS$team  4    770   192.4   0.908  0.468
## Residuals    45   9541   212.0
plot(TukeyHSD(anova))