#Filas es igual a longitud y columnas latitudes

library(readxl)
ejercicio5 <- read_excel("C:\\Users\\57321\\Documents\\R\\Excel rstudio\\ejercicio5.xlsx", 
    col_types = c("text", "text", "numeric"))
df<-data.frame(ejercicio5)
library(collapsibleTree)
collapsibleTreeSummary(df, hierarchy = c('bloque', 'cat', 'datos'))

\[H_0=\mu_{A}=\mu_{B}=\mu_{C}=\mu_{D}=\mu_{E}=\mu_{F}=\mu_{G}=\mu_{H}\]

ANV = lm(datos ~ cat + bloque, data = df)
anova(ANV)
## Analysis of Variance Table
## 
## Response: datos
##            Df Sum Sq Mean Sq F value Pr(>F)    
## cat         7 97.500  13.929  23.728 <2e-16 ***
## bloque      1  0.000   0.000   0.000      1    
## Residuals 119 69.855   0.587                   
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

#Se rechaza la hipotesis nula por lo que se dice que hay diferencia en los tratamientos

tapply(df$datos, list(df$cat, df$bloque), mean)
##   latitud longitud
## A 18.0875  18.0875
## B 17.5000  17.5000
## C 17.8875  17.8875
## D 17.0625  17.0625
## E 17.0875  17.0875
## F 16.2625  16.2625
## G 15.7875  15.7875
## H 18.5750  18.5750
tapply(df$datos, df$cat, mean)
##       A       B       C       D       E       F       G       H 
## 18.0875 17.5000 17.8875 17.0625 17.0875 16.2625 15.7875 18.5750
tapply(df$datos, df$bloque, mean)
##  latitud longitud 
## 17.28125 17.28125
boxplot(df$datos~df$cat,
        col= palette(rainbow(8)),xlab=("Categorias"),ylab=("Frecuencias"),main="Grafico de Medias y varianzas por Bloque")

#Segun los valores se determina que el mejor tratamiento es H con una media 18,5750

boxplot(df$datos~df$bloque,
        col= palette(rainbow(8)),xlab=("Categorias"),ylab=("Frecuencias"),main="Grafico de Medias y varianzas por Bloque")