1. Instalamos y/o activamos los paquetes

library(tidyverse)
library(readxl)

1.1. Cargamos la base de datos

MANDARINAS <- read_excel("MANDARINAS_2024.xlsx")

1.2. Filtramos la base de datos (Grupo 2 y 4)

MANDARINAS_FILT <- MANDARINAS %>% 
  filter(GRUPO %in% c(2,4))

2.A. Análisis comparativo de variedades

A1. Según su peso

ggplot(MANDARINAS_FILT,aes(VARIEDAD, PESO, color=VARIEDAD)) +
  geom_boxplot() + theme_bw() +
  stat_summary(fun=mean, color = "black") +
  scale_colour_manual(values = c("Clementina" = "orange", "Criolla" = "purple")) +
  labs(title = "Comparación de 2 variedades de mandarinas según su peso", x="Variedad", y="Peso (g)")

Medidas de resumen

MANDARINAS_FILT %>% 
  group_by(VARIEDAD) %>%
  summarise(MIN_PESO=min(PESO),
            MAX_PESO=max(PESO),
            MEDIA_PESO=mean(PESO),
            MEDIANA_PESO=median(PESO))
## # A tibble: 2 × 5
##   VARIEDAD   MIN_PESO MAX_PESO MEDIA_PESO MEDIANA_PESO
##   <chr>         <dbl>    <dbl>      <dbl>        <dbl>
## 1 Clementina       64      273       151.         152 
## 2 Criolla          91      241       143.         146.

Conclusión

La variedad clementina presenta un peso promedio de 151 gr siendo superior a la variedad criolla cuyo peso promedio es de 143 gr.
La mayor variabilidad y mayor peso promedio se observa en la variedad clementina la cual presenta un valor atípico que aumenta el promedio en peso de los frutos en comparación a la variedad criolla.
La mediana en ambos casos se encuentra muy cercana a la media lo cual indica que los datos están distribuidos de una manera simétrica.

A2. Según su diámetro ecuatorial

ggplot(MANDARINAS_FILT,aes(VARIEDAD, DIAM_ECUAT, color=VARIEDAD)) +
  geom_boxplot() + theme_bw() +
  stat_summary(fun=mean, color = "black") +
  scale_colour_manual(values = c("Clementina" = "orange", "Criolla" = "purple")) +
  labs(title= "Comparación de 2 variedades de mandarinas según su diámetro ecuatorial",
       x="Variedad",
       y="Diámetro Ecuatorial (cm)") +
   scale_y_continuous(breaks = seq(40, 90, by = 5))

Medidas de resumen

MANDARINAS_FILT %>% 
  group_by(VARIEDAD) %>%
  summarise(MIN_DIAM_EC=min(DIAM_ECUAT),
            MAX_DIAM_EC=max(DIAM_ECUAT),
            MEDIA_DIAM_EC=mean(DIAM_ECUAT),
            MEDIANA_DIAM_EC=median(DIAM_ECUAT))
## # A tibble: 2 × 5
##   VARIEDAD   MIN_DIAM_EC MAX_DIAM_EC MEDIA_DIAM_EC MEDIANA_DIAM_EC
##   <chr>            <dbl>       <dbl>         <dbl>           <dbl>
## 1 Clementina        50.3        86.4          68.3            70.2
## 2 Criolla           57.4        81.1          67.1            69.6

Conclusión

La variedad clementina presenta un diámetro ecuatorial con respecto a la media y la mediana relativamente igual al de la variedad criolla.
La mayor variabilidad en esta variable se observa en la variedad criolla. Así mismo, en clementina los valores atípicos nos indican la presencia de frutos con menor diámetro con respecto a la variedad criolla.

2.B. Relación entre Peso y Diámetro por Grupo

ggplot(MANDARINAS_FILT,aes(PESO, DIAM_ECUAT, color=as.factor(GRUPO))) +
  geom_point(shape = 18, size=3) +
  facet_grid(GRUPO ~.) +
  theme_gray() +
  geom_smooth(method = "lm", se = FALSE, color = "black") +
  labs(color = "Grupo",
       title= "Relación entre peso y diámetro ecuatorial por grupo",
       x="Peso (g)",
       y="Diámetro Ecuatorial (cm)") +
  scale_color_manual(values = c("2" = "darkgreen", "4" = "navy"))

Conclusión

El grupo 2 presenta una asociación alta entre el peso y diámetro ecuatorial de los frutos. Mientras que en el grupo 4 no se observa una tendencia claramente definida, lo que sugiere una baja asociación entre las variables analizadas. Este resultado podría atribuirse a diversos factores, como errores en la etapa de muestreo, en los procedimientos de medición, en la calibración del instrumental, entre otros. Sin embargo, tras observar la base de datos, se identificó que el error pudo haber ocurrido en el proceso de registro manual de los datos.

2.C. Relación entre Peso y Diámetro por Variedad

Conclusión

La variedad criolla presenta una asociación alta entre el peso y diámetro ecuatorial de los frutos con datos muy homogéneos y concentrados linealmente. Así mismo, la variedad clementina tiene una asociación media con datos más dispersos en comparación a la variedad criolla.