1. Instalamos y/o activamos los paquetes
library(tidyverse)
library(readxl)
1.1. Cargamos la base de datos
MANDARINAS <- read_excel("MANDARINAS_2024.xlsx")
1.2. Filtramos la base de datos (Grupo 2 y 4)
MANDARINAS_FILT <- MANDARINAS %>%
filter(GRUPO %in% c(2,4))
2.A. Análisis comparativo de variedades
A1. Según su peso
ggplot(MANDARINAS_FILT,aes(VARIEDAD, PESO, color=VARIEDAD)) +
geom_boxplot() + theme_bw() +
stat_summary(fun=mean, color = "black") +
scale_colour_manual(values = c("Clementina" = "orange", "Criolla" = "purple")) +
labs(title = "Comparación de 2 variedades de mandarinas según su peso", x="Variedad", y="Peso (g)")

Medidas de resumen
MANDARINAS_FILT %>%
group_by(VARIEDAD) %>%
summarise(MIN_PESO=min(PESO),
MAX_PESO=max(PESO),
MEDIA_PESO=mean(PESO),
MEDIANA_PESO=median(PESO))
## # A tibble: 2 × 5
## VARIEDAD MIN_PESO MAX_PESO MEDIA_PESO MEDIANA_PESO
## <chr> <dbl> <dbl> <dbl> <dbl>
## 1 Clementina 64 273 151. 152
## 2 Criolla 91 241 143. 146.
Conclusión
La variedad clementina presenta un peso promedio de 151 gr
siendo superior a la variedad criolla cuyo peso promedio es de 143
gr.
La mayor variabilidad y mayor peso promedio se observa en la
variedad clementina la cual presenta un valor atípico que aumenta el
promedio en peso de los frutos en comparación a la variedad
criolla.
La mediana en ambos casos se encuentra muy cercana a la
media lo cual indica que los datos están distribuidos de una manera
simétrica.
A2. Según su diámetro ecuatorial
ggplot(MANDARINAS_FILT,aes(VARIEDAD, DIAM_ECUAT, color=VARIEDAD)) +
geom_boxplot() + theme_bw() +
stat_summary(fun=mean, color = "black") +
scale_colour_manual(values = c("Clementina" = "orange", "Criolla" = "purple")) +
labs(title= "Comparación de 2 variedades de mandarinas según su diámetro ecuatorial",
x="Variedad",
y="Diámetro Ecuatorial (cm)") +
scale_y_continuous(breaks = seq(40, 90, by = 5))

Medidas de resumen
MANDARINAS_FILT %>%
group_by(VARIEDAD) %>%
summarise(MIN_DIAM_EC=min(DIAM_ECUAT),
MAX_DIAM_EC=max(DIAM_ECUAT),
MEDIA_DIAM_EC=mean(DIAM_ECUAT),
MEDIANA_DIAM_EC=median(DIAM_ECUAT))
## # A tibble: 2 × 5
## VARIEDAD MIN_DIAM_EC MAX_DIAM_EC MEDIA_DIAM_EC MEDIANA_DIAM_EC
## <chr> <dbl> <dbl> <dbl> <dbl>
## 1 Clementina 50.3 86.4 68.3 70.2
## 2 Criolla 57.4 81.1 67.1 69.6
Conclusión
La variedad clementina presenta un diámetro ecuatorial con
respecto a la media y la mediana relativamente igual al de la variedad
criolla.
La mayor variabilidad en esta variable se observa en la
variedad criolla. Así mismo, en clementina los valores atípicos nos
indican la presencia de frutos con menor diámetro con respecto a la
variedad criolla.
2.B. Relación entre Peso y Diámetro por Grupo
ggplot(MANDARINAS_FILT,aes(PESO, DIAM_ECUAT, color=as.factor(GRUPO))) +
geom_point(shape = 18, size=3) +
facet_grid(GRUPO ~.) +
theme_gray() +
geom_smooth(method = "lm", se = FALSE, color = "black") +
labs(color = "Grupo",
title= "Relación entre peso y diámetro ecuatorial por grupo",
x="Peso (g)",
y="Diámetro Ecuatorial (cm)") +
scale_color_manual(values = c("2" = "darkgreen", "4" = "navy"))

Conclusión
El grupo 2 presenta una asociación alta entre el peso y
diámetro ecuatorial de los frutos. Mientras que en el grupo 4 no se
observa una tendencia claramente definida, lo que sugiere una baja
asociación entre las variables analizadas. Este resultado podría
atribuirse a diversos factores, como errores en la etapa de muestreo, en
los procedimientos de medición, en la calibración del instrumental,
entre otros. Sin embargo, tras observar la base de datos, se identificó
que el error pudo haber ocurrido en el proceso de registro manual de los
datos.
2.C. Relación entre Peso y Diámetro por
Variedad

Conclusión
La variedad criolla presenta una asociación alta entre el
peso y diámetro ecuatorial de los frutos con datos muy homogéneos y
concentrados linealmente. Así mismo, la variedad clementina tiene una
asociación media con datos más dispersos en comparación a la variedad
criolla.