Localidad “Manfredi” Provincia de Córdoba
# Instalamos paquetes
install.packages("tidyverse")
## Installing package into '/cloud/lib/x86_64-pc-linux-gnu-library/4.4'
## (as 'lib' is unspecified)
install.packages("readxl")
## Installing package into '/cloud/lib/x86_64-pc-linux-gnu-library/4.4'
## (as 'lib' is unspecified)
install.packages("summarytools")
## Installing package into '/cloud/lib/x86_64-pc-linux-gnu-library/4.4'
## (as 'lib' is unspecified)
install.packages("leaflet")
## Installing package into '/cloud/lib/x86_64-pc-linux-gnu-library/4.4'
## (as 'lib' is unspecified)
# Cargamos paquetes
library("tidyverse")
## ── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
## ✔ dplyr 1.1.4 ✔ readr 2.1.5
## ✔ forcats 1.0.0 ✔ stringr 1.5.1
## ✔ ggplot2 3.5.1 ✔ tibble 3.2.1
## ✔ lubridate 1.9.3 ✔ tidyr 1.3.1
## ✔ purrr 1.0.2
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag() masks stats::lag()
## ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors
library("readxl")
library("summarytools")
## Warning in fun(libname, pkgname): couldn't connect to display ":0"
## system might not have X11 capabilities; in case of errors when using dfSummary(), set st_options(use.x11 = FALSE)
##
## Attaching package: 'summarytools'
##
## The following object is masked from 'package:tibble':
##
## view
library("leaflet")
TRIGO <- read_excel("TRIGO.xlsx")
Análisis Descriptivo Responder a las siguientes preguntas utilizando todo lo visto en el módulo:
A. ¿Cuántos casos (o filas) tiene en total la base de datos?
glimpse(TRIGO)
## Rows: 4,170
## Columns: 5
## $ Año <dbl> 2007, 2007, 2007, 2007, 2007, 2007, 2007, 2007, 2007, 2007…
## $ Localidad <chr> "CHA", "CHA", "CHA", "CHA", "CHA", "CHA", "CHA", "CHA", "C…
## $ Tratamiento <chr> "ConFung", "ConFung", "ConFung", "SinFung", "SinFung", "Si…
## $ Genotipo <chr> "KleinTauro", "KleinTauro", "KLEINCASTOR", "KleinTauro", "…
## $ Rendimiento <dbl> 5604.40, 4945.05, 6106.75, 4992.15, 5086.34, 6342.23, 5949…
names(TRIGO)
## [1] "Año" "Localidad" "Tratamiento" "Genotipo" "Rendimiento"
La Base de Datos de trigo tiene 4170 casos y 5 variables ( Año, Localidad, Tratamiento, genotipo y Rendimiento).
B. ¿Cúantos casos (o filas) tiene la base de datos de su localidad?
Manfredi <- TRIGO %>% filter(Localidad == "MAN")
Manfredi
## # A tibble: 135 × 5
## Año Localidad Tratamiento Genotipo Rendimiento
## <dbl> <chr> <chr> <chr> <dbl>
## 1 2007 MAN SinFung ACA901 3867.
## 2 2007 MAN SinFung ACA901 3272.
## 3 2007 MAN SinFung ACA801 3486.
## 4 2007 MAN SinFung ACA901 4033.
## 5 2007 MAN SinFung B75ANIVERSARIO 3308.
## 6 2007 MAN SinFung B75ANIVERSARIO 2592.
## 7 2007 MAN SinFung B75ANIVERSARIO 3589.
## 8 2007 MAN SinFung ACA801 4003.
## 9 2007 MAN SinFung ACA801 3320.
## 10 2007 MAN SinFung KleinTauro 3218.
## # ℹ 125 more rows
LA BASE DE DATOS DE LA LOCALIDAD DE MANFREDI TIENE 135 CASOS
C. ¿Cómo se distribuye el rendimiento de trigo en su localidad? Elabore un gráfico y saque conclusiones.
ggplot(Manfredi, aes(Rendimiento, grupo= Tratamiento, colour = Tratamiento))+
geom_freqpoly(binwidth = 500)
Tratamiento “SinFung” (línea azul):Los datos presentan una concentración clara de frecuencias altas en niveles bajos de rendimiento (entre 1000 y 4000). Se observa un pico máximo (valor más alto del conteo) alrededor de 2000, con aproximadamente 20 observaciones. A partir de los 4000, la frecuencia disminuye rápidamente hasta llegar a 0.
Tratamiento “ConFung” (línea roja):Las observaciones inician en niveles más altos de rendimiento (3000 en adelante). El pico máximo ocurre alrededor de 5000 con una cuenta de aproximadamente 8 observaciones. Después de los 5000, las frecuencias disminuyen progresivamente y tienden a 0 cerca de los 7000. “SinFung” tiene una mayor frecuencia de valores (más observaciones) en rendimientos bajos, entre 1000 y 3000. “ConFung” muestra un comportamiento opuesto: presenta valores con menor frecuencia, pero en niveles más altos de rendimiento (a partir de 3000 hasta 7000). Los tratamientos parecen seguir patrones opuestos, donde “SinFung” predomina en bajos rendimientos y “ConFung” en rendimientos más elevados.
D. ¿Cómo varía el rendimiento promedio en su localidad para los diferentes tratamientos? ¿Qué tratamiento recomendaría (Con fungicida o Sin fungicida).
ggplot(Manfredi, aes(x = Tratamiento, y = Rendimiento, fill = Tratamiento)) +
geom_boxplot(outlier.colour = "black", outlier.shape = 19, outlier.size = 2) +
labs(title = "Rendimeinto de Trigo en la Loc. de Manfredi con diferentes Niveles de Fungicida",
x = "Tratamiento",
y = "Rendimiento") +
theme_classic()
El gráfico muestra que el tratamiento con fungicida (ConFung) está asociado con un mayor rendimiento de trigo en comparación con el tratamiento sin fungicida (SinFung), ya que la mediana del rendimiento es más alta en ConFung (alrededor de 4500) frente a SinFung (cerca de 3000). Además, ConFung presenta una distribución más homogénea con menor dispersión, mientras que SinFung muestra mayor variabilidad en los rendimientos y valores más bajos en general, lo que sugiere que el uso de fungicida no solo mejora el rendimiento promedio, sino también estabiliza los resultados.
En todos los gráficos realizar las modificaciones que consideren adecuadas (ejes, tamaño de letra, color, etc.) para mejorar la presentación.
E. Agregar una ubicación ficticia de un campo dentro de su localidad usando el paquete leaflet.
leaflet() %>%
addProviderTiles(providers$Esri.WorldImagery)%>%
addMarkers(lng = -63.745362, lat = -31.8436102, group = "Marcadores") %>%
addLayersControl( baseGroups = c("Mapa Base"),
overlayGroups = c("Marcadores")
)
leaflet() %>%
addProviderTiles(providers$Esri.WorldImagery)%>%
addPolygons(lng = c(-63.730116, -63.740630, -63.736553, -63.725953), lat = c(-31.861153,-31.868151, -31.872779, -31.865891),
color = "blue") %>% addMarkers(lng = -63.745362, lat = -31.8436102)
F. Crear una tabla de frecuencias para la variable Rendimiento y analizar los resultados.
# Desactivar notación científica globalmente
options(scipen = 999)
# Crear los intervalos y definir etiquetas personalizadas
breaks <- seq(min(Manfredi$Rendimiento), max(Manfredi$Rendimiento), by = 750)
# Crear etiquetas para los intervalos manualmente
etiquetas <- paste0("[", head(breaks, -1), ", ", tail(breaks, -1) - 1, ")")
# Generar los intervalos con etiquetas
TF_MAN <- cut(Manfredi$Rendimiento,
breaks = breaks,
labels = etiquetas,
right = FALSE,
include.lowest = TRUE)
# Mostrar tabla de frecuencias
freq(TF_MAN,
report.nas = FALSE,
justify = "center")
## Frequencies
## TF_MAN
## Type: Factor
##
## Freq % % Cum.
## ------------------ ------ -------- --------
## [1058, 1807) 14 10.45 10.45
## [1808, 2557) 22 16.42 26.87
## [2558, 3307) 25 18.66 45.52
## [3308, 4057) 34 25.37 70.90
## [4058, 4807) 24 17.91 88.81
## [4808, 5557) 14 10.45 99.25
## [5558, 6307) 1 0.75 100.00
## Total 134 100.00 100.00
El análisis de frecuencias muestra que los rendimientos de trigo se concentran principalmente en los intervalos intermedios. El intervalo [3308, 4057) presenta la mayor frecuencia con 34 observaciones (25.37%), seguido por [2558, 3307) con 25 observaciones (18.66%). En conjunto, estos dos intervalos acumulan cerca del 44% del total. Los rendimientos más bajos [1058, 1807) y más altos [5558, 6307) tienen frecuencias mucho menores, con 10.45% y 0.75%, respectivamente, lo que indica que la mayoría de los valores se encuentran en rangos intermedios. En resumen, los rendimientos muestran una distribución concentrada entre 1808 y 4807, con pocos valores extremos.
G. Obtener medidas de resumen para la variable Rendimiento según el tratamiento aplicado.
descr(Manfredi$Rendimiento)
## Descriptive Statistics
## Manfredi$Rendimiento
## N: 135
##
## Rendimiento
## ----------------- -------------
## Mean 3400.72
## Std.Dev 1164.96
## Min 1058.00
## Q1 2449.00
## Median 3536.00
## Q3 4240.00
## Max 6358.00
## MAD 1217.21
## IQR 1766.05
## CV 0.34
## Skewness -0.05
## SE.Skewness 0.21
## Kurtosis -0.76
## N.Valid 135.00
## Pct.Valid 100.00
El rendimiento de trigo en la Localidad deManfredi, muestra un promedio (media) de 3400.72, con una mediana de 3536, lo que sugiere que los datos están ligeramente inclinados hacia valores menores. Esto se confirma con el skewness de -0.05, que indica una distribución casi simétrica pero con una ligera asimetría negativa. La desviación estándar es de 1164.96, lo que refleja una dispersión moderada alrededor de la media, mientras que la MAD (desviación absoluta de la mediana) es de 1217.21, similar a la desviación estándar, lo que refuerza que los datos no presentan grandes distorsiones.
El rango intercuartílico (IQR) de 1766.05, definido entre el primer cuartil (Q1 = 2449) y el tercer cuartil (Q3 = 4240), muestra que el 50% central de los rendimientos está contenido en un intervalo relativamente amplio. El valor mínimo es 1058 y el máximo es 6358, lo que demuestra la presencia de una brecha considerable en los valores extremos. No obstante, la ausencia de un skewness pronunciado sugiere que estos valores no afectan drásticamente la simetría.
El coeficiente de variación (CV = 0.34) indica una variabilidad moderada en los rendimientos en relación con la media. Además, la kurtosis de -0.76 revela que la distribución tiene una forma más plana (platicúrtica) que la distribución normal, lo cual sugiere una menor concentración de valores cerca de la media y colas menos pronunciadas.
En resumen, el rendimiento de trigo presenta una distribución equilibrada y moderadamente dispersa, con un rango amplio pero una concentración significativa de los datos entre 2449 y 4240. No se observan asimetrías ni valores atípicos extremos que afecten la estructura general de los datos. Esto indica una estabilidad relativa en los rendimientos, aunque con cierta variabilidad esperada en el proceso productivo.
H. ¿Qué genotipo recomendaría sembrar en la localidad? justifique la respuesta.
Manfredi %>%
group_by(Genotipo, Tratamiento) %>% # Agrupar por Genotipo y Tratamiento
summarise(
Media_Rendimiento = mean(Rendimiento, na.rm = TRUE), # Promedio del rendimiento
Desviacion = sd(Rendimiento, na.rm = TRUE), # Desviación estándar
Min = min(Rendimiento, na.rm = TRUE), # Valor mínimo
Max = max(Rendimiento, na.rm = TRUE), # Valor máximo
n = n() # Número de observaciones
) %>%
arrange(desc(Media_Rendimiento)) # Ordenar por rendimiento promedio
## `summarise()` has grouped output by 'Genotipo'. You can override using the
## `.groups` argument.
## # A tibble: 38 × 7
## # Groups: Genotipo [28]
## Genotipo Tratamiento Media_Rendimiento Desviacion Min Max n
## <chr> <chr> <dbl> <dbl> <dbl> <dbl> <int>
## 1 Arex ConFung 5294. 533. 4787 5849 3
## 2 ACA903 ConFung 5259. 1046. 4276 6358 3
## 3 ACA906 ConFung 5156. 497. 4589 5518 3
## 4 KleinRayo ConFung 5085. 212. 4862 5283 3
## 5 BIOINTA1002 SinFung 4974. 165. 4786. 5094 3
## 6 ACA901 ConFung 4643. 529. 4326 5253 3
## 7 KleinNutria ConFung 4489 518. 3980 5016 3
## 8 Biointa1005 ConFung 4458. 649. 3734 4988 3
## 9 ATLAX SinFung 4396. 334. 4015. 4642. 3
## 10 Floripan100 ConFung 4324. 475. 3962 4861 3
## # ℹ 28 more rows
Al analizar los datos de rendimiento promedio por genotipo y tratamiento, se observa que los tratamientos con fungicida (ConFung) tienden a proporcionar rendimientos notablemente superiores en comparación con los tratamientos sin fungicida (SinFung). Por ejemplo, Arex, ACA903, ACA906 y KleinRayo destacan con rendimientos promedio superiores a 5.000 kg/ha bajo ConFung, lo que los posiciona como las mejores opciones de siembra cuando se aplica fungicida. Por otro lado, los rendimientos bajo SinFung son considerablemente más bajos, con valores promedio que oscilan entre 1.500 y 3.000 kg/ha en la mayoría de los genotipos, evidenciando la necesidad de control de enfermedades para maximizar la productividad. Se recomienda sembrar genotipos como Arex, ACA903 y ACA906 en combinación con fungicida, ya que ofrecen los mejores rendimientos y consistencia en la localidad analizada.