# Vamos a instalar un nuevo paquete
install.packages("summarytools")
## Installing package into '/cloud/lib/x86_64-pc-linux-gnu-library/4.4'
## (as 'lib' is unspecified)
install.packages("dplyr")
## Installing package into '/cloud/lib/x86_64-pc-linux-gnu-library/4.4'
## (as 'lib' is unspecified)
# Cargamos otros paquetes que usarán en el análisis descriptivo
library(readxl)
library(tidyverse)
library(summarytools)
library(dplyr)
library(leaflet)
# Rendimiento del trigo en la Argentina.
TRIGO <- read_excel("TRIGO.xlsx")
Total_filas <- nrow(TRIGO)
# Imprimimos el resultado
print(Total_filas)
## [1] 4170
Balcarce <- TRIGO %>% filter(Localidad == "BAL")
Balcarce
## # A tibble: 684 × 5
## Año Localidad Tratamiento Genotipo Rendimiento
## <dbl> <chr> <chr> <chr> <dbl>
## 1 2007 BAL ConFung KleinZorro 3830
## 2 2007 BAL ConFung KleinZorro 3030
## 3 2007 BAL SinFung KleinTauro 4660
## 4 2007 BAL SinFung KleinZorro 3100
## 5 2007 BAL SinFung KleinZorro 4170
## 6 2007 BAL ConFung KleinZorro 3460
## 7 2007 BAL SinFung KleinZorro 3520
## 8 2007 BAL ConFung KleinTauro 5200
## 9 2007 BAL SinFung KLEINCASTOR 4050
## 10 2007 BAL ConFung KLEINCASTOR 3340
## # ℹ 674 more rows
Total_filas <- nrow(Balcarce)
# Imprimimos el resultado
print(Total_filas)
## [1] 684
ggplot(Balcarce, aes(x = factor (Año), y = Rendimiento)) +
geom_boxplot(fill = "lightblue", color = "black") +
theme_minimal() + labs(title = "Distribución anual del rendimiento de trigo en Balcarce", x = "Año", y = "Rendimiento")
#### Conclusiones: en el período de 7 años analizados, los máximos
rendimientos corresponden a los años 2010 y 2011, el año 2011 presenta
la menor dispersión de valores con respecto a la media.Las mayores
dispersiones de rendimientos se presentaron durante los años 2010 y
2012
resumen_por_año_t <- Balcarce %>%
group_by(Año,Tratamiento) %>%
summarise(
promedio_rendimiento = mean(Rendimiento, na.rm = TRUE),
minimo_rendimiento = min(Rendimiento, na.rm = TRUE),
maximo_rendimiento = max(Rendimiento, na.rm = TRUE),
.groups = 'drop' # Evita que el resultado permanezca agrupado
)
resumen_por_año_t
## # A tibble: 10 × 5
## Año Tratamiento promedio_rendimiento minimo_rendimiento maximo_rendimiento
## <dbl> <chr> <dbl> <dbl> <dbl>
## 1 2007 ConFung 4183. 2830 5560
## 2 2007 SinFung 4394. 3100 5470
## 3 2009 ConFung 5246. 3740 6438.
## 4 2009 SinFung 5010. 4090 6202
## 5 2010 ConFung 5829. 3980 8263
## 6 2010 SinFung 5661. 3940 7820
## 7 2011 ConFung 6257. 5273 7406
## 8 2011 SinFung 6101. 5215 7069
## 9 2012 ConFung 3245. 1143 5200
## 10 2012 SinFung 4132. 1029 5901
ggplot(resumen_por_año_t, aes(x = Año, y = promedio_rendimiento, color = Tratamiento)) +
geom_point(size=5) +
labs(title = "Rendimientos anuales promedio de trigo en Balcarce, por tratamiento",
x = "Año",
y = "promedio_rendimiento") +
theme_minimal()
#### Del analisis descriptivo se observa en 3 de los 5 años bajo
estudio, mayores rendimientos promedios para lotes con aplicacion de
fungicidas; los años 2007 y 2012 que presentan menores rendimientos para
ambos tratamientos, muestran mayores valores en lotes sin fungicida.
Teniendo en cuenta estos resultados de rendimento, sin poseer el
analisis estatistico, no recomendariamos el uso de fungicida.
leaflet() %>%
addProviderTiles(providers$Esri.WorldImagery) %>%
setView(lng = -58.248292, lat = -37.828882, zoom = 16) %>%
addMarkers(lng = -58.248292, lat = -37.828882)
# Paso 1: Crear intervalos de clase
RENDIMIENTO_TRIGO<- cut(Balcarce$Rendimiento,
breaks = seq(min(Balcarce$Rendimiento), max(Balcarce$Rendimiento), by = 1000),
## Ajustar el rango de los intervalos
right = FALSE,
## Definir si el intervalo incluye el límite superior
include.lowest = TRUE)
# Paso 2: Crear la tabla de frecuencias con los intervalos de clase
freq(RENDIMIENTO_TRIGO,
report.nas = FALSE,
justify = "center" )
## Frequencies
## RENDIMIENTO_TRIGO
## Type: Factor
##
## Freq % % Cum.
## ------------------------- ------ -------- --------
## [1.03e+03,2.03e+03) 11 1.62 1.62
## [2.03e+03,3.03e+03) 24 3.52 5.14
## [3.03e+03,4.03e+03) 74 10.87 16.01
## [4.03e+03,5.03e+03) 185 27.17 43.17
## [5.03e+03,6.03e+03) 212 31.13 74.30
## [6.03e+03,7.03e+03) 134 19.68 93.98
## [7.03e+03,8.03e+03] 41 6.02 100.00
## Total 681 100.00 100.00
descr(Balcarce$Rendimiento,
na.rm = TRUE, # elimina los valores faltantes de la tabla
headings = FALSE) # elimina el encabezado de la tabla
##
## Rendimiento
## ----------------- -------------
## Mean 5197.15
## Std.Dev 1251.44
## Min 1029.00
## Q1 4465.00
## Median 5229.00
## Q3 6065.60
## Max 8263.00
## MAD 1185.34
## IQR 1596.90
## CV 0.24
## Skewness -0.43
## SE.Skewness 0.09
## Kurtosis 0.37
## N.Valid 684.00
## N 684.00
## Pct.Valid 100.00
rendimientos_ordenados <- Balcarce %>%
arrange(desc(Rendimiento))
print(rendimientos_ordenados)
## # A tibble: 684 × 5
## Año Localidad Tratamiento Genotipo Rendimiento
## <dbl> <chr> <chr> <chr> <dbl>
## 1 2010 BAL ConFung KleinRayo 8263
## 2 2010 BAL ConFung SY300 8182
## 3 2010 BAL ConFung ACA906 8054
## 4 2010 BAL ConFung LE2331 7987
## 5 2010 BAL SinFung SY300 7820
## 6 2010 BAL ConFung Biointa1006 7811
## 7 2010 BAL SinFung LE2331 7796
## 8 2010 BAL SinFung ACA906 7673
## 9 2010 BAL ConFung SY300 7610
## 10 2010 BAL ConFung ACA901 7549
## # ℹ 674 more rows
Resumen_Balcarce <- Balcarce %>%
group_by(Genotipo,Tratamiento) %>%
summarise(MINIMUM = min(Rendimiento),
MEAN = mean(Rendimiento),
MEDIAN = median(Rendimiento),
MAXIMUM = max(Rendimiento))
## `summarise()` has grouped output by 'Genotipo'. You can override using the
## `.groups` argument.
Resumen_Balcarce
## # A tibble: 66 × 6
## # Groups: Genotipo [33]
## Genotipo Tratamiento MINIMUM MEAN MEDIAN MAXIMUM
## <chr> <chr> <dbl> <dbl> <dbl> <dbl>
## 1 ACA801 ConFung 4250 4897. 5220 5220
## 2 ACA801 SinFung 4800 4980 4940 5200
## 3 ACA901 ConFung 2457 5104. 4850 7549
## 4 ACA901 SinFung 3300 5149. 5555 6789
## 5 ACA903 ConFung 2786 5295 5700. 7203
## 6 ACA903 SinFung 3057 5151. 5010 6905
## 7 ACA905 ConFung 5927 6148. 6223 6293
## 8 ACA905 SinFung 5696 5946. 6021 6122
## 9 ACA906 ConFung 2571 5837. 6531 8054
## 10 ACA906 SinFung 3429 5689. 5460 7673
## # ℹ 56 more rows
rendimientos_medios <-Resumen_Balcarce %>%
arrange(desc(MEAN))
print(rendimientos_medios)
## # A tibble: 66 × 6
## # Groups: Genotipo [33]
## Genotipo Tratamiento MINIMUM MEAN MEDIAN MAXIMUM
## <chr> <chr> <dbl> <dbl> <dbl> <dbl>
## 1 SY300 ConFung 4830 6605. 6924 8182
## 2 SY300 SinFung 5540 6530. 6334 7820
## 3 ACA905 ConFung 5927 6148. 6223 6293
## 4 ACA905 SinFung 5696 5946. 6021 6122
## 5 LE2333 ConFung 4570 5865. 5760. 7293
## 6 ACA906 ConFung 2571 5837. 6531 8054
## 7 ATLAX ConFung 4620 5784. 5851 7147
## 8 ACA907 ConFung 4350 5715. 5812. 7230
## 9 ACA906 SinFung 3429 5689. 5460 7673
## 10 KleinTIGRE ConFung 4400 5684. 5740 7322
## # ℹ 56 more rows