Trabajos Practicos 1 Y 2 Modulo 4

Equipo 3: Vanesa Aybar - Italo Palanca

Instalamos y cargamos los paquetes

# Vamos a instalar un nuevo paquete
install.packages("summarytools")
## Installing package into '/cloud/lib/x86_64-pc-linux-gnu-library/4.4'
## (as 'lib' is unspecified)
install.packages("dplyr")
## Installing package into '/cloud/lib/x86_64-pc-linux-gnu-library/4.4'
## (as 'lib' is unspecified)
# Cargamos otros paquetes que usarán en el análisis descriptivo
library(readxl)      
library(tidyverse)   
library(summarytools) 
library(dplyr)
library(leaflet)

Cargamos las bases de datos

# Rendimiento del trigo en la Argentina.
TRIGO <- read_excel("TRIGO.xlsx")

Responder a las siguientes preguntas utilizando todo lo visto en el módulo:

A. ¿Cuántos casos (o filas) tiene en total la base de datos?

Contamos la cantidad de filas de la base de datos TRIGO

Total_filas <- nrow(TRIGO)

# Imprimimos el resultado
print(Total_filas)
## [1] 4170

La base de datos trigo tiene un total de 4.170 filas

B. ¿Cúantos casos (o filas) tiene la base de datos de su localidad?

Filtrar los datos para la localidad Balcarce

Balcarce <- TRIGO %>% filter(Localidad == "BAL")
Balcarce
## # A tibble: 684 × 5
##      Año Localidad Tratamiento Genotipo    Rendimiento
##    <dbl> <chr>     <chr>       <chr>             <dbl>
##  1  2007 BAL       ConFung     KleinZorro         3830
##  2  2007 BAL       ConFung     KleinZorro         3030
##  3  2007 BAL       SinFung     KleinTauro         4660
##  4  2007 BAL       SinFung     KleinZorro         3100
##  5  2007 BAL       SinFung     KleinZorro         4170
##  6  2007 BAL       ConFung     KleinZorro         3460
##  7  2007 BAL       SinFung     KleinZorro         3520
##  8  2007 BAL       ConFung     KleinTauro         5200
##  9  2007 BAL       SinFung     KLEINCASTOR        4050
## 10  2007 BAL       ConFung     KLEINCASTOR        3340
## # ℹ 674 more rows

Contamos la cantidad de filas para la localidad Balcarce

Total_filas <- nrow(Balcarce) 
# Imprimimos el resultado
print(Total_filas)
## [1] 684

Balcarce tien 684 filas.

C. ¿Cómo se distribuye el rendimiento de trigo en su localidad? Elabore un gráfico y saque conclusiones.

ggplot(Balcarce, aes(x = factor (Año), y = Rendimiento)) + 
  geom_boxplot(fill = "lightblue", color = "black") + 
  theme_minimal() + labs(title = "Distribución anual del rendimiento de trigo en Balcarce", x = "Año", y = "Rendimiento")

#### Conclusiones: en el período de 7 años analizados, los máximos rendimientos corresponden a los años 2010 y 2011, el año 2011 presenta la menor dispersión de valores con respecto a la media.Las mayores dispersiones de rendimientos se presentaron durante los años 2010 y 2012

D. ¿Cómo varía el rendimiento promedio en su localidad para los diferentes tratamientos? ¿Qué tratamiento recomendaría (Con fungicida o Sin fungicida).

resumen_por_año_t <- Balcarce %>%
  group_by(Año,Tratamiento) %>%
  summarise(
    promedio_rendimiento = mean(Rendimiento, na.rm = TRUE),
    minimo_rendimiento = min(Rendimiento, na.rm = TRUE),
    maximo_rendimiento = max(Rendimiento, na.rm = TRUE),
    .groups = 'drop'  # Evita que el resultado permanezca agrupado
  )
resumen_por_año_t
## # A tibble: 10 × 5
##      Año Tratamiento promedio_rendimiento minimo_rendimiento maximo_rendimiento
##    <dbl> <chr>                      <dbl>              <dbl>              <dbl>
##  1  2007 ConFung                    4183.               2830              5560 
##  2  2007 SinFung                    4394.               3100              5470 
##  3  2009 ConFung                    5246.               3740              6438.
##  4  2009 SinFung                    5010.               4090              6202 
##  5  2010 ConFung                    5829.               3980              8263 
##  6  2010 SinFung                    5661.               3940              7820 
##  7  2011 ConFung                    6257.               5273              7406 
##  8  2011 SinFung                    6101.               5215              7069 
##  9  2012 ConFung                    3245.               1143              5200 
## 10  2012 SinFung                    4132.               1029              5901
ggplot(resumen_por_año_t, aes(x = Año, y = promedio_rendimiento, color = Tratamiento)) +
  geom_point(size=5) +
  labs(title = "Rendimientos anuales promedio de trigo en Balcarce, por tratamiento",
    x = "Año",
    y = "promedio_rendimiento") +
  theme_minimal()

#### Del analisis descriptivo se observa en 3 de los 5 años bajo estudio, mayores rendimientos promedios para lotes con aplicacion de fungicidas; los años 2007 y 2012 que presentan menores rendimientos para ambos tratamientos, muestran mayores valores en lotes sin fungicida. Teniendo en cuenta estos resultados de rendimento, sin poseer el analisis estatistico, no recomendariamos el uso de fungicida.

E. Agregar una ubicación ficticia de un campo dentro de su localidad usando el paquete leaflet.

leaflet() %>%
  addProviderTiles(providers$Esri.WorldImagery) %>%
  setView(lng = -58.248292, lat = -37.828882, zoom = 16) %>% 
  addMarkers(lng = -58.248292, lat = -37.828882)

F. Crear una tabla de frecuencias para la variable Rendimiento y analizar los resultados.

# Paso 1: Crear intervalos de clase 
RENDIMIENTO_TRIGO<- cut(Balcarce$Rendimiento, 
                             breaks = seq(min(Balcarce$Rendimiento), max(Balcarce$Rendimiento), by = 1000), 
 ## Ajustar el rango de los intervalos
                             right = FALSE, 
 ## Definir si el intervalo incluye el límite superior
                             include.lowest = TRUE)
# Paso 2: Crear la tabla de frecuencias con los intervalos de clase
freq(RENDIMIENTO_TRIGO, 
     report.nas = FALSE, 
     justify = "center" )
## Frequencies  
## RENDIMIENTO_TRIGO  
## Type: Factor  
## 
##                            Freq     %      % Cum. 
## ------------------------- ------ -------- --------
##    [1.03e+03,2.03e+03)      11     1.62     1.62  
##    [2.03e+03,3.03e+03)      24     3.52     5.14  
##    [3.03e+03,4.03e+03)      74    10.87    16.01  
##    [4.03e+03,5.03e+03)     185    27.17    43.17  
##    [5.03e+03,6.03e+03)     212    31.13    74.30  
##    [6.03e+03,7.03e+03)     134    19.68    93.98  
##    [7.03e+03,8.03e+03]      41     6.02    100.00 
##           Total            681    100.00   100.00

Los rendimientos de esta base de datos fluctuan entre 1.000 a 8.000 kg/ha, los mas frecuentes son los comprendidos entre 5.000 y 6.000 kg/ha. Los rendimientos entre 4.000 y 6.000 representan mas del 50 % de los datos obtenidos; los rendimientos entre 1.000 y 3.000 kg/ha son los de menor frecuencia. Los rendimientos comprendidos entre 7.000 a 8.000 kg/ha representan el 6%

G. Obtener medidas de resumen para la variable Rendimiento según el tratamiento aplicado.

descr(Balcarce$Rendimiento, 
      na.rm = TRUE, # elimina los valores faltantes de la tabla
      headings = FALSE) # elimina el encabezado de la tabla
## 
##                     Rendimiento
## ----------------- -------------
##              Mean       5197.15
##           Std.Dev       1251.44
##               Min       1029.00
##                Q1       4465.00
##            Median       5229.00
##                Q3       6065.60
##               Max       8263.00
##               MAD       1185.34
##               IQR       1596.90
##                CV          0.24
##          Skewness         -0.43
##       SE.Skewness          0.09
##          Kurtosis          0.37
##           N.Valid        684.00
##                 N        684.00
##         Pct.Valid        100.00

H. ¿Qué genotipo recomendaría sembrar en la localidad? justifique la respuesta.

rendimientos_ordenados <- Balcarce %>%
  arrange(desc(Rendimiento))
print(rendimientos_ordenados)
## # A tibble: 684 × 5
##      Año Localidad Tratamiento Genotipo    Rendimiento
##    <dbl> <chr>     <chr>       <chr>             <dbl>
##  1  2010 BAL       ConFung     KleinRayo          8263
##  2  2010 BAL       ConFung     SY300              8182
##  3  2010 BAL       ConFung     ACA906             8054
##  4  2010 BAL       ConFung     LE2331             7987
##  5  2010 BAL       SinFung     SY300              7820
##  6  2010 BAL       ConFung     Biointa1006        7811
##  7  2010 BAL       SinFung     LE2331             7796
##  8  2010 BAL       SinFung     ACA906             7673
##  9  2010 BAL       ConFung     SY300              7610
## 10  2010 BAL       ConFung     ACA901             7549
## # ℹ 674 more rows
Resumen_Balcarce <- Balcarce %>% 
  group_by(Genotipo,Tratamiento) %>% 
  summarise(MINIMUM = min(Rendimiento),
            MEAN = mean(Rendimiento),
            MEDIAN = median(Rendimiento),
            MAXIMUM = max(Rendimiento))
## `summarise()` has grouped output by 'Genotipo'. You can override using the
## `.groups` argument.
Resumen_Balcarce
## # A tibble: 66 × 6
## # Groups:   Genotipo [33]
##    Genotipo Tratamiento MINIMUM  MEAN MEDIAN MAXIMUM
##    <chr>    <chr>         <dbl> <dbl>  <dbl>   <dbl>
##  1 ACA801   ConFung        4250 4897.  5220     5220
##  2 ACA801   SinFung        4800 4980   4940     5200
##  3 ACA901   ConFung        2457 5104.  4850     7549
##  4 ACA901   SinFung        3300 5149.  5555     6789
##  5 ACA903   ConFung        2786 5295   5700.    7203
##  6 ACA903   SinFung        3057 5151.  5010     6905
##  7 ACA905   ConFung        5927 6148.  6223     6293
##  8 ACA905   SinFung        5696 5946.  6021     6122
##  9 ACA906   ConFung        2571 5837.  6531     8054
## 10 ACA906   SinFung        3429 5689.  5460     7673
## # ℹ 56 more rows
rendimientos_medios <-Resumen_Balcarce %>%
  arrange(desc(MEAN))
print(rendimientos_medios)
## # A tibble: 66 × 6
## # Groups:   Genotipo [33]
##    Genotipo   Tratamiento MINIMUM  MEAN MEDIAN MAXIMUM
##    <chr>      <chr>         <dbl> <dbl>  <dbl>   <dbl>
##  1 SY300      ConFung        4830 6605.  6924     8182
##  2 SY300      SinFung        5540 6530.  6334     7820
##  3 ACA905     ConFung        5927 6148.  6223     6293
##  4 ACA905     SinFung        5696 5946.  6021     6122
##  5 LE2333     ConFung        4570 5865.  5760.    7293
##  6 ACA906     ConFung        2571 5837.  6531     8054
##  7 ATLAX      ConFung        4620 5784.  5851     7147
##  8 ACA907     ConFung        4350 5715.  5812.    7230
##  9 ACA906     SinFung        3429 5689.  5460     7673
## 10 KleinTIGRE ConFung        4400 5684.  5740     7322
## # ℹ 56 more rows

Recomendariamos el genotipo: SY300