# Instalamos y/o cargamos paquetes
library("tidyverse")
## ── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
## âś” dplyr     1.1.4     âś” readr     2.1.5
## âś” forcats   1.0.0     âś” stringr   1.5.1
## âś” ggplot2   3.5.1     âś” tibble    3.2.1
## âś” lubridate 1.9.3     âś” tidyr     1.3.1
## âś” purrr     1.0.2     
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## âś– dplyr::filter() masks stats::filter()
## âś– dplyr::lag()    masks stats::lag()
## ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors
library("readxl")
install.packages("leaflet")
## Installing package into '/cloud/lib/x86_64-pc-linux-gnu-library/4.4'
## (as 'lib' is unspecified)
library("leaflet")
TRIGO <- read_excel("TRIGO.xlsx")
glimpse(TRIGO)
## Rows: 4,170
## Columns: 5
## $ Año         <dbl> 2007, 2007, 2007, 2007, 2007, 2007, 2007, 2007, 2007, 2007…
## $ Localidad   <chr> "CHA", "CHA", "CHA", "CHA", "CHA", "CHA", "CHA", "CHA", "C…
## $ Tratamiento <chr> "ConFung", "ConFung", "ConFung", "SinFung", "SinFung", "Si…
## $ Genotipo    <chr> "KleinTauro", "KleinTauro", "KLEINCASTOR", "KleinTauro", "…
## $ Rendimiento <dbl> 5604.40, 4945.05, 6106.75, 4992.15, 5086.34, 6342.23, 5949…
#En total la base de datos TRIGO tiene 4170 casos y 5 variables.
TRIGOMAJ <- TRIGO %>%
 filter(Localidad == "MAJ")
glimpse(TRIGOMAJ)
## Rows: 230
## Columns: 5
## $ Año         <dbl> 2007, 2007, 2007, 2007, 2007, 2007, 2007, 2007, 2007, 2007…
## $ Localidad   <chr> "MAJ", "MAJ", "MAJ", "MAJ", "MAJ", "MAJ", "MAJ", "MAJ", "M…
## $ Tratamiento <chr> "ConFung", "ConFung", "ConFung", "ConFung", "ConFung", "Co…
## $ Genotipo    <chr> "ONIX", "KleinZorro", "KleinZorro", "ONIX", "ONIX", "B75AN…
## $ Rendimiento <dbl> 4360, 4210, 6140, 4960, 5750, 4900, 5170, 5840, 5400, 3830…
#La base de datos Marcos Juárez posee 230 casos y 5 variables.
ggplot(TRIGOMAJ, aes(Rendimiento)) +
  geom_histogram()
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.

ggplot(TRIGOMAJ, aes(Rendimiento)) +
  geom_histogram(bins = 24, color = "red", fill = "gray")+
  theme_classic()

#El rendimiento en la localidad de Marcos Juárez se distribuye en forma simétrica.
mean(TRIGOMAJ$Rendimiento)
## [1] 4468.043
TRIGOMAJCF <- TRIGOMAJ %>%
 filter(Tratamiento == "ConFung")
mean(TRIGOMAJCF$Rendimiento)
## [1] 4410.226
TRIGOMAJSF <- TRIGOMAJ %>%
 filter(Tratamiento == "SinFung")
mean(TRIGOMAJSF$Rendimiento)
## [1] 4489.381
ggplot(TRIGOMAJCF, aes(Rendimiento)) +
  geom_histogram(bins = 24, color = "yellow", fill = "gray")+
  theme_classic()

ggplot(TRIGOMAJSF, aes(Rendimiento)) +
  geom_histogram(bins = 24, color = "green", fill = "gray")+
  theme_classic()

#El rendimiento para el tratamiento con fungicida (CF) presenta una media de 4410.226 Kg/ha, mientras que para el tratamiento sin fungicida es 4489.381 Kg/ha. En base al rendimiento podrĂ­a recomendar cualquiera de los dos tratamientos, sin embargo, en base a los costos se recomienda el tratamiento sin fungicida (SF)
leaflet() %>%
  addProviderTiles(providers$Esri.WorldImagery) %>%
  setView(lng = -62.1067, lat = -32.6978, zoom = 16) %>% 
  addMarkers(lng = -62.1067, lat = -32.6978)
# Vamos a instalar un nuevo paquete
install.packages("summarytools")
## Installing package into '/cloud/lib/x86_64-pc-linux-gnu-library/4.4'
## (as 'lib' is unspecified)
# Cargamos otros paquetes que usarán en el análisis descriptivo
library(readxl)      
library(tidyverse)   
library(summarytools) 
## Warning in fun(libname, pkgname): couldn't connect to display ":0"
## system might not have X11 capabilities; in case of errors when using dfSummary(), set st_options(use.x11 = FALSE)
## 
## Attaching package: 'summarytools'
## The following object is masked from 'package:tibble':
## 
##     view
# Trabajamos con la base de datos "TRIGOMAJ"
# Paso 1: Crear intervalos de clase 
TF_RENDIMIENTO_TRIGOMAJ<- cut(TRIGOMAJ$Rendimiento, 
                             breaks = seq(min(TRIGOMAJ$Rendimiento), max(TRIGOMAJ$Rendimiento), by = 300), # Ajustar el rango de los intervalos
                             right = FALSE, # Definir si el intervalo incluye el lĂ­mite superior
                             include.lowest = TRUE)
# Paso 2: Crear la tabla de frecuencias con los intervalos de clase
freq(TF_RENDIMIENTO_TRIGOMAJ, 
     report.nas = FALSE, 
     justify = "center" )
## Frequencies  
## TF_RENDIMIENTO_TRIGOMAJ  
## Type: Factor  
## 
##                          Freq     %      % Cum. 
## ----------------------- ------ -------- --------
##     [1.7e+03,2e+03)       2      0.87     0.87  
##     [2e+03,2.3e+03)       7      3.06     3.93  
##    [2.3e+03,2.6e+03)      5      2.18     6.11  
##    [2.6e+03,2.9e+03)      15     6.55    12.66  
##    [2.9e+03,3.2e+03)      8      3.49    16.16  
##    [3.2e+03,3.5e+03)      13     5.68    21.83  
##    [3.5e+03,3.8e+03)      14     6.11    27.95  
##    [3.8e+03,4.1e+03)      21     9.17    37.12  
##    [4.1e+03,4.4e+03)      28    12.23    49.34  
##    [4.4e+03,4.7e+03)      23    10.04    59.39  
##     [4.7e+03,5e+03)       21     9.17    68.56  
##     [5e+03,5.3e+03)       13     5.68    74.24  
##    [5.3e+03,5.6e+03)      18     7.86    82.10  
##    [5.6e+03,5.9e+03)      11     4.80    86.90  
##    [5.9e+03,6.2e+03)      14     6.11    93.01  
##    [6.2e+03,6.5e+03)      5      2.18    95.20  
##    [6.5e+03,6.8e+03)      7      3.06    98.25  
##    [6.8e+03,7.1e+03]      4      1.75    100.00 
##          Total           229    100.00   100.00

#La mayorĂ­a de las plantas posee un remdimiento entre 3200 y 6200 Kg/ha

# Otro camino... crear el vector "RENDIMIENTO"
RENDIMIENTOMAJ <- TRIGOMAJ$Rendimiento
RENDIMIENTOMAJ
##   [1] 4360 4210 6140 4960 5750 4900 5170 5840 5400 3830 5860 5660 5110 3610 4070
##  [16] 4850 5190 4810 3650 4770 3470 5280 5480 5000 5470 5990 5600 5180 5420 4760
##  [31] 2760 4900 5480 4690 4010 4430 4150 4520 4440 4760 5260 5340 5210 3860 4300
##  [46] 4300 4400 4280 4480 4640 4520 4320 4170 5400 4040 4820 4030 4420 4260 4080
##  [61] 5300 3890 4730 4150 4200 4370 4290 4140 3970 5450 4610 4000 4250 4740 4880
##  [76] 4340 4900 4520 4740 4860 4950 5430 4010 4420 4590 4580 4150 4310 3330 4680
##  [91] 4980 4910 3590 4070 4550 4430 3900 4310 4110 5830 5960 6000 6540 5840 5140
## [106] 6660 5060 6020 5200 6940 5860 4500 6280 5990 6300 5580 5930 5360 6010 5280
## [121] 6870 6560 5000 6840 5940 6120 7240 5630 5420 5950 4680 4070 5590 6400 6510
## [136] 6940 6780 5510 6710 5640 5940 6570 5400 5570 6480 6450 6150 5400 5200 5850
## [151] 5800 6050 4810 3551 4221 4553 1703 4608 3564 2181 3320 3439 3802 4043 3223
## [166] 3752 2029 2910 2116 4294 2831 3285 3358 2783 2884 4393 2426 4645 4245 2641
## [181] 3721 2296 2545 2125 3403 2965 2674 3815 2854 2164 2773 3023 3645 3786 2413
## [196] 3437 3915 3321 2646 3230 3790 2588 2569 3347 4507 4184 3194 2735 1775 2029
## [211] 2686 3374 3601 4044 4305 2884 3043 2616 2723 4429 3596 2944 3156 3993 3739
## [226] 4397 3830 2766 4061 3154
# Medidas de resumen

MIN <- min(RENDIMIENTOMAJ)
Q1 <- quantile(RENDIMIENTOMAJ, probs = 0.25)
MEDIA <- mean(RENDIMIENTOMAJ)
MEDIANA <- median(RENDIMIENTOMAJ)
Q3 <- quantile(RENDIMIENTOMAJ, probs = 0.75)
MAX <- max(RENDIMIENTOMAJ)
RANGO <- range(RENDIMIENTOMAJ)
SD <- sd(RENDIMIENTOMAJ)
CV <- (SD / MEDIA) * 100  

# Imprimimos los objetos
MIN
## [1] 1703
Q1
##     25% 
## 3667.75
MEDIA
## [1] 4468.043
MEDIANA
## [1] 4424.5
Q3
##  75% 
## 5390
MAX
## [1] 7240
RANGO
## [1] 1703 7240
SD
## [1] 1196.54
CV
## [1] 26.77996
summary(RENDIMIENTOMAJ)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    1703    3668    4424    4468    5390    7240
ggplot(TRIGOMAJ, aes(Rendimiento, Genotipo, color = Genotipo)) +
  geom_boxplot()

#Los genotipos de trigo que recomendaríamos para la localidad de Marcos Juárez son: ACA905, AGPFast y ATLAX, ya que presentan un rendimiento alto.