Instalamos paquetes

install.packages("leaflet")
## Installing package into '/cloud/lib/x86_64-pc-linux-gnu-library/4.4'
## (as 'lib' is unspecified)

Cargamos las librerías

# Cargar libreria necesaria
library(readxl)
library(dplyr)
library(leaflet)

Cargamos la base de datos “Mandarina”

#Cargamos base de datos mandarina
MANDARINAS <- read_excel("MANDARINAS_2024.xlsx")

Ubicación de los lotes en el campo

leaflet() %>%
  addProviderTiles(providers$Esri.WorldImagery) %>%
  setView(lng = -65.85754528972062, lat = -28.653488585584952, zoom = 16) %>% 
  addMarkers(lng = -65.85754528972062, lat = -28.653488585584952)

Procedimiento de selección de los individuos de la muestra

Muestreo Aleatorio Simple (MAS) sin reemplazo

# Calculamos el tamaño muestral de frutos para la variedad "Clementina".

# 1. Definimos los parámetros
M1 <- 146.4667 # Media muestral del Grupo 1.    
Z <- 1.96  # Valor de Z para un nivel de confianza del 95%
E <- 0.05*M1 # Margen de error tolerado (5% de la media)
S1 <- 34.57100  # Se considera una estimación de la desviación estándar de 35.59
E
## [1] 7.323335
# 2. Calculamos el tamaño muestral
n_cle_g1 <- (Z * S1 / E)^2
n_cle_g1 <- ceiling(n_cle_g1)  # Redondear hacia arriba para obtener valor entero.
n_cle_g1
## [1] 86
# 3. Definir cantidad de plantas a muestrear

N_plantas <- n_cle_g1/ 4
N_plantas <- ceiling(N_plantas)
N_plantas
## [1] 22
# MAS sin reemplazo
CLEMENTINA <- 1:220 #tamaño de población de Clementina

MAS_CLEMENTINA_22 <- sample(CLEMENTINA, size = 22, replace = FALSE) #size = 10 indica que se seleccionarán 10 elementos y replace = FALSE indica que se selecciona sin reemplazo.
MAS_CLEMENTINA_22
##  [1]  82 135 217 200 212  87  81 195  37  56 189 170  12 107 137 161  21  14 126
## [20] 179 162 100
# Ordenamos la muestra de 10 elementos en cada lote de menor a mayor con la función "sort()"
MAS_CLE_ORD_22 <- sort(MAS_CLEMENTINA_22)
MAS_CLE_ORD_22
##  [1]  12  14  21  37  56  81  82  87 100 107 126 135 137 161 162 170 179 189 195
## [20] 200 212 217

Muestreo Sistemático

VARIEDAD CLEMENTINA

# 1. Definir el tamaño de la población y el tamaño muestral
N_LOTE_CLEMENTINA <- 220
n_TAMAÑO_MUESTRAL <- 22

# 2. Calcular el espaciamiento de muestreo (k)
k_INTERVALO_MUESTREO <- ceiling(N_LOTE_CLEMENTINA / n_TAMAÑO_MUESTRAL)
k_INTERVALO_MUESTREO
## [1] 10
# 3. Determinar la unidad de arranque o punto de partida del muestreo.
PLANTA_INICIO_MUESTREO <- sample(1:k_INTERVALO_MUESTREO, 1) #indica la 1° planta a muestrear
PLANTA_INICIO_MUESTREO
## [1] 1
# 4. Seleccionar las plantas del lote de Clementina
MS_CLEMENTINA <- seq(from = PLANTA_INICIO_MUESTREO, to = N_LOTE_CLEMENTINA, by = k_INTERVALO_MUESTREO)
# Mostrar la muestra seleccionada
MS_CLEMENTINA
##  [1]   1  11  21  31  41  51  61  71  81  91 101 111 121 131 141 151 161 171 181
## [20] 191 201 211

Muestreo estratificado con afijación proporcional

Cantidad de frutos

N(Clementina) = 500 frutos/planta x 220 plantas = 125000 frutos

N(Criolla) = 500 frutos/planta x 80 plantas = 40000 frutos

MANDARINAS %>% 
  filter(GRUPO == 1) %>%
  group_by(VARIEDAD) %>% 
  summarise(mean(PESO), sd(PESO))
## # A tibble: 2 × 3
##   VARIEDAD   `mean(PESO)` `sd(PESO)`
##   <chr>             <dbl>      <dbl>
## 1 Clementina         146.       34.6
## 2 Criolla            135.       27.0
# Variedad Clementina (Cl) y Criolla (Cr)

# 1. Definimos los Parámetros 
M1_Cl <- 146.4667
M1_Cr <- 135.2667
Z <- 1.96  # Valor de Z para un nivel de confianza del 95%
sigma_Cl <- 34.57100  # Desviación estándar de la población de Clementina
sigma_Cr <- 26.9507 # Desviación estándar de la población de Criolla
N_Cl <- 110000  # Tamaño de la población total de Clemetina
N_Cr <- 40000 # Tamaño de la población total de Clemetina
E_Cl <- 0.05 * M1_Cl  # Margen de error tolerado en Clementina
E_Cr <- 0.05 * M1_Cr # Margen de error tolerado en Criolla
E_Cl
## [1] 7.323335
E_Cr
## [1] 6.763335
# 2. Calculamos el tamaño muestral de Clementina
n_Cle_peso_pf <- (Z^2 * sigma_Cl^2 * N_Cl) / ((N_Cl - 1) * E_Cl^2 + Z^2 * sigma_Cl^2)
n_Cle_peso_pf <- ceiling(n_Cle_peso_pf)  # Redondear hacia arriba
n_Cle_peso_pf
## [1] 86
# 3. Calculamos el tamaño muestral de Criolla
n_Cri_peso_pf <- (Z^2 * sigma_Cr^2 * N_Cr) / ((N_Cr - 1) * E_Cr^2 + Z^2 * sigma_Cr^2)
n_Cri_peso_pf <- ceiling(n_Cri_peso_pf)  # Redondear hacia arriba
n_Cri_peso_pf
## [1] 61
#4 Tamaño total de la muestra
MUESTRA_FINAL <- n_Cle_peso_pf + n_Cri_peso_pf
MUESTRA_FINAL
## [1] 147
# Cantidad de PLANTA
PLANTAS <- MUESTRA_FINAL/ 4
PLANTAS <- ceiling(PLANTAS)
PLANTAS
## [1] 37
#Afijación proporcional
PLANTAS
## [1] 37
Ncle_cri <- 300
n1 <- 220 #Clementina 
n2 <- 80  #Criolla    

#Fracción de muestreo proporcional
 f <- PLANTAS/Ncle_cri
 f
## [1] 0.1233333
n1 <- f * 220 # cantidad de árboles de Clementina
n1 <- ceiling(n1)
n2 <- f * 80  # cantidad de árboles de Criolla 
n2 <- ceiling(n2)
n1
## [1] 28
n2
## [1] 10
# Muestreo estratificado con afijación proporcional

CLEMENTINA <- 1:220 #tamaño de población de Clementina
CRIOLLA <- 1:80

#1. Clementina
#Aplicamos la función sample
CLE_EST <- sample(CLEMENTINA, size = 28, replace = FALSE) 
#Ordenamos el resultado
CLE_EST_ORD <- sort(CLE_EST)
CLE_EST_ORD
##  [1]   7  11  12  16  42  51  53  58  61  66  78  79  80  81 102 108 117 147 149
## [20] 154 156 169 180 187 190 202 216 217
#2. Criolla
#Aplicamos la función sample
CRI_EST <- sample(CRIOLLA, size = 10, replace = FALSE) 
#Ordenamos el resultado
CRI_EST_ORD <- sort(CRI_EST)
CRI_EST_ORD
##  [1]  2  8 11 21 28 42 46 58 68 72