_________________________________________________________________________________________________________________________


1 Instalamos un nuevo paquete

install.packages("leaflet")

El paquete leaflet en R permite la creación de mapas interactivos, con la capacidad de personalizar marcadores, capas y geometrías.

2 Cargamos las librerías

# Cargar libreria necesaria
library(readxl)
library(dplyr)
library(kableExtra)
library(leaflet)

3 Cargamos la base de datos

Para realizar los ejercicios de muestreo, seguiremos el caso con el cual venimos desarrollando la diplomatura denominado “Mandarinas”.

#Cargamos base de datos mandarina
MANDARINAS <- read_excel("MANDARINAS_2024.xlsx")

4 Ubicación de los lotes en el campo

leaflet() %>%
  addProviderTiles(providers$Esri.WorldImagery) %>%
  setView(lng = -65.85754528972062, lat = -28.653488585584952, zoom = 16) %>% 
  addMarkers(lng = -65.85754528972062, lat = -28.653488585584952)

Argumentos:

  1. leaflet(): Inicializa un mapa interactivo vacío.

  2. addProviderTiles(providers$Esri.WorldImagery): Agrega una capa de fondo con imágenes satelitales de alta resolución de la superficie terrestre.

  3. setView(lng = -65.85754528972062, lat = -28.653488585584952, zoom = 17): Ajusta el centro del mapa en una ubicación específica usando coordenadas de longitud y latitud y el nivel de zoom se establece en 17, proporcionando una vista cercana y detallada de la zona.

  4. addMarkers(lng = -65.85754528972062, lat = -28.653488585584952): Coloca un marcador en las mismas coordenadas especificadas en setView() para señalar un punto de interés concreto en el mapa.

Para más información: Paquete leaflet en R coder

5 Diseño del muestreo

Características de los lotes a muestrear

  • La variedad Clementina presenta 250 plantas.

  • La variedad Criolla presenta 100 plantas.

Estrategia de Selección y Recolección:

  • Se seleccionarán 10 árboles de cada variedad.

  • De cada árbol se extraerán 4 frutos de los cuatro puntos cardinales.

Criterios de inclusión:

  • Las plantas deben pertenecer a la variedad que se está muestreando en cada lote.

  • Edad de las plantas: Incluir únicamente árboles en un rango de edad productiva, evitando árboles demasiado jóvenes o demasiado viejos, que podrían no representar adecuadamente la producción típica.

  • Condiciones agronómicas: Asegurarse de que las plantas han sido tratadas de manera uniforme en cuanto a riego, fertilización, tratamientos sanitarios, etc., para evitar sesgos en la calidad de los frutos.

Criterios de exclusión:

  • Plantas que se encuentren enfermas o presenten otro tipo de afección.

  • Plantas ubicadas en los bordes del lote (borduras).

  • Plantas que no pertenezcan a la variedad objetivo.

  • Plantas que no se encuentren en su ubicación asignada previamente en el diseño del muestreo.

6 Muestreo Aleatorio Simple (MAS) sin reemplazo

Usaremos la función sample()del paquete {base} que permite obtener una muestra del tamaño especificado de los elementos de x con o sin reemplazo.

# MAS sin reemplazo
CLEMENTINA <- 1:250 #tamaño de población de Clementina
CRIOLLA <- 1:100    #tamaño de población de Criolla
MAS_CLEMENTINA <- sample(CLEMENTINA, size = 10, replace = FALSE) 
MAS_CRIOLLA <- sample(CRIOLLA, size = 10, replace = FALSE)
MAS_CLEMENTINA
##  [1] 108 176 233 112 136 150 193 119 160 239
MAS_CRIOLLA
##  [1] 49 88 43  2  5 58 15 39 70 31
# Ordenamos la muestra en cada lote de menor a mayor con la función "sort()"
MAS_CLE_ORD <- sort(MAS_CLEMENTINA)
MAS_CRIOLLA_ORD <- sort(MAS_CRIOLLA)
MAS_CLE_ORD
##  [1] 108 112 119 136 150 160 176 193 233 239
MAS_CRIOLLA_ORD
##  [1]  2  5 15 31 39 43 49 58 70 88

7 Muestreo Sistemático

Los pasos para obtener una muestra sistemática de tamaño “n” de una población “N” son:

  1. Definir tamaño de la población (N) y tamaño muestral (n).

  2. Calcular el intervalo de muestreo (K): se obtiene de dividir el número total de plantas del lote a muestrear (N) en el tamaño de la muestra (n).

\[ K = \frac{N}{n} \]

  1. Punto de partida: seleccionar un número aleatorio entre 1 y el intervalo de muestreo (K). Este valor determinará la primera planta a muestrear.

  2. Seleccionar las plantas del lote a muestrear de acuerdo con el intervalo de muestreo, comenzando desde el punto de partida.

VARIEDAD CLEMENTINA

# 1. Definir el tamaño de la población y el tamaño muestral
LOTE_CLEMENTINA <- 250
TAMAÑO_MUESTRAL <- 10

# 2. Calcular el intervalo de muestreo
INTERVALO_MUESTREO <- ceiling(LOTE_CLEMENTINA / TAMAÑO_MUESTRAL)
INTERVALO_MUESTREO
## [1] 25
# 3. Determinar el punto de partida del muestreo.
PLANTA_INICIO_MUESTREO <- sample(3:INTERVALO_MUESTREO, 1) # 3 indica la primera planta a muestrear
PLANTA_INICIO_MUESTREO
## [1] 24
# 4. Seleccionar las plantas del lote de Clementina
MS_CLEMENTINA <- seq(from = PLANTA_INICIO_MUESTREO, to = LOTE_CLEMENTINA, by = INTERVALO_MUESTREO)
# Mostrar la muestra seleccionada
MS_CLEMENTINA
##  [1]  24  49  74  99 124 149 174 199 224 249

Argumentos

  • ceiling(): redondea hacia arriba el intervalo de muestreo.
  • sample(): se utiliza para seleccionar un número aleatorio entre 1 y el intervalo de muestreo como punto de partida.
  • seq(): genera una secuencia de números que representan las plantas seleccionadas, comenzando desde el número aleatorio seleccionado y avanzando en incrementos del intervalo de muestreo hasta alcanzar el tamaño total de la plantación.

8 ¿Es adecuado el tamaño muestral elegido para la variedad Clementina?

Caso 2: tamaño muestral para estimar la media con población finita (conocida)

¿Parámetros?

Z= ?

sigma= ?

N= ?

E= ?

# PASO 1. Calculamos la desviación estandar poblacional (sigma)
RESUMEN_CLEM_PESO <- MANDARINAS %>%
  filter(VARIEDAD == "Clementina") %>%
  summarise(N = n(),
    MIN = min(PESO),
    MEDIA = mean(PESO),
    SIGMA = sd(PESO),
    CV = (sd(PESO) / mean(PESO)) * 100,
    MAX = max(PESO))
kable(RESUMEN_CLEM_PESO)
N MIN MEDIA SIGMA CV MAX
209 37 152.5694 35.59098 23.32773 273
# PASO 2. Definimos los Parámetros para calcular el tamaño muestral adecuado para la variedad Clementina
Z <- 1.96  # Elegimos un nivel de confianza del 95%
sigma <- 35.59098     # Desviación estándar de la población
N <- 209  # Tamaño de la población total
E <- 15.26   # Margen de error tolerado (10 % de la media)

# Paso 3. Calculamos el tamaño muestral para la variedad Clementina
TM_CLEMENTINA <- (Z^2 * sigma^2 * N) / ((N - 1) * E^2 + Z^2 * sigma^2)
TM_CLEMENTINA <- ceiling(TM_CLEMENTINA)  # Redondear hacia arriba
TM_CLEMENTINA
## [1] 20