_________________________________________________________________________________________________________________________

Caso 1: tamaño muestral para estimar la media con población finita

Si tenemos una población conocida, la fórmula ajustada es:

\[ n = \frac{Z^2 \cdot \sigma^2 \cdot N}{(N - 1) \cdot E^2 + Z^2 \cdot \sigma^2} \]

Donde:

\(n\): tamaño muestral.
\(Z\): valor Z correspondiente a un nivel de confianza.
\(\sigma\): desviación estándar de la población.
\(N\): tamaño de la población.
\(E\): margen de error tolerado.

# 1. Definimos los Parámetros
Z <- 1.96  # Valor de Z para un nivel de confianza del 95%
sigma <- 3  # Desviación estándar de la población
N <- 250  # Tamaño de la población total
E <- 2     # Margen de error tolerado

# 2. Calculamos el tamaño muestral
n_med_pf <- (Z^2 * sigma^2 * N) / ((N - 1) * E^2 + Z^2 * sigma^2)
n_med_pf <- ceiling(n_med_pf)  # Redondear hacia arriba
n_med_pf

## [1] 9

Caso 2: tamaño muestral para estimar la media con población infinita

Para una población infinita, el tamaño muestral se calcula usando:

\[ n = \left( \frac{Z \cdot S}{E} \right)^2 \]

Donde:

\(Z\): es el valor del estadístico Z para un determinado nivel de confianza (1 - \(\alpha\)).
\(S\): es la desviación estándar estimada de la población a través de la muestra piloto o bien de experiencias previas.
\(E\): es el margen de error tolerado, es decir, la máxima diferencia aceptable entre la media muestral y la media poblacional.

# 1. Definimos los parámetros
Z <- 1.96  # Valor de Z para un nivel de confianza del 95%
E <- 14     # Margen de error tolerado
S <- 105  # Se considera una estimación de la desviación estándar de 105

# 2. Calculamos el tamaño muestral
n_media_pinf <- (Z * S / E)^2
n_media_pinf <- ceiling(n_media_pinf)  # Redondear hacia arriba para obtener valor entero.
n_media_pinf

## [1] 217

Caso 3: tamaño muestral para una proporción con población infinita

El tamaño de muestra necesario para estimar una proporción en una población infinita se puede calcular usando la siguiente fórmula:

\[ n = \frac{Z^2 \cdot p \cdot (1 - p)}{E^2} \]

Donde:

\(n\): es el tamaño muestral.
\(Z\): es el valor Z correspondiente al nivel de confianza.
\(p\): es la proporción esperada.
\(E\): es el margen de error tolerado.

# 1. Definimos los parámetros
Z <- 1.96  # Valor de Z para un nivel de confianza del 95%
p <- 0.5   # Proporción esperada 
E <- 0.05  # Margen de error

# 2. Calculamos el tamaño muestral
n_prop_inf <- (Z^2 * p * (1 - p)) / (E^2)
n_prop_inf <- ceiling(n_prop_inf)  # Redondear hacia arriba
n_prop_inf

## [1] 385

Caso 4: tamaño muestral para una proporción con población finita

\[ n = \frac{Z^2 \cdot p \cdot (1 - p) \cdot N}{(N - 1) \cdot E^2 + Z^2 \cdot p \cdot (1 - p)} \]

Donde:

\(n\): es el tamaño muestral.
\(Z\): es el valor Z correspondiente al nivel de confianza.
\(p\): es la proporción esperada.
\(N\): es el tamaño de la población.
\(E\): es el margen de error tolerado.

# 1. Definimos los Parámetros
Z <- 1.96  # Para un nivel de confianza del 95%
p <- 0.5   # Proporción esperada 
N <- 1000  # Tamaño de la población total
E <- 0.05  # Margen de error tolerado

# 2. Calculamos el tamaño muestral
n_prop_fin <- (Z^2 * p * (1 - p) * N) / ((N - 1) * E^2 + Z^2 * p * (1 - p))
n_prop_fin <- ceiling(n_prop_fin)  # Redondear hacia arriba
n_prop_fin

## [1] 278

Desarrollamos un caso práctico con la base de datos “Mandarinas”

1. Instalamos paquetes

install.packages("tidyverse")

2. Cargamos paquetes

library(tidyverse)
library(readxl)

3. Cargamos la base de datos

MANDARINAS <- read_excel("MANDARINAS_2024.xlsx")

4. Obtenemos medidas de resumen para la variable “Peso” de cada “Grupo” y variedad “Clementina”.

RESUMEN <- MANDARINAS %>% 
  filter(VARIEDAD == "Clementina") %>% 
  group_by(GRUPO) %>% 
  summarise(MEDIA = mean(PESO),
            SD = sd(PESO),
            MIN_GRUPO= min(PESO),
            MAX_GRUPO= max(PESO))
RESUMEN

## # A tibble: 7 × 5
##   GRUPO MEDIA    SD MIN_GRUPO MAX_GRUPO
##   <dbl> <dbl> <dbl>     <dbl>     <dbl>
## 1     1  146.  34.6        37       231
## 2     2  160.  36.0       113       273
## 3     3  151.  32.5        86       212
## 4     4  142.  33.6        64       199
## 5     5  158.  40.3        90       257
## 6     6  144.  34.9        71       204
## 7     7  168.  32.3       116       227

5. Obtenemos medidas de resumen para la variable “Peso” de todos los “Grupos” y variedad “Clementina”.

RESUMEN_GRAL <-MANDARINAS %>% 
  filter(VARIEDAD == "Clementina") %>% 
  summarise(MEDIA_GRAL = mean(PESO),
            SD_GRAL= sd(PESO),
            MIN_GRAL= min(PESO),
            MAX_GRAL= max(PESO))
RESUMEN_GRAL

## # A tibble: 1 × 4
##   MEDIA_GRAL SD_GRAL MIN_GRAL MAX_GRAL
##        <dbl>   <dbl>    <dbl>    <dbl>
## 1       153.    35.6       37      273

6. Cálculo del tamaño muestral

“Cuando no se conocen los valores poblacionales, se pueden sustituir por una estimación adecuada obtenida de estudios previos o de una prueba piloto (Ojeda et al., 2011, Metodología de diseño estadístico).”

Error muestral

Podemos asumir un error del 5% respecto al valor medio. Si tomamos por ejemplo la variable “Peso” de las mandarinas, se puedes calcular el error en función de las medias observadas.Así, para el Grupo 1, con una media de 146.47 g, un error del 5% sería:

𝐸= 0.05 × 146.47 = 7.32 g

Esto implica que se espera que la media poblacional esté dentro de 7.32 gramos por encima o por debajo de la media muetral.

6.1. Tamaño muestral para población desconocida con base en los datos del “Grupo 1”, tomando la variable “Peso”.

# Calculamos el tamaño muestral de frutos para la variedad "Clementina".

# 1. Definimos los parámetros
M1 <- 146.4667 # Media muestral del Grupo 1.    
Z <- 1.96  # Valor de Z para un nivel de confianza del 95%
E <- 0.05*M1 # Margen de error tolerado (5% de la media)
S1 <- 34.57100  # Se considera una estimación de la desviación estándar de 35.59
E

## [1] 7.323335

# 2. Calculamos el tamaño muestral
n_cle_g1 <- (Z * S1 / E)^2
n_cle_g1 <- ceiling(n_cle_g1)  # Redondear hacia arriba para obtener valor entero.
n_cle_g1

## [1] 86

6.2. Cálculo del tamaño muestral para población desconocida, con base en los datos del “Grupo 2”, tomando la variable “Peso”.

# Calculamos el tamaño muestral de frutos para la variedad "Clementina".

# 1. Definimos los parámetros
M2 <- 160.4333      
Z <- 1.96  # Valor de Z para un nivel de confianza del 95%
E <- 0.05 * M2    # Margen de error tolerado (5% de la media)
S2 <- 36.01789  # Se considera una estimación de la desviación estándar de 35.59
E

## [1] 8.021665

# 2. Calculamos el tamaño muestral
n_cle_g2 <- (Z * S2 / E)^2
n_cle_g2 <- ceiling(n_cle_g2)  # Redondear hacia arriba para obtener valor entero.
n_cle_g2

## [1] 78

6.3. Cálculo del tamaño muestral para población desconocida, con base en los datos de todos los Grupos.

# Calculamos el tamaño muestral de frutos para la variedad "Clementina".

# 1. Definimos los parámetros
Mgral <- 152.5694       
Z <- 1.96  # Valor de Z para un nivel de confianza del 95%
E <- 0.09 * Mgral    # Margen de error tolerado (5% de la media) +-7.63 gramos.
Sgral <- 35.59098  # Se considera una estimación de la desviación estándar de 35.59

# 2. Calculamos el tamaño muestral
n_cle_gral <- (Z * Sgral / E)^2
n_cle_gral <- ceiling(n_cle_gral)  # Redondear hacia arriba para obtener valor entero.
n_cle_gral

## [1] 26

6.4. Tamaño muestral para estimar la media con población conocida.

Para resolver este caso, vamos a partir del supuesto que cada árbol tiene 500 frutos y que en el lote hay 250 plantas de la variedad Clementina.

N = 500 frutos/planta x 250 plantas = 125000 frutos

# 1. Definimos los Parámetros
Mgral <- 152.5694   
Z <- 1.96  # Valor de Z para un nivel de confianza del 95%
sigma <- 35.59098  # Desviación estándar de la población
N <- 125000  # Tamaño de la población total
E <- 0.05 * Mgral  # Margen de error tolerado
E

## [1] 7.62847

# 2. Calculamos el tamaño muestral
n_cle_peso_pf <- (Z^2 * sigma^2 * N) / ((N - 1) * E^2 + Z^2 * sigma^2)
n_cle_peso_pf <- ceiling(n_cle_peso_pf)  # Redondear hacia arriba
n_cle_peso_pf

## [1] 84

Módulo 3: Tamaño de Muestra

Diplomatura en Bioestadística con Software R por Proyectos

Facultad de Ciencias Agrarias - Universidad Nacional de Catamarca

Caso 1: tamaño muestral para estimar la media con población finita

Caso 2: tamaño muestral para estimar la media con población infinita

Caso 3: tamaño muestral para una proporción con población infinita

Caso 4: tamaño muestral para una proporción con población finita

Desarrollamos un caso práctico con la base de datos “Mandarinas”

1. Instalamos paquetes

2. Cargamos paquetes

3. Cargamos la base de datos

4. Obtenemos medidas de resumen para la variable “Peso” de cada “Grupo” y variedad “Clementina”.

5. Obtenemos medidas de resumen para la variable “Peso” de todos los “Grupos” y variedad “Clementina”.

6. Cálculo del tamaño muestral

Error muestral

6.1. Tamaño muestral para población desconocida con base en los datos del “Grupo 1”, tomando la variable “Peso”.

6.2. Cálculo del tamaño muestral para población desconocida, con base en los datos del “Grupo 2”, tomando la variable “Peso”.

6.3. Cálculo del tamaño muestral para población desconocida, con base en los datos de todos los Grupos.

6.4. Tamaño muestral para estimar la media con población conocida.