Ejercicios Muestreo Cap7

#Ejercicio 7.1

Ejercicio <- "Suponga que una compañía hipotecaria de casas tiene N hipotecas numeradas consecutivamente en el orden en que fueron otorgadas durante un periodo de 20 años. Existe una tendencia de incremento en los saldos sin pagar a causa del aumento en el costo de la vivienda a través de los años. La compañía desea estimar la cantidad total de los saldos sin pagar. (Emplearía usted un muestreo irrestricto aleatorio o un muestreo sistemático?¿ Por qué?"


#Usaría un muestreo sistemático debido a la tendencia de incremento en los saldos, ya que permite obtener una muestra representativa del periodo completo sin importar el orden de las hipotecas. Esto asegura una estimación más precisa del total de saldos sin pagar, capturando la variabilidad a través de los años. El muestreo irrestricto podría no captar adecuadamente esta tendencia histórica.

cat("Next")

## Next

#Ejercicio 7.2

Ejercicio <- "Una corporación lista a los empleados por grupos de ingresos (alfabéticamente dentro de grupos) desde el más alto hasta el más bajo. Si el objetivo es estimar el ingreso promedio por empleado, (¿deberá usarse el muestreo sistemático, el muestreo estratificado o el muestreo irrestricto aleatorio? Suponga que los costos son equivalentes para los tres métodos y que usted puede estratificar por grupos de ingreso. Analice las ventajas y desventajas de los tres métodos."

#Respuesta
cat("Dado que los empleados están agrupados por ingresos, el muestreo estratificado sería ideal, ya que permite estimar con precisión el ingreso promedio considerando la variabilidad entre grupos de ingreso. 
\nVentajas:
1. Muestreo Estratificado: Maximiza la precisión al representar cada grupo de ingresos, reduciendo la variabilidad entre estratos.
2. Muestreo Sistemático: Es rápido y garantiza cobertura general, pero podría introducir sesgo si hay patrones en los datos dentro de cada grupo de ingresos.
3. Muestreo Irrestricto Aleatorio: Simple de aplicar, pero menos eficiente en estimaciones cuando hay alta variabilidad entre ingresos.
\nDesventaja:
1. Estratificado: Requiere información previa de los grupos.
2. Sistemático: Puede no captar la variabilidad específica entre ingresos en orden alfabético.
3. Irrestricto Aleatorio: Menor precisión en estimaciones de ingreso promedio.")

## Dado que los empleados están agrupados por ingresos, el muestreo estratificado sería ideal, ya que permite estimar con precisión el ingreso promedio considerando la variabilidad entre grupos de ingreso. 
## 
## Ventajas:
## 1. Muestreo Estratificado: Maximiza la precisión al representar cada grupo de ingresos, reduciendo la variabilidad entre estratos.
## 2. Muestreo Sistemático: Es rápido y garantiza cobertura general, pero podría introducir sesgo si hay patrones en los datos dentro de cada grupo de ingresos.
## 3. Muestreo Irrestricto Aleatorio: Simple de aplicar, pero menos eficiente en estimaciones cuando hay alta variabilidad entre ingresos.
## 
## Desventaja:
## 1. Estratificado: Requiere información previa de los grupos.
## 2. Sistemático: Puede no captar la variabilidad específica entre ingresos en orden alfabético.
## 3. Irrestricto Aleatorio: Menor precisión en estimaciones de ingreso promedio.

#Ejercicio 7.4

Ejericicio <- "La gerencia de una compañía privada está interesada en estimar la proporción de empleados que favorecen una nueva política de inversión. Una muestra sistemática de l-en-10 es obtenida de los empleados que salen del edificio al final de un día de trabajo en particular. Use los datos de la tabla adjunta para estimar p. la proporción a favor de la nueva política, y establezca un límite para el error de estimación. Suponga N = 2000."

Objetivos <- "Calcular Psy, la proporción estimada de empleados a favor de la política y Calcular un límite para el error de estimación."


# Datos 
N <- 2000  # Tamaño poblacional
n <- 200   # Tamaño de la muestra
suma_yi <- 132  # Suma de respuestas afirmativas

# Cálculo de la proporción muestral estimada
p_sy <- suma_yi / n
q_sy <- 1 - p_sy  

# varianza estimada de la proporción muestral Psy (7.10)
varianza_p_sy <- (p_sy * q_sy) / (n - 1) * ((N - n) / N)

# límite para el error de estimación (7.11)
error_estimacion <- 2 * sqrt(varianza_p_sy)

cat("Proporción estimada a favor de la nueva política (p_sy):", p_sy, "\n")

## Proporción estimada a favor de la nueva política (p_sy): 0.66

cat("Varianza estimada de la proporción muestral:", varianza_p_sy, "\n")

## Varianza estimada de la proporción muestral: 0.001014874

cat("Límite para el error de estimación:", error_estimacion, "\n")

## Límite para el error de estimación: 0.06371419

#Ejercicio 7.5

Ejercicio <- "Para la situación referida en el Ejercicio 7.4, determine el tamaño de muestra requerido para estimar p, con un límite para el error de estimación de 0.01 unidades. ¿Qué tipo de muestra sistemática deberá obtenerse?" 

# Datos
N <- 2000            # Tamaño poblacional
B <- 0.01            # Límite para el error de estimación
p_sy <- 0.66         # Proporción estimada
sigma2 <- p_sy * (1 - p_sy)  # Varianza de la proporción muestral

# Cálculo de D
D <- (B^2) / 4

# tamaño de muestra n
n <- N * sigma2 / ((N - 1) * D + sigma2)

cat("Tamaño de muestra requerido:", ceiling(n), "\n")

## Tamaño de muestra requerido: 1636

cat("Tipo de muestreo sistemático 1-en-", round(N / ceiling(n)), "\n")

## Tipo de muestreo sistemático 1-en- 1

#Ejercicio 7.6

Ejercicio <- "La sección de control de calidad de una empresa usa el muestreo sistemático para estimar la cantidad promedio de llenado en latas de 12 onzas que sale de una línea de producción. Los datos de la tabla adjunta representan una muestra sistemática de 1-en-50 de la producción de un día. Estime μ, y establezca un límite para el error de estimación. Suponga que N = 1800."
  
# Datos
datos <- c(12, 11.97, 12.01, 12.03, 12.01, 11.80, 
             11.91, 11.98, 12.03, 11.98, 12, 11.83,
             11.87, 12.01, 11.98, 11.87, 11.90, 11.88, 
             12.05, 11.87, 11.91, 11.93, 11.94, 11.89,
             11.72, 11.93, 11.95, 11.97, 11.93, 12.05,
             11.85, 11.98, 11.87, 12.05, 12.02, 12.04)

N <- 1800  # Tamaño poblacional
n <- length(datos)  # Tamaño de la muestra

# media muestral
media_muestral <- mean(datos)

# varianza muestral
varianza_muestral <- var(datos)

# varianza estimada de la media (7.2)
V_y_sy <- (varianza_muestral / n) * ((N - n) / N)

# Límite para el error de estimación (7.3)
error_estimacion <- 2 * sqrt(V_y_sy)

# Resultados
cat("Media poblacional estimada (mu):", media_muestral, "\n")

## Media poblacional estimada (mu): 11.94472

cat("Límite para el error de estimación:", (error_estimacion),  "\n")

## Límite para el error de estimación: 0.02591679

#Ejercicio 7.7
  
Ejercicio <- "Use los datos del Ejercicio anterior para determinar el tamaño de muestra requerido para estimar μ dentro de 0.03 unidades."

# Datos 

varianza_muestral <- var(datos)  

B <- 0.03  # Límite de error deseado
N <- 1800  # Tamaño de la población

# Cálculo de D
D <- B^2 / 4

# tamaño de muestra necesario (7.13)
n_requerido <- (N * varianza_muestral) / ((N - 1) * D + varianza_muestral)

n_requerido <- ceiling(n_requerido)

cat("Tamaño de muestra requerido:", n_requerido, "\n")

## Tamaño de muestra requerido: 28

#Ejercicio 7.8 #FALTAN DATOS

Ejercicio <- "Expertos en edafología quieren determinar la cantidad de calcio intercambiable (en partes por millón) en una parcela de terreno. Para simplificar el esquema de muestreo, en el terreno se sobrepone una malla rectangular. En cada punto de intersección en la malla se toman muestras de suelo. Use los datos siguientes para determinar la cantidad promedio de calcio intercambiable en la parcela de terreno. Establezca un limite para el error de estimación."
  
# Datos 
n <- 45
suma_y <- 90320
suma_y2 <- 148030000

# media muestral
media_muestral <- suma_y / n

# varianza muestral
varianza_muestral <- (suma_y2 - (suma_y^2 / n)) / (n - 1)

# Límite para el error de estimación 
error_estimacion <- 2 * sqrt(varianza_muestral / n)

## Warning in sqrt(varianza_muestral/n): Se han producido NaNs

cat("Media muestral de calcio intercambiable:", media_muestral, "\n")

## Media muestral de calcio intercambiable: 2007.111

#Ejercicio 7.9
  
Ejercicio <- "La patrulla de caminos de un estado en particular está interesada en la proporción de automovilistas que portan su licencia. Se instala un puesto de verificación en una carretera principal y se detiene al conductor de cada séptimo automóvil. Use los datos de la tabla anexa para estimar la proporción de conductores que portan su licencia. Establezca un límite para el error de estimación. Suponga que N = 2800 autos pasan por el puesto de verificación durante el periodo de muestreo."

# Datos 
suma_yi <- 324
n <- 400
N <- 2800

# proporción muestral
p_sy <- suma_yi / n

# varianza estimada de la proporción
varianza_p_sy <- (p_sy * (1 - p_sy)) / (n - 1) * ((N - n) / N)

# límite para el error de estimación
error_estimacion <- 2 * sqrt(varianza_p_sy)

# Resultados
cat("Proporción muestral de conductores con licencia:", p_sy, "\n")

## Proporción muestral de conductores con licencia: 0.81

cat("Límite para el error de estimación:", error_estimacion, "\n")

## Límite para el error de estimación: 0.03636549

#Ejercicio 7.10
  
Ejercicio <- "La patrulla de caminos espera que pasen cuando menos N = 3000 automóviles por el puesto de verificación. Determine el tamaño de muestra requerido para estimar P con aproximación de B = 0.015 unidades."

# Datos 
N <- 3000
B <- 0.015
p <- 0.81 #Proporcion del ejercicio anterior

# valor de D 
D <- B^2 / 4

# tamaño de muestra necesario
n <- (N * p * (1 - p)) / ((N - 1) * D + p * (1 - p))

# Redondear al número entero más cercano
n <- ceiling(n)

# Resultados
cat("Tamaño de muestra requerido:", n, "\n")

## Tamaño de muestra requerido: 1432

#Ejercicio 7.11
  
Ejercicio <- "Un colegio está interesado en mejorar sus relaciones con una comunidad vecina. Una muestra sistematica de 1 -en-150 de los N = 4500 estudiantes listados en el directorio es tomada para estimar la cantidad total de dinero gastado en ropa durante un trimestre del año escolar. Los resultados de la muestra están listados en la tabla anexa. Use los datos para estimar τ, y establezca un límite para el error de estimación."

# Datos 
gastos <- c(30, 22, 10, 62, 28, 31, 40, 29, 17, 51, 29, 21, 13, 15, 23,
            32, 14, 29, 48, 50, 9, 15, 6, 93, 21, 20, 13, 12, 29, 38)

N <- 4500        # Tamaño de la población
n <- length(gastos)  # Tamaño de la muestra

# media muestral
y_barra <- mean(gastos)

# Estimador del total poblacional
tau_hat <- N * y_barra

# varianza muestral
s_y2 <- var(gastos)

# varianza estimada de tau (7.7) 
V_tau <- N^2 * (s_y2 / n) * ((N - n) / N)

# Límite para el error de estimación (7.8)
error_limit <- 2 * sqrt(V_tau)

# Resultados
cat("Estimación del total poblacional (τ̂):", tau_hat, "\n")

## Estimación del total poblacional (τ̂): 127500

cat("Límite para el error de estimación:", error_limit, "\n")

## Límite para el error de estimación: 30137.06

#Ejercicio 7.12
  
Ejercicio <- "¿Qué tamaño de muestra es necesario para estimar τ en el Ejercicio 7.11. con un límite para el error de estimación aproximadamente igual a $10,000? ¿Qué esquema de muestreo sistemático recomendaría?"

# Datos 
gastos <- c(30, 22, 10, 62, 28, 31, 40, 29, 17, 51, 29, 21, 13, 15, 23, 32, 14, 29, 48, 50, 
            9, 15, 6, 93, 21, 20, 13, 12, 29, 38)

N <- 4500    # Tamaño de la población
B <- 10000   # Límite de error deseado

# Calculo de la media muestral
Y_bar <- mean(gastos)

# varianza muestral
s2 <- var(gastos)

D <- (B)/(4)

muestra <- (N*s2)/(N-1)*(D+s2) #7.13

# tamaño de muestra requerido
n_required <- (4 * N^2 * s2) / (B^2 + 4 * s2 * (N - 1))

n_required <- ceiling(n_required)
cat("El tamaño de muestra necesario es:", n_required, "\n")

## El tamaño de muestra necesario es: 259

#Ejercicio 7.13
  
Ejercicio <- "En una comunidad se realiza un censo. Además de la información usual que se obtiene de la población, los investigadores preguntan a los ocupantes de cada vigésima casa cuánto tiempo la han habitado. Use estos datos para estimar la cantidad promedio de tiempo que las personas han vivido en su casa actual. Establezca un límite para el error de estimación."

# Datos 
n <- 115
N <- 2300
sum_y <- 407.1
sum_y2 <- 2011.15

# media muestral
y_bar_sy <- sum_y / n

# varianza muestral 
s2 <- (1 / (n - 1)) * (sum_y2 - (sum_y^2 / n)) 

# límite para el error de estimación (7.3)
error_limit <- 2 * sqrt((s2 / n) * ((N - n) / N))

# Resultados
cat("La cantidad promedio de tiempo es:", y_bar_sy, "años\n")

## La cantidad promedio de tiempo es: 3.54 años

cat("El límite para el error de estimación es:", error_limit, "años\n")

## El límite para el error de estimación es: 0.4064751 años

#Ejercicio 7.14
  
Ejercicio <- "Un grupo de consejeros está interesado en la colegiatura promedio anual para los estudiantes que radican fuera del estado en 371 escuelas de estudios universitarios de primero y segundos años. A partir de una lista en orden alfabético de estas escuelas se extrae una muestra sistemática de 1-en-7. Los datos referentes a los costos de la colegiatura fuera del estado para un año escolar (septiembre a junio) son obtenidos de cada escuela en la muestra. Sea yi la cantidad requerida por colegiatura para la i-ésima escuela en la muestra. Use los datos siguientes para estimar μ, y establezca un límite para el error de estimación."

# Datos 
n <- 53
N <- 371
sum_y <- 11950
sum_y2 <- 2731037

# media muestral
y_bar_sy <- sum_y / n

# varianza muestral
s2 <- (1 / (n - 1)) * (sum_y2 - (sum_y^2 / n))

# límite para el error de estimación (7.3)
error_limit <- 2 * sqrt((s2 / n) * ((N - n) / N))

# Resultados
cat("La colegiatura promedio anual es:", y_bar_sy, "dólares\n")

## La colegiatura promedio anual es: 225.4717 dólares

cat("El límite para el error de estimación es:", error_limit, "dólares\n")

## El límite para el error de estimación es: 6.752354 dólares

#Ejercicio 7.15
  
Ejercicio <- "Los funcionarios de un museo están interesados en el número total de personas que visitan el lugar durante su periodo de 180 días cuando una costosa colección de antigüedades está en exhibición. Puesto que el control de visitantes en el museo cada día es muy costoso, los funcionarios deciden obtener estos datos cada décimo día. La información de esta muestra sistemática de 1-en-10 se resume en la tabla adjunta. Use estos datos para estimar T, el número total de personas que visitan el museo durante el periodo específico. Establezca un límite para el error de estimación."

# Datos 
n <- 18
N <- 180
sum_y <- 4868
sum_y2 <- 1321450

# media muestral
y_bar_sy <- sum_y / n

# estimador del total poblacional
T_hat <- N * y_bar_sy

# varianza muestral
s2 <- (1 / (n - 1)) * (sum_y2 - (sum_y^2 / n))

# límite para el error de estimación
error_limit <- 2 * sqrt((N^2 * s2 / n) * ((N - n) / N))

# Resultados
cat("El estimador del total poblacional (número total de personas) es:", T_hat, "\n")

## El estimador del total poblacional (número total de personas) es: 48680

cat("El límite para el error de estimación es:", error_limit, "\n")

## El límite para el error de estimación es: 1370.345

#Ejercicio 7.16

Ejercicio <- "Los guardabosques están interesados en determinar el volumen medio de madera por acre para 520 parcelas de un acre (N = 520). Se obtiene una muestra sistemática de 1-en-25. Usando los datos presentados en la tabla adjunta, estime μ, el volumen promedio de madera por parcela, y establezca un límite para el error de estimación."

# Datos 
n <- 21
N <- 520
volumes <- c(7030,  6720,   6850,   7210,   7150,   7370,   7000,   6930,   6570,   6910,   7380,   7540,   6720,   6900,   7200,   7100,   6860,   6800,   7050,   7420,   7090)

# media muestral
y_bar_sy <- mean(volumes)

# varianza muestral
s2 <- var(volumes)

# Paso 3: Calcular el límite para el error de estimación
error_limit <- 2 * sqrt((N - n) / N * (s2 / n))

# Resultados
cat("La media muestral para el número de madera es:", y_bar_sy, "\n")

## La media muestral para el número de madera es: 7038.095

cat("El límite para el error de estimación es:", error_limit, "\n")

## El límite para el error de estimación es: 108.7363

#Ejercicio 7.17
  
Ejercicio <- "Los funcionarios de cierta sociedad profesional desean determinar la proporción de miembros que apoyan varias enmiendas propuestas en las prácticas de arbitraje. Los funcionarios conducen una muestra sistemática de 1-en-10, a partir de una lista en orden alfabético de los N = 650 miembros registrados. Sea y = 1 si la i-ésima persona muestreada favorece los cambios propuestos y y, = 0 si se opone a los cambios. Use los siguientes datos de la muestra para estimar p, la proporción de miembros en favor de los cambios propuestos. Establezca un límite para el error de estimación."

# Datos
N <- 650   # Tamaño de la población
n <- 65    # Tamaño de la muestra
sum_yi <- 48  # Suma de las respuestas favorables en la muestra

# proporción muestral
p_hat <- sum_yi / n

# varianza de la proporción muestral
var_p_hat <- (p_hat * (1 - p_hat) / n) * ((N - n) / N)

# límite para el error de estimación
error_limit <- 2 * sqrt(var_p_hat)

cat("La estimación de la proporción de miembros que apoyan los cambios es:", p_hat, "\n")

## La estimación de la proporción de miembros que apoyan los cambios es: 0.7384615

cat("Con un limite de error de estimación de:", error_limit, "\n")

## Con un limite de error de estimación de: 0.1034252

Conclusión <- "Se estima que aproximadamente el 73.85% de los miembros apoyan los cambios propuestos en las prácticas de arbitraje."

cat("Next")

## Next

#Ejercicio 7.18 
  
Ejercicio <- "En una encuesta sociológica una muestra sistemática de 1-en-50 se extrae de los registros de impuestos municipales para determinar el número total de familias en la ciudad que alquilan sus casas. Sea yi =1 si la familia en la i-ésima casa muestreada alquila y sea y, = 0 si no alquila. Hay N = 15,200 casas en la comunidad. Use lo siguiente para estimar τ, el número total de familias que alquilan. Establezca un límite para el error de estimación."

# Datos
N <- 15200    # Tamaño de la población
n <- 304      # Tamaño de la muestra
sum_yi <- 88  # Número de familias que alquilan en la muestra

# proporción muestral
p_hat <- sum_yi / n

# estimador del total poblacional (τ̂)
tau_hat <- N * p_hat

# varianza estimada del total poblacional
var_tau_hat <- N^2 * ((p_hat * (1 - p_hat)) / n) * ((N - n) / N)

# límite para el error de estimación
error_limit <- 2 * sqrt(var_tau_hat)

cat("Estimación del número total de familias que alquilan sus casas en la ciudad:", tau_hat, "\n")

## Estimación del número total de familias que alquilan sus casas en la ciudad: 4400

cat("El Límite para el error de estimación:", error_limit, "\n")

## El Límite para el error de estimación: 782.7885

Conclusion <- "Se estima que aproximadamente 4400 familias en la comunidad alquilan sus casas. Con un límite de error de estimación de ± 783 familias"
     
cat("Next")

## Next

#Ejercicio 7.19
  
Ejercicio <- "Un granjero desea estimar el peso total de fruto que producirá un terreno de zuchini (calabaza), muestreando antes de la cosecha. La parcela consiste de 20 hileras con 400 plantas por hilera. El vendedor de las semillas dice que cada planta puede producir hasta 8 libras de fruto. Describa un plan de muestreo sistemático para este problema a fin de estimar el peso total de fruto con aproximación de 2000 libras."

#Solucion

DefinirPoblación <- "La parcela completa tiene: 20 hileras, 400 plantas por hilera, Entonces, el tamaño total de la población es N= 20*400=8000 plantas"

DeterminarLaMuestra <- "Queremos que el error de estimación esté dentro de 2000 libras. Primero, necesitamos estimar la varianza de la producción por planta. Luego, el tamaño de muestra necesario n para un error de estimación 𝐵=2000 libras se puede estimar con la fórmula de muestreo sistemático:"

PlandeMuestreo <- "Seleccionar la hilera de inicio y planta en esa hilera: Elegir una hilera inicial aleatoriamente entre las 20 disponibles y una planta inicial dentro de esa hilera. Seleccionar plantas de manera sistemática: A partir de la primera planta seleccionada, avanzar cada k-ésima planta a lo largo de las hileras. Aquí K s el intervalo de muestreo calculado como K=N/n y por ultimo Registrar el peso estimado de fruto en cada planta muestreada antes de la cosecha, sumando los resultados para obtener una estimación total del peso de fruto en la parcela."

cat("Next")

## Next

#Ejercicio 7.20
  
Ejercicio <- 'La tabla anexa muestra el número de nacimientos y la tasa de natalidad por cada 1000 individuos para Estados Unidos durante seis años seleccionados sistemáticamente.'

A <- "Estime el número promedio de varones nacidos por año para el periodo 1955-1980, y establezca un límite para el error de estimación."
B <- "Estime la tasa promedio anual de natalidad para el periodo 1955-1980, y establezca un límite para el error de estimación."
C <- "Cree usted que el muestreo sistemático es mejor que el muestreo irrestricto aleatorio para los problemas de las partes (a) y (b)? ¿Por qué?"

# Datos de nacimientos y tasas de natalidad
datos <- data.frame(
  Año = c(1955, 1960, 1965, 1970, 1975, 1980),
  Nacimiento_Hombres = c(2073719, 2179708, 1927054, 1915378, 1613135, 1852616),
  Nacimiento_Mujeres = c(1973576, 2078142, 1833304, 1816008, 1531063, 1759642),
  Total_Nacimientos = c(4047295, 4257850, 3760358, 3731386, 3144198, 3612258),
  Natalidad = c(26, 23.7, 19.4, 18.4, 14.6, 15.9)
)

n <- 6 
N <- 26  # Total de años en el periodo

# número promedio de varones nacidos por año
promedio_varones <- mean(datos$Nacimiento_Hombres)

# varianza de la muestra
varianza_varones <- var(datos$Nacimiento_Hombres)


# error estándar
error_estandar_varones <- sqrt((1 - n / N)*(varianza_varones / nrow(datos)))


# error de estimación 
limite_error_varones <- 2 * error_estandar_varones

cat("Estimación del número promedio de varones nacidos por año:", promedio_varones, "\n")

## Estimación del número promedio de varones nacidos por año: 1926935

cat("Límite para el error de estimación:", limite_error_varones, "\n")

## Límite para el error de estimación: 139437.4

# tasa promedio anual de natalidad
promedio_natalidad <- mean(datos$Natalidad)

# varianza de la muestra
varianza_natalidad <- var(datos$Natalidad)

# error estándar
error_estandar_natalidad <- sqrt((1 - n / N)*(varianza_natalidad / nrow(datos)))

# Límite para el error de estimación
limite_error_natalidad <- 2 * error_estandar_natalidad

cat("Estimación de la tasa promedio anual de natalidad:", promedio_natalidad, "\n")

## Estimación de la tasa promedio anual de natalidad: 19.66667

cat("Límite para el error de estimación:", round(limite_error_natalidad, 2), "\n")

## Límite para el error de estimación: 3.17

#Ejercicio 7.21
  
Ejercicio <- "En la tabla anexa se presentan los datos sobre las tasas de divorcio (por cada 1000 personas) en Estados Unidos para una muestra sistemática de los años de 1900. Estime la tasa de divorcio promedio anual para tal periodo y establezca un límite para el error de estimación. ¿Es en este caso el muestreo sistemático mejor o peor que el muestreo irrestricto aleatorio? ¿Por qué?"

# Datos de las tasas de divorcio 
tasas_divorcio <- c(0.7, 0.8, 0.9, 1.0, 1.6, 1.5, 1.6, 1.7, 2.0, 3.5, 2.6, 2.3, 2.2, 2.5, 3.5, 4.8, 5.2)

# Tamaño de la población 
N <- 81
n <- length(tasas_divorcio)

# Estimación de la tasa de divorcio
media_muestral <- mean(tasas_divorcio)

# varianza de la muestra
varianza_muestral <- var(tasas_divorcio)

# límite para el error de estimación
error_estimacion <- sqrt((1 - n / N) * (varianza_muestral / n))

limite_error_divorcio <- 2 * error_estimacion

cat("Interpretación de los resultados:\n")

## Interpretación de los resultados:

cat("La estimación de la tasa promedio de divorcio anual para el periodo de los años 1900 a 1980 es de aproximadamente", round(media_muestral, 2), "divorcios por cada 1000 personas.\n")

## La estimación de la tasa promedio de divorcio anual para el periodo de los años 1900 a 1980 es de aproximadamente 2.26 divorcios por cada 1000 personas.

cat("El límite para el error de estimación es", round(limite_error_divorcio, 2), "divorcios por cada 1000 personas.\n")

## El límite para el error de estimación es 0.57 divorcios por cada 1000 personas.

# Evaluación del muestreo sistemático
cat("Evaluación del muestreo sistemático:")

## Evaluación del muestreo sistemático:

#En este caso, el muestreo sistemático puede ser una mejor opción que el muestreo irrestricto aleatorio, ya que los datos de tasas de divorcio podrían tener una tendencia o patrón a lo largo de los años, y el muestreo sistemático ayuda a capturar estos patrones de manera representativa. El muestreo irrestricto aleatorio podría pasar por alto ciertas tendencias históricas en los datos de largo plazo.

cat("Next")

## Next

#Ejercicio 7.22

Ejercicio <- "Un inspector de control de calidad debe muestrear obleas de silicio, con las cuales se fabricarán circuitos integrados para computadoras después de haberse horneado. En el horno se colocan consecutivamente charolas ranuradas que contienen muchas obleas durante todo el día. La colocación de la charola y la hora del día pueden tener efectos importantes en la calidad de la oblea. Sugiera un plan de muestreo con el fin de estimar la proporción de obleas defectuosas."


# 1. Dado que las obleas se hornean en charolas consecutivas durante todo el día, se recomienda 
#    un muestreo sistemático estratificado para capturar las variaciones que puedan surgir por 
#    la colocación de la charola y la hora del día.

# 2. Dividir el día en intervalos de tiempo representativos (por ejemplo, cada hora), considerando 
#    las posibles variaciones en la calidad que puedan ocurrir durante el día. Cada intervalo de tiempo 
#    representa un estrato en el cual se seleccionará una muestra de obleas.

# 3. Dentro de cada intervalo de tiempo (estrato), seleccionar sistemáticamente obleas a intervalos 
#    regulares, por ejemplo, seleccionar cada k-ésima oblea de cada charola en ese intervalo. 
#    Esto asegura que se muestrean obleas de diferentes posiciones en cada charola.

# 4. Registrar si la oblea es defectuosa (1) o no defectuosa (0) en cada observación de la muestra.

# 5. Al finalizar el muestreo, calcular la proporción de obleas defectuosas utilizando la fórmula:
#    p_hat <- sum(defectuosas) / n_muestra
#    donde `defectuosas` representa las obleas defectuosas observadas, y `n_muestra` es el tamaño total de la muestra.

cat("Next")

## Next

#Ejercicio 7.23

Ejercicio <- "Un almacén contiene estibas de acumuladares para automóviles que deben ser muestreados para la inspección de calidad. Cada estiba tiene anotada una fecha de producción diferente y se ordena cronológicamente. Los tamaños de las estibas son aproximadamente iguales. Sugiera un plan  de muestreo para estimar la proporción de acumuladores defectuosos"

# Plan de muestreo para estimar la proporción de acumuladores defectuosos:

# 1. Dado que las estibas están ordenadas cronológicamente por fecha de producción y tienen tamaños similares, se recomienda usar un muestreo sistemático para seleccionar acumuladores de diferentes estibas.

# 2. Determinar el intervalo de muestreo `k` en función del número total de estibas y el tamaño deseado de la muestra. Por ejemplo, si hay N estibas y se desea una muestra de n, el intervalo `k` es:
#k <- (N / n)

# 3. Seleccionar una estiba de inicio aleatoriamente entre las primeras `k` estibas.

# 4. A partir de la estiba inicial, seleccionar cada `k`-ésima estiba para la muestra. De cada estiba seleccionada,tomar una muestra de acumuladores (por ejemplo, una muestra aleatoria de acumuladores) para inspeccionar.

# 5. Inspeccionar cada acumulador en las estibas seleccionadas y registrar si es defectuoso (1) o no defectuoso (0).

# 6. Al finalizar el muestreo, calcular la proporción de acumuladores defectuosos:
#p_hat sum(defectuosos) / n_total
#    donde `defectuosos` es la cantidad total de acumuladores defectuosos observados en la muestra y `n_total` es el tamaño total de la muestra de acumuladores inspeccionados.

cat("Next")

## Next

#Ejercicio 7.25

Ejercicio <- "La participación en el mercado de cierto producto alimenticio será estimada registrando las compras almacenadas del producto durante algunas semanas seleccionadas del año. Analice las ventajas y desventajas de una selección sistemática de las semanas para este estudio."

#Ventajas


#Ventajas del muestreo sistemático:

#Representatividad a lo largo del año: Captura tendencias generales de compra y es útil para observar variaciones anuales.

#Simplicidad y rapidez: Fácil de implementar, reduce errores y evita sesgos de selección.


#Desventajas del muestreo sistemático:

#Riesgo de periodicidad coincidente: Puede no capturar ciclos de demanda específicos (como promociones o festividades).

#Limitada sensibilidad estacional: Podría pasar por alto variaciones semanales importantes.

#Es ideal para tendencias generales, pero puede ser limitado para estudios que necesitan precisión en variaciones estacionales o semanales.

Ejercicios Muestreo Cap7

Yorbin Matias Sequeira

2024-11-11