Estadística Inferencial

Clase 2.9
Estimación de tamaño de muestra

Msc. Roberto Trespalacios

Universidad Tecnológica de Bolivar

2024-01-29

Tabla de contenido

  • Elección del tamaño de muestra
    • Tamaño de muestra para población infinita (usando la varianza \(\sigma^2\))
    • Tamaño de muestra para población finita (usando la varianza \(\sigma^2\))
    • Tamaño de muestra para población infinita (usando la varianza de una proporción \(\frac{p(1-p)}{n}\))
    • Tamaño de muestra para población finita (usando la varianza de una proporción \(\frac{p(1-p)}{n}\))
    • Ejemplos
    • Ejercicios

Elección del tamaño de muestra

Introducción

Decidir cuál es el mejor tamaño para una muestra es una de las preocupaciones principales relativas al muestreo.

  • El primer aviso es que no existe un tamaño bueno para todo.
  • Según el tipo de muestreo que se vaya a realizar, los objetivos que se persigan, las características de la población y las condiciones en las que se van a realizar las estimaciones, serán aconsejables unos tamaños u otros.
  • Podría parecer que una muestra es mejor cuanto más grande. Pues sí, podría parecerlo, pero no tiene por qué ser cierto; pensemos que:
    • Cuanto más grande, las estimaciones serán más precisas y con menos riesgo de error.
    • La recolección de datos saldrá más cara y tal vez se reduzca el control de los datos.

Tamaño de muestra para población infinita (usando la varianza \(\sigma^2\))

Recordemos que la fórmula que permite calcular el error \(e\) de precisión cuando no conocemos el tamaño \(N\) de la población(infinita), viene dado por:

\[e = z_{\frac{\alpha}{2}}\frac{\sigma}{\sqrt{n}}\]

donde \(n\) es tamaño de muestra. Ahora, despejando \(n\) de la ecuación, tenemos que:

\[n = \Big{\lceil}\frac{ (z_{\frac{\alpha}{2}})^2 \sigma^2}{e^2}\Big{\rceil}\]

El error de precición, tiene un nivel de significancia de \(\alpha\).

Observaciones: Puesto que no se conoce el valor del parámetro \(\sigma^2\), lo reemplazamos por \(S^2\). 2. El simbolo \(\Big{\lceil} \cdot \Big{\rceil}\), significa: el entero mayor más cercano.

Tamaño de muestra para población finita (usando la varianza \(\sigma^2\))

Cuando conocemos el tamaño \(N\) de la población(finita), el error de estimación, viene dado por:

\[e = z_{\frac{\alpha}{2}}\sigma \sqrt{\frac{N-n}{n(N-1)}}\]

Ahora, despejando \(n\) de la ecuación, tenemos que:

\[n = \Big{\lceil}\frac{ (z_{\frac{\alpha}{2}})^2 \sigma^2 N}{e^2(N-1)+(z_{\frac{\alpha}{2}})^2\sigma^2}\Big{\rceil}\]

Tamaño de muestra para población infinita (usando la varianza de una proporción \(\frac{p(1-p)}{n}\))

Recordemos que la fórmula que permite calcular el error \(e\) de precisión cuando no conocemos el tamaño \(N\) de la población(infinita) y tenemos una proporción \(p\), viene dado por:

\[e = z_{\frac{\alpha}{2}}\sqrt{\frac{p(1-p)}{n}}\]

donde \(n\) es tamaño de muestra y \(p\) es la proporción poblacional (si no conocemos \(p\), usamos la estimación \(\hat{p}\). Ahora, despejando \(n\) de la ecuación, tenemos que el tamaño de muestra es:

\[n = \Big{\lceil}\frac{ (z_{\frac{\alpha}{2}})^2 p(1-p)}{e^2}\Big{\rceil}\]

Observación

Puesto que no se conoce el valor del parámetro \(p\), lo reemplazamos por \(\hat{p}\).

Tamaño de muestra para población finita (usando la varianza de una proporción \(\frac{p(1-p)}{n}\))

Recordemos que la fórmula que permite calcular el error \(e\) de precisión cuando conocemos el tamaño \(N\) de la población(finita) y tenemos una proporción \(p\), viene dado por:

\[e = z_{\frac{\alpha}{2}} \sqrt{\frac{(N-n)p(1-p)}{n(N-1)}}\]

donde \(n\) es tamaño de muestra y \(p\) es la proporción poblacional (si no conocemos \(p\), usamos la estimación \(\hat{p}\). Ahora, despejando \(n\) de la ecuación, tenemos que el tamaño de muestra es:

\[n = \Big{\lceil}\frac{ (z_{\frac{\alpha}{2}})^2 p(1-p) N}{e^2(N-1)+(z_{\frac{\alpha}{2}})^2p(1-p)}\Big{\rceil}\]

Ejemplo 1

En un estudio se pretende estimar la PAS (Personas Altamente Sensibles) de un grupo de pacientes con una determinada patología. Se asume una \(\sigma = 10\) mmHg. Si se desea un error de 0.03 un nivel de confianza del 98%. ¿Cuál es el tamaño de muestra necesario?

Solución a mano

Podemos observar, que

  • \(\sigma = 10\)
  • \(1- \alpha =0.98\), luego \(\frac{\alpha}{2} = 0.01\), por lo tanto, \(z_{0.01}= 2.33\)

\[ \begin{align*} n = & \Big{\lceil}\frac{ (z_{\frac{\alpha}{2}})^2 \sigma^2}{e^2}\Big{\rceil}\\ = & \Big{\lceil}\frac{ 2.33^2 10^2}{0.03^2}\Big{\rceil}\\ = & \lceil 603211.1\rceil \\ =& 603212 \end{align*} \]

Solución en R

Code
sigma = 10
error = 0.03
zalpha2 = round(qnorm(0.01, mean=0, sd =1, lower.tail = FALSE), 2)
n = ceiling(zalpha2^2*sigma^2/error^2)

cat("El tamaño de muestra que se requiere para estimar la PAS es: ", n)
El tamaño de muestra que se requiere para estimar la PAS es:  603212

Ejemplos

  1. Para conocer el porcentaje de votos de un partido político A, con un error del 0.01 y un nivel de confianza del 95% ¿Cuántos casos se necesitan, si se sabe que por costumbre el partido obtiene un porcentaje del 37% de los votos en las elecciones?

  2. En un campus de una universidad la población es exactamente de 2962 alumnos. En una encuesta de evaluación de la universidad, y por lo que respecta a los alumnos de todo el campus, con un nivel de confianza del 90%, un margen de error del 4% y una varianza del 0.58. Encuentre eltamaño de muestra \(n\), mínimo asociado al problema.

Ejercicios

  1. Ante la sospecha de una diferencia sistemática entre dos laboratorios A y B en la determinación de la cantidad de albúmina sérica, expresada en gr/100 ml, se ha realizado una experiencia consistente en la extracción de sangre a 10 pacientes. Para cada muestra de sangre se midió la albúmina sérica en ambos laboratorios y las diferencias entre laboratorios (A–B) fueron las siguientes: 0.6, 0.7, 0.8, 0.9, 0.3, 0.5, –0.5, 1.3, 0.4, 0.8. Considerando normalidad. Se pide, al nivel de confianza 0.9:
    1. Calcular un intervalo de confianza para la diferencia media de medición considerando que la desviación típica de las diferencias poblacionales es 0.22.
    2. ¿Qué tamaño mínimo de muestra deberíamos tomar para que la amplitud del intervalo fuese menor o igual que la mitad del anterior?
  2. Unos grandes almacenes desean estimar la proporción de empleados que están a favor de cambiar el convenio laboral. Para ello se realiza una encuesta a 100 trabajadores y resulta que la mitad está a favor del cambio y la otra mitad no. La estimación debe quedar a menos de 0.05 de la proporción verdadera de los que están a favor del cambio del convenio, con un coeficiente de confianza del 90%. ¿Cuántos empleados se debe muestrear?.