INTERVALOS DE CONFIANZA

¿Dónde está el Parámetro?

Concepto

El parámetro poblacional es frecuentemente un valor desconocido que sólo puede ser estimado usando los datos obtenidos de una muestra aleatoria. De ahí que resulta necesario determinar con cierto grado de certeza cuál puede ser el verdadero parámetro.

La estimación por intervalos consiste en establecer el intervalo de valores donde es más probable se encuentre el parámetro. La obtención del intervalo se basa en las siguientes consideraciones:

  1. Si conocemos la distribución muestral del estimador podemos obtener las probabilidades de ocurrencia de los estadísticos muestrales.

  2. Si conociéramos el valor del parámetro poblacional, podríamos establecer la probabilidad de que el estimador se halle dentro de los intervalos de la distribución muestral.

  3. El problema es que el parámetro poblacional es desconocido, y por ello el intervalo se establece alrededor del estimador. Si repetimos el muestreo un gran número de veces y definimos un intervalo alrededor de cada valor del estadístico muestral, el parámetro se sitúa dentro de cada intervalo en un porcentaje conocido de ocasiones. Este intervalo es denominado “intervalo de confianza”.

Cálculo de intervalos de confianza para la media de una población con desviación típica conocida

“De una cierta población se ha extraído una muestra de 64 individuos, cuyo valor medio es 1012. Se sabe por otras experiencias del mismo tipo, que la desviación típica vale 25. Hallar intervalos de confianza para el valor medio de la población a los niveles de confianza del 0.95 y 0.99.”

Los pasos para calcular los intervalos de confianza son:

1 Lo primero es fijar un nivel de confianza 1-α (siendo α la máxima probabilidad aceptada de cometer un error). La probabilidad de que nuestra estimación esté dentro de ciertos valores es fijada de antemano. Normalmente los valores de confianza son del 90%, 95% o 99%. Hay que tener en cuenta que mientrás más alto el nivel de confianza más estrecho será el intervalo. \(95%\) y del \(99%\).

Para este ejercicio fijamos un nivel de confianza del \(95%\) y del \(99%\).

2 Cálculo del margen de error

Cuando estimo la media poblacional a través de la media muestral y cuando la desviación estándar de la población es conocida, el máximo error de estimación dado para un nivel de confianza 1-α está dado por la siguiente ecuación.

\[ x ={zeta_{\alpha/2}}\frac{-\beta\pm\sqrt(\beta^2-4\alpha\gamma)}{2\alpha}\]

Ejemplo

Se generan 100000 muestras aleatorias (n=25) de una población que sigue la distribución Normal, y resulta:

La distribución de las Medias muestrales aproxima al modelo Normal: ##Ejercicios de Intervalos de confianza para la media

qnorm(0.05,0,1)
## [1] -1.644854
ggplot(data.frame(x = randNorm, y = randDensity)) + 
  aes(x = x, y = y) +
geom_point() + 
  labs(x = "Random Normal Variable", y = "Densidad")

ggplot(data.frame(x = randNorm), aes(x = x)) +
    geom_histogram(binwidth = 0.1) +
  labs(x = "Random Normal Variable", y = "Frecuencia")