Estadística Inferencial

Clase 2.1
Estimación de parámetros poblacionales

Msc. Roberto Trespalacios

Universidad Tecnológica de Bolivar

2024-01-29

Tabla de contenido

  • Estimación de parámetros poblacionales
    • Estimación puntual
    • Estimación por intervalos
    • Ejercicios

Estimación de parámetros poblacionales

Estimación de parámetros poblacionales

Recordemos que la Inferencia Estadística es el conjunto de métodos usados para obtener una conclusión sobre una población a través de la información proporcionada por una muestra.

  • En el caso de que la información que se desea obtener de la población es el valor de alguno de sus parámetros, la técnica que se utiliza es la estimación.

  • La estimación de los parámetros se llevará a cabo de dos formas:

    • Estimación Puntual
    • Estimación por Intervalo
  • A continuación se estudiará la estimación de los parámetros poblaciones desconocidos y se especificarán algunas propiedades deseables de los Estimadores (funciones de los valores de la muestra).

Estimación puntual

Sea \(X\) una variable aleatoria que sigue una distribución de probabilidad con función de densidad \(f(\boldsymbol \theta)\); es decir,

\[X \rightarrow f(\theta_1, \theta_2, \dots, \theta_k)\]

donde \(\theta_1, \theta_2, \dots, \theta_k\) son los parámetros poblacionales.

Problema

  • Supogamos que no conocemos los verdaderos valores de los parámetros \(\theta_i\).
  • Nuestro objetivo es encontrar una función de los valores muestrales de \(X\), que proporcione un valor que aproxime al máximo el verdadero valor de cada \(\theta_i\).

Solución

Tomamos una muestra aleatoria, \(x_1, x_2, \dots, x_{n}\), de tamaño \(n\) y buscamos una función \(u\), tal que,

\[u(x_1, x_2, \dots, x_{n}) = \theta\]

\(u\), es una función que hace corresponder los valores de la muestra \(x_1, x_2, \dots, x_{n}\) con los “verdaderos” valores de los parámetros \(\theta_i\).
\(u\), recibe el nombre de estimador de \(\boldsymbol \theta\).

Estimación puntual

  • Sea \(x_1, x_2, \dots, x_{n}\) una muestra aleatoria de tamaño \(n\) de la población; entonces

\[u(x_1, x_2, \dots, x_{n}) = \hat{\boldsymbol \theta}\] Donde \(u\), es el estimador de \(\boldsymbol \theta\).

Observaciones
  • \(u(x_1, x_2, \dots, x_{n})\) se llama estimador de \(\boldsymbol \theta\)
  • \(\hat{\boldsymbol \theta}\) se llama estimación de \(\boldsymbol \theta\)
  • \(\boldsymbol \theta\) es un parámetro de la población
  • \(u(x_1, x_2, \dots, x_{n})\) es un estadístico de la muestra
  • \(\hat{\boldsymbol \theta}\) es el valor del parámetro \(\boldsymbol \theta\) estimado por el estadístico \(u\).

Estimación puntual ejemplo 1

Problema

Sea \(X\) uan variable con distribución normal de parámetros media \(\mu\) y varianza \(\sigma^2\). Es decir,

\[X \rightarrow N(\mu, \sigma^2)\]

¿Cuál sería un estimador puntual de la media \(\mu\)?.

Solución

Un estimador del parámetro \(\mu\), sería \(\bar{x}\). En efecto,

\[\begin{align*} u: \mathbb{R}& \Rightarrow \mathbb{R}\\ x_1, x_2, \dots, x_n & \Rightarrow u(x_1, x_2, \dots, x_n) = \hat{ \mu} \end{align*}\]

Es decir, en particular tenemos que:

\[\begin{align*} u: \mathbb{R}& \Rightarrow \mathbb{R}\\ x_1, x_2, \dots, x_n & \Rightarrow u(x_1, x_2, \dots, x_n) = \frac{\sum x_i}{n} = \bar{x} \end{align*}\]

Así,

  • \(\frac{\sum x_i}{n}\) es un estimador de \(\mu\)
  • \(\bar{x}^*\) se llama estimación puntual de \(\mu\)

Estimación puntual ejemplo 2

El supervisor de una linea de galletas, necesita calibrar la temperatura que tienen los hornos, ya que hubo un desperfecto y al parecer prodrían presentarse inconvenientes con la cocción. En el turno solo cuenta con un trabajador y por lo tanto solo selecciona aleatoriamente la temperatura que dan 20 de los hornos .

La media de la muestra (el estimador), es igual a 170\(^oC\), y atribuimos este valor (la estimación) a la Media de todos los hornos.

Resumiendo:

  • La media de la temperatura de los hornos de la fábrica, (no se conoce), es \(\mu\).
  • El estimador de la media de la temperatura de los hornos es \(\bar{x}\).
  • La estimación de la media (\(\mu\)) de la temperatura de los hornos es \(\bar{x} = 170^oC\).

Estimación puntual

Observaciones

  1. Un estimador de un parámetro \(\boldsymbol \theta\), que vamos a denotar por \(\hat{\boldsymbol \theta}\), es una variable aleatoria pues varía de muestra a muestra, así a cada muestra de tamaño \(n\) le corresponde un valor de \(u\).
  2. Podemos utilizar como estimadores de la Media de la población otros estadísticos de tendencia central como la Moda o la Mediana, pero NO todos los estimadores son apropiados.
  3. Los estimadores deben satisfacer ciertos requisitos, y por esta razón, interesa conocer sus propiedades a fin de utilizar los que sean adecuados según las circunstancias de la estimación.

Estimadores puntuales: precisos, insesgados y consistentes

Podemos tener muchos estimadores de un parámetro, pero no aseguro que todos sean “mejores”, y tampoco que sean “buenos”. A continuación veremos un concepto importante en la teoría de estadística inferencia; se trata de los estimadores insesgados.

Observación

  • Un estimador puntual es “mejor y bueno”, si es preciso, insesgado y consistente; es decir, si satisface la:
    • Precisión (varianza): se refiere a la dispersión del conjunto de valores obtenidos de mediciones repetidas de una magnitud.
    • Exactitud (sesgo): se refiere a cuán cerca del valor real se encuentra el valor medido. En términos estadísticos, la exactitud está relacionada con el sesgo de una estimación.
    • Consistencia (\(n \rightarrow \infty\)): a medida que el tamaño de la muestra crece, el estimador se aproxima cada vez más al valor real del parámetro.

Estimación puntual ejemplo 3

Sea \(X\) uan variable con distribución normal de parámetros media \(\mu\) y varianza \(\sigma^2\). Es decir,

\[X \rightarrow N(\mu, \sigma^2)\]

¿Cuál sería un estimador puntual de la varianza \(\sigma^2\)?.

Solución

Un estimador del parámetro \(\sigma^2\), sería \(S^2\). En efecto,

\[\begin{align*} u: \mathbb{R}& \Rightarrow \mathbb{R}\\ x_1, x_2, \dots, x_n & \Rightarrow u(x_1, x_2, \dots, x_n) = S^2 \end{align*}\]

Es decir, en particular tenemos que:

\[\begin{align*} u: \mathbb{R}& \Rightarrow \mathbb{R}\\ x_1, x_2, \dots, x_n & \Rightarrow u(x_1, x_2, \dots, x_n) = \frac{\sum (x_i - \bar{x}) ^2}{n} = S^2 \end{align*}\]

Así,

  • \(\frac{\sum (x_i - \bar{x}) ^2}{n}\) es un estimador de \(\sigma^2\)
  • \(S^{2*}\) se llama estimación puntual de \(\sigma^2\)

Estimadores precisos, insesgados y consistentes - ejemplo 4

Estimador \(\bar{x}\) de la media \(\mu\)

Pregunta

¿Es \(\bar{x} =\frac{\sum x_i}{n}\) un estimador preciso, insesgado y consistente para la media poblacional \(\mu\)?

Respuesta

SI

Pregunta

¿Es \(Me = Mediana\) un estimador preciso, insesgado y consistente para la mediana poblacional \(\mu\)?

Respuesta

¿?

Estimador \(S^2\) de la varianza \(\sigma^2\)

Pregunta

¿Es \(S^2 =\frac{\sum (x_i - \bar{x}) ^2}{n}\) un estimador preciso, insesgado y consistente para la varianza poblacional \(\sigma^2\)?

Respuesta

NO

Pregunta

¿Cuál sería un estimador preciso, insesgado y consistente para la varianza poblacional \(\sigma^2\)?

Respuesta

\(S^2 =\frac{\sum (x_i - \bar{x}) ^2}{n-1}\)

Estimadores precisos, insesgados y consistentes - ejemplo 4 en R

Preguntas

Sea \(X \rightarrow N(\mu, \sigma^2)\), generemos unas muestras y verifiquemos si los estimadores:

Code
k = 100 # numero de muestras
n = 100 # tamano de la muestra
mu = 2 # media poblacional
varx = 4 # varianza poblacional
X = NULL
for(i in 1:k){
  X = cbind(X, rnorm(n, mean = mu, sd = sqrt(4)))
  }
  1. \(\bar{x}\): media muestral
  2. \(S^2_{n-1}\): cuasi-varianza muestral
  3. \(S^2_{n}\): varianza muestral

son estimadores precisos, insesgados y consistentes.

Respuestas

  1. Verifiquemos a \(\bar{x}\)
Code
xbar = NULL
for(i in 1:k){
  xbar = c(xbar, mean(X[,i]))
  }

cat("E[\U0078\U0304] =", mean(xbar), "\n")
cat("E[\U0078\U0304]-\U03BC =", mean(xbar)-mu)
  1. Verifiquemos a \(S^2_{n-1}\)
Code
varx = NULL
for(i in 1:k){
  varx = c(varx, var(X[,i]))
  }

cat("E[S\U00B2] =", mean(varx), "\n")
cat("E[S\U00B2]-S\U00B2 =", mean(varx)-xvar)
  1. Verifiquemos a \(S^2_{n}\)
Code
varx1 = NULL
for(i in 1:k){
  varx1 = c(varx1, sum((X[,i]-mean(X[,i]))^2)/n)
  }

cat("E[S\U00B2] =", mean(varx1), "\n")
cat("E[S\U00B2]-S\U00B2 =", mean(varx1)-xvar)

Concluya en cada caso.

Estimación por intervalos

La estimación puntual trata el problema de estimar mediante un número el valor de una característica poblacional o parámetro \(\theta\) desconocido (por ejemplo, la estimación del IPC de un determinado período).

  • En muchos casos la estimación puntual no es suficiente en el sentido de que no nos indica el error que se comete en dicha estimación.
  • Lo razonable en la práctica es adjuntar, junto a la estimación puntual del parámetro, un cierto intervalo numérico que mida el margen de error que, de acuerdo a las observaciones muestrales, pueda tener dicha estimación.
  • La idea de Intervalo de Confianza, es proponer un rango de valores entre los que posiblemente se encuentre el verdadero valor del parámetro \(\theta\).

Estimación por intervalos

El propósito es determinar un intervalo que con cierta seguridad contenga el parámetro a estimar.

  • Los extremos del intervalo son funciones \(f_1\) y \(f_2\) de la muestra y por tanto variables aleatorias. Es decir:

\[ \begin{align*} f_1(\theta, X) = & u(x_1,x_2, \cdots, x_{n}) - error \\ f_2(\theta, X) = & u(x_1,x_2, \cdots, x_{n}) + error \end{align*} \]

  • El objetivo de los intervalos de confianza encontrar tales funciones de forma que con cierta “seguridad o confianza” se pueda afirmar que

\[f_1 \leqslant \theta \leqslant f_2\]

además, que las funciones \(f_1\) y \(f_2\) sean tales que

\[ p(f_1 \leqslant \theta \leqslant f_2)=1-\alpha \]

de esta manera, se puede decir que \(f_1\) y \(f_2\) determina un intervalo que tiene la probabilidad \(1-\alpha\) de contener al parámetro poblacional \(\theta\).

Estimación por intervalos

En la figura podemos observar las funciones \(f_1\) y \(f_2\), y la región (probabilidad) que se genera con esos límites.

  • \(1-\alpha\) recibe el nombre de coeficiente de confianza o nivel de confianza. Es la probabilidad de que un intervalo de confianza contenga el verdadero valor del parámetro.

  • \(\alpha\) es un número pequeño comprendido entre 0 y 1, \(0 < \alpha < 1\) (usualmente próximo a 0). Es el riesgo de que el intervalo no contenga el valor del parámetro a estimar \(\theta\), por lo que α recibe el nombre de riesgo del error del intervalo, nivel del error del intervalo o nivel de significación del intervalo.

  • \(f_1\) y \(f_2\) reciben el nombre de límite inferior y superior del intervalo de confianza, respectivamente

Estimación por intervalos

  • Este intervalo recibe el nombre Intervalo de confianza con coeficiente de confianza \(1-\alpha\).
  • Se desea que el coeficiente de confianza sea próximo a la unidad y que la amplitud del intervalo sea lo más pequeña posible.

En esta sección vamos a estudiar, dentro de la distribución Normal, los intervalos de confianza para los parámetros:

  • media poblacional \(\mu\)
  • varianza poblacional \(\sigma^2\)
  • proporción poblacional \(p\).