Clase 2.1
Estimación de parámetros poblacionales
Universidad Tecnológica de Bolivar
2024-01-29
Recordemos que la Inferencia Estadística es el conjunto de métodos usados para obtener una conclusión sobre una población a través de la información proporcionada por una muestra.
En el caso de que la información que se desea obtener de la población es el valor de alguno de sus parámetros, la técnica que se utiliza es la estimación.
La estimación de los parámetros se llevará a cabo de dos formas:
A continuación se estudiará la estimación de los parámetros poblaciones desconocidos y se especificarán algunas propiedades deseables de los Estimadores (funciones de los valores de la muestra).
Sea \(X\) una variable aleatoria que sigue una distribución de probabilidad con función de densidad \(f(\boldsymbol \theta)\); es decir,
\[X \rightarrow f(\theta_1, \theta_2, \dots, \theta_k)\]
donde \(\theta_1, \theta_2, \dots, \theta_k\) son los parámetros poblacionales.
Tomamos una muestra aleatoria, \(x_1, x_2, \dots, x_{n}\), de tamaño \(n\) y buscamos una función \(u\), tal que,
\[u(x_1, x_2, \dots, x_{n}) = \theta\]
\(u\), es una función que hace corresponder los valores de la muestra \(x_1, x_2, \dots, x_{n}\) con los “verdaderos” valores de los parámetros \(\theta_i\).
\(u\), recibe el nombre de estimador de \(\boldsymbol \theta\).
\[u(x_1, x_2, \dots, x_{n}) = \hat{\boldsymbol \theta}\] Donde \(u\), es el estimador de \(\boldsymbol \theta\).
Sea \(X\) uan variable con distribución normal de parámetros media \(\mu\) y varianza \(\sigma^2\). Es decir,
\[X \rightarrow N(\mu, \sigma^2)\]
¿Cuál sería un estimador puntual de la media \(\mu\)?.
Un estimador del parámetro \(\mu\), sería \(\bar{x}\). En efecto,
\[\begin{align*} u: \mathbb{R}& \Rightarrow \mathbb{R}\\ x_1, x_2, \dots, x_n & \Rightarrow u(x_1, x_2, \dots, x_n) = \hat{ \mu} \end{align*}\]
Es decir, en particular tenemos que:
\[\begin{align*} u: \mathbb{R}& \Rightarrow \mathbb{R}\\ x_1, x_2, \dots, x_n & \Rightarrow u(x_1, x_2, \dots, x_n) = \frac{\sum x_i}{n} = \bar{x} \end{align*}\]
Así,
El supervisor de una linea de galletas, necesita calibrar la temperatura que tienen los hornos, ya que hubo un desperfecto y al parecer prodrían presentarse inconvenientes con la cocción. En el turno solo cuenta con un trabajador y por lo tanto solo selecciona aleatoriamente la temperatura que dan 20 de los hornos .
La media de la muestra (el estimador), es igual a 170\(^oC\), y atribuimos este valor (la estimación) a la Media de todos los hornos.
Resumiendo:
Podemos tener muchos estimadores de un parámetro, pero no aseguro que todos sean “mejores”, y tampoco que sean “buenos”. A continuación veremos un concepto importante en la teoría de estadística inferencia; se trata de los estimadores insesgados.
Sea \(X\) uan variable con distribución normal de parámetros media \(\mu\) y varianza \(\sigma^2\). Es decir,
\[X \rightarrow N(\mu, \sigma^2)\]
¿Cuál sería un estimador puntual de la varianza \(\sigma^2\)?.
Un estimador del parámetro \(\sigma^2\), sería \(S^2\). En efecto,
\[\begin{align*} u: \mathbb{R}& \Rightarrow \mathbb{R}\\ x_1, x_2, \dots, x_n & \Rightarrow u(x_1, x_2, \dots, x_n) = S^2 \end{align*}\]
Es decir, en particular tenemos que:
\[\begin{align*} u: \mathbb{R}& \Rightarrow \mathbb{R}\\ x_1, x_2, \dots, x_n & \Rightarrow u(x_1, x_2, \dots, x_n) = \frac{\sum (x_i - \bar{x}) ^2}{n} = S^2 \end{align*}\]
Así,
¿Es \(\bar{x} =\frac{\sum x_i}{n}\) un estimador preciso, insesgado y consistente para la media poblacional \(\mu\)?
SI
¿Es \(Me = Mediana\) un estimador preciso, insesgado y consistente para la mediana poblacional \(\mu\)?
¿?
¿Es \(S^2 =\frac{\sum (x_i - \bar{x}) ^2}{n}\) un estimador preciso, insesgado y consistente para la varianza poblacional \(\sigma^2\)?
NO
¿Cuál sería un estimador preciso, insesgado y consistente para la varianza poblacional \(\sigma^2\)?
\(S^2 =\frac{\sum (x_i - \bar{x}) ^2}{n-1}\)
Sea \(X \rightarrow N(\mu, \sigma^2)\), generemos unas muestras y verifiquemos si los estimadores:
son estimadores precisos, insesgados y consistentes.
Concluya en cada caso.
La estimación puntual trata el problema de estimar mediante un número el valor de una característica poblacional o parámetro \(\theta\) desconocido (por ejemplo, la estimación del IPC de un determinado período).
El propósito es determinar un intervalo que con cierta seguridad contenga el parámetro a estimar.
\[ \begin{align*} f_1(\theta, X) = & u(x_1,x_2, \cdots, x_{n}) - error \\ f_2(\theta, X) = & u(x_1,x_2, \cdots, x_{n}) + error \end{align*} \]
\[f_1 \leqslant \theta \leqslant f_2\]
además, que las funciones \(f_1\) y \(f_2\) sean tales que
\[ p(f_1 \leqslant \theta \leqslant f_2)=1-\alpha \]
de esta manera, se puede decir que \(f_1\) y \(f_2\) determina un intervalo que tiene la probabilidad \(1-\alpha\) de contener al parámetro poblacional \(\theta\).
En la figura podemos observar las funciones \(f_1\) y \(f_2\), y la región (probabilidad) que se genera con esos límites.
\(1-\alpha\) recibe el nombre de coeficiente de confianza o nivel de confianza. Es la probabilidad de que un intervalo de confianza contenga el verdadero valor del parámetro.
\(\alpha\) es un número pequeño comprendido entre 0 y 1, \(0 < \alpha < 1\) (usualmente próximo a 0). Es el riesgo de que el intervalo no contenga el valor del parámetro a estimar \(\theta\), por lo que α recibe el nombre de riesgo del error del intervalo, nivel del error del intervalo o nivel de significación del intervalo.
\(f_1\) y \(f_2\) reciben el nombre de límite inferior y superior del intervalo de confianza, respectivamente
En esta sección vamos a estudiar, dentro de la distribución Normal, los intervalos de confianza para los parámetros: