Puedes seguir el tutorial por vídeo en YouTube

1 Introducción al diseño de experimentos.

2 Elementos de inferencia estadística.

2.1 Población y muestra, parámetros y estadísticos.

2.2 Distribuciones de probabilidad e inferencia.

2.3 Estimación puntual y por intervalo.

2.3.1 Estimación puntual.

Es un valor numérico simple de un parámetro desconocido. Anteriormente hemos visto como hacer estimaciones puntuales de la media o la varianza muestrales. Tres parámetros sobre los que con frecuencia se desea hacer inferencia son:

  • La media \(\mu\) del proceso (población).
  • La varianza \(\sigma^2\) o la desviación estándar s del proceso.
  • La proporción p (por ejemplo, producción defectuosa).

Los estimadores puntuales (estadísticos) más recomendados para estimar estos parámetros son, respectivamente:

  • La media muestral.

\[\mu = \overline {X}\]

  • La varianza muestral.

\[\hat {\sigma }^{2} = S^2\] * La proporción de defectuosos en la muestra, donde x es el número de producción defectuosa en una muestra de tamaño n.

\[\hat {p } = X/n\]

Ejemplo de estimación puntual para la media.

Para saber número de frutos que tienen de media los árboles de una finca (\(\mu\)), basta con sumar el número de frutos que tiene cada árbol y dividirlo por el número total de árboles. El resultado es la media poblacional. En la mayoría de las ocasiones, hacer esto es inviable, así que hay que se calcula la media de una muestra (\(\overline {X}\)), para ello se suma el número de frutos de la muestra y se divide por en número total de árboles de la misma. Se obtiene así la media de la muestra. Si la muestra se escoje al azar, su media es un estimador imparcial de la media de la población.

Por ejemplo, queremos saber en número de frutos que tienen de media los árboles de una finca. La finca tiene 30.000 árboles. Supongamos que dismponemos de los recursos suficientes y contamos el número de frutos de los 30.000 y obtenemos los siguientes datos.

set.seed(007)
Poblacion <- round(runif(30000, min = 150, max = 300),0)

MediaPoblacion <- mean(Poblacion); MediaPoblacion #Esta sería la media poblacional (mu).
## [1] 225.1558

Como lo normal es que no tengamos los recursos para contar los frutos de todos los árboles, podemos optar por selecionar 10 al azar y contar sus frutos.

Muestra <- sample(Poblacion, 10, replace = FALSE) ; Muestra #Mostramos todos los datos.
##  [1] 276 230 183 212 295 211 287 236 217 261
MediaMuestra <- mean(Muestra); MediaMuestra 
## [1] 240.8

Esta sería la media muestral \[\overline {X} = 240.8\]

Ejemplo de estimación puntual para la Varianza.

La varianza de una población (\(\sigma^2\)) es una medida de la dispersión de los datos alrededor de su media (\(\mu\)). Se calcula de la siguiente manera: \[\sigma^2 = \sum(X-\mu)^2 / N\]

La varianza de una muestra (\(S^2\)) es la medida de dispersión de los datos de la muestra, alrededor de su media (\(\overline {X}\)). Se calcula: \[S^2 = \sum(x-\overline {X})^2 / (n-1)\]

La desviación típica de una muestra (s) no es más que la raíz cuadrada de la varianza (\(S^2\)). Su valor nos indica que aproximadamente 2/3 de los datos (cuando éstos tienen una distribución normal), están entre los valores de la media \(\pm\) la desviación típica.

Siguiendo con el ejemplo anterior.

VarPoblacion <- round((var(Poblacion) * 29999 / 30000), 2) ; VarPoblacion #varianza de una población (sigma^2). El comando "var" en R calcula la varianza de una muestra, es decir, que divide en n-1. Si queremos calcular la varianza de una población, hacemos una corrección como la que yo he hecho, o instalamos y usamos el comando de algún paquete que haga esta operación, por ejemplo "PopVar".
## [1] 1878.7
VarMuestra <- round(var(Muestra), 2) ; VarMuestra #varianza de una muestra (s^2)
## [1] 1387.07

La varianza de la población (\(\sigma^2\)) es 1878.7 y la varianza de la muestra (\(S^2\)) es 1387.07.