2 Elementos de inferencia estadística.

2.1 Población y muestra, parámetros y estadísticos.

2.2 Distribuciones de probabilidad e inferencia.

2.3 Estimación puntual y por intervalo.

2.3.1 Estimación puntual.

2.3.2 Estimación por intervalo.

2.3.2.1 Intervalo de confianza para una media

2.3.2.2 Intervalo para la varianza.

Es posible deducir intervalos de confianza para cualquier parámetro. En particular, para construir un intervalo de confianza para la varianza \(\sigma ^{2}\), la distribución de referencia es una ji-cuadrada con n – 1 grados de libertad.

La fórmula que se aplica es la siguiente:

\[\dfrac {\left( n-1\right) S^{2}} {X_{\alpha / 2 , n-1}^{2}}\leq \sigma^2 \leq \dfrac {\left ( n-1\right) S^{2}} {X_{1 - \alpha / 2 , n-1}^{2}}\]

Los valores de \[X_{\alpha / 2 , n-1}^{2}\] y \[X_{1 - \alpha / 2 , n-1}^{2}\] son puntos críticos de la distribución ji-cuadrada con n – 1 grados de libertad y se leen en la tabla de esta distribución para el valor de \(\alpha\) dado.

Ejemplo de intervalo de confianza para una varianza.

Queremos saber la media y la varianza en el contenido de azúcar de una partida de fruta, tanto por estimación puntual como por intervalo. Las mediciones de las muestras son:

MuestraIntervalos <- c(14.30, 10.18, 15.50, 11.90, 12.38, 12.51, 11.21, 12.50, 8.35, 13.21) ; MuestraIntervalos

##  [1] 14.30 10.18 15.50 11.90 12.38 12.51 11.21 12.50  8.35 13.21

Estimadores puntuales.

MediaEP <- round(mean(MuestraIntervalos), 2) ; MediaEP

## [1] 12.2

DesEsEP <- round(sd(MuestraIntervalos), 2) ; DesEsEP

## [1] 2.01

La media resulta 12.2 y la desviación estandar 2.01.

Calculamos el intervalo para la media, como hicimos anteriormente.

n <- length(MuestraIntervalos) ; n #Número de muestras.

## [1] 10

nivel.conf <- 0.95 #Nivel de confianza con el que quiero trabajar.
ErrorEstandar_SE <- DesEsEP/sqrt(n) ; ErrorEstandar_SE

## [1] 0.6356178

z <- qt((1 + nivel.conf)/2, df = n - 1) ; z

## [1] 2.262157

ErrorEstimacion <- z * ErrorEstandar_SE ; ErrorEstimacion

## [1] 1.437867

Int.inf.media <- round((MediaEP - ErrorEstimacion), 2)
Int.sup.media <- round((MediaEP + ErrorEstimacion), 2)
Int.inf.media ; Int.sup.media

## [1] 10.76

## [1] 13.64

Suponiendo distribución normal, el intervalo al 95% de confianza para la media \(\mu\) está dado por [10.76, 13.64]

Visualizamos el resultado de los intervalos de confianza de la media.

if (!require(visualize)) {install.packages("visualize")}

## Loading required package: visualize

library(visualize)
visualize.norm(stat = c(Int.inf.media, Int.sup.media), mu = MediaEP, sd = DesEsEP, section = "bounded")

Para calcular el correspondiente intervalo para la desviación estándar \(\sigma\), necesitamos primero los puntos críticos de la distribución ji-cuadrada con n – 1 grados de libertad. Como la distribución de Ji cuadrada no es simétrica (ya lo hemos visto anteriormente), tenemos que calcular cada uno de los extremos de la curva por separado. \[\dfrac {\left( n-1\right) S^{2}} {X_{\alpha / 2 , n-1}^{2}}\leq \sigma^2 \leq \dfrac {\left ( n-1\right) S^{2}} {X_{1 - \alpha / 2 , n-1}^{2}}\]

Cálculo de los puntos críticos de la distribución ji-cuadrada con n – 1 grados de libertad.

JiInf <- qchisq((1 + nivel.conf)/2, df = n - 1)
JiSup <- qchisq((1 - nivel.conf)/2, df = n - 1)
JiInf ; JiSup

## [1] 19.02277

## [1] 2.700389

Calculamos los intervalos para la varianza.

Int.inf.Var <- (n - 1) * DesEsEP^2 / JiInf ; Int.inf.Var

## [1] 1.911441

Int.sup.Var <- (n - 1) * DesEsEP^2 / JiSup ; Int.sup.Var

## [1] 13.46506

Calculamos los intervalos para la desviación estándar.

Int.inf.DesEs <- sqrt(Int.inf.Var) ; Int.inf.DesEs

## [1] 1.382549

Int.sup.DesEs <- sqrt(Int.sup.Var) ; Int.sup.DesEs

## [1] 3.669476

Rango.int.var <- Int.sup.Var - Int.inf.Var ; Rango.int.var

## [1] 11.55362

Ahora, con una confianza de 95% se espera que la desviación estándar del contenido de azúcar de esa partida de fruta esté entre [1.3825488, 3.6694765]

Ejemplo 2 de intervalo de confianza para una varianza. (Esta parte no está en el vídeo)

Con los mismos datos, averiguar el intervalo de confianza de la desviación standar al 99%.

n <- length(MuestraIntervalos) ; n #Número de muestras.

## [1] 10

nivel.conf <- 0.99 ; nivel.conf #Nivel de confianza con el que quiero trabajar.

## [1] 0.99

Int.inf.Var <- (n - 1) * sd(MuestraIntervalos)^2 / qchisq((1 + nivel.conf)/2, df = n - 1) ; Int.inf.Var

## [1] 1.547793

Int.sup.Var <- (n - 1) * sd(MuestraIntervalos)^2 / qchisq((1 - nivel.conf)/2, df = n - 1) ; Int.sup.Var

## [1] 21.04487

Rango.int.var <- Int.sup.Var - Int.inf.Var ; Rango.int.var

## [1] 19.49708

Estadística básica agronómica

Raúl Ortiz

25 de octubre de 2017

1 Introducción al diseño de experimentos.