Intervalos de confianza para la media

Cantidad pivotal o estadístico para la estimación de la media poblacional ${\mu}_{x}$

\[\mu_{\bar{x}}=E(\bar{x})=\mu_x=mean\]

Varianza poblacional conocida ${\sigma}_{x}^{2}$

\[\sigma_{\bar{x}}^{2}=V(\bar{x})=\frac{\sigma_{x}^{2}}{n}=\frac{sd^2}{size}\]

\[ \text{Si }x_i\stackrel{iid}{\sim}P(mean,sd^2)\text{ entonces }Z=\frac{\bar{x}_{size}-mean}{\sqrt{\frac{sd^2}{size}}}{\sim}N(0,1) \]

Ejemplo

Estandarización de una variable aleatoria con media igual a 176 y desviación estándar igual a 15 centímetros, que puede ser la distribución de las estaturas de los individuos en una población cuyo promedio de estaturas sea igual 176 centímetros y en promedio se alejen de este valor en 3 centímetros.

\[ P(\text{estaturas}=x)=\frac{1}{{3}\sqrt{2\pi}}e^{-\frac{1}{2}\left(\frac{x-{176}}{{3}}\right)^{2}}\text{ con }0{\leq}x{\leq}\infty \]

estaturas <- rnorm(n = 10000, mean = 176, sd = 3)
cat("la media de las estaturas es: ", round(mean(estaturas),0)," y ","la desviación estándar de las estaturas es: ", round(sd(estaturas),0))

## la media de las estaturas es:  176  y  la desviación estándar de las estaturas es:  3

library(ggplot2)
qplot(estaturas, geom = "histogram", bins = 30, main="Histograma de las estaturas", xlab="Estaturas", fill=I("blue"))

\[ \text{Si }estaturas_i\stackrel{iid}{\sim}N(176,3^2)\text{ con }{\sigma^2=3^2}\text{ conocida, entonces }Z=\frac{\overline{estaturas}_{size}-176}{\sqrt{\frac{3^2}{size}}}{\sim}N(0,1) \]

Simulación de escenarios con distinto número de repeticiones y tamaños de muestra para la obtención de la distribución de diferentes promedios muestrales obtenidos de ellas; con el fin de obtener la distribución límite que se espera sea normal, es decir, la distribución de la media muestral cuando se incrementan el tamaño de las muestras corresponde a una distribución normal y aquí es mostrado dicho resultado conocido como Teorema del límite central (o TLC por sus siglas).

n <- c(5, 13, 23, 37, 41)
t <- c(10, 100, 1000, 10000)

muestras.de.estaturas <- data.frame()

for(i in n) {
    col <- c()
    for(j in t) {
        trial <- 1:j
        counter <- j
        value <- c()
        while(counter > 0) {
            bucket <- sample(estaturas, i, replace = FALSE)
            Z <- (mean(bucket)-176)/(3/sqrt(i))
            value <- c(value, Z)
            counter <- counter - 1
        }
        col <- cbind(trial, value, i, j)
        muestras.de.estaturas <- rbind(muestras.de.estaturas, col)
    }
}

rm(col, bucket, value, counter, i, j, n, t, Z, trial)

str(muestras.de.estaturas)

## 'data.frame':    55550 obs. of  4 variables:
##  $ trial: num  1 2 3 4 5 6 7 8 9 10 ...
##  $ value: num  -0.971 0.7773 0.0346 -0.5133 -0.7958 ...
##  $ i    : num  5 5 5 5 5 5 5 5 5 5 ...
##  $ j    : num  10 10 10 10 10 10 10 10 10 10 ...

names(muestras.de.estaturas) <- c("trial#", "value", "samples", "trials")

g <- ggplot(muestras.de.estaturas, aes(x = value)) + geom_density(fill = "blue") + 
        facet_grid(samples ~ trials, labeller = label_both) + 
        ggtitle("Teorema del límite central por medio de simulación") + 
        geom_vline(xintercept = round(0,1), linetype = "dashed")
g

Varianza desconocida ${s}_{x}^{2}$

\[\hat{\sigma}_{\bar{x}}^{2}=\hat{V}(\bar{x})=\frac{s_{x}^{2}}{n}=\frac{\widehat{sd^2}}{size}\]

\[ \text{Si }x_i\stackrel{iid}{\sim}P(mean,sd^2)\text{ con }{\sigma^2=sd^2}\text{ desconocida, entonces }T=\frac{\bar{x}_{size}-mean}{\sqrt{\frac{\widehat{sd^2}}{size}}}{\sim}t_{(size-1)} \]

Ejemplo

Estandarización de una variable aleatoria con media y desviación estándar iguales a $980.657, que puede ser la distribución de los ingresos de los individuos en una población cuyo promedio de estaturas sea igual $980.657 pesos.

\[ P(\text{ingresos}=x)=\frac{1}{980657}e^{-\frac{1}{980657}x}\text{ con }0{\leq}x{\leq}\infty \]

ingresos <- rexp(n = 10000, rate = 1/980657)
cat("la media de los ingresos es: ", round(mean(ingresos),0)," y ","la desviación estándar de los ingresos es: ", round(sd(ingresos),0))

## la media de los ingresos es:  975324  y  la desviación estándar de los ingresos es:  975405

library(ggplot2)
qplot(ingresos, geom = "histogram", bins = 30, main="Histograma de los ingresos", xlab="Ingresos", fill=I("green"))

\[ \text{Si }x_i\stackrel{iid}{\sim}exp\left({\lambda}=980657\right)\text{ con }{sd^2=\sigma^2}\text{ desconocida, entonces }T=\frac{\overline{ingresos}_{size}-980657}{\sqrt{\frac{\widehat{sd^2}}{size}}}{\sim}t_{(size-1)} \]

Simulación de escenarios con distinto número de repeticiones y tamaños de muestra para la obtención de la distribución de diferentes promedios muestrales obtenidos de ellas; con el fin de obtener la distribución límite que se espera sea normal, es decir, la distribución de la media muestral cuando se incrementan el tamaño de las muestras corresponde a una distribución normal y aquí es mostrado dicho resultado conocido como Teorema del límite central (o TLC por sus siglas).

n <- c(53, 67, 79, 97, 101)
t <- c(10, 100, 1000, 10000)

muestras.de.ingresos <- data.frame()

for(i in n) {
    col <- c()
    for(j in t) {
        trial <- 1:j
        counter <- j
        value <- c()
        while(counter > 0) {
            bucket <- sample(ingresos, i, replace = FALSE)
            T <- (mean(bucket)-980657)/(sd(bucket)/sqrt(i))
            value <- c(value, T)
            counter <- counter - 1
        }
        col <- cbind(trial, value, i, j)
        muestras.de.ingresos <- rbind(muestras.de.ingresos, col)
    }
}

rm(col, bucket, value, counter, i, j, n, t, xbar, trial)

str(muestras.de.ingresos)

## 'data.frame':    55550 obs. of  4 variables:
##  $ trial: num  1 2 3 4 5 6 7 8 9 10 ...
##  $ value: num  -0.607 1.213 -0.214 0.224 -0.174 ...
##  $ i    : num  53 53 53 53 53 53 53 53 53 53 ...
##  $ j    : num  10 10 10 10 10 10 10 10 10 10 ...

names(muestras.de.ingresos) <- c("trial#", "value", "samples", "trials")

g <- ggplot(muestras.de.ingresos, aes(x = value)) + geom_density(fill = "green") + 
        facet_grid(samples ~ trials, labeller = label_both) + 
        ggtitle("Teorema del límite central por medio de simulación") + 
        geom_vline(xintercept = round(0,1), linetype = "dashed")
g

\[ \text{Si }x_i\stackrel{iid}{\sim}P(mean,sd^2)\text{ con }{\sigma^2=sd^2}\text{ desconocida, entonces }z=\frac{\bar{x}_{size}-mean}{\sqrt{\frac{\widehat{sd^2}}{size}}}\stackrel{size\rightarrow\infty}{\sim}N(0,1) \]

Ejemplo

Estandarización de una variable aleatoria con media y desviación estándar iguales a 980.657, que puede ser la distribución de los ingresos de los individuos en una población cuyo promedio de estaturas sea igual $980.657 pesos y en promedio se alejen de este valor en $980.657 pesos.

ingresos <- rexp(n = 10000, rate = 1/980657)
cat("la media de los ingresos es: ", round(mean(ingresos),0)," y ","la desviación estándar de los ingresos es: ", round(sd(ingresos),0))

## la media de los ingresos es:  972098  y  la desviación estándar de los ingresos es:  964478

library(ggplot2)
qplot(ingresos, geom = "histogram", bins = 30, main="Histograma de los ingresos", xlab="Ingresos", fill=I("orange"))

\[ \text{Si }x_i\stackrel{iid}{\sim}exp\left({\lambda}=980657\right)\text{ con }{sd^2=\sigma^2}\text{ desconocida, entonces }z=\frac{\overline{ingresos}_{size}-980657}{\sqrt{\frac{\widehat{sd^2}}{size}}}\stackrel{size\rightarrow\infty}{\sim}N(0,1) \]

Simulación de escenarios con distinto número de repeticiones y tamaños de muestra para la obtención de la distribución de diferentes promedios muestrales obtenidos de ellas; con el fin de obtener la distribución límite que se espera sea normal, es decir, la distribución de la media muestral cuando se incrementan el tamaño de las muestras corresponde a una distribución normal y aquí es mostrado dicho resultado conocido como Teorema del límite central (o TLC por sus siglas).

n <- c(103, 109, 131, 137, 139)
t <- c(10, 100, 1000, 10000)

muestras.de.ingresos <- data.frame()

for(i in n) {
    col <- c()
    for(j in t) {
        trial <- 1:j
        counter <- j
        value <- c()
        while(counter > 0) {
            bucket <- sample(ingresos, i, replace = FALSE)
            T <- (mean(bucket)-980657)/(sd(bucket)/sqrt(i))
            value <- c(value, T)
            counter <- counter - 1
        }
        col <- cbind(trial, value, i, j)
        muestras.de.ingresos <- rbind(muestras.de.ingresos, col)
    }
}

rm(col, bucket, value, counter, i, j, n, t, xbar, trial)

str(muestras.de.ingresos)

## 'data.frame':    55550 obs. of  4 variables:
##  $ trial: num  1 2 3 4 5 6 7 8 9 10 ...
##  $ value: num  -1.2744 0.0361 1.1387 0.48 -1.1647 ...
##  $ i    : num  103 103 103 103 103 103 103 103 103 103 ...
##  $ j    : num  10 10 10 10 10 10 10 10 10 10 ...

names(muestras.de.ingresos) <- c("trial#", "value", "samples", "trials")

g <- ggplot(muestras.de.ingresos, aes(x = value)) + geom_density(fill = "orange") + 
        facet_grid(samples ~ trials, labeller = label_both) + 
        ggtitle("Teorema del límite central por medio de simulación") + 
        geom_vline(xintercept = round(0,1), linetype = "dashed")
g

Intervalo de confianza para la estimación de la media poblacional ${\mu}_{x}$

\[ P\left(L{\leq}\frac{\bar{x}_{size}-mean}{\sqrt{\frac{variance}{size}}}{\leq}U\right)=1-\alpha \]

\[ P\left(L\sqrt{\frac{variance}{size}}{\leq}\bar{x}_{size}-mean{\leq}U\sqrt{\frac{variance}{size}}\right)=1-\alpha \]

\[ P\left(-\bar{x}_{size}+L\sqrt{\frac{variance}{size}}{\leq}-mean{\leq}-\bar{x}_{size}+U\sqrt{\frac{variance}{size}}\right)=1-\alpha \]

\[ P\left(\bar{x}_{size}-L\sqrt{\frac{variance}{size}}{\geq}mean{\geq}\bar{x}_{size}-U\sqrt{\frac{variance}{size}}\right)=1-\alpha \]

\[ P\left(\bar{x}_{size}-U\sqrt{\frac{variance}{size}}{\leq}mean{\leq}\bar{x}_{size}-L\sqrt{\frac{variance}{size}}\right)=1-\alpha \]

\[ P\left(\bar{x}_{size}+L\sqrt{\frac{variance}{size}}{\leq}mean{\leq}\bar{x}_{size}+U\sqrt{\frac{variance}{size}}\right)=1-\alpha \]

Varianza conocida ${\sigma}_{x}^{2}$

\[ P\left(-z_{\frac{\alpha}{2}}{\leq}\frac{\bar{x}_{size}-mean}{\sqrt{\frac{sd^2}{size}}}{\leq}z_{\frac{\alpha}{2}}\right)=1-\alpha \]

\[ P\left(\bar{x}_{size}-z_{\frac{\alpha}{2}}\sqrt{\frac{sd^2}{size}}{\leq}mean{\leq}\bar{x}_{size}+z_{\frac{\alpha}{2}}\sqrt{\frac{sd^2}{size}}\right)=1-\alpha \]

Ejemplo intervalo de confianza para una media ${\mu}_{x}$ con varianza conocida ${\sigma}_{x}^{2}$.

Tras revisar a fondo los documentos oficiales, se obtuvo que la tasa de contagio del coronarivurs por país es de 2,68 que se obtuvo al analizar los 75 casos confirmados que se tenían al momento de la firma del decreto (martes en la tarde) , es decir, que tasa media de contagio fue de 2,68 con una desviación estándar de 0.5 contagios, basandose en la información de los datos para los 1.103 municipios del país, esto no quiere decir que la tasa media de contagio más pequeña es de 2,18 y la mayor resulta ser de 3,18, sino que de media de la tasa de contagio se encuentra entre 2 y 3 casos por cada persona con coronavirus. Para comprobar esto se se obtienen 150 contagios promedio por municipio en el país y se estima un intervalo de confianza del 90% ($1-\alpha=0.90$) con un nivel de significancia del 10% ($\alpha=0.10$).

set.seed(555)
MuestraMunicipios <- round(rnorm(n = 150, mean = 2.68, sd = 0.5), 2) ; MuestraMunicipios

##   [1] 2.52 2.93 2.87 3.62 1.79 3.12 2.60 3.36 2.70 2.99 2.54 2.35 2.18 2.25 2.34
##  [16] 2.64 2.81 2.30 1.96 2.94 3.03 2.91 2.10 3.32 2.15 2.70 3.02 2.63 2.58 3.40
##  [31] 2.58 2.53 2.81 2.55 2.53 2.77 2.46 2.96 2.38 2.19 3.79 3.39 3.12 2.50 2.23
##  [46] 2.85 2.88 2.51 3.81 1.12 3.25 2.72 2.82 2.57 2.60 2.20 3.23 2.35 2.12 2.71
##  [61] 2.87 3.00 2.02 3.18 3.40 2.36 2.64 3.10 3.71 2.20 2.11 2.48 3.07 2.60 1.93
##  [76] 2.31 2.85 2.84 3.31 2.64 1.76 3.33 2.98 2.12 2.77 3.35 2.79 2.06 2.25 2.79
##  [91] 2.72 1.90 2.85 3.28 2.77 3.06 3.06 2.53 1.91 3.18 2.28 1.92 2.70 3.00 4.39
## [106] 2.29 2.62 2.72 2.95 2.74 2.81 2.40 3.05 1.81 2.04 2.76 3.27 3.00 2.75 1.84
## [121] 2.64 2.42 3.02 3.30 3.22 2.33 2.18 3.01 2.79 2.61 3.70 2.59 3.33 2.32 2.30
## [136] 1.73 1.99 2.85 2.61 3.21 2.17 1.52 2.23 2.64 2.35 2.36 3.86 3.17 2.24 2.22

El intervalo de confianza en este caso esta dado por:

\[ \left(\bar{x}_{size}-z_{\frac{\alpha}{2}}\sqrt{\frac{{sd^2}}{size}};\bar{x}_{size}+z_{\frac{\alpha}{2}}\sqrt{\frac{{sd^2}}{size}}\right) \]

Calculo de la media muestral $\bar{x}_{size}$

MediaMunicipal_X <- round(mean(MuestraMunicipios), 2) ; MediaMunicipal_X

## [1] 2.68

Calculo de la desviación estándar muestral ${sd}=\sqrt{{sd^2}}$

DesEstandar_P <- round(0.5, 2) ; DesEstandar_P

## [1] 0.5

Calculo del tamaño muestral ${size}$

size <- length(MuestraMunicipios) ; size

## [1] 150

Calculo del error estándar $\sqrt{\frac{{sd^2}}{size}}$

ErrorEstandar_SE <- round(DesEstandar_P/sqrt(size), 2) ; ErrorEstandar_SE

## [1] 0.04

Calculo del cuantíl de la distribución normal estándar $z_{\frac{\alpha}{2}}$

nivel.conf <- 0.9; z_alfa_0_5 <- qnorm((1 + nivel.conf)/2); z_alfa_0_5

## [1] 1.644854

Calculo del error de estimación $z_{\frac{\alpha}{2}}\sqrt{\frac{{sd^2}}{size}}$

ErrorEstimacion <- round(z_alfa_0_5 * ErrorEstandar_SE, 2) ; ErrorEstimacion

## [1] 0.07

Calculo del límite inferior del intervalo de confianza $\bar{x}_{size}-x_{\frac{\alpha}{2}}\sqrt{\frac{{sd^2}}{size}}$

Int.inf <- MediaMunicipal_X - ErrorEstimacion ; Int.inf

## [1] 2.61

Calculo del límite inferior del intervalo de confianza $\bar{x}_{size}+z_{\frac{\alpha}{2}}\sqrt{\frac{{sd^2}}{size}}$

Int.sup <- MediaMunicipal_X + ErrorEstimacion ; Int.sup

## [1] 2.75

Calculo del intervalo de confianza $\bar{x}_{size}{\pm}z_{\frac{\alpha}{2}}\sqrt{\frac{{sd^2}}{size}}$

MediaMunicipal_X + c(-ErrorEstimacion, +ErrorEstimacion)

## [1] 2.61 2.75

Graficación del intervalo de confianza

library(mosaic)
mean(MuestraMunicipios) + cdist( "norm", .90) * 0.5 / sqrt(size)

## [1] 2.609582 2.743884

Ejericio intervalo de confianza para una media ${\mu}_{x}$ con varianza conocida ${\sigma}_{x}^{2}$.

¿Cuál sería el intervalo de confianza de la media, con un nivel de significación alfa del 1%?
¿Cuál sería el intervalo de confianza de la media, con un nivel de significación alfa del 2%?
¿Cuál sería el intervalo de confianza de la media, con un nivel de significación alfa del 4%?
¿Cuál sería el intervalo de confianza de la media, con un nivel de significación alfa del 6%?
¿Cuál sería el intervalo de confianza de la media, con un nivel de significación alfa del 11%?
¿Cuál sería el intervalo de confianza de la media, con un nivel de significación alfa del 12%?
¿Cuál sería el intervalo de confianza de la media, con un nivel de significación alfa del 16%?
¿Cuál sería el intervalo de confianza de la media, con un nivel de significación alfa del 17%?
¿Cuál sería el intervalo de confianza de la media, con un nivel de significación alfa del 20%?
¿Cuál sería el intervalo de confianza de la media, con un nivel de significación alfa del 25%?

Varianza desconocida ${s}_{x}^{2}$

\[ P\left(-t_{\left(size-1,\frac{\alpha}{2}\right)}{\leq}\frac{\bar{x}_{size}-mean}{\sqrt{\frac{\widehat{sd^2}}{size}}}{\leq}t_{\left(size-1,\frac{\alpha}{2}\right)}\right)=1-\alpha \]

\[ P\left(\bar{x}_{size}-t_{\left(size-1,\frac{\alpha}{2}\right)}\sqrt{\frac{\widehat{sd^2}}{size}}{\leq}mean{\leq}\bar{x}_{size}+t_{\left(size-1,\frac{\alpha}{2}\right)}\sqrt{\frac{\widehat{sd^2}}{size}}\right)=1-\alpha \]

Ejemplo intervalo de confianza para una media ${\mu}_{x}$ con varianza desconocida ${\sigma}_{x}^{2}$.

Tras revisar a fondo los documentos oficiales, se obtuvo que la tasa de contagio del coronarivurs por país es de 2,68 que se obtuvo al analizar los 75 casos confirmados que se tenían al momento de la firma del decreto (martes en la tarde) , es decir, que tasa media de contagio fue de 2,68 con una desviación estándar de 0.5 contagios, esto no quiere decir que la tasa media de contagio más pequeña es de 2,18 y la mayor resulta ser de 3,18, sino que de media de la tasa de contagio se encuentra entre 2 y 3 casos por cada persona con coronavirus. Para comprobar esto se se obtienen 150 contagios promedio por municipio en el país y se estima un intervalo de confianza del 90% ($1-\alpha=0.95$) con un nivel de significancia del 10% ($\alpha=0.05$).

set.seed(555)
MuestraMunicipios <- round(rnorm(n = 150, mean = 2.68, sd = 0.5), 2) ; MuestraMunicipios

##   [1] 2.52 2.93 2.87 3.62 1.79 3.12 2.60 3.36 2.70 2.99 2.54 2.35 2.18 2.25 2.34
##  [16] 2.64 2.81 2.30 1.96 2.94 3.03 2.91 2.10 3.32 2.15 2.70 3.02 2.63 2.58 3.40
##  [31] 2.58 2.53 2.81 2.55 2.53 2.77 2.46 2.96 2.38 2.19 3.79 3.39 3.12 2.50 2.23
##  [46] 2.85 2.88 2.51 3.81 1.12 3.25 2.72 2.82 2.57 2.60 2.20 3.23 2.35 2.12 2.71
##  [61] 2.87 3.00 2.02 3.18 3.40 2.36 2.64 3.10 3.71 2.20 2.11 2.48 3.07 2.60 1.93
##  [76] 2.31 2.85 2.84 3.31 2.64 1.76 3.33 2.98 2.12 2.77 3.35 2.79 2.06 2.25 2.79
##  [91] 2.72 1.90 2.85 3.28 2.77 3.06 3.06 2.53 1.91 3.18 2.28 1.92 2.70 3.00 4.39
## [106] 2.29 2.62 2.72 2.95 2.74 2.81 2.40 3.05 1.81 2.04 2.76 3.27 3.00 2.75 1.84
## [121] 2.64 2.42 3.02 3.30 3.22 2.33 2.18 3.01 2.79 2.61 3.70 2.59 3.33 2.32 2.30
## [136] 1.73 1.99 2.85 2.61 3.21 2.17 1.52 2.23 2.64 2.35 2.36 3.86 3.17 2.24 2.22

El intervalo de confianza en este caso esta dado por:

\[ \left(\bar{x}_{size}-t_{\left(size-1,\frac{\alpha}{2}\right)}\sqrt{\frac{\widehat{sd^2}}{size}};\bar{x}_{size}+t_{\left(size-1,\frac{\alpha}{2}\right)}\sqrt{\frac{\widehat{sd^2}}{size}}\right) \]

Calculo de la media muestral $\bar{x}_{size}$

MediaMunicipal_X <- round(mean(MuestraMunicipios), 2) ; MediaMunicipal_X

## [1] 2.68

Calculo de la desviación estándar muestral $\widehat{sd}=\sqrt{\widehat{sd^2}}$

DesEstandar_S <- round(sd(MuestraMunicipios), 2); DesEstandar_S

## [1] 0.51

Calculo del tamaño muestral ${size}$

size <- length(MuestraMunicipios) ; size

## [1] 150

Calculo del error estándar $\sqrt{\frac{\widehat{sd^2}}{size}}$

ErrorEstandar_SE <- round(DesEstandar_S/sqrt(size), 2) ; ErrorEstandar_SE

## [1] 0.04

Calculo del cuantíl de la distribución t-student $t_{\left(size-1,\frac{\alpha}{2}\right)}$

nivel.conf <- 0.95; t_alfa_0_5 <- qt((1 + nivel.conf)/2, df = size - 1); t_alfa_0_5

## [1] 1.976013

Calculo del error de estimación $t_{\left(size-1,\frac{\alpha}{2}\right)}\sqrt{\frac{\widehat{sd^2}}{size}}$

ErrorEstimacion <- round(t_alfa_0_5 * ErrorEstandar_SE, 2) ; ErrorEstimacion

## [1] 0.08

Calculo del límite inferior del intervalo de confianza $\bar{x}_{size}-t_{\left(size-1,\frac{\alpha}{2}\right)}\sqrt{\frac{\widehat{sd^2}}{size}}$

Int.inf <- MediaMunicipal_X - ErrorEstimacion ; Int.inf

## [1] 2.6

Calculo del límite inferior del intervalo de confianza $\bar{x}_{size}+t_{\left(size-1,\frac{\alpha}{2}\right)}\sqrt{\frac{\widehat{sd^2}}{size}}$

Int.sup <- MediaMunicipal_X + ErrorEstimacion ; Int.sup

## [1] 2.76

Calculo del intervalo de confianza $\bar{x}_{size}{\pm}t_{\left(size-1,\frac{\alpha}{2}\right)}\sqrt{\frac{\widehat{sd^2}}{size}}$

MediaMunicipal_X + c(-ErrorEstimacion, +ErrorEstimacion)

## [1] 2.60 2.76

Graficación del intervalo de confianza

library(mosaic)
mean(MuestraMunicipios) + cdist("t", p = 0.90, df=size-1) * sd(MuestraMunicipios) / sqrt(size)

## [1] 2.607969 2.745497

Ejericio intervalo de confianza para una media ${\mu}_{x}$ con varianza desconocida ${\sigma}_{x}^{2}$.

¿Cuál sería el intervalo de confianza de la media, con un nivel de significación alfa del 1%?
¿Cuál sería el intervalo de confianza de la media, con un nivel de significación alfa del 2%?
¿Cuál sería el intervalo de confianza de la media, con un nivel de significación alfa del 4%?
¿Cuál sería el intervalo de confianza de la media, con un nivel de significación alfa del 6%?
¿Cuál sería el intervalo de confianza de la media, con un nivel de significación alfa del 11%?
¿Cuál sería el intervalo de confianza de la media, con un nivel de significación alfa del 12%?
¿Cuál sería el intervalo de confianza de la media, con un nivel de significación alfa del 16%?
¿Cuál sería el intervalo de confianza de la media, con un nivel de significación alfa del 17%?
¿Cuál sería el intervalo de confianza de la media, con un nivel de significación alfa del 20%?
¿Cuál sería el intervalo de confianza de la media, con un nivel de significación alfa del 25%?

Varianza desconocida ${s}_{x}^{2}$ y tamaño de muestra $size{\rightarrow}\infty$

\[ P\left(-z_{\frac{\alpha}{2}}{\leq}\frac{\bar{x}_{size}-mean}{\sqrt{\frac{\widehat{sd^2}}{size}}}{\leq}z_{\frac{\alpha}{2}}\right)=1-\alpha \]

\[ P\left(\bar{x}_{size}-z_{\frac{\alpha}{2}}\sqrt{\frac{\widehat{sd^2}}{size}}{\leq}mean{\leq}\bar{x}_{size}+z_{\frac{\alpha}{2}}\sqrt{\frac{\widehat{sd^2}}{size}}\right)=1-\alpha \]

Ejemplo intervalo de confianza para una media ${\mu}_{x}$ con varianza conocida ${\sigma}_{x}^{2}$ y tamaño de muestra $size{\rightarrow}\infty$.

Tras revisar a fondo los documentos oficiales, se obtuvo que la tasa de contagio del coronarivurs por país es de 2,68 que se obtuvo al analizar los 75 casos confirmados que se tenían al momento de la firma del decreto (martes en la tarde) , es decir, que tasa media de contagio fue de 2,68 con una desviación estándar de 0.5 contagios, basandose en la información de los datos para los 1.103 municipios del país, esto no quiere decir que la tasa media de contagio más pequeña es de 2,18 y la mayor resulta ser de 3,18, sino que de media de la tasa de contagio se encuentra entre 2 y 3 casos por cada persona con coronavirus. Para comprobar esto se se obtienen 600 contagios promedio por municipio en el país y se estima un intervalo de confianza del 99% ($1-\alpha=0.99$) con un nivel de significancia del 1% ($\alpha=0.01$).

set.seed(555)
MuestraMunicipios <- round(rnorm(n = 600, mean = 2.68, sd = 0.5), 2) ; MuestraMunicipios

##   [1] 2.52 2.93 2.87 3.62 1.79 3.12 2.60 3.36 2.70 2.99 2.54 2.35 2.18 2.25 2.34
##  [16] 2.64 2.81 2.30 1.96 2.94 3.03 2.91 2.10 3.32 2.15 2.70 3.02 2.63 2.58 3.40
##  [31] 2.58 2.53 2.81 2.55 2.53 2.77 2.46 2.96 2.38 2.19 3.79 3.39 3.12 2.50 2.23
##  [46] 2.85 2.88 2.51 3.81 1.12 3.25 2.72 2.82 2.57 2.60 2.20 3.23 2.35 2.12 2.71
##  [61] 2.87 3.00 2.02 3.18 3.40 2.36 2.64 3.10 3.71 2.20 2.11 2.48 3.07 2.60 1.93
##  [76] 2.31 2.85 2.84 3.31 2.64 1.76 3.33 2.98 2.12 2.77 3.35 2.79 2.06 2.25 2.79
##  [91] 2.72 1.90 2.85 3.28 2.77 3.06 3.06 2.53 1.91 3.18 2.28 1.92 2.70 3.00 4.39
## [106] 2.29 2.62 2.72 2.95 2.74 2.81 2.40 3.05 1.81 2.04 2.76 3.27 3.00 2.75 1.84
## [121] 2.64 2.42 3.02 3.30 3.22 2.33 2.18 3.01 2.79 2.61 3.70 2.59 3.33 2.32 2.30
## [136] 1.73 1.99 2.85 2.61 3.21 2.17 1.52 2.23 2.64 2.35 2.36 3.86 3.17 2.24 2.22
## [151] 1.93 2.58 3.96 3.58 2.39 3.09 2.66 2.49 2.59 3.10 2.85 1.99 2.59 2.97 2.68
## [166] 3.08 2.71 3.30 2.84 3.59 2.76 2.47 1.96 2.77 2.69 2.12 3.00 2.77 2.75 2.42
## [181] 2.44 3.23 2.93 2.47 3.36 2.52 2.65 2.36 3.14 3.07 2.78 2.56 2.68 3.11 1.92
## [196] 1.84 2.58 1.96 3.19 3.27 3.43 2.32 2.66 2.31 2.05 1.77 3.54 1.89 3.36 1.15
## [211] 2.21 2.63 2.45 3.44 2.58 2.59 2.69 1.96 2.40 3.61 3.53 2.94 3.21 2.84 2.32
## [226] 3.02 3.09 2.75 2.73 2.52 3.22 2.47 2.91 2.75 2.94 2.33 2.87 2.52 3.20 2.78
## [241] 2.26 2.60 2.38 3.11 2.59 3.31 2.52 2.54 2.70 2.33 3.14 2.62 2.31 3.12 1.91
## [256] 2.74 3.02 2.75 2.79 2.82 3.21 2.74 2.68 2.44 2.07 2.31 1.92 3.19 1.84 2.87
## [271] 2.58 2.54 3.38 1.78 2.14 3.11 2.47 2.74 2.34 2.01 2.66 3.23 2.57 2.77 2.82
## [286] 2.40 2.70 2.07 2.23 2.02 3.14 2.12 2.69 3.68 4.29 3.14 3.01 2.08 3.50 2.90
## [301] 2.94 3.03 2.57 2.41 3.32 2.07 3.14 2.74 3.34 2.29 3.75 2.54 2.92 3.37 2.76
## [316] 2.82 2.05 3.58 1.81 2.80 2.27 3.34 2.57 2.34 3.04 3.08 2.69 2.04 2.66 1.60
## [331] 2.24 2.80 2.73 2.82 2.92 3.81 3.53 3.54 3.77 2.64 3.43 1.65 1.55 2.57 2.13
## [346] 2.45 2.50 2.80 2.25 3.19 2.24 3.12 2.37 3.10 3.43 2.79 1.60 3.15 2.44 2.78
## [361] 2.12 3.08 2.17 3.04 2.30 2.63 2.86 2.74 2.15 1.96 2.02 3.93 1.31 2.90 2.60
## [376] 1.75 3.97 2.69 2.39 3.41 2.26 2.97 2.18 2.75 2.95 2.60 2.71 3.22 2.62 2.69
## [391] 2.60 3.18 2.47 1.70 2.90 1.82 2.04 2.64 3.28 2.49 3.12 2.44 3.47 2.61 2.54
## [406] 2.14 2.93 3.02 2.53 2.75 2.66 2.74 2.40 3.23 2.46 3.05 2.06 2.59 2.56 2.40
## [421] 2.64 2.31 2.57 2.63 2.74 2.80 2.68 2.34 3.61 2.63 3.28 3.07 2.82 1.98 2.37
## [436] 2.95 2.95 2.19 3.11 1.86 3.50 3.05 2.82 3.48 3.31 1.81 3.45 2.83 2.40 3.21
## [451] 2.16 2.25 3.27 2.50 2.53 2.04 3.67 3.44 2.81 2.85 2.50 3.40 2.76 2.64 2.95
## [466] 3.60 2.61 3.10 3.31 2.80 1.86 2.82 3.02 1.45 3.45 3.11 3.01 2.10 2.32 3.14
## [481] 1.89 2.84 2.23 3.23 3.37 2.90 2.74 2.98 3.27 1.82 2.71 3.02 2.86 2.76 1.74
## [496] 2.44 2.72 3.63 2.46 2.57 1.82 2.44 2.39 2.85 2.52 2.96 2.11 2.42 2.88 2.78
## [511] 2.83 2.03 3.15 2.31 2.92 3.27 3.62 1.83 3.81 2.95 2.68 2.62 2.24 2.68 2.76
## [526] 2.65 2.97 3.15 2.77 3.26 2.84 2.82 2.19 2.54 3.25 2.91 2.07 2.59 2.51 2.49
## [541] 2.59 2.96 1.72 3.76 2.95 3.06 2.45 3.47 3.11 3.90 1.97 2.73 2.89 3.78 2.65
## [556] 2.38 2.47 2.54 2.82 2.42 2.31 3.16 2.43 2.07 2.97 1.96 1.90 3.22 2.42 3.11
## [571] 3.75 2.71 3.89 2.26 3.23 2.75 2.52 2.13 3.04 2.54 3.14 2.65 2.03 3.23 2.52
## [586] 2.73 1.88 2.39 2.27 3.19 2.42 2.61 3.41 3.11 2.54 3.05 2.88 2.28 2.60 2.93

El intervalo de confianza en este caso esta dado por:

\[ \left(\bar{x}_{size}-z_{\frac{\alpha}{2}}\sqrt{\frac{\widehat{sd^2}}{size}};\bar{x}_{size}+z_{\frac{\alpha}{2}}\sqrt{\frac{\widehat{sd^2}}{size}}\right) \]

Calculo de la media muestral $\bar{x}_{size}$

MediaMunicipal_X <- round(mean(MuestraMunicipios), 2) ; MediaMunicipal_X

## [1] 2.7

Calculo de la desviación estándar muestral ${sd}=\sqrt{\widehat{sd^2}}$

DesEstandar_P <- round(sd(MuestraMunicipios), 2) ; DesEstandar_P

## [1] 0.5

Calculo del tamaño muestral ${size}$

size <- length(MuestraMunicipios) ; size

## [1] 600

Calculo del error estándar $\sqrt{\frac{\widehat{sd^2}}{size}}$

ErrorEstandar_SE <- round(DesEstandar_P/sqrt(size), 2) ; ErrorEstandar_SE

## [1] 0.02

Calculo del cuantíl de la distribución normal estándar $z_{\frac{\alpha}{2}}$

nivel.conf <- 0.99; z_alfa_0_5 <- qnorm((1 + nivel.conf)/2); z_alfa_0_5

## [1] 2.575829

Calculo del error de estimación $z_{\frac{\alpha}{2}}\sqrt{\frac{\widehat{sd^2}}{size}}$

ErrorEstimacion <- round(z_alfa_0_5 * ErrorEstandar_SE, 2) ; ErrorEstimacion

## [1] 0.05

Calculo del límite inferior del intervalo de confianza $\bar{x}_{size}-z_{\frac{\alpha}{2}}\sqrt{\frac{\widehat{sd^2}}{size}}$

Int.inf <- MediaMunicipal_X - ErrorEstimacion ; Int.inf

## [1] 2.65

Calculo del límite inferior del intervalo de confianza $\bar{x}_{size}+z_{\frac{\alpha}{2}}\sqrt{\frac{\widehat{sd^2}}{size}}$

Int.sup <- MediaMunicipal_X + ErrorEstimacion ; Int.sup

## [1] 2.75

Calculo del intervalo de confianza $\bar{x}_{size}{\pm}z_{\frac{\alpha}{2}}\sqrt{\frac{\widehat{sd^2}}{size}}$

MediaMunicipal_X + c(-ErrorEstimacion, +ErrorEstimacion)

## [1] 2.65 2.75

Graficación del intervalo de confianza

library(mosaic)
mean(MuestraMunicipios) + cdist( "norm", .90) * sd(MuestraMunicipios) / sqrt(size)

## [1] 2.669353 2.737147

Ejericio intervalo de confianza para una media ${\mu}_{x}$ con varianza desconocida ${\sigma}_{x}^{2}$ y tamaño de muestra $size{\rightarrow}\infty$.

¿Cuál sería el intervalo de confianza de la media, con un nivel de significación alfa del 2%?
¿Cuál sería el intervalo de confianza de la media, con un nivel de significación alfa del 3%?
¿Cuál sería el intervalo de confianza de la media, con un nivel de significación alfa del 4%?
¿Cuál sería el intervalo de confianza de la media, con un nivel de significación alfa del 6%?
¿Cuál sería el intervalo de confianza de la media, con un nivel de significación alfa del 7%?
¿Cuál sería el intervalo de confianza de la media, con un nivel de significación alfa del 13%?
¿Cuál sería el intervalo de confianza de la media, con un nivel de significación alfa del 11%?
¿Cuál sería el intervalo de confianza de la media, con un nivel de significación alfa del 18%?
¿Cuál sería el intervalo de confianza de la media, con un nivel de significación alfa del 19%?
¿Cuál sería el intervalo de confianza de la media, con un nivel de significación alfa del 25%?

Intervalos de confianza para la media

M Sc. Mario Gregorio Saavedra Rodríguez

2/5/2020

Cantidad pivotal o estadístico para la estimación de la media poblacional \({\mu}_{x}\)

Varianza poblacional conocida \({\sigma}_{x}^{2}\)

Ejemplo

Varianza desconocida \({s}_{x}^{2}\)

Ejemplo

Ejemplo

Intervalo de confianza para la estimación de la media poblacional \({\mu}_{x}\)

Varianza conocida \({\sigma}_{x}^{2}\)

Ejemplo intervalo de confianza para una media \({\mu}_{x}\) con varianza conocida \({\sigma}_{x}^{2}\).

Ejericio intervalo de confianza para una media \({\mu}_{x}\) con varianza conocida \({\sigma}_{x}^{2}\).

Varianza desconocida \({s}_{x}^{2}\)

Ejemplo intervalo de confianza para una media \({\mu}_{x}\) con varianza desconocida \({\sigma}_{x}^{2}\).

Ejericio intervalo de confianza para una media \({\mu}_{x}\) con varianza desconocida \({\sigma}_{x}^{2}\).

Varianza desconocida \({s}_{x}^{2}\) y tamaño de muestra \(size{\rightarrow}\infty\)

Ejemplo intervalo de confianza para una media \({\mu}_{x}\) con varianza conocida \({\sigma}_{x}^{2}\) y tamaño de muestra \(size{\rightarrow}\infty\).

Ejericio intervalo de confianza para una media \({\mu}_{x}\) con varianza desconocida \({\sigma}_{x}^{2}\) y tamaño de muestra \(size{\rightarrow}\infty\).