Objetivo

Identificar e interpretar intervalos de confianza con distribuciones normales Z.

Descripción

Se presentan diversos ejercicios con los que se requiere inicializar variables para determinar valores de Z con los cuales se estima intervalos de confianza.

Se interpretar intervalo de confianza

Fundamento teórico

Error muestral

El concepto de error muestral se define como la diferencia que existe de el valor de la media de varias medias en relación con la media poblacional.

Ejemplo se crea una población de 200 valores y bajo la distribución normal, se identifica la media poblacional con μ=50 y σ=5

set.seed(2021)
n = 200
poblacion <- rnorm(n = n, mean = 50, sd = 5)
poblacion
##   [1] 49.38770 52.76228 51.74325 51.79816 54.49027 40.38715 51.30872 54.57783
##   [9] 50.06886 58.64982 44.58898 48.63587 50.90998 57.54271 58.02235 40.79262
##  [17] 58.11655 50.65695 57.40561 57.56659 45.28778 49.07157 44.49438 56.04058
##  [25] 41.87531 50.52689 42.72278 48.22992 49.53150 55.50334 40.18087 42.76028
##  [33] 55.09722 42.89291 46.97734 42.08263 43.57034 42.72658 49.56464 52.52368
##  [41] 50.58194 58.80107 48.27442 60.60000 49.82811 46.03923 57.37758 46.37221
##  [49] 51.56190 53.45982 47.49855 38.72065 50.21871 48.15591 45.19889 50.51883
##  [57] 52.13645 49.14759 42.25430 42.47200 50.08022 49.07318 51.95967 46.21645
##  [65] 51.15709 45.08193 52.82540 58.08376 48.74018 44.72061 48.25884 49.78505
##  [73] 43.01223 57.45108 44.80306 48.81527 45.00429 43.03729 54.91003 51.80470
##  [81] 48.31245 46.78306 39.16557 53.16644 49.27543 43.79986 52.66980 42.05868
##  [89] 45.04518 52.41630 54.05309 48.53168 49.73271 53.67592 50.07492 49.38999
##  [97] 46.76613 45.66071 47.45650 39.61208 48.69832 52.25170 49.28559 47.56639
## [105] 44.02113 50.23470 49.36734 36.49642 47.14593 52.95799 52.43488 49.36600
## [113] 43.70400 51.00646 40.41548 58.36370 52.35395 57.07057 50.42149 40.98848
## [121] 53.76872 48.44028 41.33720 39.30719 61.82899 52.42378 55.46619 51.51454
## [129] 55.07650 62.26796 48.77190 52.70760 50.98438 39.64419 52.56292 47.97119
## [137] 51.78099 48.34215 50.40296 48.69234 45.61275 53.70654 36.58518 45.25261
## [145] 52.23131 43.55585 49.21097 51.73908 49.70189 57.38364 46.72918 48.71593
## [153] 43.72981 53.85522 45.44324 46.53347 46.91166 53.81062 44.56421 48.00100
## [161] 54.13898 51.77710 50.79569 54.77698 48.30179 46.36309 41.51097 59.77069
## [169] 63.33369 60.31690 54.09392 49.60175 47.55275 54.23859 45.20478 54.64344
## [177] 51.90483 57.47302 47.66148 51.30579 45.03696 44.68309 51.37142 54.72671
## [185] 53.63095 48.72744 57.42590 51.15143 51.39001 50.73520 44.01855 50.45068
## [193] 56.09635 47.19254 51.68441 42.31600 48.79935 52.57433 48.80572 52.90909

Media de la población

media.p <- mean(poblacion) 
media.p
## [1] 49.55983

Determinando varias muestras

muestra1 <- sample(x = poblacion, size = 30, replace = FALSE)
muestra2 <- sample(x = poblacion, size = 30, replace = FALSE)
muestra3 <- sample(x = poblacion, size = 30, replace = FALSE)
muestra4 <- sample(x = poblacion, size = 30, replace = FALSE)
muestra5 <- sample(x = poblacion, size = 30, replace = FALSE)

Visualizar las muestras

Muestra1

muestra1
##  [1] 58.08376 51.37142 50.42149 45.20478 39.30719 55.46619 44.72061 48.79935
##  [9] 53.67592 48.44028 47.49855 51.51454 50.98438 52.25170 55.07650 45.04518
## [17] 51.30872 50.52689 48.69234 49.60175 48.81527 51.78099 48.80572 54.23859
## [25] 43.72981 48.25884 47.14593 50.23470 60.60000 38.72065

Muestra2

muestra2
##  [1] 36.49642 45.66071 44.58898 53.67592 53.45982 51.95967 48.27442 61.82899
##  [9] 51.74325 58.11655 42.47200 44.01855 42.72658 51.15143 49.78505 52.41630
## [17] 57.56659 48.77190 46.97734 54.64344 51.00646 57.07057 49.73271 51.15709
## [25] 48.30179 53.16644 50.51883 53.76872 50.08022 54.09392

Muestra3

muestra3
##  [1] 58.11655 49.53150 57.38364 50.06886 51.30872 43.01223 44.58898 60.60000
##  [9] 58.80107 50.58194 44.80306 44.72061 52.70760 48.31245 39.64419 41.87531
## [17] 52.41630 53.85522 51.74325 53.16644 50.08022 47.56639 50.42149 42.72278
## [25] 49.21097 49.38770 53.67592 51.80470 45.00429 46.78306

Muestra4

muestra4
##  [1] 51.15143 44.02113 42.47200 52.95799 50.73520 45.04518 58.36370 60.31690
##  [9] 49.07157 45.44324 48.80572 36.58518 48.22992 39.30719 55.46619 51.78099
## [17] 46.53347 40.38715 47.19254 57.54271 58.64982 47.56639 56.09635 46.72918
## [25] 57.47302 51.37142 59.77069 57.07057 51.73908 41.87531

Muestra5

muestra5
##  [1] 57.07057 49.27543 48.34215 43.55585 51.95967 55.07650 52.66980 39.61208
##  [9] 54.09392 54.64344 51.80470 44.56421 48.77190 53.16644 50.21871 46.97734
## [17] 50.07492 51.79816 51.90483 48.27442 42.31600 51.30579 51.39001 43.79986
## [25] 45.19889 40.41548 49.73271 45.04518 51.15709 51.78099

Medias de las muestras

media1 <- mean(muestra1)
media2 <- mean(muestra2)
media3 <- mean(muestra3)
media4 <- mean(muestra4)
media5 <- mean(muestra5)

media1
## [1] 49.6774
media2
## [1] 50.50769
media3
## [1] 49.79652
media4
## [1] 49.99171
media5
## [1] 49.1999

Media de medias muestrales

media.de.medias <- mean(c(media1, media2, media3, media4, media5))
media.de.medias
## [1] 49.83464

Calculando el Error Estándar

La diferencia que existe entre la media de todas las medias en relación a la media poblacional es o lo que se conoce como Error Muestral.

Err.Std=σx¯=σn−−√σ es la desviación estándar de la poblaciónn es la cantidad de elementos

Err.Std = sd(poblacion) / sqrt(n)
Err.Std
## [1] 0.3689865

Intervalo de confianza

El concepto de intervalo de confianza es el conjunto de valores que se forma a partir de una muestra de forma que exista la probabilidad de que el parámetro poblacional ocurra dentro de dicho conjunto con una probabilidad específica. La probabilidad específica se llama nivel de confianza. (lind2015?).

El intervalo de confianza es una técnica de estimación utilizada en inferencia estadística que permite acotar un par o varios pares de valores, dentro de los cuales se encontrará la estimación puntual buscada (con una determinada probabilidad).

Permite calcular dos valores alrededor de una media muestral (uno superior y otro inferior). Estos valores van a acotar un rango dentro del cual, con una determinada probabilidad, se va a localizar el parámetro poblacional. (Economipedia, n.d.).

3.3 Fórmula de intervalo de confianza IC=x¯±z⋅σn−−√

Se necesita el valor de z!, ¿de dónde? y ¿cómo se obtiene?

Se requiere el estadístico la media de una muestra.

Se necesita la desviación estándar de la población Se estiman los valores mínimos y máximos dentro de un intervalo al 90%, tal vez al 95% tal vez al 99%… O cualquier otro valor de confianza.

Por ejemplo :

Desarrollo

Cargar librerías

library(cowplot) # Gráficos
library(ggplot2) # Gráfico
library(mosaic)
library(dplyr)  # Para filter,select,arrange,mutate %>%..

Cargar funciones

source("https://raw.githubusercontent.com/rpizarrog/Trabajos-en-R-AD2021/main/funciones/funciones.para.distribuciones.r")
## 
## Attaching package: 'gtools'
## The following object is masked from 'package:mosaic':
## 
##     logit

Tabla de niveles de confianza de 0.90

4.2.2 a 0.99

confianza = seq(0.90, 0.99, 0.01)
confianza
##  [1] 0.90 0.91 0.92 0.93 0.94 0.95 0.96 0.97 0.98 0.99
alfa = 1 - confianza
alfa
##  [1] 0.10 0.09 0.08 0.07 0.06 0.05 0.04 0.03 0.02 0.01
v.critico <- 1 - (alfa / 2)
v.critico
##  [1] 0.950 0.955 0.960 0.965 0.970 0.975 0.980 0.985 0.990 0.995
z <- qnorm(v.critico)
z
##  [1] 1.644854 1.695398 1.750686 1.811911 1.880794 1.959964 2.053749 2.170090
##  [9] 2.326348 2.575829
tabla <- data.frame(confianza, alfa, v.critico, z)
tabla
##    confianza alfa v.critico        z
## 1       0.90 0.10     0.950 1.644854
## 2       0.91 0.09     0.955 1.695398
## 3       0.92 0.08     0.960 1.750686
## 4       0.93 0.07     0.965 1.811911
## 5       0.94 0.06     0.970 1.880794
## 6       0.95 0.05     0.975 1.959964
## 7       0.96 0.04     0.980 2.053749
## 8       0.97 0.03     0.985 2.170090
## 9       0.98 0.02     0.990 2.326348
## 10      0.99 0.01     0.995 2.575829

Ejemplos

Se determina intervalos de confianza para cuando se tiene la media desconocida de una población pero se conoce su desviación estándar σ, se conoce la media de la muestra x¯ y el valor de n (cantidad de elementos de la muestra) además de el valor de confianza solicitado.

Ejemplo 1. Alumnos de una facultad

Se ha obtenido una muestra de n=25 alumnos de una Facultad para estimar la calificación media de los expedientes de los alumnos en la Facultad. Se sabe por otros cursos que la desviación típica de las puntuaciones en dicha Facultad es de σ=2.01 puntos. La media de la muestra fue de x¯=4.9.

Se requiere determinar el intervalo de confianza al 90 %. y

Se necesita determinar el intervalo de confianza al 99 %.

Entonces y conforme a la fórmula del intervalo de confianza:

IC=x¯±z⋅σn−−√

Intervalo de confianza al 90%

intervalo <- f.intervalo.confianza(media = 4.9, desv = 2.01, n = 25, confianza = 0.90)
intervalo
## [1] 4.2388 5.5612

La media de 4.9 debe estar entre 4.2388, 5.5612 al 90% de confianza

Intervalo de confianza al 99%

intervalo <- f.intervalo.confianza(media = 4.9, desv = 2.01, n = 25, confianza = 0.99)
intervalo
## [1] 3.8645 5.9355

La media de 4.9 debe estar entre 3.8645, 5.9355 al 99% de confianza

Visualizar al 90%

Visualizar al 99%

Ejemplo 2. Pendiente

Interpretación

Bibliografía Economipedia. n.d. “Intervalo de Confianza.” https://economipedia.com/definiciones/intervalo-de-confianza.html.