Identificar e interpretar intervalos de confianza con distribuciones normales Z.
Se presentan diversos ejercicios con los que se requiere inicializar variables para determinar valores de Z con los cuales se estima intervalos de confianza.
Se interpretar intervalo de confianza
El concepto de error muestral se define como la diferencia que existe de el valor de la media de varias medias en relación con la media poblacional.
Ejemplo se crea una población de 200 valores y bajo la distribución normal, se identifica la media poblacional con μ=50 y σ=5
n = 200
poblacion <- rnorm(n = n, mean = 50, sd = 5)
poblacion
## [1] 46.52149 37.71979 52.95411 51.35983 52.80810 42.48290 56.96860 46.73935
## [9] 48.73715 49.35069 55.17637 51.40959 54.77495 50.78281 41.67254 54.32658
## [17] 48.96267 48.89458 44.47990 51.57429 59.31334 47.61218 41.65637 52.71018
## [25] 47.23346 49.18083 50.04597 48.08847 45.55350 50.05950 46.80783 58.59294
## [33] 42.27297 51.01555 50.41740 48.22392 43.46988 51.65751 55.92560 51.63888
## [41] 52.21771 49.68410 49.80748 55.79575 61.91555 41.96666 44.78919 40.42475
## [49] 46.09307 51.15634 48.71100 55.98890 55.36126 42.04576 52.77268 46.99322
## [57] 49.21772 44.29115 42.12748 52.70165 49.90614 52.01003 55.25965 50.80167
## [65] 56.83247 45.21887 39.18478 47.88440 47.62065 54.46942 52.63142 51.51732
## [73] 49.18087 54.87974 54.17131 50.65536 51.31893 46.45402 47.29048 52.77260
## [81] 50.23040 50.54086 57.02795 42.40702 43.27408 48.72877 48.80148 61.07075
## [89] 54.21418 57.07035 47.35792 51.44809 45.69714 57.42901 59.15654 53.25678
## [97] 51.71193 45.66875 58.12342 53.62519 46.55665 49.60658 51.09333 52.18342
## [105] 54.77912 50.34105 49.10853 45.13553 47.44643 56.18276 45.58089 47.13214
## [113] 40.92416 54.23646 54.62253 51.07568 50.73439 50.21208 48.91521 56.23204
## [121] 47.47533 46.11392 47.70731 48.13440 50.05933 61.11877 46.13860 57.31428
## [129] 53.08975 47.07771 59.74097 57.87522 57.00373 54.67363 49.08733 57.14818
## [137] 61.33994 59.27809 44.54965 50.26683 53.69670 39.24712 50.08990 58.66370
## [145] 49.32837 56.70353 58.58771 50.00502 48.34257 48.43512 43.50465 46.16758
## [153] 57.79895 56.47026 50.03030 47.78775 49.61648 45.02696 41.07197 53.05751
## [161] 54.90566 63.27867 52.09123 52.85773 46.83583 52.81319 59.39679 45.40840
## [169] 65.74663 41.72370 50.24951 43.31985 49.92710 51.52254 49.24745 41.59235
## [177] 49.11411 43.36041 52.64004 51.22841 42.10901 55.01018 54.10995 50.54789
## [185] 43.63811 50.81823 53.48504 52.82502 51.42045 53.24236 41.44093 54.99539
## [193] 43.70826 43.57429 61.30309 48.84593 54.17084 57.50661 52.21210 42.70218
media.p <- mean(poblacion)
media.p
## [1] 50.47992
muestra1 <- sample(x = poblacion, size = 30, replace = FALSE)
muestra2 <- sample(x = poblacion, size = 30, replace = FALSE)
muestra3 <- sample(x = poblacion, size = 30, replace = FALSE)
muestra4 <- sample(x = poblacion, size = 30, replace = FALSE)
muestra5 <- sample(x = poblacion, size = 30, replace = FALSE)
muestra1
## [1] 57.31428 51.22841 41.59235 40.92416 53.05751 48.96267 45.58089 58.59294
## [9] 61.33994 55.79575 49.35069 42.04576 52.18342 50.73439 52.77268 56.47026
## [17] 61.11877 46.45402 48.08847 42.12748 54.62253 43.63811 57.79895 45.40840
## [25] 55.01018 54.10995 47.07771 52.70165 50.03030 41.67254
muestra2
## [1] 42.10901 42.04576 47.07771 54.46942 63.27867 40.92416 61.33994 46.55665
## [9] 45.58089 46.13860 55.98890 52.01003 59.15654 52.70165 52.18342 46.45402
## [17] 54.32658 47.88440 48.43512 51.07568 47.29048 57.02795 51.52254 52.81319
## [25] 51.71193 47.35792 49.11411 50.41740 54.99539 49.24745
muestra3
## [1] 57.07035 56.96860 61.07075 50.54789 58.12342 48.84593 53.08975 50.78281
## [9] 51.07568 53.69670 50.04597 52.95411 54.10995 48.89458 42.48290 49.32837
## [17] 43.46988 61.11877 52.80810 42.04576 48.13440 54.17131 53.24236 45.21887
## [25] 59.15654 42.27297 48.08847 51.22841 45.55350 48.43512
muestra4
## [1] 61.30309 49.92710 49.68410 48.80148 45.58089 48.08847 51.40959 42.12748
## [9] 51.35983 48.22392 54.62253 47.23346 56.18276 52.80810 49.60658 43.57429
## [17] 49.35069 56.47026 48.72877 57.79895 39.24712 37.71979 46.45402 51.57429
## [25] 39.18478 52.63142 51.07568 51.09333 47.61218 51.71193
muestra5
## [1] 52.01003 52.82502 52.09123 49.61648 54.17084 54.10995 57.42901 42.27297
## [9] 42.70218 39.18478 49.18087 61.07075 55.36126 53.08975 41.72370 42.12748
## [17] 51.65751 41.96666 46.13860 61.11877 46.83583 46.16758 57.50661 51.42045
## [25] 43.50465 59.31334 51.35983 46.55665 48.71100 44.54965
media1 <- mean(muestra1)
media2 <- mean(muestra2)
media3 <- mean(muestra3)
media4 <- mean(muestra4)
media5 <- mean(muestra5)
media1
## [1] 50.59351
media2
## [1] 50.70785
media3
## [1] 51.13441
media4
## [1] 49.3729
media5
## [1] 49.85911
media.de.medias <- mean(c(media1, media2, media3, media4, media5))
media.de.medias
## [1] 50.33355
Err.Std = sd(poblacion) / sqrt(n)
Err.Std
## [1] 0.3738938
El concepto de intervalo de confianza es el conjunto de valores que se forma a partir de una muestra de forma que exista la probabilidad de que el parámetro poblacional ocurra dentro de dicho conjunto con una probabilidad específica. La probabilidad específica se llama nivel de confianza. (lind2015?).
El intervalo de confianza es una técnica de estimación utilizada en inferencia estadística que permite acotar un par o varios pares de valores, dentro de los cuales se encontrará la estimación puntual buscada (con una determinada probabilidad).
Permite calcular dos valores alrededor de una media muestral (uno superior y otro inferior). Estos valores van a acotar un rango dentro del cual, con una determinada probabilidad, se va a localizar el parámetro poblacional. (Economipedia, n.d.).
library(cowplot) # Gráficos
library(ggplot2) # Gráfico
library(mosaic)
## Registered S3 method overwritten by 'mosaic':
## method from
## fortify.SpatialPolygonsDataFrame ggplot2
##
## The 'mosaic' package masks several functions from core packages in order to add
## additional features. The original behavior of these functions should not be affected by this.
##
## Attaching package: 'mosaic'
## The following objects are masked from 'package:dplyr':
##
## count, do, tally
## The following object is masked from 'package:Matrix':
##
## mean
## The following object is masked from 'package:ggplot2':
##
## stat
## The following object is masked from 'package:cowplot':
##
## theme_map
## The following objects are masked from 'package:stats':
##
## binom.test, cor, cor.test, cov, fivenum, IQR, median, prop.test,
## quantile, sd, t.test, var
## The following objects are masked from 'package:base':
##
## max, mean, min, prod, range, sample, sum
library(dplyr) # Para filter,select,arrange,mutate %>%..
source("https://raw.githubusercontent.com/rpizarrog/Trabajos-en-R-AD2021/main/funciones/funciones.para.distribuciones.r")
##
## Attaching package: 'gtools'
## The following object is masked from 'package:mosaic':
##
## logit
confianza = seq(0.90, 0.99, 0.01)
confianza
## [1] 0.90 0.91 0.92 0.93 0.94 0.95 0.96 0.97 0.98 0.99
alfa = 1 - confianza
alfa
## [1] 0.10 0.09 0.08 0.07 0.06 0.05 0.04 0.03 0.02 0.01
v.critico <- 1 - (alfa / 2)
v.critico
## [1] 0.950 0.955 0.960 0.965 0.970 0.975 0.980 0.985 0.990 0.995
z <- qnorm(v.critico)
z
## [1] 1.644854 1.695398 1.750686 1.811911 1.880794 1.959964 2.053749 2.170090
## [9] 2.326348 2.575829
tabla <- data.frame(confianza, alfa, v.critico, z)
tabla
## confianza alfa v.critico z
## 1 0.90 0.10 0.950 1.644854
## 2 0.91 0.09 0.955 1.695398
## 3 0.92 0.08 0.960 1.750686
## 4 0.93 0.07 0.965 1.811911
## 5 0.94 0.06 0.970 1.880794
## 6 0.95 0.05 0.975 1.959964
## 7 0.96 0.04 0.980 2.053749
## 8 0.97 0.03 0.985 2.170090
## 9 0.98 0.02 0.990 2.326348
## 10 0.99 0.01 0.995 2.575829
Se determina intervalos de confianza para cuando se tiene la media desconocida de una población pero se conoce su desviación estándar σσ, se conoce la media de la muestra x¯x¯ y el valor de nn (cantidad de elementos de la muestra) además de el valor de confianza solicitado.
Se ha obtenido una muestra de n=25n=25 alumnos de una Facultad para estimar la calificación media de los expedientes de los alumnos en la Facultad. Se sabe por otros cursos que la desviación típica de las puntuaciones en dicha Facultad es de σ=2.01σ=2.01 puntos. La media de la muestra fue de x¯=4.9x¯=4.9.
Se requiere determinar el intervalo de confianza al 90 %. y
Se necesita determinar el intervalo de confianza al 99 %.
Entonces y conforme a la fórmula del intervalo de confianza:
intervalo <- f.intervalo.confianza(media = 4.9, desv = 2.01, n = 25, confianza = 0.90)
intervalo
## [1] 4.2388 5.5612
La media de 4.9 debe estar entre 4.2388, 5.5612 al 90% de confianza
intervalo <- f.intervalo.confianza(media = 4.9, desv = 2.01, n = 25, confianza = 0.99)
intervalo
## [1] 3.8645 5.9355
La media de 4.9 debe estar entre 3.8645, 5.9355 al 99% de confianza
El intervalo que se se genera como intervalo de confianza significa que la media debe estar entre ese rango del límite inferior y superior para aceptar que está precisamente en ese nivel de confianza.
Economipedia. n.d. “Intervalo de Confianza.” https://economipedia.com/definiciones/intervalo-de-confianza.html.