Identificar e interpretar intervalos de confianza con distribuciones normales Z.
Se presentan diversos ejercicios con los que se requiere inicializar variables para determinar valores de Z con los cuales se estima intervalos de confianza.
Se interpretar intervalo de confianza
El concepto de error muestral se define como la diferencia que existe de el valor de la media de varias medias en relación con la media poblacional.
Ejemplo se crea una población de 200 valores y bajo la distribución normal, se identifica la media poblacional con μ=50 y σ=5
n = 200
poblacion <- rnorm(n = n, mean = 50, sd = 5)
poblacion
## [1] 48.24345 55.86338 43.56179 57.47417 55.84875 51.30999 58.59689 51.85257
## [9] 45.11454 57.31802 58.05161 51.25888 60.76245 53.32064 55.23239 55.20228
## [17] 51.49629 50.97610 49.88418 60.33191 47.95868 54.83951 50.50700 46.20706
## [25] 54.33021 50.01079 49.68535 48.02390 56.72972 47.73175 52.71331 51.10437
## [33] 53.26651 56.01924 51.86289 48.41263 49.27829 51.39219 55.15367 53.26475
## [41] 46.94174 55.70575 54.10079 54.29976 54.97838 49.39032 46.07418 40.28804
## [49] 38.91688 54.65784 52.42103 55.49205 51.03823 53.20678 51.04038 51.01524
## [57] 42.33808 53.17970 56.13930 54.60352 53.97773 51.57844 48.37025 55.81360
## [65] 48.55629 51.02026 51.78678 48.95803 49.57861 49.55460 46.76756 41.02659
## [73] 43.99137 56.68177 53.85759 41.41401 46.99472 58.10753 57.37770 49.49416
## [81] 64.83922 54.71695 56.39288 45.31603 51.38310 46.27935 58.27851 52.83736
## [89] 50.11449 45.37159 53.11616 58.46683 46.89551 57.24726 49.32679 52.58778
## [97] 47.08232 51.79980 50.95051 61.09470 51.68569 54.73921 53.38099 44.33756
## [105] 46.48581 43.22112 58.41267 57.90478 49.29584 53.04669 49.24238 55.91017
## [113] 52.01706 43.50115 51.72198 56.83937 50.16529 48.59892 54.65333 42.77525
## [121] 52.45601 52.34621 44.00750 43.29136 48.33402 47.89359 50.83645 48.71481
## [129] 48.73393 55.36051 55.56920 51.83526 47.30857 55.28179 42.36479 55.69228
## [137] 50.41626 45.17873 48.44917 42.33293 56.19428 54.58129 51.49940 52.97063
## [145] 51.32323 49.22588 49.16039 52.92048 49.15864 53.27654 63.57294 41.21613
## [153] 52.30877 51.87376 45.32200 50.80258 48.83120 47.25013 51.88735 61.45157
## [161] 56.60625 50.43196 48.72168 41.59399 39.04784 57.97225 55.20097 47.32479
## [169] 37.70613 56.02727 53.67197 40.98716 53.40825 49.28655 49.37022 46.29829
## [177] 52.17700 42.70973 48.13227 54.42532 56.02416 51.58383 52.54692 40.46335
## [185] 54.55534 48.88451 44.85694 51.99897 47.03509 44.67440 53.19401 50.74559
## [193] 58.77323 53.69231 49.34120 51.64224 49.88909 54.05352 47.04442 51.40974
media.p <- mean(poblacion)
media.p
## [1] 51.0385
muestra1 <- sample(x = poblacion, size = 30, replace = FALSE)
muestra2 <- sample(x = poblacion, size = 30, replace = FALSE)
muestra3 <- sample(x = poblacion, size = 30, replace = FALSE)
muestra4 <- sample(x = poblacion, size = 30, replace = FALSE)
muestra5 <- sample(x = poblacion, size = 30, replace = FALSE)
muestra1
## [1] 45.11454 56.02416 51.02026 39.04784 43.50115 61.09470 53.85759 50.01079
## [9] 51.68569 53.04669 55.91017 53.20678 51.40974 49.49416 46.76756 44.85694
## [17] 51.49940 48.02390 64.83922 51.04038 54.33021 56.83937 56.39288 51.57844
## [25] 54.10079 53.38099 57.90478 45.32200 54.83951 50.74559
muestra2
## [1] 54.33021 39.04784 53.26651 60.76245 57.31802 50.83645 54.58129 49.39032
## [9] 61.45157 60.33191 44.67440 41.02659 41.41401 58.59689 49.24238 56.72972
## [17] 50.74559 46.99472 47.04442 47.25013 42.77525 49.49416 56.02727 50.43196
## [25] 51.86289 54.83951 58.41267 45.32200 51.87376 49.68535
muestra3
## [1] 49.39032 47.95868 52.45601 52.97063 45.31603 54.73921 56.13930 52.58778
## [9] 50.41626 51.04038 54.33021 48.88451 54.42532 48.55629 45.17873 49.37022
## [17] 58.05161 60.76245 51.99897 51.86289 55.28179 50.16529 49.28655 43.22112
## [25] 51.58383 58.77323 47.08232 46.89551 46.76756 45.32200
muestra4
## [1] 48.59892 58.41267 42.70973 47.73175 56.13930 51.57844 54.60352 55.15367
## [9] 56.60625 55.36051 49.32679 53.69231 47.08232 43.56179 61.45157 47.89359
## [17] 55.28179 43.29136 49.55460 51.64224 45.37159 51.68569 51.79980 49.39032
## [25] 51.32323 40.28804 55.69228 57.47417 49.24238 46.27935
muestra5
## [1] 51.99897 41.59399 54.83951 40.28804 57.24726 51.88735 61.45157 51.32323
## [9] 44.33756 37.70613 54.33021 52.58778 45.11454 49.49416 51.30999 54.71695
## [17] 56.13930 49.24238 47.25013 52.45601 51.64224 60.33191 53.04669 56.19428
## [25] 51.86289 48.37025 51.04038 57.90478 50.50700 64.83922
media1 <- mean(muestra1)
media2 <- mean(muestra2)
media3 <- mean(muestra3)
media4 <- mean(muestra4)
media5 <- mean(muestra5)
media1
## [1] 51.89621
media2
## [1] 51.19201
media3
## [1] 51.02717
media4
## [1] 50.94067
media5
## [1] 51.70182
media.de.medias <- mean(c(media1, media2, media3, media4, media5))
media.de.medias
## [1] 51.35157
Err.Std = sd(poblacion) / sqrt(n)
Err.Std
## [1] 0.3487552
El concepto de intervalo de confianza es el conjunto de valores que se forma a partir de una muestra de forma que exista la probabilidad de que el parámetro poblacional ocurra dentro de dicho conjunto con una probabilidad específica. La probabilidad específica se llama nivel de confianza. (lind2015?).
El intervalo de confianza es una técnica de estimación utilizada en inferencia estadística que permite acotar un par o varios pares de valores, dentro de los cuales se encontrará la estimación puntual buscada (con una determinada probabilidad).
Permite calcular dos valores alrededor de una media muestral (uno superior y otro inferior). Estos valores van a acotar un rango dentro del cual, con una determinada probabilidad, se va a localizar el parámetro poblacional. (Economipedia, n.d.).
library(cowplot) # Gráficos
library(ggplot2) # Gráfico
library(mosaic)
## Registered S3 method overwritten by 'mosaic':
## method from
## fortify.SpatialPolygonsDataFrame ggplot2
##
## The 'mosaic' package masks several functions from core packages in order to add
## additional features. The original behavior of these functions should not be affected by this.
##
## Attaching package: 'mosaic'
## The following objects are masked from 'package:dplyr':
##
## count, do, tally
## The following object is masked from 'package:Matrix':
##
## mean
## The following object is masked from 'package:ggplot2':
##
## stat
## The following object is masked from 'package:cowplot':
##
## theme_map
## The following objects are masked from 'package:stats':
##
## binom.test, cor, cor.test, cov, fivenum, IQR, median, prop.test,
## quantile, sd, t.test, var
## The following objects are masked from 'package:base':
##
## max, mean, min, prod, range, sample, sum
library(dplyr) # Para filter,select,arrange,mutate %>%..
source("https://raw.githubusercontent.com/rpizarrog/Trabajos-en-R-AD2021/main/funciones/funciones.para.distribuciones.r")
##
## Attaching package: 'gtools'
## The following object is masked from 'package:mosaic':
##
## logit
confianza = seq(0.90, 0.99, 0.01)
confianza
## [1] 0.90 0.91 0.92 0.93 0.94 0.95 0.96 0.97 0.98 0.99
alfa = 1 - confianza
alfa
## [1] 0.10 0.09 0.08 0.07 0.06 0.05 0.04 0.03 0.02 0.01
v.critico <- 1 - (alfa / 2)
v.critico
## [1] 0.950 0.955 0.960 0.965 0.970 0.975 0.980 0.985 0.990 0.995
z <- qnorm(v.critico)
z
## [1] 1.644854 1.695398 1.750686 1.811911 1.880794 1.959964 2.053749 2.170090
## [9] 2.326348 2.575829
tabla <- data.frame(confianza, alfa, v.critico, z)
tabla
## confianza alfa v.critico z
## 1 0.90 0.10 0.950 1.644854
## 2 0.91 0.09 0.955 1.695398
## 3 0.92 0.08 0.960 1.750686
## 4 0.93 0.07 0.965 1.811911
## 5 0.94 0.06 0.970 1.880794
## 6 0.95 0.05 0.975 1.959964
## 7 0.96 0.04 0.980 2.053749
## 8 0.97 0.03 0.985 2.170090
## 9 0.98 0.02 0.990 2.326348
## 10 0.99 0.01 0.995 2.575829
Se determina intervalos de confianza para cuando se tiene la media desconocida de una población pero se conoce su desviación estándar σσ, se conoce la media de la muestra x¯x¯ y el valor de nn (cantidad de elementos de la muestra) además de el valor de confianza solicitado.
Se ha obtenido una muestra de n=25n=25 alumnos de una Facultad para estimar la calificación media de los expedientes de los alumnos en la Facultad. Se sabe por otros cursos que la desviación típica de las puntuaciones en dicha Facultad es de σ=2.01σ=2.01 puntos. La media de la muestra fue de x¯=4.9x¯=4.9.
Se requiere determinar el intervalo de confianza al 90 %. y
Se necesita determinar el intervalo de confianza al 99 %.
Entonces y conforme a la fórmula del intervalo de confianza:
intervalo <- f.intervalo.confianza(media = 4.9, desv = 2.01, n = 25, confianza = 0.90)
intervalo
## [1] 4.2388 5.5612
La media de 4.9 debe estar entre 4.2388, 5.5612 al 90% de confianza
intervalo <- f.intervalo.confianza(media = 4.9, desv = 2.01, n = 25, confianza = 0.99)
intervalo
## [1] 3.8645 5.9355
La media de 4.9 debe estar entre 3.8645, 5.9355 al 99% de confianza
El intervalo que se se genera como intervalo de confianza significa que la media debe estar entre ese rango del límite inferior y superior para aceptar que está precisamente en ese nivel de confianza.
Economipedia. n.d. “Intervalo de Confianza.” https://economipedia.com/definiciones/intervalo-de-confianza.html.