Los ejercicios de 1 al 5 se resuelven con información contenida en la presentación y otros recursos.
Todas las afirmaciones son ciertas para los intervalos de confianza.
Dado que no conocemos los valores reales de la población, La estimación de la media se realiza con los datos de la muestra empleando la distribución t
El código en Res el siguiente:
Ejercicio8<-c(75,80,80,74,84,78,89,72,83,76,75,87,78,79,88)## Cree un obejto con los datos
mean(Ejercicio8)+qt(0.975,(length(Ejercicio8)-1))*
(sd(Ejercicio8)/sqrt(length(Ejercicio8)))#IC alto. Se empleo el valor de 0.975 dado que el valor critico de Z que nos interesa es: Z alfa/2
## [1] 82.80347
mean(Ejercicio8)-qt(0.975,(length(Ejercicio8)-1))*
(sd(Ejercicio8)/sqrt(length(Ejercicio8)))#IC bajo Se empleo el valor de 0.975 dado que el valor critico de Z que nos interesa es: Z alfa/2
## [1] 76.92986
Para este ejercicio se necesita la formula:
\(p-Z_{crit}* SE\) para el intervalo inferior
\(p+Z_{crit}* SE\) para el intervalo superior
\(SE= \sqrt{p(1-p)/n}\) para el error estándar
Del ejercicio se puede obtener que: \(p=0.35\), \(n=140\) e \(IC=95%\). Con estos datos se sustituye en las formulas. Primero empleamos la formula para \(SE= \sqrt{p(1-p)/n}\), sustituyendo nos queda: \(SE= \sqrt{0.35(1-0.35)/140}\) y obtenemos un valor para el SE de: 0.0403113. En R puede emplear el siguiente código:
sqrt(0.35*(1-0.35)/140)
## [1] 0.04031129
Ahora puede estimar los IC al 95% con el siguiente formula sustituida:
\(0.35-0.975* 0.04031129\) para el intervalo inferior
\(0.35+0.975* 0.04031129\) para el intervalo superior
En R puede emplear el siguiente código
0.35-0.975*sqrt(0.35*(1-0.35)/140)##Intervalo bajo
## [1] 0.3106965
0.35+0.975*sqrt(0.35*(1-0.35)/140)## Intervalo alto
## [1] 0.3893035
Es decir la proporción de pacientes asmáticos alérgicos al polvo es de 0.31 a 0.39 en la población con un 95% de confianza
Una vez que se estima la proporción de fábricas con calificación deficiente que es igual $ 21/70=0.3$ Se siguen los mismos paras que en el ejercicio 9. Quedando el código de Rde la siguiente manera:
0.30-0.975*sqrt(0.30*(1-0.30)/70)##Intervalo bajo
## [1] 0.2465971
0.30+0.975*sqrt(0.30*(1-0.30)/70)## Intervalo alto
## [1] 0.3534029
Es decir la proporción de fabricas con calificación deficiente es de0.26 a 0.34 en la población con un 95% de confianza
Este ejercicio es igual al ejercicio 8, es decir dados unos datos (nivel de bilirrubina) se debe estimar los intervalos de confianza para la media poblacional. Sin embargo, en el ejercicio no se indica datos de la media poblacional, ni de la varianza poblacional. Por ello se emplea la distribución t.
El código de Rqueda de la siguiente manera:
Ejercicio11<-c(20.5,14.8,21.3, 12.7, 15.2 ,26.6 ,23.4 ,22.9 ,15.7, 19.2)## Cree un obejto con los datos
mean(Ejercicio11)+qt(0.975,(length(Ejercicio11)-1))*
(sd(Ejercicio11)/sqrt(length(Ejercicio11)))#IC alto. Se empleo el valor de 0.975 dado que el valor critico de Z que nos interesa es: Z alfa/2
## [1] 22.44726
mean(Ejercicio11)-qt(0.975,(length(Ejercicio11)-1))*
(sd(Ejercicio11)/sqrt(length(Ejercicio11)))#IC bajo Se empleo el valor de 0.975 dado que el valor critico de Z que nos interesa es: Z alfa/2
## [1] 16.01274
Es decir los niveles de bilirrubina en la población están entre: 16.01 y 22.45 con un 95% de confianza.
En este ejercicio nos piden que calculemos los intervalos de confianza al 80% para una muestra de \(n=9\) cuya \(\bar{x}\) es de 110. además nos dicen que la población sigue un distribución normal de \(N (\mu, \sigma^2)\) y que se conoce la desviación estándar poblacional \(\sigma = 6\). Dados estos datos es posible emplear la distribución Z para calcular la media poblacional, ya que conocemos que sigue una distribución normal y que conocemos el valor se \(\sigma=6\)
\(\bar{x}-Z_{crit}* \sigma/\sqrt{n}\) para el intervalo inferior
\(\bar{x}+Z_{crit}* \sigma/\sqrt{n}\) para el intervalo superior
En seguida optemos el valor de Z para el 0.90% dado \(Z_{crit}= \alpha/2\). Con el siguiente código de R:
qnorm(0.90)
## [1] 1.281552
Sustituyendo por los datos del problema nos quedaría:
\(110-1.28* 6/\sqrt{9}\) para el intervalo inferior
\(110+1.28* 6/\sqrt{9}\) para el intervalo superior
Dando como resultado para IC superior 112.5631031 y 107.4368969 para el IC con un 95% de confianza. Es decir la media poblacional de la presión arterial se encuentra entre 112.5631031 y 107.4368969 con un 80% de confianza.
Puede emplear el siguiente código de R para calcularlo en un solo paso:
110+qnorm(0.9)*6/sqrt(9)#IC superior
## [1] 112.5631
110-qnorm(0.9)*6/sqrt(9)#IC inferior
## [1] 107.4369
En este caso nos dice que se desconoce \(\sigma\) por lo que no es posible emplear la distribución \(Z\). En cambio ahora podemos emplear la distribución \(t\) y la \(sd\) que nos da el problema
la formula del error estándar es la que sigue:Obtenemos los datos del problema y sustituimos:
Obtenemos que el \(SE=\) 2
Para calcular el error estándar empleamos el siguiente código de R
6/sqrt(9)
## [1] 2
Ahora podemos estimar el intervalo de confianza empleando la distribución \(t\) con el siguiente código de Rigual al de los problemas 8 y 11.
110+qt(0.90,(9-1))*(6/sqrt(9))#IC alto. Se empleo el valor de 0.975 dado que el valor critico de Z que nos interesa es: Z alfa/2
## [1] 112.7936
110-qt(0.90,(9-1))*(6/sqrt(9))#IC bajo Se empleo el valor de 0.975 dado que el valor critico de Z que nos interesa es: Z alfa/2
## [1] 107.2064
Para exportar la base puede hacerlo desde Rstudio como se muestra en las imágenes siguientes:
Ir a la ruta donde tiene guardado el archivo haciendo clic en browse
Dado que es un archivo de texto separado por espacios, es decir, los espacios delimitan las columnas es necesario cambiar el delimitador por “white space” como lo muestra la imagen
también puede emplear el siguiente código de
R
BodyTemperature <- read_table2("RUTA de archivo/BodyTemperature.txt")
Parsed with column specification:
cols(
Gender = col_character(),
Age = col_double(),
HeartRate = col_double(),
Temperature = col_double()
)
Para revisar que la base de datos esté cargado correctamente lo podemos ver al momento de cargarla, ya que Rstudio despliega automáticamente la base de datos.
Pero también puede usar la función head()que muestra los primeros 5 resultados
## Parsed with column specification:
## cols(
## Gender = col_character(),
## Age = col_double(),
## HeartRate = col_double(),
## Temperature = col_double()
## )
head(BodyTemperature)
# A tibble: 6 x 4
Gender Age HeartRate Temperature
<chr> <dbl> <dbl> <dbl>
1 M 33 69 97
2 M 32 72 98.8
3 M 42 68 96.2
4 F 33 75 97.8
5 F 26 68 98.8
6 M 37 79 101.
Para que R nos tome cada columna como un objeto es necesario usar la función attach()
attach(BodyTemperature)
Ahora podemos estimar los intervalos de confianza utilizando el siguiente código igual al de los problemas 8 y 11.
mean(Temperature)+qt(0.90,(length(Temperature)-1))*
(sd(Temperature)/sqrt(length(Temperature)))#IC alto. Se empleo el valor de 0.975 dado que el valor critico de Z que nos interesa es: Z alfa/2
## [1] 98.45346
mean(Temperature)-qt(0.90,(length(Temperature)-1))*
(sd(Temperature)/sqrt(length(Temperature)))#IC bajo Se empleo el valor de 0.975 dado que el valor critico de Z que nos interesa es: Z alfa/2
## [1] 98.20654
mean(HeartRate)+qt(0.90,(length(HeartRate)-1))*
(sd(HeartRate)/sqrt(length(HeartRate)))#IC alto. Se empleo el valor de 0.975 dado que el valor critico de Z que nos interesa es: Z alfa/2
## [1] 74.34545
mean(HeartRate)-qt(0.90,(length(HeartRate)-1))*
(sd(HeartRate)/sqrt(length(HeartRate)))#IC bajo Se empleo el valor de 0.975 dado que el valor critico de Z que nos interesa es: Z alfa/2
## [1] 72.97455
Se resuelve igual al ejercicio 14