Resolución de Ejercicios 1-6.

Los ejercicios de 1 al 5 se resuelven con información contenida en la presentación y otros recursos.

Resolución ejercicio 6.

Instrucciones

  1. Indique si las siguientes afirmaciones son falsas o verdaderas.
  • El intervalo de confianza contiene una serie de valores que se confia en que contengan el verdadero parámetro poblacional.
  • Para calcular el intervalo de confianza es preciso calcular en la muestra el estimador apropiado y el error estándar.
  • Un intervalo de confianza al 95% se suele obtener al restar y sumar el error estándar multiplicado por 1.96.
  • Para calcular un intervalo de confianza al 90% se suele restar y sumar el error estándar multiplicado por 1.645

Respuesta

Todas las afirmaciones son ciertas para los intervalos de confianza.

Resolución de ejercicios 8-13

Ejercicio 8

Instrucciones

  1. El análisis de los gases de la sangre arterial practicado a 15 hombres adultos físicamente activos proporción los siguientes valores de Pa0 2 en reposo: 75,80,80,74,84,78,89,72,83,76,75,87,78,79,88. Calcule el intervalo de confianza de 95 por ciento para la media de la población.

Resolución

Dado que no conocemos los valores reales de la población, La estimación de la media se realiza con los datos de la muestra empleando la distribución t

El código en Res el siguiente:

Ejercicio8<-c(75,80,80,74,84,78,89,72,83,76,75,87,78,79,88)## Cree un obejto con los datos
mean(Ejercicio8)+qt(0.975,(length(Ejercicio8)-1))*
  (sd(Ejercicio8)/sqrt(length(Ejercicio8)))#IC alto. Se empleo el valor de 0.975 dado que el valor critico de Z que nos interesa es: Z alfa/2
## [1] 82.80347
mean(Ejercicio8)-qt(0.975,(length(Ejercicio8)-1))*
  (sd(Ejercicio8)/sqrt(length(Ejercicio8)))#IC bajo Se empleo el valor de 0.975 dado que el valor critico de Z que nos interesa es: Z alfa/2
## [1] 76.92986

Ejercicio 9

Instrucciones

  1. ¿Que proporción de pacientes asmáticos son alérgicos al polvo? En una muestra de 140 individuos, 35 por ciento tuvo reacciones positivas en la piel Construya un intervalo de confianza de 95 por ciento para la proporción de la población.

Resolución

Para este ejercicio se necesita la formula:

\(p-Z_{crit}* SE\) para el intervalo inferior

\(p+Z_{crit}* SE\) para el intervalo superior

\(SE= \sqrt{p(1-p)/n}\) para el error estándar

Del ejercicio se puede obtener que: \(p=0.35\), \(n=140\) e \(IC=95%\). Con estos datos se sustituye en las formulas. Primero empleamos la formula para \(SE= \sqrt{p(1-p)/n}\), sustituyendo nos queda: \(SE= \sqrt{0.35(1-0.35)/140}\) y obtenemos un valor para el SE de: 0.0403113. En R puede emplear el siguiente código:

sqrt(0.35*(1-0.35)/140)
## [1] 0.04031129

Ahora puede estimar los IC al 95% con el siguiente formula sustituida:

\(0.35-0.975* 0.04031129\) para el intervalo inferior

\(0.35+0.975* 0.04031129\) para el intervalo superior

En R puede emplear el siguiente código

0.35-0.975*sqrt(0.35*(1-0.35)/140)##Intervalo bajo
## [1] 0.3106965
0.35+0.975*sqrt(0.35*(1-0.35)/140)## Intervalo alto
## [1] 0.3893035

Es decir la proporción de pacientes asmáticos alérgicos al polvo es de 0.31 a 0.39 en la población con un 95% de confianza

Ejercicio 10

Instrucciones

  1. Se lleva cabo una encuesta de higiene industrial en un área metropolitana de gran tamaño. De 70 plantas manufactureras visitadas, 21 recibieron la calificación de “deficiente” que se refiere a la ausencia de medidas de seguridad. Construya un intervalo de confianza de 95 por ciento para la proporción de la población con una calificación de “deficiente”.

Resolución

Una vez que se estima la proporción de fábricas con calificación deficiente que es igual $ 21/70=0.3$ Se siguen los mismos paras que en el ejercicio 9. Quedando el código de Rde la siguiente manera:

0.30-0.975*sqrt(0.30*(1-0.30)/70)##Intervalo bajo
## [1] 0.2465971
0.30+0.975*sqrt(0.30*(1-0.30)/70)## Intervalo alto
## [1] 0.3534029

Es decir la proporción de fabricas con calificación deficiente es de0.26 a 0.34 en la población con un 95% de confianza

Ejercicio 11

Instrucciones

  1. ¿Cual es el nivel promedio de bilirrubina en e! suero de los pacientes internados en un hospital para el tratamiento de la hepatitis? Una muestra de 10 pacientes arrojó los siguientes resultados: 20.5,14.8,21.3, 12.7, 15.2 ,26.6 ,23.4 ,22.9 ,15.7, 19.2. Construya un intervalo de confianza de 95 por dentro para la media de la población.

Resolución

Este ejercicio es igual al ejercicio 8, es decir dados unos datos (nivel de bilirrubina) se debe estimar los intervalos de confianza para la media poblacional. Sin embargo, en el ejercicio no se indica datos de la media poblacional, ni de la varianza poblacional. Por ello se emplea la distribución t.

El código de Rqueda de la siguiente manera:

Ejercicio11<-c(20.5,14.8,21.3, 12.7, 15.2 ,26.6 ,23.4 ,22.9 ,15.7, 19.2)## Cree un obejto con los datos
mean(Ejercicio11)+qt(0.975,(length(Ejercicio11)-1))*
  (sd(Ejercicio11)/sqrt(length(Ejercicio11)))#IC alto. Se empleo el valor de 0.975 dado que el valor critico de Z que nos interesa es: Z alfa/2
## [1] 22.44726
mean(Ejercicio11)-qt(0.975,(length(Ejercicio11)-1))*
  (sd(Ejercicio11)/sqrt(length(Ejercicio11)))#IC bajo Se empleo el valor de 0.975 dado que el valor critico de Z que nos interesa es: Z alfa/2
## [1] 16.01274

Es decir los niveles de bilirrubina en la población están entre: 16.01 y 22.45 con un 95% de confianza.

Ejercicio 12

Instrucciones

  1. Suponemos que la distribución de probabilidad de la presión arterial, \(X\), es la distribución de \(N (\mu, \sigma^2)\). Supongamos que sabemos que \(\sigma = 6\). Para estimar \(\mu\), seleccionamos al azar a 9 personas y medimos su presión arterial. La media muestral es \(\bar{X}\) = 110.
  • Encuentre la estimación del intervalo de confianza del 80% para \(\mu\).

Resolución

En este ejercicio nos piden que calculemos los intervalos de confianza al 80% para una muestra de \(n=9\) cuya \(\bar{x}\) es de 110. además nos dicen que la población sigue un distribución normal de \(N (\mu, \sigma^2)\) y que se conoce la desviación estándar poblacional \(\sigma = 6\). Dados estos datos es posible emplear la distribución Z para calcular la media poblacional, ya que conocemos que sigue una distribución normal y que conocemos el valor se \(\sigma=6\)

Empleamos la siguiente formula:

\(\bar{x}-Z_{crit}* \sigma/\sqrt{n}\) para el intervalo inferior

\(\bar{x}+Z_{crit}* \sigma/\sqrt{n}\) para el intervalo superior

En seguida optemos el valor de Z para el 0.90% dado \(Z_{crit}= \alpha/2\). Con el siguiente código de R:

qnorm(0.90)
## [1] 1.281552

Sustituyendo por los datos del problema nos quedaría:

\(110-1.28* 6/\sqrt{9}\) para el intervalo inferior

\(110+1.28* 6/\sqrt{9}\) para el intervalo superior

Dando como resultado para IC superior 112.5631031 y 107.4368969 para el IC con un 95% de confianza. Es decir la media poblacional de la presión arterial se encuentra entre 112.5631031 y 107.4368969 con un 80% de confianza.

Puede emplear el siguiente código de R para calcularlo en un solo paso:

110+qnorm(0.9)*6/sqrt(9)#IC superior
## [1] 112.5631
110-qnorm(0.9)*6/sqrt(9)#IC inferior
## [1] 107.4369

Ejercicio 13

Instrucciones

  1. Para la pregunta anterior, suponga que no sabíamos \(\sigma\) y lo estimamos usando la desviación estándar de la muestra \(sd = 6\).
  • Encuentre el error estándar para la media muestral como el estimador de la media poblacional.
  • Encuentre la estimación del intervalo de confianza del 80% para μ basada en esta muestra.

Resolución

En este caso nos dice que se desconoce \(\sigma\) por lo que no es posible emplear la distribución \(Z\). En cambio ahora podemos emplear la distribución \(t\) y la \(sd\) que nos da el problema

la formula del error estándar es la que sigue:
\(SE=sd/\sqrt{n}\)

Obtenemos los datos del problema y sustituimos:

\(SE=6/\sqrt{9}\)

Obtenemos que el \(SE=\) 2

Para calcular el error estándar empleamos el siguiente código de R

6/sqrt(9)
## [1] 2

Ahora podemos estimar el intervalo de confianza empleando la distribución \(t\) con el siguiente código de Rigual al de los problemas 8 y 11.

110+qt(0.90,(9-1))*(6/sqrt(9))#IC alto. Se empleo el valor de 0.975 dado que el valor critico de Z que nos interesa es: Z alfa/2
## [1] 112.7936
110-qt(0.90,(9-1))*(6/sqrt(9))#IC bajo Se empleo el valor de 0.975 dado que el valor critico de Z que nos interesa es: Z alfa/2
## [1] 107.2064

Resolución de ejercicios 14-15

Ejercicio 14

Instrucciones

  1. Usando el conjunto de datos “BodyTemperature.txt”, que se encuentra en la carpeta de bases de datos, encuentre la estimación puntual y la estimación del intervalo de confianza del 80% para las medias poblacionales de frecuencia cardíaca y temperatura corporal normal.

Resolución

Exportar base de datos

Para exportar la base puede hacerlo desde Rstudio como se muestra en las imágenes siguientes:

Ir a la ruta donde tiene guardado el archivo haciendo clic en browse

Dado que es un archivo de texto separado por espacios, es decir, los espacios delimitan las columnas es necesario cambiar el delimitador por “white space” como lo muestra la imagen

también puede emplear el siguiente código de R

BodyTemperature <- read_table2("RUTA de archivo/BodyTemperature.txt")
Parsed with column specification:
cols(
  Gender = col_character(),
  Age = col_double(),
  HeartRate = col_double(),
  Temperature = col_double()
)
Revisar base de datos

Para revisar que la base de datos esté cargado correctamente lo podemos ver al momento de cargarla, ya que Rstudio despliega automáticamente la base de datos.

Pero también puede usar la función head()que muestra los primeros 5 resultados

## Parsed with column specification:
## cols(
##   Gender = col_character(),
##   Age = col_double(),
##   HeartRate = col_double(),
##   Temperature = col_double()
## )
head(BodyTemperature)
# A tibble: 6 x 4
  Gender   Age HeartRate Temperature
  <chr>  <dbl>     <dbl>       <dbl>
1 M         33        69        97  
2 M         32        72        98.8
3 M         42        68        96.2
4 F         33        75        97.8
5 F         26        68        98.8
6 M         37        79       101. 
Adjuntar base de datos

Para que R nos tome cada columna como un objeto es necesario usar la función attach()

attach(BodyTemperature)
Calcular los IC

Ahora podemos estimar los intervalos de confianza utilizando el siguiente código igual al de los problemas 8 y 11.

Para temperatura corporal
mean(Temperature)+qt(0.90,(length(Temperature)-1))*
  (sd(Temperature)/sqrt(length(Temperature)))#IC alto. Se empleo el valor de 0.975 dado que el valor critico de Z que nos interesa es: Z alfa/2
## [1] 98.45346
mean(Temperature)-qt(0.90,(length(Temperature)-1))*
  (sd(Temperature)/sqrt(length(Temperature)))#IC bajo Se empleo el valor de 0.975 dado que el valor critico de Z que nos interesa es: Z alfa/2
## [1] 98.20654
Para frecuencia cardíaca
mean(HeartRate)+qt(0.90,(length(HeartRate)-1))*
  (sd(HeartRate)/sqrt(length(HeartRate)))#IC alto. Se empleo el valor de 0.975 dado que el valor critico de Z que nos interesa es: Z alfa/2
## [1] 74.34545
mean(HeartRate)-qt(0.90,(length(HeartRate)-1))*
  (sd(HeartRate)/sqrt(length(HeartRate)))#IC bajo Se empleo el valor de 0.975 dado que el valor critico de Z que nos interesa es: Z alfa/2
## [1] 72.97455

Ejercicio 15

Instrucciones

  1. Utilizando la base de datos Archivo “Pima.tr.csv” que se encuentra en la carpeta de bases de datos, encuentre la estimación puntual y la estimación del intervalo de confianza del 80%, 90%, 95% y 99% para la variable glu, bmi y bp.

Resolución

Se resuelve igual al ejercicio 14