Para los siguientes ejercicios se usará el siguiente conjunto de datos.
dir <- system.file(package = "dagdata")
filename <- file.path(dir,"extdata/mice_pheno.csv")
datos <- read.csv(filename) %>% na.omit
poblacionControl <- datos$Bodyweight[datos$Sex == "F" & datos$Diet == 'chow']
length(poblacionControl) # [1] 225
poblacionTratamiento <- datos$Bodyweight[datos$Sex == "F" & datos$Diet == 'hf']
length(poblacionTratamiento) # [1] 200
Utilice dplyr para crear un vector xm con el peso corporal de todos los machos en la dieta de control (chow). ¿Cuál es el promedio de esta población?
xm<-datos %>% filter(Sex == "M" & Diet == 'chow') %>% select(Bodyweight) %>% unlist
mean(xm) # [1] 30,96381
Ahora use el paquete rafalib y use la función popsd para calcular la desviación estándar de la población.
popsd(xm) # [1] 4,420501
Coloque la semilla en 1. Tome una muestra aleatoria X de tamaño 25 de x. ¿Cuál es el promedio y la desviación estándar de la muestra?
set.seed(1)
Xm<-sample(xm, 25)
mean(Xm) # [1] 30,5196
sd(Xm) # [1] 3,928546
Utilice dplyr para crear un vector y con el peso corporal de todos los machos con la dieta alta en grasas (hf). ¿Cuál es el promedio de esta población?
ym<-datos %>% filter(Sex == "M" & Diet == 'hf') %>% select(Bodyweight) %>% unlist
mean(ym) # [1] 34,84793
Ahora use el paquete rafalib y use la función popsd para calcular la desviación estándar de esta población.
popsd(ym) # [1] 5,574609
Coloque la semilla en 1. Tome una muestra aleatoria Y de tamaño 25 de y. ¿Cuál es el promedio y la desviación estándar de la muestra?
set.seed(1)
Ym<-sample(ym, 25)
mean(Ym) # [1] 35,8036
sd(Ym) # [1] 5,476176
¿Cuál es la diferencia en valor absoluto entre \(\mu_y - \mu_x\) y \(\bar{Y} - \bar{X}\)?
abs((mean(ym)-mean(xm))-(mean(Ym)-mean(Xm))) # [1] 1,399884
Repita lo anterior para las hembras. Asegúrese de establecer la semilla en 1 antes de cada llamada de muestra. ¿Cuál es la diferencia en valor absoluto entre \(\mu_y - \mu_x\) y \(\bar{Y} - \bar{X}\)?
xh<-datos %>% filter(Sex == "F" & Diet == 'chow') %>% select(Bodyweight) %>% unlist
mean(xh) # [1] 23,89338
popsd(xh) # [1] 3,416438
yh<-datos %>% filter(Sex == "F" & Diet == 'hf') %>% select(Bodyweight) %>% unlist
mean(yh) # [1] 26,2689
popsd(yh) # [1] 5,06987
set.seed(1)
Xh<-sample(xh, 25)
mean(Xh) # [1] 24,2528
sd(Xh) # [1] 3,878647
set.seed(1)
Yh<-sample(yh, 25)
mean(Yh) # [1] 28,3828
sd(Yh) # [1] 5,627544
abs((mean(yh)-mean(xh))-(mean(Yh)-mean(Xh))) # [1] 1,754483
Para las hembras, en el caso de los individuos con tratamiento \(y\) y \(Y\), nuestras estimaciones muestrales estuvieron más cerca de la diferencia poblacional que para los machos. ¿Cuál es una posible explicación para esto?
Elabore los histogramas de las poblaciones de machos y hembras discriminando por control y tratamiento.
mypar(2,2) # Sirve igual par(mfrow=c(2,2))
hist(xm, main='Peso machos control', ylab = "Frencuencia", xlab = "Peso en gramos")
hist(ym, main='Peso machos tratamiento', ylab = "Frencuencia", xlab = "Peso en gramos")
hist(xh, main='Peso hembras control', ylab = "Frencuencia", xlab = "Peso en gramos")
hist(yh, main='Peso hembras tratamiento', ylab = "Frencuencia", xlab = "Peso en gramos")
| Poblaciones y muestras | Capítulo de inferencia | Teorema del límite central |