Para los siguientes ejercicios se usará el siguiente conjunto de datos.

dir <- system.file(package = "dagdata")
filename <- file.path(dir,"extdata/mice_pheno.csv") 
datos <- read.csv(filename) %>% na.omit
poblacionControl <- datos$Bodyweight[datos$Sex == "F" & datos$Diet == 'chow']
length(poblacionControl) # [1] 225
poblacionTratamiento <-  datos$Bodyweight[datos$Sex == "F" & datos$Diet == 'hf']
length(poblacionTratamiento) # [1] 200

1

Utilice dplyr para crear un vector xm con el peso corporal de todos los machos en la dieta de control (chow). ¿Cuál es el promedio de esta población?

xm<-datos %>% filter(Sex == "M" & Diet == 'chow') %>% select(Bodyweight) %>% unlist
mean(xm) # [1] 30,96381

2

Ahora use el paquete rafalib y use la función popsd para calcular la desviación estándar de la población.

popsd(xm) # [1] 4,420501

3

Coloque la semilla en 1. Tome una muestra aleatoria X de tamaño 25 de x. ¿Cuál es el promedio y la desviación estándar de la muestra?

set.seed(1)
Xm<-sample(xm, 25)
mean(Xm) # [1] 30,5196
sd(Xm) # [1] 3,928546

4

Utilice dplyr para crear un vector y con el peso corporal de todos los machos con la dieta alta en grasas (hf). ¿Cuál es el promedio de esta población?

ym<-datos %>% filter(Sex == "M" & Diet == 'hf') %>% select(Bodyweight) %>% unlist
mean(ym) # [1] 34,84793

5

Ahora use el paquete rafalib y use la función popsd para calcular la desviación estándar de esta población.

popsd(ym) # [1] 5,574609

6

Coloque la semilla en 1. Tome una muestra aleatoria Y de tamaño 25 de y. ¿Cuál es el promedio y la desviación estándar de la muestra?

set.seed(1)
Ym<-sample(ym, 25)
mean(Ym) # [1] 35,8036
sd(Ym) # [1] 5,476176

7

¿Cuál es la diferencia en valor absoluto entre \(\mu_y - \mu_x\) y \(\bar{Y} - \bar{X}\)?

abs((mean(ym)-mean(xm))-(mean(Ym)-mean(Xm))) # [1] 1,399884

8

Repita lo anterior para las hembras. Asegúrese de establecer la semilla en 1 antes de cada llamada de muestra. ¿Cuál es la diferencia en valor absoluto entre \(\mu_y - \mu_x\) y \(\bar{Y} - \bar{X}\)?

xh<-datos %>% filter(Sex == "F" & Diet == 'chow') %>% select(Bodyweight) %>% unlist
mean(xh) # [1] 23,89338
popsd(xh) # [1] 3,416438
yh<-datos %>% filter(Sex == "F" & Diet == 'hf') %>% select(Bodyweight) %>% unlist
mean(yh) # [1] 26,2689
popsd(yh) # [1] 5,06987
set.seed(1)
Xh<-sample(xh, 25)
mean(Xh) # [1] 24,2528
sd(Xh) # [1] 3,878647
set.seed(1)
Yh<-sample(yh, 25)
mean(Yh) # [1] 28,3828
sd(Yh) # [1] 5,627544
abs((mean(yh)-mean(xh))-(mean(Yh)-mean(Xh))) # [1] 1,754483

9

Para las hembras, en el caso de los individuos con tratamiento \(y\) y \(Y\), nuestras estimaciones muestrales estuvieron más cerca de la diferencia poblacional que para los machos. ¿Cuál es una posible explicación para esto?

  1. La varianza de la población de las hembras es menor que la de los machos; por tanto, la variable muestral tiene menos variabilidad.
  2. Las estimaciones estadísticas son más precisas para las hembras
  3. El tamaño de la muestra fue mayor para las hembras
  4. El tamaño de la muestra fue menor para las hembras

10

Elabore los histogramas de las poblaciones de machos y hembras discriminando por control y tratamiento.

mypar(2,2) # Sirve igual par(mfrow=c(2,2))
hist(xm, main='Peso machos control', ylab = "Frencuencia", xlab = "Peso en gramos")
hist(ym, main='Peso machos tratamiento', ylab = "Frencuencia", xlab = "Peso en gramos")
hist(xh, main='Peso hembras control', ylab = "Frencuencia", xlab = "Peso en gramos")
hist(yh, main='Peso hembras tratamiento', ylab = "Frencuencia", xlab = "Peso en gramos")

Poblaciones y muestras Capítulo de inferencia Teorema del límite central