Analisis comparativo: Galton original vs Galton Guanajuato

pairs.panels(Galton01)

La gráfica muestra que hay una correlación de 0.07 entre la estatura del padre y la estatura de la madre. La correlación entre la estatura del padre y la del hijo es de 0.28,mientras que la estatura de la madre y el hijo tiene una correlación de 0.20.

summary(cm)
##      Padre            Pcm             Mcm             Hcm       
##  Min.   :62.00   Min.   :157.5   Min.   :147.3   Min.   :142.2  
##  1st Qu.:68.00   1st Qu.:172.7   1st Qu.:160.0   1st Qu.:162.6  
##  Median :69.00   Median :175.3   Median :162.6   Median :168.9  
##  Mean   :69.24   Mean   :175.9   Mean   :162.8   Mean   :169.6  
##  3rd Qu.:71.00   3rd Qu.:180.3   3rd Qu.:166.4   3rd Qu.:177.0  
##  Max.   :78.50   Max.   :199.4   Max.   :179.1   Max.   :200.7

En centimetros la estatura promedio del padre es de 175 cm, la de lamadre 162 cm y la del hijo 169 cm.

hist(Galton_cm$Pcm,xlab = "Padre",ylab = "Frecuencia", main="Estatura del Padre en cm")
par(mfrow=c(1,3))
hist(Galton_cm$Pcm,xlab = "Padre",ylab = "Frecuencia", main="Estatura del Padre en cm")
hist(Galton_cm$Mcm,xlab = "Madre",ylab = "Frecuencia", main="Estatura de la Madre en cm")
hist(Galton_cm$Hcm,xlab = "Hijos",ylab = "Frecuencia", main="Estatura de los Hijos en cm")

A continucaión aparecen los siguientes histogramas para el padre, la madre y el hijo, respectivamente.

plot(Galton$Padre,Galton$Estatura, ylim = c(50,max(Galton$Estatura)),xlim = c(60,max(Galton$Padre)),xlab = "Padres",ylab = "Estatura de los hijos", type="p",pch=16)
abline(reg = lm(c),col="red",lwd =4)

plot(Galton$Madre,Galton$Estatura, ylim = c(50,max(Galton$Estatura)),xlim = c(60,max(Galton$Madre)),xlab = "Madre",ylab = "Estatura de los hijos", type="p",pch=16)
abline(reg = lm(c),col="red",lwd =4)

Como se aprecia en las gráficas la estatura del padre influye más en la estatura de los hijos.

Estatura de los hijos

La gráfica muestra la diferencia de estaturas entre hijos varones y mujeres.

inference(y = Estatura, x = Genero, data = Galton, statistic = "mean", type = "ci", 
          method = "theoretical", order = c("M","F"))
## Response variable: numerical, Explanatory variable: categorical (2 levels)
## n_M = 460, y_bar_M = 69.2261, s_M = 2.6408
## n_F = 430, y_bar_F = 64.1144, s_F = 2.3778
## 95% CI (M - F): (4.781 , 5.4424)

Entre la estatura de los hijos varones e hijas hay una diferencia entre 4.7 y 5.4 pulgadas.

ggplot(data=Galton,aes(x=Padre,y=Estatura,color=Genero, size=Estatura))+geom_point()+geom_smooth()+ggtitle("Estatura: Padre vs Hij@")
## Warning: Using `size` aesthetic for lines was deprecated in ggplot2 3.4.0.
## ℹ Please use `linewidth` instead.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.
## `geom_smooth()` using method = 'loess' and formula = 'y ~ x'
## Warning: The following aesthetics were dropped during statistical transformation: size
## ℹ This can happen when ggplot fails to infer the correct grouping structure in
##   the data.
## ℹ Did you forget to specify a `group` aesthetic or to convert a numerical
##   variable into a factor?

A partir de las 70 pulgadas la estatura de los padres influyen más en la estatura de las hijas.

ggplot(data=Galton,aes(x=Madre,y=Estatura,color=Genero, size=Estatura))+geom_point()+geom_smooth()+ggtitle("Estatura: Madre vs Hij@")
## `geom_smooth()` using method = 'loess' and formula = 'y ~ x'
## Warning: The following aesthetics were dropped during statistical transformation: size
## ℹ This can happen when ggplot fails to infer the correct grouping structure in
##   the data.
## ℹ Did you forget to specify a `group` aesthetic or to convert a numerical
##   variable into a factor?

A partir de la pulgada 64, la madre influye más en la estatura del hijo.

v<-ggplot(data=Galton, aes (x=Estatura,fill=Genero))+geom_histogram(binwidth = 1,color="black")
v+ggtitle("Histograma")

Este histograma representa las estaturas de los hijos varones e hijas.

Estaturas en familias de Guanajuato (Mayo 23)

pairs.panels(Galton02)

Para el caso de Guanajuato en contraste con los datos de Galton originales entre la estatura de el Padre y la Madre hay una correlación de 0.33, entre el Padre y el hijo 0.18 y entre la Madre y el hijo hay una correlación de 0.39.

plot(GaltonMayo23$Padre,GaltonMayo23$Estatura,ylim = c(0.8,max(GaltonMayo23$Estatura)),xlim = c(1.5,max(GaltonMayo23$Padre)),xlab = "Padres",ylab = "Estatura de los hijos", type="p",pch=16)
abline(reg = lm(c1),col="red",lwd =4)

plot(GaltonMayo23$Madre,GaltonMayo23$Estatura,ylim = c(0.8,max(GaltonMayo23$Estatura)),xlim = c(1.4,max(GaltonMayo23$Padre)),xlab = "Madres",ylab = "Estatura de los hijos", type="p",pch=16)
abline(reg = lm(d1),col="red",lwd =4)

A partir de las gráficas se puede apreciar que para el caso de GUanajuato, la Madre influye más en la estatura de los hijos que el Padre.

Conclusiones

En los datos del Galton original se concluye que el Padre es quien influye más en la estatura de los hijos, mientras que en el Galton Guanajuato se concluye que la Madre quien influye más en la estatura de los hijos. Otra conclusión es que a correlación que existe en el Galton original es de 0.07 y en el Galton de Guanajusto es de 0.33 respecto a los padres y madres, esto significa que ahora la estatura es un factor importante para que las personas decidan salir o no en el caso de Guanajuato.