Un investigador ha oido hablar del extraño país de Amazonia Boreal, donde las mujeres son grandes guerreras y los hombres cuidan a los niños, no pueden votar y se los considera propiedad de la esposa.
Amazonia Boreal es un pais aislado del resto por millas de hielo artico y por eso nadie ha podido visitarlo pero año a año envian deportistas a las olimpiadas de sus dos deportes nacionales, el nado sincronizado y el levantamiento de pesas
Un investigador teoriza que esta curiosa organizacion social se debe a una significativa ventaja fisica de las mujeres con respecto a los varones
Para ello decide estudiar a las delegaciones deportivas de “amazonicos borelicos” ya que es la unica muestra que encuentra a disposicion
Ya registra los datos y arma la siguiente base:
head(amazona_boreal,5)
## # A tibble: 5 x 6
## Sexo Peso Equipo `Tamaño del pie` `Numero de cal~` `Sol en sagita~`
## <fct> <dbl> <fct> <dbl> <dbl> <fct>
## 1 Masculino 72 equipo de ~ 7.07 24 Sagitario
## 2 Masculino 65 equipo de ~ 6.61 23 Sagitario
## 3 Masculino 68 equipo de ~ 6.76 23 Sagitario
## 4 Femenino 76 levantamie~ 7.74 27 Sagitario
## 5 Femenino 90 levantamie~ 8.99 31 Sagitario
str(amazona_boreal)
## tibble [51 x 6] (S3: tbl_df/tbl/data.frame)
## $ Sexo : Factor w/ 2 levels "Femenino","Masculino": 2 2 2 1 1 2 2 2 2 2 ...
## $ Peso : num [1:51] 72 65 68 76 90 69 70 65 66 65 ...
## $ Equipo : Factor w/ 2 levels "equipo de natacion",..: 1 1 1 2 2 1 1 1 1 1 ...
## $ Tamaño del pie : num [1:51] 7.07 6.61 6.76 7.74 8.99 6.95 6.94 6.45 6.47 6.59 ...
## $ Numero de calzado: num [1:51] 24 23 23 27 31 24 24 22 22 23 ...
## $ Sol en sagitario : Factor w/ 2 levels "Otro signo","Sagitario": 2 2 2 2 2 1 1 1 1 1 ...
Tambien hizo un par de gráficos para entender cada variable, veamos:
ggplot(amazona_boreal, aes(x=Sexo, y=Peso, fill=Equipo))+
geom_boxplot()+
ggtitle("Peso por sexo y equipo")
ggplot(amazona_boreal, aes(x=Sexo, fill=Equipo))+
geom_bar()+
ggtitle("Distribucion de los sexos por equipos")
Tambien testeo si se cumplia la normalidad de la variable peso
library("ggpubr")
# grafico de densidad
ggdensity(amazona_boreal$Peso, fill = "lightgray")+
ggtitle("Peso", "density plot")
# QQ plot
ggqqplot(amazona_boreal$Peso)+
ggtitle("Peso", "QQ Plot")
#Boxplot
boxplot(amazona_boreal$Peso)
Con todos estos datos la hipótesis de trabajo de nuestro investigador es que las amazonas borealas son mas pesadas que los amazonos borealos (el gentilicio puede variar)
Describa las variables, es decir el tipo de cada una de ellas
¿Qué piensa de la normalidad de la variable peso? Justifique
La hipotesis del investigador pouede escribirse en terminos de hipotesis nula como (marque la correcta):
Ho: Xpeso-amazona > Xpeso-amazono H1 Xpeso-amazona = Xpeso-amazono
H1: Xpeso-amazona > Xpeso-amazono Ho: Xpeso-amazona = Xpeso-amazono
Ho: Xpeso-amazona = Xpeso-amazono H1: Xpeso-amazona ‡ Xpeso-amazono
El investigador en funcion de su hipotesis realizo el siguiente test
t.test(amazona_boreal$Peso~amazona_boreal$Sexo)
##
## Welch Two Sample t-test
##
## data: amazona_boreal$Peso by amazona_boreal$Sexo
## t = 11.604, df = 32.477, p-value = 4.295e-13
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
## 10.69023 15.23900
## sample estimates:
## mean in group Femenino mean in group Masculino
## 81.08000 68.11538
¿Cual de estas hipótesis se testearon con esta prueba? (Seleccione la correcta:
Ho: Xpeso-amazona > Xpeso-amazono H1 Xpeso-amazona = Xpeso-amazono
H1: Xpeso-amazona > Xpeso-amazono Ho: Xpeso-amazona = Xpeso-amazono
Ho: Xpeso-amazona = Xpeso-amazono H1: Xpeso-amazona ‡ Xpeso-amazono
¿Como describiría los hallazgos del investigador?
El investigador interpreta sus resultados como: “Hay evidencia suficiente para decir que las amazonas son mucho mas grandes que sus compañeros amazonos, lo que justifica la aparicion de una sociedad matriarcal opresora sobre las masculinidades” ¿Está de acuerdo con la interpretación de los resultados? Fundamente -de al menos dos razones-
¿Que es un confusor? Es posible que exista alguno no tenido en cuenta en este modelo
Nuestro invetigador esta entusismadisimo, está describiendo una sociedad que cambiará para siempre la forma en que interpretamos el machismo, esta tambien entusiasmado de volver con el equipo olímpico y conseguirse una novia amazona boreala. Ha leido varias paginas de citas en Amazonia Boreal (estan aislados pero tienen internet) y le llama la atencion que muchas de las mujeres son sagitario. Mientras se prepara para su viaje se le ocurren nuevas hipotesis, ¿y si la dominancia femenina se debe a haber nacido bajo el sol en sagitario?, también vió durante los juegos que las amazonas portan unos pies que harían temblar de vergüenza a pie grande y piensa que puede ser un factor social determinante tambien.
Con todo esto en mente se le ocurre ver algunas correlaciones y pensar un modelo de regresion lineal
ggplot(amazona_boreal, aes(x=Peso, y=`Tamaño del pie`, color=Sexo))+
geom_point()
ggplot(amazona_boreal, aes(x=Peso, y=`Numero de calzado`, color=Sexo))+
geom_point()
cor.test(amazona_boreal$Peso, amazona_boreal$`Tamaño del pie`)
##
## Pearson's product-moment correlation
##
## data: amazona_boreal$Peso and amazona_boreal$`Tamaño del pie`
## t = 67.914, df = 49, p-value < 2.2e-16
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
## 0.9907391 0.9970038
## sample estimates:
## cor
## 0.9947301
cor.test(amazona_boreal$Peso, amazona_boreal$`Numero de calzado`)
##
## Pearson's product-moment correlation
##
## data: amazona_boreal$Peso and amazona_boreal$`Numero de calzado`
## t = 44.53, df = 49, p-value < 2.2e-16
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
## 0.9787376 0.9930927
## sample estimates:
## cor
## 0.9878691
cor.test(amazona_boreal$`Tamaño del pie`, amazona_boreal$`Numero de calzado`)
##
## Pearson's product-moment correlation
##
## data: amazona_boreal$`Tamaño del pie` and amazona_boreal$`Numero de calzado`
## t = 73.258, df = 49, p-value < 2.2e-16
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
## 0.9920298 0.9974225
## sample estimates:
## cor
## 0.9954658
¿Como interpretaría los graficos obtenidos? Escriba un pequeño parrafo para cada uno
¿Como interpretaría los resultados de las correlaciones? Escriba un pequeño parrafo para cada una
Envalentonado por los resultados nuestro investigador decide dar un paso mas alla e intentar un modelo de regresión lineal
a<-lm(Peso~Sexo+ Equipo+`Tamaño del pie`+`Numero de calzado`+ amazona_boreal$`Sol en sagitario`, data=amazona_boreal)
summary(a)
##
## Call:
## lm(formula = Peso ~ Sexo + Equipo + `Tamaño del pie` + `Numero de calzado` +
## amazona_boreal$`Sol en sagitario`, data = amazona_boreal)
##
## Residuals:
## Min 1Q Median 3Q Max
## -1.36653 -0.54036 0.02707 0.51411 1.32975
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 3.39526 2.27388 1.493 0.1424
## SexoMasculino -0.50409 0.60831 -0.829 0.4117
## Equipolevantamiento de pesas 0.02892 0.58255 0.050 0.9606
## `Tamaño del pie` 12.22144 1.51528 8.065 2.77e-10
## `Numero de calzado` -0.77496 0.42531 -1.822 0.0751
## amazona_boreal$`Sol en sagitario`Sagitario 0.25057 0.24635 1.017 0.3145
##
## (Intercept)
## SexoMasculino
## Equipolevantamiento de pesas
## `Tamaño del pie` ***
## `Numero de calzado` .
## amazona_boreal$`Sol en sagitario`Sagitario
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.7785 on 45 degrees of freedom
## Multiple R-squared: 0.9906, Adjusted R-squared: 0.9896
## F-statistic: 948.3 on 5 and 45 DF, p-value: < 2.2e-16
¿Como interpretaría estos resulatdos?
¿Cual es la variable dependeinte?
Escriba la formula que esta regresion lineal
Interprete el elfecto de los coeficientes como si hiciera un reporte
¿Es un buen modelo de regresion? Fundamente
¿Sigue pensando con el investigador que las mujeres son mas pesadas que los hombres? ¿Por qué?