Este documento PDF es representativo del Primer Ejercicio P2P, perteneciente al curso MOOC AprendeR: Introducción al tratamiento de datos con R y RStudio, dictado por la Universidad de las Islas Baleares, España.
El desarrollo del ejercicio es el siguiente:
RESULTADOS <- read.csv("https://miriadax.net/documents/28098821/74010125/Halterofilia.csv/f2fb1ddc-6de0-4942-870e-fbe5e9d2eca8", sep=";")
## Peso Arrancada Dos.Tiempos Total Categoria Sexo
## 1 55.61 132 160 292 menos 56 M
## 2 55.64 127 161 288 menos 56 M
## 3 55.87 130 150 280 menos 56 M
## 4 55.73 123 150 273 menos 56 M
## 5 55.93 120 149 269 menos 56 M
## 6 55.87 127 140 267 menos 56 M
RESULTADOS$Categoria=ordered(RESULTADOS$Categoria, levels=c("menos 48","menos 53","menos 56","menos 58","menos 62","menos 63","menos 69","menos 75","mas 78","menos 77","menos 85","menos 94","menos 105","mas 105"))
## 'data.frame': 462 obs. of 6 variables:
## $ Peso : num 55.6 55.6 55.9 55.7 55.9 ...
## $ Arrancada : int 132 127 130 123 120 127 118 112 121 115 ...
## $ Dos.Tiempos: int 160 161 150 150 149 140 146 152 142 146 ...
## $ Total : int 292 288 280 273 269 267 264 264 263 261 ...
## $ Categoria : Ord.factor w/ 14 levels "menos 48"<"menos 53"<..: 3 3 3 3 3 3 3 3 3 3 ...
## $ Sexo : Factor w/ 2 levels "F","M": 2 2 2 2 2 2 2 2 2 2 ...
## Sexo Categoria Arrancada Dos.Tiempos
## 1 F menos 48 72.35714 91.78571
## 2 F menos 53 78.42308 99.46154
## 3 M menos 56 111.64516 137.48387
## 4 F menos 58 84.62069 106.68966
## 5 M menos 62 121.84375 149.25000
## 6 F menos 63 92.61538 116.00000
## 7 F menos 69 96.57143 120.03571
## 8 M menos 69 134.40000 164.33333
## 9 F menos 75 101.89655 124.62069
## 10 M menos 77 141.38889 172.83333
## 11 M menos 85 153.34286 187.11429
## 12 M menos 94 160.34146 195.97561
## 13 M menos 105 164.50000 200.28947
## 14 M mas 105 173.26667 212.03333
c)Extraer de Resultados dos dataframes: uno llamado ResM, con los datos de los hombres, y otro llamado ResF, con los datos de las mujeres. Ambos dataframes deben contener sólo dos columnas: “Peso” y “Total”.
ResF=RESULTADOS[RESULTADOS$Sexo=="F",c(1,4)]
## Peso Total
## 274 47.88 214
## 275 47.72 205
## 276 47.83 204
## 277 47.71 186
## 278 47.08 185
## 279 47.94 180
ResM=RESULTADOS[RESULTADOS$Sexo=="M",c(1,4)]
## Peso Total
## 1 55.61 292
## 2 55.64 288
## 3 55.87 280
## 4 55.73 273
## 5 55.93 269
## 6 55.87 267
d)Crear un gráfico a partir de ResM, con el peso corporal en el eje horizontal y el peso total levantado en el eje vertical. Tienes que usar triángulos vacíos de color rojo. Verás que la distribución de los puntos es bastante peculiar. Encuentra una razón para esta distribución.
Interpretación: La grafica muestra que al aumentar el peso corporal existe una relación directa al Peso Total Levantado por cada individuo, esta situación se manifiesta en el grupo de individuos con peso corporal entre 60[kg] y 100 [kg]
Interpretación: La grafica permite suponer que mujeres con un peso promedio de hasta 80 [kg] muestran una relación directa entre Peso Corporal y Peso Total Levantado.
e)Añadir al gráfico los puntos correspondientes a ResF. Tienes que usar cuadrados llenos de color verde. Añade una leyenda que indique cada tipo de punto qué sexo representa. Asegúrate de que todos los puntos están dentro de la gráfica y ninguno queda sin representar por haber quedado fuera de los límites. Es posible que tengas que redibujar todo usando valores adecuados de “xlim” e “ylim”.
f)Calcular la regresión lineal del peso levantado en función del peso corporal tanto para los hombres como para las mujeres. Indica en ambos casos cuánto peso levantan de media por cada Kg. adicional de peso corporal. Indica también los coeficientes de determinación.
Mujeres:
summary(lm(ResF$Total~ResF$Peso))
##
## Call:
## lm(formula = ResF$Total ~ ResF$Peso)
##
## Residuals:
## Min 1Q Median 3Q Max
## -88.804 -15.476 -1.079 17.350 76.988
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 103.0499 8.8061 11.70 <2e-16 ***
## ResF$Peso 1.5396 0.1314 11.72 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 28.46 on 187 degrees of freedom
## Multiple R-squared: 0.4233, Adjusted R-squared: 0.4202
## F-statistic: 137.3 on 1 and 187 DF, p-value: < 2.2e-16
Hombres:
summary(lm(ResM$Total~ResM$Peso))
##
## Call:
## lm(formula = ResM$Total ~ ResM$Peso)
##
## Residuals:
## Min 1Q Median 3Q Max
## -168.493 -20.913 4.294 24.289 66.750
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 177.48035 7.84172 22.63 <2e-16 ***
## ResM$Peso 1.72725 0.08866 19.48 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 34.89 on 271 degrees of freedom
## Multiple R-squared: 0.5834, Adjusted R-squared: 0.5819
## F-statistic: 379.5 on 1 and 271 DF, p-value: < 2.2e-16
Mujeres: 1.54
Hombres: 1.727
rF=summary(lm(ResF$Total~ResF$Peso))$r.squared
Mujeres:´summary(lm(ResF\(Total~ResF\)Peso))$r.squared`
## [1] 0.423298
rM=summary(lm(ResM$Total~ResM$Peso))$r.squared
Hombres:
## [1] 0.5834273
g)Añadir las dos rectas al gráfico anterior con los colores correspondientes.
plot(ResM,pch=24,col="red", main="Peso Corporal v/s Peso Total Levantado ",ylab="Peso Total Levantado",xlab="Peso Corporal",xlim=c(0,180),ylim=c(0,450))
points(ResF$Peso,ResF$Total,pch=22,col="green",bg="green")
legend ("bottomright",legend=c( "ResM","ResF"), pch = c(24,22) , col=c(" red ","green"))
abline(lm(ResF$Total~ResF$Peso),col="green")
abline(lm(ResM$Total~ResM$Peso),col="red")
text (130,280,labels =expression("R^2 = 0,4233"),pos=4,col="green")
text (0,200,labels =expression("R^2 = 0,5834"),pos=4,col="red")