Regresion lineal simple
Importar
Analisis de correlación
- Matriz de diagramas de dispercion
A continuacion se hara una cuantificacion del grado de relacion lineal, por medio de la matriz de coeficientes de correlacion
## peso edad grasas
## peso 1.0000000 0.2400133 0.2652935
## edad 0.2400133 1.0000000 0.8373534
## grasas 0.2652935 0.8373534 1.0000000
Se puede observar que a medida que la edad de una persona aumenta el contenido de grasas el cuerpo con indice de relacion en 83% Esto explicado con un coeficiente de 0.8373534
Recta de minimos cuadrados
##
## Call:
## lm(formula = grasas ~ edad, data = grasas)
##
## Residuals:
## Min 1Q Median 3Q Max
## -63.478 -26.816 -3.854 28.315 90.881
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 102.5751 29.6376 3.461 0.00212 **
## edad 5.3207 0.7243 7.346 1.79e-07 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 43.46 on 23 degrees of freedom
## Multiple R-squared: 0.7012, Adjusted R-squared: 0.6882
## F-statistic: 53.96 on 1 and 23 DF, p-value: 1.794e-07
Con base a lo estimado en el; analisis de regresion lineal, obtenemos la ecuacion de la recta de minimos cuadrados.
\[y=102.5751+ 5.3207x\] ### Graficas de la recta de minimos cuadrados
### modelacion (Calculo) de predicciones
## 1 2 3 4 5 6 7 8
## 262.1954 267.5161 272.8368 278.1575 283.4781 288.7988 294.1195 299.4402
## 9 10 11 12 13 14 15 16
## 304.7608 310.0815 315.4022 320.7229 326.0435 331.3642 336.6849 342.0056
## 17 18 19 20 21
## 347.3263 352.6469 357.9676 363.2883 368.6090
Inferencia en el modelo de regresion simple
- Suponemos ahora que los datos proceden de un modelo de regresión simple, de la forma:
\[y_i = \beta_0 + \beta_1 x_i + \epsilon_i, \ \ \ \ i=1,\ldots,n,\] Donde : * Los errores aleatorios \(\epsilon_i\) son independientes con distribucion normal 0 y varianza \(\sigma^2\)
- Los errores estandar de los estimadores de los parametros \(\beta_0 y \beta_1\) se encuentran en la columna std error serían 29.6376 y 0.7243
Cálculo del nivel de confianza
- Intervalo de confianza para el 95% de los datos
## 2.5 % 97.5 %
## (Intercept) 41.265155 163.885130
## edad 3.822367 6.818986
- Intervalo de confianza para el 90% de los datos
## 5 % 95 %
## (Intercept) 51.780153 153.370132
## edad 4.079335 6.562018
Representacion grafica de los intervalos de confianza
nuevas.edades <- data.frame(edad=seq(30,50))
# Grafico de dispercion y recta
plot(grasas$edad, grasas$grasas, xlab = "Edad", ylab="Grasas")
abline(regresion)
# Intervalos de confianza de la respuesta media
# ic es una matriz con tres columnas, la primera es la prediccion, y los otras 2 con extremos del intervalos
ic <- predict(regresion,nuevas.edades, interval= "confidence")
lines(nuevas.edades$edad, ic[, 2], lty=2, col="red")
lines(nuevas.edades$edad, ic[, 3], lty=2, col="red")
ic <- predict(regresion,nuevas.edades, interval= "prediction")
lines(nuevas.edades$edad, ic[, 2], lty=2, col="blue")
lines(nuevas.edades$edad, ic[, 3], lty=2, col="blue")
Asignacion para miercoles
Generar una conclusion de la actividad
Conclusión
En esta actividad estamos trabajando con el esquema de R el cual importamos, ordenamos, transformamos, visualizamos, modelamos y presentamos los datos tal cual se trabaja en esta actividad, nos tocó trabajar con el tema de regresión lineal el cual es súper útil a la hora de la predicción de estándares entre los datos en este caso trabajamos con un ejemplo el cual consiste en que una persona tiene tres factores edad, peso y grasas las cuales tiene una correlación entre sí, una persona entre más edad tenga mayor será la concentración de grasas ya que el metabolismo de dicha persona es más bajo que una persona joven, también miramos como se puede predecir o mejor dicho modelar el estándar de una persona mediante una matriz de valores edad y el paso, los cuales influyen al factor de la grasa el cual se denomina como matriz de coeficiente de relación en donde entran en juego los 3 factores. Tomando esto en cuenta esta más que claro como con la regresión lineal se puede predecir y modelar cualquier fenómeno o problema solamente tomando una regla, teniendo 2 variables que tengas relación entre sí.