R Markdown
Importar paquetes y definir folder de trabajo
Importar datos
## [1] "MES" "HERMOSILLO90" "HERMOSILLO15"
Descripción de datos
Se tienen datos de TEMPERATURA de 12 meses, Hmo 2015 y Hmo 1990.
Cuantificar el grado de relación lineal (coef. de correlación)
## MES HERMOSILLO90 HERMOSILLO15
## MES 1.0000000 0.1913544 0.1013128
## HERMOSILLO90 0.1913544 1.0000000 0.9261336
## HERMOSILLO15 0.1013128 0.9261336 1.0000000
Estimación y representación de la recta de mínimos cuadrados
El comando básico es lm (linear models). El primer argumento de este comando es una fórmula y ~ x en la que se especifica cuál es la variable respuesta o dependiente (y) y cuál es la variable regresora o independiente (x). El segundo argumento, llamado data especifica cuál es el fichero en el que se encuentran las variables. El resultado lo guardamos en un objeto llamado regresion. Este objeto es una lista que contiene toda la información relevante sobre el análisis. Mediante el comando summary obtenemos un resumen de los principales resultados:
##
## Call:
## lm(formula = HERMOSILLO15 ~ HERMOSILLO90, data = temp)
##
## Residuals:
## Min 1Q Median 3Q Max
## -3.1891 -1.0318 -0.5857 1.1764 3.7109
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 7.7519 3.2655 2.374 0.039 *
## HERMOSILLO90 0.7982 0.1028 7.764 1.53e-05 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 2.058 on 10 degrees of freedom
## Multiple R-squared: 0.8577, Adjusted R-squared: 0.8435
## F-statistic: 60.29 on 1 and 10 DF, p-value: 1.528e-05
Los parámetros de la ecuación de la recta de mínimos cuadrados que relaciona la cantidad de grasas en la sangre en función del peso vienen dados por la columna ´Estimate´ de la tabla ´Coefficients´ de la salida anterior. Por lo tanto, en este ejemplo la ecuación de la recta de mínimos cuadrados es:
\[ y = 7.7519 + 0.7982 x \]
Los siguientes comandos representan la nube de puntos (comando plot) y añaden la representación gráfica de la recta de mínimos cuadrados (comando abline aplicado al objeto generado por lm):
plot(temp$HERMOSILLO90, temp$HERMOSILLO15, xlab="HERMOSILLO90", ylab="HERMOSILLO15" )
abline(regresion)El coeficiente de determinación (es decir, el coeficiente de correlación al cuadrado) mide la bondad del ajuste de la recta a los datos. A partir de la salida anterior.
Cálculo de predicciones
Supongamos que queremos utilizar la recta de mínimos cuadrados para predecir la cantidad de grasas para individuos de edades 25,26,27,…,40. Basta crear un fichero de datos que contenga las nuevas variables regresoras y usar el comando predict:
## 1 2 3 4 5 6 7 8
## 27.70769 28.50592 29.30416 30.10239 30.90062 31.69885 32.49708 33.29531
## 9 10 11 12 13 14 15 16
## 34.09354 34.89177 35.69000 36.48823 37.28647 38.08470 38.88293 39.68116