setwd("~/PROBABILIDAD Y ESTADISTICA 2020")
library(readxl)
Alimento <- read_excel("camarones10.xlsx")
Alimento
## # A tibble: 25 x 3
## Peso Biomasa Alimento
## <dbl> <dbl> <dbl>
## 1 11.4 6052. 7303
## 2 11.9 7718. 8992
## 3 11.5 7611. 8872
## 4 11.7 8115. 9387
## 5 11.4 7446. 9197
## 6 10.5 7649. 9226
## 7 11.2 7990. 9401
## 8 10.6 7691. 9266
## 9 11.5 7366. 8646
## 10 11.4 7228. 8718
## # ... with 15 more rows
Se tienen datos de 25 camarones de peso, biomasa acumulada y Alimento total consumido.
## Peso Biomasa Alimento
## Peso 1.0000000 0.5715104 -0.4987611
## Biomasa 0.5715104 1.0000000 0.2733789
## Alimento -0.4987611 0.2733789 1.0000000
El comando básico es lm (linear models). El primer argumento de este comando es una fórmula y ~ x en la que se especifica cuál es la variable respuesta o dependiente (y) y cuál es la variable regresora o independiente (x). El segundo argumento, llamado data especifica cuál es el fichero en el que se encuentran las variables. El resultado lo guardamos en un objeto llamado regresion. Este objeto es una lista que contiene toda la información relevante sobre el análisis. Mediante el comando summary obtenemos un resumen de los principales resultados:
##
## Call:
## lm(formula = Alimento ~ Peso, data = Alimento)
##
## Residuals:
## Min 1Q Median 3Q Max
## -1626.12 -213.88 36.26 271.38 938.93
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 12917.6 1343.7 9.613 1.6e-09 ***
## Peso -349.6 126.7 -2.760 0.0112 *
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 534.6 on 23 degrees of freedom
## Multiple R-squared: 0.2488, Adjusted R-squared: 0.2161
## F-statistic: 7.616 on 1 and 23 DF, p-value: 0.01115
Los parámetros de la ecuación de la recta de mínimos cuadrados que relaciona el peso de los camarones en función del alimento consumido, vienen dados por la columna ´Estimate´ de la tabla ´Coefficients´ de la salida anterior. Por lo tanto, en este ejemplo la ecuación de la recta de mínimos cuadrados es:
\[ y = 12917.6 - 349.6 x \]
Los siguientes comandos representan la nube de puntos (comando plot) y añaden la representación gráfica de la recta de mínimos cuadrados (comando abline aplicado al objeto generado por lm):
El coeficiente de determinación (es decir, el coeficiente de correlación al cuadrado) mide la bondad del ajuste de la recta a los datos. A partir de la salida anterior, vemos que su valor en este caso es Multiple R-squared: 0.701.
Supongamos que queremos utilizar la recta de mínimos cuadrados para predecir la cantidad de Alimento para los camarones de Peso 9,9.5,10…,12. Basta crear un fichero de datos que contenga las nuevas variables regresoras y usar el comando predict:
## 1 2 3 4
## 9771.561 9421.999 9072.438 8722.876
Download U4A1.rmd