datasets-package?datasets-package
y ejecutarlo (darle enter)
Dar click en “index” en la parte inferior derecha de la ventana que sale en “Help” llamada “The R Datasets Package”
Cuando hacemos esto sale una lista y descripción de los datos disponibles
Si por ejemplo decidimos usar " cars "
damos de alta una variable llamada por ejemplo “carros”
carros <- cars
carros
## speed dist
## 1 4 2
## 2 4 10
## 3 7 4
## 4 7 22
## 5 8 16
## 6 9 10
## 7 10 18
## 8 10 26
## 9 10 34
## 10 11 17
## 11 11 28
## 12 12 14
## 13 12 20
## 14 12 24
## 15 12 28
## 16 13 26
## 17 13 34
## 18 13 34
## 19 13 46
## 20 14 26
## 21 14 36
## 22 14 60
## 23 14 80
## 24 15 20
## 25 15 26
## 26 15 54
## 27 16 32
## 28 16 40
## 29 17 32
## 30 17 40
## 31 17 50
## 32 18 42
## 33 18 56
## 34 18 76
## 35 18 84
## 36 19 36
## 37 19 46
## 38 19 68
## 39 20 32
## 40 20 48
## 41 20 52
## 42 20 56
## 43 20 64
## 44 22 66
## 45 23 54
## 46 24 70
## 47 24 92
## 48 24 93
## 49 24 120
## 50 25 85
de los datos de velocidad de los carros
library(fdth)
##
## Attaching package: 'fdth'
## The following objects are masked from 'package:stats':
##
## sd, var
tabla <-fdt(carros$speed, breaks="Sturges")
tabla
## Class limits f rf rf(%) cf cf(%)
## [3.96,7.0014) 4 0.08 8 4 8
## [7.0014,10.043) 5 0.10 10 9 18
## [10.043,13.084) 10 0.20 20 19 38
## [13.084,16.126) 9 0.18 18 28 56
## [16.126,19.167) 10 0.20 20 38 76
## [19.167,22.209) 6 0.12 12 44 88
## [22.209,25.25) 6 0.12 12 50 100
plot(tabla, type="fh")
### Histograma de frecuencia acumulada
plot(tabla, type="cfh")
plot(tabla, type="rfh")
plot(tabla, type="fp")
# Medidas de tendencia central Para la velocidad de los automóviles
mean(carros$speed)
## [1] 15.4
Gráfico de caja y bigote
boxplot(carros$speed)
regresion <- lm(dist ~ speed, data=carros)
summary(regresion)
##
## Call:
## lm(formula = dist ~ speed, data = carros)
##
## Residuals:
## Min 1Q Median 3Q Max
## -29.069 -9.525 -2.272 9.215 43.201
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -17.5791 6.7584 -2.601 0.0123 *
## speed 3.9324 0.4155 9.464 1.49e-12 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 15.38 on 48 degrees of freedom
## Multiple R-squared: 0.6511, Adjusted R-squared: 0.6438
## F-statistic: 89.57 on 1 and 48 DF, p-value: 1.49e-12
pairs(carros)
## Matriz de coeficientes de correlación
cor(carros)
## speed dist
## speed 1.0000000 0.8068949
## dist 0.8068949 1.0000000
Entonces tomando esto en cuenta, la ecuación de la recta de mínimos cuadrados para esta regresión lineal sería:
\[ y = -17.5791 + 3.9324x \]
plot(carros$speed, carros$dist, xlab = "Velocidad de los carros", ylab="Distancia de detención")
abline(regresion)