Hacer uno del parquete ?datasets-package

?datasets-package

y ejecutarlo (darle enter)

damos de alta una variable llamada por ejemplo “carros”

carros <- cars 
carros
##    speed dist
## 1      4    2
## 2      4   10
## 3      7    4
## 4      7   22
## 5      8   16
## 6      9   10
## 7     10   18
## 8     10   26
## 9     10   34
## 10    11   17
## 11    11   28
## 12    12   14
## 13    12   20
## 14    12   24
## 15    12   28
## 16    13   26
## 17    13   34
## 18    13   34
## 19    13   46
## 20    14   26
## 21    14   36
## 22    14   60
## 23    14   80
## 24    15   20
## 25    15   26
## 26    15   54
## 27    16   32
## 28    16   40
## 29    17   32
## 30    17   40
## 31    17   50
## 32    18   42
## 33    18   56
## 34    18   76
## 35    18   84
## 36    19   36
## 37    19   46
## 38    19   68
## 39    20   32
## 40    20   48
## 41    20   52
## 42    20   56
## 43    20   64
## 44    22   66
## 45    23   54
## 46    24   70
## 47    24   92
## 48    24   93
## 49    24  120
## 50    25   85

Tabla de frecuencia

de los datos de velocidad de los carros

library(fdth)
## 
## Attaching package: 'fdth'
## The following objects are masked from 'package:stats':
## 
##     sd, var
tabla <-fdt(carros$speed, breaks="Sturges")
tabla
##     Class limits  f   rf rf(%) cf cf(%)
##    [3.96,7.0014)  4 0.08     8  4     8
##  [7.0014,10.043)  5 0.10    10  9    18
##  [10.043,13.084) 10 0.20    20 19    38
##  [13.084,16.126)  9 0.18    18 28    56
##  [16.126,19.167) 10 0.20    20 38    76
##  [19.167,22.209)  6 0.12    12 44    88
##   [22.209,25.25)  6 0.12    12 50   100

Histogramas

Histograma de frecuencia absoluta

plot(tabla, type="fh")

### Histograma de frecuencia acumulada

plot(tabla, type="cfh")

Histograma de frecuencia relativa

plot(tabla, type="rfh")

Polígono de frecuencia absoluta

plot(tabla, type="fp")

# Medidas de tendencia central Para la velocidad de los automóviles

mean(carros$speed)
## [1] 15.4

Gráfico de caja y bigote

boxplot(carros$speed)

Regresión lineal

regresion <- lm(dist ~ speed, data=carros)
summary(regresion)
## 
## Call:
## lm(formula = dist ~ speed, data = carros)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -29.069  -9.525  -2.272   9.215  43.201 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) -17.5791     6.7584  -2.601   0.0123 *  
## speed         3.9324     0.4155   9.464 1.49e-12 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 15.38 on 48 degrees of freedom
## Multiple R-squared:  0.6511, Adjusted R-squared:  0.6438 
## F-statistic: 89.57 on 1 and 48 DF,  p-value: 1.49e-12

Matriz de diagramas de dispersión

pairs(carros)

## Matriz de coeficientes de correlación

cor(carros)
##           speed      dist
## speed 1.0000000 0.8068949
## dist  0.8068949 1.0000000

Entonces tomando esto en cuenta, la ecuación de la recta de mínimos cuadrados para esta regresión lineal sería:

\[ y = -17.5791 + 3.9324x \]

Gráfico de dispersión con la recta de los mínimos cuadrados

plot(carros$speed, carros$dist, xlab = "Velocidad de los carros", ylab="Distancia de detención")
abline(regresion)