Introducción:

En este reporte analizamos datos de equipos de Grandes Ligas (MLB) usando el dataset Teams del paquete Lahman.

El objetivo es explorar la relación entre jonrones (HR) y carreras anotadas (R).

Vista inicical de los datos:

head(Teams)
##   yearID lgID teamID franchID divID Rank   G Ghome  W  L DivWin WCWin LgWin
## 1   1884   UA    ALT      ALT  <NA>   10  25    NA  6 19   <NA>  <NA>     N
## 2   1961   AL    LAA      ANA  <NA>    8 162    82 70 91   <NA>  <NA>     N
## 3   1962   AL    LAA      ANA  <NA>    3 162    81 86 76   <NA>  <NA>     N
## 4   1963   AL    LAA      ANA  <NA>    9 161    81 70 91   <NA>  <NA>     N
## 5   1964   AL    LAA      ANA  <NA>    5 162    81 82 80   <NA>  <NA>     N
## 6   1965   AL    CAL      ANA  <NA>    7 162    80 75 87   <NA>  <NA>     N
##   WSWin   R   AB    H X2B X3B  HR  BB   SO  SB CS HBP SF  RA  ER  ERA CG SHO SV
## 1  <NA>  90  899  223  30   6   2  22  130  NA NA  NA NA 216 114 4.67 20   0  0
## 2     N 744 5424 1331 218  22 189 681 1068  37 28  NA NA 784 689 4.31 25   5 34
## 3     N 718 5499 1377 232  35 137 602  917  46 27  NA NA 706 603 3.70 23  15 47
## 4     N 597 5506 1378 208  38  95 448  916  43 30  NA NA 660 569 3.52 30  13 31
## 5     N 544 5362 1297 186  27 102 472  920  49 39  NA NA 551 469 2.91 30  28 41
## 6     N 527 5354 1279 200  36  92 443  973 107 59  NA NA 569 508 3.17 39  14 33
##   IPouts   HA HRA BBA SOA   E  DP    FP                  name
## 1    659  292   3  52  93 156   4 0.862 Altoona Mountain City
## 2   4314 1391 180 713 973 192 154 0.969    Los Angeles Angels
## 3   4398 1412 118 616 858 175 153 0.972    Los Angeles Angels
## 4   4365 1317 120 578 889 163 155 0.974    Los Angeles Angels
## 5   4350 1273 100 530 965 138 168 0.978    Los Angeles Angels
## 6   4323 1259  91 563 847 123 149 0.981     California Angels
##                 park attendance BPF PPF teamIDBR teamIDlahman45 teamIDretro
## 1               <NA>         NA 101 109      ALT            ALT         ALT
## 2 Wrigley Field (LA)     603510 111 112      LAA            LAA         LAA
## 3     Dodger Stadium    1144063  97  97      LAA            LAA         LAA
## 4     Dodger Stadium     821015  94  94      LAA            LAA         LAA
## 5     Dodger Stadium     760439  90  90      LAA            LAA         LAA
## 6     Dodger Stadium     566727  97  98      CAL            CAL         CAL
names(Teams)
##  [1] "yearID"         "lgID"           "teamID"         "franchID"      
##  [5] "divID"          "Rank"           "G"              "Ghome"         
##  [9] "W"              "L"              "DivWin"         "WCWin"         
## [13] "LgWin"          "WSWin"          "R"              "AB"            
## [17] "H"              "X2B"            "X3B"            "HR"            
## [21] "BB"             "SO"             "SB"             "CS"            
## [25] "HBP"            "SF"             "RA"             "ER"            
## [29] "ERA"            "CG"             "SHO"            "SV"            
## [33] "IPouts"         "HA"             "HRA"            "BBA"           
## [37] "SOA"            "E"              "DP"             "FP"            
## [41] "name"           "park"           "attendance"     "BPF"           
## [45] "PPF"            "teamIDBR"       "teamIDlahman45" "teamIDretro"

Resúmenes estadísticos:

summary(Teams$HR)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##     0.0    48.0   112.0   108.1   158.0   307.0
summary(Teams$R)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    24.0   615.0   692.0   682.1   765.0  1220.0

Histograma de HR:

hist(Teams$HR, col="gold",xlab = "Jonrones por equipo-temporada", ylab="Frecuencia", main = "Distribución de Jonrones"  )

Relación entre HR y R:

plot(Teams$HR, Teams$R, xlab="Jonrones (HR)", ylab="Carreras (R)", main="Relación entre HR y R", col="purple")

Conclusión:

Los datos muestran que en la historia de la MLB era común que muchos equipos tuvieran pocos jonrones, aunque en épocas más recientes hay mas jonrones. El gráfico de dispersión muesta que exite una relación positiva en que mientras más jonrones conecta un equipo, más carreras anota.