Descripción del paquete: Proporciona tablas de la “Base de datos de béisbol Sean Lahman”, ofrece una variedad de desafíos interesantes y oportunidades para el procesamiento y visualización de datos en R.. Utiliza los datos de pitcheo, bateo y fielding, entre otras como de rendimiento y otras tablas desde 1871 hasta 2015, según lo registrado en el 2016 Versión de la base de datos.
Esta base de datos contiene estadísticas de lanzamiento, bateo y fildeo para las Grandes Ligas de Béisbol desde 1871 hasta el 2016. Incluye datos de las dos ligas actuales (estadounidense y nacional), las otras cuatro ligas principales (Asociación Americana, Asociación Sindical, Liga de Jugadores y Liga Federal), y la Asociación Nacional de 1871-1875. Fue creada por Sean Lahman, quien fue pionero en el esfuerzo por hacer estadísticas de béisbol. Libre acceso al público en general. Lo que comenzó como un esfuerzo de un solo hombre en 1994 ha crecido enormemente, y ahora un equipo de investigadores ha reunido sus esfuerzos para hacer de este el más grande. En la versión actual, los ejemplos hacen un uso extensivo del paquete dplyr para la manipulación de datos (tabulación, consultas, resúmenes, fusión, etc.), que refleja el diseño de la base de datos relacional original y ggplot2 para gráficos.
La forma principal de esta base de datos es una base de datos relacionada en formato de Microsoft Access. El diseño sigue estos principios generales: A cada jugador se le asigna un código único (ID de jugador). Toda la información está relacionada en otras tablas con ese jugador y está etiquetada con su ID de jugador. Entonces todos los ID están vinculados a nombres y fechas de nacimiento en la tabla principal. La base de datos se compone de las siguientes tablas principales:
1. Data(master):19105 observaciones con 26 variables que consta de nombres de jugadores, fecha de nacimiento e información biográfica. Este archivo se usa para obtener detalles sobre jugadores enumerados en Batting, Pitching y otros archivos donde los jugadores son identificados solo por jugadorID, también hay variables como peso del jugador en libras, altura del jugador en pulgadas, cuidad dónde murió el jugador, estado dónde murió el jugador.
2. Data(batting): 102,816 observaciones con 22 variables que consta de: número de juegos en los que un jugador jugó, homeruns, golpe por lanzamiento.
3. Data(pitching): 44,963 observaciones con 30 variables que consta de: juegos completos, perdidos, ganados, comenzados.
4. Data (fielding): 136,815 observaciones con 18 variables que consta de: posición, juegos, errores, clasificación de la zona.También se proporciona una colección de otras tablas que a continuación se desarrollan brevemente:
1. Data(Teams): Estadísticas y posiciones anuales de los equipos: 2835 observaciones con 48 variables como por ejemplo: año, posición de la clasificación final, juegos jugados, juegos jugados en casa, juegos ganados, juegos perdidos, bases robadas.
2. Data (TeamsHalf): Datos de la temporada de los equipos: 52 observaciones con 10 variables como por ejemplo: año, división, juegos jugados, primera o segunda mitad de la temporada, liga.
3. Data (TeamsFranchises): Información sobre franquicias de equipos: 120 observaciones con 4 variables como por ejemplo: ID franquicia, nombre de la franquicia, si el equipo está actualmente activo (S o N), identificación de la franquicia del equipo de la Asociación Nacional jugado como…
1. Data (battingpost): 13,543 observaciones con 22 variables como por ejemplo, bases robadas, base en bolas, strikeouts, intentional walks, hit by pitch.
2. Data (pitchingpost): 5,271 observaciones con 30 variables como por ejemplo, juegos comenzados, juegos completos, homeruns, strikeouts.
3. Data (Fieldingpost): 12,714 observaciones con 17 variables como por ejemplo: posición, juegos, errores, putouts.
4. Data (Seriespost): 316 observaciones con 9 variables como por ejemplo, equipo que ganó la serie, liga que ganó la serie, equipo que perdió la serie, liga que perdió la serie.
1. Data (AwardsManager): 179 observaciones con 6 variables que consta de: ID del gerente, nombre del premio ganado, año, el premio fue empate (S o N).
2. Data (AwardsPlayers): 6,158 observaciones con 6 variables: ID del jugador, nombre del premio ganado, año, notas sobre el premio, premio fue empate (S o N).
3. Data (AwardsSharemanagers): 425 observaciones con 7 variables: año, ID del gerente, número de puntos recibidos, número máximo de puntos posibles, número de votos en primer lugar.
4. Data (AwardsShareplayers): 6,879 observaciones con 7 variables: año ID del jugador, número de puntos recibidos, número máximo de puntos posibles, número de votos en primer lugar.
A continuación se muestra un ejemplo de los jugadores mejores pagados desde 1985 al 2016
## yearID teamID lgID playerID salary nameFirst nameLast
## 1 1985 PHI NL schmimi01 2130300 Mike Schmidt
## 2 1986 NYN NL fostege01 2800000 George Foster
## 3 1987 PHI NL schmimi01 2127333 Mike Schmidt
## 4 1988 SLN NL smithoz01 2340000 Ozzie Smith
## 5 1989 LAN NL hershor01 2766667 Orel Hershiser
## 6 1990 ML4 AL yountro01 3200000 Robin Yount
## 7 1991 LAN NL strawda01 3800000 Darryl Strawberry
## 8 1992 NYN NL bonilbo01 6100000 Bobby Bonilla
## 9 1993 NYN NL bonilbo01 6200000 Bobby Bonilla
## 10 1994 NYN NL bonilbo01 6300000 Bobby Bonilla
## 11 1995 DET AL fieldce01 9237500 Cecil Fielder
## 12 1996 DET AL fieldce01 9237500 Cecil Fielder
## 13 1997 CHA AL belleal01 10000000 Albert Belle
## 14 1998 FLO NL sheffga01 14936667 Gary Sheffield
## 15 1999 BAL AL belleal01 11949794 Albert Belle
## 16 2000 LAN NL brownke01 15714286 Kevin Brown
## 17 2001 TEX AL rodrial01 22000000 Alex Rodriguez
## 18 2002 TEX AL rodrial01 22000000 Alex Rodriguez
## 19 2003 TEX AL rodrial01 22000000 Alex Rodriguez
## 20 2004 BOS AL ramirma02 22500000 Manny Ramirez
## 21 2005 NYA AL rodrial01 26000000 Alex Rodriguez
## 22 2006 NYA AL rodrial01 21680727 Alex Rodriguez
## 23 2007 NYA AL giambja01 23428571 Jason Giambi
## 24 2008 NYA AL rodrial01 28000000 Alex Rodriguez
## 25 2009 NYA AL rodrial01 33000000 Alex Rodriguez
## 26 2010 NYA AL rodrial01 33000000 Alex Rodriguez
## 27 2011 NYA AL rodrial01 32000000 Alex Rodriguez
## 28 2012 NYA AL rodrial01 30000000 Alex Rodriguez
## 29 2013 NYA AL rodrial01 29000000 Alex Rodriguez
## 30 2014 LAN NL greinza01 26000000 Zack Greinke
## 31 2015 LAN NL kershcl01 32571000 Clayton Kershaw
## 32 2016 LAD NL kershcl01 33000000 Clayton Kershaw