names(bateadores)
##  [1] "id_jugador"         "id_anio"            "orden_equipos"     
##  [4] "id_equipo"          "id_liga"            "juegos"            
##  [7] "al_bate"            "carreras"           "golpes"            
## [10] "dobles"             "triples"            "cuadrangulares"    
## [13] "carreras_empujadas" "bases_robadas"      "atrapado_robando"  
## [16] "base_bolas"         "ponches"            "base_intencional"  
## [19] "golpeado"           "toque_sacrificio"   "elavado_sacrificio"
## [22] "doble_matanza"
gt(head(bateadores, n=3))
id_jugador id_anio orden_equipos id_equipo id_liga juegos al_bate carreras golpes dobles triples cuadrangulares carreras_empujadas bases_robadas atrapado_robando base_bolas ponches base_intencional golpeado toque_sacrificio elavado_sacrificio doble_matanza
abercda01 1871 1 TRO NA 1 4 0 0 0 0 0 0 0 0 0 0 NA NA NA NA 0
addybo01 1871 1 RC1 NA 25 118 30 32 6 0 0 13 8 1 4 0 NA NA NA NA 0
allisar01 1871 1 CL1 NA 29 137 28 40 4 5 0 19 3 1 2 5 NA NA NA NA 1
#1.Buscar el bateador que tuvo más carreras en cualquier año
bateadores %>% 
  select(id_jugador, carreras, id_anio) %>% 
  arrange(desc(carreras)) %>% 
  summarise(id_jugador,carreras,id_anio) %>% 
  head()
## Warning: Returning more (or less) than 1 row per `summarise()` group was deprecated in
## dplyr 1.1.0.
## ℹ Please use `reframe()` instead.
## ℹ When switching from `summarise()` to `reframe()`, remember that `reframe()`
##   always returns an ungrouped data frame and adjust accordingly.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.
##   id_jugador carreras id_anio
## 1  hamilbi01      198    1894
## 2  brownto01      177    1891
## 3   ruthba01      177    1921
## 4  oneilti01      167    1887
## 5  gehrilo01      167    1936
## 6  hamilbi01      166    1895
#2.¿Cual es el nombre del bateador (id_jugador) que estuvo más veces “al_bate”? Prepara una lista del bateador más frecuente al bate al menos
bateadores %>% 
  select(id_jugador, al_bate) %>% 
  arrange(desc(al_bate)) %>% 
  summarise(id_jugador,al_bate) %>% 
  head() %>% 
  gt()
## Warning: Returning more (or less) than 1 row per `summarise()` group was deprecated in
## dplyr 1.1.0.
## ℹ Please use `reframe()` instead.
## ℹ When switching from `summarise()` to `reframe()`, remember that `reframe()`
##   always returns an ungrouped data frame and adjust accordingly.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.
id_jugador al_bate
rolliji01 716
wilsowi02 705
suzukic01 704
samueju01 701
cashda01 699
pierrju01 699
#3.¿Cuales son las “ligas” de baseball (pelota) que estan incluida en este archivo?
bateadores %>% 
  select(id_liga) %>% 
  distinct() %>% 
  summarise(id_liga)
## Warning: Returning more (or less) than 1 row per `summarise()` group was deprecated in
## dplyr 1.1.0.
## ℹ Please use `reframe()` instead.
## ℹ When switching from `summarise()` to `reframe()`, remember that `reframe()`
##   always returns an ungrouped data frame and adjust accordingly.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.
##   id_liga
## 1      NA
## 2      NL
## 3      AA
## 4      UA
## 5      PL
## 6      AL
## 7      FL
#4.Selecciona los años (1900, 1950, 2000 y 2020) y jonrones y hacer una tabla por año que demuestra el máximo de jonrones para cada año
bateadores %>% 
  select(id_anio, cuadrangulares) %>% 
  filter(id_anio==c(1900, 1950, 2000,2020)) %>% 
  group_by(id_anio) %>% 
  summarise(max_jonrones = max(cuadrangulares)) %>% 
  gt()
id_anio max_jonrones
1900 7
1950 31
2000 50
2020 18
#5.Haz una tabla de la los jugadores que jugaron más años
bateadores %>% 
  select(id_jugador, id_anio, juegos) %>% 
  group_by(id_jugador) %>% 
  summarise(anios_jugados= n_distinct (id_anio)) %>% 
  arrange(desc(anios_jugados)) %>% 
  head() %>% 
  gt()
id_jugador anios_jugados
ansonca01 27
ryanno01 27
johnto01 26
mcguide01 26
collied01 25
henderi01 25
#5a.¿Cual es el jugador que ha jugado más años?
bateadores %>% 
  select(id_jugador, id_anio, juegos) %>% 
  group_by(id_jugador) %>% 
  summarise(anios_jugados= n_distinct (id_anio)) %>% 
  filter(anios_jugados==max(anios_jugados)) %>% 
  gt()
id_jugador anios_jugados
ansonca01 27
ryanno01 27
#6.Selecciona solamente la liga “AL”, los años desde de 2000 en adelande, y determina cual es la suma de “carreras” anotadas por cada equipo.
bateadores %>% 
  select(id_liga, id_anio, carreras,id_equipo) %>%
  filter(id_liga == "AL", id_anio >= 2000) %>% 
  group_by(id_equipo) %>% 
  summarise(carreras_anotadas = sum(carreras)) %>% 
  arrange(desc(carreras_anotadas))
## # A tibble: 16 × 2
##    id_equipo carreras_anotadas
##    <fct>                 <int>
##  1 BOS                   18605
##  2 NYA                   18576
##  3 TEX                   17703
##  4 TOR                   17253
##  5 CLE                   17137
##  6 MIN                   16755
##  7 OAK                   16727
##  8 CHA                   16703
##  9 DET                   16242
## 10 BAL                   16150
## 11 TBA                   16130
## 12 SEA                   15897
## 13 KCA                   15827
## 14 LAA                   12836
## 15 HOU                    7184
## 16 ANA                    3978
#6a.¿Cual es el equipo que tiene la mayor cantidad carreras?
bateadores %>% 
  select(id_liga, carreras,id_equipo) %>%
  filter(id_liga == "AL", id_anio >= 2000) %>% 
  group_by(id_equipo) %>% 
  summarise(carreras_anotadas = sum(carreras)) %>% 
  filter(carreras_anotadas==max(carreras_anotadas)) %>% 
  gt()
id_equipo carreras_anotadas
BOS 18605
#6b.¿Cual es el equipo que tiene menor carreras?
bateadores %>% 
  select(id_liga, carreras,id_equipo) %>%
  filter(id_liga == "AL", id_anio >= 2000) %>% 
  group_by(id_equipo) %>% 
  summarise(carreras_anotadas = sum(carreras)) %>% 
  filter(carreras_anotadas==min(carreras_anotadas)) %>% 
  gt()
id_equipo carreras_anotadas
ANA 3978