names(bateadores)
## [1] "id_jugador" "id_anio" "orden_equipos"
## [4] "id_equipo" "id_liga" "juegos"
## [7] "al_bate" "carreras" "golpes"
## [10] "dobles" "triples" "cuadrangulares"
## [13] "carreras_empujadas" "bases_robadas" "atrapado_robando"
## [16] "base_bolas" "ponches" "base_intencional"
## [19] "golpeado" "toque_sacrificio" "elavado_sacrificio"
## [22] "doble_matanza"
gt(head(bateadores, n=3))
| id_jugador |
id_anio |
orden_equipos |
id_equipo |
id_liga |
juegos |
al_bate |
carreras |
golpes |
dobles |
triples |
cuadrangulares |
carreras_empujadas |
bases_robadas |
atrapado_robando |
base_bolas |
ponches |
base_intencional |
golpeado |
toque_sacrificio |
elavado_sacrificio |
doble_matanza |
| abercda01 |
1871 |
1 |
TRO |
NA |
1 |
4 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
NA |
NA |
NA |
NA |
0 |
| addybo01 |
1871 |
1 |
RC1 |
NA |
25 |
118 |
30 |
32 |
6 |
0 |
0 |
13 |
8 |
1 |
4 |
0 |
NA |
NA |
NA |
NA |
0 |
| allisar01 |
1871 |
1 |
CL1 |
NA |
29 |
137 |
28 |
40 |
4 |
5 |
0 |
19 |
3 |
1 |
2 |
5 |
NA |
NA |
NA |
NA |
1 |
#1.Buscar el bateador que tuvo más carreras en cualquier año
bateadores %>%
select(id_jugador, carreras, id_anio) %>%
arrange(desc(carreras)) %>%
summarise(id_jugador,carreras,id_anio) %>%
head()
## Warning: Returning more (or less) than 1 row per `summarise()` group was deprecated in
## dplyr 1.1.0.
## ℹ Please use `reframe()` instead.
## ℹ When switching from `summarise()` to `reframe()`, remember that `reframe()`
## always returns an ungrouped data frame and adjust accordingly.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.
## id_jugador carreras id_anio
## 1 hamilbi01 198 1894
## 2 brownto01 177 1891
## 3 ruthba01 177 1921
## 4 oneilti01 167 1887
## 5 gehrilo01 167 1936
## 6 hamilbi01 166 1895
#2.¿Cual es el nombre del bateador (id_jugador) que estuvo más veces “al_bate”? Prepara una lista del bateador más frecuente al bate al menos
bateadores %>%
select(id_jugador, al_bate) %>%
arrange(desc(al_bate)) %>%
summarise(id_jugador,al_bate) %>%
head() %>%
gt()
## Warning: Returning more (or less) than 1 row per `summarise()` group was deprecated in
## dplyr 1.1.0.
## ℹ Please use `reframe()` instead.
## ℹ When switching from `summarise()` to `reframe()`, remember that `reframe()`
## always returns an ungrouped data frame and adjust accordingly.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.
| id_jugador |
al_bate |
| rolliji01 |
716 |
| wilsowi02 |
705 |
| suzukic01 |
704 |
| samueju01 |
701 |
| cashda01 |
699 |
| pierrju01 |
699 |
#3.¿Cuales son las “ligas” de baseball (pelota) que estan incluida en este archivo?
bateadores %>%
select(id_liga) %>%
distinct() %>%
summarise(id_liga)
## Warning: Returning more (or less) than 1 row per `summarise()` group was deprecated in
## dplyr 1.1.0.
## ℹ Please use `reframe()` instead.
## ℹ When switching from `summarise()` to `reframe()`, remember that `reframe()`
## always returns an ungrouped data frame and adjust accordingly.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.
## id_liga
## 1 NA
## 2 NL
## 3 AA
## 4 UA
## 5 PL
## 6 AL
## 7 FL
#4.Selecciona los años (1900, 1950, 2000 y 2020) y jonrones y hacer una tabla por año que demuestra el máximo de jonrones para cada año
bateadores %>%
select(id_anio, cuadrangulares) %>%
filter(id_anio==c(1900, 1950, 2000,2020)) %>%
group_by(id_anio) %>%
summarise(max_jonrones = max(cuadrangulares)) %>%
gt()
| id_anio |
max_jonrones |
| 1900 |
7 |
| 1950 |
31 |
| 2000 |
50 |
| 2020 |
18 |
#5.Haz una tabla de la los jugadores que jugaron más años
bateadores %>%
select(id_jugador, id_anio, juegos) %>%
group_by(id_jugador) %>%
summarise(anios_jugados= n_distinct (id_anio)) %>%
arrange(desc(anios_jugados)) %>%
head() %>%
gt()
| id_jugador |
anios_jugados |
| ansonca01 |
27 |
| ryanno01 |
27 |
| johnto01 |
26 |
| mcguide01 |
26 |
| collied01 |
25 |
| henderi01 |
25 |
#5a.¿Cual es el jugador que ha jugado más años?
bateadores %>%
select(id_jugador, id_anio, juegos) %>%
group_by(id_jugador) %>%
summarise(anios_jugados= n_distinct (id_anio)) %>%
filter(anios_jugados==max(anios_jugados)) %>%
gt()
| id_jugador |
anios_jugados |
| ansonca01 |
27 |
| ryanno01 |
27 |
#6.Selecciona solamente la liga “AL”, los años desde de 2000 en adelande, y determina cual es la suma de “carreras” anotadas por cada equipo.
bateadores %>%
select(id_liga, id_anio, carreras,id_equipo) %>%
filter(id_liga == "AL", id_anio >= 2000) %>%
group_by(id_equipo) %>%
summarise(carreras_anotadas = sum(carreras)) %>%
arrange(desc(carreras_anotadas))
## # A tibble: 16 × 2
## id_equipo carreras_anotadas
## <fct> <int>
## 1 BOS 18605
## 2 NYA 18576
## 3 TEX 17703
## 4 TOR 17253
## 5 CLE 17137
## 6 MIN 16755
## 7 OAK 16727
## 8 CHA 16703
## 9 DET 16242
## 10 BAL 16150
## 11 TBA 16130
## 12 SEA 15897
## 13 KCA 15827
## 14 LAA 12836
## 15 HOU 7184
## 16 ANA 3978
#6a.¿Cual es el equipo que tiene la mayor cantidad carreras?
bateadores %>%
select(id_liga, carreras,id_equipo) %>%
filter(id_liga == "AL", id_anio >= 2000) %>%
group_by(id_equipo) %>%
summarise(carreras_anotadas = sum(carreras)) %>%
filter(carreras_anotadas==max(carreras_anotadas)) %>%
gt()
| id_equipo |
carreras_anotadas |
| BOS |
18605 |
#6b.¿Cual es el equipo que tiene menor carreras?
bateadores %>%
select(id_liga, carreras,id_equipo) %>%
filter(id_liga == "AL", id_anio >= 2000) %>%
group_by(id_equipo) %>%
summarise(carreras_anotadas = sum(carreras)) %>%
filter(carreras_anotadas==min(carreras_anotadas)) %>%
gt()
| id_equipo |
carreras_anotadas |
| ANA |
3978 |