Carga en R el CSV de la web http://winterolympicsmedals.com/medals.csv y responde a las siguientes preguntas.
# Cargar el paquete readr
library(readr)
# Especificar la ruta local del archivo CSV
file_path <- ("~/CURSOS1/R STUDIO/r-basic-master/data/medals.csv")
# Cargar el archivo CSV desde la ruta local
medals_data <- read_csv("~/CURSOS1/R STUDIO/r-basic-master/data/medals.csv")
# Ver las primeras 10 filas del dataframe
head(medals_data, 10)
## # A tibble: 10 × 9
## ...1 Year City Sport Discipline NOC Event Event.gender Medal
## <dbl> <dbl> <chr> <chr> <chr> <chr> <chr> <chr> <chr>
## 1 1 1924 Chamonix Skating Figure skating AUT indi… M Silv…
## 2 2 1924 Chamonix Skating Figure skating AUT indi… W Gold
## 3 3 1924 Chamonix Skating Figure skating AUT pairs X Gold
## 4 4 1924 Chamonix Bobsleigh Bobsleigh BEL four… M Bron…
## 5 5 1924 Chamonix Ice Hockey Ice Hockey CAN ice … M Gold
## 6 6 1924 Chamonix Biathlon Biathlon FIN mili… M Silv…
## 7 7 1924 Chamonix Skating Figure skating FIN pairs X Silv…
## 8 8 1924 Chamonix Skating Speed skating FIN 1000… M Gold
## 9 9 1924 Chamonix Skating Speed skating FIN 1000… M Silv…
## 10 10 1924 Chamonix Skating Speed skating FIN 1500m M Gold
# Ver las últimas 10 filas del dataframe
tail(medals_data, 10)
## # A tibble: 10 × 9
## ...1 Year City Sport Discipline NOC Event Event.gender Medal
## <dbl> <dbl> <chr> <chr> <chr> <chr> <chr> <chr> <chr>
## 1 2302 2006 Turin Skiing Alpine Skiing USA Alpine comb… M Gold
## 2 2303 2006 Turin Skiing Alpine Skiing USA giant slalom W Gold
## 3 2304 2006 Turin Skiing Freestyle Ski. USA moguls M Bron…
## 4 2305 2006 Turin Skiing Snowboard USA Giant paral… W Bron…
## 5 2306 2006 Turin Skiing Snowboard USA Half-pipe M Gold
## 6 2307 2006 Turin Skiing Snowboard USA Half-pipe M Silv…
## 7 2308 2006 Turin Skiing Snowboard USA Half-pipe W Gold
## 8 2309 2006 Turin Skiing Snowboard USA Half-pipe W Silv…
## 9 2310 2006 Turin Skiing Snowboard USA Snowboard C… M Gold
## 10 2311 2006 Turin Skiing Snowboard USA Snowboard C… W Silv…
# Ver la estructura del dataframe
str(medals_data)
## spc_tbl_ [2,311 × 9] (S3: spec_tbl_df/tbl_df/tbl/data.frame)
## $ ...1 : num [1:2311] 1 2 3 4 5 6 7 8 9 10 ...
## $ Year : num [1:2311] 1924 1924 1924 1924 1924 ...
## $ City : chr [1:2311] "Chamonix" "Chamonix" "Chamonix" "Chamonix" ...
## $ Sport : chr [1:2311] "Skating" "Skating" "Skating" "Bobsleigh" ...
## $ Discipline : chr [1:2311] "Figure skating" "Figure skating" "Figure skating" "Bobsleigh" ...
## $ NOC : chr [1:2311] "AUT" "AUT" "AUT" "BEL" ...
## $ Event : chr [1:2311] "individual" "individual" "pairs" "four-man" ...
## $ Event.gender: chr [1:2311] "M" "W" "X" "M" ...
## $ Medal : chr [1:2311] "Silver" "Gold" "Gold" "Bronze" ...
## - attr(*, "spec")=
## .. cols(
## .. ...1 = col_double(),
## .. Year = col_double(),
## .. City = col_character(),
## .. Sport = col_character(),
## .. Discipline = col_character(),
## .. NOC = col_character(),
## .. Event = col_character(),
## .. Event.gender = col_character(),
## .. Medal = col_character()
## .. )
## - attr(*, "problems")=<externalptr>
# Para especificar las Columnas
spec(medals_data)
## cols(
## ...1 = col_double(),
## Year = col_double(),
## City = col_character(),
## Sport = col_character(),
## Discipline = col_character(),
## NOC = col_character(),
## Event = col_character(),
## Event.gender = col_character(),
## Medal = col_character()
## )
¿Cuántos deportistas aparecen en el data frame?
# Cargar el paque dplyr
library(dplyr)
# Contar el número de deportistas únicos (asumiendo que cada fila es un deportista único)
num_deportistas <- medals_data %>%
summarise(num_deportistas = n())
# Mostrar el resultado
print(num_deportistas)
## # A tibble: 1 × 1
## num_deportistas
## <int>
## 1 2311
¿Cuántos deportistas han ganado medallas de oro? ¿Cuántos han ganado medallas de plata? ¿Y cuántos de bronce?
# Contar el número de medallas de cada tipo
medallas_por_tipo <- medals_data %>%
group_by(Medal) %>%
summarise(count = n())
# Mostrar el resultado
print(medallas_por_tipo)
## # A tibble: 3 × 2
## Medal count
## <chr> <int>
## 1 Bronze 764
## 2 Gold 774
## 3 Silver 773
¿En cuántos lugares se han hecho olimpiadas de invierno?
# Cargar el paque dplyr
library(dplyr)
# Contar el número de ciudades únicas que han albergado los Juegos Olímpicos de Invierno
num_ciudades <- medals_data %>%
summarise(num_ciudades = n_distinct(City))
# Mostrar el resultado
print(num_ciudades)
## # A tibble: 1 × 1
## num_ciudades
## <int>
## 1 17
¿Cuántos hombres y cuántas mujeres hay?
# Cargar el paque dplyr
library(dplyr)
# Contar el número de hombres y mujeres
genero_medallas <- medals_data %>%
group_by(Event.gender) %>%
summarise(count = n())
# Mostrar el resultado
print(genero_medallas)
## # A tibble: 3 × 2
## Event.gender count
## <chr> <int>
## 1 M 1386
## 2 W 802
## 3 X 123
¿En qué año participaron más deportistas?
# Cargar el paque dplyr
library(dplyr)
# Contar el número de deportistas por año
deportistas_por_ano <- medals_data %>%
group_by(Year) %>%
summarise(count = n()) %>%
arrange(desc(count))
# Mostrar el año con más deportistas
ano_con_mas_deportistas <- deportistas_por_ano %>%
slice(1)
# Mostrar el resultado
print(ano_con_mas_deportistas)
## # A tibble: 1 × 2
## Year count
## <dbl> <int>
## 1 2006 252
El campo NOC indica el país del ganador de la medalla. ¿Qué país puede presumir de haber ganado más medallas de oro en los juegos de invierno entre 1960 y 1996?
# Cargar el paque dplyr
library(dplyr)
# Filtrar los datos para el rango de años 1960-1996 y medallas de oro
medallas_oro_1960_1996 <- medals_data %>%
filter(Year >= 1960 & Year <= 1996 & Medal == "Gold")
# Contar el número de medallas de oro por país
medallas_oro_por_pais <- medallas_oro_1960_1996 %>%
group_by(NOC) %>%
summarise(count = n()) %>%
arrange(desc(count))
# Mostrar el país con más medallas de oro
pais_con_mas_medallas_oro <- medallas_oro_por_pais %>%
slice(1)
# Mostrar el resultado
print(pais_con_mas_medallas_oro)
## # A tibble: 1 × 2
## NOC count
## <chr> <int>
## 1 URS 71