La librería dplyr es una parte fundamental del ecosistema de paquetes de R utilizada para la manipulación y transformación eficiente de datos. Desarrollada por Hadley Wickham y otros colaboradores, dplyr proporciona un conjunto coherente de funciones que facilitan la manipulación y análisis de datos en R. https://dplyr.tidyverse.org/
Este dataset (corpus) contiene criticas realizadas por los usuarios de www.filmaffinity.com sobre más de 50 películas españolas (50 películas más relevantes hasta el momento de la creación del dataset).
El dataset (copus) esta formado por:
film_name: Título de la película. gender: Genero de la película (comedia, terror, acción, etc.) film_avg_rate: Nota media de la película (votos de todos los usuarios) review_rate: Nota que el usuario que hace la crítica pone a la película. review_title: Título de la crítica. review_text: Crítica de la película.
#install.packages("readr")
library(dplyr)
##
## Adjuntando el paquete: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(readr) #Para leer archivos .csv
filmaffinity <- read_csv("reviews_filmaffinity_2.csv")
## Warning: One or more parsing issues, call `problems()` on your data frame for details,
## e.g.:
## dat <- vroom(...)
## problems(dat)
## Rows: 8529 Columns: 6
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ","
## chr (4): film_name, gender, film_avg_rate, review_text
## dbl (2): review_rate, review_title
##
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
El operador %>% (pipe) facilita la escritura de código más legible y facilita la secuencia de operaciones en una tubería (pipeline). En lugar de anidar funciones o asignar resultados intermedios a variables, el operador %>% permite encadenar las operaciones de una manera más clara y directa.
head(filmaffinity,10) #permite mostrar los primeros 10 registros del dataset
## # A tibble: 10 × 6
## film_name gender film_avg_rate review_rate review_title review_text
## <chr> <chr> <chr> <dbl> <dbl> <chr>
## 1 Ocho apellidos vas… Comed… 6 0 3 "OCHO APEL…
## 2 Ocho apellidos vas… Comed… 6 0 2 "El perro …
## 3 Ocho apellidos vas… Comed… 6 0 2 "Si no ere…
## 4 Ocho apellidos vas… Comed… 6 0 2 "Aida: The…
## 5 Ocho apellidos vas… Comed… 6 0 2 "UN HOMBRE…
## 6 Ocho apellidos vas… Comed… 6 0 8 "Pues si p…
## 7 Ocho apellidos vas… Comed… 6 0 3 "¿LA MÁS T…
## 8 Ocho apellidos vas… Comed… 6 0 3 "España co…
## 9 Ocho apellidos vas… Comed… 6 0 1 "¿Que le p…
## 10 Ocho apellidos vas… Comed… 6 0 1 "AHIVALAOS…
filmaffinity %>% head(10) #permite mostrar los primeros 10 registros del dataset
## # A tibble: 10 × 6
## film_name gender film_avg_rate review_rate review_title review_text
## <chr> <chr> <chr> <dbl> <dbl> <chr>
## 1 Ocho apellidos vas… Comed… 6 0 3 "OCHO APEL…
## 2 Ocho apellidos vas… Comed… 6 0 2 "El perro …
## 3 Ocho apellidos vas… Comed… 6 0 2 "Si no ere…
## 4 Ocho apellidos vas… Comed… 6 0 2 "Aida: The…
## 5 Ocho apellidos vas… Comed… 6 0 2 "UN HOMBRE…
## 6 Ocho apellidos vas… Comed… 6 0 8 "Pues si p…
## 7 Ocho apellidos vas… Comed… 6 0 3 "¿LA MÁS T…
## 8 Ocho apellidos vas… Comed… 6 0 3 "España co…
## 9 Ocho apellidos vas… Comed… 6 0 1 "¿Que le p…
## 10 Ocho apellidos vas… Comed… 6 0 1 "AHIVALAOS…
10 %>% head(filmaffinity, .) #permite mostrar los primeros 10 registros del dataset
## # A tibble: 10 × 6
## film_name gender film_avg_rate review_rate review_title review_text
## <chr> <chr> <chr> <dbl> <dbl> <chr>
## 1 Ocho apellidos vas… Comed… 6 0 3 "OCHO APEL…
## 2 Ocho apellidos vas… Comed… 6 0 2 "El perro …
## 3 Ocho apellidos vas… Comed… 6 0 2 "Si no ere…
## 4 Ocho apellidos vas… Comed… 6 0 2 "Aida: The…
## 5 Ocho apellidos vas… Comed… 6 0 2 "UN HOMBRE…
## 6 Ocho apellidos vas… Comed… 6 0 8 "Pues si p…
## 7 Ocho apellidos vas… Comed… 6 0 3 "¿LA MÁS T…
## 8 Ocho apellidos vas… Comed… 6 0 3 "España co…
## 9 Ocho apellidos vas… Comed… 6 0 1 "¿Que le p…
## 10 Ocho apellidos vas… Comed… 6 0 1 "AHIVALAOS…
La función select() se utiliza para seleccionar columnas específicas de un marco de datos. Puede ser útil cuando estás trabajando con conjuntos de datos grandes y solo necesitas trabajar con un subconjunto específico de columnas.
filmaffinity %>%
select(film_name, gender, film_avg_rate, review_rate, review_title, review_text)
## # A tibble: 8,529 × 6
## film_name gender film_avg_rate review_rate review_title review_text
## <chr> <chr> <chr> <dbl> <dbl> <chr>
## 1 Ocho apellidos vas… Comed… 6 0 3 "OCHO APEL…
## 2 Ocho apellidos vas… Comed… 6 0 2 "El perro …
## 3 Ocho apellidos vas… Comed… 6 0 2 "Si no ere…
## 4 Ocho apellidos vas… Comed… 6 0 2 "Aida: The…
## 5 Ocho apellidos vas… Comed… 6 0 2 "UN HOMBRE…
## 6 Ocho apellidos vas… Comed… 6 0 8 "Pues si p…
## 7 Ocho apellidos vas… Comed… 6 0 3 "¿LA MÁS T…
## 8 Ocho apellidos vas… Comed… 6 0 3 "España co…
## 9 Ocho apellidos vas… Comed… 6 0 1 "¿Que le p…
## 10 Ocho apellidos vas… Comed… 6 0 1 "AHIVALAOS…
## # ℹ 8,519 more rows
filmaffinity %>%
select(film_name:review_text)
## # A tibble: 8,529 × 6
## film_name gender film_avg_rate review_rate review_title review_text
## <chr> <chr> <chr> <dbl> <dbl> <chr>
## 1 Ocho apellidos vas… Comed… 6 0 3 "OCHO APEL…
## 2 Ocho apellidos vas… Comed… 6 0 2 "El perro …
## 3 Ocho apellidos vas… Comed… 6 0 2 "Si no ere…
## 4 Ocho apellidos vas… Comed… 6 0 2 "Aida: The…
## 5 Ocho apellidos vas… Comed… 6 0 2 "UN HOMBRE…
## 6 Ocho apellidos vas… Comed… 6 0 8 "Pues si p…
## 7 Ocho apellidos vas… Comed… 6 0 3 "¿LA MÁS T…
## 8 Ocho apellidos vas… Comed… 6 0 3 "España co…
## 9 Ocho apellidos vas… Comed… 6 0 1 "¿Que le p…
## 10 Ocho apellidos vas… Comed… 6 0 1 "AHIVALAOS…
## # ℹ 8,519 more rows
filmaffinity %>%
select(-'film_name', -'review_rate')
## # A tibble: 8,529 × 4
## gender film_avg_rate review_title review_text
## <chr> <chr> <dbl> <chr>
## 1 Comedia 6 3 "OCHO APELLIDOS VASCOS...Y NINGÚN NOMBRE …
## 2 Comedia 6 2 "El perro verde,No soy un experto cinéfil…
## 3 Comedia 6 2 "Si no eres de comer mierda... no te coma…
## 4 Comedia 6 2 "Aida: The movie,No sé qué está pasando, …
## 5 Comedia 6 2 "UN HOMBRE SOLO (Julio Iglesias 1987),\"P…
## 6 Comedia 6 8 "Pues si para ti es una mierda, ¿para qué…
## 7 Comedia 6 3 "¿LA MÁS TAQUILLERA? ASÍ NOS VA, ESTO ES…
## 8 Comedia 6 3 "España como imposibilidad,Es triste ver …
## 9 Comedia 6 1 "¿Que le pasa al público español? ¡ah si,…
## 10 Comedia 6 1 "AHIVALAOSTIA, PISHA,-Ahivalohostia, Txom…
## # ℹ 8,519 more rows
La función mutate() se utiliza para agregar nuevas columnas o modificar columnas existentes en un marco de datos. Puedes realizar operaciones aritméticas, aplicar funciones a columnas existentes y crear nuevas variables basadas en las existentes.