El presente análisis se realizó gracias a la capacitación en el Club de R para RRHH.
Qué es el Club? Es una comunidad de aprendizaje de programación en R destinada para las personas que trabajan en Recursos Humanos de habla hispana.
Soy una de las integrantes del Club.👋
Vamos a analizar brevemente un texto, a través de un paquete de R llamado Text Mining.
En RRHH analizar texto resulta fundamental, lo podriamos utilizar en entrevistas, evaluaciones, encuestas, comunicación corporativa (…).
¿ Se te ocurre algún otro uso? Contanos en comentarios.
Los datos que vamos a usar son de una canción muy popular en Argentina.
¿Por qué una canción?
La idea es demostrar los resultados del uso de dicha herramienta y que sea visible para el lector.
La pieza musical en cuestión es “El Bómbon”, cuyos autores son “Los Palmeras”.1
library(googlesheets4)
library(tidyverse)
library(gargle)
library(tidytext)
library(wordcloud2)
library(tm)
library(funModeling)
library(scales)
library(xaringan)
library(gt)
# Estilos para los gráficos
zy <- theme(panel.background = element_blank(),
panel.grid.major.y = element_line(colour = "#F4F6F6"),
axis.line = element_line(colour = "grey"))
zx <- theme(panel.background = element_blank(),
panel.grid.major.x = element_line(colour = "#F4F6F6"),
axis.line = element_line(colour = "grey"))
letraPalmeras <- sheets_read("1FuU9kcPxJA37PGomv5zZzFrzchibEe-WDJ36Ty9vhHg")
letraPalmeras %>%
mutate(Comentarios = as.character(Comentarios))## # A tibble: 40 x 1
## Comentarios
## <chr>
## 1 Ella se agita, toda noche mueve la cinturita
## 2 Y pa' colmo usa pollera cortita
## 3 Y el meneo la levanta todita
## 4 Ella bonita, baila, mueve, se menea, te excita
## 5 Cuando se le va parando solita
## 6 Ella sigue porque sabe que irrita
## 7 Es que ella tiene un bombón asesino
## 8 Se sabe un bombón bien latino
## 9 Es que es un bombón suculento
## 10 Con ese bombón casamiento
## # ... with 30 more rows
Para trabajar con la letra, realizamos una serie de procesos, los cuales nos permiten acceder a una base de datos, compuesta por los siguientes elementos:
Tenemos un archivo inicial para trabajar compuesto por 1 columna y 40 filas.
Como sabemos, hay palabras que encontramos en los discursos que no sirven para un análisis, por ejemplo “y”, “o”, “lo”… Todas estas palabras las eliminamos de nuestras bases.
letraPalmeras_vacio <- letraPalmeras %>%
anti_join(vacias)Nos interesa ver la frecuencia en la que aparecen las palabras en la canción.
Lo podemos observar en forma de tabla:
letraPalmeras_vacio %>%
count(palabra, sort = TRUE) %>%
gt %>%
tab_header(title = "Frecuencia") %>%
tab_source_note(source_note = "Elaboración Propia")%>%
cols_label(palabra = "Palabra",
n="Cantidad")| Frecuencia | |
|---|---|
| Palabra | Cantidad |
| bombón | 28 |
| sabe | 8 |
| mueve | 7 |
| menea | 5 |
| asesino | 3 |
| bien | 3 |
| casamiento | 3 |
| insaciable | 3 |
| masticable | 3 |
| parece | 3 |
| quiere | 3 |
| seguro | 3 |
| suculento | 3 |
| tiene | 3 |
| agita | 2 |
| baila | 2 |
| bonita | 2 |
| cinturita | 2 |
| colmo | 2 |
| cortita | 2 |
| irrita | 2 |
| latino | 2 |
| levanta | 2 |
| meneo | 2 |
| noche | 2 |
| pa | 2 |
| parando | 2 |
| pollera | 2 |
| sigue | 2 |
| solita | 2 |
| todita | 2 |
| usa | 2 |
| va | 2 |
| excita | 1 |
| exita | 1 |
| latinos | 1 |
| Elaboración Propia | |
–
También lo podemos visualizar en forma grafica:
letraPalmeras_vacio %>%
count(palabra, sort = TRUE) %>%
filter(n>1) %>%
ggplot(aes(x= reorder(palabra, n), y = n, fill = n))+
geom_bar(stat = 'identity') +
scale_fill_gradient(low = "#D6DBDF", high = "#34495E")+
zx+
labs(title= "El Bombón",
subtitle = "Autor: Los Palmeras",
x="", y="Cantidad de apariciones") +
coord_flip()Como podemos observar, hay una palabra “Bombón” que es la que más se repite. Pero también hay un patrón de frecuencia en las palabras restantes. La intensidad de frecuencia que le damos a una palabra en un discurso, tiene un objetivo determinado. Tendremos que analizar si luego de realizada la comunicación en cuestión, el objetivo fue alcanzado o no.
Con la presente pieza musical podemos armar una nube de palabras.
¿Para qué usar una nube? Porque queda divino
Más allá de lo estético, las nubes de palabras nos sirven visualmente para observar aquellas palabras/categorías con mayor/menor presencia en el discurso analizado.
Por ejemplo: La empresa quiere cambiar su politica de beneficios. Para ello hace una consulta a sus colaboradores sobre qué beneficios valorarían más. Luego utiliza la nube de palabras para demostrar que la empresa accedió a otorgar aquellos beneficios con mayor cantidad de votos.
¿ Se te ocurren otros casos de uso? Contanos en comentarios.
Volviendo a nuestra canción, podemos observar que “Bombón” es la que más veces aparece. En menor medida, pero con una frecuencia alta aparece “Menea” y “Sabe” y “Mueve”.
letraPalmeras_vacio %>%
count(palabra,sort = TRUE) %>%
ungroup() %>%
wordcloud2(size = 0.6, shape = "cardioid")Hasta acá no hablamos de sentimientos, los podriamos analizar?
Cuando analizamos una comunicación podemos observar la relación que hay entre las palabras utilizadas y los sentimientos.
Por ejemplo: Si en una encuesta de clima tenemos palabras o frases como “Conforme”, “Recomendaría”, “Me encanta”, podemos relacionarlo con un sentimiento Positivo. En cambio si aparece “Injusto”, “Desagradable”, “Angustia”, podemos relacionarlo con uno Negativo.
Nos reservamos el análisis de sentimientos para la próxima. 🤗
Se te ocurre en qué texto sería interesante analizar los sentimientos? Dejalo en comentarios o mandame por privado
Llegamos al final. Gracias por estar ahi.👏
Contacto: http://linktr.ee/Yanel.Paulette/
No es mi objetivo entrar en debate respecto al significado de la letra, su interpretación, ni tampoco realizar una critica artística. Solo quiero usar los datos y que sean fácilmente visibles al lector.↩︎