Es un método para visualizar la distribución de datos numéricos de diferentes variables. Es similar a Box Plot pero con un gráfico rotado a cada lado, lo que brinda más información sobre la estimación de densidad en el eje y.
Un diagrama de violín se utiliza para visualizar la distribución de los datos y su densidad de probabilidad.
Para mostrar la distribución del digrama de violin la variable correcta es la categórica la cual permite clasificar una serie de datos por medio de valores fijos asociados a una cualidad o categoría concreta. La variable categórica, a diferencia de las variables cardinales o continuas (que permiten cálculos numéricos), clasifica a los individuos o casos. Normalmente toman valores representados por números enteros, como el uno o el cero, pero estos son solo eso, representaciones.
library(ggplot2)
data("ToothGrowth")
ggplot(ToothGrowth) +
aes(x = dose, y = len) +
geom_violin()
# DIGRAMA EN R