caso vehículos
¿Que tipo de vehículo puede ser más adecuado para los siguientes tipos de clientes? Considere su experiencia y la información disponible en el conjunto de datos de vehículos a continuación (BD mpg)
Familia con niños en edad escolar que viven fuera de la ciudad
Ingeniero constructor con varias obras en municipios del departamento
Estudiante universitario
Pensionado
Dendrograma
Es un tipo de representación gráfica o diagrama de datos en forma de árbol que organiza los datos en subcategoras que se van dividiendo en otros hasta llegar al nivel de detalle deseado (asemejándose a las ramas de un árbol que se van dividiendo en otras sucesivamente). Este tipo de representación permite apreciar claramente las relaciones de agrupación entre los datos e incluso entre grupos de ellos aunque no las relaciones de similaridad o cercana entre categorías. Observando las sucesivas subdivisiones podemos hacernos una idea sobre los criterios de agrupación de los mismos, la distancia entre los datos según las relaciones establecidas, etc. También podramos referirnos al dendrograma como la ilustración de las agrupaciones derivadas de la aplicación de un algorítmo de clustering jerárquico.
Librerias: ggplot /ggdendro/ reshape2/ protoclust
library (ggplot2)
#head(mpg)
Vamos a trabajar con un año específico y en este, solo seleccionando los casos completos del conjunto de datos: con registros incompletos, el algoritmo de cluster puede lanzar errores o excepciones.
# subconjunto de datos del dataset(mpg) completo(año 2008, categoria vehiculo suv)
vehic2008<- subset(mpg, mpg$year==2008 & mpg$class=='suv')
# Seleccionamos datos completos (filas con información completa al cruzar con columnas). Lo que decimos con los [] es llamar las filas, solamente las que estén completas, columnas, todas.
vehic2008<- vehic2008[complete.cases(vehic2008),]
# revisamos 3 primeras columnas
head(vehic2008,3)
## # A tibble: 3 x 11
## manufacturer model displ year cyl trans drv cty hwy fl class
## <chr> <chr> <dbl> <int> <int> <chr> <chr> <int> <int> <chr> <chr>
## 1 chevrolet c1500 sub~ 5.3 2008 8 auto(~ r 14 20 r suv
## 2 chevrolet c1500 sub~ 5.3 2008 8 auto(~ r 11 15 e suv
## 3 chevrolet c1500 sub~ 5.3 2008 8 auto(~ r 14 20 r suv