Análisis en relación a salarios usando K-means
Caso de estudio
El set de datos Wage del paquete ISRL contiene información sobre 3000 trabajadores. Se comparara el salario de los empleados con sus otras caracteristicas (educación, sector de trabajo, etc…) para determinar en base al salario, que variable se puede representar correctamente. Para encontrar la relación correcta se utilizara el método de K-means con cada una de las variables.
Salario de diferentes personas
Paquetes
library(pacman)
p_load("ISLR", "ggplot2", "xfun","DT", "cluster", "prettydoc")
Salario <- WageDatos
datatable(Salario)Comprobación de hipótesis con k-means.
Utilizando k-means se determinara si es posible predecir si una persona tiene o no tiene seguro médico utilizando como dato de entrada cuanto gana.
La hipótesis es que las personas más adineradas tienen seguro médico dado que pueden costearlo.
Estudio de variable de seguro médico (health insurance)
set.seed(101)
clusterSeguro <- kmeans(Salario[,11], center=2, nstart = 20 )
clusterSeguro## K-means clustering with 2 clusters of sizes 847, 2153
##
## Cluster means:
## [,1]
## 1 160.86502
## 2 92.36329
##
## Clustering vector:
## [1] 2 2 1 1 2 1 1 2 2 1 2 2 2 1 1 2 2 1 1 2 1 2 2 1 2 1 2 2 2 2 1 2 2 2 2 2 2
## [38] 2 2 2 2 2 2 2 2 1 1 1 2 2 1 2 1 2 2 2 1 1 2 2 1 2 2 2 2 2 1 1 2 2 2 2 2 2
## [75] 2 2 1 2 2 2 1 2 2 2 2 2 2 2 1 1 1 2 2 2 2 2 2 1 1 1 2 2 2 2 2 2 2 2 1 2 2
## [112] 2 2 2 2 2 2 1 1 2 2 2 1 1 2 2 1 2 2 2 2 1 1 2 1 2 2 2 2 2 2 2 2 2 2 2 1 1
## [149] 1 2 2 1 2 2 1 1 2 1 2 2 2 2 2 2 1 1 2 2 2 1 2 2 1 1 1 2 1 2 1 2 1 2 2 2 1
## [186] 2 2 2 2 2 1 2 2 2 1 1 2 1 2 2 2 1 2 2 2 2 1 1 1 2 1 2 1 2 2 2 1 2 2 2 2 2
## [223] 2 1 2 2 2 2 1 2 2 2 2 1 2 2 1 2 2 2 2 1 2 2 2 2 2 2 2 2 2 1 2 2 2 2 2 2 1
## [260] 2 2 1 2 2 2 1 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 1 2 2 2 1 2 2 2 2 1 2 2 2
## [297] 2 2 1 2 2 2 2 2 1 1 2 2 2 2 2 2 2 2 1 2 2 2 2 2 1 2 2 2 2 2 1 2 2 2 1 1 2
## [334] 2 1 2 2 2 2 2 1 2 2 2 1 2 2 1 1 1 1 1 2 2 1 2 2 2 2 2 2 1 1 2 2 2 2 2 1 1
## [371] 2 2 1 1 2 1 2 2 2 2 1 1 1 1 2 2 2 1 2 2 2 2 2 2 2 2 2 2 2 2 1 2 2 2 2 2 1
## [408] 2 2 1 1 2 2 2 1 2 2 2 1 2 2 2 1 1 1 1 2 2 2 1 2 2 1 2 2 2 2 2 1 2 2 2 1 2
## [445] 2 2 2 1 1 1 2 1 2 2 2 1 2 1 1 1 2 2 2 1 2 2 2 2 2 1 2 2 2 2 1 2 2 2 2 1 2
## [482] 1 2 2 2 2 2 2 2 1 2 2 2 2 2 2 1 2 2 2 2 2 1 1 2 1 2 2 2 2 2 1 2 2 2 1 2 1
## [519] 2 1 2 1 1 2 2 1 1 1 2 2 2 2 2 1 2 1 2 2 2 2 2 2 1 2 1 2 2 2 2 2 2 2 1 1 2
## [556] 2 2 2 2 2 2 2 2 1 2 1 2 2 2 2 1 2 2 2 2 2 2 2 2 2 1 2 2 2 2 2 1 1 2 2 2 2
## [593] 2 2 2 2 2 2 1 2 2 2 1 1 1 2 2 2 1 2 2 2 1 2 2 2 2 2 2 1 1 2 2 2 1 2 2 1 1
## [630] 1 2 1 1 2 2 1 2 2 2 1 2 2 1 2 2 1 2 2 2 2 1 2 1 2 1 2 2 1 2 2 2 2 2 2 2 2
## [667] 1 2 1 2 1 2 1 2 2 2 2 2 2 1 1 2 1 2 2 2 1 2 1 2 2 1 2 1 2 2 2 1 1 2 2 2 1
## [704] 2 1 1 2 2 2 2 2 2 2 2 2 2 2 1 2 2 2 2 2 1 2 2 2 2 1 2 1 1 1 1 1 2 2 2 2 1
## [741] 2 2 2 2 2 2 1 2 1 2 2 1 2 2 2 2 1 1 2 2 1 2 2 2 2 2 2 1 1 1 2 2 2 1 2 2 2
## [778] 2 1 2 1 2 1 2 1 2 2 1 1 1 2 1 1 2 2 2 1 1 2 1 2 1 2 1 2 2 1 2 2 1 2 2 2 2
## [815] 2 2 2 1 2 1 2 2 2 2 2 2 2 2 1 1 1 1 1 2 2 2 2 2 1 2 2 2 2 2 1 2 2 2 2 1 2
## [852] 2 2 2 2 1 2 1 2 2 2 1 1 1 2 2 1 1 2 1 2 2 2 2 2 2 2 2 2 2 1 2 2 2 2 2 2 2
## [889] 2 2 2 2 1 2 2 2 2 2 1 2 2 1 1 2 2 2 1 1 2 2 2 1 2 2 1 2 1 2 2 2 1 2 2 2 2
## [926] 1 2 2 2 1 2 2 2 2 1 2 2 2 2 2 2 2 2 1 2 1 1 2 2 2 1 1 2 1 2 1 1 2 2 2 2 1
## [963] 2 2 2 1 2 1 1 2 2 1 2 2 2 2 1 1 2 2 2 1 1 2 2 2 2 2 2 2 2 2 2 2 2 1 2 2 2
## [1000] 1 2 2 2 2 2 2 2 2 2 2 2 2 2 1 1 1 1 2 2 2 2 1 2 2 2 2 1 2 2 1 2 2 2 2 2 2
## [1037] 1 2 2 1 2 2 2 2 2 1 2 1 2 1 2 2 2 2 2 1 2 2 2 1 1 2 2 2 2 2 2 2 2 2 2 2 2
## [1074] 2 2 2 2 1 2 2 1 2 1 2 1 2 2 2 2 2 2 2 2 2 2 2 1 2 2 1 2 1 2 2 2 2 1 2 2 2
## [1111] 2 1 1 2 2 2 2 2 1 2 2 1 2 1 2 2 2 1 2 1 2 2 2 2 2 2 2 2 1 2 2 1 2 2 2 2 2
## [1148] 2 1 2 2 2 1 2 2 2 2 2 2 2 2 1 1 1 2 2 2 2 2 2 2 2 2 2 2 2 2 1 1 1 2 2 1 2
## [1185] 1 1 2 1 2 1 2 1 1 2 2 1 2 1 1 1 1 2 2 2 1 2 2 2 2 2 1 2 1 2 1 2 2 2 2 1 1
## [1222] 2 1 2 2 1 1 2 2 1 2 2 2 1 2 2 2 2 1 1 2 2 2 2 2 2 2 1 2 2 1 1 2 2 2 2 1 2
## [1259] 2 1 2 2 2 2 2 1 2 2 1 2 2 1 2 1 2 1 2 1 2 2 2 1 1 1 2 2 2 1 1 2 2 2 2 1 2
## [1296] 2 1 2 2 2 1 2 2 1 2 1 2 1 2 1 2 2 1 2 1 2 2 2 2 2 2 2 2 2 2 1 1 2 2 2 2 1
## [1333] 2 2 2 2 1 2 2 2 2 2 1 1 2 1 2 2 2 2 1 2 1 2 2 1 2 2 2 1 2 2 2 2 1 2 2 2 2
## [1370] 2 1 1 2 2 1 2 2 1 2 1 2 2 2 2 2 1 2 1 2 2 2 1 2 2 2 2 2 2 2 1 1 2 2 2 2 2
## [1407] 2 2 2 1 1 2 1 2 2 2 2 2 1 2 1 2 1 2 2 2 2 1 2 2 2 2 2 2 2 1 2 2 2 2 2 1 2
## [1444] 2 2 2 2 2 2 2 1 1 1 2 2 2 2 2 2 2 2 2 2 2 1 2 2 2 2 2 2 2 1 2 1 1 2 2 2 2
## [1481] 1 1 2 1 1 1 2 1 2 2 2 2 2 2 2 2 1 1 2 1 2 2 2 2 2 1 1 1 2 2 2 1 1 1 2 1 2
## [1518] 2 2 2 2 2 2 2 2 2 2 2 2 1 2 2 2 2 2 2 2 2 2 2 2 2 1 2 2 2 2 2 1 2 2 2 1 1
## [1555] 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 1 2 2 2 2 2 2 2 2 1 2 1 1 2 2 1 2 1 2 2 2 2
## [1592] 2 2 2 2 2 2 2 2 2 2 1 2 2 1 2 1 1 2 2 2 2 2 2 2 2 1 1 2 2 1 2 2 2 2 2 2 2
## [1629] 2 2 2 2 1 2 2 1 1 1 2 2 2 2 1 2 2 2 2 2 1 2 2 1 1 2 1 2 2 2 2 2 2 1 2 2 2
## [1666] 2 2 1 2 1 2 2 2 1 2 2 2 1 1 2 1 2 2 2 2 1 1 2 2 2 2 1 2 1 2 2 1 1 2 2 2 1
## [1703] 2 1 1 2 2 2 2 2 2 1 1 2 1 2 1 2 2 2 1 2 2 1 2 2 2 2 2 2 2 2 2 2 1 2 2 2 2
## [1740] 2 2 1 2 1 2 2 2 1 2 2 2 2 1 1 1 1 2 2 2 2 2 2 2 1 2 2 2 2 1 2 2 2 2 2 1 2
## [1777] 1 2 2 2 1 2 2 2 2 2 1 2 2 2 2 2 2 2 1 1 2 2 2 2 2 2 2 2 2 2 1 1 2 1 2 2 2
## [1814] 2 1 2 2 2 2 2 2 2 1 2 1 2 2 1 1 2 2 2 2 1 1 2 2 2 2 2 2 1 2 2 2 2 2 2 2 2
## [1851] 2 2 2 2 2 2 2 1 1 2 2 2 2 1 1 2 2 2 2 1 1 2 1 1 1 2 2 2 2 2 1 2 1 2 1 2 2
## [1888] 2 2 2 2 1 2 2 2 1 1 2 2 2 2 2 2 1 2 2 2 2 2 2 2 2 2 1 2 2 2 2 2 2 2 2 2 1
## [1925] 2 2 2 2 1 1 1 2 2 2 1 2 2 2 2 2 2 2 2 1 2 1 1 2 1 2 2 2 2 1 2 2 1 2 2 2 1
## [1962] 2 1 2 2 2 2 2 2 1 1 2 1 2 2 2 2 1 1 1 1 2 2 2 1 2 2 2 2 1 2 1 2 1 2 1 2 1
## [1999] 2 1 2 2 2 1 2 1 1 2 2 1 2 2 2 2 2 2 1 2 1 1 2 2 2 2 2 2 1 2 2 1 2 1 2 2 2
## [2036] 2 1 1 2 1 2 1 2 2 2 2 2 2 2 2 2 2 1 1 2 1 2 2 1 2 1 2 1 2 1 2 2 2 1 1 2 2
## [2073] 2 2 2 1 2 2 2 2 2 2 2 2 1 1 1 2 2 2 2 1 2 2 2 2 2 2 2 2 2 1 1 2 2 2 2 1 1
## [2110] 2 1 2 2 2 1 1 1 2 2 2 1 2 2 2 1 2 2 2 2 2 2 2 1 2 2 2 2 1 2 2 2 2 1 2 2 2
## [2147] 1 2 1 2 2 1 2 2 2 1 2 1 2 1 2 2 2 2 2 2 2 2 2 2 2 1 1 1 1 2 2 2 2 1 2 1 1
## [2184] 2 1 2 2 1 2 2 1 2 2 1 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 1 2 2 2 2 1 2
## [2221] 2 1 2 1 2 2 1 1 1 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 1 2 2 2 2 2 2 2 2 1 2 2
## [2258] 1 2 2 2 1 2 2 1 2 2 2 2 1 2 1 1 2 2 2 2 2 1 2 1 1 2 1 2 2 1 2 1 2 1 2 2 2
## [2295] 2 2 2 2 2 1 2 2 2 1 2 2 2 1 2 1 1 1 2 2 1 2 2 2 1 1 2 2 2 2 1 2 2 2 2 2 2
## [2332] 1 1 2 1 2 1 2 2 1 2 2 2 2 2 2 2 2 1 2 2 1 1 2 1 2 2 1 2 2 2 1 2 2 2 1 2 2
## [2369] 1 1 2 1 2 2 2 1 1 2 2 2 2 1 1 2 1 2 1 2 1 1 2 2 2 2 2 2 1 2 1 2 2 2 2 1 2
## [2406] 2 2 2 2 2 2 2 2 2 2 2 1 2 2 1 2 2 2 2 2 1 1 2 2 2 2 2 2 1 2 2 1 2 1 2 2 2
## [2443] 2 1 1 1 2 2 2 1 1 1 2 2 2 2 2 1 2 2 1 1 2 2 2 2 1 2 2 2 2 1 1 2 2 1 1 1 2
## [2480] 2 2 1 2 2 2 2 2 1 2 2 2 2 1 2 2 2 2 1 2 2 1 2 2 2 2 1 1 2 2 2 2 2 2 2 2 2
## [2517] 2 2 1 2 1 2 2 1 2 2 2 2 2 2 2 1 1 2 2 1 2 2 2 2 2 2 2 1 2 2 1 1 2 2 2 2 2
## [2554] 2 1 2 1 1 2 2 2 1 1 2 1 1 2 2 1 2 2 2 1 2 2 2 2 2 2 2 1 2 1 1 2 2 2 1 1 2
## [2591] 2 2 2 2 2 1 2 2 2 2 2 2 1 1 1 2 1 1 2 2 1 2 2 2 2 1 2 1 2 2 1 2 2 2 1 2 2
## [2628] 2 2 1 1 2 1 2 2 2 2 2 2 2 1 2 1 2 1 2 1 1 2 1 2 2 2 2 2 2 1 2 2 2 1 2 1 1
## [2665] 2 2 2 1 1 1 2 2 2 2 2 1 2 2 2 2 1 2 2 2 2 1 1 2 2 1 1 2 1 2 1 2 1 1 2 2 1
## [2702] 2 1 2 1 1 2 2 2 1 2 2 1 2 2 1 2 2 2 1 2 2 1 1 2 1 1 1 1 2 2 2 1 1 2 2 2 2
## [2739] 2 2 2 1 1 2 2 2 2 2 1 2 2 2 1 1 2 2 2 2 2 1 2 2 2 2 2 2 2 2 1 2 2 2 2 1 1
## [2776] 2 1 2 2 1 2 2 1 2 1 2 2 2 2 1 2 2 2 2 1 2 1 2 2 1 2 1 2 1 1 1 2 2 1 2 2 2
## [2813] 2 2 1 2 2 2 2 1 1 1 2 2 2 2 1 2 2 1 1 1 1 1 1 2 1 2 2 2 1 1 1 2 2 2 1 2 2
## [2850] 1 2 2 2 2 2 2 1 1 1 2 2 2 2 1 2 2 2 1 2 2 2 2 2 2 2 2 2 1 1 2 1 2 1 2 2 2
## [2887] 2 2 1 1 2 2 2 1 2 2 2 2 2 1 2 1 2 1 2 2 2 2 2 1 2 1 2 2 2 2 1 2 2 2 1 2 2
## [2924] 2 1 1 2 2 1 2 2 2 2 2 2 1 2 1 2 2 2 2 2 2 2 2 2 2 1 2 2 1 2 2 2 2 2 2 2 2
## [2961] 2 2 2 2 2 2 2 2 2 2 1 1 2 1 2 2 2 2 2 1 2 2 1 2 2 2 1 1 2 1 1 2 2 2 1 1 2
## [2998] 2 2 2
##
## Within cluster sum of squares by cluster:
## [1] 1484428.2 885265.4
## (between_SS / total_SS = 54.6 %)
##
## Available components:
##
## [1] "cluster" "centers" "totss" "withinss" "tot.withinss"
## [6] "betweenss" "size" "iter" "ifault"
table(clusterSeguro$cluster, Salario$health_ins)##
## 1. Yes 2. No
## 1 729 118
## 2 1354 799
Con la tabla anterior podemos deducir que el seguro medico no suele tan significativo hablando de salario. Se aprecia que los datos de las filas están “revueltos” por lo que no podemos obtener un modelo claro de la relación.
Representacion grafica de los clusters modelados
clusplot(Wage[,c(9,11)], clusterSeguro$cluster, color=T, shade=T, lines=0)Como se aprecia en la grafica, los clusters se de los grupos se combinan en cierto punto, haciendo muy dificil diferenciar claramente ambas variables.
Diagrama de dispersión
ggplot(Salario, aes(age, wage)) + geom_point(aes (col=health_ins), size=2)- Puntos rojos: Personas con seguro medico
- Puntos azules: Personas sin seguro medico
Con lo visto en el diagrama, no es posible diferenciar que personas tienen y quienes no cuentan con un seguro medico, por lo que se puede decir que el salario no es muy influyente en cuanto a un seguro.
Estudio de variable de raza (race)
Como siguiente de variable se utilizara la raza, la cual tomando los tiempos actuales, se podria decir que no existe una gran relación inicialmente, ya que existen infinidad de maneras de generar ingresos.
set.seed(101)
clusterRaza <- kmeans(Salario[,11], center=4, nstart = 20 )
clusterRaza## K-means clustering with 4 clusters of sizes 516, 80, 1250, 1154
##
## Cluster means:
## [,1]
## 1 157.60459
## 2 276.90658
## 3 114.06788
## 4 77.16592
##
## Clustering vector:
## [1] 4 4 3 1 4 3 1 3 3 3 3 4 4 3 3 4 4 1 3 3 1 4 4 1 4 2 4 4 3 4 1 3 4 3 4 4 4
## [38] 3 3 4 4 3 4 4 4 1 2 1 4 3 1 3 2 4 3 4 1 1 3 3 1 3 4 4 3 3 1 1 3 4 4 4 4 3
## [75] 4 3 2 4 3 4 3 3 4 4 4 4 4 4 3 3 3 3 4 3 4 3 3 1 1 1 3 3 3 4 3 4 4 4 3 3 3
## [112] 4 4 3 4 4 3 1 2 3 4 4 1 1 4 4 3 4 3 4 3 3 1 3 3 4 3 3 4 4 4 4 3 4 4 3 1 3
## [149] 1 4 4 3 4 4 1 1 4 3 3 4 3 3 4 4 1 3 4 4 4 3 4 4 1 1 1 3 1 3 1 3 3 3 3 3 1
## [186] 3 3 3 3 4 1 3 4 4 1 1 3 1 4 3 4 3 3 4 3 4 2 1 3 4 3 4 1 3 4 3 1 4 3 4 4 4
## [223] 3 1 4 3 4 4 3 3 3 3 3 1 4 4 2 4 4 4 4 3 4 3 3 4 4 3 3 4 3 3 4 3 4 3 3 4 1
## [260] 4 4 3 3 4 4 1 3 3 4 4 3 3 3 3 3 4 3 3 3 4 4 3 3 1 3 4 4 1 4 3 3 3 1 4 4 4
## [297] 4 4 1 4 4 4 4 4 3 1 4 4 4 4 4 3 4 4 3 3 4 4 3 4 3 3 4 4 4 4 1 3 4 3 1 1 4
## [334] 4 1 4 4 3 4 3 3 4 4 3 1 3 3 2 1 1 1 1 4 4 1 3 3 3 4 4 3 1 1 4 4 4 4 3 1 2
## [371] 3 4 3 2 3 3 4 3 4 4 3 1 1 1 3 4 4 3 4 4 3 3 3 3 3 4 3 3 3 4 3 4 4 3 3 4 3
## [408] 3 4 3 1 3 4 4 1 3 4 3 1 3 4 4 3 1 3 1 4 3 4 1 3 4 1 4 4 4 4 4 1 3 3 3 2 3
## [445] 4 4 4 1 3 1 4 1 3 4 3 2 3 3 1 1 4 3 4 1 3 4 4 3 3 1 3 3 4 4 3 3 3 4 4 1 4
## [482] 3 4 4 3 4 4 4 3 2 3 3 3 3 3 3 3 4 3 4 3 3 1 2 3 3 4 4 3 3 4 3 4 3 4 2 3 1
## [519] 4 1 4 3 3 4 3 1 1 1 4 4 4 3 3 1 3 2 4 4 3 4 4 3 1 4 1 4 3 3 4 4 3 3 3 1 3
## [556] 4 4 3 3 4 4 4 3 2 3 1 3 3 4 4 1 3 3 4 3 4 4 4 4 3 2 4 4 4 3 4 1 1 4 3 4 4
## [593] 3 3 4 4 3 3 1 4 4 3 1 3 3 3 4 3 3 4 3 4 1 3 4 4 3 4 3 1 1 4 3 3 3 4 3 1 1
## [630] 3 3 1 1 3 3 1 3 4 3 3 3 3 2 3 3 3 4 3 3 4 1 4 1 3 3 3 3 2 4 4 3 4 3 4 4 4
## [667] 1 3 3 4 1 4 1 3 4 4 3 4 3 1 1 3 3 3 4 4 1 4 1 3 3 1 4 1 4 4 4 1 1 4 3 3 2
## [704] 4 1 1 3 4 4 4 3 3 4 3 4 3 3 1 3 4 4 3 3 1 4 3 3 3 1 3 2 1 3 1 1 3 4 3 3 3
## [741] 4 3 4 4 3 3 3 3 1 4 4 1 4 3 4 4 1 1 4 3 2 3 4 4 3 4 3 1 3 3 3 3 3 3 4 4 3
## [778] 4 3 4 1 3 1 4 3 3 4 3 3 1 3 1 2 3 3 4 1 1 4 1 4 1 3 1 4 4 1 4 4 1 3 3 4 3
## [815] 4 3 3 1 3 1 4 3 3 3 4 4 3 4 1 3 2 1 1 3 4 3 4 3 1 4 4 4 4 3 3 4 4 3 4 1 3
## [852] 3 4 3 4 1 3 3 3 3 4 1 3 1 4 4 1 3 4 1 3 3 4 3 3 3 4 4 3 3 1 4 4 4 3 3 3 3
## [889] 3 3 3 3 1 3 4 3 4 3 1 3 4 2 3 3 4 3 3 1 3 4 4 1 4 3 3 4 2 3 4 4 1 3 3 4 3
## [926] 3 4 4 3 1 4 3 4 4 3 4 4 4 4 4 3 4 4 1 3 1 1 4 3 3 3 1 4 1 3 2 1 4 3 4 3 1
## [963] 3 3 3 3 4 1 1 4 4 1 4 3 4 3 1 1 4 4 4 1 1 4 3 3 3 3 3 4 4 3 3 4 4 1 4 4 4
## [1000] 1 4 4 4 4 4 4 3 3 3 4 4 3 3 3 1 2 1 3 4 4 4 1 3 3 4 3 1 4 4 1 4 3 4 3 4 3
## [1037] 1 4 4 3 4 3 4 4 4 3 4 1 3 3 3 3 3 3 3 1 4 3 4 3 3 3 3 4 3 3 3 3 3 4 3 4 3
## [1074] 3 4 3 4 1 4 4 3 4 3 3 2 4 4 3 3 3 4 3 4 3 4 3 1 4 4 3 4 3 4 3 3 4 3 4 3 4
## [1111] 3 3 2 4 4 3 3 4 3 3 3 3 4 3 3 3 3 2 4 1 4 4 3 3 3 3 4 4 1 4 3 3 3 4 4 4 3
## [1148] 3 3 4 3 4 1 3 4 4 4 4 3 3 3 1 1 1 4 4 3 3 3 4 4 4 4 3 4 3 4 1 1 1 4 3 3 4
## [1185] 1 1 4 3 3 1 4 3 1 4 4 3 4 1 1 3 1 3 3 4 1 3 3 4 3 4 3 4 3 4 1 3 4 4 4 1 1
## [1222] 4 3 3 3 3 3 4 4 2 4 3 4 1 3 4 4 3 3 3 4 4 4 3 3 4 4 1 3 4 1 1 3 3 3 3 1 4
## [1259] 4 1 4 3 4 4 4 1 3 4 1 4 4 2 3 1 3 1 3 3 3 4 3 2 2 1 3 3 3 1 1 3 3 3 3 2 3
## [1296] 4 1 4 3 3 3 3 3 1 3 1 4 1 3 2 4 3 1 4 3 4 4 3 4 4 4 3 4 4 4 2 3 4 4 4 3 1
## [1333] 4 3 4 3 1 4 3 3 3 3 1 1 3 1 3 4 4 3 1 4 1 4 3 1 3 4 4 3 4 3 3 4 1 4 4 3 4
## [1370] 3 3 2 3 4 3 3 4 1 4 3 3 3 3 3 3 1 3 1 3 4 4 3 3 4 3 4 4 3 4 1 3 4 3 3 4 4
## [1407] 3 3 3 3 1 3 3 4 4 3 3 4 1 4 1 3 1 3 3 3 4 1 3 4 3 3 4 3 4 1 3 4 4 3 4 1 3
## [1444] 4 3 4 3 3 4 4 3 1 1 4 3 4 4 3 4 4 4 4 3 4 1 3 4 3 3 4 4 3 3 4 1 1 4 4 4 3
## [1481] 1 1 4 2 1 3 3 1 4 4 4 4 3 4 4 4 3 1 4 3 4 4 4 3 3 1 1 1 4 4 4 3 1 1 3 1 3
## [1518] 4 3 3 4 4 4 3 4 3 3 4 3 1 4 3 4 4 4 4 4 3 3 4 4 3 1 4 4 4 3 4 1 3 3 3 3 1
## [1555] 3 4 4 4 4 4 3 4 4 3 4 4 3 4 3 1 3 4 4 3 4 4 3 4 1 3 1 1 4 4 2 3 1 3 4 4 3
## [1592] 3 4 3 4 3 3 3 4 3 4 1 3 4 3 3 1 1 4 4 3 3 4 4 4 3 3 3 3 4 1 3 4 3 4 4 4 3
## [1629] 3 3 4 3 3 3 3 2 1 1 3 4 4 3 1 4 4 4 4 4 3 4 3 3 3 4 1 3 3 3 3 3 3 3 3 4 3
## [1666] 4 3 1 4 1 4 4 4 3 3 4 3 1 3 4 1 3 3 4 4 3 2 4 3 3 3 1 4 1 3 3 3 1 4 4 3 1
## [1703] 4 1 1 3 3 3 3 4 3 1 1 4 1 3 3 3 3 4 3 3 3 1 4 4 4 4 4 3 3 4 4 3 1 4 3 3 3
## [1740] 3 3 1 4 1 3 3 3 1 4 3 4 4 1 2 1 1 4 4 4 3 3 3 3 3 4 4 4 4 3 4 3 4 3 3 1 4
## [1777] 1 3 4 3 1 4 3 4 3 4 3 4 3 3 4 4 3 4 1 1 3 4 4 3 3 4 3 3 3 4 1 3 4 1 4 4 3
## [1814] 4 1 4 3 3 4 4 3 3 1 3 3 3 3 1 2 4 3 3 4 2 1 3 3 4 4 4 4 3 3 3 4 4 4 3 4 4
## [1851] 4 4 3 3 4 4 4 3 1 3 3 4 4 1 1 4 4 3 4 3 1 3 1 1 1 4 3 3 4 4 1 3 2 4 1 4 3
## [1888] 3 3 3 3 1 4 3 3 1 1 3 3 4 3 3 4 1 3 3 4 4 4 3 3 4 4 1 3 3 4 4 4 4 3 3 4 1
## [1925] 4 4 3 4 3 1 3 3 4 3 1 4 4 3 4 3 3 4 4 1 3 1 1 3 3 3 4 4 3 1 3 4 1 3 3 4 3
## [1962] 4 3 3 3 4 4 4 3 1 1 4 3 3 3 3 3 1 3 3 3 4 4 3 2 4 4 4 4 1 4 3 4 3 3 3 3 1
## [1999] 3 1 4 4 4 1 4 3 3 4 3 3 4 3 3 4 4 3 1 4 1 2 3 3 4 4 4 3 2 4 3 3 3 1 4 4 4
## [2036] 4 1 1 4 3 3 3 4 3 4 4 3 4 3 3 3 3 1 1 3 3 4 4 1 4 3 4 1 4 3 3 4 3 1 1 3 3
## [2073] 4 4 3 1 3 4 3 4 4 4 4 4 1 1 1 3 4 3 4 3 4 3 4 4 3 4 4 4 4 1 1 4 3 3 4 1 1
## [2110] 3 2 3 4 3 1 1 2 3 3 3 3 3 3 3 1 3 3 3 4 4 4 3 1 4 3 3 3 3 4 3 4 3 1 4 3 3
## [2147] 1 3 2 3 3 1 3 3 3 1 3 1 3 3 4 3 4 4 3 4 3 4 4 4 4 1 3 1 1 4 3 3 4 1 4 1 1
## [2184] 3 1 4 4 1 3 4 1 4 3 1 4 4 4 4 4 3 4 4 3 3 3 3 4 3 3 4 4 3 3 3 4 3 4 4 3 4
## [2221] 4 3 4 1 4 4 1 1 1 4 4 4 4 4 3 3 4 3 4 4 4 4 4 3 3 1 3 4 4 3 4 3 4 4 2 4 3
## [2258] 1 4 4 3 1 3 4 2 4 3 3 3 1 4 1 2 3 3 3 4 3 3 4 1 1 3 1 4 3 2 3 1 3 1 3 3 4
## [2295] 3 4 3 4 4 1 4 4 3 1 3 3 4 1 4 1 1 1 4 4 1 4 3 4 3 1 3 4 4 4 1 4 4 4 3 4 4
## [2332] 1 1 4 1 3 3 4 3 1 3 3 4 4 4 3 4 4 1 4 3 2 1 4 1 3 3 1 3 4 3 1 3 3 3 3 4 4
## [2369] 2 2 3 1 3 4 4 1 1 4 3 3 4 2 1 3 1 3 3 3 3 1 3 3 4 3 4 3 2 4 3 4 4 3 3 1 4
## [2406] 4 3 4 3 4 3 4 4 4 3 4 1 3 3 1 3 3 3 4 4 1 3 3 3 4 3 4 3 3 3 3 3 4 1 4 3 4
## [2443] 4 3 1 3 3 4 4 1 1 1 4 4 4 4 4 3 4 4 3 1 3 3 4 3 1 4 4 3 3 2 1 3 3 1 3 2 3
## [2480] 4 3 3 4 4 4 3 4 3 3 4 3 3 1 3 4 3 4 3 4 4 1 4 4 4 4 1 1 4 3 4 4 4 3 3 4 3
## [2517] 4 4 3 3 1 3 4 2 3 4 3 4 3 4 3 2 2 4 3 1 4 4 3 4 3 3 4 3 3 3 1 1 3 4 4 4 3
## [2554] 4 3 4 1 1 4 3 3 1 1 3 1 3 3 3 3 4 4 4 1 3 3 3 3 4 4 4 1 3 3 3 4 4 4 3 3 3
## [2591] 3 3 3 4 4 3 3 3 3 3 3 4 1 1 1 3 1 1 3 4 1 4 4 3 3 3 4 3 4 4 1 3 3 3 1 4 4
## [2628] 4 4 1 3 4 1 3 3 4 4 3 4 4 1 3 3 4 1 4 3 1 4 3 4 4 3 4 4 3 1 4 4 4 3 4 1 1
## [2665] 4 3 3 3 1 1 4 4 4 4 4 3 4 4 3 3 2 4 3 4 4 2 1 3 3 2 3 3 2 4 2 3 1 3 4 4 3
## [2702] 3 1 4 1 2 4 3 4 3 3 4 2 4 4 1 4 3 4 1 4 3 1 1 3 3 1 3 3 4 4 4 3 3 4 4 3 4
## [2739] 4 3 4 3 3 3 3 4 3 3 1 4 4 4 1 1 3 3 3 4 3 1 4 4 3 4 3 3 4 3 1 3 4 3 3 3 1
## [2776] 3 1 4 4 1 3 4 1 3 1 3 3 3 3 1 4 4 4 3 1 3 2 4 4 3 3 3 4 1 1 3 4 4 1 3 3 3
## [2813] 3 4 1 3 4 3 3 3 1 3 4 3 4 4 1 3 4 1 1 3 3 1 2 3 3 3 4 4 1 1 1 4 4 3 1 3 3
## [2850] 1 3 4 4 3 3 4 1 1 1 4 4 3 4 1 4 4 4 3 4 4 4 3 3 3 4 4 3 3 3 3 2 4 3 4 4 4
## [2887] 3 4 3 1 3 3 4 2 4 4 4 4 4 1 4 1 4 3 4 4 4 4 4 1 3 3 4 4 3 3 1 3 4 4 1 3 4
## [2924] 4 3 2 3 3 1 3 3 3 3 3 3 1 4 1 4 4 3 3 4 4 3 4 3 3 1 4 3 1 3 3 4 4 3 4 3 3
## [2961] 4 4 3 4 4 4 4 4 4 4 1 3 4 1 3 3 4 4 4 1 4 4 3 4 3 4 3 1 3 1 3 3 3 3 3 1 3
## [2998] 4 4 4
##
## Within cluster sum of squares by cluster:
## [1] 155083.82 14406.08 154690.20 243845.24
## (between_SS / total_SS = 89.1 %)
##
## Available components:
##
## [1] "cluster" "centers" "totss" "withinss" "tot.withinss"
## [6] "betweenss" "size" "iter" "ifault"
table(clusterRaza$cluster, Salario$race)##
## 1. White 2. Black 3. Asian 4. Other
## 1 438 23 51 4
## 2 68 5 7 0
## 3 1058 114 71 7
## 4 916 151 61 26
En base a la tabla no se pueden obtener grandes resultados, sin embargo, se puede notar una gran diferencia de personas entre la primera y las demas columnas, lo cual puede que afecte al modelo.
clusplot(Salario[,c(4,11)], clusterRaza$cluster, color=T, shade=T, lines=0)Diagrama de dispersión
ggplot(Salario, aes(age, wage)) + geom_point(aes (col=race), size=4)- Puntos rojos: blancos
- Puntos verdes: negros
- Puntos azules: asiaticos
- Puntos morados: otros
Lo que se puede apreciar es es que existe una cantidad desproporcionada de personas blancas en constraste con las demas, haciendo que sea imposible diferencias claramente en base al salario de una persona obtener su raza, aunque es posible notar que entre las personas con mayor salario se encuentran más personas negras.
Estudio de variable de educación (education)
En primera instancia se podria decir sin pensar mucho que la educiación de una persona es bastante influyente en el salario de una persona, pero hoy en dia una persona sin muchos estudios tambien puede generar grandes ingresos, por lo que posiblemente no sera una variable util.
set.seed(101)
clusterEdu <- kmeans(Salario[,11], center=5, nstart = 20)
clusterEdu## K-means clustering with 5 clusters of sizes 80, 707, 1049, 383, 781
##
## Cluster means:
## [,1]
## 1 276.90658
## 2 68.96630
## 3 98.21798
## 4 163.61342
## 5 126.12614
##
## Clustering vector:
## [1] 2 2 5 4 2 5 4 3 5 5 5 2 3 5 5 3 2 4 5 3 4 2 3 4 3 1 3 2 5 2 4 3 2 3 3 3 3
## [38] 3 3 2 2 3 2 2 2 4 1 4 2 5 4 3 1 2 5 2 4 4 3 3 4 5 2 3 5 5 4 4 3 2 3 2 2 3
## [75] 3 3 1 2 5 3 5 3 2 2 3 2 3 2 5 5 5 3 2 3 2 3 3 4 4 4 5 5 3 2 5 3 3 2 5 5 5
## [112] 2 2 3 3 3 5 4 1 3 3 3 4 5 3 2 5 3 5 2 3 5 5 5 5 2 3 5 3 3 2 3 3 2 2 5 4 5
## [149] 4 2 3 5 2 2 4 5 2 5 3 2 5 5 2 2 5 5 2 3 3 5 2 2 4 4 4 3 4 3 5 5 5 3 3 5 4
## [186] 3 3 3 3 3 4 3 2 3 4 4 5 4 3 5 2 5 5 2 5 3 1 5 5 2 5 2 4 3 2 5 4 2 3 2 2 3
## [223] 3 4 2 3 3 3 5 3 3 3 5 4 2 2 1 2 2 2 2 5 2 5 5 2 2 3 3 2 3 5 2 5 2 3 3 2 5
## [260] 3 2 5 3 3 3 4 3 3 2 2 5 3 3 5 3 3 3 5 5 2 2 5 5 4 3 3 3 5 2 5 3 5 4 2 3 2
## [297] 3 2 4 3 2 2 2 2 5 4 2 2 3 3 2 5 2 3 5 5 3 2 5 2 5 5 3 2 3 3 5 3 2 3 4 5 2
## [334] 2 4 3 3 3 2 5 5 3 2 5 4 3 3 1 5 4 5 4 3 3 4 5 3 3 2 3 5 4 4 3 2 2 3 5 4 1
## [371] 3 2 5 1 3 5 3 5 2 3 5 4 4 5 5 2 2 5 2 2 3 5 3 3 5 3 5 5 3 3 5 3 2 3 3 3 5
## [408] 3 2 5 5 3 3 3 5 5 3 5 4 3 3 2 5 4 5 4 3 5 3 4 3 3 4 2 2 2 3 3 5 3 5 5 1 3
## [445] 2 3 3 4 5 4 3 4 5 2 3 1 3 5 4 4 2 3 2 5 5 2 2 3 3 4 3 3 2 3 5 3 3 2 2 4 2
## [482] 5 2 2 3 2 2 3 5 1 5 3 3 3 5 5 5 2 3 2 5 3 4 1 3 5 3 2 3 5 3 5 2 3 2 1 3 4
## [519] 3 4 2 5 5 2 3 4 4 5 2 2 2 3 3 4 3 1 3 3 3 2 2 3 4 3 4 2 3 3 3 2 3 5 5 4 3
## [556] 2 3 3 5 2 3 2 3 1 3 4 5 3 3 2 4 3 5 2 3 2 3 2 3 3 1 3 2 3 3 2 4 4 2 5 2 3
## [593] 3 3 2 2 3 3 4 2 3 3 4 5 5 5 3 3 5 3 3 2 4 3 3 2 3 3 3 4 4 2 3 3 5 2 5 5 5
## [630] 5 5 4 4 3 3 4 3 2 5 5 3 5 1 5 3 5 2 5 5 2 4 2 5 5 5 5 3 1 3 3 3 2 3 3 2 3
## [667] 4 3 5 3 4 2 5 5 2 3 3 3 3 4 5 3 5 5 2 2 5 2 4 3 3 4 2 4 2 3 2 4 5 2 5 5 1
## [704] 2 4 4 5 3 3 2 5 3 3 5 2 3 5 5 5 2 3 3 3 4 3 5 3 5 4 5 1 4 5 4 4 5 3 3 3 5
## [741] 3 5 3 3 3 5 5 3 4 3 3 4 2 5 3 3 4 4 2 5 1 3 2 3 3 2 5 4 5 5 5 5 5 5 2 2 3
## [778] 2 5 3 4 3 4 2 5 5 3 5 5 4 5 4 1 3 3 3 4 4 3 5 2 5 5 4 3 3 5 2 2 4 5 5 2 3
## [815] 2 3 3 4 3 4 2 3 5 3 3 2 5 2 5 5 1 4 4 5 2 5 2 5 5 2 3 2 3 5 5 2 2 3 2 4 3
## [852] 3 2 3 2 4 3 5 3 3 2 4 5 4 3 2 5 5 2 4 5 5 3 3 5 5 2 2 3 3 5 2 2 2 5 5 3 5
## [889] 5 5 3 3 4 5 3 3 2 3 4 5 2 1 5 3 3 3 5 4 5 2 2 4 2 5 5 3 1 3 3 2 4 3 3 2 3
## [926] 5 3 2 5 4 2 5 2 2 5 2 2 3 3 2 5 2 2 4 3 5 5 2 3 3 5 4 2 5 3 1 4 3 3 2 5 4
## [963] 5 3 3 5 3 5 4 3 2 4 2 3 2 5 5 4 3 2 2 4 4 3 3 3 3 5 3 3 2 3 5 3 3 5 2 3 3
## [1000] 5 3 3 2 3 2 3 5 3 3 2 3 3 5 5 4 1 4 5 2 3 2 5 3 3 3 5 4 3 2 4 2 3 3 3 3 3
## [1037] 4 2 3 5 2 3 2 3 3 5 2 4 5 5 5 5 5 5 5 4 2 3 3 5 5 3 5 2 5 3 3 3 5 3 3 2 3
## [1074] 3 2 5 2 5 2 2 5 2 5 3 1 2 2 5 5 3 2 5 2 5 2 5 4 2 2 5 2 5 3 5 3 3 5 2 3 3
## [1111] 5 5 1 2 3 3 3 3 5 3 3 5 2 5 3 3 3 1 3 4 3 3 3 3 3 3 3 3 4 3 5 5 3 3 2 2 3
## [1148] 3 5 3 3 2 5 3 3 3 3 2 5 3 3 5 4 4 2 2 3 5 5 3 3 3 2 3 3 3 2 4 5 4 3 3 5 2
## [1185] 5 4 2 5 3 4 2 5 4 3 3 5 2 4 4 5 4 3 5 3 4 3 5 2 3 2 5 2 5 3 4 5 3 2 3 5 4
## [1222] 3 5 5 3 5 5 3 2 1 2 3 3 4 3 3 2 5 5 5 3 2 2 5 3 3 2 5 5 2 5 4 5 5 5 3 5 2
## [1259] 3 4 2 3 2 2 2 5 3 2 5 2 2 1 5 4 5 4 3 5 3 3 3 1 1 4 3 5 5 4 4 3 3 3 3 1 3
## [1296] 3 5 2 3 3 5 5 5 4 5 5 3 4 5 1 2 3 4 3 5 3 2 3 2 2 2 5 2 2 2 1 5 2 2 2 3 4
## [1333] 3 5 3 5 4 2 3 3 3 3 5 4 5 4 3 2 2 3 5 2 4 2 3 4 5 2 3 5 3 3 3 3 5 3 3 3 2
## [1370] 5 5 1 3 2 5 5 2 5 3 5 5 3 5 3 3 4 5 4 3 3 2 5 5 2 3 3 3 5 2 5 5 2 3 3 3 2
## [1407] 5 3 5 5 4 5 5 3 2 3 3 2 4 2 4 5 4 3 5 5 2 4 3 2 3 3 3 3 3 4 5 3 3 3 3 5 5
## [1444] 3 3 2 3 3 3 3 5 4 4 3 3 2 2 3 2 2 2 2 3 2 4 5 2 3 5 2 3 5 5 2 4 5 2 2 3 5
## [1481] 4 4 2 1 5 5 3 4 2 2 2 3 5 3 2 2 5 4 2 5 3 3 3 3 3 4 4 5 2 3 2 5 5 4 3 4 3
## [1518] 2 5 3 2 2 2 3 3 3 5 3 5 4 3 5 3 2 2 3 2 3 3 2 3 5 4 2 3 2 5 2 4 3 3 3 5 4
## [1555] 3 2 2 2 3 2 3 3 2 3 2 3 3 2 5 5 3 3 3 5 3 3 3 3 4 3 4 4 2 3 1 3 4 5 3 3 3
## [1592] 5 3 5 2 3 5 3 2 3 2 4 3 3 5 3 4 4 2 3 3 5 2 3 3 5 5 5 3 2 5 3 2 3 2 2 3 3
## [1629] 5 3 2 5 5 3 3 1 4 4 3 2 2 3 4 2 3 3 2 2 5 3 3 5 5 3 4 3 5 3 3 3 3 5 5 2 3
## [1666] 2 3 4 2 4 2 2 2 5 3 2 3 5 5 2 5 5 3 2 2 5 1 3 3 5 3 5 3 4 5 3 5 4 3 3 3 4
## [1703] 2 4 4 3 5 3 5 2 5 4 4 2 4 3 5 5 3 2 5 3 3 4 2 2 3 2 3 3 3 2 3 3 4 3 3 3 3
## [1740] 3 3 4 2 4 5 5 3 4 2 5 2 2 4 1 5 4 2 2 2 5 3 3 3 5 3 3 2 2 5 2 3 2 3 3 4 2
## [1777] 5 5 2 3 4 2 3 3 3 2 5 2 5 3 2 3 3 2 4 5 3 3 2 5 5 3 3 3 5 3 5 5 2 5 3 2 3
## [1814] 2 5 3 3 3 3 3 3 5 4 5 5 3 5 4 1 2 3 5 2 1 5 3 3 2 2 2 3 5 3 5 2 2 2 3 2 3
## [1851] 3 3 3 3 3 3 3 5 5 3 5 3 2 4 5 2 2 3 3 5 4 3 5 4 5 2 3 5 2 2 5 3 1 2 4 2 3
## [1888] 3 5 5 5 4 2 3 3 4 4 3 3 2 3 3 2 4 3 3 2 3 3 5 3 2 3 4 3 5 2 2 3 2 5 3 3 4
## [1925] 3 3 3 2 5 4 5 5 2 3 4 2 3 3 3 3 5 2 2 5 3 4 4 3 5 3 3 3 3 5 5 3 4 3 5 3 5
## [1962] 2 5 3 3 3 2 3 3 4 4 2 5 3 3 3 3 4 5 5 5 3 3 3 1 2 3 2 3 4 3 5 2 5 5 5 3 4
## [1999] 5 4 3 2 3 4 2 5 5 3 3 5 2 3 3 3 2 5 4 3 4 1 5 3 3 3 2 3 1 3 3 5 3 4 2 2 2
## [2036] 3 4 5 2 5 5 5 2 3 3 2 5 2 3 3 3 5 4 4 3 5 2 2 4 2 5 2 4 3 5 3 3 3 5 4 3 3
## [2073] 2 2 3 5 3 2 3 3 2 2 2 3 4 5 4 3 2 5 2 5 2 3 2 2 3 2 3 2 3 4 4 2 3 5 2 4 4
## [2110] 5 1 3 3 5 4 5 1 5 5 3 5 5 3 3 5 3 3 5 3 3 3 3 4 2 3 5 3 5 3 3 2 5 4 2 3 5
## [2147] 5 3 1 3 3 4 3 5 5 4 3 4 5 5 2 3 2 3 3 2 3 2 2 2 2 4 5 4 4 3 3 3 2 5 3 4 4
## [2184] 5 5 2 2 4 5 3 4 2 3 4 2 2 3 3 3 3 2 2 5 3 5 5 2 5 5 3 2 5 5 5 3 3 2 3 5 2
## [2221] 2 5 2 4 3 2 5 4 4 3 2 2 2 3 3 3 3 3 3 2 2 2 3 3 3 4 3 2 2 3 2 5 2 2 1 3 5
## [2258] 5 2 3 5 4 3 3 1 2 3 5 3 4 2 5 1 5 5 5 2 5 5 2 4 4 3 4 3 3 1 3 4 3 4 3 3 3
## [2295] 3 2 5 2 2 4 3 2 3 4 5 5 2 5 2 4 4 5 2 3 4 2 3 3 5 4 5 3 3 3 4 3 3 2 5 2 2
## [2332] 4 5 3 5 3 5 2 5 4 5 5 2 2 2 3 3 3 5 3 5 1 4 3 5 5 5 4 3 2 3 5 3 5 3 5 2 2
## [2369] 1 1 3 5 5 3 2 4 4 2 5 5 3 1 4 3 4 5 5 3 5 5 3 5 3 5 2 3 1 2 5 2 3 5 3 4 2
## [2406] 3 5 2 5 2 5 2 2 3 3 3 4 3 5 5 3 3 3 2 2 4 5 5 3 2 3 2 3 5 5 5 5 2 5 2 3 3
## [2443] 2 5 4 5 5 3 3 4 4 5 2 2 2 3 2 5 3 2 5 5 5 3 3 5 5 2 2 5 5 1 4 5 3 4 5 1 3
## [2480] 2 5 5 3 3 2 5 2 5 5 2 5 3 5 3 2 3 3 5 2 3 4 2 3 2 3 5 4 2 5 2 2 2 5 5 2 5
## [2517] 3 2 5 5 4 5 2 1 3 3 3 3 5 2 5 1 1 2 5 4 3 2 3 3 5 3 2 5 5 3 5 5 3 2 3 3 5
## [2554] 2 5 2 4 4 2 5 3 4 4 3 5 5 5 3 5 2 3 2 4 5 3 3 3 2 2 2 4 5 5 5 2 2 2 5 5 5
## [2591] 5 5 3 2 3 5 3 3 3 5 3 2 4 4 5 3 5 4 3 2 4 2 2 3 3 5 2 5 3 3 4 3 3 5 4 3 2
## [2628] 2 3 5 5 2 4 3 5 2 2 5 3 2 4 5 5 3 4 2 5 4 2 5 2 2 5 2 3 3 5 2 2 2 5 2 5 4
## [2665] 2 5 5 5 5 4 2 3 2 2 2 5 2 2 3 5 1 2 5 3 2 1 4 5 3 1 5 3 1 2 1 5 5 5 3 2 5
## [2702] 5 4 3 4 1 3 3 2 5 3 2 1 2 2 4 2 5 3 4 2 5 4 4 5 5 4 5 5 2 3 2 5 5 3 3 5 2
## [2739] 3 5 3 5 5 3 3 3 3 5 4 2 2 2 4 4 3 3 5 2 5 5 2 2 3 2 3 5 3 5 4 3 2 3 3 5 4
## [2776] 3 4 2 2 4 3 2 4 3 4 3 3 3 3 4 2 2 3 5 4 5 1 3 3 5 5 5 2 4 5 5 2 2 4 3 5 3
## [2813] 3 3 5 5 2 3 5 5 5 5 2 3 2 2 4 5 2 4 4 5 5 4 1 3 5 5 2 3 4 5 4 2 2 5 4 5 3
## [2850] 5 3 2 2 5 5 3 4 4 4 3 2 3 2 5 2 2 3 5 3 2 3 5 3 5 2 3 5 5 5 3 1 2 5 2 2 2
## [2887] 3 2 5 4 3 3 3 1 2 2 2 2 3 5 3 5 3 5 3 2 2 3 2 4 3 5 2 3 5 3 5 5 2 3 5 5 2
## [2924] 2 5 1 3 3 4 3 5 3 5 3 3 4 2 4 2 3 5 3 2 2 3 3 3 5 5 2 3 4 3 5 2 3 3 3 3 3
## [2961] 2 3 3 2 2 3 3 3 3 2 4 5 3 4 5 3 2 3 3 4 2 2 5 3 3 3 5 4 5 4 5 5 3 3 5 4 3
## [2998] 2 3 3
##
## Within cluster sum of squares by cluster:
## [1] 14406.08 116042.54 69006.33 100656.46 62021.91
## (between_SS / total_SS = 93.1 %)
##
## Available components:
##
## [1] "cluster" "centers" "totss" "withinss" "tot.withinss"
## [6] "betweenss" "size" "iter" "ifault"
table(clusterEdu$cluster, Salario$education)##
## 1. < HS Grad 2. HS Grad 3. Some College 4. College Grad 5. Advanced Degree
## 1 0 5 7 22 46
## 2 151 337 112 83 24
## 3 86 421 296 188 58
## 4 3 29 59 141 151
## 5 28 179 176 251 147
clusplot(Wage[,c(5,11)], clusterEdu$cluster, color=T, shade=T, lines=0)Diagrama de dispersión
ggplot(Salario, aes(age, wage)) + geom_point(aes (col=education), size=5)- Puntos rojos: sin preparatoria terminada
- Puntos amarillos: preparatoria terminada
- Puntos verdes: parte de carrera
- Puntos azules: carrera terminada
- Puntos morados: estudios avanzados
Al igual que en los otros casos, los datos se mayormente dispersos, por lo que no se puede hacer una deducción clara. Lo que se puede obtener es que las personas que no terminaron la preparatoria se encuentran entre los que tienen un menor salario y las personas con estudios avanzados se encuentran entre las personas con mayor salario.
Estudio de variable de sector de trabajo (jobclass)
El sector de trabajo es otra caracteristica que podria ser util a la diferenciar sueldos, pero al solamente contar dos sectores y todos los puestos de cada sector, se puede predecir que no se podra diferenciar con mucha seguridad en que sector se encuentra una persona usando su sueldo.
set.seed(101)
clusterSector <- kmeans(Salario[,11], center=2, nstart = 20)
clusterSector## K-means clustering with 2 clusters of sizes 847, 2153
##
## Cluster means:
## [,1]
## 1 160.86502
## 2 92.36329
##
## Clustering vector:
## [1] 2 2 1 1 2 1 1 2 2 1 2 2 2 1 1 2 2 1 1 2 1 2 2 1 2 1 2 2 2 2 1 2 2 2 2 2 2
## [38] 2 2 2 2 2 2 2 2 1 1 1 2 2 1 2 1 2 2 2 1 1 2 2 1 2 2 2 2 2 1 1 2 2 2 2 2 2
## [75] 2 2 1 2 2 2 1 2 2 2 2 2 2 2 1 1 1 2 2 2 2 2 2 1 1 1 2 2 2 2 2 2 2 2 1 2 2
## [112] 2 2 2 2 2 2 1 1 2 2 2 1 1 2 2 1 2 2 2 2 1 1 2 1 2 2 2 2 2 2 2 2 2 2 2 1 1
## [149] 1 2 2 1 2 2 1 1 2 1 2 2 2 2 2 2 1 1 2 2 2 1 2 2 1 1 1 2 1 2 1 2 1 2 2 2 1
## [186] 2 2 2 2 2 1 2 2 2 1 1 2 1 2 2 2 1 2 2 2 2 1 1 1 2 1 2 1 2 2 2 1 2 2 2 2 2
## [223] 2 1 2 2 2 2 1 2 2 2 2 1 2 2 1 2 2 2 2 1 2 2 2 2 2 2 2 2 2 1 2 2 2 2 2 2 1
## [260] 2 2 1 2 2 2 1 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 1 2 2 2 1 2 2 2 2 1 2 2 2
## [297] 2 2 1 2 2 2 2 2 1 1 2 2 2 2 2 2 2 2 1 2 2 2 2 2 1 2 2 2 2 2 1 2 2 2 1 1 2
## [334] 2 1 2 2 2 2 2 1 2 2 2 1 2 2 1 1 1 1 1 2 2 1 2 2 2 2 2 2 1 1 2 2 2 2 2 1 1
## [371] 2 2 1 1 2 1 2 2 2 2 1 1 1 1 2 2 2 1 2 2 2 2 2 2 2 2 2 2 2 2 1 2 2 2 2 2 1
## [408] 2 2 1 1 2 2 2 1 2 2 2 1 2 2 2 1 1 1 1 2 2 2 1 2 2 1 2 2 2 2 2 1 2 2 2 1 2
## [445] 2 2 2 1 1 1 2 1 2 2 2 1 2 1 1 1 2 2 2 1 2 2 2 2 2 1 2 2 2 2 1 2 2 2 2 1 2
## [482] 1 2 2 2 2 2 2 2 1 2 2 2 2 2 2 1 2 2 2 2 2 1 1 2 1 2 2 2 2 2 1 2 2 2 1 2 1
## [519] 2 1 2 1 1 2 2 1 1 1 2 2 2 2 2 1 2 1 2 2 2 2 2 2 1 2 1 2 2 2 2 2 2 2 1 1 2
## [556] 2 2 2 2 2 2 2 2 1 2 1 2 2 2 2 1 2 2 2 2 2 2 2 2 2 1 2 2 2 2 2 1 1 2 2 2 2
## [593] 2 2 2 2 2 2 1 2 2 2 1 1 1 2 2 2 1 2 2 2 1 2 2 2 2 2 2 1 1 2 2 2 1 2 2 1 1
## [630] 1 2 1 1 2 2 1 2 2 2 1 2 2 1 2 2 1 2 2 2 2 1 2 1 2 1 2 2 1 2 2 2 2 2 2 2 2
## [667] 1 2 1 2 1 2 1 2 2 2 2 2 2 1 1 2 1 2 2 2 1 2 1 2 2 1 2 1 2 2 2 1 1 2 2 2 1
## [704] 2 1 1 2 2 2 2 2 2 2 2 2 2 2 1 2 2 2 2 2 1 2 2 2 2 1 2 1 1 1 1 1 2 2 2 2 1
## [741] 2 2 2 2 2 2 1 2 1 2 2 1 2 2 2 2 1 1 2 2 1 2 2 2 2 2 2 1 1 1 2 2 2 1 2 2 2
## [778] 2 1 2 1 2 1 2 1 2 2 1 1 1 2 1 1 2 2 2 1 1 2 1 2 1 2 1 2 2 1 2 2 1 2 2 2 2
## [815] 2 2 2 1 2 1 2 2 2 2 2 2 2 2 1 1 1 1 1 2 2 2 2 2 1 2 2 2 2 2 1 2 2 2 2 1 2
## [852] 2 2 2 2 1 2 1 2 2 2 1 1 1 2 2 1 1 2 1 2 2 2 2 2 2 2 2 2 2 1 2 2 2 2 2 2 2
## [889] 2 2 2 2 1 2 2 2 2 2 1 2 2 1 1 2 2 2 1 1 2 2 2 1 2 2 1 2 1 2 2 2 1 2 2 2 2
## [926] 1 2 2 2 1 2 2 2 2 1 2 2 2 2 2 2 2 2 1 2 1 1 2 2 2 1 1 2 1 2 1 1 2 2 2 2 1
## [963] 2 2 2 1 2 1 1 2 2 1 2 2 2 2 1 1 2 2 2 1 1 2 2 2 2 2 2 2 2 2 2 2 2 1 2 2 2
## [1000] 1 2 2 2 2 2 2 2 2 2 2 2 2 2 1 1 1 1 2 2 2 2 1 2 2 2 2 1 2 2 1 2 2 2 2 2 2
## [1037] 1 2 2 1 2 2 2 2 2 1 2 1 2 1 2 2 2 2 2 1 2 2 2 1 1 2 2 2 2 2 2 2 2 2 2 2 2
## [1074] 2 2 2 2 1 2 2 1 2 1 2 1 2 2 2 2 2 2 2 2 2 2 2 1 2 2 1 2 1 2 2 2 2 1 2 2 2
## [1111] 2 1 1 2 2 2 2 2 1 2 2 1 2 1 2 2 2 1 2 1 2 2 2 2 2 2 2 2 1 2 2 1 2 2 2 2 2
## [1148] 2 1 2 2 2 1 2 2 2 2 2 2 2 2 1 1 1 2 2 2 2 2 2 2 2 2 2 2 2 2 1 1 1 2 2 1 2
## [1185] 1 1 2 1 2 1 2 1 1 2 2 1 2 1 1 1 1 2 2 2 1 2 2 2 2 2 1 2 1 2 1 2 2 2 2 1 1
## [1222] 2 1 2 2 1 1 2 2 1 2 2 2 1 2 2 2 2 1 1 2 2 2 2 2 2 2 1 2 2 1 1 2 2 2 2 1 2
## [1259] 2 1 2 2 2 2 2 1 2 2 1 2 2 1 2 1 2 1 2 1 2 2 2 1 1 1 2 2 2 1 1 2 2 2 2 1 2
## [1296] 2 1 2 2 2 1 2 2 1 2 1 2 1 2 1 2 2 1 2 1 2 2 2 2 2 2 2 2 2 2 1 1 2 2 2 2 1
## [1333] 2 2 2 2 1 2 2 2 2 2 1 1 2 1 2 2 2 2 1 2 1 2 2 1 2 2 2 1 2 2 2 2 1 2 2 2 2
## [1370] 2 1 1 2 2 1 2 2 1 2 1 2 2 2 2 2 1 2 1 2 2 2 1 2 2 2 2 2 2 2 1 1 2 2 2 2 2
## [1407] 2 2 2 1 1 2 1 2 2 2 2 2 1 2 1 2 1 2 2 2 2 1 2 2 2 2 2 2 2 1 2 2 2 2 2 1 2
## [1444] 2 2 2 2 2 2 2 1 1 1 2 2 2 2 2 2 2 2 2 2 2 1 2 2 2 2 2 2 2 1 2 1 1 2 2 2 2
## [1481] 1 1 2 1 1 1 2 1 2 2 2 2 2 2 2 2 1 1 2 1 2 2 2 2 2 1 1 1 2 2 2 1 1 1 2 1 2
## [1518] 2 2 2 2 2 2 2 2 2 2 2 2 1 2 2 2 2 2 2 2 2 2 2 2 2 1 2 2 2 2 2 1 2 2 2 1 1
## [1555] 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 1 2 2 2 2 2 2 2 2 1 2 1 1 2 2 1 2 1 2 2 2 2
## [1592] 2 2 2 2 2 2 2 2 2 2 1 2 2 1 2 1 1 2 2 2 2 2 2 2 2 1 1 2 2 1 2 2 2 2 2 2 2
## [1629] 2 2 2 2 1 2 2 1 1 1 2 2 2 2 1 2 2 2 2 2 1 2 2 1 1 2 1 2 2 2 2 2 2 1 2 2 2
## [1666] 2 2 1 2 1 2 2 2 1 2 2 2 1 1 2 1 2 2 2 2 1 1 2 2 2 2 1 2 1 2 2 1 1 2 2 2 1
## [1703] 2 1 1 2 2 2 2 2 2 1 1 2 1 2 1 2 2 2 1 2 2 1 2 2 2 2 2 2 2 2 2 2 1 2 2 2 2
## [1740] 2 2 1 2 1 2 2 2 1 2 2 2 2 1 1 1 1 2 2 2 2 2 2 2 1 2 2 2 2 1 2 2 2 2 2 1 2
## [1777] 1 2 2 2 1 2 2 2 2 2 1 2 2 2 2 2 2 2 1 1 2 2 2 2 2 2 2 2 2 2 1 1 2 1 2 2 2
## [1814] 2 1 2 2 2 2 2 2 2 1 2 1 2 2 1 1 2 2 2 2 1 1 2 2 2 2 2 2 1 2 2 2 2 2 2 2 2
## [1851] 2 2 2 2 2 2 2 1 1 2 2 2 2 1 1 2 2 2 2 1 1 2 1 1 1 2 2 2 2 2 1 2 1 2 1 2 2
## [1888] 2 2 2 2 1 2 2 2 1 1 2 2 2 2 2 2 1 2 2 2 2 2 2 2 2 2 1 2 2 2 2 2 2 2 2 2 1
## [1925] 2 2 2 2 1 1 1 2 2 2 1 2 2 2 2 2 2 2 2 1 2 1 1 2 1 2 2 2 2 1 2 2 1 2 2 2 1
## [1962] 2 1 2 2 2 2 2 2 1 1 2 1 2 2 2 2 1 1 1 1 2 2 2 1 2 2 2 2 1 2 1 2 1 2 1 2 1
## [1999] 2 1 2 2 2 1 2 1 1 2 2 1 2 2 2 2 2 2 1 2 1 1 2 2 2 2 2 2 1 2 2 1 2 1 2 2 2
## [2036] 2 1 1 2 1 2 1 2 2 2 2 2 2 2 2 2 2 1 1 2 1 2 2 1 2 1 2 1 2 1 2 2 2 1 1 2 2
## [2073] 2 2 2 1 2 2 2 2 2 2 2 2 1 1 1 2 2 2 2 1 2 2 2 2 2 2 2 2 2 1 1 2 2 2 2 1 1
## [2110] 2 1 2 2 2 1 1 1 2 2 2 1 2 2 2 1 2 2 2 2 2 2 2 1 2 2 2 2 1 2 2 2 2 1 2 2 2
## [2147] 1 2 1 2 2 1 2 2 2 1 2 1 2 1 2 2 2 2 2 2 2 2 2 2 2 1 1 1 1 2 2 2 2 1 2 1 1
## [2184] 2 1 2 2 1 2 2 1 2 2 1 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 1 2 2 2 2 1 2
## [2221] 2 1 2 1 2 2 1 1 1 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 1 2 2 2 2 2 2 2 2 1 2 2
## [2258] 1 2 2 2 1 2 2 1 2 2 2 2 1 2 1 1 2 2 2 2 2 1 2 1 1 2 1 2 2 1 2 1 2 1 2 2 2
## [2295] 2 2 2 2 2 1 2 2 2 1 2 2 2 1 2 1 1 1 2 2 1 2 2 2 1 1 2 2 2 2 1 2 2 2 2 2 2
## [2332] 1 1 2 1 2 1 2 2 1 2 2 2 2 2 2 2 2 1 2 2 1 1 2 1 2 2 1 2 2 2 1 2 2 2 1 2 2
## [2369] 1 1 2 1 2 2 2 1 1 2 2 2 2 1 1 2 1 2 1 2 1 1 2 2 2 2 2 2 1 2 1 2 2 2 2 1 2
## [2406] 2 2 2 2 2 2 2 2 2 2 2 1 2 2 1 2 2 2 2 2 1 1 2 2 2 2 2 2 1 2 2 1 2 1 2 2 2
## [2443] 2 1 1 1 2 2 2 1 1 1 2 2 2 2 2 1 2 2 1 1 2 2 2 2 1 2 2 2 2 1 1 2 2 1 1 1 2
## [2480] 2 2 1 2 2 2 2 2 1 2 2 2 2 1 2 2 2 2 1 2 2 1 2 2 2 2 1 1 2 2 2 2 2 2 2 2 2
## [2517] 2 2 1 2 1 2 2 1 2 2 2 2 2 2 2 1 1 2 2 1 2 2 2 2 2 2 2 1 2 2 1 1 2 2 2 2 2
## [2554] 2 1 2 1 1 2 2 2 1 1 2 1 1 2 2 1 2 2 2 1 2 2 2 2 2 2 2 1 2 1 1 2 2 2 1 1 2
## [2591] 2 2 2 2 2 1 2 2 2 2 2 2 1 1 1 2 1 1 2 2 1 2 2 2 2 1 2 1 2 2 1 2 2 2 1 2 2
## [2628] 2 2 1 1 2 1 2 2 2 2 2 2 2 1 2 1 2 1 2 1 1 2 1 2 2 2 2 2 2 1 2 2 2 1 2 1 1
## [2665] 2 2 2 1 1 1 2 2 2 2 2 1 2 2 2 2 1 2 2 2 2 1 1 2 2 1 1 2 1 2 1 2 1 1 2 2 1
## [2702] 2 1 2 1 1 2 2 2 1 2 2 1 2 2 1 2 2 2 1 2 2 1 1 2 1 1 1 1 2 2 2 1 1 2 2 2 2
## [2739] 2 2 2 1 1 2 2 2 2 2 1 2 2 2 1 1 2 2 2 2 2 1 2 2 2 2 2 2 2 2 1 2 2 2 2 1 1
## [2776] 2 1 2 2 1 2 2 1 2 1 2 2 2 2 1 2 2 2 2 1 2 1 2 2 1 2 1 2 1 1 1 2 2 1 2 2 2
## [2813] 2 2 1 2 2 2 2 1 1 1 2 2 2 2 1 2 2 1 1 1 1 1 1 2 1 2 2 2 1 1 1 2 2 2 1 2 2
## [2850] 1 2 2 2 2 2 2 1 1 1 2 2 2 2 1 2 2 2 1 2 2 2 2 2 2 2 2 2 1 1 2 1 2 1 2 2 2
## [2887] 2 2 1 1 2 2 2 1 2 2 2 2 2 1 2 1 2 1 2 2 2 2 2 1 2 1 2 2 2 2 1 2 2 2 1 2 2
## [2924] 2 1 1 2 2 1 2 2 2 2 2 2 1 2 1 2 2 2 2 2 2 2 2 2 2 1 2 2 1 2 2 2 2 2 2 2 2
## [2961] 2 2 2 2 2 2 2 2 2 2 1 1 2 1 2 2 2 2 2 1 2 2 1 2 2 2 1 1 2 1 1 2 2 2 1 1 2
## [2998] 2 2 2
##
## Within cluster sum of squares by cluster:
## [1] 1484428.2 885265.4
## (between_SS / total_SS = 54.6 %)
##
## Available components:
##
## [1] "cluster" "centers" "totss" "withinss" "tot.withinss"
## [6] "betweenss" "size" "iter" "ifault"
table(clusterSector$cluster, Salario$jobclass)##
## 1. Industrial 2. Information
## 1 339 508
## 2 1205 948
Con la tabla obtenida se observa que los datos se encuentran dispersos entre ambos sectores, por que quiza no sea un modelo que cumpla con lo que se busca.
clusplot(Wage[,c(7,11)], clusterSector$cluster, color=T, shade=T, lines=0)Diagrama de dispersión
ggplot(Salario, aes(age, wage)) + geom_point(aes (col=jobclass), size=2)- Puntos rojos: Sector industrial
- Puntos azules: Sector de información
En los salarios bajos y medios tambies se tiene una combinación de ambos sectores, haciendo que sea dificil clasificar a las personas segun su sector de trabajo utilizando su salario. Como resultados se tienen que en los sueldos mas grandes se encuentran personas de información con pocas excepciones.
Estudio de variable de estado civil (maritl)
En el mercado actual, se acostumbra a que las personas casadas posean un mejor empleo que las personas que no, por lo que quiza con el estado civil de una persona se pueda conocer mejor su salario.
set.seed(101)
clusterEstado <- kmeans(Salario[,11], center=5, nstart = 20)
clusterEstado## K-means clustering with 5 clusters of sizes 80, 707, 1049, 383, 781
##
## Cluster means:
## [,1]
## 1 276.90658
## 2 68.96630
## 3 98.21798
## 4 163.61342
## 5 126.12614
##
## Clustering vector:
## [1] 2 2 5 4 2 5 4 3 5 5 5 2 3 5 5 3 2 4 5 3 4 2 3 4 3 1 3 2 5 2 4 3 2 3 3 3 3
## [38] 3 3 2 2 3 2 2 2 4 1 4 2 5 4 3 1 2 5 2 4 4 3 3 4 5 2 3 5 5 4 4 3 2 3 2 2 3
## [75] 3 3 1 2 5 3 5 3 2 2 3 2 3 2 5 5 5 3 2 3 2 3 3 4 4 4 5 5 3 2 5 3 3 2 5 5 5
## [112] 2 2 3 3 3 5 4 1 3 3 3 4 5 3 2 5 3 5 2 3 5 5 5 5 2 3 5 3 3 2 3 3 2 2 5 4 5
## [149] 4 2 3 5 2 2 4 5 2 5 3 2 5 5 2 2 5 5 2 3 3 5 2 2 4 4 4 3 4 3 5 5 5 3 3 5 4
## [186] 3 3 3 3 3 4 3 2 3 4 4 5 4 3 5 2 5 5 2 5 3 1 5 5 2 5 2 4 3 2 5 4 2 3 2 2 3
## [223] 3 4 2 3 3 3 5 3 3 3 5 4 2 2 1 2 2 2 2 5 2 5 5 2 2 3 3 2 3 5 2 5 2 3 3 2 5
## [260] 3 2 5 3 3 3 4 3 3 2 2 5 3 3 5 3 3 3 5 5 2 2 5 5 4 3 3 3 5 2 5 3 5 4 2 3 2
## [297] 3 2 4 3 2 2 2 2 5 4 2 2 3 3 2 5 2 3 5 5 3 2 5 2 5 5 3 2 3 3 5 3 2 3 4 5 2
## [334] 2 4 3 3 3 2 5 5 3 2 5 4 3 3 1 5 4 5 4 3 3 4 5 3 3 2 3 5 4 4 3 2 2 3 5 4 1
## [371] 3 2 5 1 3 5 3 5 2 3 5 4 4 5 5 2 2 5 2 2 3 5 3 3 5 3 5 5 3 3 5 3 2 3 3 3 5
## [408] 3 2 5 5 3 3 3 5 5 3 5 4 3 3 2 5 4 5 4 3 5 3 4 3 3 4 2 2 2 3 3 5 3 5 5 1 3
## [445] 2 3 3 4 5 4 3 4 5 2 3 1 3 5 4 4 2 3 2 5 5 2 2 3 3 4 3 3 2 3 5 3 3 2 2 4 2
## [482] 5 2 2 3 2 2 3 5 1 5 3 3 3 5 5 5 2 3 2 5 3 4 1 3 5 3 2 3 5 3 5 2 3 2 1 3 4
## [519] 3 4 2 5 5 2 3 4 4 5 2 2 2 3 3 4 3 1 3 3 3 2 2 3 4 3 4 2 3 3 3 2 3 5 5 4 3
## [556] 2 3 3 5 2 3 2 3 1 3 4 5 3 3 2 4 3 5 2 3 2 3 2 3 3 1 3 2 3 3 2 4 4 2 5 2 3
## [593] 3 3 2 2 3 3 4 2 3 3 4 5 5 5 3 3 5 3 3 2 4 3 3 2 3 3 3 4 4 2 3 3 5 2 5 5 5
## [630] 5 5 4 4 3 3 4 3 2 5 5 3 5 1 5 3 5 2 5 5 2 4 2 5 5 5 5 3 1 3 3 3 2 3 3 2 3
## [667] 4 3 5 3 4 2 5 5 2 3 3 3 3 4 5 3 5 5 2 2 5 2 4 3 3 4 2 4 2 3 2 4 5 2 5 5 1
## [704] 2 4 4 5 3 3 2 5 3 3 5 2 3 5 5 5 2 3 3 3 4 3 5 3 5 4 5 1 4 5 4 4 5 3 3 3 5
## [741] 3 5 3 3 3 5 5 3 4 3 3 4 2 5 3 3 4 4 2 5 1 3 2 3 3 2 5 4 5 5 5 5 5 5 2 2 3
## [778] 2 5 3 4 3 4 2 5 5 3 5 5 4 5 4 1 3 3 3 4 4 3 5 2 5 5 4 3 3 5 2 2 4 5 5 2 3
## [815] 2 3 3 4 3 4 2 3 5 3 3 2 5 2 5 5 1 4 4 5 2 5 2 5 5 2 3 2 3 5 5 2 2 3 2 4 3
## [852] 3 2 3 2 4 3 5 3 3 2 4 5 4 3 2 5 5 2 4 5 5 3 3 5 5 2 2 3 3 5 2 2 2 5 5 3 5
## [889] 5 5 3 3 4 5 3 3 2 3 4 5 2 1 5 3 3 3 5 4 5 2 2 4 2 5 5 3 1 3 3 2 4 3 3 2 3
## [926] 5 3 2 5 4 2 5 2 2 5 2 2 3 3 2 5 2 2 4 3 5 5 2 3 3 5 4 2 5 3 1 4 3 3 2 5 4
## [963] 5 3 3 5 3 5 4 3 2 4 2 3 2 5 5 4 3 2 2 4 4 3 3 3 3 5 3 3 2 3 5 3 3 5 2 3 3
## [1000] 5 3 3 2 3 2 3 5 3 3 2 3 3 5 5 4 1 4 5 2 3 2 5 3 3 3 5 4 3 2 4 2 3 3 3 3 3
## [1037] 4 2 3 5 2 3 2 3 3 5 2 4 5 5 5 5 5 5 5 4 2 3 3 5 5 3 5 2 5 3 3 3 5 3 3 2 3
## [1074] 3 2 5 2 5 2 2 5 2 5 3 1 2 2 5 5 3 2 5 2 5 2 5 4 2 2 5 2 5 3 5 3 3 5 2 3 3
## [1111] 5 5 1 2 3 3 3 3 5 3 3 5 2 5 3 3 3 1 3 4 3 3 3 3 3 3 3 3 4 3 5 5 3 3 2 2 3
## [1148] 3 5 3 3 2 5 3 3 3 3 2 5 3 3 5 4 4 2 2 3 5 5 3 3 3 2 3 3 3 2 4 5 4 3 3 5 2
## [1185] 5 4 2 5 3 4 2 5 4 3 3 5 2 4 4 5 4 3 5 3 4 3 5 2 3 2 5 2 5 3 4 5 3 2 3 5 4
## [1222] 3 5 5 3 5 5 3 2 1 2 3 3 4 3 3 2 5 5 5 3 2 2 5 3 3 2 5 5 2 5 4 5 5 5 3 5 2
## [1259] 3 4 2 3 2 2 2 5 3 2 5 2 2 1 5 4 5 4 3 5 3 3 3 1 1 4 3 5 5 4 4 3 3 3 3 1 3
## [1296] 3 5 2 3 3 5 5 5 4 5 5 3 4 5 1 2 3 4 3 5 3 2 3 2 2 2 5 2 2 2 1 5 2 2 2 3 4
## [1333] 3 5 3 5 4 2 3 3 3 3 5 4 5 4 3 2 2 3 5 2 4 2 3 4 5 2 3 5 3 3 3 3 5 3 3 3 2
## [1370] 5 5 1 3 2 5 5 2 5 3 5 5 3 5 3 3 4 5 4 3 3 2 5 5 2 3 3 3 5 2 5 5 2 3 3 3 2
## [1407] 5 3 5 5 4 5 5 3 2 3 3 2 4 2 4 5 4 3 5 5 2 4 3 2 3 3 3 3 3 4 5 3 3 3 3 5 5
## [1444] 3 3 2 3 3 3 3 5 4 4 3 3 2 2 3 2 2 2 2 3 2 4 5 2 3 5 2 3 5 5 2 4 5 2 2 3 5
## [1481] 4 4 2 1 5 5 3 4 2 2 2 3 5 3 2 2 5 4 2 5 3 3 3 3 3 4 4 5 2 3 2 5 5 4 3 4 3
## [1518] 2 5 3 2 2 2 3 3 3 5 3 5 4 3 5 3 2 2 3 2 3 3 2 3 5 4 2 3 2 5 2 4 3 3 3 5 4
## [1555] 3 2 2 2 3 2 3 3 2 3 2 3 3 2 5 5 3 3 3 5 3 3 3 3 4 3 4 4 2 3 1 3 4 5 3 3 3
## [1592] 5 3 5 2 3 5 3 2 3 2 4 3 3 5 3 4 4 2 3 3 5 2 3 3 5 5 5 3 2 5 3 2 3 2 2 3 3
## [1629] 5 3 2 5 5 3 3 1 4 4 3 2 2 3 4 2 3 3 2 2 5 3 3 5 5 3 4 3 5 3 3 3 3 5 5 2 3
## [1666] 2 3 4 2 4 2 2 2 5 3 2 3 5 5 2 5 5 3 2 2 5 1 3 3 5 3 5 3 4 5 3 5 4 3 3 3 4
## [1703] 2 4 4 3 5 3 5 2 5 4 4 2 4 3 5 5 3 2 5 3 3 4 2 2 3 2 3 3 3 2 3 3 4 3 3 3 3
## [1740] 3 3 4 2 4 5 5 3 4 2 5 2 2 4 1 5 4 2 2 2 5 3 3 3 5 3 3 2 2 5 2 3 2 3 3 4 2
## [1777] 5 5 2 3 4 2 3 3 3 2 5 2 5 3 2 3 3 2 4 5 3 3 2 5 5 3 3 3 5 3 5 5 2 5 3 2 3
## [1814] 2 5 3 3 3 3 3 3 5 4 5 5 3 5 4 1 2 3 5 2 1 5 3 3 2 2 2 3 5 3 5 2 2 2 3 2 3
## [1851] 3 3 3 3 3 3 3 5 5 3 5 3 2 4 5 2 2 3 3 5 4 3 5 4 5 2 3 5 2 2 5 3 1 2 4 2 3
## [1888] 3 5 5 5 4 2 3 3 4 4 3 3 2 3 3 2 4 3 3 2 3 3 5 3 2 3 4 3 5 2 2 3 2 5 3 3 4
## [1925] 3 3 3 2 5 4 5 5 2 3 4 2 3 3 3 3 5 2 2 5 3 4 4 3 5 3 3 3 3 5 5 3 4 3 5 3 5
## [1962] 2 5 3 3 3 2 3 3 4 4 2 5 3 3 3 3 4 5 5 5 3 3 3 1 2 3 2 3 4 3 5 2 5 5 5 3 4
## [1999] 5 4 3 2 3 4 2 5 5 3 3 5 2 3 3 3 2 5 4 3 4 1 5 3 3 3 2 3 1 3 3 5 3 4 2 2 2
## [2036] 3 4 5 2 5 5 5 2 3 3 2 5 2 3 3 3 5 4 4 3 5 2 2 4 2 5 2 4 3 5 3 3 3 5 4 3 3
## [2073] 2 2 3 5 3 2 3 3 2 2 2 3 4 5 4 3 2 5 2 5 2 3 2 2 3 2 3 2 3 4 4 2 3 5 2 4 4
## [2110] 5 1 3 3 5 4 5 1 5 5 3 5 5 3 3 5 3 3 5 3 3 3 3 4 2 3 5 3 5 3 3 2 5 4 2 3 5
## [2147] 5 3 1 3 3 4 3 5 5 4 3 4 5 5 2 3 2 3 3 2 3 2 2 2 2 4 5 4 4 3 3 3 2 5 3 4 4
## [2184] 5 5 2 2 4 5 3 4 2 3 4 2 2 3 3 3 3 2 2 5 3 5 5 2 5 5 3 2 5 5 5 3 3 2 3 5 2
## [2221] 2 5 2 4 3 2 5 4 4 3 2 2 2 3 3 3 3 3 3 2 2 2 3 3 3 4 3 2 2 3 2 5 2 2 1 3 5
## [2258] 5 2 3 5 4 3 3 1 2 3 5 3 4 2 5 1 5 5 5 2 5 5 2 4 4 3 4 3 3 1 3 4 3 4 3 3 3
## [2295] 3 2 5 2 2 4 3 2 3 4 5 5 2 5 2 4 4 5 2 3 4 2 3 3 5 4 5 3 3 3 4 3 3 2 5 2 2
## [2332] 4 5 3 5 3 5 2 5 4 5 5 2 2 2 3 3 3 5 3 5 1 4 3 5 5 5 4 3 2 3 5 3 5 3 5 2 2
## [2369] 1 1 3 5 5 3 2 4 4 2 5 5 3 1 4 3 4 5 5 3 5 5 3 5 3 5 2 3 1 2 5 2 3 5 3 4 2
## [2406] 3 5 2 5 2 5 2 2 3 3 3 4 3 5 5 3 3 3 2 2 4 5 5 3 2 3 2 3 5 5 5 5 2 5 2 3 3
## [2443] 2 5 4 5 5 3 3 4 4 5 2 2 2 3 2 5 3 2 5 5 5 3 3 5 5 2 2 5 5 1 4 5 3 4 5 1 3
## [2480] 2 5 5 3 3 2 5 2 5 5 2 5 3 5 3 2 3 3 5 2 3 4 2 3 2 3 5 4 2 5 2 2 2 5 5 2 5
## [2517] 3 2 5 5 4 5 2 1 3 3 3 3 5 2 5 1 1 2 5 4 3 2 3 3 5 3 2 5 5 3 5 5 3 2 3 3 5
## [2554] 2 5 2 4 4 2 5 3 4 4 3 5 5 5 3 5 2 3 2 4 5 3 3 3 2 2 2 4 5 5 5 2 2 2 5 5 5
## [2591] 5 5 3 2 3 5 3 3 3 5 3 2 4 4 5 3 5 4 3 2 4 2 2 3 3 5 2 5 3 3 4 3 3 5 4 3 2
## [2628] 2 3 5 5 2 4 3 5 2 2 5 3 2 4 5 5 3 4 2 5 4 2 5 2 2 5 2 3 3 5 2 2 2 5 2 5 4
## [2665] 2 5 5 5 5 4 2 3 2 2 2 5 2 2 3 5 1 2 5 3 2 1 4 5 3 1 5 3 1 2 1 5 5 5 3 2 5
## [2702] 5 4 3 4 1 3 3 2 5 3 2 1 2 2 4 2 5 3 4 2 5 4 4 5 5 4 5 5 2 3 2 5 5 3 3 5 2
## [2739] 3 5 3 5 5 3 3 3 3 5 4 2 2 2 4 4 3 3 5 2 5 5 2 2 3 2 3 5 3 5 4 3 2 3 3 5 4
## [2776] 3 4 2 2 4 3 2 4 3 4 3 3 3 3 4 2 2 3 5 4 5 1 3 3 5 5 5 2 4 5 5 2 2 4 3 5 3
## [2813] 3 3 5 5 2 3 5 5 5 5 2 3 2 2 4 5 2 4 4 5 5 4 1 3 5 5 2 3 4 5 4 2 2 5 4 5 3
## [2850] 5 3 2 2 5 5 3 4 4 4 3 2 3 2 5 2 2 3 5 3 2 3 5 3 5 2 3 5 5 5 3 1 2 5 2 2 2
## [2887] 3 2 5 4 3 3 3 1 2 2 2 2 3 5 3 5 3 5 3 2 2 3 2 4 3 5 2 3 5 3 5 5 2 3 5 5 2
## [2924] 2 5 1 3 3 4 3 5 3 5 3 3 4 2 4 2 3 5 3 2 2 3 3 3 5 5 2 3 4 3 5 2 3 3 3 3 3
## [2961] 2 3 3 2 2 3 3 3 3 2 4 5 3 4 5 3 2 3 3 4 2 2 5 3 3 3 5 4 5 4 5 5 3 3 5 4 3
## [2998] 2 3 3
##
## Within cluster sum of squares by cluster:
## [1] 14406.08 116042.54 69006.33 100656.46 62021.91
## (between_SS / total_SS = 93.1 %)
##
## Available components:
##
## [1] "cluster" "centers" "totss" "withinss" "tot.withinss"
## [6] "betweenss" "size" "iter" "ifault"
table(clusterEstado$cluster, Salario$maritl)##
## 1. Never Married 2. Married 3. Widowed 4. Divorced 5. Separated
## 1 5 72 0 2 1
## 2 279 356 4 51 17
## 3 247 676 9 93 24
## 4 30 329 0 20 4
## 5 87 641 6 38 9
En algunos estados se puede apreciar una diferencia clara pero no en todos, por lo que puede que el modelo no sea tan funcional.
clusplot(Wage[,c(3,11)], clusterEstado$cluster, color=T, shade=T, lines=0)Diagrama de dispersión
ggplot(Salario, aes(age, wage)) + geom_point(aes (col=maritl), size=5)Al igual que en los anteriores modelos, se encuentra una dispersión entre los diferentes tipos de personas, por lo que este modelo tampofo funciona correctamente y no se puede aplicar k-means, sin embargo, entre las personas con mayores salario se encuentran más personas casadas.
Conclusión
Una vez vistos todos los modelos con lo que se puede comparar el salario, se puede observar que ciertas caracteristicas de una persona tienen relación con su salario, pero no se pudo obtener un modelo en el que se visualice claramente una relación. Algunas de las variables que fueron relativamente influyente son: el sector de trabajo, educación y estado civil, pero ninguna funciona completamente bien. De igual manera, el método de k-means no resulto util en ninguno de los anteriores modelos planteados, por lo que quiza se necesite aplicar diferentes metodos y variables para llegar a mejores conclusiones.