A6U1 Parte 2 Equipo2

Germám Gómez López - Jorge Alan Retamoza Flores - Erick Abraham Bernal Amparano

14/3/2022

library(pacman)
p_load("prettydoc","ISLR", "ggplot2", "xfun","DT","cluster","plotly","tm")

Combinando Métodos - Matrimonio

Tomando en cuenta el análisis anterior, nos pudimos percatar de que no es posible determinar si un individuo tiene seguro médico únicamente tomando en cuenta su salario y su edad. Ahora en este nuevo análisis vamos a ver si con tu salario y tu edad se puede predecir tu estado civil, es decir, nuestra hipótesis alternativa sería que si se puede predecir tu estado civil únicamente tomando en cuenta tu sueldo.

Importar Datos

data("Wage")

wg <- Wage
datos <- data.frame(wage = Wage$wage, age= Wage$age)
datos2 <- data.frame(wage = Wage$wage,age=Wage$age , maritl= Wage$maritl)
datatable(datos2)

Contando los datos

table (wg$maritl)
## 
## 1. Never Married       2. Married       3. Widowed      4. Divorced 
##              648             2074               19              204 
##     5. Separated 
##               55

Graficando Variables

estadoCivil<-Wage$maritl
p<-ggplot(datos, aes(wage,age)) + geom_point(aes (col= estadoCivil), size=3)
ggplotly(p)

Analizando la gráfica podemos percatarnos de que la mayoría de las personas que cuentan con mejor salario tienden a estar casados, pero tambien podemos ver que no solo los que tienen mayor ingreso estan casados, están muy mezclados en todos los rangos de ingresos.

Clusters K-Means

Construyendo clusters utilizando K-means

wgsCluster <- kmeans(datos,centers=5, nstart = 20)
wgsCluster
## K-means clustering with 5 clusters of sizes 446, 546, 1012, 80, 916
## 
## Cluster means:
##        wage      age
## 1 160.63692 45.16368
## 2  65.66964 34.97619
## 3  93.08103 43.02668
## 4 276.90658 46.88750
## 5 121.46355 44.44323
## 
## Clustering vector:
##    [1] 2 2 5 1 2 5 1 5 5 5 5 3 3 5 5 3 3 1 5 3 1 2 3 1 3 4 3 2 5 2 1 3 3 5 3 3 3
##   [38] 3 3 2 2 5 2 2 3 1 4 1 2 5 1 3 4 2 5 2 1 1 3 5 1 5 3 3 5 5 1 1 3 2 3 2 2 3
##   [75] 3 3 4 2 5 3 5 5 2 2 3 2 3 2 5 5 5 3 2 5 2 3 3 1 1 1 5 5 5 2 5 3 3 2 5 5 5
##  [112] 3 2 5 3 3 5 1 4 3 3 3 1 5 3 2 5 3 5 3 3 5 1 5 5 2 5 5 3 3 2 3 3 2 2 5 1 5
##  [149] 1 2 3 5 3 3 1 5 2 5 3 2 5 5 3 2 5 5 2 3 3 5 2 2 1 1 1 3 1 3 1 5 5 5 3 5 1
##  [186] 3 3 3 3 3 1 3 2 3 1 1 5 1 3 5 2 5 5 2 5 3 4 1 5 2 5 2 1 3 2 5 1 2 3 3 2 3
##  [223] 3 1 2 3 3 3 5 3 3 5 5 1 2 3 4 3 3 2 2 5 2 5 5 2 2 5 3 2 3 5 2 5 2 5 3 2 1
##  [260] 3 2 5 5 3 3 1 3 3 2 2 5 5 5 5 5 3 5 5 5 2 2 5 5 1 3 3 3 1 2 5 3 5 1 2 3 2
##  [297] 3 2 1 3 2 2 2 2 5 1 2 2 3 3 2 5 3 3 5 5 3 2 5 2 5 5 3 2 2 3 1 5 3 3 1 5 3
##  [334] 2 1 3 3 5 2 5 5 3 3 5 1 3 3 4 5 1 5 1 3 3 1 5 3 5 2 3 5 1 1 3 2 2 3 5 1 4
##  [371] 3 2 5 4 5 5 3 5 2 3 5 1 1 1 5 2 3 5 2 3 3 5 3 3 5 3 5 5 3 3 5 3 3 3 5 3 5
##  [408] 3 2 5 1 3 3 3 5 5 3 5 1 3 3 3 5 1 5 1 3 5 3 1 5 3 1 2 2 2 3 3 1 5 5 5 4 3
##  [445] 2 3 3 1 5 1 3 1 5 3 3 4 3 5 1 1 2 3 2 5 5 3 2 5 3 1 3 3 2 3 5 3 5 2 2 1 3
##  [482] 5 3 2 3 2 2 3 5 4 5 3 3 5 5 5 5 3 5 2 5 3 1 4 3 5 3 2 3 5 3 5 2 5 3 4 3 1
##  [519] 3 1 3 5 5 2 3 1 1 5 2 2 2 3 5 1 3 4 3 3 3 2 2 5 1 3 1 2 3 3 3 3 3 5 5 1 3
##  [556] 2 3 3 5 2 3 2 3 4 3 1 5 3 3 3 1 5 5 3 5 2 3 2 3 3 4 3 2 3 5 2 1 1 3 5 3 3
##  [593] 5 3 2 2 3 3 1 2 3 5 1 5 5 5 3 5 5 3 3 2 1 3 3 2 3 3 5 1 1 2 3 3 5 2 5 1 1
##  [630] 5 5 1 1 3 5 1 3 2 5 5 3 5 4 5 5 5 2 5 5 2 1 2 1 5 5 5 3 4 3 3 3 3 3 3 2 3
##  [667] 1 3 5 3 1 2 1 5 2 3 3 3 3 1 5 5 5 5 2 3 1 2 1 3 3 1 3 1 2 3 2 1 1 2 5 5 4
##  [704] 2 1 1 5 3 3 2 5 5 3 5 2 3 5 1 5 3 3 5 3 1 3 5 3 5 1 5 4 1 5 1 1 5 3 5 5 5
##  [741] 3 5 3 3 5 5 5 3 1 3 3 1 3 5 3 3 1 1 2 5 4 5 2 3 5 2 5 1 5 5 5 5 5 5 3 2 3
##  [778] 2 5 3 1 3 1 2 5 5 3 5 5 1 5 1 4 3 3 3 1 1 3 5 3 1 5 1 3 3 1 2 2 1 5 5 3 3
##  [815] 2 3 3 1 3 1 2 3 5 3 3 3 5 2 5 5 4 1 1 5 2 5 2 5 5 2 3 2 3 5 5 3 2 3 2 1 3
##  [852] 5 2 3 2 1 3 5 3 3 3 1 5 1 3 2 5 5 3 1 5 5 3 3 5 5 3 3 3 3 5 2 2 3 5 5 3 5
##  [889] 5 5 5 3 1 5 3 3 2 3 1 5 2 4 5 3 3 3 5 1 5 3 2 1 2 5 5 3 4 3 3 2 1 3 3 2 5
##  [926] 5 3 2 5 1 3 5 3 2 5 2 2 3 3 3 5 3 2 1 3 1 1 2 5 5 5 1 2 1 3 4 1 3 5 2 5 1
##  [963] 5 3 3 5 3 1 1 3 2 1 2 5 3 5 1 1 3 2 3 1 1 3 3 5 3 5 5 3 2 3 5 3 3 5 3 3 3
## [1000] 5 3 3 2 3 2 3 5 5 5 3 3 3 5 5 1 4 1 5 2 3 2 5 3 5 3 5 1 3 2 1 2 3 3 3 3 3
## [1037] 1 2 3 5 2 3 2 3 3 5 2 1 5 5 5 5 5 5 5 1 2 3 3 5 5 5 5 2 5 3 3 3 5 3 3 3 5
## [1074] 3 2 5 2 1 2 3 5 2 5 3 4 2 3 5 5 5 2 5 2 5 3 5 1 2 2 5 3 5 3 5 3 3 5 2 3 3
## [1111] 5 5 4 2 3 3 3 3 5 3 3 5 2 5 5 3 5 4 3 1 3 3 3 5 3 5 3 3 1 3 5 5 3 3 3 3 5
## [1148] 3 5 3 5 2 1 3 3 3 3 3 5 5 3 1 1 1 3 2 3 5 5 3 3 3 2 3 3 5 2 1 5 1 3 3 5 2
## [1185] 5 1 2 5 3 1 2 5 1 3 3 5 2 1 1 5 1 3 5 3 1 5 5 2 5 2 5 2 5 3 1 5 3 3 3 1 1
## [1222] 3 5 5 3 5 5 3 3 4 3 3 3 1 5 3 2 5 5 5 3 2 3 5 3 3 2 5 5 2 1 1 5 5 5 3 1 2
## [1259] 3 1 2 5 3 3 2 5 3 2 5 2 3 4 5 1 5 1 5 5 5 3 3 4 4 1 3 5 5 1 1 3 3 3 3 4 5
## [1296] 3 5 2 3 3 5 5 5 1 5 1 3 1 5 4 2 5 1 3 5 3 2 5 2 2 2 5 2 2 2 4 5 2 2 3 3 1
## [1333] 3 5 3 5 1 2 3 3 5 5 1 1 5 1 3 3 2 5 5 2 1 2 3 1 5 2 3 5 3 3 3 3 5 3 3 3 2
## [1370] 5 5 4 5 2 5 5 2 1 3 5 5 3 5 5 3 1 5 1 5 3 2 5 5 2 3 3 3 5 2 1 5 2 3 3 3 2
## [1407] 5 3 5 5 1 5 5 3 2 3 5 2 1 2 1 5 1 3 5 5 2 1 3 3 3 3 3 3 3 1 5 3 3 3 3 1 5
## [1444] 3 5 2 3 3 3 3 5 1 1 3 5 2 2 3 3 2 2 2 3 2 1 5 2 5 5 3 3 5 5 2 1 5 2 3 3 5
## [1481] 1 1 2 4 5 5 5 1 2 3 2 3 5 2 3 3 5 1 2 5 3 3 3 5 5 1 1 5 2 3 3 5 5 1 5 1 5
## [1518] 2 5 5 2 2 2 3 3 3 5 3 5 1 3 5 3 2 2 3 2 3 3 2 3 5 1 2 3 2 5 2 1 5 3 3 5 1
## [1555] 3 3 3 3 3 2 5 3 2 3 2 3 3 3 5 5 3 3 3 5 3 3 5 3 1 3 1 1 2 3 4 3 1 5 3 3 5
## [1592] 5 3 5 2 3 5 5 2 5 2 1 3 3 5 3 1 1 2 3 5 5 2 3 3 5 5 5 3 2 5 3 3 5 2 2 3 3
## [1629] 5 3 2 5 5 3 5 4 1 1 5 3 2 5 1 2 3 3 2 2 5 3 3 5 5 3 1 3 5 3 3 3 5 5 5 2 3
## [1666] 2 3 1 3 1 2 2 2 5 5 2 5 5 5 2 5 5 5 2 2 5 4 3 5 5 3 5 3 1 5 3 5 1 3 3 3 1
## [1703] 3 1 1 3 5 3 5 3 5 1 1 2 1 3 5 5 3 3 5 3 5 1 2 2 3 2 3 3 5 2 3 5 1 3 3 3 3
## [1740] 3 3 1 2 1 5 5 5 1 3 5 2 2 1 4 1 1 2 2 3 5 3 5 3 5 3 3 3 2 5 2 3 2 5 3 1 2
## [1777] 1 5 2 5 1 2 3 3 3 2 5 2 5 5 2 3 3 2 1 5 3 3 2 5 5 3 5 3 5 3 1 5 2 5 3 2 5
## [1814] 2 5 3 3 5 3 3 3 5 1 5 5 5 5 1 4 2 3 5 2 4 1 3 5 3 3 3 3 5 5 5 2 3 3 5 3 3
## [1851] 3 3 3 3 3 3 3 5 5 5 5 3 3 1 5 3 2 5 3 5 1 5 5 1 5 2 3 5 2 2 1 5 4 3 1 2 3
## [1888] 3 5 5 5 1 2 5 3 1 1 3 3 2 3 5 2 1 3 5 2 3 3 5 3 3 3 1 3 5 2 3 3 2 5 3 3 1
## [1925] 3 3 3 2 5 1 5 5 2 5 1 2 3 3 3 3 5 2 2 5 5 1 1 3 5 5 3 3 3 1 5 3 1 3 5 3 5
## [1962] 2 5 5 3 3 2 3 5 1 1 2 5 3 5 3 5 1 5 5 5 3 3 3 4 2 3 2 3 1 3 5 3 5 5 5 3 1
## [1999] 5 1 3 3 3 1 2 5 5 3 3 5 2 5 3 3 3 5 1 3 1 4 5 3 3 3 2 3 4 3 3 5 3 1 3 2 2
## [2036] 3 1 5 2 5 5 5 3 3 3 2 5 2 3 3 3 5 1 1 3 5 2 3 1 2 5 2 1 3 5 3 3 3 5 1 3 3
## [2073] 2 2 3 5 5 3 5 3 2 2 3 3 1 5 1 3 2 5 2 5 2 3 2 2 5 2 3 2 3 1 1 3 5 5 3 1 1
## [2110] 5 4 3 3 5 1 5 4 5 5 3 5 5 5 5 5 5 3 5 3 3 3 3 1 3 5 5 3 5 3 5 3 5 1 3 3 5
## [2147] 1 5 4 5 3 1 5 5 5 1 3 1 5 5 2 5 2 3 5 3 3 3 2 2 2 1 5 1 1 3 3 3 2 5 3 1 1
## [2184] 5 5 2 2 1 5 3 1 2 5 1 3 2 3 3 3 3 2 2 5 3 5 5 3 5 5 3 2 5 5 5 3 5 2 3 5 3
## [2221] 2 5 3 1 3 2 1 1 1 3 2 3 2 3 3 5 3 3 3 2 2 2 3 3 5 1 5 2 2 3 2 5 3 2 4 3 5
## [2258] 1 3 3 5 1 3 3 4 3 3 5 3 1 3 5 4 5 5 5 2 5 5 3 1 1 3 1 3 3 4 3 1 5 1 5 3 3
## [2295] 3 2 5 2 2 1 3 2 5 1 5 5 3 5 2 1 1 1 2 3 1 2 5 3 5 1 5 3 3 3 1 3 3 2 5 2 3
## [2332] 1 1 3 1 3 5 2 5 1 5 5 2 2 2 3 3 3 1 3 5 4 1 3 5 5 5 1 3 2 5 1 3 5 3 5 2 3
## [2369] 4 4 3 1 5 3 2 1 1 2 5 5 3 4 1 3 1 5 5 3 5 5 5 5 3 5 2 3 4 2 5 3 3 5 3 1 2
## [2406] 2 5 2 5 2 5 2 2 3 3 3 1 5 5 1 5 3 5 2 2 1 5 5 3 2 3 2 5 5 5 5 5 2 1 2 3 3
## [2443] 2 5 1 5 5 3 3 1 1 1 2 2 2 3 3 5 3 2 5 5 5 3 3 5 1 2 2 5 5 4 1 5 3 1 5 4 5
## [2480] 2 5 5 3 3 2 5 2 5 5 2 5 3 5 5 2 3 3 5 3 3 1 2 3 2 3 5 1 3 5 2 2 2 5 5 2 5
## [2517] 3 3 5 5 1 5 2 4 3 3 5 3 5 2 5 4 4 3 5 1 3 2 3 3 5 5 2 5 5 3 1 5 3 3 3 3 5
## [2554] 2 5 2 1 1 2 5 3 1 1 5 5 5 5 3 5 2 3 2 1 5 3 3 3 2 2 3 1 5 5 5 3 2 2 5 5 5
## [2591] 5 5 5 3 3 5 3 5 5 5 3 2 1 1 1 3 1 1 5 2 1 3 2 3 3 5 2 5 3 3 1 3 3 5 1 3 2
## [2628] 2 3 5 5 2 1 3 5 2 2 5 3 2 1 5 5 3 1 3 5 1 3 5 3 2 5 2 3 3 1 2 2 2 5 2 5 1
## [2665] 2 5 5 5 5 1 2 3 2 3 2 5 2 3 5 5 4 2 5 3 2 4 1 5 3 4 5 5 4 2 4 5 1 5 3 2 5
## [2702] 5 1 3 1 4 3 3 2 5 5 2 4 3 2 1 2 5 3 1 2 5 1 1 5 5 1 5 5 2 3 2 5 5 3 3 5 2
## [2739] 3 5 3 5 5 3 3 3 3 5 1 3 3 2 1 1 3 3 5 2 5 5 2 2 5 2 3 5 3 5 1 3 2 5 5 5 1
## [2776] 3 1 2 2 1 3 3 1 3 1 3 5 3 5 1 2 2 3 5 1 5 4 3 3 5 5 5 2 1 1 5 2 3 1 3 5 5
## [2813] 5 3 1 5 2 3 5 5 5 5 3 5 2 2 1 5 2 1 1 5 5 1 4 3 5 5 2 3 1 5 1 2 2 5 1 5 3
## [2850] 5 3 3 2 5 5 3 1 1 1 3 2 3 2 1 2 3 3 5 3 3 3 5 3 5 2 3 5 5 5 5 4 2 5 2 2 2
## [2887] 3 2 5 1 3 3 3 4 2 3 2 2 3 1 3 1 3 5 3 2 2 3 2 1 5 5 2 3 5 3 5 5 2 3 5 5 3
## [2924] 2 5 4 5 3 1 3 5 3 5 3 3 1 3 1 2 3 5 3 2 2 3 3 3 5 5 2 5 1 3 5 2 3 3 3 3 5
## [2961] 2 3 3 2 2 3 3 3 3 2 1 5 3 1 5 3 2 3 3 1 2 2 5 3 3 3 5 1 5 1 5 5 5 3 5 1 3
## [2998] 2 3 3
## 
## Within cluster sum of squares by cluster:
## [1] 159978.87 169284.23 212127.25  20954.07 173404.41
##  (between_SS / total_SS =  86.9 %)
## 
## Available components:
## 
## [1] "cluster"      "centers"      "totss"        "withinss"     "tot.withinss"
## [6] "betweenss"    "size"         "iter"         "ifault"
  • Se comparan los clusters con los datos originales
table(wgsCluster$cluster,wg$maritl)
##    
##     1. Never Married 2. Married 3. Widowed 4. Divorced 5. Separated
##   1               35        381          1          25            4
##   2              253        239          3          39           12
##   3              231        665          8          82           26
##   4                5         72          0           2            1
##   5              124        717          7          56           12
  • Se agrupan los clusters
clusplot(datos, wgsCluster$cluster, color=T, shade=T, lines=0)

Podemos percatarnos de que en la parte final es más fácil distinguir los resultados, pero en la parte inicial y media no hay una preferencia alguna entre los diferentes estados civiles.diferencia entre los salarios altos y bajos.

tot.withinss <- vector(mode="character", length=10)
for (i in 1:10){
  wgsCluster <- kmeans(datos, center=i, nstart=20)
  tot.withinss[i] <- wgsCluster$tot.withinss
}
  • Se grafíca el codo obtenido
plot(1:10, tot.withinss, type="b", pch=19)

Conclusión

Podemos concluir que como tal no existe una relación estrecha para definir el estado civil de una persona meramente con su ingreso. Es verdad que las personas con mas ingresos tienden a estar casadas, pero no es un factor determinante para poder predecirlo.

Descargas

Descarga este código haciendo click al siguiente enlace.

xfun::embed_file("A6U1_2Equipo2.Rmd")

Download A6U1_2Equipo2.Rmd