ANALISIS DE CORRESPONDENCIAS MULTIPLES (MCA)
El análisis de correspondencia múltiple (MCA) es una extensión del análisis de correspondencia simple para resumir y visualizar una tabla de datos que contiene más de dos variables categóricas. También puede verse como una generalización del análisis de componentes principales cuando las variables a analizar son categóricas en lugar de cuantitativas.
MCA se usa generalmente para analizar un conjunto de datos de una encuesta. El objetivo es identificar:
- Un grupo de personas con perfil similar en sus respuestas a las preguntas
- Las asociaciones entre categorías de variables
A continuacion, se va a calcular y visualizar análisis de correspondencias múltiples en el software \(\mathrm{R}\) usando FactoMineR (para el análisis) y factoextra (para la visualización de datos).
library(FactoMineR)
## Warning: package 'FactoMineR' was built under R version 4.1.3
library(ggplot2)
## Warning: package 'ggplot2' was built under R version 4.1.3
library(FactoClass)
## Warning: package 'FactoClass' was built under R version 4.1.3
## Loading required package: ade4
## Warning: package 'ade4' was built under R version 4.1.3
##
## Attaching package: 'ade4'
## The following object is masked from 'package:FactoMineR':
##
## reconst
## Loading required package: ggrepel
## Warning: package 'ggrepel' was built under R version 4.1.3
## Loading required package: xtable
## Warning: package 'xtable' was built under R version 4.1.3
## Loading required package: scatterplot3d
library(factoextra)
## Warning: package 'factoextra' was built under R version 4.1.3
## Welcome! Want to learn more? See two factoextra-related books at https://goo.gl/ve3WBa
library(Rcpp)
library(broom)
library(pander)
## Warning: package 'pander' was built under R version 4.1.3
library(corrplot)
## Warning: package 'corrplot' was built under R version 4.1.3
## corrplot 0.92 loaded
library(gridExtra)
Los datos “admi” del paquete FactoClass, que son los estudiantes admitidos a las 7 carreras de la Facultad de ciencias de la Universidad Nacional de Colombia (Bogotá) en el primer trimestre del 2013. Estos datos poseen información de los puntajes obtenidos por estos estudiantes (445 admitidos) en el examen de ingreso, así como también algunas variables de información sociodemográfica.
data(admi)
<- subset(admi, select = c("carr", "gene", "estr", "orig","age") )
DatosInicial DatosInicial
## carr gene estr orig age
## 1 Biol F alto Bogo 17
## 2 Biol M medio Bogo 17
## 3 Biol F bajo Bogo 18
## 4 Biol F bajo Bogo 18
## 5 Biol M medio Bogo 17
## 6 Biol F medio Bogo 17
## 7 Biol F medio Bogo 17
## 8 Biol M medio Bogo 17
## 9 Biol F medio Bogo 19
## 10 Biol M medio Bogo 18
## 11 Biol M bajo Bogo 17
## 12 Biol M medio Bogo 17
## 13 Biol M medio Bogo 16
## 14 Biol F alto Bogo 17
## 15 Biol M medio Bogo 17
## 16 Biol M medio Bogo 18
## 17 Biol M medio Bogo 20
## 18 Biol F medio Bogo 20
## 19 Biol M alto Otro 17
## 20 Biol M medio Bogo 35
## 21 Biol M bajo Bogo 20
## 22 Biol F bajo Bogo 19
## 23 Biol M alto Otro 17
## 24 Biol M bajo Bogo 19
## 25 Biol F medio Otro 17
## 26 Biol M bajo Cund 17
## 27 Biol F alto Bogo 16
## 28 Biol F medio Cund 17
## 29 Biol M bajo Bogo 20
## 30 Biol M bajo Otro 16
## 31 Biol F alto Cund 16
## 32 Biol M bajo Bogo 21
## 33 Biol F bajo Otro 20
## 34 Biol M medio Cund 16
## 35 Biol M bajo Cund 17
## 36 Biol F bajo Otro 16
## 37 Biol M bajo Cund 17
## 38 Biol F medio Otro 16
## 39 Biol M alto Cund 17
## 40 Biol F bajo Otro 18
## 41 Biol M bajo Otro 18
## 42 Biol F medio Otro 16
## 43 Biol M bajo Otro 17
## 44 Biol M alto Bogo 17
## 45 Biol F medio Bogo 16
## 46 Biol M alto Bogo 19
## 47 Biol M alto Bogo 16
## 48 Biol M medio Bogo 19
## 49 Biol M medio Bogo 17
## 50 Biol M bajo Bogo 18
## 51 Biol M alto Bogo 17
## 52 Biol M alto Bogo 18
## 53 Biol F medio Bogo 18
## 54 Biol M bajo Bogo 17
## 55 Biol M alto Bogo 17
## 56 Biol M medio Bogo 16
## 57 Biol F alto Bogo 17
## 58 Biol M bajo Otro 16
## 59 Biol F medio Otro 17
## 60 Biol M medio Otro 17
## 61 Biol M bajo Otro 16
## 62 Biol F bajo Otro 15
## 63 Biol M bajo Otro 16
## 64 Esta M medio Bogo 17
## 65 Esta M alto Bogo 16
## 66 Esta M bajo Bogo 17
## 67 Esta F alto Bogo 16
## 68 Esta M medio Bogo 17
## 69 Esta M medio Bogo 30
## 70 Esta M bajo Bogo 17
## 71 Esta M bajo Bogo 17
## 72 Esta M medio Bogo 17
## 73 Esta M medio Bogo 17
## 74 Esta F bajo Bogo 19
## 75 Esta M bajo Bogo 17
## 76 Esta M medio Bogo 16
## 77 Esta F medio Bogo 17
## 78 Esta F medio Bogo 16
## 79 Esta F medio Bogo 16
## 80 Esta M bajo Bogo 17
## 81 Esta F alto Bogo 16
## 82 Esta M bajo Bogo 19
## 83 Esta M medio Bogo 17
## 84 Esta M bajo Bogo 17
## 85 Esta F bajo Bogo 16
## 86 Esta M bajo Bogo 16
## 87 Esta F medio Bogo 16
## 88 Esta M medio Bogo 39
## 89 Esta F bajo Bogo 20
## 90 Esta M bajo Bogo 21
## 91 Esta F bajo Cund 17
## 92 Esta M bajo Bogo 19
## 93 Esta M bajo Bogo 20
## 94 Esta M bajo Bogo 16
## 95 Esta M medio Bogo 18
## 96 Esta M bajo Bogo 25
## 97 Esta F medio Cund 16
## 98 Esta M bajo Bogo 31
## 99 Esta M bajo Otro 17
## 100 Esta M medio Bogo 18
## 101 Esta M medio Bogo 30
## 102 Esta F bajo Cund 17
## 103 Esta M bajo Cund 22
## 104 Esta M alto Cund 17
## 105 Esta M medio Otro 17
## 106 Esta M medio Otro 16
## 107 Esta F alto Otro 17
## 108 Esta M bajo Bogo 16
## 109 Esta M medio Bogo 16
## 110 Esta F bajo Bogo 16
## 111 Esta M medio Bogo 17
## 112 Esta F medio Bogo 15
## 113 Esta M medio Bogo 16
## 114 Esta M bajo Bogo 17
## 115 Esta M medio Bogo 16
## 116 Esta M bajo Bogo 19
## 117 Esta M medio Bogo 17
## 118 Esta F medio Bogo 22
## 119 Esta M medio Bogo 17
## 120 Esta M alto Bogo 18
## 121 Esta M bajo Bogo 17
## 122 Esta M alto Bogo 17
## 123 Esta M bajo Otro 20
## 124 Esta M bajo Otro 18
## 125 Esta F medio Otro 17
## 126 Esta M medio Otro 17
## 127 Esta M bajo Otro 18
## 128 Esta M medio Otro 17
## 129 Esta M alto Bogo 17
## 130 Farm M medio Bogo 17
## 131 Farm F medio Bogo 16
## 132 Farm F medio Bogo 17
## 133 Farm F medio Bogo 16
## 134 Farm M medio Bogo 17
## 135 Farm M medio Bogo 18
## 136 Farm F medio Bogo 18
## 137 Farm F medio Bogo 19
## 138 Farm M bajo Bogo 17
## 139 Farm F medio Bogo 17
## 140 Farm F bajo Bogo 17
## 141 Farm F medio Bogo 16
## 142 Farm F medio Bogo 18
## 143 Farm F medio Bogo 17
## 144 Farm F medio Bogo 17
## 145 Farm F medio Bogo 17
## 146 Farm F medio Bogo 16
## 147 Farm M medio Bogo 16
## 148 Farm F bajo Bogo 23
## 149 Farm F medio Bogo 17
## 150 Farm F bajo Bogo 16
## 151 Farm F medio Bogo 17
## 152 Farm F medio Bogo 16
## 153 Farm F medio Bogo 18
## 154 Farm M bajo Bogo 23
## 155 Farm M medio Otro 17
## 156 Farm M medio Bogo 23
## 157 Farm F bajo Bogo 17
## 158 Farm M bajo Bogo 20
## 159 Farm M medio Bogo 18
## 160 Farm M bajo Bogo 19
## 161 Farm M medio Bogo 18
## 162 Farm M medio Bogo 18
## 163 Farm F bajo Otro 16
## 164 Farm M medio Bogo 18
## 165 Farm F bajo Bogo 18
## 166 Farm M bajo Bogo 26
## 167 Farm F bajo Bogo 18
## 168 Farm M bajo Bogo 17
## 169 Farm F medio Otro 16
## 170 Farm M bajo Bogo 18
## 171 Farm M bajo Cund 20
## 172 Farm M bajo Cund 18
## 173 Farm M bajo Cund 16
## 174 Farm F bajo Bogo 16
## 175 Farm M alto Bogo 20
## 176 Farm F medio Otro 16
## 177 Farm F bajo Otro 16
## 178 Farm M medio Cund 17
## 179 Farm F bajo Otro 22
## 180 Farm F bajo Bogo 20
## 181 Farm M medio Bogo 17
## 182 Farm M medio Bogo 19
## 183 Farm F bajo Otro 19
## 184 Farm M medio Bogo 17
## 185 Farm F medio Bogo 18
## 186 Farm F alto Bogo 17
## 187 Farm M bajo Bogo 17
## 188 Farm F alto Bogo 17
## 189 Farm M medio Bogo 16
## 190 Farm F medio Bogo 17
## 191 Farm M bajo Bogo 17
## 192 Farm F medio Bogo 18
## 193 Farm F alto Bogo 16
## 194 Farm M alto Bogo 16
## 195 Farm M bajo Bogo 18
## 196 Farm M alto Bogo 16
## 197 Farm M bajo Otro 17
## 198 Farm F alto Otro 17
## 199 Farm F bajo Otro 16
## 200 Farm F bajo Otro 17
## 201 Farm M bajo Otro 17
## 202 Farm F bajo Otro 20
## 203 Fisi M alto Bogo 18
## 204 Fisi M alto Bogo 16
## 205 Fisi F medio Bogo 16
## 206 Fisi M medio Bogo 16
## 207 Fisi M medio Bogo 17
## 208 Fisi M medio Bogo 18
## 209 Fisi M medio Bogo 17
## 210 Fisi M medio Bogo 18
## 211 Fisi M bajo Bogo 16
## 212 Fisi M medio Bogo 19
## 213 Fisi M bajo Bogo 18
## 214 Fisi M alto Bogo 16
## 215 Fisi M bajo Bogo 17
## 216 Fisi M medio Bogo 17
## 217 Fisi M bajo Bogo 18
## 218 Fisi M alto Bogo 16
## 219 Fisi M alto Bogo 17
## 220 Fisi M medio Bogo 40
## 221 Fisi M alto Bogo 17
## 222 Fisi M alto Bogo 17
## 223 Fisi F bajo Bogo 21
## 224 Fisi M bajo Bogo 17
## 225 Fisi M alto Otro 16
## 226 Fisi M bajo Bogo 21
## 227 Fisi M alto Bogo 17
## 228 Fisi M alto Otro 16
## 229 Fisi M medio Bogo 23
## 230 Fisi M bajo Cund 17
## 231 Fisi M bajo Bogo 15
## 232 Fisi F bajo Otro 18
## 233 Fisi F bajo Otro 17
## 234 Fisi F alto Bogo 21
## 235 Fisi F bajo Cund 18
## 236 Fisi M medio Bogo 18
## 237 Fisi M bajo Cund 17
## 238 Fisi M bajo Otro 16
## 239 Fisi M bajo Otro 16
## 240 Fisi M bajo Otro 26
## 241 Fisi F bajo Cund 17
## 242 Fisi M medio Cund 17
## 243 Fisi M bajo Otro 15
## 244 Fisi M medio Otro 17
## 245 Fisi M medio Bogo 17
## 246 Fisi F medio Bogo 17
## 247 Fisi M medio Bogo 17
## 248 Fisi M medio Bogo 17
## 249 Fisi M medio Bogo 17
## 250 Fisi M alto Bogo 17
## 251 Fisi F alto Bogo 17
## 252 Fisi M medio Bogo 17
## 253 Fisi M bajo Otro 19
## 254 Fisi M medio Bogo 16
## 255 Fisi M medio Bogo 17
## 256 Fisi F alto Bogo 16
## 257 Fisi F alto Bogo 16
## 258 Fisi M medio Bogo 17
## 259 Fisi M alto Bogo 16
## 260 Fisi M medio Bogo 18
## 261 Fisi M alto Bogo 18
## 262 Fisi M alto Bogo 18
## 263 Fisi M alto Bogo 32
## 264 Fisi M bajo Otro 16
## 265 Fisi M medio Bogo 20
## 266 Fisi M bajo Bogo 16
## 267 Fisi M medio Bogo 19
## 268 Fisi M medio Bogo 27
## 269 Fisi F medio Bogo 17
## 270 Fisi F medio Bogo 17
## 271 Fisi M medio Bogo 18
## 272 Fisi M medio Bogo 23
## 273 Fisi M medio Bogo 17
## 274 Fisi M medio Bogo 22
## 275 Fisi M bajo Bogo 17
## 276 Fisi M bajo Otro 17
## 277 Fisi M bajo Otro 17
## 278 Fisi M medio Otro 16
## 279 Fisi M medio Otro 17
## 280 Fisi M medio Otro 17
## 281 Fisi M bajo Otro 17
## 282 Fisi M bajo Otro 16
## 283 Fisi M bajo Otro 16
## 284 Fisi M medio Bogo 39
## 285 Geol M bajo Bogo 17
## 286 Geol F alto Bogo 17
## 287 Geol M medio Bogo 17
## 288 Geol M alto Bogo 16
## 289 Geol M medio Bogo 19
## 290 Geol M medio Bogo 17
## 291 Geol M bajo Bogo 17
## 292 Geol M bajo Bogo 17
## 293 Geol M medio Bogo 16
## 294 Geol M alto Bogo 17
## 295 Geol M alto Cund 17
## 296 Geol M alto Cund 17
## 297 Geol M bajo Cund 17
## 298 Geol M medio Cund 16
## 299 Geol M bajo Otro 17
## 300 Geol M bajo Otro 19
## 301 Geol M bajo Bogo 20
## 302 Geol M bajo Bogo 16
## 303 Geol F bajo Otro 17
## 304 Geol M bajo Cund 25
## 305 Geol M medio Otro 17
## 306 Geol M alto Otro 16
## 307 Geol F medio Bogo 16
## 308 Geol M alto Bogo 16
## 309 Geol M bajo Otro 15
## 310 Geol M alto Bogo 18
## 311 Geol F alto Bogo 17
## 312 Geol M alto Bogo 16
## 313 Geol F medio Bogo 17
## 314 Geol F alto Bogo 18
## 315 Geol M alto Bogo 17
## 316 Geol F alto Bogo 16
## 317 Geol M bajo Otro 17
## 318 Geol M alto Bogo 16
## 319 Geol F bajo Bogo 21
## 320 Geol M medio Bogo 17
## 321 Geol M alto Bogo 17
## 322 Geol M bajo Bogo 20
## 323 Geol M alto Bogo 17
## 324 Geol M alto Bogo 17
## 325 Geol M alto Bogo 17
## 326 Geol M bajo Bogo 17
## 327 Geol M bajo Bogo 17
## 328 Geol M bajo Otro 17
## 329 Geol M bajo Otro 19
## 330 Mate F medio Bogo 31
## 331 Mate M bajo Bogo 17
## 332 Mate M medio Bogo 18
## 333 Mate M medio Bogo 17
## 334 Mate M medio Bogo 20
## 335 Mate M medio Bogo 16
## 336 Mate M medio Bogo 18
## 337 Mate M medio Bogo 23
## 338 Mate F medio Bogo 17
## 339 Mate M medio Bogo 17
## 340 Mate M medio Bogo 17
## 341 Mate M medio Bogo 18
## 342 Mate M bajo Bogo 20
## 343 Mate M medio Cund 15
## 344 Mate M bajo Otro 16
## 345 Mate M bajo Cund 17
## 346 Mate M medio Bogo 28
## 347 Mate M bajo Bogo 18
## 348 Mate M medio Otro 17
## 349 Mate M medio Bogo 21
## 350 Mate M medio Bogo 19
## 351 Mate M bajo Bogo 21
## 352 Mate M bajo Bogo 16
## 353 Mate M bajo Bogo 44
## 354 Mate M bajo Bogo 25
## 355 Mate F bajo Cund 19
## 356 Mate M alto Bogo 17
## 357 Mate M bajo Bogo 17
## 358 Mate M medio Bogo 18
## 359 Mate M alto Bogo 17
## 360 Mate M bajo Bogo 24
## 361 Mate M medio Otro 20
## 362 Mate M medio Bogo 20
## 363 Mate M alto Otro 16
## 364 Mate M bajo Cund 23
## 365 Mate M bajo Otro 16
## 366 Mate M alto Bogo 30
## 367 Mate M bajo Bogo 17
## 368 Mate M alto Bogo 19
## 369 Mate M medio Bogo 17
## 370 Mate M bajo Bogo 16
## 371 Mate M alto Bogo 29
## 372 Mate M bajo Otro 25
## 373 Mate M medio Bogo 17
## 374 Mate F medio Bogo 16
## 375 Mate M medio Bogo 30
## 376 Mate F medio Bogo 19
## 377 Mate M medio Bogo 16
## 378 Mate M bajo Otro 19
## 379 Mate M bajo Otro 25
## 380 Mate F alto Otro 16
## 381 Mate M bajo Otro 16
## 382 Mate M bajo Otro 17
## 383 Quim F medio Bogo 16
## 384 Quim F bajo Bogo 18
## 385 Quim F medio Bogo 18
## 386 Quim M alto Bogo 16
## 387 Quim M medio Bogo 21
## 388 Quim M medio Bogo 19
## 389 Quim M bajo Bogo 16
## 390 Quim M bajo Bogo 16
## 391 Quim F medio Bogo 16
## 392 Quim M medio Bogo 20
## 393 Quim F bajo Bogo 18
## 394 Quim M alto Bogo 17
## 395 Quim M medio Bogo 18
## 396 Quim M bajo Bogo 19
## 397 Quim M medio Bogo 21
## 398 Quim F bajo Cund 16
## 399 Quim M bajo Bogo 20
## 400 Quim F bajo Bogo 18
## 401 Quim M medio Bogo 16
## 402 Quim M bajo Bogo 17
## 403 Quim M medio Bogo 23
## 404 Quim M bajo Otro 16
## 405 Quim M bajo Otro 18
## 406 Quim M bajo Cund 19
## 407 Quim M bajo Bogo 19
## 408 Quim M bajo Otro 16
## 409 Quim F bajo Otro 16
## 410 Quim F medio Otro 17
## 411 Quim M alto Bogo 18
## 412 Quim M medio Cund 16
## 413 Quim M medio Cund 17
## 414 Quim M medio Cund 17
## 415 Quim M medio Cund 16
## 416 Quim M bajo Cund 27
## 417 Quim F bajo Otro 16
## 418 Quim M bajo Otro 16
## 419 Quim M bajo Cund 23
## 420 Quim F alto Otro 17
## 421 Quim M medio Otro 15
## 422 Quim M bajo Otro 17
## 423 Quim F alto Otro 17
## 424 Quim F medio Bogo 16
## 425 Quim M alto Bogo 16
## 426 Quim M medio Otro 16
## 427 Quim F medio Bogo 16
## 428 Quim M alto Bogo 17
## 429 Quim F bajo Bogo 17
## 430 Quim F medio Bogo 16
## 431 Quim F medio Bogo 16
## 432 Quim M alto Bogo 17
## 433 Quim F bajo Bogo 16
## 434 Quim M bajo Bogo 19
## 435 Quim M bajo Bogo 17
## 436 Quim M bajo Bogo 17
## 437 Quim M medio Bogo 21
## 438 Quim M medio Bogo 17
## 439 Quim F medio Bogo 17
## 440 Quim F bajo Bogo 17
## 441 Quim M bajo Otro 19
## 442 Quim M bajo Otro 16
## 443 Quim M bajo Otro 16
## 444 Quim M bajo Otro 18
## 445 Quim F bajo Otro 17
<- DatosInicial$carr
Carrera <- DatosInicial$gene
Sexo <- DatosInicial$estr
Estrato <- DatosInicial$orig
Origen <- as.factor(DatosInicial$age)
Edad
<- cbind(DatosInicial,Carrera,Sexo,Estrato,Origen)
Datos 1:5] <- NULL Datos[,
Se utilizaron las variables correspondientes a la carrera a la cual ingresaron, el género, el estrato y el origen (si son de Bogotá o no).
Datos
## Carrera Sexo Estrato Origen
## 1 Biol F alto Bogo
## 2 Biol M medio Bogo
## 3 Biol F bajo Bogo
## 4 Biol F bajo Bogo
## 5 Biol M medio Bogo
## 6 Biol F medio Bogo
## 7 Biol F medio Bogo
## 8 Biol M medio Bogo
## 9 Biol F medio Bogo
## 10 Biol M medio Bogo
## 11 Biol M bajo Bogo
## 12 Biol M medio Bogo
## 13 Biol M medio Bogo
## 14 Biol F alto Bogo
## 15 Biol M medio Bogo
## 16 Biol M medio Bogo
## 17 Biol M medio Bogo
## 18 Biol F medio Bogo
## 19 Biol M alto Otro
## 20 Biol M medio Bogo
## 21 Biol M bajo Bogo
## 22 Biol F bajo Bogo
## 23 Biol M alto Otro
## 24 Biol M bajo Bogo
## 25 Biol F medio Otro
## 26 Biol M bajo Cund
## 27 Biol F alto Bogo
## 28 Biol F medio Cund
## 29 Biol M bajo Bogo
## 30 Biol M bajo Otro
## 31 Biol F alto Cund
## 32 Biol M bajo Bogo
## 33 Biol F bajo Otro
## 34 Biol M medio Cund
## 35 Biol M bajo Cund
## 36 Biol F bajo Otro
## 37 Biol M bajo Cund
## 38 Biol F medio Otro
## 39 Biol M alto Cund
## 40 Biol F bajo Otro
## 41 Biol M bajo Otro
## 42 Biol F medio Otro
## 43 Biol M bajo Otro
## 44 Biol M alto Bogo
## 45 Biol F medio Bogo
## 46 Biol M alto Bogo
## 47 Biol M alto Bogo
## 48 Biol M medio Bogo
## 49 Biol M medio Bogo
## 50 Biol M bajo Bogo
## 51 Biol M alto Bogo
## 52 Biol M alto Bogo
## 53 Biol F medio Bogo
## 54 Biol M bajo Bogo
## 55 Biol M alto Bogo
## 56 Biol M medio Bogo
## 57 Biol F alto Bogo
## 58 Biol M bajo Otro
## 59 Biol F medio Otro
## 60 Biol M medio Otro
## 61 Biol M bajo Otro
## 62 Biol F bajo Otro
## 63 Biol M bajo Otro
## 64 Esta M medio Bogo
## 65 Esta M alto Bogo
## 66 Esta M bajo Bogo
## 67 Esta F alto Bogo
## 68 Esta M medio Bogo
## 69 Esta M medio Bogo
## 70 Esta M bajo Bogo
## 71 Esta M bajo Bogo
## 72 Esta M medio Bogo
## 73 Esta M medio Bogo
## 74 Esta F bajo Bogo
## 75 Esta M bajo Bogo
## 76 Esta M medio Bogo
## 77 Esta F medio Bogo
## 78 Esta F medio Bogo
## 79 Esta F medio Bogo
## 80 Esta M bajo Bogo
## 81 Esta F alto Bogo
## 82 Esta M bajo Bogo
## 83 Esta M medio Bogo
## 84 Esta M bajo Bogo
## 85 Esta F bajo Bogo
## 86 Esta M bajo Bogo
## 87 Esta F medio Bogo
## 88 Esta M medio Bogo
## 89 Esta F bajo Bogo
## 90 Esta M bajo Bogo
## 91 Esta F bajo Cund
## 92 Esta M bajo Bogo
## 93 Esta M bajo Bogo
## 94 Esta M bajo Bogo
## 95 Esta M medio Bogo
## 96 Esta M bajo Bogo
## 97 Esta F medio Cund
## 98 Esta M bajo Bogo
## 99 Esta M bajo Otro
## 100 Esta M medio Bogo
## 101 Esta M medio Bogo
## 102 Esta F bajo Cund
## 103 Esta M bajo Cund
## 104 Esta M alto Cund
## 105 Esta M medio Otro
## 106 Esta M medio Otro
## 107 Esta F alto Otro
## 108 Esta M bajo Bogo
## 109 Esta M medio Bogo
## 110 Esta F bajo Bogo
## 111 Esta M medio Bogo
## 112 Esta F medio Bogo
## 113 Esta M medio Bogo
## 114 Esta M bajo Bogo
## 115 Esta M medio Bogo
## 116 Esta M bajo Bogo
## 117 Esta M medio Bogo
## 118 Esta F medio Bogo
## 119 Esta M medio Bogo
## 120 Esta M alto Bogo
## 121 Esta M bajo Bogo
## 122 Esta M alto Bogo
## 123 Esta M bajo Otro
## 124 Esta M bajo Otro
## 125 Esta F medio Otro
## 126 Esta M medio Otro
## 127 Esta M bajo Otro
## 128 Esta M medio Otro
## 129 Esta M alto Bogo
## 130 Farm M medio Bogo
## 131 Farm F medio Bogo
## 132 Farm F medio Bogo
## 133 Farm F medio Bogo
## 134 Farm M medio Bogo
## 135 Farm M medio Bogo
## 136 Farm F medio Bogo
## 137 Farm F medio Bogo
## 138 Farm M bajo Bogo
## 139 Farm F medio Bogo
## 140 Farm F bajo Bogo
## 141 Farm F medio Bogo
## 142 Farm F medio Bogo
## 143 Farm F medio Bogo
## 144 Farm F medio Bogo
## 145 Farm F medio Bogo
## 146 Farm F medio Bogo
## 147 Farm M medio Bogo
## 148 Farm F bajo Bogo
## 149 Farm F medio Bogo
## 150 Farm F bajo Bogo
## 151 Farm F medio Bogo
## 152 Farm F medio Bogo
## 153 Farm F medio Bogo
## 154 Farm M bajo Bogo
## 155 Farm M medio Otro
## 156 Farm M medio Bogo
## 157 Farm F bajo Bogo
## 158 Farm M bajo Bogo
## 159 Farm M medio Bogo
## 160 Farm M bajo Bogo
## 161 Farm M medio Bogo
## 162 Farm M medio Bogo
## 163 Farm F bajo Otro
## 164 Farm M medio Bogo
## 165 Farm F bajo Bogo
## 166 Farm M bajo Bogo
## 167 Farm F bajo Bogo
## 168 Farm M bajo Bogo
## 169 Farm F medio Otro
## 170 Farm M bajo Bogo
## 171 Farm M bajo Cund
## 172 Farm M bajo Cund
## 173 Farm M bajo Cund
## 174 Farm F bajo Bogo
## 175 Farm M alto Bogo
## 176 Farm F medio Otro
## 177 Farm F bajo Otro
## 178 Farm M medio Cund
## 179 Farm F bajo Otro
## 180 Farm F bajo Bogo
## 181 Farm M medio Bogo
## 182 Farm M medio Bogo
## 183 Farm F bajo Otro
## 184 Farm M medio Bogo
## 185 Farm F medio Bogo
## 186 Farm F alto Bogo
## 187 Farm M bajo Bogo
## 188 Farm F alto Bogo
## 189 Farm M medio Bogo
## 190 Farm F medio Bogo
## 191 Farm M bajo Bogo
## 192 Farm F medio Bogo
## 193 Farm F alto Bogo
## 194 Farm M alto Bogo
## 195 Farm M bajo Bogo
## 196 Farm M alto Bogo
## 197 Farm M bajo Otro
## 198 Farm F alto Otro
## 199 Farm F bajo Otro
## 200 Farm F bajo Otro
## 201 Farm M bajo Otro
## 202 Farm F bajo Otro
## 203 Fisi M alto Bogo
## 204 Fisi M alto Bogo
## 205 Fisi F medio Bogo
## 206 Fisi M medio Bogo
## 207 Fisi M medio Bogo
## 208 Fisi M medio Bogo
## 209 Fisi M medio Bogo
## 210 Fisi M medio Bogo
## 211 Fisi M bajo Bogo
## 212 Fisi M medio Bogo
## 213 Fisi M bajo Bogo
## 214 Fisi M alto Bogo
## 215 Fisi M bajo Bogo
## 216 Fisi M medio Bogo
## 217 Fisi M bajo Bogo
## 218 Fisi M alto Bogo
## 219 Fisi M alto Bogo
## 220 Fisi M medio Bogo
## 221 Fisi M alto Bogo
## 222 Fisi M alto Bogo
## 223 Fisi F bajo Bogo
## 224 Fisi M bajo Bogo
## 225 Fisi M alto Otro
## 226 Fisi M bajo Bogo
## 227 Fisi M alto Bogo
## 228 Fisi M alto Otro
## 229 Fisi M medio Bogo
## 230 Fisi M bajo Cund
## 231 Fisi M bajo Bogo
## 232 Fisi F bajo Otro
## 233 Fisi F bajo Otro
## 234 Fisi F alto Bogo
## 235 Fisi F bajo Cund
## 236 Fisi M medio Bogo
## 237 Fisi M bajo Cund
## 238 Fisi M bajo Otro
## 239 Fisi M bajo Otro
## 240 Fisi M bajo Otro
## 241 Fisi F bajo Cund
## 242 Fisi M medio Cund
## 243 Fisi M bajo Otro
## 244 Fisi M medio Otro
## 245 Fisi M medio Bogo
## 246 Fisi F medio Bogo
## 247 Fisi M medio Bogo
## 248 Fisi M medio Bogo
## 249 Fisi M medio Bogo
## 250 Fisi M alto Bogo
## 251 Fisi F alto Bogo
## 252 Fisi M medio Bogo
## 253 Fisi M bajo Otro
## 254 Fisi M medio Bogo
## 255 Fisi M medio Bogo
## 256 Fisi F alto Bogo
## 257 Fisi F alto Bogo
## 258 Fisi M medio Bogo
## 259 Fisi M alto Bogo
## 260 Fisi M medio Bogo
## 261 Fisi M alto Bogo
## 262 Fisi M alto Bogo
## 263 Fisi M alto Bogo
## 264 Fisi M bajo Otro
## 265 Fisi M medio Bogo
## 266 Fisi M bajo Bogo
## 267 Fisi M medio Bogo
## 268 Fisi M medio Bogo
## 269 Fisi F medio Bogo
## 270 Fisi F medio Bogo
## 271 Fisi M medio Bogo
## 272 Fisi M medio Bogo
## 273 Fisi M medio Bogo
## 274 Fisi M medio Bogo
## 275 Fisi M bajo Bogo
## 276 Fisi M bajo Otro
## 277 Fisi M bajo Otro
## 278 Fisi M medio Otro
## 279 Fisi M medio Otro
## 280 Fisi M medio Otro
## 281 Fisi M bajo Otro
## 282 Fisi M bajo Otro
## 283 Fisi M bajo Otro
## 284 Fisi M medio Bogo
## 285 Geol M bajo Bogo
## 286 Geol F alto Bogo
## 287 Geol M medio Bogo
## 288 Geol M alto Bogo
## 289 Geol M medio Bogo
## 290 Geol M medio Bogo
## 291 Geol M bajo Bogo
## 292 Geol M bajo Bogo
## 293 Geol M medio Bogo
## 294 Geol M alto Bogo
## 295 Geol M alto Cund
## 296 Geol M alto Cund
## 297 Geol M bajo Cund
## 298 Geol M medio Cund
## 299 Geol M bajo Otro
## 300 Geol M bajo Otro
## 301 Geol M bajo Bogo
## 302 Geol M bajo Bogo
## 303 Geol F bajo Otro
## 304 Geol M bajo Cund
## 305 Geol M medio Otro
## 306 Geol M alto Otro
## 307 Geol F medio Bogo
## 308 Geol M alto Bogo
## 309 Geol M bajo Otro
## 310 Geol M alto Bogo
## 311 Geol F alto Bogo
## 312 Geol M alto Bogo
## 313 Geol F medio Bogo
## 314 Geol F alto Bogo
## 315 Geol M alto Bogo
## 316 Geol F alto Bogo
## 317 Geol M bajo Otro
## 318 Geol M alto Bogo
## 319 Geol F bajo Bogo
## 320 Geol M medio Bogo
## 321 Geol M alto Bogo
## 322 Geol M bajo Bogo
## 323 Geol M alto Bogo
## 324 Geol M alto Bogo
## 325 Geol M alto Bogo
## 326 Geol M bajo Bogo
## 327 Geol M bajo Bogo
## 328 Geol M bajo Otro
## 329 Geol M bajo Otro
## 330 Mate F medio Bogo
## 331 Mate M bajo Bogo
## 332 Mate M medio Bogo
## 333 Mate M medio Bogo
## 334 Mate M medio Bogo
## 335 Mate M medio Bogo
## 336 Mate M medio Bogo
## 337 Mate M medio Bogo
## 338 Mate F medio Bogo
## 339 Mate M medio Bogo
## 340 Mate M medio Bogo
## 341 Mate M medio Bogo
## 342 Mate M bajo Bogo
## 343 Mate M medio Cund
## 344 Mate M bajo Otro
## 345 Mate M bajo Cund
## 346 Mate M medio Bogo
## 347 Mate M bajo Bogo
## 348 Mate M medio Otro
## 349 Mate M medio Bogo
## 350 Mate M medio Bogo
## 351 Mate M bajo Bogo
## 352 Mate M bajo Bogo
## 353 Mate M bajo Bogo
## 354 Mate M bajo Bogo
## 355 Mate F bajo Cund
## 356 Mate M alto Bogo
## 357 Mate M bajo Bogo
## 358 Mate M medio Bogo
## 359 Mate M alto Bogo
## 360 Mate M bajo Bogo
## 361 Mate M medio Otro
## 362 Mate M medio Bogo
## 363 Mate M alto Otro
## 364 Mate M bajo Cund
## 365 Mate M bajo Otro
## 366 Mate M alto Bogo
## 367 Mate M bajo Bogo
## 368 Mate M alto Bogo
## 369 Mate M medio Bogo
## 370 Mate M bajo Bogo
## 371 Mate M alto Bogo
## 372 Mate M bajo Otro
## 373 Mate M medio Bogo
## 374 Mate F medio Bogo
## 375 Mate M medio Bogo
## 376 Mate F medio Bogo
## 377 Mate M medio Bogo
## 378 Mate M bajo Otro
## 379 Mate M bajo Otro
## 380 Mate F alto Otro
## 381 Mate M bajo Otro
## 382 Mate M bajo Otro
## 383 Quim F medio Bogo
## 384 Quim F bajo Bogo
## 385 Quim F medio Bogo
## 386 Quim M alto Bogo
## 387 Quim M medio Bogo
## 388 Quim M medio Bogo
## 389 Quim M bajo Bogo
## 390 Quim M bajo Bogo
## 391 Quim F medio Bogo
## 392 Quim M medio Bogo
## 393 Quim F bajo Bogo
## 394 Quim M alto Bogo
## 395 Quim M medio Bogo
## 396 Quim M bajo Bogo
## 397 Quim M medio Bogo
## 398 Quim F bajo Cund
## 399 Quim M bajo Bogo
## 400 Quim F bajo Bogo
## 401 Quim M medio Bogo
## 402 Quim M bajo Bogo
## 403 Quim M medio Bogo
## 404 Quim M bajo Otro
## 405 Quim M bajo Otro
## 406 Quim M bajo Cund
## 407 Quim M bajo Bogo
## 408 Quim M bajo Otro
## 409 Quim F bajo Otro
## 410 Quim F medio Otro
## 411 Quim M alto Bogo
## 412 Quim M medio Cund
## 413 Quim M medio Cund
## 414 Quim M medio Cund
## 415 Quim M medio Cund
## 416 Quim M bajo Cund
## 417 Quim F bajo Otro
## 418 Quim M bajo Otro
## 419 Quim M bajo Cund
## 420 Quim F alto Otro
## 421 Quim M medio Otro
## 422 Quim M bajo Otro
## 423 Quim F alto Otro
## 424 Quim F medio Bogo
## 425 Quim M alto Bogo
## 426 Quim M medio Otro
## 427 Quim F medio Bogo
## 428 Quim M alto Bogo
## 429 Quim F bajo Bogo
## 430 Quim F medio Bogo
## 431 Quim F medio Bogo
## 432 Quim M alto Bogo
## 433 Quim F bajo Bogo
## 434 Quim M bajo Bogo
## 435 Quim M bajo Bogo
## 436 Quim M bajo Bogo
## 437 Quim M medio Bogo
## 438 Quim M medio Bogo
## 439 Quim F medio Bogo
## 440 Quim F bajo Bogo
## 441 Quim M bajo Otro
## 442 Quim M bajo Otro
## 443 Quim M bajo Otro
## 444 Quim M bajo Otro
## 445 Quim F bajo Otro
<-ggplot(Datos, aes(x=Carrera)) + geom_bar(fill= "#DDB4EB")
F1<-ggplot(Datos, aes(x=Sexo)) + geom_bar(fill= "#FFD4A5")
F2<-ggplot(Datos, aes(x=Estrato)) + geom_bar(fill= "#41894A")
F3<-ggplot(Datos, aes(x=Origen)) + geom_bar(fill= "#FFEC28")
F4<- grid.arrange(F1,F2,F3,F4, nrow = 2) F5
La función MCA() crea un objeto que contiene mucha información encontrada en diferentes listas y matrices. Al usar la función print() se mostrará una lista con todos los valores que contiene.
<- MCA(Datos, graph = FALSE)
uni.mca print(uni.mca)
## **Results of the Multiple Correspondence Analysis (MCA)**
## The analysis was performed on 445 individuals, described by 4 variables
## *The results are available in the following objects:
##
## name description
## 1 "$eig" "eigenvalues"
## 2 "$var" "results for the variables"
## 3 "$var$coord" "coord. of the categories"
## 4 "$var$cos2" "cos2 for the categories"
## 5 "$var$contrib" "contributions of the categories"
## 6 "$var$v.test" "v-test for the categories"
## 7 "$ind" "results for the individuals"
## 8 "$ind$coord" "coord. for the individuals"
## 9 "$ind$cos2" "cos2 for the individuals"
## 10 "$ind$contrib" "contributions of the individuals"
## 11 "$call" "intermediate results"
## 12 "$call$marge.col" "weights of columns"
## 13 "$call$marge.li" "weights of rows"
Eingevalores
<- get_eigenvalue(uni.mca)
eigenval pander(head(eigenval))
eigenvalue | variance.percent | cumulative.variance.percent | |
---|---|---|---|
Dim.1 | 0.3423 | 12.45 | 12.45 |
Dim.2 | 0.3338 | 12.14 | 24.59 |
Dim.3 | 0.2968 | 10.79 | 35.38 |
Dim.4 | 0.2634 | 9.579 | 44.96 |
Dim.5 | 0.2546 | 9.258 | 54.22 |
Dim.6 | 0.25 | 9.091 | 63.31 |
Para determinar el numero de componentes principales smiramos un un Scree Plot, que es un plot de los eigenvalues ordenados de mayor a menor.
- El número de componentes es determinado en el punto mas allá del cual los egeinvalues restantes son todos relativamente pequeños y de tamaño comparable.
- También se puede calcular el eigenvalue promedio sobre el cual el axis se debería mantener en la solución. En este caso debería ser (1/(número de columnas-1)).
fviz_screeplot(uni.mca, addlabels = TRUE, ylim = c(0, 15)) + geom_hline(yintercept = 7.14, linetype = 2, color = "red")
Biplot
fviz_mca_biplot(uni.mca, repel = TRUE,
ggtheme = theme_grey())+labs(
title =" Representación simultanea de los individuos y las categorías")
## Warning: ggrepel: 387 unlabeled data points (too many overlaps). Consider
## increasing max.overlaps
- Los individuos están representados por los puntos azules
- Las categorías de las variables por los triángulos rojos.
- Individuos con un perfil similar están cerca en el mapa de factores y lo mismo se puede decir para los puntos de las variables.
- Parte de los individuos se relaciona con el estrato bajo y haber ingresado a la carrera de química.
- Hay una relación entre estudiantes que ingresaron a matemáticas y el género masculino, y estudiantes de estrato alto y la carrera física.
Resultados de Variables.
<- get_mca_var(uni.mca)
var var
## Multiple Correspondence Analysis Results for variables
## ===================================================
## Name Description
## 1 "$coord" "Coordinates for categories"
## 2 "$cos2" "Cos2 for categories"
## 3 "$contrib" "contributions of categories"
Para visualizar la correlación entre variables y las dimensiones principales de ACM:
fviz_mca_var(uni.mca, choice = "mca.cor",
repel = TRUE,
ggtheme = theme_grey())
Esta gráfica ayuda a identificar las variables que están más correlacionadas con cada dimensión. Las correlaciones cuadradas entre variables y las dimensiones son usadas como coordenadas.
En este caso se tiene que la variable Estrato
es la que presenta mayor correlación con la dimensión 2, por una diferencia pequeña con Origen
y Carrera
, y una mayor con Género
. Así mismo, la variable más correlacionada con la dimensión 1 es Carrera
.
Si queremos ver las coordenadas puntuales de cada categoría en cada dimensión:
pander(head(round(var$coord, 2), 15))
Dim 1 | Dim 2 | Dim 3 | Dim 4 | Dim 5 | |
---|---|---|---|---|---|
Biol | -0.05 | 0.33 | 0.7 | -0.31 | 1.99 |
Esta | -0.14 | -0.15 | -0.68 | 1.08 | -0.55 |
Farm | -1.3 | 0.69 | 0.31 | -0.09 | -0.8 |
Fisi | 0.28 | -0.69 | -0.23 | -1.23 | -0.04 |
Geol | 0.99 | -0.76 | 1.61 | 0.72 | -1 |
Mate | 0.39 | -0.48 | -1.27 | -0.06 | 0.21 |
Quim | 0.3 | 0.86 | -0.14 | 0.43 | 0.1 |
F | -0.9 | 0.68 | 0.59 | 0 | 0 |
M | 0.36 | -0.27 | -0.24 | 0 | 0 |
bajo | 0.58 | 0.72 | -0.14 | 0.03 | -0.32 |
medio | -0.69 | -0.27 | -0.45 | 0.02 | 0.29 |
alto | 0.29 | -0.97 | 1.35 | -0.09 | 0.05 |
Bogo | -0.33 | -0.39 | -0.02 | 0.08 | -0.07 |
Cund | 0.94 | 0.65 | 0.08 | 1.85 | 1.15 |
Otro | 0.71 | 1.01 | 0.04 | -0.98 | -0.22 |
Para solo ver las modalidades o categorías de las variables (sin individuos):
fviz_mca_var(uni.mca, col.var = "purple", shape.var = 10, repel = TRUE,
ggtheme = theme_grey())+labs(title = " Nube de puntos de las Modalidades/Categorías")
Se observa la relación y asociación entre las categorías de las variables y se puede interpretar como:
Las categorías de variables con un perfil similar están agrupadas juntas.
Categorías de variables correlacionadas negativamente están posicionadas en lados opuestos del origen de la gráfica (cuadrantes opuestos).
La distancia entre los puntos de cada categoría y el origen mide la calidad de la categoría de la variable en el mapa de factores. Los puntos de cada categoría que estén lejos del origen están bien representados en el mapa.
Según esto, bajo lo que se puede observar en el gráfico, las categorías “Cund”, “Otro”, “Bajo” y “Química” comparten un perfil similar, existe cierta asociación. Se puede suponer entonces que las personas que entraron a la Universidad Nacional a la Facultad de Ciencias que son provenietes de lugares por fuera de Bogotá, tienen más relación o asociación con estratos socioeconomicos bajos, y una escogencia en la carrera de quimica.
Los inidividuos de estrato alto estan más asociados a carreras universitarias como la fisica y la matematica y esta última al sexo masculino. Para culminar, vemos que el sexo femenino esta más relacionado con la carrera universitaria farmacia.
Calidad de la representación de las categoría de las variables.
La calidad de la representación se llama el coseno cuadrado (Cos2), el cual mide el grado de asociación entre las categorías de las variables y un eje en particular. Si la categoría de una variable está bien representada por dos dimensiones, la suma del cos2 es cercana a uno. Para algunos ítems de las filas, más de dos dimensiones son requeridas para represetar perfectamente los datos. Hay distintas maneras de ver dicha calidad de representación:
pander(head(var$cos2, 15))
Dim 1 | Dim 2 | Dim 3 | Dim 4 | Dim 5 | |
---|---|---|---|---|---|
Biol | 0.0003501 | 0.01831 | 0.08068 | 0.01557 | 0.6521 |
Esta | 0.003632 | 0.003828 | 0.08105 | 0.2029 | 0.05301 |
Farm | 0.3341 | 0.09399 | 0.01918 | 0.001698 | 0.1245 |
Fisi | 0.01825 | 0.1089 | 0.01145 | 0.3445 | 0.0003198 |
Geol | 0.1114 | 0.06446 | 0.2922 | 0.05777 | 0.1117 |
Mate | 0.02033 | 0.03053 | 0.2187 | 0.0005584 | 0.005957 |
Quim | 0.01509 | 0.1232 | 0.003015 | 0.03103 | 0.001542 |
F | 0.3291 | 0.1863 | 0.1414 | 3.7e-08 | 6.771e-06 |
M | 0.3291 | 0.1863 | 0.1414 | 3.7e-08 | 6.771e-06 |
bajo | 0.2285 | 0.3472 | 0.01319 | 0.0004408 | 0.06814 |
medio | 0.3403 | 0.05253 | 0.1465 | 0.000183 | 0.05893 |
alto | 0.01895 | 0.208 | 0.403 | 0.001932 | 0.0004683 |
Bogo | 0.2571 | 0.3556 | 0.001142 | 0.01378 | 0.012 |
Cund | 0.08297 | 0.03919 | 0.000562 | 0.3193 | 0.1229 |
Otro | 0.1367 | 0.2815 | 0.0004658 | 0.265 | 0.01346 |
En este caso ninguna de las categorías estaría bien representada únicamente por 2 dimensiones, la categoría Bogotá cuenta con un cos2 de 0.612 pero aún así no es lo suficientemente cercano a uno. Todas las categorías de las variables requerirían más de una dimensión para estar mejor representadas.
Diagrama de puntos:
fviz_mca_var(uni.mca, col.var = "cos2",
repel = TRUE, gradient.cols = c("#00AFBB", "#E7B800","#FC4E07"),
ggtheme = theme_grey())+labs(title = " Nube de puntos de las Modalidades/Categorías")
Gráficamente es más sencillo observar las categorías que se encuentran mejor representadas por las dimensiones 1 y 2. Como ya se dijo, la categoría Bogotá es de las que mejor representadas se encuentra, seguido de las categorías Bajo, F (Femenino) y M (Masculino).
Diagrama de barras:
fviz_cos2(uni.mca, choice = "var", axes = 1:2)+labs(title = " Cos2 de Categorías para las Dimensiones 1-2")
Las categorías peor representadas por las dimensiones 1 y 2 parecen ser “Esta”, “Biol”, “Mate”, “Cund”, “Fisi”. Esto significa que la posición de sus correspondientes puntos en el diagrama de dispersión deben ser interpretados con precausión. También indica que una solución con dimensión más alta sería recomendable.
Y, finalmente, para ver un análisis del cos2 con más de dos dimensiones:
corrplot(var$cos2, is.corr = FALSE)
##Contribución de las categorías de las variables a las dimensiones.
La contribución de las categorías de las variables (en %) a la definición de las dimensiones puede ser extraída como
pander(head(round(var$contrib,2), 15))
Dim 1 | Dim 2 | Dim 3 | Dim 4 | Dim 5 | |
---|---|---|---|---|---|
Biol | 0.02 | 1.18 | 5.83 | 1.27 | 54.97 |
Esta | 0.23 | 0.24 | 5.81 | 16.4 | 4.43 |
Farm | 20.4 | 5.88 | 1.35 | 0.13 | 10.22 |
Fisi | 1.09 | 6.65 | 0.79 | 26.67 | 0.03 |
Geol | 7.31 | 4.34 | 22.12 | 4.93 | 9.86 |
Mate | 1.31 | 2.01 | 16.22 | 0.05 | 0.52 |
Quim | 0.95 | 7.92 | 0.22 | 2.53 | 0.13 |
F | 17.12 | 9.94 | 8.49 | 0 | 0 |
M | 6.91 | 4.01 | 3.43 | 0 | 0 |
bajo | 9.98 | 15.54 | 0.66 | 0.03 | 4 |
medio | 14.52 | 2.3 | 7.21 | 0.01 | 3.38 |
alto | 1.13 | 12.74 | 27.77 | 0.15 | 0.04 |
Bogo | 5.65 | 8.02 | 0.03 | 0.39 | 0.35 |
Cund | 5.54 | 2.68 | 0.04 | 27.71 | 11.04 |
Otro | 7.83 | 16.53 | 0.03 | 19.73 | 1.04 |
Las categorías de las variables con el mayor valor contribuyen más a la definición de las dimensiones, y, así mismo, las que contribuyen mas a la dimensión 1 y 2 son las más importantes en explicar la variabilidad de los datos.
Gráficamente:
fviz_contrib(uni.mca, choice = "var", axes = 1, top = 15)+labs(title = "Contribución de las Categorías para las Dimensión 1")
fviz_contrib(uni.mca, choice = "var", axes = 2, top = 15)+labs(title = "Contribución de las Categorías para las Dimensión 2")
La linea roja indica el valor promedio esperado si las contribuciones fueran uniformes. En este caso, las categorías “Farm”, “F”, “Medio”, y “Bajo” son las más importantes en la definición de la primera dimensión, por otro lado, “Otro”, “Bajo”, “Alto” y “F” son las que más contribuyen a la dimensión 2.
Las que más contribuyen en total se pueden ver mediante dos gráficos distintos, un gráfico de barras:
fviz_contrib(uni.mca, choice = "var", axes = 1:2, top = 15)+labs(title = " Contribuciones de las Categorías para las Dimensiónes 1-2")
fviz_mca_var(uni.mca, col.var = "contrib",
gradient.cols = c("#00AFBB", "#E7B800","#FC4E07"),
ggtheme = theme_grey()
repel = TRUE) ,
Aquí, las categorías que más contribuyen son Farm, F, Bajo, y Otro, y se puede distinguir a qué polo de las dimensiones están contribuyendo: Bajo y Otro contribuyen al polo positivo de la dimensión 1 y 2, mientras que Farm y F contribuyen al polo positivo de la dimensión 2 y el polo negativo de la dimensión 1.
Resultados Individuos
Ahora se procede a realizar el mismo procedimiento pero para los individuos.
<- get_mca_ind(uni.mca)
est est
## Multiple Correspondence Analysis Results for individuals
## ===================================================
## Name Description
## 1 "$coord" "Coordinates for the individuals"
## 2 "$cos2" "Cos2 for the individuals"
## 3 "$contrib" "contributions of the individuals"
Estos resultados para los individuos dan la misma información como la descrita para las categorías de variables.
Coordinadas de los puntos de columnas
pander(head(est$coord))
Dim 1 | Dim 2 | Dim 3 | Dim 4 | Dim 5 |
---|---|---|---|---|
-0.423 | -0.1496 | 1.2 | -0.1577 | 0.9744 |
-0.3017 | -0.2614 | -0.007109 | -0.1043 | 1.091 |
-0.2986 | 0.5795 | 0.5181 | -0.09983 | 0.794 |
-0.2986 | 0.5795 | 0.5181 | -0.09983 | 0.794 |
-0.3017 | -0.2614 | -0.007109 | -0.1043 | 1.091 |
-0.8432 | 0.1512 | 0.3741 | -0.1045 | 1.094 |
Calidad de representación
pander(head(est$cos2))
Dim 1 | Dim 2 | Dim 3 | Dim 4 | Dim 5 |
---|---|---|---|---|
0.05315 | 0.006649 | 0.4277 | 0.007387 | 0.282 |
0.04384 | 0.03292 | 2.435e-05 | 0.005238 | 0.5738 |
0.03412 | 0.1285 | 0.1027 | 0.003812 | 0.2411 |
0.03412 | 0.1285 | 0.1027 | 0.003812 | 0.2411 |
0.04384 | 0.03292 | 2.435e-05 | 0.005238 | 0.5738 |
0.2741 | 0.008809 | 0.05396 | 0.004208 | 0.4616 |
Contribuciones.
pander(head(est$contrib))
Dim 1 | Dim 2 | Dim 3 | Dim 4 | Dim 5 |
---|---|---|---|---|
0.1175 | 0.01507 | 1.09 | 0.02121 | 0.838 |
0.05975 | 0.04601 | 3.826e-05 | 0.009277 | 1.051 |
0.05856 | 0.2261 | 0.2032 | 0.008502 | 0.5564 |
0.05856 | 0.2261 | 0.2032 | 0.008502 | 0.5564 |
0.05975 | 0.04601 | 3.826e-05 | 0.009277 | 1.051 |
0.4668 | 0.01538 | 0.106 | 0.009314 | 1.057 |
Ahora vamos a visualizar únicamente los individuos coloréandolos en base de sus valores de Cos2 (calidad de representación).
fviz_mca_ind(uni.mca, col.ind = "cos2",
gradient.cols= c("blue", "white", "red"),
repel = TRUE,
ggtheme = theme_grey())
## Warning: ggrepel: 397 unlabeled data points (too many overlaps). Consider
## increasing max.overlaps
Se ven individuos mas alejados al centro de gravedad son los mejor representados por ambas dimensiones dado que segun sus caracteristicas contribuyen un alto porcentaje a la definicion de ambas dimensiones (lejanos y aproximadamente con 45 grados al centro de gravedad), ademas de los que estan alejados y muy cercanos a una dimension, como por ejemplo los individuos 409, 417 y 445 se encuentra muy cercanos al eje de la dimension 2 por lo que esta los representa bien.
tail(est$contrib)
## Dim 1 Dim 2 Dim 3 Dim 4 Dim 5
## 440 0.01471501 0.4409500 0.01381912 0.05817901 0.01813721
## 441 0.45812217 0.6782594 0.03567506 0.05517507 0.04278631
## 442 0.45812217 0.6782594 0.03567506 0.05517507 0.04278631
## 443 0.45812217 0.6782594 0.03567506 0.05517507 0.04278631
## 444 0.45812217 0.6782594 0.03567506 0.05517507 0.04278631
## 445 0.05667182 1.3504293 0.02040334 0.05526492 0.04168646
fviz_cos2 (uni.mca, choice = "ind", axes = 1:2, top = 50)+labs(title = "Cos2 de los individuos para las Dimensiónes 1-2")
Aquí se observa una complicación si quisieramos observar los cos2 de cada individuo mediante un diagrama de barras debido a la gran cantidad de datos que hay. El diagrama de barras en este caso no es recomendable por esto mismo, y ocurre también para observar las contribuciones de los individuos a las dimensiones. El codigo para observar las contribuciones sería
fviz_contrib(uni.mca, choice = "ind", axes = 1:2)
Agrupando a los individuos.
El siguiente código agrupa los individuos por colores utilizando los niveles de la variable de elección, en este caso escogimos la variable “Sexo” que indica el género de los estudiantes admitidos. El argumento habillage se usa para especificar el el factor de la variable para agrupar los individuos por color. Se agrega también un elipse de concentración alrededor de cada grupo usando el argumento addEllipses = TRUE.
fviz_mca_ind(uni.mca,
label = "none",
habillage = Sexo,
pallette = c("#CCCCFF", "#F08080"),
addEllipses = TRUE,
ggtheme = theme_grey())
Se puede observar cómo las elipses de concentración de los puntos correspondientes a las categorías de la variable sexo están diferenciadas entre sí horizontalmente, indicando que la dimensión representada en ese eje (dimensión 1) discrimina entre ambas categorías de la variable. Esto no es así para la dimensión en el eje vertical (dimensión 2).
Si se quiere hacer con varias variables categóricas:
fviz_ellipses(uni.mca, 1:4,
geom = "point")
- Descripción de la dimensión:
<- dimdesc(uni.mca, axes = c(1,2))
uni.desc 1]] uni.desc[[
## $quali
## R2 p.value
## Carrera 0.4285332 2.729269e-50
## Estrato 0.3509500 3.261910e-42
## Sexo 0.3290597 2.681458e-40
## Origen 0.2605319 1.074463e-29
##
## $category
## Estimate p.value
## Sexo=M 0.3706947 2.681458e-40
## Estrato=bajo 0.3052501 8.673120e-27
## Origen=Otro 0.1560603 7.249209e-16
## Carrera=Geol 0.5424408 4.904088e-13
## Origen=Cund 0.2950703 5.987708e-10
## Carrera=Mate 0.1872306 2.572682e-03
## Estrato=alto 0.1350416 3.620153e-03
## Carrera=Fisi 0.1266678 4.305176e-03
## Carrera=Quim 0.1373367 9.492803e-03
## Origen=Bogo -0.4511305 1.925781e-30
## Sexo=F -0.3706947 2.681458e-40
## Carrera=Farm -0.8029882 5.005960e-41
## Estrato=medio -0.4402917 6.161214e-42
##
## attr(,"class")
## [1] "condes" "list"
Prueba de hipotesis:
- H0: La variable o clasificacion no es caracteristica en la dimension
- H1: La variable o clasificacion es caracteristica en la dimensión
El primer eje (dimension 1) se caracteriza por todas las cualitativas de la base de datos, siendo la variable carrera la que mas influencia tiene en esta dimension dado que tiene el R-cuadrado mas alto. Por el lado de las categorias, todas menos la carrera de biologia ni estadistica, son caracteristicas en esta dimension.
Se puede ver que la categoria sexo masculino tiene coordenadas significativamente más elevadas que la media (0) en el primer eje, mientras que la categoria estrato medio es la que tiene coordenadas mas por debajo de la media del eje 1.
2]] uni.desc[[
## $quali
## R2 p.value
## Estrato 0.4084061 4.142269e-51
## Origen 0.3636578 4.127146e-44
## Carrera 0.3769897 3.462704e-42
## Sexo 0.1863262 1.270418e-21
##
## $category
## Estimate p.value
## Estrato=bajo 0.51524141 5.965710e-43
## Origen=Otro 0.34025553 1.132851e-33
## Sexo=F 0.27548929 1.270418e-21
## Carrera=Quim 0.51470708 2.380816e-14
## Carrera=Farm 0.41514749 3.873902e-11
## Origen=Cund 0.13011519 2.600059e-05
## Carrera=Biol 0.20779436 4.242543e-03
## Carrera=Mate -0.25928525 2.121723e-04
## Estrato=medio -0.05679302 1.027153e-06
## Carrera=Geol -0.42207042 5.642303e-08
## Carrera=Fisi -0.38590151 9.136110e-13
## Sexo=M -0.27548929 1.270418e-21
## Estrato=alto -0.45844838 3.025078e-24
## Origen=Bogo -0.47037072 3.422630e-44
##
## attr(,"class")
## [1] "condes" "list"
El primer eje (dimension 2) se caracteriza por todas las cualitativas de la base de datos, siendo la variable estrato la que mas influencia tiene en esta dimension dado que tiene el R-cuadrado mas alto. Por el lado de las categorias, todas menos la carrera de Estadistica, son caracteristicas en esta dimension.
Se puede ver que la categoria estrato bajo tiene coordenadas significativamente más elevadas que la media (0) en el segundo eje, mientras que la categoria origen Bogota es la que tiene coordenadas mas por debajo de la media del eje 2.
Variable Suplementaria.
Se agrega la variable suplementaria “Edad” a la base de datos
<-cbind(Datos,Edad) NuevosDatos
<- MCA(NuevosDatos,quali.sup = 5,ncp=2,graph = FALSE)
sup.mca<- sup.mca$quali.sup$coord
coor_catpander(coor_cat)
Dim 1 | Dim 2 | |
---|---|---|
15 | 0.567 | 0.4691 |
16 | -0.03525 | 0.1695 |
17 | 0.04223 | -0.1247 |
18 | -0.326 | 0.001609 |
19 | 0.1602 | 0.1941 |
20 | 0.02123 | 0.2132 |
21 | 0.06035 | -0.2191 |
22 | -0.2961 | 0.427 |
23 | -0.1237 | 0.001791 |
24 | 0.732 | -0.3164 |
25 | 1.233 | 0.2662 |
26 | 0.4551 | 0.5639 |
27 | 0.6635 | 0.1215 |
28 | -0.1988 | -1.058 |
29 | 0.5195 | -1.578 |
30 | -0.2136 | -1.066 |
31 | -0.3905 | -0.2077 |
32 | 0.4439 | -1.742 |
35 | -0.5157 | -0.4525 |
39 | -0.4309 | -1.017 |
40 | -0.2744 | -1.222 |
44 | 0.732 | -0.3164 |
<-sup.mca$quali.sup$eta2
coor_edadpander(coor_edad)
Dim 1 | Dim 2 | |
---|---|---|
Edad | 0.04859 | 0.06076 |
fviz_mca_var(sup.mca,repel=T)+labs(title =" Nube de puntos de Categorias y Edad Suplementaria")
Del gráfico anterior, inferimos que de las relaciones más fuertes que se pueden notar, son cuando los estudiantes tienen 15 y 26 años su estrato es bajo, y provienen de otros sectores fuera de Bogotá. Otra puede ser los que tengan 25 años y provengan de municipios de Cundinamarca.
Las variables e individuos suplementarios no se utilizan para determinar las dimensiones principales. Sus coordenadas se predicen utilizando únicamente la información proporcionada por el análisis de correspondencia múltiple realizado sobre las variables/individuos activos.