ACS:Taller 2

Los siguientes datos hacen referencia a algunos establecimientos hoteleros existentes en España (1991), y el nivel de ingresos (en millones de pesetas) de los mismos.

El investigador pretende establecer si los hoteles de determinadas categorías están más asociados a ciertos niveles de ingresos que otros. Realice un informe donde ponga de manifiesto los resultados encontrados en la investigación

knitr::opts_chunk$set(echo = TRUE)

library(FactoMineR)
library(ggplot2)
library(factoextra)

## Welcome! Want to learn more? See two factoextra-related books at https://goo.gl/ve3WBa

library(ade4)

## 
## Attaching package: 'ade4'

## The following object is masked from 'package:FactoMineR':
## 
##     reconst

###   Para crear como matriz los datos de Ingresos de Hoteles
C1 <- c(327,253,153,124,121,14)
C2 <- c(133,169,234,257,234,7)
C3 <- c(9,45,196,277,677,55)
C4 <- c(3,32,25,31,260,160)

x <-matrix(c(C1,C2,C3,C4),6,4)

x

##      [,1] [,2] [,3] [,4]
## [1,]  327  133    9    3
## [2,]  253  169   45   32
## [3,]  153  234  196   25
## [4,]  124  257  277   31
## [5,]  121  234  677  260
## [6,]   14    7   55  160

###   Para Nombrar las Filas
rownames(x) <- c("Menos de 10",
                 "De 10 a Menos de 20",
                 "De 20 a Menos de 50",
                 "De 50 a Menos de 100",
                 "De 100 a Menos de 500",
                 "De 500 y Más")



###   Para Nombrar las Columnas
colnames(x) <- c("1*","2*","3*","4 y 5*")

x

##                        1*  2*  3* 4 y 5*
## Menos de 10           327 133   9      3
## De 10 a Menos de 20   253 169  45     32
## De 20 a Menos de 50   153 234 196     25
## De 50 a Menos de 100  124 257 277     31
## De 100 a Menos de 500 121 234 677    260
## De 500 y Más           14   7  55    160

Prueba de independencia y valores propios

Esta prueba se realiza con la prueba Chi-Cuadrado y permite observar si hay independencia entre las variables

chisq.test(x)

## 
##  Pearson's Chi-squared test
## 
## data:  x
## X-squared = 1902.8, df = 15, p-value < 2.2e-16

Para el caso se observa que el valor p es menor a un nivel de significancia del 5%, por lo tanto se afirma que las variables son dependientes entre ellas.

ACS: Análisis de correspondencias simples

res.ACS <- CA(x)

Se observa como en la categoria 1 se asocian a grupos que tienen un ingreso de menos de 10 y de 10 a menos de 20, en la categoria 2 y 3 se ubican aquellos grupos que tienen un ingreso de 20 a menos de 50, de 50 a menos de 100 y de 100 a menos de 500, mientras que la categoria más alta de 4 y 5 se ubican aquellos grupos cuyo ingreso es de 500 y más.

Con este análisis se puede afirmar la premisa del investigador donde las categorias de hoteles más altos se ubican aquellos grupos que tienen un ingreso mayor.

Porcenjate de inercia

Las dos primeras dimensiones de análisis expresan el 97% de la inercia total del conjunto de datos; Este porcentaje es alto y por lo tanto la dimensión 1 y 2 representa una parte importante de la variabilidad de los datos.

A partir de estas observaciones, probablemente no sea útil interpretar el resto de las dimensiones

res.ACS$eig

##       eigenvalue percentage of variance cumulative percentage of variance
## dim 1 0.34966706              69.758270                          69.75827
## dim 2 0.13695403              27.322209                          97.08048
## dim 3 0.01463426               2.919521                         100.00000

eig.val <- res.ACS$eig
barplot(eig.val[, 2], 
        names.arg = 1:nrow(eig.val), 
        main = "Varianzas Explicadas por los Comp",
        xlab = "Componentes Principales",
        ylab = "Porcentaje de Varianzas",
        col ="steelblue")  
lines(x = 1:nrow(eig.val), eig.val[, 2], 
      type = "b", pch = 19, col = "red")

Contribucciones para filas y columnas

Se realiza el analisis de contribuciones teniendo en cuenta los dos primeros componentes debido a su representatividad:

fviz_contrib(res.ACS, choice = "row", axes = 1)##contribuciones fila

fviz_contrib(res.ACS, choice = "row", axes = 2)

Analizando las contribuciones fila se observa que el nivel de ingreso “Menos de 10” y “De 500 y más son las sobresalientes en la primera dimensión. Mientras que lel nivel de ingreso”De 500 y más” y “De 50 a menos de 100” son las más presentativas en la dimensión 2

fviz_contrib(res.ACS, choice = "col", axes = 1)##contribuciones columnas

##la linea roja es como una contribucion promedio 1/n
fviz_contrib(res.ACS, choice = "col", axes = 2)

Respecto a las contribuciones columna las categorias sobresalientes en la dimensión 1 son la 1 y la 4y5, mientras que la dimensión 2 se observa las categorias 4y5 y 3.

Ánalisis de Cosenos

El ánalisis de cosenos permite fortalecer las contribuciones, teniendo como hallazgos las categorias representativas mencionados anteriormente.

Los cosenos2 son utilizados cuando hay existencia de variables suplementarias, para el estudio de caso se presenta como un ánalisis adicional.

##Cosenos fila
fviz_cos2(res.ACS, choice = "row", axes = 1)

fviz_cos2(res.ACS, choice = "row", axes = 2)

Se analiza en los cosenos filas el nivel de ingreso “De 100 a menos de 500” y “De 10 a menos de 20” en la dimensión 1, mientras que el nivel de ingreso de “De 50 a menos de 100”y “De 20 a menos de 50” son representativos en la dimensión 2.

##Cosenos columna
fviz_cos2(res.ACS, choice = "col", axes = 1)

fviz_cos2(res.ACS, choice = "col", axes = 2)

Analizando las columnas, se destacan las categorias en 1 y 4y5 en la dimensión 1, mientras que las categorias 3, 4y5 son representativas en el eje 2.

Como conclusión este análisis de correspondencias simples permite observar como existe una relación entre los diferentes grupos de ingresos y la categoria de los hoteles en España, por lo tanto es una relación dependiente, a más nivel de ingreso mejor acceso a hoteles de alto nivel.