Los siguientes datos hacen referencia a algunos establecimientos hoteleros existentes en España (1991), y el nivel de ingresos (en millones de pesetas) de los mismos.
El investigador pretende establecer si los hoteles de determinadas categorías están más asociados a ciertos niveles de ingresos que otros. Realice un informe donde ponga de manifiesto los resultados encontrados en la investigación
knitr::opts_chunk$set(echo = TRUE)
library(FactoMineR)
library(ggplot2)
library(factoextra)
## Welcome! Want to learn more? See two factoextra-related books at https://goo.gl/ve3WBa
library(ade4)
##
## Attaching package: 'ade4'
## The following object is masked from 'package:FactoMineR':
##
## reconst
### Para crear como matriz los datos de Ingresos de Hoteles
C1 <- c(327,253,153,124,121,14)
C2 <- c(133,169,234,257,234,7)
C3 <- c(9,45,196,277,677,55)
C4 <- c(3,32,25,31,260,160)
x <-matrix(c(C1,C2,C3,C4),6,4)
x
## [,1] [,2] [,3] [,4]
## [1,] 327 133 9 3
## [2,] 253 169 45 32
## [3,] 153 234 196 25
## [4,] 124 257 277 31
## [5,] 121 234 677 260
## [6,] 14 7 55 160
### Para Nombrar las Filas
rownames(x) <- c("Menos de 10",
"De 10 a Menos de 20",
"De 20 a Menos de 50",
"De 50 a Menos de 100",
"De 100 a Menos de 500",
"De 500 y Más")
### Para Nombrar las Columnas
colnames(x) <- c("1*","2*","3*","4 y 5*")
x
## 1* 2* 3* 4 y 5*
## Menos de 10 327 133 9 3
## De 10 a Menos de 20 253 169 45 32
## De 20 a Menos de 50 153 234 196 25
## De 50 a Menos de 100 124 257 277 31
## De 100 a Menos de 500 121 234 677 260
## De 500 y Más 14 7 55 160
Esta prueba se realiza con la prueba Chi-Cuadrado y permite observar si hay independencia entre las variables
chisq.test(x)
##
## Pearson's Chi-squared test
##
## data: x
## X-squared = 1902.8, df = 15, p-value < 2.2e-16
Para el caso se observa que el valor p es menor a un nivel de significancia del 5%, por lo tanto se afirma que las variables son dependientes entre ellas.
res.ACS <- CA(x)
Se observa como en la categoria 1 se asocian a grupos que tienen un ingreso de menos de 10 y de 10 a menos de 20, en la categoria 2 y 3 se ubican aquellos grupos que tienen un ingreso de 20 a menos de 50, de 50 a menos de 100 y de 100 a menos de 500, mientras que la categoria más alta de 4 y 5 se ubican aquellos grupos cuyo ingreso es de 500 y más.
Con este análisis se puede afirmar la premisa del investigador donde las categorias de hoteles más altos se ubican aquellos grupos que tienen un ingreso mayor.
Las dos primeras dimensiones de análisis expresan el 97% de la inercia total del conjunto de datos; Este porcentaje es alto y por lo tanto la dimensión 1 y 2 representa una parte importante de la variabilidad de los datos.
A partir de estas observaciones, probablemente no sea útil interpretar el resto de las dimensiones
res.ACS$eig
## eigenvalue percentage of variance cumulative percentage of variance
## dim 1 0.34966706 69.758270 69.75827
## dim 2 0.13695403 27.322209 97.08048
## dim 3 0.01463426 2.919521 100.00000
eig.val <- res.ACS$eig
barplot(eig.val[, 2],
names.arg = 1:nrow(eig.val),
main = "Varianzas Explicadas por los Comp",
xlab = "Componentes Principales",
ylab = "Porcentaje de Varianzas",
col ="steelblue")
lines(x = 1:nrow(eig.val), eig.val[, 2],
type = "b", pch = 19, col = "red")
Se realiza el analisis de contribuciones teniendo en cuenta los dos primeros componentes debido a su representatividad:
fviz_contrib(res.ACS, choice = "row", axes = 1)##contribuciones fila
fviz_contrib(res.ACS, choice = "row", axes = 2)
Analizando las contribuciones fila se observa que el nivel de ingreso “Menos de 10” y “De 500 y más son las sobresalientes en la primera dimensión. Mientras que lel nivel de ingreso”De 500 y más” y “De 50 a menos de 100” son las más presentativas en la dimensión 2
fviz_contrib(res.ACS, choice = "col", axes = 1)##contribuciones columnas
##la linea roja es como una contribucion promedio 1/n
fviz_contrib(res.ACS, choice = "col", axes = 2)
Respecto a las contribuciones columna las categorias sobresalientes en la dimensión 1 son la 1 y la 4y5, mientras que la dimensión 2 se observa las categorias 4y5 y 3.
El ánalisis de cosenos permite fortalecer las contribuciones, teniendo como hallazgos las categorias representativas mencionados anteriormente.
Los cosenos2 son utilizados cuando hay existencia de variables suplementarias, para el estudio de caso se presenta como un ánalisis adicional.
##Cosenos fila
fviz_cos2(res.ACS, choice = "row", axes = 1)
fviz_cos2(res.ACS, choice = "row", axes = 2)
Se analiza en los cosenos filas el nivel de ingreso “De 100 a menos de 500” y “De 10 a menos de 20” en la dimensión 1, mientras que el nivel de ingreso de “De 50 a menos de 100”y “De 20 a menos de 50” son representativos en la dimensión 2.
##Cosenos columna
fviz_cos2(res.ACS, choice = "col", axes = 1)
fviz_cos2(res.ACS, choice = "col", axes = 2)
Analizando las columnas, se destacan las categorias en 1 y 4y5 en la dimensión 1, mientras que las categorias 3, 4y5 son representativas en el eje 2.
Como conclusión este análisis de correspondencias simples permite observar como existe una relación entre los diferentes grupos de ingresos y la categoria de los hoteles en España, por lo tanto es una relación dependiente, a más nivel de ingreso mejor acceso a hoteles de alto nivel.