ACS

Análisis de Correspondencias

Análisis de Correspondencias 1963 Universidad de Renner (Francia), Benzecri Se trata de una técnica de interdependencia en la que no se distingue entre variables dependientes e independientes Es una técnica que permite estudiar las relaciones de inercia y asociación, entre variables categóricas en tablas de contingencia Análisis de Correspondencias Simple (dos variables) Análisis de Correspondencias Múltiple (más de dos variables)

Análisis de Correspondencias

CORRESPONDENCIAS SIMPLES

Dada una tabla de observaciones correspondiente a dos variables cualitativas, el análisis de correspondencias simples es una técnica para representar las categorías de las dos variables en un espacio de pequeña dimensión que permita interpretar, por un lado, las similitudes entre las categorías de una variable respecto a las categorías de la otra, y por otro, las relaciones entre las categorías de cada una de las variables por separado

Análisis de Correspondencias

—–

Así al analizar el cruce entre dos variables se pretende 1 Reducir la información de la que disponemos a factores que permitan explicarla de modo más resumido y sencillo 2 Crear un espacio factorial en el que ubicar las variables y sujetos para poder establecer grados de semejanza y diferencia entre ellos  Todo ello nos permite 1 Analizar la semejanzas y diferencias entre las categorías de una misma variable 2 Analizar la relación de semejanzas y diferencias entre las categorías de las distintas variables incluidas en el análisis

Análisis de Correspondencias

# Instalar paquetes si no están instalados
if (!require("FactoMineR")) install.packages("FactoMineR")
## Cargando paquete requerido: FactoMineR
## Warning: package 'FactoMineR' was built under R version 4.4.3
if (!require("factoextra")) install.packages("factoextra")
## Cargando paquete requerido: factoextra
## Warning: package 'factoextra' was built under R version 4.4.3
## Cargando paquete requerido: ggplot2
## Welcome! Want to learn more? See two factoextra-related books at https://goo.gl/ve3WBa
# Cargar los paquetes necesarios
library(FactoMineR)
library(factoextra)

# Crear la tabla de contingencia
datos <- matrix(c(71, 80, 81, 86, 102,
                  42, 43, 47, 47, 43,
                  55, 56, 58, 54, 49,
                  66, 68, 65, 65, 58,
                  18, 5, 1, 0, 0),
                nrow = 5, byrow = TRUE)

# Asignar nombres a filas y columnas
rownames(datos) <- c("N", "E", "n", "V", "e")
colnames(datos) <- c("1", "2", "3", "4", "5")

# Mostrar la tabla de contingencia
print("Tabla de contingencia:")
## [1] "Tabla de contingencia:"
print(datos)
##    1  2  3  4   5
## N 71 80 81 86 102
## E 42 43 47 47  43
## n 55 56 58 54  49
## V 66 68 65 65  58
## e 18  5  1  0   0
chisq.test(datos)
## Warning in chisq.test(datos): Chi-squared approximation may be incorrect
## 
##  Pearson's Chi-squared test
## 
## data:  datos
## X-squared = 57.373, df = 16, p-value = 1.441e-06
# Realizar el análisis de correspondencias simples
res.ca <- CA(datos, graph = FALSE)

# Visualizar los resultados
print(res.ca)
## **Results of the Correspondence Analysis (CA)**
## The row variable has  5  categories; the column variable has 5 categories
## The chi square of independence between the two variables is equal to 57.37256 (p-value =  1.44118e-06 ).
## *The results are available in the following objects:
## 
##    name              description                   
## 1  "$eig"            "eigenvalues"                 
## 2  "$col"            "results for the columns"     
## 3  "$col$coord"      "coord. for the columns"      
## 4  "$col$cos2"       "cos2 for the columns"        
## 5  "$col$contrib"    "contributions of the columns"
## 6  "$row"            "results for the rows"        
## 7  "$row$coord"      "coord. for the rows"         
## 8  "$row$cos2"       "cos2 for the rows"           
## 9  "$row$contrib"    "contributions of the rows"   
## 10 "$call"           "summary called parameters"   
## 11 "$call$marge.col" "weights of the columns"      
## 12 "$call$marge.row" "weights of the rows"
# Gráfico de correspondencia
fviz_ca_biplot(res.ca, repel = TRUE,
               title = "Análisis de Correspondencias - Fármacos vs Síntomas")

# Visualizar la inercia (varianza) explicada por cada dimensión
fviz_screeplot(res.ca, addlabels = TRUE) +
  ggtitle("Porcentaje de inercia explicada por cada dimensión")

# Contribuciones de filas y columnas a las dimensiones
fviz_contrib(res.ca, choice = "row", axes = 1:2, top = 5) +
  ggtitle("Contribución de los fármacos a las dimensiones")

fviz_contrib(res.ca, choice = "col", axes = 1:2, top = 5) +
  ggtitle("Contribución de los síntomas a las dimensiones")

\[H0: X ind Y\] \[H0: X dep Y\]

chisq.test(datos)
## Warning in chisq.test(datos): Chi-squared approximation may be incorrect
## 
##  Pearson's Chi-squared test
## 
## data:  datos
## X-squared = 57.373, df = 16, p-value = 1.441e-06

En este caso los grados de libertad son (5-1)(5-1)