library(FactoMineR)
library(MASS)
piel = read.csv("Pielescuero_car.csv")
head(piel)
## Exportacion Tamano Financiacion Zona Actividad
## 1 siexp 11-20 nopre NE MeAl
## 2 noexp 11-20 nopre CE Ropa
## 3 siexp 11-20 nopre NE Ropa
## 4 siexp 11-20 nopre NE Ropa
## 5 siexp 11-20 nopre NO Ropa
## 6 siexp 11-20 nopre CE Ropa
res.mca = MCA(piel,graph = FALSE)
res.mca$eig
## eigenvalue percentage of variance cumulative percentage of variance
## dim 1 0.3133837 17.410204 17.41020
## dim 2 0.2682425 14.902359 32.31256
## dim 3 0.2283492 12.686064 44.99863
## dim 4 0.2234502 12.413899 57.41253
## dim 5 0.1992452 11.069180 68.48171
## dim 6 0.1659142 9.217454 77.69916
## dim 7 0.1592931 8.849618 86.54878
## dim 8 0.1279160 7.106443 93.65522
## dim 9 0.1142060 6.344779 100.00000
res.mca$var
## $coord
## Dim 1 Dim 2 Dim 3 Dim 4 Dim 5
## noexp -0.3817625 1.20066951 -0.44688144 0.4537567 0.47004615
## siexp 0.1302136 -0.40953068 0.15242468 -0.1547697 -0.16032582
## > 50 1.0841841 0.68452267 -0.28828490 -1.2312538 0.20482524
## 11-20 -1.0365988 -0.01791045 -0.06058862 -0.4955448 0.42802844
## 21-50 0.2759867 -0.18852536 0.11822461 0.6398680 -0.30339558
## nopre -0.3679824 -0.01399222 0.28280261 -0.1893402 0.19640234
## sipre 0.8331677 0.03168050 -0.64030780 0.4286949 -0.44468454
## CE -0.3091239 -0.18258348 -0.70812605 0.2864292 0.05443628
## NE 0.8574439 -0.06011448 0.38494751 -0.2470174 0.99962375
## NO -0.2048776 0.43237569 1.07319296 -0.3449079 -1.08778117
## MeAl -0.3317734 1.99677500 1.65275172 1.9255243 0.61185342
## PeCu -0.9998304 -0.13972661 -0.45272957 -0.2020602 -0.49910585
## Ropa 0.6302089 0.71580247 -0.31104964 -0.5040226 -0.23021711
## Zapa 0.2517811 -0.87403926 0.31358019 0.2472778 0.46226138
##
## $contrib
## Dim 1 Dim 2 Dim 3 Dim 4 Dim 5
## noexp 2.3656302 27.337324628 4.4485840 4.6870762 5.6406563
## siexp 0.8068816 9.324358788 1.5173465 1.5986926 1.9239448
## > 50 11.7078553 5.452501716 1.1360358 21.1768860 0.6572441
## 11-20 21.0089732 0.007327318 0.0985014 6.7335612 5.6340030
## 21-50 2.6131657 1.424553880 0.6580869 19.7000310 4.9670370
## nopre 5.9943603 0.010125373 4.8588394 2.2257184 2.6857804
## sipre 13.5721364 0.022925372 11.0011458 5.0393624 6.0810123
## CE 3.1020977 1.264334610 22.3402635 3.7352562 0.1513058
## NE 11.3911674 0.065412962 3.1509157 1.3258901 24.3510883
## NO 0.6658324 3.464554240 25.0731304 2.6465361 29.5221162
## MeAl 0.4466666 18.901980857 15.2122128 21.1005542 2.3893701
## PeCu 16.9635996 0.387054773 4.7733143 0.9716783 6.6487362
## Ropa 7.9117093 11.924399335 2.6450728 7.0973624 1.6605996
## Zapa 1.4499243 20.413146147 3.0865506 1.9613950 7.6871059
##
## $cos2
## Dim 1 Dim 2 Dim 3 Dim 4 Dim 5
## noexp 0.049710669 0.4917110043 0.06811576 0.07022781 0.075360535
## siexp 0.049710669 0.4917110043 0.06811576 0.07022781 0.075360535
## > 50 0.217378683 0.0866535946 0.01536932 0.28035356 0.007758502
## 11-20 0.474587228 0.0001416796 0.00162135 0.10845770 0.080917019
## 21-50 0.088546097 0.0413173559 0.01624833 0.47596362 0.107006820
## nopre 0.306591023 0.0004432806 0.18108072 0.08116918 0.087337083
## sipre 0.306591023 0.0004432806 0.18108072 0.08116918 0.087337083
## CE 0.098930229 0.0345133193 0.51914048 0.08493727 0.003067896
## NE 0.235716184 0.0011586070 0.04750956 0.01956289 0.320369473
## NO 0.013883981 0.0618368902 0.38096119 0.03934878 0.391388607
## MeAl 0.007474134 0.2707297190 0.18547821 0.25175359 0.025419819
## PeCu 0.362081852 0.0070715128 0.07423895 0.01478821 0.090227605
## Ropa 0.180225328 0.2325054719 0.04390421 0.11527811 0.024050383
## Zapa 0.035409095 0.4267078123 0.05492448 0.03415379 0.119355911
##
## $v.test
## Dim 1 Dim 2 Dim 3 Dim 4 Dim 5
## noexp -2.924079 9.1964283 -3.4228513 3.475512 3.6002794
## siexp 2.924079 -9.1964283 3.4228513 -3.475512 -3.6002794
## > 50 6.114665 3.8606241 -1.6258915 -6.944121 1.1551893
## 11-20 -9.034877 -0.1561054 -0.5280835 -4.319112 3.7306470
## 21-50 3.902554 -2.6658179 1.6717395 9.047969 -4.2901251
## nopre -7.261794 -0.2761237 5.5808497 -3.736455 3.8758197
## sipre 7.261794 0.2761237 -5.5808497 3.736455 -3.8758197
## CE -4.125045 -2.4364505 -9.4494530 3.822200 0.7264146
## NE 6.367353 -0.4464083 2.8586088 -1.834344 7.4231765
## NO -1.545330 3.2612797 8.0947714 -2.601536 -8.2048059
## MeAl -1.133821 6.8238927 5.6482079 6.580397 2.0909828
## PeCu -7.891646 -1.1028600 -3.5733877 -1.594858 -3.9394350
## Ropa 5.567653 6.3238391 -2.7480038 -4.452846 -2.0338795
## Zapa 2.467866 -8.5670149 3.0735990 2.423727 4.5309179
##
## $eta2
## Dim 1 Dim 2 Dim 3 Dim 4 Dim 5
## Exportacion 0.04971067 0.4917110043 0.06811576 0.07022781 0.07536053
## Tamano 0.55359216 0.0923341898 0.02160896 0.53192852 0.11215797
## Financiacion 0.30659102 0.0004432806 0.18108072 0.08116918 0.08733708
## Zona 0.23753068 0.0643017652 0.57731588 0.08611415 0.53820631
## Actividad 0.41949381 0.6924220516 0.29362449 0.34781128 0.18316427
res.mca$call$marge.col
## noexp siexp > 50 11-20 21-50 nopre sipre
## 0.05086705 0.14913295 0.03121387 0.06127168 0.10751445 0.13872832 0.06127168
## CE NE NO MeAl PeCu Ropa Zapa
## 0.10173410 0.04855491 0.04971098 0.01271676 0.05317919 0.06242775 0.07167630
# Función eig.mca():
eig.mca <- function(mca.res) {
res <- list()
dat <- mca.res$call$X # tabla inicial
eig <- mca.res$eig
###########################################################################################
# estadísticas sobre la dimensión
# nombre datos y número de niveles
n <- dim(dat)[1] # número de unidades
p <- dim(dat)[2] # número de variables
lfac <- vector("numeric",length=p) # niveles de cada variable
for (i in 1:p) {
lfac[i] <- length(table(dat[,i]))
}
# valores iniciales
q <- sum(lfac) # número total de niveles
exptr <- (q-p)/p # traza esperada
meig <- 1/p # autovalor promedio
expeig <- q-p # autovalores esperados
# cálculo de los grados de libertad de todas las tablas
dl <- 0
for (i in 2:p){
for (j in 1:i) {
dl <- dl + (lfac[i]-1)*(lfac[j]-1)
}
}
var <- 2*dl/(p^2*n*(q-p)) # varianza del autovalor promedio
sd <- sqrt(var) # su desvío estandar
sup <- meig + 2*sd # umbral superior del promedio a 95%
# tabla de autovalores
neig <- length(which(eig[,1] != 0)) # número de autovalores non cero
teigen <- matrix(0, nrow=neig,ncol=4) # matriz para resultados
rownames(teigen) <- c(1:neig)
colnames(teigen) <- c("sing.val.","eigenval.","perc.inertia","cum.inertia")
tr <- sum(eig[,1]) # traza verdadera
teigen[,1] <- eig[,1] # valores singulares (SVD)
teigen[,2] <- teigen[1:neig,1]^2 # autovalores (Burt)
teigen[,3] <- teigen[1:neig,1]/tr*100. # % inercia
teigen[,4] <- cumsum(teigen[1:neig,3]) # % inertia cumulado
neigs <- length(which(teigen[1:neig,1] > meig)) # autovalores sobre el promedio
burtin <- sum(teigen[1:neig,2]) # inercia de Burt (suma de autovalores)
offdin <- (p/(p-1))*(burtin-(exptr/p)) # inercia no diagonal
# tabla de estadísticas
val <- matrix(c(n,p,q,exptr,tr,burtin,offdin,meig,expeig,neig,
neigs,dl,var,sd,sup),nrow=15,ncol=1)
rownames(val) <- c("units","characters","levels","exp.trace","tot.inertia",
"Burt inertia","off-diag.in.","ave.eigen.","expected dim.",
"dimension","valid dim.","df","var.eig","sd.eig.","sup.conf.int.")
colnames(val) <- "table values"
# guarda estadísticas y autovalores
res$eigen_stats <- round(val,6)
res$eigenvalues <- round(teigen,4)
# tabla de inercia ajustada
inertias <- matrix(0, nrow=neigs,ncol=5)
rownames(inertias) <- c(1:neigs)
colnames(inertias) <- c("adj.inertia","Benz.perc.","Benz.cum.","Green.perc.","Green.cum.")
inertias[,1] <- round((teigen[1:neigs,1]-meig)^2*(p/(p-1))^2,8) # inercia ajustada
totin <- sum(inertias[,1]) # inercia ajustada total
inertias[,2] <- inertias[,1]/totin*100. # porcentaje Benzécri
inertias[,3] <- cumsum(inertias[,2]) # cumulado Benzécri
inertias[,4] <- inertias[,1]/offdin*100. # porcentaje Greenacre
inertias[,5] <- cumsum(inertias[,4]) # cumulado Greenacre
# guarda tabla de inercia ajustada
res$inertia <- round(inertias,4)
nfs <- max(which(teigen[,1]>sup)) # dimensión verdadera
res$nfs = nfs
# guarda tabla final
if (nfs>1){
res$solution <- round(cbind(teigen[1:nfs,],inertias[1:nfs,]), 4)
} else {
res$solution <- round(c(teigen[1:nfs,],inertias[1:nfs,]), 4)
}
res
}
eig.mca(res.mca)
## $eigen_stats
## table values
## units 173.000000
## characters 5.000000
## levels 14.000000
## exp.trace 1.800000
## tot.inertia 1.800000
## Burt inertia 0.394243
## off-diag.in. 0.042803
## ave.eigen. 0.200000
## expected dim. 9.000000
## dimension 9.000000
## valid dim. 4.000000
## df 49.000000
## var.eig 0.002518
## sd.eig. 0.050176
## sup.conf.int. 0.300353
##
## $eigenvalues
## sing.val. eigenval. perc.inertia cum.inertia
## 1 0.3134 0.0982 17.4102 17.4102
## 2 0.2682 0.0720 14.9024 32.3126
## 3 0.2283 0.0521 12.6861 44.9986
## 4 0.2235 0.0499 12.4139 57.4125
## 5 0.1992 0.0397 11.0692 68.4817
## 6 0.1659 0.0275 9.2175 77.6992
## 7 0.1593 0.0254 8.8496 86.5488
## 8 0.1279 0.0164 7.1064 93.6552
## 9 0.1142 0.0130 6.3448 100.0000
##
## $inertia
## adj.inertia Benz.perc. Benz.cum. Green.perc. Green.cum.
## 1 0.0201 68.1413 68.1413 46.9292 46.9292
## 2 0.0073 24.6842 92.8254 17.0001 63.9293
## 3 0.0013 4.2598 97.0852 2.9337 66.8631
## 4 0.0009 2.9148 100.0000 2.0074 68.8705
##
## $nfs
## [1] 1
##
## $solution
## sing.val. eigenval. perc.inertia cum.inertia adj.inertia Benz.perc.
## 0.3134 0.0982 17.4102 17.4102 0.0201 68.1413
## Benz.cum. Green.perc. Green.cum.
## 68.1413 46.9292 46.9292
resultado = eig.mca(res.mca)
nf = resultado$nfs
contr <- round(res.mca$var$contr,2)
coord <- round(res.mca$var$coord,3)
vtest <- round(res.mca$var$contr,3)
qual <- round(res.mca$var$cos2*100,2)
qcum <- t(apply(qual,1,cumsum))
lvar <- list()
eta <- round(res.mca$var$eta2[,1:nf],2)
for (i in 1:nf) {
var <- cbind(contr[,i],coord[,i],vtest[,i],qual[,i],qcum[,i])
colnames(var) = c("contributions","coordinates","test-value","quality","cum.qual.")
lvar[[i]] <- var
}
eta
## Exportacion Tamano Financiacion Zona Actividad
## 0.05 0.55 0.31 0.24 0.42
lvar
## [[1]]
## contributions coordinates test-value quality cum.qual.
## noexp 2.37 -0.382 2.366 4.97 4.97
## siexp 0.81 0.130 0.807 4.97 4.97
## > 50 11.71 1.084 11.708 21.74 21.74
## 11-20 21.01 -1.037 21.009 47.46 47.46
## 21-50 2.61 0.276 2.613 8.85 8.85
## nopre 5.99 -0.368 5.994 30.66 30.66
## sipre 13.57 0.833 13.572 30.66 30.66
## CE 3.10 -0.309 3.102 9.89 9.89
## NE 11.39 0.857 11.391 23.57 23.57
## NO 0.67 -0.205 0.666 1.39 1.39
## MeAl 0.45 -0.332 0.447 0.75 0.75
## PeCu 16.96 -1.000 16.964 36.21 36.21
## Ropa 7.91 0.630 7.912 18.02 18.02
## Zapa 1.45 0.252 1.450 3.54 3.54
En la función eig.mca(), se identifica que hay 4 dimensiones válidas basadas en un umbral superior de confianza al 95%. En la salida de la función, se muestra:
La selección se hace comparando los valores propios (sing.val.) con el promedio de los autovalores (umbral calculado con la desviación estándar), lo que da como resultado 4 dimensiones significativas.
La inercia total explicada por las dimensiones es la siguiente:
Esto significa que las primeras 4 dimensiones capturan aproximadamente el 57.4% de la variabilidad total de los datos. Esta es una cantidad aceptable en análisis de correspondencia múltiple para interpretar patrones significativos.
Para cada dimensión, identificamos las variables que tienen las mayores contribuciones (contributions) y calidad de representación (quality):
Contribuciones más altas: “11-20” (21.01%), “PeCu” (16.96%) y “sipre” (13.57%).
Mejor calidad de representación (cos2): “11-20” (47.46%) y “PeCu” (36.21%).
Contribuciones más altas: “noexp” (27.34%) y “Zapa” (20.41%).
Mejor calidad de representación (cos2): “MeAl” (27.07%) y “Ropa” (23.25%).
Contribuciones más altas: “NO” (25.07%) y “CE” (22.34%).
Mejor calidad de representación (cos2): “NO” (38.10%) y “CE” (51.91%).
Contribuciones más altas: “> 50” (21.18%) y “MeAl” (21.10%).
Mejor calidad de representación (cos2): “MeAl” (25.18%) y “> 50” (28.04%).
Atribuir un significado a las dimensiones se basa en las categorías que más contribuyen y su interpretación en el contexto de los datos:
Dimensión 1: Esta dimensión parece diferenciar entre tamaños de empresas (“11-20”, “PeCu”) y financiamiento (“sipre”). Podría estar relacionada con la diferencia entre empresas pequeñas/medianas y aquellas con o sin financiamiento.
Dimensión 2: La alta contribución de “noexp” sugiere que esta dimensión podría diferenciar entre empresas que no exportan y otras categorías de actividad como “MeAl” y “Ropa”. Podría estar asociada a la orientación del mercado interno versus externo.
Dimensión 3: La dimensión parece estar muy relacionada con la zona (“NO” y “CE”), lo que sugiere que podría estar diferenciando entre diferentes ubicaciones geográficas de las empresas.
Dimensión 4: Dada la contribución de “> 50” y “MeAl”, esta dimensión podría estar diferenciando entre empresas grandes versus medianas en relación con una actividad particular (“MeAl”).
En función de la calidad de la representación (cos2) y las contribuciones, las variables que parecen ser más relevantes para describir la variabilidad en los datos son:
Tamaño (“11-20”, “> 50”) tiene una representación fuerte en varias dimensiones, lo que indica que la categoría de tamaño tiene un papel importante.
Actividad: “MeAl”, “Ropa” y “PeCu” destacan en términos de su asociación con distintas dimensiones.
Zona: Las categorías de zona “NO” y “CE” son bastante representativas, lo que sugiere una variabilidad geográfica en los datos.
La variable Tamaño (con categorías como “11-20” y “> 50”) tiene un alto impacto en la primera dimensión y una buena calidad de representación en las demás. Esto sugiere que el tamaño de la empresa es un factor crucial para explicar las diferencias en los datos
La variable Actividad incluye categorías como “MeAl”, “Ropa” y “PeCu”. Estas categorías aparecen con alta contribución en las dimensiones principales y muestran una buena calidad de representación. Por ejemplo, “MeAl” y “Ropa” se asocian de manera significativa con varias dimensiones. Esto implica que la actividad económica es otra variable importante en los datos.
a variable Zona (con categorías como “CE” y “NO”) es relevante, ya que tiene altas contribuciones y una buena calidad de representación en varias dimensiones, especialmente en la tercera dimensión. Esto sugiere que la ubicación geográfica es relevante para explicar las diferencias entre las empresas
La variable Exportación (con categorías como “noexp” y “siexp”) es destacable principalmente en las primeras dos dimensiones. Dado su peso en los valores de contribución, parece ser una característica que influye significativamente en la variabilidad
La variable Financiación (con categorías “nopre” y “sipre”) contribuye de manera significativa a las dimensiones 1 y 3. La presencia de estas categorías en varias dimensiones sugiere que el acceso o no a financiamiento también es un factor relevante en los datos
Conclusión:
Los caracteres más relevantes en la tabla de datos son Tamaño, Actividad, Zona, Exportación y Financiación. Estas variables explican gran parte de la inercia en las primeras dimensiones y tienen un buen grado de representación (cos2) en el análisis de correspondencias múltiples. Esto significa que estas variables son las que más aportan a la variabilidad observada en los datos.
En resumen, el tamaño de la empresa, la actividad económica que realiza, la zona en la que se encuentra, si exporta o no, y su acceso a financiación son los factores clave que diferencian a las empresas en el conjunto de datos analizado
MCA(piel,graph = TRUE)
## **Results of the Multiple Correspondence Analysis (MCA)**
## The analysis was performed on 173 individuals, described by 5 variables
## *The results are available in the following objects:
##
## name description
## 1 "$eig" "eigenvalues"
## 2 "$var" "results for the variables"
## 3 "$var$coord" "coord. of the categories"
## 4 "$var$cos2" "cos2 for the categories"
## 5 "$var$contrib" "contributions of the categories"
## 6 "$var$v.test" "v-test for the categories"
## 7 "$var$eta2" "coord. of variables"
## 8 "$ind" "results for the individuals"
## 9 "$ind$coord" "coord. for the individuals"
## 10 "$ind$cos2" "cos2 for the individuals"
## 11 "$ind$contrib" "contributions of the individuals"
## 12 "$call" "intermediate results"
## 13 "$call$marge.col" "weights of columns"
## 14 "$call$marge.li" "weights of rows"
Este gráfico muestra la distribución de las categorías en el espacio definido por las dos primeras dimensiones. Los puntos en el gráfico representan las categorías de las variables, y su posición indica su relación con las dimensiones.
Dim 1 (17.41%): Se alinea bien con la discusión de la importancia de Exportación, Tamaño y Financiación. Las categorías como “11-20” y “PeCu” se encuentran en el extremo negativo, mientras que “sipre” y “>50” están en el extremo positivo, lo cual sugiere que Dim 1 refleja diferencias en Tamaño y acceso a Financiación.
Dim 2 (14.90%): La categoría “MeAl” se encuentra en la parte superior del gráfico, lo que concuerda con su alta contribución a esta dimensión. También vemos a “noexp” y “no” en posiciones altas, lo cual confirma la interpretación de la dimensión como una diferenciación entre actividades y orientación de mercado.
Este gráfico muestra las observaciones individuales (empresas) en el mismo espacio de dos dimensiones.
Las observaciones están distribuidas de manera uniforme en el espacio definido por las dos dimensiones principales, lo cual es un indicio de que el análisis MCA logró capturar la variabilidad de manera efectiva en estas dos primeras dimensiones. Las posiciones de las observaciones cercanas a ciertas categorías refuerzan la idea de que las dimensiones están diferenciando principalmente por actividad, tamaño y orientación de mercado.
Este gráfico muestra la calidad de representación de las variables en el plano de las dos dimensiones principales. Las variables que se encuentran más alejadas del origen son las mejor representadas
Actividad aparece bien representada en la Dim 2, lo cual confirma la discusión de su fuerte contribución en esta dimensión. Exportación y Tamaño se encuentran bien proyectadas hacia la Dim 1, lo que está en línea con los resultados discutidos. Financiación se encuentra más cerca del origen, lo que indica que no tiene una representación tan fuerte en estas dos dimensiones. Esto se alinea con lo discutido anteriormente, donde su calidad de representación (cos2) no era tan alta
# Crear la tabla de contingencia multidimensional
tabla_contingencia <- table(piel)
modelo_saturado <- loglm(~ Exportacion * Tamano * Financiacion * Zona * Actividad, data = tabla_contingencia)
summary(modelo_saturado)
## Formula:
## ~Exportacion * Tamano * Financiacion * Zona * Actividad
## attr(,"variables")
## list(Exportacion, Tamano, Financiacion, Zona, Actividad)
## attr(,"factors")
## Exportacion Tamano Financiacion Zona Actividad Exportacion:Tamano
## Exportacion 1 0 0 0 0 1
## Tamano 0 1 0 0 0 1
## Financiacion 0 0 1 0 0 0
## Zona 0 0 0 1 0 0
## Actividad 0 0 0 0 1 0
## Exportacion:Financiacion Tamano:Financiacion Exportacion:Zona
## Exportacion 1 0 1
## Tamano 0 1 0
## Financiacion 1 1 0
## Zona 0 0 1
## Actividad 0 0 0
## Tamano:Zona Financiacion:Zona Exportacion:Actividad
## Exportacion 0 0 1
## Tamano 1 0 0
## Financiacion 0 1 0
## Zona 1 1 0
## Actividad 0 0 1
## Tamano:Actividad Financiacion:Actividad Zona:Actividad
## Exportacion 0 0 0
## Tamano 1 0 0
## Financiacion 0 1 0
## Zona 0 0 1
## Actividad 1 1 1
## Exportacion:Tamano:Financiacion Exportacion:Tamano:Zona
## Exportacion 1 1
## Tamano 1 1
## Financiacion 1 0
## Zona 0 1
## Actividad 0 0
## Exportacion:Financiacion:Zona Tamano:Financiacion:Zona
## Exportacion 1 0
## Tamano 0 1
## Financiacion 1 1
## Zona 1 1
## Actividad 0 0
## Exportacion:Tamano:Actividad Exportacion:Financiacion:Actividad
## Exportacion 1 1
## Tamano 1 0
## Financiacion 0 1
## Zona 0 0
## Actividad 1 1
## Tamano:Financiacion:Actividad Exportacion:Zona:Actividad
## Exportacion 0 1
## Tamano 1 0
## Financiacion 1 0
## Zona 0 1
## Actividad 1 1
## Tamano:Zona:Actividad Financiacion:Zona:Actividad
## Exportacion 0 0
## Tamano 1 0
## Financiacion 0 1
## Zona 1 1
## Actividad 1 1
## Exportacion:Tamano:Financiacion:Zona
## Exportacion 1
## Tamano 1
## Financiacion 1
## Zona 1
## Actividad 0
## Exportacion:Tamano:Financiacion:Actividad
## Exportacion 1
## Tamano 1
## Financiacion 1
## Zona 0
## Actividad 1
## Exportacion:Tamano:Zona:Actividad
## Exportacion 1
## Tamano 1
## Financiacion 0
## Zona 1
## Actividad 1
## Exportacion:Financiacion:Zona:Actividad
## Exportacion 1
## Tamano 0
## Financiacion 1
## Zona 1
## Actividad 1
## Tamano:Financiacion:Zona:Actividad
## Exportacion 0
## Tamano 1
## Financiacion 1
## Zona 1
## Actividad 1
## Exportacion:Tamano:Financiacion:Zona:Actividad
## Exportacion 1
## Tamano 1
## Financiacion 1
## Zona 1
## Actividad 1
## attr(,"term.labels")
## [1] "Exportacion"
## [2] "Tamano"
## [3] "Financiacion"
## [4] "Zona"
## [5] "Actividad"
## [6] "Exportacion:Tamano"
## [7] "Exportacion:Financiacion"
## [8] "Tamano:Financiacion"
## [9] "Exportacion:Zona"
## [10] "Tamano:Zona"
## [11] "Financiacion:Zona"
## [12] "Exportacion:Actividad"
## [13] "Tamano:Actividad"
## [14] "Financiacion:Actividad"
## [15] "Zona:Actividad"
## [16] "Exportacion:Tamano:Financiacion"
## [17] "Exportacion:Tamano:Zona"
## [18] "Exportacion:Financiacion:Zona"
## [19] "Tamano:Financiacion:Zona"
## [20] "Exportacion:Tamano:Actividad"
## [21] "Exportacion:Financiacion:Actividad"
## [22] "Tamano:Financiacion:Actividad"
## [23] "Exportacion:Zona:Actividad"
## [24] "Tamano:Zona:Actividad"
## [25] "Financiacion:Zona:Actividad"
## [26] "Exportacion:Tamano:Financiacion:Zona"
## [27] "Exportacion:Tamano:Financiacion:Actividad"
## [28] "Exportacion:Tamano:Zona:Actividad"
## [29] "Exportacion:Financiacion:Zona:Actividad"
## [30] "Tamano:Financiacion:Zona:Actividad"
## [31] "Exportacion:Tamano:Financiacion:Zona:Actividad"
## attr(,"order")
## [1] 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 3 3 4 4 4 4 4 5
## attr(,"intercept")
## [1] 1
## attr(,"response")
## [1] 0
## attr(,".Environment")
## <environment: R_GlobalEnv>
##
## Statistics:
## X^2 df P(> X^2)
## Likelihood Ratio 0 0 1
## Pearson NaN 0 1
Likelihood Ratio (X^2): La razón de verosimilitud en un modelo saturado siempre es cero porque el modelo ajusta perfectamente los datos observados. Un valor de 0 indica que no hay ninguna discrepancia entre las frecuencias observadas y las esperadas, ya que todas las interacciones se han incluido.
Grados de libertad (df): En un modelo saturado, los grados de libertad también son 0 porque no hay restricciones en los datos; el modelo tiene tantos parámetros como datos.
P-valor (P(> X^2)): El P-valor para el modelo saturado siempre será 1, lo que indica un ajuste perfecto.
# Proceso de eliminación hacia atrás para simplificar el modelo
modelo_reducido <- step(modelo_saturado, direction = "backward")
## Start: AIC=288
## ~Exportacion * Tamano * Financiacion * Zona * Actividad
##
## Df AIC
## - Exportacion:Tamano:Financiacion:Zona:Actividad 12 264.16
## <none> 288.00
##
## Step: AIC=264.16
## ~Exportacion + Tamano + Financiacion + Zona + Actividad + Exportacion:Tamano +
## Exportacion:Financiacion + Tamano:Financiacion + Exportacion:Zona +
## Tamano:Zona + Financiacion:Zona + Exportacion:Actividad +
## Tamano:Actividad + Financiacion:Actividad + Zona:Actividad +
## Exportacion:Tamano:Financiacion + Exportacion:Tamano:Zona +
## Exportacion:Financiacion:Zona + Tamano:Financiacion:Zona +
## Exportacion:Tamano:Actividad + Exportacion:Financiacion:Actividad +
## Tamano:Financiacion:Actividad + Exportacion:Zona:Actividad +
## Tamano:Zona:Actividad + Financiacion:Zona:Actividad + Exportacion:Tamano:Financiacion:Zona +
## Exportacion:Tamano:Financiacion:Actividad + Exportacion:Tamano:Zona:Actividad +
## Exportacion:Financiacion:Zona:Actividad + Tamano:Financiacion:Zona:Actividad
##
## Df AIC
## - Exportacion:Tamano:Zona:Actividad 12 241.27
## - Tamano:Financiacion:Zona:Actividad 12 245.00
## - Exportacion:Financiacion:Zona:Actividad 6 252.37
## - Exportacion:Tamano:Financiacion:Actividad 6 254.30
## - Exportacion:Tamano:Financiacion:Zona 4 258.20
## <none> 264.16
##
## Step: AIC=241.27
## ~Exportacion + Tamano + Financiacion + Zona + Actividad + Exportacion:Tamano +
## Exportacion:Financiacion + Tamano:Financiacion + Exportacion:Zona +
## Tamano:Zona + Financiacion:Zona + Exportacion:Actividad +
## Tamano:Actividad + Financiacion:Actividad + Zona:Actividad +
## Exportacion:Tamano:Financiacion + Exportacion:Tamano:Zona +
## Exportacion:Financiacion:Zona + Tamano:Financiacion:Zona +
## Exportacion:Tamano:Actividad + Exportacion:Financiacion:Actividad +
## Tamano:Financiacion:Actividad + Exportacion:Zona:Actividad +
## Tamano:Zona:Actividad + Financiacion:Zona:Actividad + Exportacion:Tamano:Financiacion:Zona +
## Exportacion:Tamano:Financiacion:Actividad + Exportacion:Financiacion:Zona:Actividad +
## Tamano:Financiacion:Zona:Actividad
##
## Df AIC
## - Tamano:Financiacion:Zona:Actividad 12 222.16
## - Exportacion:Financiacion:Zona:Actividad 6 229.35
## - Exportacion:Tamano:Financiacion:Actividad 6 231.29
## - Exportacion:Tamano:Financiacion:Zona 4 235.74
## <none> 241.27
##
## Step: AIC=222.16
## ~Exportacion + Tamano + Financiacion + Zona + Actividad + Exportacion:Tamano +
## Exportacion:Financiacion + Tamano:Financiacion + Exportacion:Zona +
## Tamano:Zona + Financiacion:Zona + Exportacion:Actividad +
## Tamano:Actividad + Financiacion:Actividad + Zona:Actividad +
## Exportacion:Tamano:Financiacion + Exportacion:Tamano:Zona +
## Exportacion:Financiacion:Zona + Tamano:Financiacion:Zona +
## Exportacion:Tamano:Actividad + Exportacion:Financiacion:Actividad +
## Tamano:Financiacion:Actividad + Exportacion:Zona:Actividad +
## Tamano:Zona:Actividad + Financiacion:Zona:Actividad + Exportacion:Tamano:Financiacion:Zona +
## Exportacion:Tamano:Financiacion:Actividad + Exportacion:Financiacion:Zona:Actividad
##
## Df AIC
## - Exportacion:Financiacion:Zona:Actividad 6 210.33
## - Exportacion:Tamano:Financiacion:Actividad 6 212.42
## - Exportacion:Tamano:Financiacion:Zona 4 216.01
## - Tamano:Zona:Actividad 12 220.29
## <none> 222.16
##
## Step: AIC=210.33
## ~Exportacion + Tamano + Financiacion + Zona + Actividad + Exportacion:Tamano +
## Exportacion:Financiacion + Tamano:Financiacion + Exportacion:Zona +
## Tamano:Zona + Financiacion:Zona + Exportacion:Actividad +
## Tamano:Actividad + Financiacion:Actividad + Zona:Actividad +
## Exportacion:Tamano:Financiacion + Exportacion:Tamano:Zona +
## Exportacion:Financiacion:Zona + Tamano:Financiacion:Zona +
## Exportacion:Tamano:Actividad + Exportacion:Financiacion:Actividad +
## Tamano:Financiacion:Actividad + Exportacion:Zona:Actividad +
## Tamano:Zona:Actividad + Financiacion:Zona:Actividad + Exportacion:Tamano:Financiacion:Zona +
## Exportacion:Tamano:Financiacion:Actividad
##
## Df AIC
## - Exportacion:Tamano:Financiacion:Actividad 6 200.91
## - Financiacion:Zona:Actividad 6 201.77
## - Exportacion:Tamano:Financiacion:Zona 4 204.44
## - Tamano:Zona:Actividad 12 208.46
## <none> 210.33
## - Exportacion:Zona:Actividad 6 210.61
##
## Step: AIC=200.91
## ~Exportacion + Tamano + Financiacion + Zona + Actividad + Exportacion:Tamano +
## Exportacion:Financiacion + Tamano:Financiacion + Exportacion:Zona +
## Tamano:Zona + Financiacion:Zona + Exportacion:Actividad +
## Tamano:Actividad + Financiacion:Actividad + Zona:Actividad +
## Exportacion:Tamano:Financiacion + Exportacion:Tamano:Zona +
## Exportacion:Financiacion:Zona + Tamano:Financiacion:Zona +
## Exportacion:Tamano:Actividad + Exportacion:Financiacion:Actividad +
## Tamano:Financiacion:Actividad + Exportacion:Zona:Actividad +
## Tamano:Zona:Actividad + Financiacion:Zona:Actividad + Exportacion:Tamano:Financiacion:Zona
##
## Df AIC
## - Financiacion:Zona:Actividad 6 192.87
## - Tamano:Financiacion:Actividad 6 193.61
## - Exportacion:Tamano:Financiacion:Zona 4 194.82
## - Exportacion:Tamano:Actividad 6 197.28
## - Exportacion:Financiacion:Actividad 3 198.54
## - Tamano:Zona:Actividad 12 200.08
## <none> 200.91
## - Exportacion:Zona:Actividad 6 201.17
##
## Step: AIC=192.87
## ~Exportacion + Tamano + Financiacion + Zona + Actividad + Exportacion:Tamano +
## Exportacion:Financiacion + Tamano:Financiacion + Exportacion:Zona +
## Tamano:Zona + Financiacion:Zona + Exportacion:Actividad +
## Tamano:Actividad + Financiacion:Actividad + Zona:Actividad +
## Exportacion:Tamano:Financiacion + Exportacion:Tamano:Zona +
## Exportacion:Financiacion:Zona + Tamano:Financiacion:Zona +
## Exportacion:Tamano:Actividad + Exportacion:Financiacion:Actividad +
## Tamano:Financiacion:Actividad + Exportacion:Zona:Actividad +
## Tamano:Zona:Actividad + Exportacion:Tamano:Financiacion:Zona
##
## Df AIC
## - Tamano:Financiacion:Actividad 6 184.80
## - Exportacion:Tamano:Financiacion:Zona 4 187.69
## - Exportacion:Tamano:Actividad 6 189.77
## - Exportacion:Financiacion:Actividad 3 192.27
## <none> 192.87
## - Tamano:Zona:Actividad 12 193.05
## - Exportacion:Zona:Actividad 6 194.68
##
## Step: AIC=184.8
## ~Exportacion + Tamano + Financiacion + Zona + Actividad + Exportacion:Tamano +
## Exportacion:Financiacion + Tamano:Financiacion + Exportacion:Zona +
## Tamano:Zona + Financiacion:Zona + Exportacion:Actividad +
## Tamano:Actividad + Financiacion:Actividad + Zona:Actividad +
## Exportacion:Tamano:Financiacion + Exportacion:Tamano:Zona +
## Exportacion:Financiacion:Zona + Tamano:Financiacion:Zona +
## Exportacion:Tamano:Actividad + Exportacion:Financiacion:Actividad +
## Exportacion:Zona:Actividad + Tamano:Zona:Actividad + Exportacion:Tamano:Financiacion:Zona
##
## Df AIC
## - Exportacion:Tamano:Financiacion:Zona 4 179.69
## - Exportacion:Tamano:Actividad 6 182.52
## - Exportacion:Financiacion:Actividad 3 184.35
## <none> 184.80
## - Tamano:Zona:Actividad 12 185.90
## - Exportacion:Zona:Actividad 6 186.16
##
## Step: AIC=179.69
## ~Exportacion + Tamano + Financiacion + Zona + Actividad + Exportacion:Tamano +
## Exportacion:Financiacion + Tamano:Financiacion + Exportacion:Zona +
## Tamano:Zona + Financiacion:Zona + Exportacion:Actividad +
## Tamano:Actividad + Financiacion:Actividad + Zona:Actividad +
## Exportacion:Tamano:Financiacion + Exportacion:Tamano:Zona +
## Exportacion:Financiacion:Zona + Tamano:Financiacion:Zona +
## Exportacion:Tamano:Actividad + Exportacion:Financiacion:Actividad +
## Exportacion:Zona:Actividad + Tamano:Zona:Actividad
##
## Df AIC
## - Exportacion:Tamano:Zona 4 173.68
## - Tamano:Financiacion:Zona 4 175.30
## - Exportacion:Tamano:Actividad 6 176.99
## - Exportacion:Financiacion:Zona 2 178.13
## - Exportacion:Financiacion:Actividad 3 178.56
## <none> 179.69
## - Tamano:Zona:Actividad 12 180.28
## - Exportacion:Zona:Actividad 6 180.51
## - Exportacion:Tamano:Financiacion 2 181.83
##
## Step: AIC=173.68
## ~Exportacion + Tamano + Financiacion + Zona + Actividad + Exportacion:Tamano +
## Exportacion:Financiacion + Tamano:Financiacion + Exportacion:Zona +
## Tamano:Zona + Financiacion:Zona + Exportacion:Actividad +
## Tamano:Actividad + Financiacion:Actividad + Zona:Actividad +
## Exportacion:Tamano:Financiacion + Exportacion:Financiacion:Zona +
## Tamano:Financiacion:Zona + Exportacion:Tamano:Actividad +
## Exportacion:Financiacion:Actividad + Exportacion:Zona:Actividad +
## Tamano:Zona:Actividad
##
## Df AIC
## - Tamano:Financiacion:Zona 4 168.92
## - Exportacion:Tamano:Actividad 6 170.80
## - Exportacion:Financiacion:Zona 2 172.32
## - Exportacion:Financiacion:Actividad 3 172.54
## - Exportacion:Zona:Actividad 6 173.20
## <none> 173.68
## - Exportacion:Tamano:Financiacion 2 175.71
## - Tamano:Zona:Actividad 12 179.78
##
## Step: AIC=168.92
## ~Exportacion + Tamano + Financiacion + Zona + Actividad + Exportacion:Tamano +
## Exportacion:Financiacion + Tamano:Financiacion + Exportacion:Zona +
## Tamano:Zona + Financiacion:Zona + Exportacion:Actividad +
## Tamano:Actividad + Financiacion:Actividad + Zona:Actividad +
## Exportacion:Tamano:Financiacion + Exportacion:Financiacion:Zona +
## Exportacion:Tamano:Actividad + Exportacion:Financiacion:Actividad +
## Exportacion:Zona:Actividad + Tamano:Zona:Actividad
##
## Df AIC
## - Exportacion:Tamano:Actividad 6 166.03
## - Exportacion:Financiacion:Zona 2 167.00
## - Exportacion:Financiacion:Actividad 3 167.47
## - Exportacion:Zona:Actividad 6 168.73
## <none> 168.92
## - Exportacion:Tamano:Financiacion 2 169.55
## - Tamano:Zona:Actividad 12 174.04
##
## Step: AIC=166.03
## ~Exportacion + Tamano + Financiacion + Zona + Actividad + Exportacion:Tamano +
## Exportacion:Financiacion + Tamano:Financiacion + Exportacion:Zona +
## Tamano:Zona + Financiacion:Zona + Exportacion:Actividad +
## Tamano:Actividad + Financiacion:Actividad + Zona:Actividad +
## Exportacion:Tamano:Financiacion + Exportacion:Financiacion:Zona +
## Exportacion:Financiacion:Actividad + Exportacion:Zona:Actividad +
## Tamano:Zona:Actividad
##
## Df AIC
## - Exportacion:Zona:Actividad 6 163.71
## - Exportacion:Financiacion:Zona 2 163.99
## - Exportacion:Financiacion:Actividad 3 165.84
## <none> 166.03
## - Exportacion:Tamano:Financiacion 2 166.99
## - Tamano:Zona:Actividad 12 170.06
##
## Step: AIC=163.7
## ~Exportacion + Tamano + Financiacion + Zona + Actividad + Exportacion:Tamano +
## Exportacion:Financiacion + Tamano:Financiacion + Exportacion:Zona +
## Tamano:Zona + Financiacion:Zona + Exportacion:Actividad +
## Tamano:Actividad + Financiacion:Actividad + Zona:Actividad +
## Exportacion:Tamano:Financiacion + Exportacion:Financiacion:Zona +
## Exportacion:Financiacion:Actividad + Tamano:Zona:Actividad
##
## Df AIC
## - Exportacion:Financiacion:Zona 2 160.90
## - Exportacion:Financiacion:Actividad 3 162.84
## <none> 163.71
## - Exportacion:Tamano:Financiacion 2 164.13
## - Tamano:Zona:Actividad 12 168.16
##
## Step: AIC=160.9
## ~Exportacion + Tamano + Financiacion + Zona + Actividad + Exportacion:Tamano +
## Exportacion:Financiacion + Tamano:Financiacion + Exportacion:Zona +
## Tamano:Zona + Financiacion:Zona + Exportacion:Actividad +
## Tamano:Actividad + Financiacion:Actividad + Zona:Actividad +
## Exportacion:Tamano:Financiacion + Exportacion:Financiacion:Actividad +
## Tamano:Zona:Actividad
##
## Df AIC
## - Exportacion:Financiacion:Actividad 3 159.29
## - Financiacion:Zona 2 160.69
## <none> 160.90
## - Exportacion:Tamano:Financiacion 2 161.55
## - Exportacion:Zona 2 162.37
## - Tamano:Zona:Actividad 12 165.70
##
## Step: AIC=159.29
## ~Exportacion + Tamano + Financiacion + Zona + Actividad + Exportacion:Tamano +
## Exportacion:Financiacion + Tamano:Financiacion + Exportacion:Zona +
## Tamano:Zona + Financiacion:Zona + Exportacion:Actividad +
## Tamano:Actividad + Financiacion:Actividad + Zona:Actividad +
## Exportacion:Tamano:Financiacion + Tamano:Zona:Actividad
##
## Df AIC
## - Financiacion:Actividad 3 154.69
## - Financiacion:Zona 2 158.99
## <none> 159.29
## - Exportacion:Tamano:Financiacion 2 159.82
## - Exportacion:Zona 2 161.05
## - Tamano:Zona:Actividad 12 164.18
## - Exportacion:Actividad 3 173.59
##
## Step: AIC=154.69
## ~Exportacion + Tamano + Financiacion + Zona + Actividad + Exportacion:Tamano +
## Exportacion:Financiacion + Tamano:Financiacion + Exportacion:Zona +
## Tamano:Zona + Financiacion:Zona + Exportacion:Actividad +
## Tamano:Actividad + Zona:Actividad + Exportacion:Tamano:Financiacion +
## Tamano:Zona:Actividad
##
## Df AIC
## - Financiacion:Zona 2 154.21
## <none> 154.69
## - Exportacion:Tamano:Financiacion 2 155.11
## - Exportacion:Zona 2 156.22
## - Tamano:Zona:Actividad 12 159.70
## - Exportacion:Actividad 3 168.66
##
## Step: AIC=154.21
## ~Exportacion + Tamano + Financiacion + Zona + Actividad + Exportacion:Tamano +
## Exportacion:Financiacion + Tamano:Financiacion + Exportacion:Zona +
## Tamano:Zona + Exportacion:Actividad + Tamano:Actividad +
## Zona:Actividad + Exportacion:Tamano:Financiacion + Tamano:Zona:Actividad
##
## Df AIC
## <none> 154.21
## - Exportacion:Tamano:Financiacion 2 154.27
## - Exportacion:Zona 2 155.61
## - Tamano:Zona:Actividad 12 158.87
## - Exportacion:Actividad 3 167.75
# Ver el modelo reducido
summary(modelo_reducido)
## Formula:
## ~Exportacion + Tamano + Financiacion + Zona + Actividad + Exportacion:Tamano +
## Exportacion:Financiacion + Tamano:Financiacion + Exportacion:Zona +
## Tamano:Zona + Exportacion:Actividad + Tamano:Actividad +
## Zona:Actividad + Exportacion:Tamano:Financiacion + Tamano:Zona:Actividad
## attr(,"variables")
## list(Exportacion, Tamano, Financiacion, Zona, Actividad)
## attr(,"factors")
## Exportacion Tamano Financiacion Zona Actividad Exportacion:Tamano
## Exportacion 1 0 0 0 0 1
## Tamano 0 1 0 0 0 1
## Financiacion 0 0 1 0 0 0
## Zona 0 0 0 1 0 0
## Actividad 0 0 0 0 1 0
## Exportacion:Financiacion Tamano:Financiacion Exportacion:Zona
## Exportacion 1 0 1
## Tamano 0 1 0
## Financiacion 1 1 0
## Zona 0 0 1
## Actividad 0 0 0
## Tamano:Zona Exportacion:Actividad Tamano:Actividad Zona:Actividad
## Exportacion 0 1 0 0
## Tamano 1 0 1 0
## Financiacion 0 0 0 0
## Zona 1 0 0 1
## Actividad 0 1 1 1
## Exportacion:Tamano:Financiacion Tamano:Zona:Actividad
## Exportacion 1 0
## Tamano 1 1
## Financiacion 1 0
## Zona 0 1
## Actividad 0 1
## attr(,"term.labels")
## [1] "Exportacion" "Tamano"
## [3] "Financiacion" "Zona"
## [5] "Actividad" "Exportacion:Tamano"
## [7] "Exportacion:Financiacion" "Tamano:Financiacion"
## [9] "Exportacion:Zona" "Tamano:Zona"
## [11] "Exportacion:Actividad" "Tamano:Actividad"
## [13] "Zona:Actividad" "Exportacion:Tamano:Financiacion"
## [15] "Tamano:Zona:Actividad"
## attr(,"order")
## [1] 1 1 1 1 1 2 2 2 2 2 2 2 2 3 3
## attr(,"intercept")
## [1] 1
## attr(,"response")
## [1] 0
## attr(,".Environment")
## <environment: R_GlobalEnv>
##
## Statistics:
## X^2 df P(> X^2)
## Likelihood Ratio 54.20907 94 0.9996709
## Pearson NaN 94 NaN
En cada paso, el algoritmo elimina interacciones o efectos de mayor orden que no mejoran significativamente el ajuste del modelo. Aquí algunos pasos clave de eliminación:
Continúa hasta el último paso donde se ha llegado a un modelo reducido con AIC=154.21, que es significativamente menor que el modelo saturado inicial.
~ Exportacion + Tamano + Financiacion + Zona + Actividad + Exportacion:Tamano + Exportacion:Financiacion + Tamano:Financiacion + Exportacion:Zona + Tamano:Zona + Exportacion:Actividad + Tamano:Actividad + Zona:Actividad + Exportacion:Tamano:Financiacion + Tamano:Zona:Actividad
Este modelo es más simple que el modelo saturado inicial, ya que ha eliminado muchas interacciones de mayor orden
Estadísticas de ajuste del modelo final:
X² bajo: El valor del X² es relativamente bajo (54.209) y está asociado a un P-valor alto (0.99967), lo cual indica que no hay evidencia de falta de ajuste. Esto significa que el modelo reducido ajusta bien a los datos, ya que no observamos diferencias significativas entre las frecuencias observadas y las esperadas.
P-valor alto: Un P-valor tan alto sugiere que el modelo reducido ajusta adecuadamente, lo que es ideal en este contexto. No hay necesidad de mantener todas las interacciones complejas del modelo saturado, pues el modelo reducido explica suficientemente bien las relaciones en los datos.
El AIC se ha reducido significativamente (de 288 a 154.21), lo que indica que el modelo es más parsimonioso y ajusta mejor en términos de balance entre complejidad y capacidad predictiva
# Paso 1: Ajustar el modelo saturado
modelo_saturado <- loglm(~ Exportacion * Tamano * Financiacion * Zona * Actividad, data = tabla_contingencia)
# Paso 2: Modelo con solo interacciones de tercer orden
modelo_tercer_orden <- loglm(~ (Exportacion + Tamano + Financiacion + Zona + Actividad)^3, data = tabla_contingencia)
# Paso 3: Modelo con solo interacciones de segundo orden
modelo_segundo_orden <- loglm(~ (Exportacion + Tamano + Financiacion + Zona + Actividad)^2, data = tabla_contingencia)
# Paso 4: Modelo sin interacciones (solo efectos principales)
modelo_efectos_principales <- loglm(~ Exportacion + Tamano + Financiacion + Zona + Actividad, data = tabla_contingencia)
# Dado que no se puede usar directamente la función AIC para este loglm, lo que realizaremos es crear una función que nos permita calcular el AIC
# Función para calcular el AIC de un modelo loglineal
calcular_AIC_loglm <- function(modelo) {
devianza <- modelo$deviance
num_parametros <- length(coef(modelo)) # Número de coeficientes en el modelo
AIC <- devianza + 2 * num_parametros
return(AIC)
}
# Calcular el AIC de cada modelo (previamente creado)
AIC_saturado <- calcular_AIC_loglm(modelo_saturado)
AIC_tercer_orden <- calcular_AIC_loglm(modelo_tercer_orden)
AIC_segundo_orden <- calcular_AIC_loglm(modelo_segundo_orden)
AIC_efectos_principales <- calcular_AIC_loglm(modelo_efectos_principales)
# Mostrar los resultados
AIC_resultados <- data.frame(
Modelo = c("Saturado", "Interacciones Tercer Orden", "Interacciones Segundo Orden", "Efectos Principales"),
AIC = c(AIC_saturado, AIC_tercer_orden, AIC_segundo_orden, AIC_efectos_principales)
)
print(AIC_resultados)
## Modelo AIC
## 1 Saturado 64.00000
## 2 Interacciones Tercer Orden 62.73666
## 3 Interacciones Segundo Orden 114.29581
## 4 Efectos Principales 169.20729
Modelo Saturado (AIC = 64.00): Este modelo incluye todas las interacciones posibles entre las variables (Exportacion, Tamano, Financiacion, Zona y Actividad). Debido a que incluye todas las posibles interacciones, ajusta perfectamente los datos, pero es también el modelo más complejo.
Modelo con Interacciones de Tercer Orden (AIC = 62.73): Este modelo incluye todas las interacciones hasta de tres variables. Al comparar su AIC con el del modelo saturado, vemos que tiene un AIC ligeramente más bajo (62.73 vs. 64.00), lo que indica que es un poco más eficiente en términos de balance entre ajuste y complejidad. Esto sugiere que las interacciones de cuarto y quinto orden no aportan significativamente al ajuste del modelo.
Modelo con Interacciones de Segundo Orden (AIC = 114.30): Este modelo incluye únicamente interacciones de dos variables. Su AIC es bastante más alto que los dos primeros modelos (114.30 vs. 62.73 y 64.00), lo cual indica que al eliminar las interacciones de tercer orden, el modelo pierde capacidad de ajuste y se aleja significativamente de los datos observados.
Modelo con Efectos Principales (AIC = 169.21): Este modelo incluye solo los efectos principales de cada variable sin interacciones. Al tener un AIC significativamente mayor (169.21), se puede concluir que el modelo es demasiado simple y no representa adecuadamente la estructura de los datos.
El modelo con interacciones de tercer orden tiene el AIC más bajo (62.73), lo que sugiere que es el mejor modelo en términos de simplicidad y ajuste a los datos. Es más simple que el modelo saturado pero logra capturar de manera adecuada la estructura de los datos, sin incluir interacciones de mayor orden que no parecen ser necesarias.