El Censo Nacional Agropecuario 2014 de Colombia marcó un hito significativo en la recopilación y análisis de datos agrícolas y pecuarios en el país. Llevado a cabo por el Departamento Administrativo Nacional de Estadística (DANE), este censo se posicionó como el tercer ejercicio censal agropecuario en la historia del país, representando un esfuerzo colosal para comprender mejor la estructura y dinámica del sector agropecuario colombiano.
La importancia de este censo radica no solo en la magnitud de la operación estadística, considerada la más grande en la historia del DANE hasta ese momento, sino también en la riqueza y profundidad de los datos recopilados. La información obtenida proporcionó una visión integral del estado del sector agropecuario, incluyendo aspectos como la distribución de la tierra, las prácticas de cultivo y cría, el uso de tecnologías agrícolas, y las condiciones socioeconómicas de los agricultores y trabajadores del campo.
Desde una perspectiva estadística, el Censo Nacional Agropecuario 2014 fue un proyecto ambicioso que implementó metodologías avanzadas para garantizar la recopilación de datos precisos y representativos. La georreferenciación de la información fue un aspecto clave, permitiendo un análisis espacial detallado que facilita la identificación de patrones geográficos en la producción agropecuaria y las prácticas de manejo del suelo.
En la presente edición se incluye un estudio meticuloso que aborda la interacción de variables clave en el departamento de Risaralda, con especial atención a indicadores como:
Se trata de un análisis multivariado, cuyo propósito es desvelar las relaciones subyacentes entre estas variables y su impacto en la estructura socioeconómica de la región. La metodología empleada incluye: - Analisis de covarianza y correlación para variables cuantitativas - Análisis de distancia de Mahalanobis - Evaluación de la normalidad multivariante y datos atípicos - Estimación de coeficientes de asimetría y curtosis - Pruebas de hipótesis - Análisis Multivariable de variable cualitativás - Análisis de chi cuadrado - Análisis avanzado (generalidades)
El estudio se orienta hacia la comprensión y proyección de tendencias en el sector agropecuario y lechero de Risaralda, proporcionando datos valiosos para:
Se persigue, por tanto, aportar una visión que contribuya al desarrollo sostenible y al crecimiento económico de la región.
Este análisis es un ejemplo claro del papel crucial de la estadística en el análisis de complejidades del desarrollo rural y la gestión de recursos, y se espera que el trabajo sirva como plataforma para debates futuros y la toma de decisiones informadas.
Área de pastos: El valor medio es de 13,470.41 hectáreas, lo que indica que en promedio, las parcelas en Risaralda poseen esta cantidad de hectáreas dedicadas a pastos. Este valor puede estar influenciado por grandes fincas, sugiriendo la necesidad de examinar la mediana para obtener una mejor comprensión de la distribución.
Hembras de ordeño: El promedio de hembras de ordeño por finca es aproximadamente 6.32. Esto refleja el tamaño medio de los hatos dedicados al ordeño en la región, lo cual es un indicador útil para comprender el enfoque hacia la producción de leche.
Leche recolectada: En promedio, cada finca recolecta 47.27 litros de leche. Este número es coherente con el promedio de hembras de ordeño, aunque la variabilidad en este valor podría ser importante para entender la eficiencia y las prácticas de manejo en las fincas.
Área total: El área total promedio de las fincas en Risaralda es de 280,593.8 hectáreas, lo cual es muy elevado y sugiere una distorsión debido a la inclusión de grandes propiedades en el análisis. Este valor probablemente sesga la percepción del tamaño típico de las fincas en la región.
Personas: El número medio de personas por finca es de aproximadamente 2.92, lo que podría indicar el tamaño medio de la mano de obra disponible en las fincas, aunque este número no distingue entre trabajadores familiares y empleados.
# pairs(cov.s.agro_matriz, main = "Dispersograma de la matriz de covarianza",
# pch = 21, bg = c("red", "green3", "blue", "yellow", "gray")[unclass(factor(row.names(cov.s.agro_matriz)))]
# )
Esta matriz de correlación representa las relaciones entre diferentes variables agropecuarias del Censo Nacional Agropecuario 2014 en Risaralda. Las variables son: área de pastos (AreaPastos), número de hembras de ordeño (HembrasOrdeño), cantidad de leche recolectada (LecheRecolectada), área total de la finca (AreaTotal) y el número de personas (Personas) trabajando o viviendo en la finca. La matriz es simétrica con unos en la diagonal principal, lo que indica que la correlación de una variable consigo misma es siempre 1.
Área de pastos (AreaPastos) tiene una correlación positiva muy fuerte con el Área Total (AreaTotal) (0.8844), lo que sugiere que, como se esperaría, a mayor área total de la finca, generalmente hay más área dedicada a pastos.
Hembras de ordeño (HembrasOrdeño) tiene una correlación muy alta con la Leche Recolectada (LecheRecolectada) (0.8885), indicando que un mayor número de hembras de ordeño está asociado con mayores volúmenes de leche recolectada.
Las correlaciones de Hembras de ordeño (HembrasOrdeño) y Leche Recolectada (LecheRecolectada) con Área de pastos (AreaPastos) son positivas (0.1898 y 0.1360 respectivamente), aunque no tan fuertes, lo que podría indicar que un aumento en el área de pastos podría estar relacionado con un mayor número de hembras de ordeño y, por tanto, más leche recolectada, pero hay otros factores que también influyen en estas variables.
Área total (AreaTotal) tiene correlaciones positivas moderadas con Hembras de Ordeño (HembrasOrdeño) y Leche Recolectada (LecheRecolectada) (0.2843 y 0.1865 respectivamente), sugiriendo que las fincas más grandes pueden tener una mayor capacidad para el ordeño y la recolección de leche, aunque esta relación no es tan fuerte como la correlación entre el área de pastos y el área total.
La variable Personas tiene correlaciones muy bajas con todas las otras variables, indicando que la cantidad de personas en la finca no parece estar fuertemente asociada con el tamaño de las áreas de pastos, el número de hembras de ordeño, la cantidad de leche recolectada o el área total de la finca.
AreaPastos HembrasOrdeño LecheRecolectada AreaTotal
AreaPastos NA 0.000000000 0.000000e+00 0.0000000 HembrasOrdeño 0.0000000 NA 0.000000e+00 0.0000000 LecheRecolectada 0.0000000 0.000000000 NA 0.0000000 AreaTotal 0.0000000 0.000000000 0.000000e+00 NA Personas 0.8159544 0.001294637 9.650862e-05 0.7314891 Personas AreaPastos 8.159544e-01 HembrasOrdeño 1.294637e-03 LecheRecolectada 9.650862e-05 AreaTotal 7.314891e-01 Personas NA AreaPastos HembrasOrdeño LecheRecolectada AreaTotal AreaPastos NA 0.000000000 0.000000e+00 0.0000000 HembrasOrdeño 0.0000000 NA 0.000000e+00 0.0000000 LecheRecolectada 0.0000000 0.000000000 NA 0.0000000 AreaTotal 0.0000000 0.000000000 0.000000e+00 NA Personas 0.8159544 0.001294637 9.650862e-05 0.7314891 Personas AreaPastos 8.159544e-01 HembrasOrdeño 1.294637e-03 LecheRecolectada 9.650862e-05 AreaTotal 7.314891e-01 Personas NA
Área de pastos y el número de hembras de ordeño: P-valor ≈ 0.000 Interpretación: Hay una correlación estadísticamente significativa entre el área de pastos y el número de hembras de ordeño. Es altamente improbable que esta correlación se deba al azar.
Área de pastos y leche recolectada: P-valor ≈ 0.000 Interpretación: Similarmente, hay una correlación estadísticamente significativa entre el área de pastos y la cantidad de leche recolectada, indicando una relación fuerte y no aleatoria.
Área de pastos y área total: P-valor ≈ 0.000 Interpretación: Existe una correlación estadísticamente significativa entre el área total de la finca y el área de pastos, lo que sugiere que estas dos medidas están fuertemente relacionadas.
Área de pastos y personas: P-valor ≈ 0.816 Interpretación: No hay evidencia de una correlación estadísticamente significativa entre el área de pastos y el número de personas, lo que sugiere que cualquier correlación observada puede deberse al azar.
Hembras de ordeño y leche recolectada: P-valor ≈ 0.000 Interpretación: Hay una fuerte correlación estadísticamente significativa entre el número de hembras de ordeño y la leche recolectada, lo que indica una relación directa y esperada entre estas dos variables.
Hembras de ordeño y personas: P-valor ≈ 0.001 Interpretación: Existe una correlación significativa entre el número de hembras de ordeño y el número de personas, aunque esta relación es menos fuerte que algunas de las otras observadas.
Leche recolectada y personas: P-valor ≈ 0.0001 Interpretación: Existe una correlación estadísticamente significativa, aunque posiblemente débil, entre la cantidad de leche recolectada y el número de personas.
Área total y personas: P-valor ≈ 0.731 Interpretación: No hay evidencia de una correlación significativa entre el área total y el número de personas.
Means, standard deviations, and correlations with confidence intervals
Variable M SD 1 2 3 4
1. AreaPastos 0.44 0.46
HembrasOrdeño 0.48 0.43 -.39
[-.95, .75]
LecheRecolectada 0.45 0.45 -.47 .98**
[-.96, .70] [.72, 1.00]
AreaTotal 0.47 0.44 .98** -.31 -.41
[.73, 1.00] [-.94, .79] [-.95, .74]
Personas 0.22 0.44 -.59 -.51 -.43 -.64
[-.97, .61] [-.96, .68] [-.95, .73] [-.97, .56]
Note. M and SD are used to represent mean and standard deviation, respectively. Values in square brackets indicate the 95% confidence interval. The confidence interval is a plausible range of population correlations that could have caused the sample correlation (Cumming, 2014). * indicates p < .05. ** indicates p < .01.
Las correlaciones entre Área de Pastos y Área Total son muy altas y positivas, lo cual indica que a medida que una aumenta, la otra también lo hace, y esta relación es estadísticamente significativa. Hay una correlación negativa entre Hembras de Ordeño y Área de Pastos, y aunque el intervalo de confianza es amplio, sugiere que no hay una relación lineal fuerte y clara entre estas dos variables. La correlación casi perfecta entre Hembras de Ordeño y Leche Recolectada indica que casi con certeza, a medida que una variable aumenta, la otra también lo hace, reflejando una relación directa y muy fuerte en la producción de leche. Las variables Personas presentan correlaciones negativas con todas las demás variables y los intervalos de confianza amplios sugieren incertidumbre en estas estimaciones, pero indican tendencias negativas generales con todas las variables relacionadas con la gestión de la granja.
Para entender mejor estos datos, realicé un análisis exploratorio que incluyó calcular estadísticas descriptivas y observar la distribución de los valores:
Rango de valores: Los valores varían desde muy pequeños (prácticamente cero) hasta extremadamente grandes (más de 3646), lo cual sugiere una variabilidad significativa en cómo los puntos de datos se alejan del centro o promedio del grupo.
Valores típicos: La mayoría de los valores son relativamente bajos, indicando que la mayoría de los puntos no están muy lejos del centro. Sin embargo, hay algunos valores extremadamente altos que podrían considerarse como outliers o anomalías.
Tendencias centrales: La media es aproximadamente 4.69, pero es muy influenciada por valores extremos, como lo indica una mediana de 0.829, sugiriendo que la mitad de los puntos están bastante cercanos al centro.
Concentración de puntos: La mayoría de las observaciones tienen distancias de Mahalanobis muy bajas, acumulándose cerca del origen. Esto sugiere que la mayoría de las observaciones están agrupadas cerca de la media del conjunto de datos y no son consideradas atípicas.
Línea de umbral del 95% (umbral 95%): La línea punteada roja marca el umbral para identificar outliers. Las observaciones que caen a la derecha de esta línea tienen una alta probabilidad de ser outliers multivariados. En esta gráfica, el umbral está etiquetado con el valor 1506.36, que probablemente ha sido calculado basado en la distribución chi-cuadrado correspondiente al 95% de confianza para el número de grados de libertad igual al número de variables en el conjunto de datos.
Outliers: Existen observaciones muy por encima del umbral que se destacan claramente. Tienen valores etiquetados como 3130.93 y 3054.66, que son significativamente mayores que el umbral del 95%. Estos puntos son outliers multivariados fuertes y pueden ser de particular interés o preocupación, dependiendo del contexto del análisis.
Observaciones cercanas al umbral: Hay observaciones con valores alrededor de 500 a 600 que están cercanas al umbral, pero no lo superan significativamente. Estas pueden ser consideradas como casos límite y podrían requerir una revisión adicional.
Ausencia de valores moderados: Lo notable es la aparente ausencia de valores moderados entre los extremadamente bajos y los muy altos. Esto podría indicar una distribución bimodal o la presencia de dos grupos distintos en el conjunto de datos.
Interpretación contextual: Para interpretar adecuadamente esta gráfica, sería necesario entender el contexto de los datos, por ejemplo, qué variables están siendo medidas y cómo se calculó la distancia de Mahalanobis. Las implicaciones de encontrar tales outliers dependerían de si estamos analizando variables financieras, resultados de salud, medidas de calidad de manufactura, etc.
Posibles acciones subsecuentes: Dependiendo del análisis posterior, podríamos decidir investigar los outliers más a fondo, entender por qué son tan diferentes y determinar si deben ser excluidos o tratados de manera especial en análisis posteriores.
| Test | Statistic | p.value | Result |
|---|---|---|---|
| Mardia Skewness | 2944594.909 | 0 | NO |
| Mardia Kurtosis | 21596.024 | 0 | NO |
| MVN | NA | NA | NO |
| Test | Variable | Statistic | p.value | Normality |
|---|---|---|---|---|
| Anderson-Darling | AreaPastos | 1383.588 | <0.001 | NO |
| Anderson-Darling | HembrasOrdeño | 793.245 | <0.001 | NO |
| Anderson-Darling | LecheRecolectada | 828.105 | <0.001 | NO |
| Anderson-Darling | AreaTotal | 1319.995 | <0.001 | NO |
| Anderson-Darling | Personas | 196.348 | <0.001 | NO |
| Test | Variable | Statistic | p.value | Normality |
|---|---|---|---|---|
| Anderson-Darling | AreaPastos | 1383.588 | <0.001 | NO |
| Anderson-Darling | HembrasOrdeño | 793.245 | <0.001 | NO |
| Anderson-Darling | LecheRecolectada | 828.105 | <0.001 | NO |
| Anderson-Darling | AreaTotal | 1319.995 | <0.001 | NO |
| Anderson-Darling | Personas | 196.348 | <0.001 | NO |
Pruebas de normalidad multivariante
Mardia Skewness
Statistic: 2,944,594.909. Este valor es extremadamente alto, indicando una gran asimetría en la distribución multivariante.
p value: 0. Un p-valor de 0 sugiere que hay evidencia estadísticamente significativa para rechazar la hipótesis nula de que la distribución es simétrica. Result: NO. La normalidad multivariante basada en la asimetría no se sostiene.
Mardia Kurtosis
Statistic: 21,596.024. Este valor también es extremadamente alto, lo que indica un exceso de kurtosis.
p value: 0. Al igual que con la asimetría, un p-valor de 0 aquí indica rechazo de la hipótesis nula de kurtosis normal (kurtosis de una distribución normal multivariante). Result: NO. La kurtosis no sigue la esperada en una distribución normal multivariante.
Pruebas de normalidad univariante
Test: Todas las pruebas son del tipo Anderson-Darling, un método común para evaluar la normalidad de una muestra.
Statistic: Valores estadísticos que cuantifican la desviación de la normalidad.
p value: Valores extremadamente bajos (<0.001) indican un rechazo fuerte de la hipótesis nula de que los datos siguen una distribución normal.
Normality: Todos los resultados son “NO”, lo que indica que ninguna de las variables evaluadas sigue una distribución normal.
Descriptivos estadísticos
n: Número de observaciones (3940 para todas las variables). Mean, Std.Dev, Median, Min, Max: Medidas de tendencia central y dispersión. 25th, 75th: Percentiles 25 y 75, proporcionan una visión de la distribución de los datos.
Skew (Asimetría): Todas las variables muestran asimetría significativa, como se indica por valores altos, particularmente en AreaPastos y AreaTotal.
Kurtosis: Valores extremadamente altos en algunas variables, especialmente en AreaPastos y AreaTotal, indicando colas pesadas y picos pronunciados más allá de lo esperado en una distribución normal.
[1] “Outliers encontrados:” AreaPastos HembrasOrdeño LecheRecolectada AreaTotal Personas 98 3.296938e+04 61 555 1.153247e+06 2 101 4.919857e+03 68 400 1.212518e+06 6 107 0.000000e+00 79 688 1.211094e+06 9 154 5.386990e+03 140 1027 1.176356e+06 7 206 1.870064e+03 90 445 1.187291e+06 1 236 0.000000e+00 66 815 1.159760e+06 6 242 1.870064e+03 90 445 1.187291e+06 1 433 0.000000e+00 61 728 7.251658e+04 4 461 0.000000e+00 66 330 1.210391e+06 1 616 3.076629e+05 70 345 3.289979e+06 5 691 0.000000e+00 56 731 3.381867e+05 4 821 0.000000e+00 79 1200 3.786010e+05 1 843 4.100770e+03 7 94 1.627779e+06 136 883 2.313664e+04 79 1200 3.635462e+05 1 1121 0.000000e+00 81 494 8.933328e+05 4 1290 0.000000e+00 95 464 2.135066e+06 3 1322 0.000000e+00 95 464 1.187968e+06 17 1411 0.000000e+00 59 728 4.658086e+05 5 1747 3.490373e+03 72 369 8.379733e+05 3 1765 0.000000e+00 60 295 3.108709e+05 1 1789 6.357683e+03 73 138 1.552120e+06 3 1793 7.628680e+02 58 579 4.953934e+05 6 1794 3.067703e+02 58 579 2.023670e+05 6 1992 2.703732e+04 54 877 5.538788e+04 1 2079 0.000000e+00 33 470 1.795037e+05 4 2146 2.792101e+03 119 833 1.549869e+06 6 2294 1.296550e+04 124 608 9.893761e+05 6 2374 3.197196e+05 54 635 9.929914e+05 4 2689 1.399376e+04 100 489 7.390763e+04 4 2690 0.000000e+00 58 220 9.349922e+05 3 2857 2.777718e+04 62 232 1.213781e+06 4 2862 0.000000e+00 56 658 4.105033e+05 0 3289 2.191161e+01 49 791 3.116307e+05 2 3404 0.000000e+00 170 1460 5.373096e+05 6 3550 5.484236e+04 52 964 3.675627e+05 1 3585 3.416902e+04 52 964 1.269929e+05 7 3964 6.843448e+03 120 1223 2.958399e+05 1 3987 1.006462e+03 120 1223 1.038433e+05 10 3992 1.795141e+03 46 518 1.018120e+05 5 4144 0.000000e+00 62 232 9.309263e+04 5 4154 0.000000e+00 62 476 1.734468e+05 4 4174 0.000000e+00 62 476 1.645784e+05 5 4178 0.000000e+00 4 25 3.447199e+05 20 4560 0.000000e+00 64 510 3.253667e+05 2 4602 0.000000e+00 71 784 2.908656e+05 6 4603 0.000000e+00 71 784 2.908701e+05 6 4863 6.308829e+04 172 1574 2.328209e+06 3 5431 1.018523e+03 58 282 7.642897e+05 10 5944 9.167322e+04 58 220 6.068443e+05 4 6077 2.920096e+04 52 701 8.432835e+04 1 6146 0.000000e+00 72 351 1.039266e+06 1 6522 0.000000e+00 145 652 3.081993e+06 0 6723 6.241575e+04 130 1273 2.349860e+06 0 6879 0.000000e+00 66 815 1.195541e+06 2 7320 0.000000e+00 2 16 6.994339e+05 26 7734 5.660729e+02 0 0 1.472633e+06 16 7869 8.940788e+04 76 870 3.260910e+05 3 8004 0.000000e+00 34 494 2.890759e+05 1 8278 4.472517e+03 53 714 4.947246e+04 2 8296 4.472826e+03 53 714 4.947823e+04 6 8391 8.227285e+04 62 232 6.469521e+05 1 8891 1.124819e+05 95 464 3.689010e+05 3 8982 1.679886e+04 116 1934 3.467773e+05 9 9760 6.372191e+04 61 706 2.708822e+05 2 10309 2.037431e+01 86 1317 4.978112e+05 3 10461 0.000000e+00 73 732 1.740008e+05 0 10462 0.000000e+00 73 732 1.739988e+05 0 11556 1.008687e+04 55 529 1.420443e+05 3 11671 7.921183e+04 64 314 3.298340e+05 3 11675 1.084146e+05 64 314 1.195596e+06 5 12293 1.785535e+02 238 2459 5.747213e+06 4 13067 5.738816e+02 2 22 5.112918e+04 14 13865 9.401658e+04 128 627 1.008728e+06 3 13866 9.405743e+04 128 627 1.008728e+06 4 13982 0.000000e+00 78 383 2.122764e+06 5 13991 2.153234e+03 72 351 4.171639e+06 3 14745 1.489849e+05 89 1364 1.219864e+06 7 14755 2.378800e+03 74 364 1.088201e+06 6 14984 9.928658e+05 9 44 9.928658e+05 0 15528 2.153561e+01 2 13 8.511644e+04 18 17010 0.000000e+00 73 620 1.851538e+07 0 17061 2.150333e+05 83 408 1.123611e+06 6 17146 6.923593e+05 76 376 1.328599e+06 0 17149 0.000000e+00 171 786 5.548256e+06 9 17172 0.000000e+00 64 238 2.442785e+05 0 17178 0.000000e+00 64 238 3.156088e+05 1 17555 3.144051e+05 49 501 2.388034e+06 3 17847 0.000000e+00 6 30 1.332454e+06 18 18340 0.000000e+00 93 458 9.165396e+04 4 18400 0.000000e+00 103 502 5.627037e+04 0 21375 0.000000e+00 70 800 1.993513e+04 9 22075 6.485958e+06 265 1181 1.713022e+08 0 22383 6.185936e+01 1 24 1.993916e+03 18 22730 0.000000e+00 61 429 1.334405e+05 1 23213 2.085980e+03 10 50 6.737659e+04 39 24887 0.000000e+00 54 715 7.467041e+05 2 26546 2.050682e+05 79 550 8.676974e+05 0 26822 5.961071e+02 0 0 1.541618e+04 14 27572 3.100587e+02 0 0 1.000847e+06 24 29088 0.000000e+00 114 558 9.646782e+05 4 29157 0.000000e+00 112 552 8.046345e+05 3 29162 0.000000e+00 364 1982 8.345755e+06 3 29167 0.000000e+00 63 307 1.150734e+06 1 29298 6.053354e+04 30 470 2.756309e+05 1 29348 0.000000e+00 76 370 9.599646e+05 4 29417 0.000000e+00 58 282 3.679225e+05 0 29498 0.000000e+00 58 220 2.317143e+06 1 29853 0.000000e+00 63 307 9.603420e+05 4 29999 8.938543e+04 58 505 3.368487e+05 3 30436 0.000000e+00 120 590 1.661711e+06 5 30491 0.000000e+00 135 659 6.008086e+05 1 30840 0.000000e+00 81 165 4.623410e+06 2 30855 1.163866e+03 49 239 1.813239e+07 0 31528 0.000000e+00 3 20 3.071698e+04 16 32451 0.000000e+00 0 0 4.932175e+04 18 33543 0.000000e+00 103 201 2.127113e+05 8 35461 0.000000e+00 33 470 6.647462e+04 5 36583 0.000000e+00 47 202 1.789855e+07 0 37042 7.249815e+03 148 512 3.243614e+04 3 39069 0.000000e+00 48 541 5.620187e+03 3 39865 0.000000e+00 0 0 1.100887e+02 16 40107 0.000000e+00 0 0 1.064738e+02 16 46220 1.193131e+07 24 109 1.370891e+08 0 46806 0.000000e+00 36 494 8.660491e+05 11 46833 0.000000e+00 54 617 6.766484e+04 1 46944 5.485867e+03 5 33 1.604779e+07 29 46946 0.000000e+00 63 960 1.851318e+06 15 46978 0.000000e+00 36 494 8.894466e+05 1 47179 0.000000e+00 36 476 4.129137e+05 8 47195 7.331956e+03 2 13 4.374060e+04 14 47518 2.543632e+04 0 0 2.373661e+05 31 47825 0.000000e+00 52 588 2.691690e+05 4 47842 2.301197e+01 23 470 1.851253e+05 2 47848 0.000000e+00 72 561 1.506278e+06 4 48388 1.396046e+06 19 76 3.303793e+06 4 48683 1.287648e+05 72 887 5.730422e+06 7 48901 3.543248e+06 153 1479 2.595871e+07 17 49065 0.000000e+00 36 476 2.049224e+04 0 50224 6.813157e+04 15 72 1.300139e+06 17 50513 0.000000e+00 55 568 1.221110e+06 6 50655 0.000000e+00 51 588 1.256339e+06 3 50839 0.000000e+00 11 56 5.118200e+05 18 51455 0.000000e+00 64 952 3.170264e+06 9 51490 0.000000e+00 62 706 5.521325e+05 0 52185 0.000000e+00 64 245 1.273874e+06 3 52186 0.000000e+00 64 245 8.876025e+05 4 52225 0.000000e+00 1 14 3.032691e+04 14
#________________________________________________________________________________________
# Análisis cluster
library(cluster)
library(purrr)
matriz_datos <- readRDS("D:/practica4/multiva/data1/output/matriz_datos.rds")
data_c <- matriz_datos
#To remove any missing value that might be present in the data, type this:
data_c <- na.omit(data_c)
data_c <- scale(data_c)
# Dissimilarity matrix
d <- dist(data_c, method = "euclidean")
# Hierarchical clustering using Complete Linkage
hc1 <- hclust(d, method = "complete" )
# Plot the obtained dendrogram
plot(hc1, cex = 0.6, hang = -1)
# compute divisive hierarchical clustering
hc4 <- diana(data_c)
# Divise coefficient
hc4$dc
[1] 0.9983596
## [1] 0.9305939
## [1] 0.9305939
# plot dendrogram
pltree(hc4, cex = 0.6, hang = -1, main = "Dendrogram of diana")
# También podemos usar la función fviz_cluster del paquete factoextra para visualizar el resultado en un diagrama de dispersión.
library(ggplot2)
library(factoextra)
clust <- cutree(hc4, k = 5)
## Loading required package: ggplot2
## Welcome! Related Books: `Practical Guide To Cluster Analysis in R` at https://goo.gl/13EFCZ
fviz_cluster(list(data_c = data_c, cluster = clust)) ## from ‘factoextra’ package
respca<-prcomp(matriz_datos, scale = TRUE)
library(stats)
#prcomp() Forma rápida de implementar PCA sobre una matriz de datos.
respca<-prcomp(matriz_datos, scale = TRUE)
names(respca)
[1] “sdev” “rotation” “center” “scale” “x”
head(respca$rotation)[, 1:5] #las coordenadas de los datos en el nuevo sistema rotado de coordenadas.
PC1 PC2 PC3 PC4 PC5
AreaPastos 0.47942952 -0.5270344 -0.03521518 -0.539647590 -0.44712690 HembrasOrdeño 0.51929521 0.4635558 0.08086575 0.457125998 -0.54767237 LecheRecolectada 0.48463459 0.5184003 0.07440646 -0.493020888 0.49777964 AreaTotal 0.51342627 -0.4757166 -0.03260927 0.506694150 0.50227969 Personas 0.04475039 0.1109309 -0.99278444 0.002782835 -0.00794053
#Estas coordenadas se corresponden con los scores de los componentes principales.
dim(respca$rotation) #Número de distintos componentes
[1] 5 5
head(respca$x)[,1:5] #los vectores de los scores.
PC1 PC2 PC3 PC4 PC5
3 0.8845438 0.9216526 -0.46517045 0.2867768545 -0.315386530 4 1.5190574 -0.2069016 -0.26900141 0.6362286434 -0.241381073 5 0.9409264 -0.7299291 0.52215551 0.2094735497 0.132570117 32 -0.3759122 -0.2319073 -0.06769555 0.0005789311 0.006565177 33 -0.0111087 0.1419246 -0.30261884 -0.0075351658 -0.014260148 42 -0.4283039 -0.2815078 -0.07569165 -0.0047247546 0.016245264
respca$sdev #las desviaciones estándares de cada CP.
[1] 1.5132295 1.2240852 0.9956013 0.3648268 0.2956880
respca$sdev^2 ## Varianza explicada por cada componente
[1] 2.28986347 1.49838451 0.99122200 0.13309860 0.08743142
summary(respca)
Importance of components: PC1 PC2 PC3 PC4 PC5 Standard deviation 1.513 1.2241 0.9956 0.36483 0.29569 Proportion of Variance 0.458 0.2997 0.1982 0.02662 0.01749 Cumulative Proportion 0.458 0.7577 0.9559 0.98251 1.00000
#comprobemos la importancia del componente 1
xx<-respca$x
xx<-as.data.frame(xx)
xx <- as.data.frame(respca$x)
saveRDS(xx, "xx.rds")
# Asegurarte de que solo incluyas los primeros dos componentes principales
# si solo esos son de interés para la correlación
base_datoscor <- xx[, c("PC1", "PC2")]
# Mostrar las primeras filas para verificar el dataframe
head(base_datoscor)
PC1 PC2
3 0.8845438 0.9216526 4 1.5190574 -0.2069016 5 0.9409264 -0.7299291 32 -0.3759122 -0.2319073 33 -0.0111087 0.1419246 42 -0.4283039 -0.2815078
# Calcular y mostrar la matriz de correlación entre PC1 y PC2
cor_matrix <- cor(base_datoscor, use = "complete.obs") # Usa 'complete.obs' para manejar los NA si los hay
print(cor_matrix)
PC1 PC2
PC1 1.000000e+00 1.433204e-14 PC2 1.433204e-14 1.000000e+00
respca1 <- princomp(xx, cor = TRUE)
#respca1 <- princomp(~ Speed + Power,
# data = df, na.action = na.exclude, cor = TRUE)
names(respca1)
[1] “sdev” “loadings” “center” “scale” “n.obs” “scores” “call”
respca1$sdev
Comp.1 Comp.2 Comp.3 Comp.4 Comp.5 1 1 1 1 1
summary(respca1)
Importance of components: Comp.1 Comp.2 Comp.3 Comp.4 Comp.5 Standard deviation 1.0 1.0 1.0 1.0 1.0 Proportion of Variance 0.2 0.2 0.2 0.2 0.2 Cumulative Proportion 0.2 0.4 0.6 0.8 1.0
library(FactoMineR)
#PCA() #PCA con resultados más detallados. Los valores ausentes se reemplazan por la media de cada columna.
#Pueden incluirse variables categóricas suplementarias. Estandariza automáticamente los datos.
respca2 <- PCA(X = xx, scale.unit = FALSE, ncp = 6, graph = TRUE)
print(respca2)
Results for the Principal Component Analysis (PCA) The analysis was performed on 3940 individuals, described by 5 variables *The results are available in the following objects:
name description
1 “\(eig" "eigenvalues" 2
"\)var” “results for the variables”
3 “\(var\)coord” “coord. for the
variables”
4 “\(var\)cor” “correlations variables
- dimensions” 5 “\(var\)cos2” “cos2 for
the variables”
6 “\(var\)contrib” “contributions of
the variables”
7 “\(ind" "results for the
individuals" 8 "\)ind\(coord" "coord. for the individuals"
9 "\)ind\(cos2" "cos2
for the individuals" 10 "\)ind\(contrib" "contributions of the
individuals" 11 "\)call” “summary statistics”
12 “\(call\)centre” “mean of the
variables”
13 “\(call\)ecart.type” “standard error
of the variables”
14 “\(call\)row.w” “weights for the
individuals”
15 “\(call\)col.w” “weights for the
variables”
head(respca2$eig) #como ejemplo
eigenvalue percentage of variance cumulative percentage of variance
comp 1 2.28928229 45.797269 45.79727 comp 2 1.49800421 29.967690 75.76496 comp 3 0.99097042 19.824440 95.58940 comp 4 0.13306482 2.661972 98.25137 comp 5 0.08740923 1.748628 100.00000
library(factoextra)
get_pca(respca2) #Extrae la información sobre las variables.
Principal Component Analysis Results for variables
=================================================== Name
Description
1 “\(coord" "Coordinates for the
variables" 2 "\)cor” “Correlations between variables
and dimensions” 3 “\(cos2" "Cos2 for
the variables" 4 "\)contrib” “contributions of the
variables”
get_pca_var(respca2) #Extrae la información sobre las variables.
Principal Component Analysis Results for variables
=================================================== Name
Description
1 “\(coord" "Coordinates for the
variables" 2 "\)cor” “Correlations between variables
and dimensions” 3 “\(cos2" "Cos2 for
the variables" 4 "\)contrib” “contributions of the
variables”
get_pca_ind(respca2) #Extrae la información sobre las observaciones.
Principal Component Analysis Results for individuals
=================================================== Name
Description
1 “\(coord" "Coordinates for the
individuals" 2 "\)cos2” “Cos2 for the
individuals”
3 “$contrib” “contributions of the individuals”
#visualización
fviz_eig(respca2) #visualizar eigenvalores (scree plot)
fviz_screeplot(respca2) #visualizar eigenvalores (scree plot)
fviz_pca_ind(respca2) #Representación de observaciones sobre componentes principales.
fviz_pca_ind(respca2,
col.ind = "cos2", # Color by the quality of representation
gradient.cols = c("#00AFBB", "#E7B800", "#FC4E07"),
repel = FALSE # Avoid text overlapping
)
fviz_pca_var(respca2) #Representación de variables sobre componentes principales.
fviz_pca_var(respca2,
col.var = "contrib", # Color by contributions to the PC
gradient.cols = c("#00AFBB", "#E7B800", "#FC4E07"),
repel = TRUE # Avoid text overlapping
)
fviz_pca_var(respca2, col.var = "cos2",
geom.var = "arrow",
labelsize = 2,
repel = FALSE)
fviz_contrib(respca2,choice = "var") #Representa la contribución de filas/columnas de los resultados de un pca.
fviz_contrib(respca2,choice = "ind")
biplot(x = respca1, scale = 0, cex = 0.6, col = c("blue4", "brown3"))
fviz_pca_biplot(respca1, repel = FALSE,
col.var = "#2E9FDF", # Variables color
col.ind = "#696969" # Individuals color
)
fviz_pca_biplot(respca1, repel = TRUE,
#geom= "point", #o text o geom=c("point", "text")
col.var = "#2E9FDF", # Variables color
col.ind = "#696969", # Individuals color
select.ind = list(contrib = 30)
)
grupo<-as.factor(xx$Alignment)
#función contraida
ggbiplot <- function(pcobj, choices = 1:2, scale = 1, pc.biplot = TRUE,
obs.scale = 1 - scale, var.scale = scale,
groups = NULL, ellipse = FALSE, ellipse.prob = 0.68,
labels = NULL, labels.size = 3, alpha = 1,
var.axes = TRUE,
circle = FALSE, circle.prob = 0.69,
varname.size = 3, varname.adjust = 1.5,
varname.abbrev = FALSE, ...)
{
library(ggplot2)
library(plyr)
library(scales)
library(grid)
stopifnot(length(choices) == 2)
# Recover the SVD
if(inherits(pcobj, 'prcomp')){
nobs.factor <- sqrt(nrow(pcobj$x) - 1)
d <- pcobj$sdev
u <- sweep(pcobj$x, 2, 1 / (d * nobs.factor), FUN = '*')
v <- pcobj$rotation
} else if(inherits(pcobj, 'princomp')) {
nobs.factor <- sqrt(pcobj$n.obs)
d <- pcobj$sdev
u <- sweep(pcobj$scores, 2, 1 / (d * nobs.factor), FUN = '*')
v <- pcobj$loadings
} else if(inherits(pcobj, 'PCA')) {
nobs.factor <- sqrt(nrow(pcobj$call$X))
d <- unlist(sqrt(pcobj$eig)[1])
u <- sweep(pcobj$ind$coord, 2, 1 / (d * nobs.factor), FUN = '*')
v <- sweep(pcobj$var$coord,2,sqrt(pcobj$eig[1:ncol(pcobj$var$coord),1]),FUN="/")
} else if(inherits(pcobj, "lda")) {
nobs.factor <- sqrt(pcobj$N)
d <- pcobj$svd
u <- predict(pcobj)$x/nobs.factor
v <- pcobj$scaling
d.total <- sum(d^2)
} else {
stop('Expected a object of class prcomp, princomp, PCA, or lda')
}
# Scores
choices <- pmin(choices, ncol(u))
df.u <- as.data.frame(sweep(u[,choices], 2, d[choices]^obs.scale, FUN='*'))
# Directions
v <- sweep(v, 2, d^var.scale, FUN='*')
df.v <- as.data.frame(v[, choices])
names(df.u) <- c('xvar', 'yvar')
names(df.v) <- names(df.u)
if(pc.biplot) {
df.u <- df.u * nobs.factor
}
# Scale the radius of the correlation circle so that it corresponds to
# a data ellipse for the standardized PC scores
r <- sqrt(qchisq(circle.prob, df = 2)) * prod(colMeans(df.u^2))^(1/4)
# Scale directions
v.scale <- rowSums(v^2)
df.v <- r * df.v / sqrt(max(v.scale))
# Change the labels for the axes
if(obs.scale == 0) {
u.axis.labs <- paste('standardized PC', choices, sep='')
} else {
u.axis.labs <- paste('PC', choices, sep='')
}
# Append the proportion of explained variance to the axis labels
u.axis.labs <- paste(u.axis.labs,
sprintf('(%0.1f%% explained var.)',
100 * pcobj$sdev[choices]^2/sum(pcobj$sdev^2)))
# Score Labels
if(!is.null(labels)) {
df.u$labels <- labels
}
# Grouping variable
if(!is.null(groups)) {
df.u$groups <- groups
}
# Variable Names
if(varname.abbrev) {
df.v$varname <- abbreviate(rownames(v))
} else {
df.v$varname <- rownames(v)
}
# Variables for text label placement
df.v$angle <- with(df.v, (180/pi) * atan(yvar / xvar))
df.v$hjust = with(df.v, (1 - varname.adjust * sign(xvar)) / 2)
# Base plot
g <- ggplot(data = df.u, aes(x = xvar, y = yvar)) +
xlab(u.axis.labs[1]) + ylab(u.axis.labs[2]) + coord_equal()
if(var.axes) {
# Draw circle
if(circle)
{
theta <- c(seq(-pi, pi, length = 50), seq(pi, -pi, length = 50))
circle <- data.frame(xvar = r * cos(theta), yvar = r * sin(theta))
g <- g + geom_path(data = circle, color = muted('white'),
size = 1/2, alpha = 1/3)
}
# Draw directions
g <- g +
geom_segment(data = df.v,
aes(x = 0, y = 0, xend = xvar, yend = yvar),
arrow = arrow(length = unit(1/2, 'picas')),
color = muted('red'))
}
# Draw either labels or points
if(!is.null(df.u$labels)) {
if(!is.null(df.u$groups)) {
g <- g + geom_text(aes(label = labels, color = groups),
size = labels.size)
} else {
g <- g + geom_text(aes(label = labels), size = labels.size)
}
} else {
if(!is.null(df.u$groups)) {
g <- g + geom_point(aes(color = groups), alpha = alpha)
} else {
g <- g + geom_point(alpha = alpha)
}
}
# Overlay a concentration ellipse if there are groups
if(!is.null(df.u$groups) && ellipse) {
theta <- c(seq(-pi, pi, length = 50), seq(pi, -pi, length = 50))
circle <- cbind(cos(theta), sin(theta))
ell <- ddply(df.u, 'groups', function(x) {
if(nrow(x) <= 2) {
return(NULL)
}
sigma <- var(cbind(x$xvar, x$yvar))
mu <- c(mean(x$xvar), mean(x$yvar))
ed <- sqrt(qchisq(ellipse.prob, df = 2))
data.frame(sweep(circle %*% chol(sigma) * ed, 2, mu, FUN = '+'),
groups = x$groups[1])
})
names(ell)[1:2] <- c('xvar', 'yvar')
g <- g + geom_path(data = ell, aes(color = groups, group = groups))
}
# Label the variable axes
if(var.axes) {
g <- g +
geom_text(data = df.v,
aes(label = varname, x = xvar, y = yvar,
angle = angle, hjust = hjust),
color = 'darkred', size = varname.size)
}
# Change the name of the legend for groups
# if(!is.null(groups)) {
# g <- g + scale_color_brewer(name = deparse(substitute(groups)),
# palette = 'Dark2')
# }
# TODO: Add a second set of axes
return(g)
}
ggbiplot(respca2)
Dominancia de ciertas formas de tenencia: - Las formas de tenencia categorizadas como 1 y 7 son prominentemente más comunes en varias comunidades étnicas, indicando que estas formas son tradicionales o ampliamente adoptadas. - La categoría étnica 6 muestra una notable diversidad en las formas de tenencia, con una predominancia extrema de la forma 1 (1748 unidades), lo que sugiere una fuerte preferencia o necesidad de esta forma de tenencia dentro de esta comunidad.
Implicaciones de las formas menos comunes: Las formas de tenencia como 9 y 11 en la categoría étnica 6 tienen una presencia considerable, lo que indica que esta comunidad también está abierta a o requiere múltiples formas de tenencia. La categoría 99, especialmente en la categoría étnica 7 con 283 unidades, revela la existencia de formas de tenencia no especificadas o clasificadas como ‘otros’, destacando una potencial área de incertidumbre o diversidad no documentada en las prácticas de tenencia.
Celda (1,12): Descripción: Hay 71 unidades productoras donde la predominancia étnica es 1 y el fenómeno que afectó los pastos sembrados es categorizado como 12. Interpretación: Este número indica una incidencia considerable de un fenómeno específico sobre esta comunidad, que es la más alta reportada para la categoría étnica 1.
Celda (2,12): Descripción: Hay 96 unidades productoras donde la predominancia étnica es 2 y el fenómeno que afectó los pastos sembrados es 12. Interpretación: Este valor es significativamente alto para la categoría étnica 2, lo que sugiere que este fenómeno es un problema recurrente y notable para esta comunidad.
Celda (6,12): Descripción: Hay 1721 unidades productoras donde la predominancia étnica es 6 y el fenómeno que afectó los pastos sembrados es 12. Interpretación: Esta es la incidencia más alta registrada en toda la tabla y resalta la severidad del impacto de este fenómeno en la comunidad de la categoría étnica 6. La magnitud sugiere una vulnerabilidad extrema a este fenómeno específico, marcando una urgencia en la necesidad de intervención y apoyo.
Celda (7,12): Descripción: Hay 417 unidades productoras donde la predominancia étnica es 7 y el fenómeno que afectó los pastos sembrados es 12. Interpretación: Aunque menor que en la categoría étnica 6, este número sigue siendo significativamente alto, indicando que el fenómeno 12 también es un problema crítico para esta comunidad.
Predominancia Étnica 1: Ausencia de Pastos (1): 0 unidades, lo que indica que todas las unidades productoras en esta categoría tienen pastos o sabanas naturales. Presencia de Pastos (2): 78 unidades, mostrando que este grupo étnico mantiene consistentemente pastos o sabanas naturales.
Predominancia Étnica 2: Ausencia de Pastos (1): 10 unidades, una pequeña proporción en comparación con las unidades que tienen pastos. Presencia de Pastos (2): 108 unidades, indicando que la mayoría de las unidades en esta categoría étnica disponen de pastos o sabanas naturales.
Predominancia Étnica 6: Ausencia de Pastos (1): 338 unidades, una cantidad significativa, pero aún menor que aquellas con presencia de pastos. Presencia de Pastos (2): 2143 unidades, evidenciando que la gran mayoría de las unidades bajo esta predominancia étnica cuentan con extensas áreas de pastos o sabanas naturales.
Predominancia Étnica 7: Ausencia de Pastos (1): 120 unidades, lo que sugiere una presencia notable de unidades sin pastos o sabanas naturales. Presencia de Pastos (2): 518 unidades, demostrando que, aunque muchos no tienen pastos, una mayoría significativa sí los posee.
Predominancia del fenómeno 12: Categoría de Tenencia 1: Con 1481 incidentes, este fenómeno es abrumadoramente el más común, sugiriendo una alta vulnerabilidad de estas unidades a este fenómeno específico. Generalmente Dominante: El fenómeno 12 es el más reportado en casi todas las categorías de tenencia, indicando su prevalencia y posible severidad en la región.
Alta incidencia en tenencia 1: Además del fenómeno 12, la tenencia 1 muestra altas incidencias en otros fenómenos como el 2 (242 incidentes) y el 6 (178 incidentes), lo que refleja una diversidad de desafíos ambientales que enfrentan estas unidades.
Incidencias moderadas en otras formas de tenencia: Tenencia 2 y 11: Muestran incidencias relativamente altas en el fenómeno 12 (186 y 204 incidentes, respectivamente), destacando también como formas de tenencia significativamente afectadas. Diversidad de Fenómenos: Además del fenómeno 12, estas categorías también muestran incidencias moderadas en fenómenos como el 2 y el 6, lo que puede indicar problemas ambientales comunes pero variados.
Menor impacto en tenencias menos comunes: Categorías de Tenencia 3 a 9: Estas formas de tenencia registran números mucho menores en todos los fenómenos, lo que podría indicar menor actividad agrícola o mejor resiliencia a los fenómenos, dependiendo de su naturaleza específica.
Predominio de pastos naturales: la presencia de pastos o sabanas naturales es más común que su ausencia en casi todas las formas de tenencia examinadas. Esto sugiere que la mayoría de las unidades productoras están en áreas donde estos recursos naturales se mantienen o se conservan.
Formas de tenencia destacadas: tenencia 1 (Propietarios Tradicionales) muestra la mayor cantidad de unidades con pastos o sabanas naturales (1826 unidades), lo que indica que esta forma de tenencia favorece o coexiste positivamente con el mantenimiento de recursos naturales. Tenencia 11 (Posesión Colectiva/Comunal) también muestra una alta proporción de pastos o sabanas naturales (266 unidades), lo que refleja prácticas de gestión colectiva o comunal que posiblemente promuevan la conservación.
Menor presencia en algunas formas: las tenencias que involucran gestión institucional o uso temporal (como las tenencias 3, 4 y 5) muestran cifras más bajas de pastos naturales, aunque la mayoría aún mantiene estos recursos.
Análisis general: La tabla muestra claramente que la presencia de pastos o sabanas naturales (columna 2) es predominantemente más alta en casi todos los fenómenos comparada con su ausencia (columna 1), lo que indica que estos fenómenos tienden a ocurrir más frecuentemente en áreas donde existen pastos o sabanas naturales.
Fenómenos destacados: Fenómeno 12 (Sequía o Inundaciones Potencialmente): con 310 incidentes registrados donde no hay pastos o sabanas naturales y 1995 donde sí los hay, este fenómeno claramente domina la tabla, sugiriendo que es un fenómeno extenso y probablemente el más impactante, afectando considerablemente las áreas con pastos naturales. Fenómeno 2 (Posibles Enfermedades o Plagas): muestra 70 incidentes en ausencia de pastos y 291 en su presencia, destacando también como un fenómeno significativo que afecta a zonas con vegetación natural.
Otras observaciones relevantes: Menor impacto en áreas sin pastos: fenómenos como el 1, 9, y 99 tienen una presencia mucho menor en general, pero sigue siendo notable que incluso estos fenómenos menos frecuentes ocurren más en áreas con pastos naturales. Presencia moderada de otros fenómenos: fenómenos como el 6 y 8, que representan 22 y 8 incidentes en ausencia de pastos contra 234 y 70 en su presencia, respectivamente, indican una distribución moderada y subrayan la vulnerabilidad de las áreas con vegetación natural a diversos eventos ambientales.
Tabla Valor_P Chi_Cuadrado Grados_de_Libertad
1 Tabla 1 0.000000e+00 2663.31766 30 2 Tabla 2 6.520335e-07 92.83337 36 3 Tabla 3 3.630808e-06 28.00070 3 4 Tabla 4 8.145177e-08 219.43143 120 5 Tabla 5 7.946942e-03 23.87220 10 6 Tabla 6 5.376662e-05 40.75872 12
Tabla 1 Valor P: 0.000000e+00 Chi Cuadrado: 2663.31766 Grados de Libertad: 30 Interpretación: El valor P es extremadamente bajo (cero para todos los efectos prácticos), lo que indica un rechazo fuerte de la hipótesis nula de independencia. El alto valor de Chi Cuadrado refuerza la evidencia de una asociación significativa entre las variables en esta tabla.
Tabla 2 Valor P: 6.520335e-07 Chi Cuadrado: 92.83337 Grados de Libertad: 36 Interpretación: Al igual que en la Tabla 1, el valor P muy bajo sugiere que hay una diferencia significativa entre los datos observados y los esperados, indicando dependencia entre las variables.
Tabla 3 Valor P: 3.630808e-06 Chi Cuadrado: 28.00070 Grados de Libertad: 3 Interpretación: A pesar de tener menos grados de libertad, el valor de Chi Cuadrado sigue siendo significativamente alto dado el bajo valor P, sugiriendo fuertes evidencias contra la hipótesis nula.
Tabla 4 Valor P: 8.145177e-08 Chi Cuadrado: 219.43143 Grados de Libertad: 120 Interpretación: Este resultado también apoya una relación estadísticamente significativa entre las variables. El alto número de grados de libertad y el alto valor de Chi Cuadrado indican una fuerte evidencia de dependencia.
Tabla 5 Valor P: 7.946942e-03 Chi Cuadrado: 23.87220 Grados de Libertad: 10 Interpretación: Aquí, el valor P es mayor que en los casos anteriores pero sigue siendo menor que 0.01, lo que todavía sugiere una asociación significativa, aunque menos fuerte que en las tablas anteriores.
Tabla 6 Valor P: 5.376662e-05 Chi Cuadrado: 40.75872 Grados de Libertad: 12 Interpretación: Similar a la Tabla 5, este resultado muestra evidencia significativa de una relación entre las variables, con un valor P suficientemente bajo para rechazar la hipótesis nula de independencia.
Análisis de las tablas de Contingencia
Tabla 1: Valores esperados: Varias celdas tienen valores esperados menores a 5. Porcentaje de celdas menores a 5: 43.18%. Esto es problemático porque supera el 20%, indicando que la aproximación chi-cuadrado podría no ser precisa. Valor P: 0, lo que indica una asociación estadísticamente significativa entre las variables. Sin embargo, la confiabilidad de este resultado está comprometida por el alto porcentaje de celdas con bajos valores esperados.
Tabla 2: Valores esperados: Similar a la tabla 1, muchos valores esperados son menores a 5. Porcentaje de celdas menores a 5: 48.08%, también excediendo el umbral del 20%. Valor P: Muy pequeño (aproximadamente 0.000000652), sugiriendo una asociación significativa bajo la prueba chi-cuadrado, aunque la fiabilidad de este resultado es dudosa debido al mismo problema que la tabla 1.
Tabla 3: Valores esperados: Todos los valores esperados son mayores a 5. Porcentaje de celdas menores a 5: 0%, cumpliendo con las condiciones para una aproximación chi-cuadrado adecuada. Valor P: Extremadamente pequeño (aproximadamente 0.000003631), indicando una fuerte asociación significativa entre las variables con una aproximación estadísticamente robusta.
Tabla 4: Valores esperados: Un alto número de celdas con valores esperados menores a 5. Porcentaje de celdas menores a 5: 72.73%, significativamente más alto que el umbral del 20%. Valor P: Muy pequeño (aproximadamente 0.0000000815), pero la confiabilidad de este resultado está en duda debido al alto porcentaje de valores esperados bajos.
Tabla 5: Valores esperados: Algunas celdas tienen valores esperados menores a 5. Porcentaje de celdas menores a 5: 22.73%, ligeramente por encima del límite del 20%. Valor P: 0.007946942, indicativo de una asociación estadísticamente significativa pero con preocupaciones sobre la precisión de la prueba.
Tabla 6: Valores esperados: Algunas celdas tienen valores esperados menores a 5. Porcentaje de celdas menores a 5: 19.23%, justo por debajo del umbral del 20%. Valor P: Muy pequeño (aproximadamente 0.000053767), sugiriendo una asociación significativa y la prueba es considerada válida.
dat_cat_mca<- readRDS("D:/practica4/multiva/data1/output/dat_cat_mca.rds")
str(dat_cat_mca)
List of 5 $ eig : num [1:26, 1:3] 0.427 0.412 0.285 0.281 0.275 … ..- attr(, “dimnames”)=List of 2 .. ..$ : chr [1:26] “dim 1” “dim 2” “dim 3” “dim 4” … .. ..$ : chr [1:3] “eigenvalue” “percentage of variance” “cumulative percentage of variance” $ call:List of 10 ..$ X :‘data.frame’: 3315 obs. of 4 variables: .. ..$ Predominancia_etnica_de_la_unidad : Factor w/ 4 levels “Predominancia_etnica_de_la_unidad_1”,..: 4 4 4 4 3 3 3 3 3 3 … .. ..$ Tenencia_en_la_Unidad_productora : Factor w/ 11 levels “Tenencia_en_la_Unidad_productora_1”,..: 1 1 1 2 1 1 9 1 1 2 … .. ..$ Fenomeno_que_afecto_los_pastos_sembrados: Factor w/ 13 levels “Fenomeno_que_afecto_los_pastos_sembrados_1”,..: 12 1 12 12 12 12 1 12 12 6 … .. ..$ Existen_pastos_o_sabanas_naturales : Factor w/ 2 levels “Existen_pastos_o_sabanas_naturales_1”,..: 1 2 1 1 2 2 2 2 2 1 … ..$ marge.col: Named num [1:30] 0.00588 0.0089 0.1871 0.04811 0.16237 … .. ..- attr(, “names”)= chr [1:30] “Predominancia_etnica_de_la_unidad_1” “Predominancia_etnica_de_la_unidad_2” “Predominancia_etnica_de_la_unidad_6” “Predominancia_etnica_de_la_unidad_7” … ..$ marge.row: Named num [1:3315] 0.000302 0.000302 0.000302 0.000302 0.000302 … .. ..- attr(, “names”)= chr [1:3315] “1” “3” “12” “13” … ..$ ncp : num 5 ..$ row.w : num [1:3315] 1 1 1 1 1 1 1 1 1 1 … ..$ excl : NULL ..$ call : language MCA(X = matriz_datoscat_df, graph = FALSE) ..$ Xtot :‘data.frame’: 3315 obs. of 30 variables: .. ..$ Predominancia_etnica_de_la_unidad_1 : int [1:3315] 0 0 0 0 0 0 0 0 0 0 … .. ..$ Predominancia_etnica_de_la_unidad_2 : int [1:3315] 0 0 0 0 0 0 0 0 0 0 … .. ..$ Predominancia_etnica_de_la_unidad_6 : int [1:3315] 0 0 0 0 1 1 1 1 1 1 … .. ..$ Predominancia_etnica_de_la_unidad_7 : int [1:3315] 1 1 1 1 0 0 0 0 0 0 … .. ..$ Tenencia_en_la_Unidad_productora_1 : int [1:3315] 1 1 1 0 1 1 0 1 1 0 … .. ..$ Tenencia_en_la_Unidad_productora_2 : int [1:3315] 0 0 0 1 0 0 0 0 0 1 … .. ..$ Tenencia_en_la_Unidad_productora_3 : int [1:3315] 0 0 0 0 0 0 0 0 0 0 … .. ..$ Tenencia_en_la_Unidad_productora_4 : int [1:3315] 0 0 0 0 0 0 0 0 0 0 … .. ..$ Tenencia_en_la_Unidad_productora_5 : int [1:3315] 0 0 0 0 0 0 0 0 0 0 … .. ..$ Tenencia_en_la_Unidad_productora_6 : int [1:3315] 0 0 0 0 0 0 0 0 0 0 … .. ..$ Tenencia_en_la_Unidad_productora_7 : int [1:3315] 0 0 0 0 0 0 0 0 0 0 … .. ..$ Tenencia_en_la_Unidad_productora_8 : int [1:3315] 0 0 0 0 0 0 0 0 0 0 … .. ..$ Tenencia_en_la_Unidad_productora_9 : int [1:3315] 0 0 0 0 0 0 1 0 0 0 … .. ..$ Tenencia_en_la_Unidad_productora_11 : int [1:3315] 0 0 0 0 0 0 0 0 0 0 … .. ..$ Tenencia_en_la_Unidad_productora_99 : int [1:3315] 0 0 0 0 0 0 0 0 0 0 … .. ..$ Fenomeno_que_afecto_los_pastos_sembrados_1 : int [1:3315] 0 1 0 0 0 0 1 0 0 0 … .. ..$ Fenomeno_que_afecto_los_pastos_sembrados_2 : int [1:3315] 0 0 0 0 0 0 0 0 0 0 … .. ..$ Fenomeno_que_afecto_los_pastos_sembrados_3 : int [1:3315] 0 0 0 0 0 0 0 0 0 0 … .. ..$ Fenomeno_que_afecto_los_pastos_sembrados_4 : int [1:3315] 0 0 0 0 0 0 0 0 0 0 … .. ..$ Fenomeno_que_afecto_los_pastos_sembrados_5 : int [1:3315] 0 0 0 0 0 0 0 0 0 0 … .. ..$ Fenomeno_que_afecto_los_pastos_sembrados_6 : int [1:3315] 0 0 0 0 0 0 0 0 0 1 … .. ..$ Fenomeno_que_afecto_los_pastos_sembrados_7 : int [1:3315] 0 0 0 0 0 0 0 0 0 0 … .. ..$ Fenomeno_que_afecto_los_pastos_sembrados_8 : int [1:3315] 0 0 0 0 0 0 0 0 0 0 … .. ..$ Fenomeno_que_afecto_los_pastos_sembrados_9 : int [1:3315] 0 0 0 0 0 0 0 0 0 0 … .. ..$ Fenomeno_que_afecto_los_pastos_sembrados_10: int [1:3315] 0 0 0 0 0 0 0 0 0 0 … .. ..$ Fenomeno_que_afecto_los_pastos_sembrados_11: int [1:3315] 0 0 0 0 0 0 0 0 0 0 … .. ..$ Fenomeno_que_afecto_los_pastos_sembrados_12: int [1:3315] 1 0 1 1 1 1 0 1 1 0 … .. ..$ Fenomeno_que_afecto_los_pastos_sembrados_99: int [1:3315] 0 0 0 0 0 0 0 0 0 0 … .. ..$ Existen_pastos_o_sabanas_naturales_1 : int [1:3315] 1 0 1 1 0 0 0 0 0 1 … .. ..$ Existen_pastos_o_sabanas_naturales_2 : int [1:3315] 0 1 0 0 1 1 1 1 1 0 … ..$ N : num 13260 ..$ quali : int [1:4] 1 2 3 4 $ ind :List of 3 ..$ coord : num [1:3315, 1:5] 0.656 0.549 0.656 0.626 -0.166 … .. ..- attr(, “dimnames”)=List of 2 .. .. ..$ : chr [1:3315] “1” “3” “12” “13” … .. .. ..$ : chr [1:5] “Dim 1” “Dim 2” “Dim 3” “Dim 4” … ..$ contrib: num [1:3315, 1:5] 0.03041 0.02128 0.03041 0.02762 0.00195 … .. ..- attr(, “dimnames”)=List of 2 .. .. ..$ : chr [1:3315] “1” “3” “12” “13” … .. .. ..$ : chr [1:5] “Dim 1” “Dim 2” “Dim 3” “Dim 4” … ..$ cos2 : num [1:3315, 1:5] 0.1531 0.0126 0.1531 0.071 0.0746 … .. ..- attr(, “dimnames”)=List of 2 .. .. ..$ : chr [1:3315] “1” “3” “12” “13” … .. .. ..$ : chr [1:5] “Dim 1” “Dim 2” “Dim 3” “Dim 4” … $ var :List of 5 ..$ coord : num [1:30, 1:5] -3.7307 -1.3225 -0.1754 1.3826 -0.0626 … .. ..- attr(, “dimnames”)=List of 2 .. .. ..$ : chr [1:30] “Predominancia_etnica_de_la_unidad_1” “Predominancia_etnica_de_la_unidad_2” “Predominancia_etnica_de_la_unidad_6” “Predominancia_etnica_de_la_unidad_7” … .. .. ..$ : chr [1:5] “Dim 1” “Dim 2” “Dim 3” “Dim 4” … ..$ contrib: num [1:30, 1:5] 19.156 3.642 1.346 21.521 0.149 … .. ..- attr(, “dimnames”)=List of 2 .. .. ..$ : chr [1:30] “Predominancia_etnica_de_la_unidad_1” “Predominancia_etnica_de_la_unidad_2” “Predominancia_etnica_de_la_unidad_6” “Predominancia_etnica_de_la_unidad_7” … .. .. ..$ : chr [1:5] “Dim 1” “Dim 2” “Dim 3” “Dim 4” … ..$ cos2 : num [1:30, 1:5] 0.33537 0.06456 0.09148 0.4556 0.00725 … .. ..- attr(, “dimnames”)=List of 2 .. .. ..$ : chr [1:30] “Predominancia_etnica_de_la_unidad_1” “Predominancia_etnica_de_la_unidad_2” “Predominancia_etnica_de_la_unidad_6” “Predominancia_etnica_de_la_unidad_7” … .. .. ..$ : chr [1:5] “Dim 1” “Dim 2” “Dim 3” “Dim 4” … ..$ v.test : num [1:30, 1:5] -33.3 -14.6 -17.4 38.9 -4.9 … .. ..- attr(, “dimnames”)=List of 2 .. .. ..$ : chr [1:30] “Predominancia_etnica_de_la_unidad_1” “Predominancia_etnica_de_la_unidad_2” “Predominancia_etnica_de_la_unidad_6” “Predominancia_etnica_de_la_unidad_7” … .. .. ..$ : chr [1:5] “Dim 1” “Dim 2” “Dim 3” “Dim 4” … ..$ eta2 : num [1:4, 1:5] 0.7807 0.7741 0.1123 0.0426 0.7771 … .. ..- attr(, “dimnames”)=List of 2 .. .. ..$ : chr [1:4] “Predominancia_etnica_de_la_unidad” “Tenencia_en_la_Unidad_productora” “Fenomeno_que_afecto_los_pastos_sembrados” “Existen_pastos_o_sabanas_naturales” .. .. ..$ : chr [1:5] “Dim 1” “Dim 2” “Dim 3” “Dim 4” … $ svd :List of 3 ..$ vs: num [1:30] 0.654 0.642 0.533 0.53 0.524 … ..$ U : num [1:3315, 1:5] 1.004 0.84 1.004 0.957 -0.254 … ..$ V : num [1:30, 1:5] -5.7065 -2.023 -0.2682 2.1149 -0.0957 … - attr(, “class”)= chr [1:2] “MCA” “list”
eigenval<- readRDS("D:/practica4/multiva/data1/output/eigenval.rds")
str(eigenval)
num [1:26, 1:3] 0.427 0.412 0.285 0.281 0.275 … - attr(*, “dimnames”)=List of 2 ..$ : chr [1:26] “Dim.1” “Dim.2” “Dim.3” “Dim.4” … ..$ : chr [1:3] “eigenvalue” “variance.percent” “cumulative.variance.percent”
fviz_screeplot(dat_cat_mca, addlabels = TRUE, ylim = c(0, 15)) + geom_hline(yintercept = 7.14, linetype = 2, color = "red")
# Biplot
fviz_mca_biplot(dat_cat_mca, repel = TRUE,
ggtheme = theme_grey())+labs(
title =" Representación de las categorías")
var<- readRDS("D:/practica4/multiva/data1/output/var.rds")
str(var)
List of 5 $ coord : num [1:30, 1:5] -3.7307 -1.3225 -0.1754 1.3826
-0.0626 … ..- attr(, “dimnames”)=List of 2 .. ..$ : chr [1:30]
“Predominancia_etnica_de_la_unidad_1”
“Predominancia_etnica_de_la_unidad_2”
“Predominancia_etnica_de_la_unidad_6”
“Predominancia_etnica_de_la_unidad_7” … .. ..$ : chr [1:5] “Dim 1” “Dim
2” “Dim 3” “Dim 4” … $ contrib: num [1:30, 1:5] 19.156 3.642 1.346
21.521 0.149 … ..- attr(, “dimnames”)=List of 2 .. ..$ : chr [1:30]
“Predominancia_etnica_de_la_unidad_1”
“Predominancia_etnica_de_la_unidad_2”
“Predominancia_etnica_de_la_unidad_6”
“Predominancia_etnica_de_la_unidad_7” … .. ..$ : chr [1:5] “Dim 1” “Dim
2” “Dim 3” “Dim 4” … $ cos2 : num [1:30, 1:5] 0.33537 0.06456 0.09148
0.4556 0.00725 … ..- attr(, “dimnames”)=List of 2 .. ..$ : chr
[1:30] “Predominancia_etnica_de_la_unidad_1”
“Predominancia_etnica_de_la_unidad_2”
“Predominancia_etnica_de_la_unidad_6”
“Predominancia_etnica_de_la_unidad_7” … .. ..$ : chr [1:5] “Dim 1” “Dim
2” “Dim 3” “Dim 4” … $ v.test : num [1:30, 1:5] -33.3 -14.6 -17.4 38.9
-4.9 … ..- attr(, “dimnames”)=List of 2 .. ..$ : chr [1:30]
“Predominancia_etnica_de_la_unidad_1”
“Predominancia_etnica_de_la_unidad_2”
“Predominancia_etnica_de_la_unidad_6”
“Predominancia_etnica_de_la_unidad_7” … .. ..$ : chr [1:5] “Dim 1” “Dim
2” “Dim 3” “Dim 4” … $ eta2 : num [1:4, 1:5] 0.7807 0.7741 0.1123 0.0426
0.7771 … ..- attr(, “dimnames”)=List of 2 .. ..$ : chr [1:4]
“Predominancia_etnica_de_la_unidad” “Tenencia_en_la_Unidad_productora”
“Fenomeno_que_afecto_los_pastos_sembrados”
“Existen_pastos_o_sabanas_naturales” .. ..$ : chr [1:5] “Dim 1” “Dim 2”
“Dim 3” “Dim 4” … - attr(, “class”)= chr [1:3] “factoextra” “mca”
“mca_var” - attr(*, “element”)= chr “variables”
| Dim 1 | Dim 2 | Dim 3 | Dim 4 | Dim 5 | |
|---|---|---|---|---|---|
| Predominancia_etnica_de_la_unidad_1 | -3.73 | 3.65 | 1.74 | 0.82 | 0.04 |
| Predominancia_etnica_de_la_unidad_2 | -1.32 | 1.11 | -2.75 | -0.62 | 1.39 |
| Predominancia_etnica_de_la_unidad_6 | -0.18 | -0.47 | 0.08 | 0 | -0.04 |
| Predominancia_etnica_de_la_unidad_7 | 1.38 | 1.16 | 0 | 0.01 | -0.09 |
| Tenencia_en_la_Unidad_productora_1 | -0.06 | -0.22 | -0.16 | -0.02 | 0.15 |
| Tenencia_en_la_Unidad_productora_2 | -0.14 | -0.57 | 0.6 | -0.36 | 0.04 |
| Tenencia_en_la_Unidad_productora_3 | 0.02 | -0.69 | 2.58 | -0.09 | 3.86 |
| Tenencia_en_la_Unidad_productora_4 | -0.47 | -0.62 | -0.77 | -2.01 | -2.94 |
| Tenencia_en_la_Unidad_productora_5 | 0.15 | -0.29 | 0.9 | -0.86 | -1.64 |
| Tenencia_en_la_Unidad_productora_6 | 0.03 | 0.33 | -4.83 | 0.95 | 1.62 |
| Tenencia_en_la_Unidad_productora_7 | -3.59 | 3.47 | 0.55 | 0.42 | 0.47 |
| Tenencia_en_la_Unidad_productora_8 | 0.06 | -1.15 | -3.5 | 21.69 | -5.62 |
| Tenencia_en_la_Unidad_productora_9 | -0.25 | -0.46 | 0.06 | -0.23 | -2.31 |
| Tenencia_en_la_Unidad_productora_11 | -0.12 | -0.61 | 0.8 | 0.4 | -0.26 |
| Tenencia_en_la_Unidad_productora_99 | 2.1 | 1.93 | 0.12 | -0.16 | -0.4 |
| Dim 1 | Dim 2 | Dim 3 | |
|---|---|---|---|
| Predominancia_etnica_de_la_unidad_1 | 0.3354 | 0.3203 | 0.07334 |
| Predominancia_etnica_de_la_unidad_2 | 0.06456 | 0.04557 | 0.2793 |
| Predominancia_etnica_de_la_unidad_6 | 0.09148 | 0.6443 | 0.01684 |
| Predominancia_etnica_de_la_unidad_7 | 0.4556 | 0.3198 | 2.027e-06 |
| Tenencia_en_la_Unidad_productora_1 | 0.007253 | 0.0929 | 0.05007 |
| Tenencia_en_la_Unidad_productora_2 | 0.001814 | 0.02908 | 0.03163 |
| Tenencia_en_la_Unidad_productora_3 | 2.022e-06 | 0.003012 | 0.04242 |
| Tenencia_en_la_Unidad_productora_4 | 0.001204 | 0.002106 | 0.003244 |
| Tenencia_en_la_Unidad_productora_5 | 7.934e-05 | 0.0003083 | 0.002933 |
| Tenencia_en_la_Unidad_productora_6 | 7.674e-06 | 0.001295 | 0.2782 |
| Tenencia_en_la_Unidad_productora_7 | 0.3976 | 0.3715 | 0.009251 |
| Tenencia_en_la_Unidad_productora_8 | 3.39e-06 | 0.001206 | 0.01109 |
| Tenencia_en_la_Unidad_productora_9 | 0.002047 | 0.007303 | 0.0001042 |
| Tenencia_en_la_Unidad_productora_11 | 0.001553 | 0.03774 | 0.06519 |
| Tenencia_en_la_Unidad_productora_99 | 0.4152 | 0.3496 | 0.001437 |
| Dim 4 | Dim 5 | |
|---|---|---|
| Predominancia_etnica_de_la_unidad_1 | 0.01614 | 3.011e-05 |
| Predominancia_etnica_de_la_unidad_2 | 0.01417 | 0.07133 |
| Predominancia_etnica_de_la_unidad_6 | 1.067e-05 | 0.005987 |
| Predominancia_etnica_de_la_unidad_7 | 1.237e-05 | 0.001803 |
| Tenencia_en_la_Unidad_productora_1 | 0.00103 | 0.04432 |
| Tenencia_en_la_Unidad_productora_2 | 0.01149 | 0.0001582 |
| Tenencia_en_la_Unidad_productora_3 | 5.748e-05 | 0.09486 |
| Tenencia_en_la_Unidad_productora_4 | 0.02199 | 0.04731 |
| Tenencia_en_la_Unidad_productora_5 | 0.00266 | 0.009726 |
| Tenencia_en_la_Unidad_productora_6 | 0.01076 | 0.03106 |
| Tenencia_en_la_Unidad_productora_7 | 0.005302 | 0.006918 |
| Tenencia_en_la_Unidad_productora_8 | 0.426 | 0.02859 |
| Tenencia_en_la_Unidad_productora_9 | 0.001767 | 0.1814 |
| Tenencia_en_la_Unidad_productora_11 | 0.01637 | 0.00709 |
| Tenencia_en_la_Unidad_productora_99 | 0.002363 | 0.01482 |
| Dim 1 | Dim 2 | Dim 3 | |
|---|---|---|---|
| Predominancia_etnica_de_la_unidad_1 | 0.3354 | 0.3203 | 0.07334 |
| Predominancia_etnica_de_la_unidad_2 | 0.06456 | 0.04557 | 0.2793 |
| Predominancia_etnica_de_la_unidad_6 | 0.09148 | 0.6443 | 0.01684 |
| Predominancia_etnica_de_la_unidad_7 | 0.4556 | 0.3198 | 2.027e-06 |
| Tenencia_en_la_Unidad_productora_1 | 0.007253 | 0.0929 | 0.05007 |
| Tenencia_en_la_Unidad_productora_2 | 0.001814 | 0.02908 | 0.03163 |
| Tenencia_en_la_Unidad_productora_3 | 2.022e-06 | 0.003012 | 0.04242 |
| Tenencia_en_la_Unidad_productora_4 | 0.001204 | 0.002106 | 0.003244 |
| Tenencia_en_la_Unidad_productora_5 | 7.934e-05 | 0.0003083 | 0.002933 |
| Tenencia_en_la_Unidad_productora_6 | 7.674e-06 | 0.001295 | 0.2782 |
| Tenencia_en_la_Unidad_productora_7 | 0.3976 | 0.3715 | 0.009251 |
| Tenencia_en_la_Unidad_productora_8 | 3.39e-06 | 0.001206 | 0.01109 |
| Tenencia_en_la_Unidad_productora_9 | 0.002047 | 0.007303 | 0.0001042 |
| Tenencia_en_la_Unidad_productora_11 | 0.001553 | 0.03774 | 0.06519 |
| Tenencia_en_la_Unidad_productora_99 | 0.4152 | 0.3496 | 0.001437 |
| Dim 4 | Dim 5 | |
|---|---|---|
| Predominancia_etnica_de_la_unidad_1 | 0.01614 | 3.011e-05 |
| Predominancia_etnica_de_la_unidad_2 | 0.01417 | 0.07133 |
| Predominancia_etnica_de_la_unidad_6 | 1.067e-05 | 0.005987 |
| Predominancia_etnica_de_la_unidad_7 | 1.237e-05 | 0.001803 |
| Tenencia_en_la_Unidad_productora_1 | 0.00103 | 0.04432 |
| Tenencia_en_la_Unidad_productora_2 | 0.01149 | 0.0001582 |
| Tenencia_en_la_Unidad_productora_3 | 5.748e-05 | 0.09486 |
| Tenencia_en_la_Unidad_productora_4 | 0.02199 | 0.04731 |
| Tenencia_en_la_Unidad_productora_5 | 0.00266 | 0.009726 |
| Tenencia_en_la_Unidad_productora_6 | 0.01076 | 0.03106 |
| Tenencia_en_la_Unidad_productora_7 | 0.005302 | 0.006918 |
| Tenencia_en_la_Unidad_productora_8 | 0.426 | 0.02859 |
| Tenencia_en_la_Unidad_productora_9 | 0.001767 | 0.1814 |
| Tenencia_en_la_Unidad_productora_11 | 0.01637 | 0.00709 |
| Tenencia_en_la_Unidad_productora_99 | 0.002363 | 0.01482 |
# ver un análisis del cos2 con más de dos dimensiones:
corrplot(var$cos2, is.corr = FALSE)
# La contribución de las categorías de las variables (en %) a la definición de las dimensiones puede ser extraída como
pander(head(round(var$contrib,2), 15))
| Dim 1 | Dim 2 | Dim 3 | Dim 4 | Dim 5 | |
|---|---|---|---|---|---|
| Predominancia_etnica_de_la_unidad_1 | 19.16 | 18.98 | 6.29 | 1.4 | 0 |
| Predominancia_etnica_de_la_unidad_2 | 3.64 | 2.67 | 23.67 | 1.22 | 6.25 |
| Predominancia_etnica_de_la_unidad_6 | 1.35 | 9.84 | 0.37 | 0 | 0.14 |
| Predominancia_etnica_de_la_unidad_7 | 21.52 | 15.68 | 0 | 0 | 0.13 |
| Tenencia_en_la_Unidad_productora_1 | 0.15 | 1.98 | 1.54 | 0.03 | 1.41 |
| Tenencia_en_la_Unidad_productora_2 | 0.1 | 1.62 | 2.55 | 0.94 | 0.01 |
| Tenencia_en_la_Unidad_productora_3 | 0 | 0.18 | 3.7 | 0.01 | 8.57 |
| Tenencia_en_la_Unidad_productora_4 | 0.07 | 0.13 | 0.28 | 1.95 | 4.28 |
| Tenencia_en_la_Unidad_productora_5 | 0 | 0.02 | 0.26 | 0.24 | 0.88 |
| Tenencia_en_la_Unidad_productora_6 | 0 | 0.08 | 24.16 | 0.95 | 2.79 |
| Tenencia_en_la_Unidad_productora_7 | 22.56 | 21.87 | 0.79 | 0.46 | 0.61 |
| Tenencia_en_la_Unidad_productora_8 | 0 | 0.07 | 0.97 | 37.89 | 2.6 |
| Tenencia_en_la_Unidad_productora_9 | 0.12 | 0.43 | 0.01 | 0.15 | 15.95 |
| Tenencia_en_la_Unidad_productora_11 | 0.08 | 2.08 | 5.2 | 1.32 | 0.58 |
| Tenencia_en_la_Unidad_productora_99 | 22.2 | 19.39 | 0.12 | 0.19 | 1.23 |
# Las categorías de las variables con el mayor valor contribuyen más a la definición
# de las dimensiones, y, así mismo, las que contribuyen mas a la dimensión 1 y 2 son las más importantes en
# explicar la variabilidad de los datos.
# Gráficamente:
fviz_contrib(dat_cat_mca, choice = "var", axes = 1, top = 15)+labs(title = "Contribución de las Categorías para las Dimensión 1")
# Dimensión 2
fviz_contrib(dat_cat_mca, choice = "var", axes = 2, top = 15)+labs(title = " Contribución de las Categorías para las Dimensión 2")
# Dimensión 1-2
fviz_contrib(dat_cat_mca, choice = "var", axes = 1:2, top = 15)+labs(title = " Contribuciones de las Categorías para las Dimensiónes 1-2")
# dipersión 1-2
fviz_mca_var(dat_cat_mca, col.var = "contrib",
gradient.cols = c("#00AFBB", "#E7B800","#FC4E07"),
ggtheme = theme_grey()
, repel = TRUE)