En la primera etapa del estudio, se realizará un análisis descriptivo multivariante del conjunto de datos correspondiente a asociaciones de productores agropecuarios del departamento de Boyacá. Este análisis se abordará desde una perspectiva de estadística descriptiva multivariante, la cual permite obtener una visión general de los datos y comprender las relaciones existentes entre las diferentes variables involucradas.El enfoque estadístico permitira identificar patrones, tendencias y comportamientos comunes entre las asociaciones por otro lado las visualizaciones jugarán un papel clave en la interpretación, al brindar una forma clara y accesible de explorar los datos, facilitando la identificación de asociaciones relevantes y posibles interacciones entre las variables. De esta manera, se busca generar una base sólida para las fases posteriores, en las que se aplicarán técnicas inferenciales y multivariantes más avanzadas.
El conjunto de datos fue obtenido de la plataforma oficial Datos Abiertos del Gobierno de Colombia (datos.gov.co), el cual es el Portal nacional de datos abiertos de Colombia, donde las entidades públicas pueden publicar información útil para la ciudadanía, el sector privado y la academia. Este portal promueve la transparencia, la eficiencia y la eficacia de los servicios públicos, permitiendo a los ciudadanos acceder, usar y compartir información pública de manera libre y sin restricciones legales, por tanto garantiza la validez y confiabilidad de la información utilizada para el presente estudio.
El desarrollo del presente proyecto se relaciona con diversas áreas de conocimiento propias de la Ingeniería Industrial, principalmente aquellas orientadas al análisis, la optimización y la gestión de procesos. En primer lugar, se vincula con 2. Operations Research & Analysis (Investigación y análisis de operaciones), dado que emplea herramientas estadísticas y de análisis multivariado para estudiar las asociaciones agropecuarias y sus variables productivas. Asimismo, se relaciona con 3. Engineering Economic Analysis (Análisis económico de ingeniería), al considerar la evaluación de la eficiencia, el rendimiento y la rentabilidad del uso del suelo agrícola. Desde la perspectiva de 7. Operations Engineering & Management (Ingenieria y gestión de operaciones), porque el estudio aporta a la comprensión y mejora de los procesos operativos y de planificación en el sector agropecuario. De igual manera, el conjunto de comercializacion se asocia con 8.Supply Chain Management (Gestión de la cadena de suministro), al analizar los flujos de distribución y venta de los productos agrícolas. Por otra parte, la integración de datos abiertos y herramientas digitales como RStudio permite enmarcar el proyecto dentro de Information Engineering, enfocada en la gestión y procesamiento de información. Finalmente, se articula con 9. Engineering Management (Gestión de ingeniería), en cuanto implica la aplicación de principios de gestión y liderazgo técnico para la toma de decisiones estratégicas en el ámbito productivo.
El objetivo de este proyecto es aplicar técnicas de análisis multivariante para gestionar el conjunto de datos aprobado, correspondiente a asociaciones de productores agropecuarios del departamento de Boyacá, con información proveniente de la plataforma oficial Datos Abiertos del Gobierno de Colombia (datos.gov.co).
El propósito es organizar y procesar eficientemente la información, desarrollando habilidades en la gestión, análisis y visualización de datos mediante el uso del software R y RStudio, aplicando herramientas estadísticas que permitan interpretar las relaciones existentes entre las variables de estudio.
Este trabajo se enmarca dentro del curso de Gestión de Datos para Ingeniería Industrial, en la Universidad del Valle durante el periodo académico 2025_2.
El conjunto de datos analizado corresponde a información de asociaciones de productores agropecuarios del departamento de Boyacá. Contiene variables de tipo cuantitativo y cualitativo, relacionadas con la superficie sembrada, el rendimiento de los cultivos y la participación en espacios de comercializacion y ferias agropecuarias.
A continuación, se describen las variables seleccionadas del conjunto de datos, indicando su tipo y escala de medición según la naturaleza de cada una:
Estas variables proporcionan una visión integral sobre los aspectos productivos y organizacionales de las asociaciones agropecuarias, permitiendo establecer relaciones entre el tamaño de las áreas cultivadas, el rendimiento obtenido y la participación en procesos de comercializacion formal.
Tiene como finalidad explorar y comprender la organización inicial del conjunto de datos antes de la aplicación de técnicas de análisis multivariado. Mediante la ejecución de esta instrucción, se obtiene información detallada sobre la cantidad de observaciones, el número de variables, el tipo de datos de cada variable (cualitativas o cuantitativas) y su formato de almacenamiento. Al ejecutar se puede observar que el conjunto de datos original contiene 479 registros y 22 variables, las cuales incluyen información de carácter numérico, como el número de asociados activos, el área sembrada y el rendimiento en toneladas, así como variables categóricas, relacionadas con aspectos organizativos y productivos de las asociaciones, tales como el tipo de producto, el grupo productivo y la disponibilidad de servicios de comercializacion.
str(ASOCIACIONES_DE_PRODUCTORES_AGROPECUARIOS_DEPARTAMENTO_DE_BOYACA_20251024_ETL)
## tibble [479 × 22] (S3: tbl_df/tbl/data.frame)
## $ Municipio : chr [1:479] "RaQUIRA" "RaQUIRA" "RaQUIRA" "ALMEIDA" ...
## $ Numero total de asociados : num [1:479] 31 16 30 14 153 96 76 36 25 16 ...
## $ Numero de asociados Activos : num [1:479] 46 6 15 7 57 40 63 45 25 33 ...
## $ Tienen Servicio de comercializacion : chr [1:479] "Si" "Si" "Si" "No" ...
## $ Los productos tienen valor agregado : chr [1:479] "No" "No" "No" "No" ...
## $ Han sido capacitados en Buenas Practicas : chr [1:479] "Si" "Si" "Si" "Si" ...
## $ Producto : chr [1:479] "Agraz" "Agraz" "Agraz" "Aguacate" ...
## $ Grupo : chr [1:479] "Fruta" "Fruta" "Fruta" "Fruta" ...
## $ La asociacion cuenta con terreno : chr [1:479] "Si" "No" "No" "No" ...
## $ La asociacion cuenta con centro de acopio : chr [1:479] "Si" "No" "No" "No" ...
## $ En los dos ultimos años les han aprobado proyectos : chr [1:479] "Si" "No" "No" "No" ...
## $ Fertilizacion Organica. : chr [1:479] "Si" "No" "No" "Si" ...
## $ Riego En Pisicultura: disponibilidad y conduccion del agua. : chr [1:479] "Si" "Si" "No" "Si" ...
## $ llevan registros de sus costos de produccion : chr [1:479] "Si" "Si" "No" "No" ...
## $ La asociacion y/o asociados, realizan practicas para el uso y aprovechamiento de aguas de lluvia: chr [1:479] "Si" "Si" "Si" "Si" ...
## $ area total sembrada en Ha. : num [1:479] 27 12 7 2.5 25 2 1 120 1 3 ...
## $ Cual es el rendimiento en toneladas : num [1:479] 1.5 5 2 1.2 0 0 0 200 6 0 ...
## $ Area disponible en ha : num [1:479] 0 0 6 85 0 0 1 0 15 0 ...
## $ La asociacion realiza programaciones de planeacion de la siembra y produccion : chr [1:479] "Si" "Si" "No" "Si" ...
## $ Cuantos asociados estan vendiendo o comercializando : num [1:479] 46 4 0 0 0 12 0 0 0 6 ...
## $ La asociacion en el ultimo año ha participado en ferias agropecuarias : chr [1:479] "Si\r" "Si\r" "No" "No" ...
## $ Densidad_siembraporhectarea : num [1:479] 1600 1700 1600 12000 20000 200 88 20000 20700 10000 ...
Tiene como propósito presentar el conjunto de datos una vez aplicado el proceso de Extracción, Transformación y Carga (ETL), el cual busca mejorar la calidad y consistencia de la información utilizada en el estudio. Al ejecutar esta sección se observa un conjunto de datos estructurado, en el que se han depurado registros inconsistentes, ajustado formatos de variables y asegurado la correcta identificación de los tipos de datos. Este conjunto mantiene la información relevante para el análisis multivariado, garantizando que las variables cuantitativas se encuentren en formato numérico y las cualitativas correctamente categorizadas.
La visualización del conjunto de datos ETL permite comprobar que la información se encuentra lista para su análisis, reduciendo el riesgo de errores en las fases posteriores y asegurando la confiabilidad de los resultados obtenidos a partir de técnicas como el análisis exploratorio, la regresión y los métodos de clasificación y conglomerados.
ASOCIACIONES_DE_PRODUCTORES_AGROPECUARIOS_DEPARTAMENTO_DE_BOYACA_20251024_ETL
## # A tibble: 479 × 22
## Municipio `Numero total de asociados` Numero de asociados Activo…¹
## <chr> <dbl> <dbl>
## 1 RaQUIRA 31 46
## 2 RaQUIRA 16 6
## 3 RaQUIRA 30 15
## 4 ALMEIDA 14 7
## 5 PaEZ 153 57
## 6 QUÍPAMA 96 40
## 7 SAN PABLO DE BORBUR 76 63
## 8 BUENAVISTA 36 45
## 9 GARAGOA 25 25
## 10 PUERTO BOYACa 16 33
## # ℹ 469 more rows
## # ℹ abbreviated name: ¹`Numero de asociados Activos`
## # ℹ 19 more variables: `Tienen Servicio de comercializacion` <chr>,
## # `Los productos tienen valor agregado` <chr>,
## # `Han sido capacitados en Buenas Practicas` <chr>, Producto <chr>,
## # Grupo <chr>, `La asociacion cuenta con terreno` <chr>,
## # `La asociacion cuenta con centro de acopio` <chr>, …
En esta sección se realiza un análisis de estimaciones multivariadas básicas, cuyo objetivo es caracterizar estadísticamente el comportamiento conjunto de las variables cuantitativas del estudio. Estas estimaciones permiten comprender la tendencia central, la dispersión, la variabilidad conjunta y el grado de asociación lineal entre las variables seleccionadas, constituyendo una base fundamental para la aplicación posterior de técnicas multivariadas más avanzadas.
Es de importancia recalcar que los boxplots permiten analizar la distribución, dispersión y presencia de valores atípicos en cada variable. A partir de estas gráficas se evidencia una alta asimetría en la mayoría de las variables, con múltiples valores extremos, especialmente en el área disponible, el rendimiento en toneladas y la densidad de siembra por hectárea. Este comportamiento es consistente con datos reales del sector agropecuario, donde existen pocas asociaciones con valores muy altos frente a una mayoría con valores reducidos.Por otro lado a mayoría de las correlaciones presentan valores bajos, indicando una baja dependencia lineal entre las variables, lo cual justifica la aplicación de técnicas multivariadas como el análisis de componentes principales y los métodos de clasificación, que permiten capturar estructuras más complejas en los datos.
La primera parte de esta sección corresponde al vector de medias, el cual se obtiene calculando el valor promedio de cada una de las variables cuantitativas incluidas en el análisis. Este vector resume la tendencia central del conjunto de datos y permite identificar valores promedio representativos de las asociaciones agropecuarias en términos de tamaño, producción y participación en procesos de comercializacion.
Al ejecutar esta estimación se observa que variables como el número total de asociados, el número de asociados activos y el área total sembrada presentan valores medios relativamente bajos para la mayoría de las asociaciones, lo que sugiere la predominancia de organizaciones de pequeña y mediana escala. Por su parte, el rendimiento en toneladas y la densidad de siembra por hectárea presentan valores promedio más elevados, reflejando diferencias importantes en los niveles de productividad.
apply(ASOCIACIONES_DE_PRODUCTORES_AGROPECUARIOS_DEPARTAMENTO_DE_BOYACA_20251024_ETL[,-c(1,4,5,6,7,8,9,10,11,12,13,14,15,19,21)], 2, mean)
## Numero total de asociados
## 5.305219e+01
## Numero de asociados Activos
## 6.045303e+01
## area total sembrada en Ha.
## 1.587053e+02
## Cual es el rendimiento en toneladas
## 1.682242e+03
## Area disponible en ha
## 2.102034e+04
## Cuantos asociados estan vendiendo o comercializando
## 1.140919e+01
## Densidad_siembraporhectarea
## 6.513423e+06
ASOCIACIONES_DE_PRODUCTORES_AGROPECUARIOS_DEPARTAMENTO_DE_BOYACA_20251024_ETL_reducido = ASOCIACIONES_DE_PRODUCTORES_AGROPECUARIOS_DEPARTAMENTO_DE_BOYACA_20251024_ETL[,-c(1,4,5,6,7,8,9,10,11,12,13,14,15,19,21)]
nombres_boxplots <- c("Número total de asociados", "Numero de asociados activos", "Área total sembrada en Ha.", "Cúal es el rendimiento en toneladas", "Área disponible en ha", "Cuantos asociados están vendiendo o comercializando", "Densidad_sembradaporhectarea")
par(mfrow = c(1, ncol(ASOCIACIONES_DE_PRODUCTORES_AGROPECUARIOS_DEPARTAMENTO_DE_BOYACA_20251024_ETL_reducido)))
invisible(lapply(1:ncol(ASOCIACIONES_DE_PRODUCTORES_AGROPECUARIOS_DEPARTAMENTO_DE_BOYACA_20251024_ETL_reducido), function(i) {
boxplot(ASOCIACIONES_DE_PRODUCTORES_AGROPECUARIOS_DEPARTAMENTO_DE_BOYACA_20251024_ETL_reducido[, i],
main = nombres_boxplots [i])}))
La matriz de varianzas–covarianzas permite analizar la variabilidad individual de cada variable (en la diagonal principal) y la variabilidad conjunta entre pares de variables (fuera de la diagonal). Esta matriz es fundamental para entender cómo cambian simultáneamente las variables del estudio.
Al observar la matriz, se identifican varianzas elevadas en variables como el rendimiento en toneladas, el área disponible en hectáreas y la densidad de siembra por hectárea, lo que confirma la alta dispersión evidenciada previamente en los boxplots. Asimismo, se presentan covarianzas positivas entre variables relacionadas con el tamaño de la asociación y la producción, como el número de asociados activos y el área sembrada, lo que sugiere que estas variables tienden a incrementarse conjuntamente.
Sin embargo, debido a que las variables se encuentran en diferentes escalas de medición, la interpretación directa de las covarianzas resulta limitada, lo cual hace necesario complementar el análisis con la matriz de correlaciones.
round(cov(ASOCIACIONES_DE_PRODUCTORES_AGROPECUARIOS_DEPARTAMENTO_DE_BOYACA_20251024_ETL[,-c(1,4,5,6,7,8,9,10,11,12,13,14,15,19,21)]),2)
## Numero total de asociados
## Numero total de asociados 4142.83
## Numero de asociados Activos 9632.64
## area total sembrada en Ha. 10591.63
## Cual es el rendimiento en toneladas -30264.60
## Area disponible en ha -837994.84
## Cuantos asociados estan vendiendo o comercializando 39.51
## Densidad_siembraporhectarea -102932258.82
## Numero de asociados Activos
## Numero total de asociados 9632.64
## Numero de asociados Activos 86205.37
## area total sembrada en Ha. 114214.10
## Cual es el rendimiento en toneladas -24061.28
## Area disponible en ha -966815.23
## Cuantos asociados estan vendiendo o comercializando 123.06
## Densidad_siembraporhectarea -161121388.23
## area total sembrada en Ha.
## Numero total de asociados 10591.63
## Numero de asociados Activos 114214.10
## area total sembrada en Ha. 1214530.96
## Cual es el rendimiento en toneladas -99641.24
## Area disponible en ha -3189140.51
## Cuantos asociados estan vendiendo o comercializando -272.01
## Densidad_siembraporhectarea -889064892.37
## Cual es el rendimiento en toneladas
## Numero total de asociados -3.026460e+04
## Numero de asociados Activos -2.406128e+04
## area total sembrada en Ha. -9.964124e+04
## Cual es el rendimiento en toneladas 1.502491e+08
## Area disponible en ha -3.118239e+07
## Cuantos asociados estan vendiendo o comercializando 3.951853e+04
## Densidad_siembraporhectarea -1.071512e+10
## Area disponible en ha
## Numero total de asociados -8.379948e+05
## Numero de asociados Activos -9.668152e+05
## area total sembrada en Ha. -3.189141e+06
## Cual es el rendimiento en toneladas -3.118239e+07
## Area disponible en ha 2.087639e+11
## Cuantos asociados estan vendiendo o comercializando -2.395744e+05
## Densidad_siembraporhectarea -1.332385e+11
## Cuantos asociados estan vendiendo o comercializando
## Numero total de asociados 39.51
## Numero de asociados Activos 123.06
## area total sembrada en Ha. -272.01
## Cual es el rendimiento en toneladas 39518.53
## Area disponible en ha -239574.43
## Cuantos asociados estan vendiendo o comercializando 670.01
## Densidad_siembraporhectarea 86160345.10
## Densidad_siembraporhectarea
## Numero total de asociados -1.029323e+08
## Numero de asociados Activos -1.611214e+08
## area total sembrada en Ha. -8.890649e+08
## Cual es el rendimiento en toneladas -1.071512e+10
## Area disponible en ha -1.332385e+11
## Cuantos asociados estan vendiendo o comercializando 8.616035e+07
## Densidad_siembraporhectarea 1.323532e+16
La matriz de correlaciones permite evaluar el grado de asociación lineal estandarizada entre las variables cuantitativas, con valores comprendidos entre −1 y 1. Esta herramienta facilita la comparación entre variables, independientemente de sus unidades de medida.
A partir de la matriz de correlaciones se observa una correlación positiva moderada entre el número total de asociados y el número de asociados activos, lo cual es coherente desde el punto de vista organizacional. Asimismo, se identifican asociaciones débiles entre las variables productivas y las relacionadas con la comercializacion, lo que sugiere que no existe una relación lineal fuerte directa entre estos aspectos.
round(cor(ASOCIACIONES_DE_PRODUCTORES_AGROPECUARIOS_DEPARTAMENTO_DE_BOYACA_20251024_ETL[,-c(1,4,5,6,7,8,9,10,11,12,13,14,15,19,21)]),3)
## Numero total de asociados
## Numero total de asociados 1.000
## Numero de asociados Activos 0.510
## area total sembrada en Ha. 0.149
## Cual es el rendimiento en toneladas -0.038
## Area disponible en ha -0.028
## Cuantos asociados estan vendiendo o comercializando 0.024
## Densidad_siembraporhectarea -0.014
## Numero de asociados Activos
## Numero total de asociados 0.510
## Numero de asociados Activos 1.000
## area total sembrada en Ha. 0.353
## Cual es el rendimiento en toneladas -0.007
## Area disponible en ha -0.007
## Cuantos asociados estan vendiendo o comercializando 0.016
## Densidad_siembraporhectarea -0.005
## area total sembrada en Ha.
## Numero total de asociados 0.149
## Numero de asociados Activos 0.353
## area total sembrada en Ha. 1.000
## Cual es el rendimiento en toneladas -0.007
## Area disponible en ha -0.006
## Cuantos asociados estan vendiendo o comercializando -0.010
## Densidad_siembraporhectarea -0.007
## Cual es el rendimiento en toneladas
## Numero total de asociados -0.038
## Numero de asociados Activos -0.007
## area total sembrada en Ha. -0.007
## Cual es el rendimiento en toneladas 1.000
## Area disponible en ha -0.006
## Cuantos asociados estan vendiendo o comercializando 0.125
## Densidad_siembraporhectarea -0.008
## Area disponible en ha
## Numero total de asociados -0.028
## Numero de asociados Activos -0.007
## area total sembrada en Ha. -0.006
## Cual es el rendimiento en toneladas -0.006
## Area disponible en ha 1.000
## Cuantos asociados estan vendiendo o comercializando -0.020
## Densidad_siembraporhectarea -0.003
## Cuantos asociados estan vendiendo o comercializando
## Numero total de asociados 0.024
## Numero de asociados Activos 0.016
## area total sembrada en Ha. -0.010
## Cual es el rendimiento en toneladas 0.125
## Area disponible en ha -0.020
## Cuantos asociados estan vendiendo o comercializando 1.000
## Densidad_siembraporhectarea 0.029
## Densidad_siembraporhectarea
## Numero total de asociados -0.014
## Numero de asociados Activos -0.005
## area total sembrada en Ha. -0.007
## Cual es el rendimiento en toneladas -0.008
## Area disponible en ha -0.003
## Cuantos asociados estan vendiendo o comercializando 0.029
## Densidad_siembraporhectarea 1.000
En esta sección se evalúa el supuesto de normalidad multivariada del conjunto de variables cuantitativas seleccionadas. Este supuesto es fundamental en múltiples técnicas de análisis multivariado, tales como el análisis de componentes principales, el análisis discriminante y ciertos métodos inferenciales, ya que muchas de estas técnicas asumen que los datos siguen una distribución normal conjunta.
Para tal fin, se aplican diferentes Pruebas de Normalidad Multivariada (PNM), las cuales permiten contrastar estadísticamente si el vector de variables cumple o no con dicho supuesto.
Para indagar o establecer el tipo de distribución multivariada de un conjunto de datos se puede recurrir a procedimientos descriptivos, como los gráficos, o procedimientos inferenciales, como las pruebas estadísticas. En este sentido, se alcanza generalización de resultados al usar las estos últimos, si bien los primeros apoyan a las interpretaciones. En este apartado se contempla el uso de procedimientos inferenciales para determinar si el conjunto de datos de trabajo, en relación con sus variables numéricas, se distribuye normal multivariado (DNM). Las pruebas de normalidad multivariada (PNM) a las que será sometido son: Mardia, Henze-Zirkler, Doornik-Hansen y Royston. Para estas pruebas de normalidad los test obedecen a un nivel de significancia \(\alpha = 0.05\) y a las hipótesis:\[H_0: \text {Las variables tienen una DNM}\] \[H_1: \text {Las variables NO tienen una DNM}\] La prueba de Mardia se basa en extensiones de asimetría y curtosis, el cuadrado de la distancia de Mahalanobis, la cantidad de variables \(p\) por tratar y la cantidad de registros \(n\). Además, considera que la prueba estadística para la asimetría tiene una distribución \(\chi^2\) y la prueba estadística para la curtosis se distirbuye aproximadamente normal. Los detalles sobre los parámetros de las distribuciones pueden consultarse en el trabajo. La prueba de Henze-Zirkler se basa en la distancia funcional, dado que si el conjunto de datos presenta una distribución normal multivariada, el estadístico de la prueba se distribuye aproximadamente como una lognormal, cuyos parámetros de media \(\mu\) y varianza \(\sigma^2\) pueden ser consultados en el trabajo. La prueba de Doornik-Hansen está basada en la asimetría y la curtosis de un conjunto de datos multivariados, que se transforma para garantizar la independencia. Es considerada más potente que la prueba de Shapiro-Wilk para casos multivariados. Su estadístico de prueba está definido como la suma de las transformaciones al cuadrado de la asimetría y la curtosis, y sigue, aproximadamente, una distribución \(\chi^2\). Los detalles de la prueba pueden ser consultados en el trabajo. La prueba de Royston recurre a las pruebas Shapiro-Wilk o Shapiro-Francia para probar la normalidad multivariada. Así, si la curtosis es mayor que 3, la prueba de Royston usa Shapiro-Francia para distribuciones leptocurticas. Mientras que para distribuciones platicurticas usa Shapiro-Wilk. En ella los parámetros son obtenidos por aproximaciones polinomiales, esto puede ser consultado en el trabajo.
Planteamiento del problema A partir del conjunto de datos descrito en la sección 1.2, se realizará una prueba estadística de normalidad multivariada, utilizando un nivel de significancia \(\alpha=0.05\), con el objetivo de determinar si las variables métricas provienen de una población con distribución normal multivariada. Se recuerda que las variables numéricas (en escalada de medición de razón) son: área_total_sembrada, área_disponible, rendimiento_en_toneladas, numero_asociados. Se utilizará una de las pruebas de normalidad multivariada mencionadas anteriormente, como la prueba de Mardia, Henze-Zirkler, Doornik-Hansen o Royston, dependiendo de la distribución de las variables y la curtosis observada. El objetivo es evaluar si estas variables siguen una distribución normal conjunta en el espacio multivariado. El procedimiento implicará calcular el estadístico de prueba específico (por ejemplo, basado en asimetría y curtosis) y compararlo con su distribución teórica bajo la hipótesis nula de normalidad multivariada. Se establecerá un criterio de rechazo de la hipótesis nula si el valor \(p-value\) asociado al estadístico de prueba es menor que \(\alpha\). Una conclusión positiva (no rechazo de la hipótesis nula) indicaría evidencia de que las variables analizadas siguen una distribución normal multivariada. Por el contrario, un rechazo de la hipótesis nula sugeriría que al menos una de las variables no sigue una distribución normal, lo que podría tener implicaciones en el análisis posterior de los datos.
La prueba de Mardia evalúa la normalidad multivariada a partir de dos componentes fundamentales: la asimetría multivariada y la curtosis multivariada. Esta prueba contrasta si la forma de la distribución conjunta de los datos se aproxima a una normal multivariada.
Al ejecutar la prueba de Mardia sobre las variables cuantitativas del estudio, se obtiene un resultado negativo para el cumplimiento del supuesto de normalidad multivariada. Tanto la estadística asociada a la asimetría como a la curtosis presentan valores elevados, indicando que la distribución conjunta de los datos se desvía significativamente de una distribución normal.
Este resultado es consistente con la naturaleza del conjunto de datos, el cual contiene variables productivas y organizacionales con alta dispersión y presencia de valores extremos.
#mvn(ASOCIACIONES_DE_PRODUCTORES_AGROPECUARIOS_DEPARTAMENTO_DE_BOYACA_20251024_[,-c(1,4,5,6,7,8,9,10,11,12,13,14,15,19,21)], mvnTest="mardia")
mardia(ASOCIACIONES_DE_PRODUCTORES_AGROPECUARIOS_DEPARTAMENTO_DE_BOYACA_20251024_ETL[,-c(1,4,5,6,7,8,9,10,11,12,13,14,15,19,21)])
## $mv.test
## Test Statistic p-value Result
## 1 Skewness 143591.6494 0 NO
## 2 Kurtosis 1801.1518 0 NO
## 3 MV Normality <NA> <NA> NO
##
## $uv.shapiro
## W p-value UV.Normality
## Numero total de asociados 0.5624 0 No
## Numero de asociados Activos 0.0714 0 No
## area total sembrada en Ha. 0.1149 0 No
## Cual es el rendimiento en toneladas 0.1165 0 No
## Area disponible en ha 0.0221 0 No
## Cuantos asociados estan vendiendo o comercializando 0.4794 0 No
## Densidad_siembraporhectarea 0.0301 0 No
La prueba de Henze–Zirkler es una prueba basada en distancias que evalúa la discrepancia entre la distribución empírica de los datos y la distribución normal multivariada teórica. Es considerada una de las pruebas más robustas para evaluar normalidad multivariada en conjuntos de datos de tamaño moderado y grande.
Los resultados obtenidos mediante esta prueba indican el rechazo del supuesto de normalidad multivariada, confirmando que las variables analizadas no siguen una distribución normal conjunta. Este hallazgo refuerza los resultados obtenidos previamente con la prueba de Mardia.
#mvn(ASOCIACIONES_DE_PRODUCTORES_AGROPECUARIOS_DEPARTAMENTO_DE_BOYACA_20251024_[,-c(1,4,5,6,7,8,9,10,11,12,13,14,15,19,21)], mvnTest="hz")
hz(ASOCIACIONES_DE_PRODUCTORES_AGROPECUARIOS_DEPARTAMENTO_DE_BOYACA_20251024_ETL[,-c(1,4,5,6,7,8,9,10,11,12,13,14,15,19,21)])
## Test Statistic p.value Method
## 1 Henze-Zirkler 185.6465 0 asymptotic
La prueba de Doornik–Hansen evalúa la normalidad multivariada combinando transformaciones de las variables individuales y contrastando conjuntamente la asimetría y la curtosis multivariada.
Aunque esta prueba no se ejecuta directamente en el análisis presentado, su inclusión metodológica resulta pertinente como referencia, ya que constituye una alternativa ampliamente utilizada en estudios multivariados. Su mención refuerza la validez del enfoque metodológico adoptado en el análisis de normalidad.
#mvn(ASOCIACIONES_DE_PRODUCTORES_AGROPECUARIOS_DEPARTAMENTO_DE_BOYACA_20251024_[,-c(1,4,5,6,7,8,9,10,11,12,13,14,15,19,21)], mvnTest="dh")
#dh(ASOCIACIONES_DE_PRODUCTORES_AGROPECUARIOS_DEPARTAMENTO_DE_BOYACA_20251024_ETL[,-c(1,4,5,6,7,8,9,10,11,12,13,14,15,19,21)])
La prueba de Royston es una extensión multivariada de la prueba de Shapiro–Wilk y se emplea para evaluar la normalidad conjunta de un conjunto de variables cuantitativas.
Los resultados obtenidos mediante la prueba de Royston indican nuevamente el incumplimiento del supuesto de normalidad multivariada, lo cual es coherente con los resultados de las demás pruebas aplicadas y con la evidencia gráfica observada en las secciones anteriores.
#mvn(ASOCIACIONES_DE_PRODUCTORES_AGROPECUARIOS_DEPARTAMENTO_DE_BOYACA_20251024_ [,-c(1,4,5,6,7,8,9,10,11,12,13,14,15,19,21)], mvnTest="royston")
royston(ASOCIACIONES_DE_PRODUCTORES_AGROPECUARIOS_DEPARTAMENTO_DE_BOYACA_20251024_ETL[,-c(1,4,5,6,7,8,9,10,11,12,13,14,15,19,21)])
## Test Statistic p.value Method
## 1 Royston 1244.486 1.769577e-264 asymptotic
El diagrama generado mediante GGpairs permite observar simultáneamente las distribuciones individuales, los diagramas de dispersión bivariados y las correlaciones lineales entre las variables cuantitativas.
A partir de este diagrama se observa que las relaciones más relevantes se presentan entre variables productivas, como el área sembrada, el área disponible y el rendimiento en toneladas. Asimismo, las distribuciones individuales evidencian asimetría hacia la derecha, lo cual respalda los resultados obtenidos en las pruebas de normalidad multivariada. No se identifica un patrón claro de agrupamiento, lo que sugiere una alta heterogeneidad entre las asociaciones analizadas.
ggpairs(ASOCIACIONES_DE_PRODUCTORES_AGROPECUARIOS_DEPARTAMENTO_DE_BOYACA_20251024_ETL[,-c(1,4,5,6,7,8,9,10,11,12,13,14,15,19,21)])
Este diagrama permite profundizar en la evaluación de las relaciones entre variables específicas, destacando las correlaciones lineales entre pares de variables cuantitativas seleccionadas. Las correlaciones observadas son en su mayoría bajas o moderadas, lo que indica que no existe una dependencia lineal fuerte generalizada entre las variables del estudio.
library(GGally)
ggpairs(
ASOCIACIONES_DE_PRODUCTORES_AGROPECUARIOS_DEPARTAMENTO_DE_BOYACA_20251024_ETL,
columns = c(2,3,16,17,18,20,22),
upper = list(continuous = wrap("cor", size = 2.5)))
El diagrama de estrellas permite representar simultáneamente múltiples características de cada asociación mediante radios proporcionales a los valores de las variables analizadas. A partir de esta visualización se evidencia una alta variabilidad entre asociaciones, observándose perfiles productivos muy diferenciados.
Algunas asociaciones presentan valores bajos en la mayoría de las dimensiones, mientras que otras muestran radios significativamente más amplios en variables relacionadas con área, densidad y rendimiento, lo que refleja diferencias sustanciales en su capacidad productiva.
set.seed(120522)
ASOCIACIONES_DE_PRODUCTORES_AGROPECUARIOS_DEPARTAMENTO_DE_BOYACA_20251024_ETL_MUESTREADO = ASOCIACIONES_DE_PRODUCTORES_AGROPECUARIOS_DEPARTAMENTO_DE_BOYACA_20251024_ETL[sample(1:nrow(ASOCIACIONES_DE_PRODUCTORES_AGROPECUARIOS_DEPARTAMENTO_DE_BOYACA_20251024_ETL),23),-c(1,4,5,6,7,8,9,10,11,12,13,14,15,19,21)]
stars(ASOCIACIONES_DE_PRODUCTORES_AGROPECUARIOS_DEPARTAMENTO_DE_BOYACA_20251024_ETL_MUESTREADO, len = 1, cex = 0.4, key.loc = c(10, 2), draw.segments = TRUE)
Las caras de Chernoff representan cada asociación mediante un rostro sintético cuyos rasgos varían en función de los valores de las variables. Esta técnica proporciona una forma intuitiva de identificar asociaciones con comportamientos extremos o atípicos.
La diversidad morfológica observada en las caras confirma la heterogeneidad del conjunto de datos, coincidiendo con la dispersión y asimetría detectadas previamente. Este tipo de visualización resulta especialmente útil para identificar asociaciones con perfiles productivos destacados o significativamente rezagados.
Las caras de Chernoff representan cada asociación mediante un rostro sintético.
La variación de sus rasgos permite identificar: - Asociaciones con mejores indicadores productivos (caras “más grandes” o con ojos más abiertos). - Asociaciones con índices bajos (caras pequeñas o con gestos reducidos). - Gran diversidad morfológica en las expresiones, lo que coincide con la dispersión observada en las variables.
Este método brinda una forma intuitiva de identificar asociaciones atípicas o destacadas
set.seed(120522)
ASOCIACIONES_DE_PRODUCTORES_AGROPECUARIOS_DEPARTAMENTO_DE_BOYACA_20251024_ETL_MUESTREADO = ASOCIACIONES_DE_PRODUCTORES_AGROPECUARIOS_DEPARTAMENTO_DE_BOYACA_20251024_ETL[sample(1:nrow(ASOCIACIONES_DE_PRODUCTORES_AGROPECUARIOS_DEPARTAMENTO_DE_BOYACA_20251024_ETL),23),-c(1,4,5,6,7,8,9,10,11,12,13,14,15,19,21)]
faces(ASOCIACIONES_DE_PRODUCTORES_AGROPECUARIOS_DEPARTAMENTO_DE_BOYACA_20251024_ETL_MUESTREADO)
## effect of variables:
## modified item Var
## "height of face " "Numero total de asociados"
## "width of face " "Numero de asociados Activos"
## "structure of face" "area total sembrada en Ha."
## "height of mouth " "Cual es el rendimiento en toneladas"
## "width of mouth " "Area disponible en ha"
## "smiling " "Cuantos asociados estan vendiendo o comercializando"
## "height of eyes " "Densidad_siembraporhectarea"
## "width of eyes " "Numero total de asociados"
## "height of hair " "Numero de asociados Activos"
## "width of hair " "area total sembrada en Ha."
## "style of hair " "Cual es el rendimiento en toneladas"
## "height of nose " "Area disponible en ha"
## "width of nose " "Cuantos asociados estan vendiendo o comercializando"
## "width of ear " "Densidad_siembraporhectarea"
## "height of ear " "Numero total de asociados"
El análisis descriptivo multivariante permitió comprender las características generales de las asociaciones agropecuarias del departamento de Boyacá. Se evidencia una marcada heterogeneidad en la estructura organizacional, las áreas cultivadas y los niveles de productividad. Las variables productivas presentan relaciones claras entre sí, mientras que variables organizativas muestran menor cohesión. Las visualizaciones confirman la existencia de asociaciones con perfiles productivos muy distintos, lo cual establece un punto de partida sólido para la aplicación de técnicas avanzadas como ACP, correspondencias y clustering en las siguientes fases del estudio.
En esta segunda etapa del estudio, se presenta el análisis de Componentes Principales (ACP), aplicado a las variables cuantitativas seleccionadas del conjunto de datos correspondiente a las asociaciones de productores agropecuarios del departamento de Boyacá. Esta fase continúa el trabajo estadístico iniciado en la Fase 1, avanzando hacia la reducción de dimensionalidad, identificación de patrones multivariados y mejor comprensión de la estructura interna de las variables numéricas. El ACP se desarrolló a partir de tres variables cuantitativas: Número total de asociados, Número de asociados activos y Densidad de siembra por hectárea. Estas variables representan dimensiones relevantes para caracterizar la estructura poblacional y productiva de las asociaciones.
El Análisis de Componentes Principales (ACP) tiene como propósito transformar un conjunto de variables originales —posiblemente correlacionadas— en un nuevo sistema de variables no correlacionadas, denominadas componentes principales. Cada componente constituye una combinación lineal de las variables iniciales y captura una porción específica de la varianza total del sistema. Los objetivos específicos del ACP en esta fase son: • Reducir la dimensionalidad del conjunto de datos, conservando la mayor cantidad de información posible. • Identificar las variables con mayor peso en cada componente, facilitando la interpretación del fenómeno estudiado. • Evaluar la proporción de varianza explicada por los componentes, determinando cuántos de ellos resultan útiles para la representación del sistema. • Explorar relaciones subyacentes entre las variables cuantitativas mediante representaciones gráficas (correlaciones, biplots y calidad de representación). El lector interesado en los fundamentos teóricos de este método puede remitirse a la Fase 1, donde se presentan las bases estadísticas para la comprensión del ACP.
En el contexto de este estudio, el ACP se utiliza para analizar conjuntamente variables relacionadas con el tamaño de las asociaciones, la superficie cultivada, la productividad y la participación en procesos de comercializacion, permitiendo resumir estas características en un número reducido de componentes no correlacionados entre sí.
Los resultados muestran que:
La matriz ACP muestra los valores propios y la proporción de varianza explicada por cada componente principal. A partir de los resultados obtenidos se observa que: El primer componente (Dim.1) presenta un valor propio de 1.698, explicando aproximadamente el 24.3 % de la variabilidad total. El segundo componente (Dim.2) explica el 16.1 % adicional. De manera conjunta, las dos primeras dimensiones concentran cerca del 40.4 % de la información total. Al considerar los primeros cuatro componentes, la varianza acumulada alcanza aproximadamente el 69 %, lo que indica que una parte sustancial de la información original puede representarse en un espacio de baja dimensión.
Este resultado sugiere que, aunque el fenómeno estudiado es complejo y heterogéneo, existe una estructura subyacente que puede resumirse adecuadamente mediante un número reducido de componente
get_eigenvalue(PCA(ASOCIACIONES_DE_PRODUCTORES_AGROPECUARIOS_DEPARTAMENTO_DE_BOYACA_20251024_ETL[,-c(1,4,5,6,7,8,9,10,11,12,13,14,15,19,21)], ncp = 6, scale.unit = TRUE, graph = F))
## eigenvalue variance.percent cumulative.variance.percent
## Dim.1 1.6984390 24.263414 24.26341
## Dim.2 1.1294510 16.135014 40.39843
## Dim.3 1.0045209 14.350298 54.74873
## Dim.4 0.9973645 14.248064 68.99679
## Dim.5 0.8904262 12.720374 81.71716
## Dim.6 0.8379806 11.971152 93.68832
## Dim.7 0.4418179 6.311685 100.00000
La matriz de correlaciones evidencia relaciones lineales específicas entre las variables originales:
Se observa una correlación positiva moderada (0.51) entre el número total de asociados y el número de asociados activos, lo cual refleja coherencia organizativa dentro de las asociaciones.
Existe una correlación positiva entre el número de asociados activos y el área total sembrada (0.35), lo que indica que asociaciones con mayor número de miembros activos tienden a manejar superficies cultivadas más amplias.
El resto de las variables presenta correlaciones bajas o cercanas a cero, especialmente aquellas relacionadas con rendimiento, área disponible y densidad de siembra, evidenciando una débil relación lineal directa entre estos aspectos.
Este patrón confirma que el análisis bivariado resulta insuficiente para explicar la estructura del conjunto de datos, justificando la aplicación del ACP.
round(cor(ASOCIACIONES_DE_PRODUCTORES_AGROPECUARIOS_DEPARTAMENTO_DE_BOYACA_20251024_ETL[,-c(1,4,5,6,7,8,9,10,11,12,13,14,15,19,21)]),2)
## Numero total de asociados
## Numero total de asociados 1.00
## Numero de asociados Activos 0.51
## area total sembrada en Ha. 0.15
## Cual es el rendimiento en toneladas -0.04
## Area disponible en ha -0.03
## Cuantos asociados estan vendiendo o comercializando 0.02
## Densidad_siembraporhectarea -0.01
## Numero de asociados Activos
## Numero total de asociados 0.51
## Numero de asociados Activos 1.00
## area total sembrada en Ha. 0.35
## Cual es el rendimiento en toneladas -0.01
## Area disponible en ha -0.01
## Cuantos asociados estan vendiendo o comercializando 0.02
## Densidad_siembraporhectarea 0.00
## area total sembrada en Ha.
## Numero total de asociados 0.15
## Numero de asociados Activos 0.35
## area total sembrada en Ha. 1.00
## Cual es el rendimiento en toneladas -0.01
## Area disponible en ha -0.01
## Cuantos asociados estan vendiendo o comercializando -0.01
## Densidad_siembraporhectarea -0.01
## Cual es el rendimiento en toneladas
## Numero total de asociados -0.04
## Numero de asociados Activos -0.01
## area total sembrada en Ha. -0.01
## Cual es el rendimiento en toneladas 1.00
## Area disponible en ha -0.01
## Cuantos asociados estan vendiendo o comercializando 0.12
## Densidad_siembraporhectarea -0.01
## Area disponible en ha
## Numero total de asociados -0.03
## Numero de asociados Activos -0.01
## area total sembrada en Ha. -0.01
## Cual es el rendimiento en toneladas -0.01
## Area disponible en ha 1.00
## Cuantos asociados estan vendiendo o comercializando -0.02
## Densidad_siembraporhectarea 0.00
## Cuantos asociados estan vendiendo o comercializando
## Numero total de asociados 0.02
## Numero de asociados Activos 0.02
## area total sembrada en Ha. -0.01
## Cual es el rendimiento en toneladas 0.12
## Area disponible en ha -0.02
## Cuantos asociados estan vendiendo o comercializando 1.00
## Densidad_siembraporhectarea 0.03
## Densidad_siembraporhectarea
## Numero total de asociados -0.01
## Numero de asociados Activos 0.00
## area total sembrada en Ha. -0.01
## Cual es el rendimiento en toneladas -0.01
## Area disponible en ha 0.00
## Cuantos asociados estan vendiendo o comercializando 0.03
## Densidad_siembraporhectarea 1.00
El análisis de los vectores propios (cargas factoriales) permite interpretar el significado de cada componente: En el primer componente, las mayores cargas corresponden al: Número total de asociados (0.587), Número de asociados activos (0.663), Área total sembrada (0.461).
Esto indica que el primer componente representa principalmente el tamaño organizativo y productivo de la asociación, integrando simultáneamente número de miembros y superficie cultivada.
En el segundo componente, las variables con mayor peso son: Rendimiento en toneladas (0.679), Número de asociados que comercializan (0.709).
Este componente puede interpretarse como un eje de desempeño productivo–comercial, diferenciando asociaciones según su nivel de producción efectiva y su participación activa en la comercializacion.
Componentes posteriores capturan variabilidad asociada a aspectos más específicos como la densidad de siembra, la disponibilidad de área y patrones menos dominantes dentro del conjunto de datos.
princomp(ASOCIACIONES_DE_PRODUCTORES_AGROPECUARIOS_DEPARTAMENTO_DE_BOYACA_20251024_ETL[,-c(1,4,5,6,7,8,9,10,11,12,13,14,15,19,21)], cor = TRUE)$sdev^2
## Comp.1 Comp.2 Comp.3 Comp.4 Comp.5 Comp.6 Comp.7
## 1.6984390 1.1294510 1.0045209 0.9973645 0.8904262 0.8379806 0.4418179
princomp(ASOCIACIONES_DE_PRODUCTORES_AGROPECUARIOS_DEPARTAMENTO_DE_BOYACA_20251024_ETL[,-c(1,4,5,6,7,8,9,10,11,12,13,14,15,19,21)], cor = TRUE)$loadings[ ,1:5]
## Comp.1 Comp.2
## Numero total de asociados 0.58697156 0.006892806
## Numero de asociados Activos 0.66276510 0.021844267
## area total sembrada en Ha. 0.46105824 -0.022897254
## Cual es el rendimiento en toneladas -0.03898939 0.679140100
## Area disponible en ha -0.03523152 -0.144097601
## Cuantos asociados estan vendiendo o comercializando 0.02226523 0.708731282
## Densidad_siembraporhectarea -0.01936320 0.121060356
## Comp.3 Comp.4
## Numero total de asociados 0.028539196 0.03524707
## Numero de asociados Activos -0.007323642 -0.04166157
## area total sembrada en Ha. -0.044265918 -0.07285366
## Cual es el rendimiento en toneladas -0.274321087 -0.05190465
## Area disponible en ha -0.398124533 -0.89575032
## Cuantos asociados estan vendiendo o comercializando 0.031290046 -0.06073303
## Densidad_siembraporhectarea 0.873177037 -0.42774184
## Comp.5
## Numero total de asociados 0.34812103
## Numero de asociados Activos 0.02399372
## area total sembrada en Ha. -0.54354835
## Cual es el rendimiento en toneladas -0.51469169
## Area disponible en ha 0.12787137
## Cuantos asociados estan vendiendo o comercializando 0.52500550
## Densidad_siembraporhectarea -0.16094049
La comparación entre las correlaciones originales y las correlaciones de las componentes principales muestra que:
Las variables originales presentan múltiples relaciones débiles y dispersas. Las componentes principales concentran esta información en dimensiones no correlacionadas, eliminando redundancias y facilitando la interpretación.
Esto confirma que el ACP logra una síntesis eficiente de la información, manteniendo las relaciones relevantes sin multicolinealidad.
par(mfrow=c(1,2))
corrplot::corrplot(cor(ASOCIACIONES_DE_PRODUCTORES_AGROPECUARIOS_DEPARTAMENTO_DE_BOYACA_20251024_ETL[,-c(1,4,5,6,7,8,9,10,11,12,13,14,15,19,21)]), method = "color", type = "upper", number.cex = 0.4)
## Warning in
## corrplot::corrplot(cor(ASOCIACIONES_DE_PRODUCTORES_AGROPECUARIOS_DEPARTAMENTO_DE_BOYACA_20251024_ETL[,
## : Not been able to calculate text margin, please try again with a clean new
## empty window using {plot.new(); dev.off()} or reduce tl.cex
corrplot::corrplot(cor(princomp(ASOCIACIONES_DE_PRODUCTORES_AGROPECUARIOS_DEPARTAMENTO_DE_BOYACA_20251024_ETL[,-c(1,4,5,6,7,8,9,10,11,12,13,14,15,19,21)], cor = TRUE)$scores), method = "color", type = "upper", number.cex = 0.4)
El gráfico de Cattell evidencia una caída pronunciada en los valores propios después del segundo componente y una estabilización progresiva a partir del tercero. Este “codo” sugiere que los dos primeros componentes concentran la mayor parte de la información estructural, mientras que los componentes restantes aportan información marginal.
fviz_eig(PCA(ASOCIACIONES_DE_PRODUCTORES_AGROPECUARIOS_DEPARTAMENTO_DE_BOYACA_20251024_ETL[,-c(1,4,5,6,7,8,9,10,11,12,13,14,15,19,21)], scale.unit = T, graph = F), addlabels = T, ylim=c(0,90), main = "")
## Warning in geom_bar(stat = "identity", fill = barfill, color = barcolor, :
## Ignoring empty aesthetic: `width`.
De acuerdo con el criterio de Kaiser, deben conservarse los componentes con valores propios mayores a uno. En este caso:
Los primeros componentes cumplen con este criterio, Los componentes posteriores presentan valores propios inferiores a uno, indicando una contribución limitada.
Este resultado respalda estadísticamente la selección de los primeros componentes para la interpretación del fenómeno.
scree(ASOCIACIONES_DE_PRODUCTORES_AGROPECUARIOS_DEPARTAMENTO_DE_BOYACA_20251024_ETL[,-c(1,4,5,6,7,8,9,10,11,12,13,14,15,19,21)],factors = FALSE, pc = TRUE, main ="")
La calidad de representación de cada variable en los nuevos ejes dimensionales se evalúa mediante los cos², que indican el grado en que cada componente logra explicar las variables originales. Esta medida es crucial en un análisis de reducción dimensional, especialmente cuando se busca preservar la estructura informativa del conjunto de datos. En este estudio se observa que: • Las variables Número total de asociados y Número de asociados activos se encuentran mejor representadas en el PC1, debido a la magnitud de sus cargas. • La variable Densidad de siembra por hectárea presenta una excelente representación en el PC2, resultado coherente con su carga cercana a 1. Estas asociaciones permiten concluir que, en el espacio reducido de dos dimensiones, cada variable encuentra un eje dominante que capta su variabilidad esencial. El lector puede remitirse a la sección 2.2 para revisar la interpretación de los componentes, y a la Fase 1 para comprender la fundamentación teórica del uso de cos² en el ACP.
El círculo de correlaciones muestra de forma clara que:
Las variables número total de asociados, número de asociados activos y área total sembrada se alinean fuertemente con el primer componente, confirmando su asociación con el tamaño de la asociación.
El rendimiento en toneladas y el número de asociados que comercializan se proyectan principalmente sobre el segundo componente, reforzando su interpretación como eje productivo–comercial.
Variables como área disponible y densidad de siembra presentan vectores más cortos, indicando una menor contribución a las primeras dimensiones.
fviz_pca_var(PCA(ASOCIACIONES_DE_PRODUCTORES_AGROPECUARIOS_DEPARTAMENTO_DE_BOYACA_20251024_ETL[,-c(1,4,5,6,7,8,9,10,11,12,13,14,15,19,21)], scale.unit = T, graph = F),col.var="#3B83BD", repel = T, col.circle = "#CDCDCD", ggtheme = theme_bw())
## Warning: Using `size` aesthetic for lines was deprecated in ggplot2 3.4.0.
## ℹ Please use `linewidth` instead.
## ℹ The deprecated feature was likely used in the ggpubr package.
## Please report the issue at <https://github.com/kassambara/ggpubr/issues>.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.
## Warning: `aes_string()` was deprecated in ggplot2 3.0.0.
## ℹ Please use tidy evaluation idioms with `aes()`.
## ℹ See also `vignette("ggplot2-in-packages")` for more information.
## ℹ The deprecated feature was likely used in the factoextra package.
## Please report the issue at <https://github.com/kassambara/factoextra/issues>.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.
Los valores de cos² muestran que:
Las variables relacionadas con el tamaño y la actividad organizativa presentan altos valores de cos² en las primeras dimensiones, lo que indica una excelente representación en el plano factorial.
Variables como la densidad de siembra presentan valores elevados en dimensiones posteriores, lo que sugiere que su comportamiento no está completamente capturado por los primeros componentes.
(get_pca_var(PCA(ASOCIACIONES_DE_PRODUCTORES_AGROPECUARIOS_DEPARTAMENTO_DE_BOYACA_20251024_ETL[,-c(1,4,5,6,7,8,9,10,11,12,13,14,15,19,21)], ncp = 5, scale.unit = TRUE, graph = F)))$cos2
## Dim.1 Dim.2
## Numero total de asociados 0.5851727206 5.366109e-05
## Numero de asociados Activos 0.7460521964 5.389424e-04
## area total sembrada en Ha. 0.3610451530 5.921534e-04
## Cual es el rendimiento en toneladas 0.0025819201 5.209381e-01
## Area disponible en ha 0.0021082040 2.345205e-02
## Cuantos asociados estan vendiendo o comercializando 0.0008419849 5.673232e-01
## Densidad_siembraporhectarea 0.0006368015 1.655279e-02
## Dim.3 Dim.4
## Numero total de asociados 8.181679e-04 0.001239082
## Numero de asociados Activos 5.387821e-05 0.001731112
## area total sembrada en Ha. 1.968330e-03 0.005293668
## Cual es el rendimiento en toneladas 7.559226e-02 0.002686992
## Area disponible en ha 1.592197e-01 0.800253964
## Cuantos asociados estan vendiendo o comercializando 9.834932e-04 0.003678780
## Densidad_siembraporhectarea 7.658850e-01 0.182480874
## Dim.5
## Numero total de asociados 0.1079091875
## Numero de asociados Activos 0.0005126171
## area total sembrada en Ha. 0.2630717907
## Cual es el rendimiento en toneladas 0.2358806032
## Area disponible en ha 0.0145594359
## Cuantos asociados estan vendiendo o comercializando 0.2454288485
## Densidad_siembraporhectarea 0.0230636774
El gráfico de calidad de representación confirma visualmente que:
Las variables con mayor relevancia estructural en el conjunto de datos son aquellas asociadas al tamaño de la asociación y a la comercializacion.
Las variables con menor calidad de representación aportan información complementaria, pero no dominante, dentro del espacio factorial.
fviz_pca_var(PCA(ASOCIACIONES_DE_PRODUCTORES_AGROPECUARIOS_DEPARTAMENTO_DE_BOYACA_20251024_ETL[,-c(1,4,5,6,7,8,9,10,11,12,13,14,15,19,21)], ncp = 5, scale.unit = TRUE, graph = F), col.var="cos2", gradient.cols=c("#00AFBB","#E7B800","#FC4E07"), repel = TRUE)
La tabla de coordenadas individuales corresponde a las puntuaciones (scores) de cada observación (asociación) proyectada sobre los componentes principales. Cada fila representa una asociación y cada columna (Dim.1, Dim.2, …) indica su posición dentro del nuevo sistema de ejes generado por el ACP. Estas coordenadas permiten identificar qué tan alejadas o cercanas están las asociaciones entre sí en el espacio factorial y facilitan detectar asociaciones atípicas o perfiles diferenciados.
En los resultados se observa que los valores de Dim.1 y Dim.2 toman tanto valores positivos como negativos, lo cual indica que las asociaciones se distribuyen a ambos lados del centro del espacio factorial (0,0). Esto es esperado, ya que las coordenadas están calculadas sobre variables estandarizadas, por lo que el origen representa un perfil “promedio” dentro del conjunto de datos.
De forma específica:
La mayoría de asociaciones muestran coordenadas moderadas en Dim.1 y Dim.2 (cercanas a 0), lo que sugiere que comparten un perfil relativamente similar al promedio en términos del tamaño organizativo y de la dinámica productiva–comercial (según la interpretación de los componentes previos).
Se evidencian asociaciones con coordenadas extremas, por ejemplo:
En Dim.1, aparecen valores como 0.8469 (observación 5) y -0.8487 (observación 6), lo que indica asociaciones con perfiles opuestos respecto al eje principal: una con mayor contribución hacia el lado positivo del componente (más alineada con las variables que cargan positivamente en Dim.1) y otra hacia el lado negativo (perfil contrario).
En Dim.2, aparecen valores como 0.8584 (observación 12) y -0.5460 (observación 13), indicando asociaciones que se diferencian fuertemente en el eje productivo–comercial (Dim.2), siendo unas más asociadas a altos valores de las variables que cargan positivamente en Dim.2 y otras con el patrón opuesto.
Las coordenadas en dimensiones posteriores (Dim.3 a Dim.5) son, en general, menores en magnitud para muchas asociaciones, lo cual es coherente con que estas dimensiones explican menos varianza que Dim.1 y Dim.2.
En conclusión, estas coordenadas evidencian que el conjunto de asociaciones presenta heterogeneidad, con algunas asociaciones muy diferenciadas que podrían considerarse casos de interés para análisis posteriores (por ejemplo, en clustering), mientras que la mayoría se concentra alrededor de valores cercanos al promedio, reflejando perfiles más comunes dentro del departamento.
head((PCA(ASOCIACIONES_DE_PRODUCTORES_AGROPECUARIOS_DEPARTAMENTO_DE_BOYACA_20251024_ETL[,-c(1,4,5,6,7,8,9,10,11,12,13,14,15,19,21)], ncp = 5, scale.unit = TRUE, graph = F))$ind$coord, n = 23L)
## Dim.1 Dim.2 Dim.3 Dim.4 Dim.5
## 1 -0.25127462 0.85395734 0.044239814 0.009951505 -0.72064979
## 2 -0.52105462 -0.30130392 -0.011717732 -0.087132520 0.20933466
## 3 -0.37844094 -0.40883342 -0.010306516 -0.103255946 0.21141783
## 4 -0.54447199 -0.41110923 -0.016999566 -0.095728747 0.29643677
## 5 0.84687257 -0.39298359 0.042705757 -0.163477657 -0.44913617
## 6 0.28880984 -0.07099402 0.033125633 -0.108056470 -0.39416363
## 7 0.14745100 -0.40031338 0.009191479 -0.122075401 -0.04460996
## 8 -0.20918559 -0.39730308 -0.017226784 -0.093909844 0.24061968
## 9 -0.40401853 -0.40826073 -0.012486612 -0.099385924 0.23490085
## 10 -0.46207587 -0.24455631 -0.009434775 -0.079185718 0.16187630
## 11 -0.32961741 0.57868778 0.033267072 -0.017834511 -0.52321646
## 12 0.07600701 0.85837967 0.066371149 -0.003823593 -0.89936696
## 13 2.35198853 -0.54591959 -0.291412932 0.354112283 3.63966141
## 14 -0.43326515 -0.02434688 0.002980713 -0.066675518 -0.03441726
## 15 -0.51593037 -0.07120233 0.073864785 -0.030440353 0.06029435
## 16 0.19114477 -0.39885834 0.006971637 -0.117493834 -0.03067937
## 17 -0.33497386 -0.40721186 -0.012059651 -0.099446543 0.22228852
## 18 0.29237992 -0.39747164 0.012853782 -0.123998130 -0.09855141
## 19 0.14349426 -0.39987344 0.007533992 -0.118851215 -0.02815145
## 20 -0.47123888 -0.41012855 -0.016242527 -0.095133407 0.28231324
## 21 -0.42218275 -0.40781620 -0.014287963 -0.097174528 0.25141413
## 22 -0.41021495 -0.40635591 -0.018526510 -0.088260623 0.29089605
## 23 -0.52360054 -0.41029854 -0.018848541 -0.091864300 0.31233302
En esta sección se analiza qué variables son responsables de la construcción de cada componente principal, así como la interpretación estructural de las dimensiones obtenidas mediante el ACP.
Las contribuciones permiten identificar qué variables influyen en mayor medida en la construcción de cada componente. En este estudio: • PC1 está determinado principalmente por: o Número total de asociados o Número de asociados activos Ambas variables aportan de manera equilibrada a esta dimensión, lo cual es consistente con su elevada correlación interna y su relación con la estructura poblacional de las asociaciones. • PC2 está determinado casi exclusivamente por: o Densidad de siembra por hectárea El comportamiento de esta variable indica que representa un eje independiente asociado a la intensidad de uso de la tierra, y por lo tanto ofrece una perspectiva complementaria a la del tamaño poblacional. El biplot permite visualizar simultáneamente las asociaciones entre variables y la distribución de las observaciones en el nuevo espacio reducido. En este estudio, el biplot evidencia que: • Las variables asociadas al tamaño de las organizaciones se proyectan en una misma dirección dentro del cuadrante del PC1. • La densidad de siembra aparece proyectada casi ortogonalmente respecto a estas, indicando independencia entre los componentes. • Las asociaciones de productores con mayor densidad de siembra tienden a separarse de aquellas que se distinguen por mayor número de asociados, lo que sugiere la existencia de dos perfiles productivos distintos.
La matriz de contribuciones indica el porcentaje de aporte de cada variable a la varianza explicada por cada dimensión. Un valor alto implica que la variable es clave para definir esa componente, mientras que valores bajos indican influencia marginal.
Observaciones generales
Las contribuciones no están distribuidas de forma homogénea, lo que confirma que cada dimensión captura un tipo distinto de información productiva u organizacional.
Cada componente principal está dominada por un subconjunto reducido de variables, lo cual facilita su interpretación.
(get_pca_var(PCA(ASOCIACIONES_DE_PRODUCTORES_AGROPECUARIOS_DEPARTAMENTO_DE_BOYACA_20251024_ETL[,-c(1,4,5,6,7,8,9,10,11,12,13,14,15,19,21)], ncp = 5, scale.unit = TRUE, graph = F)))$contrib
## Dim.1 Dim.2
## Numero total de asociados 34.45356162 0.004751078
## Numero de asociados Activos 43.92575800 0.047717199
## area total sembrada en Ha. 21.25746978 0.052428426
## Cual es el rendimiento en toneladas 0.15201724 46.123127490
## Area disponible en ha 0.12412598 2.076411855
## Cuantos asociados estan vendiendo o comercializando 0.04957404 50.230002982
## Densidad_siembraporhectarea 0.03749334 1.465560970
## Dim.3 Dim.4
## Numero total de asociados 0.081448570 0.1242356
## Numero de asociados Activos 0.005363573 0.1735686
## area total sembrada en Ha. 0.195947152 0.5307656
## Cual es el rendimiento en toneladas 7.525205875 0.2694093
## Area disponible en ha 15.850314399 80.2368629
## Cuantos asociados estan vendiendo o comercializando 0.097906695 0.3688501
## Densidad_siembraporhectarea 76.243813735 18.2963079
## Dim.5
## Numero total de asociados 12.11882493
## Numero de asociados Activos 0.05756986
## area total sembrada en Ha. 29.54448134
## Cual es el rendimiento en toneladas 26.49075394
## Area disponible en ha 1.63510873
## Cuantos asociados estan vendiendo o comercializando 27.56307704
## Densidad_siembraporhectarea 2.59018417
Las variables con mayor contribución a la Dimensión 1 son: Número de asociados activos (~44%) Número total de asociados (~35%) Área total sembrada (~21%) Las demás variables presentan contribuciones prácticamente nulas.
Interpretación La Dimensión 1 representa claramente el tamaño organizacional y productivo de la asociación. Esta componente separa asociaciones: Grandes, con muchos asociados y mayor área sembrada Pequeñas, con estructura organizativa reducida D1 puede interpretarse como un eje de escala o magnitud organizacional.
fviz_contrib(PCA(ASOCIACIONES_DE_PRODUCTORES_AGROPECUARIOS_DEPARTAMENTO_DE_BOYACA_20251024_ETL[,-c(1,4,5,6,7,8,9,10,11,12,13,14,15,19,21)], ncp = 6, scale.unit = TRUE, graph = F), choice = "var", axes = 1, top = 10)
Las variables dominantes en D2 son: - Cantidad de asociados que están vendiendo o comercializando (~50%) - Rendimiento en toneladas (~46%)
Interpretación
La Dimensión 2 refleja el desempeño comercial y productivo, independiente del tamaño de la asociación.
Esta dimensión diferencia asociaciones que: - Logran transformar producción en comercializacion efectiva - Presentan mayor rendimiento, aun sin ser grandes en número de asociados
D2 representa un eje de eficiencia productiva–comercial.
fviz_contrib(PCA(ASOCIACIONES_DE_PRODUCTORES_AGROPECUARIOS_DEPARTAMENTO_DE_BOYACA_20251024_ETL[,-c(1,4,5,6,7,8,9,10,11,12,13,14,15,19,21)], ncp = 6, scale.unit = TRUE, graph = F), choice = "var", axes = 2, top = 10)
La variable dominante es: Densidad de siembra por hectárea (~76%)
Le siguen, con menor aporte: - Área disponible - Rendimiento en toneladas
Interpretación
La Dimensión 3 captura la intensidad del uso del suelo.
Esta componente separa asociaciones que:
D3 se interpreta como un eje de intensificación agrícola.
fviz_contrib(PCA(ASOCIACIONES_DE_PRODUCTORES_AGROPECUARIOS_DEPARTAMENTO_DE_BOYACA_20251024_ETL[,-c(1,4,5,6,7,8,9,10,11,12,13,14,15,19,21)], ncp = 6, scale.unit = TRUE, graph = F), choice = "var", axes = 3, top = 10)
Las principales contribuciones corresponden a:
Área disponible en hectáreas (~80%)
Densidad de siembra (~19%)
Interpretación
La Dimensión 4 representa la disponibilidad de recursos físicos, particularmente tierra.
Esta dimensión distingue asociaciones que:
Disponen de grandes extensiones aún no explotadas
Tienen restricciones espaciales que afectan su potencial productivo D4 es un eje de disponibilidad territorial.
fviz_contrib(PCA(ASOCIACIONES_DE_PRODUCTORES_AGROPECUARIOS_DEPARTAMENTO_DE_BOYACA_20251024_ETL[,-c(1,4,5,6,7,8,9,10,11,12,13,14,15,19,21)], ncp = 6, scale.unit = TRUE, graph = F), choice = "var", axes = 4, top = 10)
Las variables con mayor aporte son:
Área total sembrada (~30%)
Cantidad de asociados que comercializan (~28%)
Rendimiento en toneladas (~26%)
Número total de asociados (~12%)
Interpretación
La Dimensión 5 combina producción, comercializacion y estructura organizacional, funcionando como una dimensión de articulación productiva.
Esta componente identifica asociaciones que:
Logran un equilibrio entre tamaño, producción y comercializacion
Presentan perfiles productivos más integrados
D5 puede interpretarse como un eje de consolidación productiva.
fviz_contrib(PCA(ASOCIACIONES_DE_PRODUCTORES_AGROPECUARIOS_DEPARTAMENTO_DE_BOYACA_20251024_ETL[,-c(1,4,5,6,7,8,9,10,11,12,13,14,15,19,21)], ncp = 6, scale.unit = TRUE, graph = F), choice = "var", axes = 5, top = 10)
En esta sección se integran variables y registros en el espacio factorial mediante biplots, permitiendo analizar simultáneamente: La relación entre variables cuantitativas La distribución de las observaciones La influencia de variables cualitativas como factores de segmentación
Esto facilita identificar perfiles diferenciados dentro del conjunto de datos.
El biplot muestra la proyección simultánea de las asociaciones de productores y de las variables productivas sobre los dos primeros componentes principales, los cuales explican conjuntamente una proporción relevante de la variabilidad total del conjunto de datos.
Se observa que las asociaciones que sí cuentan con servicio de comercializacion tienden a ubicarse principalmente en valores positivos del primer componente (Dim1), el cual está fuertemente asociado con el número total de asociados, el número de asociados activos y el área total sembrada. Esto indica que las asociaciones con mayor tamaño organizativo y mayor escala productiva presentan una mayor probabilidad de contar con mecanismos formales de comercializacion.
Por el contrario, las asociaciones que no cuentan con servicio de comercializacion se concentran alrededor del origen o en valores negativos de Dim1, lo que sugiere estructuras productivas más pequeñas, con menor número de asociados y menor superficie cultivada. El segundo componente (Dim2) discrimina principalmente por variables relacionadas con densidad de siembra, área disponible y participación en la venta, reflejando diferencias en la eficiencia productiva y en el aprovechamiento del suelo.
En conjunto, el biplot evidencia que la presencia de servicios de comercializacion está asociada a perfiles productivos más consolidados y organizacionalmente más robustos.
set.seed(123)
ASOCIACIONES_BIPLOT <- ASOCIACIONES_DE_PRODUCTORES_AGROPECUARIOS_DEPARTAMENTO_DE_BOYACA_20251024_ETL[
sample(1:nrow(ASOCIACIONES_DE_PRODUCTORES_AGROPECUARIOS_DEPARTAMENTO_DE_BOYACA_20251024_ETL), 100),
c(
"Numero total de asociados",
"Numero de asociados Activos",
"area total sembrada en Ha.",
"Cual es el rendimiento en toneladas",
"Area disponible en ha",
"Cuantos asociados estan vendiendo o comercializando",
"Densidad_siembraporhectarea",
"Tienen Servicio de comercializacion"
)
]
ASOCIACIONES_BIPLOT$`Tienen Servicio de comercializacion` <-
factor(ASOCIACIONES_BIPLOT$`Tienen Servicio de comercializacion`)
fviz_pca_biplot(
PCA(
ASOCIACIONES_BIPLOT,
ncp = 5,
scale.unit = TRUE,
graph = FALSE,
quali.sup = 8
),
axes = c(1,2),
repel = TRUE,
habillage = "Tienen Servicio de comercializacion"
)
En el biplot segmentado por grupo productivo, se observa una diferenciación clara entre asociaciones según el tipo de actividad agropecuaria predominante.
Los grupos como ganadería, lácteos y cultivos agroindustriales tienden a ubicarse hacia regiones del plano factorial asociadas con mayores valores del número de asociados activos, mayor área sembrada y mayor volumen de producción, lo que indica sistemas productivos más extensivos y organizados.
En contraste, grupos como hortalizas, frutas y asociaciones sin producto definido presentan una mayor dispersión y se concentran en zonas cercanas al origen del plano factorial, reflejando una mayor heterogeneidad interna, escalas productivas menores y modelos organizativos más diversos.
El segundo componente contribuye a separar asociaciones según el grado de comercializacion y densidad de siembra, mostrando que incluso dentro de un mismo grupo productivo existen diferencias importantes en la intensidad productiva y en el acceso a mercados.
set.seed(123)
ASOCIACIONES_BIPLOT <- ASOCIACIONES_DE_PRODUCTORES_AGROPECUARIOS_DEPARTAMENTO_DE_BOYACA_20251024_ETL[
sample(1:nrow(ASOCIACIONES_DE_PRODUCTORES_AGROPECUARIOS_DEPARTAMENTO_DE_BOYACA_20251024_ETL), 100),
c(
"Numero total de asociados",
"Numero de asociados Activos",
"area total sembrada en Ha.",
"Cual es el rendimiento en toneladas",
"Area disponible en ha",
"Cuantos asociados estan vendiendo o comercializando",
"Densidad_siembraporhectarea",
"Grupo"
)
]
ASOCIACIONES_BIPLOT$Grupo <- factor(ASOCIACIONES_BIPLOT$Grupo)
fviz_pca_biplot(
PCA(
ASOCIACIONES_BIPLOT,
ncp = 5,
scale.unit = TRUE,
graph = FALSE,
quali.sup = 8
),
axes = c(1,2),
repel = TRUE,
habillage = "Grupo"
)
El biplot filtrado por producto específico presenta una alta superposición de registros, lo cual es consistente con la gran diversidad de productos agropecuarios presentes en el departamento de Boyacá.
No obstante, se identifican ciertos patrones: productos asociados a cultivos permanentes o de mayor escala tienden a alinearse con variables como área total sembrada, número de asociados y participación en la comercializacion, mientras que productos de menor escala o producción más especializada aparecen cercanos al origen del plano factorial.
Esta dispersión indica que el tipo de producto por sí solo no determina completamente el perfil productivo de la asociación, sino que su impacto está mediado por el nivel de organización, el tamaño de la asociación y su capacidad de comercializacion.
set.seed(123)
ASOCIACIONES_BIPLOT <- ASOCIACIONES_DE_PRODUCTORES_AGROPECUARIOS_DEPARTAMENTO_DE_BOYACA_20251024_ETL[
sample(1:nrow(ASOCIACIONES_DE_PRODUCTORES_AGROPECUARIOS_DEPARTAMENTO_DE_BOYACA_20251024_ETL), 100),
c(
"Numero total de asociados",
"Numero de asociados Activos",
"area total sembrada en Ha.",
"Cual es el rendimiento en toneladas",
"Area disponible en ha",
"Cuantos asociados estan vendiendo o comercializando",
"Densidad_siembraporhectarea",
"Producto"
)
]
ASOCIACIONES_BIPLOT$Producto <- factor(ASOCIACIONES_BIPLOT$Producto)
fviz_pca_biplot(
PCA(
ASOCIACIONES_BIPLOT,
ncp = 5,
scale.unit = TRUE,
graph = FALSE,
quali.sup = 8
),
axes = c(1,2),
repel = TRUE,
habillage = "Producto"
)
## Warning in grid.Call.graphics(C_points, x$x, x$y, x$pch, x$size): valor pch
## '30' no implementado
## Warning in grid.Call.graphics(C_points, x$x, x$y, x$pch, x$size): valor pch
## '29' no implementado
## Warning in grid.Call.graphics(C_points, x$x, x$y, x$pch, x$size): valor pch
## '26' no implementado
## Warning in grid.Call.graphics(C_points, x$x, x$y, x$pch, x$size): valor pch
## '26' no implementado
## Warning in grid.Call.graphics(C_points, x$x, x$y, x$pch, x$size): valor pch
## '26' no implementado
## Warning in grid.Call.graphics(C_points, x$x, x$y, x$pch, x$size): valor pch
## '26' no implementado
## Warning in grid.Call.graphics(C_points, x$x, x$y, x$pch, x$size): valor pch
## '26' no implementado
## Warning in grid.Call.graphics(C_points, x$x, x$y, x$pch, x$size): valor pch
## '26' no implementado
## Warning in grid.Call.graphics(C_points, x$x, x$y, x$pch, x$size): valor pch
## '26' no implementado
## Warning in grid.Call.graphics(C_points, x$x, x$y, x$pch, x$size): valor pch
## '26' no implementado
## Warning in grid.Call.graphics(C_points, x$x, x$y, x$pch, x$size): valor pch
## '26' no implementado
## Warning in grid.Call.graphics(C_points, x$x, x$y, x$pch, x$size): valor pch
## '26' no implementado
## Warning in grid.Call.graphics(C_points, x$x, x$y, x$pch, x$size): valor pch
## '28' no implementado
## Warning in grid.Call.graphics(C_points, x$x, x$y, x$pch, x$size): valor pch
## '26' no implementado
## Warning in grid.Call.graphics(C_points, x$x, x$y, x$pch, x$size): valor pch
## '26' no implementado
## Warning in grid.Call.graphics(C_points, x$x, x$y, x$pch, x$size): valor pch
## '26' no implementado
## Warning in grid.Call.graphics(C_points, x$x, x$y, x$pch, x$size): valor pch
## '26' no implementado
## Warning in grid.Call.graphics(C_points, x$x, x$y, x$pch, x$size): valor pch
## '26' no implementado
## Warning in grid.Call.graphics(C_points, x$x, x$y, x$pch, x$size): valor pch
## '26' no implementado
## Warning in grid.Call.graphics(C_points, x$x, x$y, x$pch, x$size): valor pch
## '26' no implementado
## Warning in grid.Call.graphics(C_points, x$x, x$y, x$pch, x$size): valor pch
## '31' no implementado
## Warning in grid.Call.graphics(C_points, x$x, x$y, x$pch, x$size): valor pch
## '26' no implementado
## Warning in grid.Call.graphics(C_points, x$x, x$y, x$pch, x$size): valor pch
## '27' no implementado
## Warning in grid.Call.graphics(C_points, x$x, x$y, x$pch, x$size): valor pch
## '26' no implementado
## Warning in grid.Call.graphics(C_points, x$x, x$y, x$pch, x$size): valor pch
## '26' no implementado
## Warning in grid.Call.graphics(C_points, x$x, x$y, x$pch, x$size): valor pch
## '27' no implementado
## Warning in grid.Call.graphics(C_points, x$x, x$y, x$pch, x$size): valor pch
## '28' no implementado
## Warning in grid.Call.graphics(C_points, x$x, x$y, x$pch, x$size): valor pch
## '29' no implementado
## Warning in grid.Call.graphics(C_points, x$x, x$y, x$pch, x$size): valor pch
## '30' no implementado
## Warning in grid.Call.graphics(C_points, x$x, x$y, x$pch, x$size): valor pch
## '31' no implementado
## Warning in grid.Call.graphics(C_points, x$x, x$y, x$pch, x$size): valor pch
## '26' no implementado
## Warning in grid.Call.graphics(C_points, x$x, x$y, x$pch, x$size): valor pch
## '26' no implementado
## Warning in grid.Call.graphics(C_points, x$x, x$y, x$pch, x$size): valor pch
## '27' no implementado
## Warning in grid.Call.graphics(C_points, x$x, x$y, x$pch, x$size): valor pch
## '27' no implementado
## Warning in grid.Call.graphics(C_points, x$x, x$y, x$pch, x$size): valor pch
## '28' no implementado
## Warning in grid.Call.graphics(C_points, x$x, x$y, x$pch, x$size): valor pch
## '28' no implementado
## Warning in grid.Call.graphics(C_points, x$x, x$y, x$pch, x$size): valor pch
## '29' no implementado
## Warning in grid.Call.graphics(C_points, x$x, x$y, x$pch, x$size): valor pch
## '29' no implementado
## Warning in grid.Call.graphics(C_points, x$x, x$y, x$pch, x$size): valor pch
## '30' no implementado
## Warning in grid.Call.graphics(C_points, x$x, x$y, x$pch, x$size): valor pch
## '30' no implementado
## Warning in grid.Call.graphics(C_points, x$x, x$y, x$pch, x$size): valor pch
## '31' no implementado
## Warning in grid.Call.graphics(C_points, x$x, x$y, x$pch, x$size): valor pch
## '31' no implementado
Las coordenadas individuales permiten identificar la posición específica de cada asociación en el espacio factorial definido por los componentes principales.
Se observa que aquellas asociaciones con valores extremos en Dim1 corresponden a asociaciones con mayor número de asociados activos y mayor superficie cultivada, confirmando el papel dominante de estas variables en la estructuración del primer componente. Las asociaciones con valores elevados en Dim2 presentan diferencias marcadas en densidad de siembra, área disponible y nivel de comercializacion, lo que sugiere distintos modelos de uso del suelo y estrategias productivas.
La dispersión de los individuos indica una alta heterogeneidad estructural entre asociaciones de productores agropecuarios en Boyacá, lo cual justifica el uso de técnicas multivariadas para identificar perfiles productivos diferenciados y orientar posteriores análisis de correspondencias y segmentación.
En esta tercera fase del estudio, se presentan los cálculos, visualizaciones e interpretaciones elaboradas a partir del conjunto de datos trabajado en la fase 1 Y la fase 2.
Esta etapa se centra en la aplicación de análisis de correspondencias simples (ACS) y análisis de correspondencias múltiples (ACM) sobre las variables cualitativas que describen a las asociaciones de productores del departamento de Boyacá, tales como: Tipo de producto ofrecido, Servicios de comercializacion, Nivel de valor agregado. El desarrollo de esta fase incluye: La construcción de tablas de contingencia entre pares de variables categóricas, La generación de tablas disyuntivas completas para el ACM, La evaluación de calidades de representación de las categorías en los planos factoriales, El análisis de contribuciones y relevancia de las modalidades para la formación de las dimensiones, Y la interpretación detallada de los patrones de asociación presentes entre los perfiles productivos, comerciales y de transformación de las asociaciones. Este enfoque permite profundizar en la estructura cualitativa del sistema agro productivo, ofreciendo una comprensión clara de cómo se relacionan entre sí los atributos que caracterizan a las asociaciones del departamento.
El objetivo de esta fase es analizar la relación existente entre variables cualitativas asociadas a las asociaciones de productores agropecuarios del departamento de Boyacá,
Según (Aldás & Uriel, 2017),el análisis de correspondencias simple (ACS) tiene como propósito reducir la dimensionalidad de las relaciones entre categorías de dos variables categóricas, representándolas en un espacio multidimensional. Este método permite analizar gráficamente las distancias entre las categorías de las variables, facilitando la interpretación de tablas de contingencia. El número máximo de dimensiones necesarias para explicar dichas relaciones corresponde a uno menos el número de categorías de la variable con menor cantidad de niveles.
Asimismo, el ACS, basado en tablas de contingencia, puede ampliarse para incluir más de dos variables categóricas, lo que se conoce como Análisis de correspondencias múltiples (ACM). Este enfoque utiliza una tabla disyuntiva completa, permitiendo explorar y representar relaciones más complejas entre múltiples variables categóricas.
En la tabla Grupo vs “Tienen servicio de comercializacion” (No/Si) se observa que la mayor parte de asociaciones se concentran en los grupos Fruta, Cultivos Agroindustriales y Lácteos, con predominio de la respuesta “No” en casi todos los grupos.
Ejemplos visibles en la tabla:
Fruta: 72 “No” y 18 “Sí” → es el grupo con más asociaciones en general.
Cultivos agroindustriales: 62 “No” y 19 “Sí” → alto volumen, pero mayoría “No”.
Lácteos: 58 “No” y 40 “Sí” → destaca porque tiene una proporción alta de “Sí”.
Tubérculo: 47 “No” y 13 “Sí” → mayoría “No”.
Grupos con muy pocos casos (p. ej., Artesanías, Hierbas) aparecen con conteos bajos, lo cual afecta pruebas y lecturas (por eso luego sale la advertencia del chi-cuadrado).
# Datos base (solo cualitativas)
ASOC_CA <- ASOCIACIONES_DE_PRODUCTORES_AGROPECUARIOS_DEPARTAMENTO_DE_BOYACA_20251024_ETL[
, c("Tienen Servicio de comercializacion", "Grupo", "Producto")
]
# Quitar NA (si existieran)
ASOC_CA <- na.omit(ASOC_CA)
# Tablas de contingencia (Parejas)
TAB_GxC <- table(ASOC_CA$Grupo, ASOC_CA$`Tienen Servicio de comercializacion`)
TAB_PxC <- table(ASOC_CA$Producto, ASOC_CA$`Tienen Servicio de comercializacion`)
TAB_GxP <- table(ASOC_CA$Grupo, ASOC_CA$Producto)
TAB_GxC
##
## No Si
## Artesanias 1 1
## Cereales 16 2
## Cultivos Agroindustriales 62 19
## Fruta 72 18
## Ganaderia 43 4
## Hierbas 1 1
## Hortaliza/Vegetal 27 6
## Lacteos 58 40
## Leguminosa 16 1
## Pastos 3 5
## Peces 12 2
## Sin producto 9 0
## Tuberculo 47 13
TAB_PxC
##
## No Si
## Agraz 0 3
## Aguacate 4 0
## Aguacate Hass 2 0
## Ahuyama 1 0
## Alfalfa 0 2
## Arandanos 1 0
## Araza 0 1
## Aromaticas 0 1
## Arracacha 2 0
## Arveja 7 0
## Avicolas 1 0
## Brocoli 1 0
## Cacao 8 4
## Cachama 2 0
## Caducifolios, Pera Manzana Y Ciruela 1 0
## Café 28 6
## Caña 5 2
## Caña Panelera 1 0
## Caprinos 2 0
## Cebada 3 0
## Cebada Y Trigo 2 0
## Cebolla 3 1
## Cebolla De Bulbo 1 0
## Cerdos 2 0
## Chamba (Campomanesia Lineatifolia) 1 1
## Cilantro 1 0
## Ciruela 1 1
## Conejo 1 1
## Corderos 2 0
## Críticos 1 0
## Curuba 1 0
## Datil 0 1
## Durazno 6 3
## Encuestada Sin Producto 9 0
## Forrajes 1 1
## Freijoa 1 0
## Frijol 8 1
## Frijol Verde 1 0
## Frutales 4 0
## Ganadería 15 0
## Ganadería Carne 2 1
## Gandería Doble Proposito 5 1
## Granadilla 1 0
## Granola 1 0
## Guanabana 3 0
## Guayaba 3 0
## Gulupa 5 0
## Harina De Alfalfa 1 1
## Hortalizas 10 2
## Huevos 3 0
## Lacteos 1 0
## Leche 56 35
## Leche De Cabra 0 2
## Lechuga 1 1
## Limon Tahití 2 1
## Lulo 2 1
## Maíz 6 1
## Manzana 1 0
## Manzana Y Pera 1 0
## Miel De Abeja 5 3
## Mojarra 3 0
## Mora 11 6
## Naranja 2 0
## Ovinos Y Caprinos 6 0
## Panela 13 4
## Papa 43 12
## Papa Nativa 0 1
## Papayuela 2 0
## Pera 1 0
## Piscicultura 5 1
## Pitaya 2 1
## Pollo 3 1
## Queso 1 2
## Quinua 3 1
## Sabila 1 0
## Sagu 2 0
## Siembra Y Produccion De Chin "Caña Brava - De Castilla" 1 0
## Silo 1 0
## Silo De Avena 0 1
## Tilapia 1 0
## Tomate 5 2
## Tomate De Arbol 4 0
## Transformacion De Lacteos 0 1
## Trucha Arcoiris 1 1
## Uchuva 9 0
## Venta De Animales En Pie 1 0
## Yuca 2 0
## Zanahoria 5 0
TAB_GxP
##
## Agraz Aguacate Aguacate Hass Ahuyama Alfalfa
## Artesanias 0 0 0 0 0
## Cereales 0 0 0 0 0
## Cultivos Agroindustriales 0 0 0 0 0
## Fruta 3 4 2 0 0
## Ganaderia 0 0 0 0 0
## Hierbas 0 0 0 0 0
## Hortaliza/Vegetal 0 0 0 1 0
## Lacteos 0 0 0 0 0
## Leguminosa 0 0 0 0 0
## Pastos 0 0 0 0 2
## Peces 0 0 0 0 0
## Sin producto 0 0 0 0 0
## Tuberculo 0 0 0 0 0
##
## Arandanos Araza Aromaticas Arracacha Arveja
## Artesanias 0 0 0 0 0
## Cereales 0 0 0 0 0
## Cultivos Agroindustriales 0 0 0 0 0
## Fruta 1 1 0 0 0
## Ganaderia 0 0 0 0 0
## Hierbas 0 0 1 0 0
## Hortaliza/Vegetal 0 0 0 0 0
## Lacteos 0 0 0 0 0
## Leguminosa 0 0 0 0 7
## Pastos 0 0 0 0 0
## Peces 0 0 0 0 0
## Sin producto 0 0 0 0 0
## Tuberculo 0 0 0 2 0
##
## Avicolas Brocoli Cacao Cachama
## Artesanias 0 0 0 0
## Cereales 0 0 0 0
## Cultivos Agroindustriales 0 0 12 0
## Fruta 0 0 0 0
## Ganaderia 1 0 0 0
## Hierbas 0 0 0 0
## Hortaliza/Vegetal 0 1 0 0
## Lacteos 0 0 0 0
## Leguminosa 0 0 0 0
## Pastos 0 0 0 0
## Peces 0 0 0 2
## Sin producto 0 0 0 0
## Tuberculo 0 0 0 0
##
## Caducifolios, Pera Manzana Y Ciruela Café Caña
## Artesanias 0 0 0
## Cereales 0 0 0
## Cultivos Agroindustriales 0 34 7
## Fruta 1 0 0
## Ganaderia 0 0 0
## Hierbas 0 0 0
## Hortaliza/Vegetal 0 0 0
## Lacteos 0 0 0
## Leguminosa 0 0 0
## Pastos 0 0 0
## Peces 0 0 0
## Sin producto 0 0 0
## Tuberculo 0 0 0
##
## Caña Panelera Caprinos Cebada Cebada Y Trigo
## Artesanias 0 0 0 0
## Cereales 0 0 3 2
## Cultivos Agroindustriales 1 0 0 0
## Fruta 0 0 0 0
## Ganaderia 0 2 0 0
## Hierbas 0 0 0 0
## Hortaliza/Vegetal 0 0 0 0
## Lacteos 0 0 0 0
## Leguminosa 0 0 0 0
## Pastos 0 0 0 0
## Peces 0 0 0 0
## Sin producto 0 0 0 0
## Tuberculo 0 0 0 0
##
## Cebolla Cebolla De Bulbo Cerdos
## Artesanias 0 0 0
## Cereales 0 0 0
## Cultivos Agroindustriales 0 0 0
## Fruta 0 0 0
## Ganaderia 0 0 2
## Hierbas 0 0 0
## Hortaliza/Vegetal 4 1 0
## Lacteos 0 0 0
## Leguminosa 0 0 0
## Pastos 0 0 0
## Peces 0 0 0
## Sin producto 0 0 0
## Tuberculo 0 0 0
##
## Chamba (Campomanesia Lineatifolia) Cilantro Ciruela
## Artesanias 2 0 0
## Cereales 0 0 0
## Cultivos Agroindustriales 0 0 0
## Fruta 0 0 2
## Ganaderia 0 0 0
## Hierbas 0 1 0
## Hortaliza/Vegetal 0 0 0
## Lacteos 0 0 0
## Leguminosa 0 0 0
## Pastos 0 0 0
## Peces 0 0 0
## Sin producto 0 0 0
## Tuberculo 0 0 0
##
## Conejo Corderos Críticos Curuba Datil Durazno
## Artesanias 0 0 0 0 0 0
## Cereales 0 0 0 0 0 0
## Cultivos Agroindustriales 0 0 0 0 0 0
## Fruta 0 0 1 1 1 9
## Ganaderia 2 2 0 0 0 0
## Hierbas 0 0 0 0 0 0
## Hortaliza/Vegetal 0 0 0 0 0 0
## Lacteos 0 0 0 0 0 0
## Leguminosa 0 0 0 0 0 0
## Pastos 0 0 0 0 0 0
## Peces 0 0 0 0 0 0
## Sin producto 0 0 0 0 0 0
## Tuberculo 0 0 0 0 0 0
##
## Encuestada Sin Producto Forrajes Freijoa Frijol
## Artesanias 0 0 0 0
## Cereales 0 0 0 0
## Cultivos Agroindustriales 0 0 0 0
## Fruta 0 0 1 0
## Ganaderia 0 0 0 0
## Hierbas 0 0 0 0
## Hortaliza/Vegetal 0 0 0 0
## Lacteos 0 0 0 0
## Leguminosa 0 0 0 9
## Pastos 0 2 0 0
## Peces 0 0 0 0
## Sin producto 9 0 0 0
## Tuberculo 0 0 0 0
##
## Frijol Verde Frutales Ganadería Ganadería Carne
## Artesanias 0 0 0 0
## Cereales 0 0 0 0
## Cultivos Agroindustriales 0 0 0 0
## Fruta 0 4 0 0
## Ganaderia 0 0 15 3
## Hierbas 0 0 0 0
## Hortaliza/Vegetal 0 0 0 0
## Lacteos 0 0 0 0
## Leguminosa 1 0 0 0
## Pastos 0 0 0 0
## Peces 0 0 0 0
## Sin producto 0 0 0 0
## Tuberculo 0 0 0 0
##
## Gandería Doble Proposito Granadilla Granola
## Artesanias 0 0 0
## Cereales 0 0 0
## Cultivos Agroindustriales 0 0 0
## Fruta 0 1 1
## Ganaderia 6 0 0
## Hierbas 0 0 0
## Hortaliza/Vegetal 0 0 0
## Lacteos 0 0 0
## Leguminosa 0 0 0
## Pastos 0 0 0
## Peces 0 0 0
## Sin producto 0 0 0
## Tuberculo 0 0 0
##
## Guanabana Guayaba Gulupa Harina De Alfalfa
## Artesanias 0 0 0 0
## Cereales 0 0 0 0
## Cultivos Agroindustriales 0 0 0 0
## Fruta 3 3 5 0
## Ganaderia 0 0 0 0
## Hierbas 0 0 0 0
## Hortaliza/Vegetal 0 0 0 0
## Lacteos 0 0 0 0
## Leguminosa 0 0 0 0
## Pastos 0 0 0 2
## Peces 0 0 0 0
## Sin producto 0 0 0 0
## Tuberculo 0 0 0 0
##
## Hortalizas Huevos Lacteos Leche Leche De Cabra
## Artesanias 0 0 0 0 0
## Cereales 0 0 0 0 0
## Cultivos Agroindustriales 0 0 0 0 0
## Fruta 0 0 0 0 0
## Ganaderia 0 3 0 0 0
## Hierbas 0 0 0 0 0
## Hortaliza/Vegetal 12 0 0 0 0
## Lacteos 0 0 1 91 2
## Leguminosa 0 0 0 0 0
## Pastos 0 0 0 0 0
## Peces 0 0 0 0 0
## Sin producto 0 0 0 0 0
## Tuberculo 0 0 0 0 0
##
## Lechuga Limon Tahití Lulo Maíz Manzana
## Artesanias 0 0 0 0 0
## Cereales 0 0 0 7 0
## Cultivos Agroindustriales 0 0 0 0 0
## Fruta 0 3 3 0 1
## Ganaderia 0 0 0 0 0
## Hierbas 0 0 0 0 0
## Hortaliza/Vegetal 2 0 0 0 0
## Lacteos 0 0 0 0 0
## Leguminosa 0 0 0 0 0
## Pastos 0 0 0 0 0
## Peces 0 0 0 0 0
## Sin producto 0 0 0 0 0
## Tuberculo 0 0 0 0 0
##
## Manzana Y Pera Miel De Abeja Mojarra Mora Naranja
## Artesanias 0 0 0 0 0
## Cereales 0 0 0 0 0
## Cultivos Agroindustriales 0 8 0 0 0
## Fruta 1 0 0 17 2
## Ganaderia 0 0 0 0 0
## Hierbas 0 0 0 0 0
## Hortaliza/Vegetal 0 0 0 0 0
## Lacteos 0 0 0 0 0
## Leguminosa 0 0 0 0 0
## Pastos 0 0 0 0 0
## Peces 0 0 3 0 0
## Sin producto 0 0 0 0 0
## Tuberculo 0 0 0 0 0
##
## Ovinos Y Caprinos Panela Papa Papa Nativa Papayuela
## Artesanias 0 0 0 0 0
## Cereales 0 0 0 0 0
## Cultivos Agroindustriales 0 17 0 0 0
## Fruta 0 0 0 0 2
## Ganaderia 6 0 0 0 0
## Hierbas 0 0 0 0 0
## Hortaliza/Vegetal 0 0 0 0 0
## Lacteos 0 0 0 0 0
## Leguminosa 0 0 0 0 0
## Pastos 0 0 0 0 0
## Peces 0 0 0 0 0
## Sin producto 0 0 0 0 0
## Tuberculo 0 0 55 1 0
##
## Pera Piscicultura Pitaya Pollo Queso Quinua Sabila
## Artesanias 0 0 0 0 0 0 0
## Cereales 0 0 0 0 0 4 0
## Cultivos Agroindustriales 0 0 0 0 0 0 1
## Fruta 1 0 3 0 0 0 0
## Ganaderia 0 0 0 4 0 0 0
## Hierbas 0 0 0 0 0 0 0
## Hortaliza/Vegetal 0 0 0 0 0 0 0
## Lacteos 0 0 0 0 3 0 0
## Leguminosa 0 0 0 0 0 0 0
## Pastos 0 0 0 0 0 0 0
## Peces 0 6 0 0 0 0 0
## Sin producto 0 0 0 0 0 0 0
## Tuberculo 0 0 0 0 0 0 0
##
## Sagu
## Artesanias 0
## Cereales 2
## Cultivos Agroindustriales 0
## Fruta 0
## Ganaderia 0
## Hierbas 0
## Hortaliza/Vegetal 0
## Lacteos 0
## Leguminosa 0
## Pastos 0
## Peces 0
## Sin producto 0
## Tuberculo 0
##
## Siembra Y Produccion De Chin "Caña Brava - De Castilla"
## Artesanias 0
## Cereales 0
## Cultivos Agroindustriales 1
## Fruta 0
## Ganaderia 0
## Hierbas 0
## Hortaliza/Vegetal 0
## Lacteos 0
## Leguminosa 0
## Pastos 0
## Peces 0
## Sin producto 0
## Tuberculo 0
##
## Silo Silo De Avena Tilapia Tomate Tomate De Arbol
## Artesanias 0 0 0 0 0
## Cereales 0 0 0 0 0
## Cultivos Agroindustriales 0 0 0 0 0
## Fruta 0 0 0 0 4
## Ganaderia 0 0 0 0 0
## Hierbas 0 0 0 0 0
## Hortaliza/Vegetal 0 0 0 7 0
## Lacteos 0 0 0 0 0
## Leguminosa 0 0 0 0 0
## Pastos 1 1 0 0 0
## Peces 0 0 1 0 0
## Sin producto 0 0 0 0 0
## Tuberculo 0 0 0 0 0
##
## Transformacion De Lacteos Trucha Arcoiris Uchuva
## Artesanias 0 0 0
## Cereales 0 0 0
## Cultivos Agroindustriales 0 0 0
## Fruta 0 0 9
## Ganaderia 0 0 0
## Hierbas 0 0 0
## Hortaliza/Vegetal 0 0 0
## Lacteos 1 0 0
## Leguminosa 0 0 0
## Pastos 0 0 0
## Peces 0 2 0
## Sin producto 0 0 0
## Tuberculo 0 0 0
##
## Venta De Animales En Pie Yuca Zanahoria
## Artesanias 0 0 0
## Cereales 0 0 0
## Cultivos Agroindustriales 0 0 0
## Fruta 0 0 0
## Ganaderia 1 0 0
## Hierbas 0 0 0
## Hortaliza/Vegetal 0 0 5
## Lacteos 0 0 0
## Leguminosa 0 0 0
## Pastos 0 0 0
## Peces 0 0 0
## Sin producto 0 0 0
## Tuberculo 0 2 0
Estas probabilidades indican qué fracción del total cae en cada celda (grupo–respuesta).
En los resultados:
Fruta–No = 0.1503 (15.03% del total): es una de las celdas más grandes del conjunto.
Lácteos–No = 0.1211 y Lácteos–Sí = 0.0835: Lácteos concentra una parte importante del total, y además tiene una presencia notable de “Sí”.
Cultivos Agroindustriales–No = 0.1294 y –Sí = 0.0397: mucha masa en “No”.
Tubérculo–No = 0.0981 y –Sí = 0.0271: también representa una fracción relevante.
Lectura clave: la distribución global está dominada por pocos grupos (Fruta, Cultivos agroindustriales, Lácteos, Tubérculo), y en casi todos pesa más “No”, excepto que Lácteos se acerca bastante al equilibrio.
Esta tabla es enorme y está llena de ceros → estructura muy esparcida: la mayoría de combinaciones grupo–producto no aparecen.
Lo importante aquí no es leer cada celda, sino reconocer:
Algunos productos se concentran en ciertos grupos (por definición productiva).
Al existir muchas celdas con valores muy pequeños, el análisis inferencial (chi²) tiende a marcar asociación casi siempre.
# Probabilidades conjuntas (cada celda / total)
round(prop.table(TAB_GxC), 4)
##
## No Si
## Artesanias 0.0021 0.0021
## Cereales 0.0334 0.0042
## Cultivos Agroindustriales 0.1294 0.0397
## Fruta 0.1503 0.0376
## Ganaderia 0.0898 0.0084
## Hierbas 0.0021 0.0021
## Hortaliza/Vegetal 0.0564 0.0125
## Lacteos 0.1211 0.0835
## Leguminosa 0.0334 0.0021
## Pastos 0.0063 0.0104
## Peces 0.0251 0.0042
## Sin producto 0.0188 0.0000
## Tuberculo 0.0981 0.0271
round(prop.table(TAB_PxC), 4)
##
## No Si
## Agraz 0.0000 0.0063
## Aguacate 0.0084 0.0000
## Aguacate Hass 0.0042 0.0000
## Ahuyama 0.0021 0.0000
## Alfalfa 0.0000 0.0042
## Arandanos 0.0021 0.0000
## Araza 0.0000 0.0021
## Aromaticas 0.0000 0.0021
## Arracacha 0.0042 0.0000
## Arveja 0.0146 0.0000
## Avicolas 0.0021 0.0000
## Brocoli 0.0021 0.0000
## Cacao 0.0167 0.0084
## Cachama 0.0042 0.0000
## Caducifolios, Pera Manzana Y Ciruela 0.0021 0.0000
## Café 0.0585 0.0125
## Caña 0.0104 0.0042
## Caña Panelera 0.0021 0.0000
## Caprinos 0.0042 0.0000
## Cebada 0.0063 0.0000
## Cebada Y Trigo 0.0042 0.0000
## Cebolla 0.0063 0.0021
## Cebolla De Bulbo 0.0021 0.0000
## Cerdos 0.0042 0.0000
## Chamba (Campomanesia Lineatifolia) 0.0021 0.0021
## Cilantro 0.0021 0.0000
## Ciruela 0.0021 0.0021
## Conejo 0.0021 0.0021
## Corderos 0.0042 0.0000
## Críticos 0.0021 0.0000
## Curuba 0.0021 0.0000
## Datil 0.0000 0.0021
## Durazno 0.0125 0.0063
## Encuestada Sin Producto 0.0188 0.0000
## Forrajes 0.0021 0.0021
## Freijoa 0.0021 0.0000
## Frijol 0.0167 0.0021
## Frijol Verde 0.0021 0.0000
## Frutales 0.0084 0.0000
## Ganadería 0.0313 0.0000
## Ganadería Carne 0.0042 0.0021
## Gandería Doble Proposito 0.0104 0.0021
## Granadilla 0.0021 0.0000
## Granola 0.0021 0.0000
## Guanabana 0.0063 0.0000
## Guayaba 0.0063 0.0000
## Gulupa 0.0104 0.0000
## Harina De Alfalfa 0.0021 0.0021
## Hortalizas 0.0209 0.0042
## Huevos 0.0063 0.0000
## Lacteos 0.0021 0.0000
## Leche 0.1169 0.0731
## Leche De Cabra 0.0000 0.0042
## Lechuga 0.0021 0.0021
## Limon Tahití 0.0042 0.0021
## Lulo 0.0042 0.0021
## Maíz 0.0125 0.0021
## Manzana 0.0021 0.0000
## Manzana Y Pera 0.0021 0.0000
## Miel De Abeja 0.0104 0.0063
## Mojarra 0.0063 0.0000
## Mora 0.0230 0.0125
## Naranja 0.0042 0.0000
## Ovinos Y Caprinos 0.0125 0.0000
## Panela 0.0271 0.0084
## Papa 0.0898 0.0251
## Papa Nativa 0.0000 0.0021
## Papayuela 0.0042 0.0000
## Pera 0.0021 0.0000
## Piscicultura 0.0104 0.0021
## Pitaya 0.0042 0.0021
## Pollo 0.0063 0.0021
## Queso 0.0021 0.0042
## Quinua 0.0063 0.0021
## Sabila 0.0021 0.0000
## Sagu 0.0042 0.0000
## Siembra Y Produccion De Chin "Caña Brava - De Castilla" 0.0021 0.0000
## Silo 0.0021 0.0000
## Silo De Avena 0.0000 0.0021
## Tilapia 0.0021 0.0000
## Tomate 0.0104 0.0042
## Tomate De Arbol 0.0084 0.0000
## Transformacion De Lacteos 0.0000 0.0021
## Trucha Arcoiris 0.0021 0.0021
## Uchuva 0.0188 0.0000
## Venta De Animales En Pie 0.0021 0.0000
## Yuca 0.0042 0.0000
## Zanahoria 0.0104 0.0000
round(prop.table(TAB_GxP), 4)
##
## Agraz Aguacate Aguacate Hass Ahuyama Alfalfa
## Artesanias 0.0000 0.0000 0.0000 0.0000 0.0000
## Cereales 0.0000 0.0000 0.0000 0.0000 0.0000
## Cultivos Agroindustriales 0.0000 0.0000 0.0000 0.0000 0.0000
## Fruta 0.0063 0.0084 0.0042 0.0000 0.0000
## Ganaderia 0.0000 0.0000 0.0000 0.0000 0.0000
## Hierbas 0.0000 0.0000 0.0000 0.0000 0.0000
## Hortaliza/Vegetal 0.0000 0.0000 0.0000 0.0021 0.0000
## Lacteos 0.0000 0.0000 0.0000 0.0000 0.0000
## Leguminosa 0.0000 0.0000 0.0000 0.0000 0.0000
## Pastos 0.0000 0.0000 0.0000 0.0000 0.0042
## Peces 0.0000 0.0000 0.0000 0.0000 0.0000
## Sin producto 0.0000 0.0000 0.0000 0.0000 0.0000
## Tuberculo 0.0000 0.0000 0.0000 0.0000 0.0000
##
## Arandanos Araza Aromaticas Arracacha Arveja
## Artesanias 0.0000 0.0000 0.0000 0.0000 0.0000
## Cereales 0.0000 0.0000 0.0000 0.0000 0.0000
## Cultivos Agroindustriales 0.0000 0.0000 0.0000 0.0000 0.0000
## Fruta 0.0021 0.0021 0.0000 0.0000 0.0000
## Ganaderia 0.0000 0.0000 0.0000 0.0000 0.0000
## Hierbas 0.0000 0.0000 0.0021 0.0000 0.0000
## Hortaliza/Vegetal 0.0000 0.0000 0.0000 0.0000 0.0000
## Lacteos 0.0000 0.0000 0.0000 0.0000 0.0000
## Leguminosa 0.0000 0.0000 0.0000 0.0000 0.0146
## Pastos 0.0000 0.0000 0.0000 0.0000 0.0000
## Peces 0.0000 0.0000 0.0000 0.0000 0.0000
## Sin producto 0.0000 0.0000 0.0000 0.0000 0.0000
## Tuberculo 0.0000 0.0000 0.0000 0.0042 0.0000
##
## Avicolas Brocoli Cacao Cachama
## Artesanias 0.0000 0.0000 0.0000 0.0000
## Cereales 0.0000 0.0000 0.0000 0.0000
## Cultivos Agroindustriales 0.0000 0.0000 0.0251 0.0000
## Fruta 0.0000 0.0000 0.0000 0.0000
## Ganaderia 0.0021 0.0000 0.0000 0.0000
## Hierbas 0.0000 0.0000 0.0000 0.0000
## Hortaliza/Vegetal 0.0000 0.0021 0.0000 0.0000
## Lacteos 0.0000 0.0000 0.0000 0.0000
## Leguminosa 0.0000 0.0000 0.0000 0.0000
## Pastos 0.0000 0.0000 0.0000 0.0000
## Peces 0.0000 0.0000 0.0000 0.0042
## Sin producto 0.0000 0.0000 0.0000 0.0000
## Tuberculo 0.0000 0.0000 0.0000 0.0000
##
## Caducifolios, Pera Manzana Y Ciruela Café Caña
## Artesanias 0.0000 0.0000 0.0000
## Cereales 0.0000 0.0000 0.0000
## Cultivos Agroindustriales 0.0000 0.0710 0.0146
## Fruta 0.0021 0.0000 0.0000
## Ganaderia 0.0000 0.0000 0.0000
## Hierbas 0.0000 0.0000 0.0000
## Hortaliza/Vegetal 0.0000 0.0000 0.0000
## Lacteos 0.0000 0.0000 0.0000
## Leguminosa 0.0000 0.0000 0.0000
## Pastos 0.0000 0.0000 0.0000
## Peces 0.0000 0.0000 0.0000
## Sin producto 0.0000 0.0000 0.0000
## Tuberculo 0.0000 0.0000 0.0000
##
## Caña Panelera Caprinos Cebada Cebada Y Trigo
## Artesanias 0.0000 0.0000 0.0000 0.0000
## Cereales 0.0000 0.0000 0.0063 0.0042
## Cultivos Agroindustriales 0.0021 0.0000 0.0000 0.0000
## Fruta 0.0000 0.0000 0.0000 0.0000
## Ganaderia 0.0000 0.0042 0.0000 0.0000
## Hierbas 0.0000 0.0000 0.0000 0.0000
## Hortaliza/Vegetal 0.0000 0.0000 0.0000 0.0000
## Lacteos 0.0000 0.0000 0.0000 0.0000
## Leguminosa 0.0000 0.0000 0.0000 0.0000
## Pastos 0.0000 0.0000 0.0000 0.0000
## Peces 0.0000 0.0000 0.0000 0.0000
## Sin producto 0.0000 0.0000 0.0000 0.0000
## Tuberculo 0.0000 0.0000 0.0000 0.0000
##
## Cebolla Cebolla De Bulbo Cerdos
## Artesanias 0.0000 0.0000 0.0000
## Cereales 0.0000 0.0000 0.0000
## Cultivos Agroindustriales 0.0000 0.0000 0.0000
## Fruta 0.0000 0.0000 0.0000
## Ganaderia 0.0000 0.0000 0.0042
## Hierbas 0.0000 0.0000 0.0000
## Hortaliza/Vegetal 0.0084 0.0021 0.0000
## Lacteos 0.0000 0.0000 0.0000
## Leguminosa 0.0000 0.0000 0.0000
## Pastos 0.0000 0.0000 0.0000
## Peces 0.0000 0.0000 0.0000
## Sin producto 0.0000 0.0000 0.0000
## Tuberculo 0.0000 0.0000 0.0000
##
## Chamba (Campomanesia Lineatifolia) Cilantro Ciruela
## Artesanias 0.0042 0.0000 0.0000
## Cereales 0.0000 0.0000 0.0000
## Cultivos Agroindustriales 0.0000 0.0000 0.0000
## Fruta 0.0000 0.0000 0.0042
## Ganaderia 0.0000 0.0000 0.0000
## Hierbas 0.0000 0.0021 0.0000
## Hortaliza/Vegetal 0.0000 0.0000 0.0000
## Lacteos 0.0000 0.0000 0.0000
## Leguminosa 0.0000 0.0000 0.0000
## Pastos 0.0000 0.0000 0.0000
## Peces 0.0000 0.0000 0.0000
## Sin producto 0.0000 0.0000 0.0000
## Tuberculo 0.0000 0.0000 0.0000
##
## Conejo Corderos Críticos Curuba Datil Durazno
## Artesanias 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
## Cereales 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
## Cultivos Agroindustriales 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
## Fruta 0.0000 0.0000 0.0021 0.0021 0.0021 0.0188
## Ganaderia 0.0042 0.0042 0.0000 0.0000 0.0000 0.0000
## Hierbas 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
## Hortaliza/Vegetal 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
## Lacteos 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
## Leguminosa 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
## Pastos 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
## Peces 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
## Sin producto 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
## Tuberculo 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
##
## Encuestada Sin Producto Forrajes Freijoa Frijol
## Artesanias 0.0000 0.0000 0.0000 0.0000
## Cereales 0.0000 0.0000 0.0000 0.0000
## Cultivos Agroindustriales 0.0000 0.0000 0.0000 0.0000
## Fruta 0.0000 0.0000 0.0021 0.0000
## Ganaderia 0.0000 0.0000 0.0000 0.0000
## Hierbas 0.0000 0.0000 0.0000 0.0000
## Hortaliza/Vegetal 0.0000 0.0000 0.0000 0.0000
## Lacteos 0.0000 0.0000 0.0000 0.0000
## Leguminosa 0.0000 0.0000 0.0000 0.0188
## Pastos 0.0000 0.0042 0.0000 0.0000
## Peces 0.0000 0.0000 0.0000 0.0000
## Sin producto 0.0188 0.0000 0.0000 0.0000
## Tuberculo 0.0000 0.0000 0.0000 0.0000
##
## Frijol Verde Frutales Ganadería Ganadería Carne
## Artesanias 0.0000 0.0000 0.0000 0.0000
## Cereales 0.0000 0.0000 0.0000 0.0000
## Cultivos Agroindustriales 0.0000 0.0000 0.0000 0.0000
## Fruta 0.0000 0.0084 0.0000 0.0000
## Ganaderia 0.0000 0.0000 0.0313 0.0063
## Hierbas 0.0000 0.0000 0.0000 0.0000
## Hortaliza/Vegetal 0.0000 0.0000 0.0000 0.0000
## Lacteos 0.0000 0.0000 0.0000 0.0000
## Leguminosa 0.0021 0.0000 0.0000 0.0000
## Pastos 0.0000 0.0000 0.0000 0.0000
## Peces 0.0000 0.0000 0.0000 0.0000
## Sin producto 0.0000 0.0000 0.0000 0.0000
## Tuberculo 0.0000 0.0000 0.0000 0.0000
##
## Gandería Doble Proposito Granadilla Granola
## Artesanias 0.0000 0.0000 0.0000
## Cereales 0.0000 0.0000 0.0000
## Cultivos Agroindustriales 0.0000 0.0000 0.0000
## Fruta 0.0000 0.0021 0.0021
## Ganaderia 0.0125 0.0000 0.0000
## Hierbas 0.0000 0.0000 0.0000
## Hortaliza/Vegetal 0.0000 0.0000 0.0000
## Lacteos 0.0000 0.0000 0.0000
## Leguminosa 0.0000 0.0000 0.0000
## Pastos 0.0000 0.0000 0.0000
## Peces 0.0000 0.0000 0.0000
## Sin producto 0.0000 0.0000 0.0000
## Tuberculo 0.0000 0.0000 0.0000
##
## Guanabana Guayaba Gulupa Harina De Alfalfa
## Artesanias 0.0000 0.0000 0.0000 0.0000
## Cereales 0.0000 0.0000 0.0000 0.0000
## Cultivos Agroindustriales 0.0000 0.0000 0.0000 0.0000
## Fruta 0.0063 0.0063 0.0104 0.0000
## Ganaderia 0.0000 0.0000 0.0000 0.0000
## Hierbas 0.0000 0.0000 0.0000 0.0000
## Hortaliza/Vegetal 0.0000 0.0000 0.0000 0.0000
## Lacteos 0.0000 0.0000 0.0000 0.0000
## Leguminosa 0.0000 0.0000 0.0000 0.0000
## Pastos 0.0000 0.0000 0.0000 0.0042
## Peces 0.0000 0.0000 0.0000 0.0000
## Sin producto 0.0000 0.0000 0.0000 0.0000
## Tuberculo 0.0000 0.0000 0.0000 0.0000
##
## Hortalizas Huevos Lacteos Leche Leche De Cabra
## Artesanias 0.0000 0.0000 0.0000 0.0000 0.0000
## Cereales 0.0000 0.0000 0.0000 0.0000 0.0000
## Cultivos Agroindustriales 0.0000 0.0000 0.0000 0.0000 0.0000
## Fruta 0.0000 0.0000 0.0000 0.0000 0.0000
## Ganaderia 0.0000 0.0063 0.0000 0.0000 0.0000
## Hierbas 0.0000 0.0000 0.0000 0.0000 0.0000
## Hortaliza/Vegetal 0.0251 0.0000 0.0000 0.0000 0.0000
## Lacteos 0.0000 0.0000 0.0021 0.1900 0.0042
## Leguminosa 0.0000 0.0000 0.0000 0.0000 0.0000
## Pastos 0.0000 0.0000 0.0000 0.0000 0.0000
## Peces 0.0000 0.0000 0.0000 0.0000 0.0000
## Sin producto 0.0000 0.0000 0.0000 0.0000 0.0000
## Tuberculo 0.0000 0.0000 0.0000 0.0000 0.0000
##
## Lechuga Limon Tahití Lulo Maíz Manzana
## Artesanias 0.0000 0.0000 0.0000 0.0000 0.0000
## Cereales 0.0000 0.0000 0.0000 0.0146 0.0000
## Cultivos Agroindustriales 0.0000 0.0000 0.0000 0.0000 0.0000
## Fruta 0.0000 0.0063 0.0063 0.0000 0.0021
## Ganaderia 0.0000 0.0000 0.0000 0.0000 0.0000
## Hierbas 0.0000 0.0000 0.0000 0.0000 0.0000
## Hortaliza/Vegetal 0.0042 0.0000 0.0000 0.0000 0.0000
## Lacteos 0.0000 0.0000 0.0000 0.0000 0.0000
## Leguminosa 0.0000 0.0000 0.0000 0.0000 0.0000
## Pastos 0.0000 0.0000 0.0000 0.0000 0.0000
## Peces 0.0000 0.0000 0.0000 0.0000 0.0000
## Sin producto 0.0000 0.0000 0.0000 0.0000 0.0000
## Tuberculo 0.0000 0.0000 0.0000 0.0000 0.0000
##
## Manzana Y Pera Miel De Abeja Mojarra Mora Naranja
## Artesanias 0.0000 0.0000 0.0000 0.0000 0.0000
## Cereales 0.0000 0.0000 0.0000 0.0000 0.0000
## Cultivos Agroindustriales 0.0000 0.0167 0.0000 0.0000 0.0000
## Fruta 0.0021 0.0000 0.0000 0.0355 0.0042
## Ganaderia 0.0000 0.0000 0.0000 0.0000 0.0000
## Hierbas 0.0000 0.0000 0.0000 0.0000 0.0000
## Hortaliza/Vegetal 0.0000 0.0000 0.0000 0.0000 0.0000
## Lacteos 0.0000 0.0000 0.0000 0.0000 0.0000
## Leguminosa 0.0000 0.0000 0.0000 0.0000 0.0000
## Pastos 0.0000 0.0000 0.0000 0.0000 0.0000
## Peces 0.0000 0.0000 0.0063 0.0000 0.0000
## Sin producto 0.0000 0.0000 0.0000 0.0000 0.0000
## Tuberculo 0.0000 0.0000 0.0000 0.0000 0.0000
##
## Ovinos Y Caprinos Panela Papa Papa Nativa
## Artesanias 0.0000 0.0000 0.0000 0.0000
## Cereales 0.0000 0.0000 0.0000 0.0000
## Cultivos Agroindustriales 0.0000 0.0355 0.0000 0.0000
## Fruta 0.0000 0.0000 0.0000 0.0000
## Ganaderia 0.0125 0.0000 0.0000 0.0000
## Hierbas 0.0000 0.0000 0.0000 0.0000
## Hortaliza/Vegetal 0.0000 0.0000 0.0000 0.0000
## Lacteos 0.0000 0.0000 0.0000 0.0000
## Leguminosa 0.0000 0.0000 0.0000 0.0000
## Pastos 0.0000 0.0000 0.0000 0.0000
## Peces 0.0000 0.0000 0.0000 0.0000
## Sin producto 0.0000 0.0000 0.0000 0.0000
## Tuberculo 0.0000 0.0000 0.1148 0.0021
##
## Papayuela Pera Piscicultura Pitaya Pollo Queso
## Artesanias 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
## Cereales 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
## Cultivos Agroindustriales 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
## Fruta 0.0042 0.0021 0.0000 0.0063 0.0000 0.0000
## Ganaderia 0.0000 0.0000 0.0000 0.0000 0.0084 0.0000
## Hierbas 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
## Hortaliza/Vegetal 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
## Lacteos 0.0000 0.0000 0.0000 0.0000 0.0000 0.0063
## Leguminosa 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
## Pastos 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
## Peces 0.0000 0.0000 0.0125 0.0000 0.0000 0.0000
## Sin producto 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
## Tuberculo 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
##
## Quinua Sabila Sagu
## Artesanias 0.0000 0.0000 0.0000
## Cereales 0.0084 0.0000 0.0042
## Cultivos Agroindustriales 0.0000 0.0021 0.0000
## Fruta 0.0000 0.0000 0.0000
## Ganaderia 0.0000 0.0000 0.0000
## Hierbas 0.0000 0.0000 0.0000
## Hortaliza/Vegetal 0.0000 0.0000 0.0000
## Lacteos 0.0000 0.0000 0.0000
## Leguminosa 0.0000 0.0000 0.0000
## Pastos 0.0000 0.0000 0.0000
## Peces 0.0000 0.0000 0.0000
## Sin producto 0.0000 0.0000 0.0000
## Tuberculo 0.0000 0.0000 0.0000
##
## Siembra Y Produccion De Chin "Caña Brava - De Castilla"
## Artesanias 0.0000
## Cereales 0.0000
## Cultivos Agroindustriales 0.0021
## Fruta 0.0000
## Ganaderia 0.0000
## Hierbas 0.0000
## Hortaliza/Vegetal 0.0000
## Lacteos 0.0000
## Leguminosa 0.0000
## Pastos 0.0000
## Peces 0.0000
## Sin producto 0.0000
## Tuberculo 0.0000
##
## Silo Silo De Avena Tilapia Tomate Tomate De Arbol
## Artesanias 0.0000 0.0000 0.0000 0.0000 0.0000
## Cereales 0.0000 0.0000 0.0000 0.0000 0.0000
## Cultivos Agroindustriales 0.0000 0.0000 0.0000 0.0000 0.0000
## Fruta 0.0000 0.0000 0.0000 0.0000 0.0084
## Ganaderia 0.0000 0.0000 0.0000 0.0000 0.0000
## Hierbas 0.0000 0.0000 0.0000 0.0000 0.0000
## Hortaliza/Vegetal 0.0000 0.0000 0.0000 0.0146 0.0000
## Lacteos 0.0000 0.0000 0.0000 0.0000 0.0000
## Leguminosa 0.0000 0.0000 0.0000 0.0000 0.0000
## Pastos 0.0021 0.0021 0.0000 0.0000 0.0000
## Peces 0.0000 0.0000 0.0021 0.0000 0.0000
## Sin producto 0.0000 0.0000 0.0000 0.0000 0.0000
## Tuberculo 0.0000 0.0000 0.0000 0.0000 0.0000
##
## Transformacion De Lacteos Trucha Arcoiris Uchuva
## Artesanias 0.0000 0.0000 0.0000
## Cereales 0.0000 0.0000 0.0000
## Cultivos Agroindustriales 0.0000 0.0000 0.0000
## Fruta 0.0000 0.0000 0.0188
## Ganaderia 0.0000 0.0000 0.0000
## Hierbas 0.0000 0.0000 0.0000
## Hortaliza/Vegetal 0.0000 0.0000 0.0000
## Lacteos 0.0021 0.0000 0.0000
## Leguminosa 0.0000 0.0000 0.0000
## Pastos 0.0000 0.0000 0.0000
## Peces 0.0000 0.0042 0.0000
## Sin producto 0.0000 0.0000 0.0000
## Tuberculo 0.0000 0.0000 0.0000
##
## Venta De Animales En Pie Yuca Zanahoria
## Artesanias 0.0000 0.0000 0.0000
## Cereales 0.0000 0.0000 0.0000
## Cultivos Agroindustriales 0.0000 0.0000 0.0000
## Fruta 0.0000 0.0000 0.0000
## Ganaderia 0.0021 0.0000 0.0000
## Hierbas 0.0000 0.0000 0.0000
## Hortaliza/Vegetal 0.0000 0.0000 0.0104
## Lacteos 0.0000 0.0000 0.0000
## Leguminosa 0.0000 0.0000 0.0000
## Pastos 0.0000 0.0000 0.0000
## Peces 0.0000 0.0000 0.0000
## Sin producto 0.0000 0.0000 0.0000
## Tuberculo 0.0000 0.0042 0.0000
Esto responde: “si estoy en este grupo, ¿qué tan común es tener servicio?”
CPF muestran:
Pastos: 0.375 “No” vs 0.625 “Sí” → es el grupo con mayor proporción de “Sí” (aunque revisa el tamaño muestral, porque Pastos tiene pocos casos).
Lácteos: 0.5918 “No” vs 0.4082 “Sí” → es el grupo donde más se concentra el “Sí” en términos prácticos y con más casos.
Cultivos Agroindustriales: 0.7654 “No” vs 0.2346 “Sí” → mayoría “No”.
Fruta: 0.8000 “No” vs 0.2000 “Sí” → mayoría “No”.
Ganadería: 0.9149 “No” vs 0.0851 “Sí” → muy marcado hacia “No”.
Sin producto: 1.000 “No” vs 0.000 “Sí”.
Interpretación: existe heterogeneidad entre grupos: Lácteos y Pastos son los que relativamente más presentan servicio de comercializacion, mientras Ganadería, Leguminosa y Sin producto muestran predominio fuerte de “No”.
CPC (perfil columna: dentro de No o dentro de Sí, cómo se distribuyen los grupos)
Esto responde: “entre los que tienen servicio (Sí), ¿qué grupos pesan más?” y lo mismo para “No”.
En el CPC:
En la columna “Sí”, el grupo con mayor peso es Lácteos (0.3571): o sea, una gran parte de todos los ‘Sí’ proviene de Lácteos.
También destacan en “Sí”: Fruta (0.1607), Cultivos Agroindustriales (0.1696), Tubérculo (0.1161).
En la columna “No”, los mayores aportantes son Fruta (0.1962), Cultivos Agroindustriales (0.1689), Lácteos (0.1580), Ganadería (0.1172) y Tubérculo (0.1281).
Interpretación: aunque en casi todos los grupos domina el “No”, cuando miras solo los “Sí”, se concentran especialmente en Lácteos, y luego en Cultivos Agroindustriales y Fruta. Por otro lado los productos con más evidencia (más masa) sugieren que Leche y derivados (p. ej., queso) se asocian con mayor presencia de “Sí”, mientras que muchos otros productos son principalmente “No”, pero la lectura se debe matizar por la alta dispersión.
# CPF: Frecuencias relativas por FILA (perfil fila) -> cada fila suma 1
CPF_GxC <- prop.table(TAB_GxC, 1)
CPF_PxC <- prop.table(TAB_PxC, 1)
CPF_GxP <- prop.table(TAB_GxP, 1)
# CPC: Frecuencias relativas por COLUMNA (perfil columna) -> cada columna suma 1
CPC_GxC <- prop.table(TAB_GxC, 2)
CPC_PxC <- prop.table(TAB_PxC, 2)
CPC_GxP <- prop.table(TAB_GxP, 2)
round(CPF_GxC, 4); round(CPC_GxC, 4)
##
## No Si
## Artesanias 0.5000 0.5000
## Cereales 0.8889 0.1111
## Cultivos Agroindustriales 0.7654 0.2346
## Fruta 0.8000 0.2000
## Ganaderia 0.9149 0.0851
## Hierbas 0.5000 0.5000
## Hortaliza/Vegetal 0.8182 0.1818
## Lacteos 0.5918 0.4082
## Leguminosa 0.9412 0.0588
## Pastos 0.3750 0.6250
## Peces 0.8571 0.1429
## Sin producto 1.0000 0.0000
## Tuberculo 0.7833 0.2167
##
## No Si
## Artesanias 0.0027 0.0089
## Cereales 0.0436 0.0179
## Cultivos Agroindustriales 0.1689 0.1696
## Fruta 0.1962 0.1607
## Ganaderia 0.1172 0.0357
## Hierbas 0.0027 0.0089
## Hortaliza/Vegetal 0.0736 0.0536
## Lacteos 0.1580 0.3571
## Leguminosa 0.0436 0.0089
## Pastos 0.0082 0.0446
## Peces 0.0327 0.0179
## Sin producto 0.0245 0.0000
## Tuberculo 0.1281 0.1161
round(CPF_PxC, 4); round(CPC_PxC, 4)
##
## No Si
## Agraz 0.0000 1.0000
## Aguacate 1.0000 0.0000
## Aguacate Hass 1.0000 0.0000
## Ahuyama 1.0000 0.0000
## Alfalfa 0.0000 1.0000
## Arandanos 1.0000 0.0000
## Araza 0.0000 1.0000
## Aromaticas 0.0000 1.0000
## Arracacha 1.0000 0.0000
## Arveja 1.0000 0.0000
## Avicolas 1.0000 0.0000
## Brocoli 1.0000 0.0000
## Cacao 0.6667 0.3333
## Cachama 1.0000 0.0000
## Caducifolios, Pera Manzana Y Ciruela 1.0000 0.0000
## Café 0.8235 0.1765
## Caña 0.7143 0.2857
## Caña Panelera 1.0000 0.0000
## Caprinos 1.0000 0.0000
## Cebada 1.0000 0.0000
## Cebada Y Trigo 1.0000 0.0000
## Cebolla 0.7500 0.2500
## Cebolla De Bulbo 1.0000 0.0000
## Cerdos 1.0000 0.0000
## Chamba (Campomanesia Lineatifolia) 0.5000 0.5000
## Cilantro 1.0000 0.0000
## Ciruela 0.5000 0.5000
## Conejo 0.5000 0.5000
## Corderos 1.0000 0.0000
## Críticos 1.0000 0.0000
## Curuba 1.0000 0.0000
## Datil 0.0000 1.0000
## Durazno 0.6667 0.3333
## Encuestada Sin Producto 1.0000 0.0000
## Forrajes 0.5000 0.5000
## Freijoa 1.0000 0.0000
## Frijol 0.8889 0.1111
## Frijol Verde 1.0000 0.0000
## Frutales 1.0000 0.0000
## Ganadería 1.0000 0.0000
## Ganadería Carne 0.6667 0.3333
## Gandería Doble Proposito 0.8333 0.1667
## Granadilla 1.0000 0.0000
## Granola 1.0000 0.0000
## Guanabana 1.0000 0.0000
## Guayaba 1.0000 0.0000
## Gulupa 1.0000 0.0000
## Harina De Alfalfa 0.5000 0.5000
## Hortalizas 0.8333 0.1667
## Huevos 1.0000 0.0000
## Lacteos 1.0000 0.0000
## Leche 0.6154 0.3846
## Leche De Cabra 0.0000 1.0000
## Lechuga 0.5000 0.5000
## Limon Tahití 0.6667 0.3333
## Lulo 0.6667 0.3333
## Maíz 0.8571 0.1429
## Manzana 1.0000 0.0000
## Manzana Y Pera 1.0000 0.0000
## Miel De Abeja 0.6250 0.3750
## Mojarra 1.0000 0.0000
## Mora 0.6471 0.3529
## Naranja 1.0000 0.0000
## Ovinos Y Caprinos 1.0000 0.0000
## Panela 0.7647 0.2353
## Papa 0.7818 0.2182
## Papa Nativa 0.0000 1.0000
## Papayuela 1.0000 0.0000
## Pera 1.0000 0.0000
## Piscicultura 0.8333 0.1667
## Pitaya 0.6667 0.3333
## Pollo 0.7500 0.2500
## Queso 0.3333 0.6667
## Quinua 0.7500 0.2500
## Sabila 1.0000 0.0000
## Sagu 1.0000 0.0000
## Siembra Y Produccion De Chin "Caña Brava - De Castilla" 1.0000 0.0000
## Silo 1.0000 0.0000
## Silo De Avena 0.0000 1.0000
## Tilapia 1.0000 0.0000
## Tomate 0.7143 0.2857
## Tomate De Arbol 1.0000 0.0000
## Transformacion De Lacteos 0.0000 1.0000
## Trucha Arcoiris 0.5000 0.5000
## Uchuva 1.0000 0.0000
## Venta De Animales En Pie 1.0000 0.0000
## Yuca 1.0000 0.0000
## Zanahoria 1.0000 0.0000
##
## No Si
## Agraz 0.0000 0.0268
## Aguacate 0.0109 0.0000
## Aguacate Hass 0.0054 0.0000
## Ahuyama 0.0027 0.0000
## Alfalfa 0.0000 0.0179
## Arandanos 0.0027 0.0000
## Araza 0.0000 0.0089
## Aromaticas 0.0000 0.0089
## Arracacha 0.0054 0.0000
## Arveja 0.0191 0.0000
## Avicolas 0.0027 0.0000
## Brocoli 0.0027 0.0000
## Cacao 0.0218 0.0357
## Cachama 0.0054 0.0000
## Caducifolios, Pera Manzana Y Ciruela 0.0027 0.0000
## Café 0.0763 0.0536
## Caña 0.0136 0.0179
## Caña Panelera 0.0027 0.0000
## Caprinos 0.0054 0.0000
## Cebada 0.0082 0.0000
## Cebada Y Trigo 0.0054 0.0000
## Cebolla 0.0082 0.0089
## Cebolla De Bulbo 0.0027 0.0000
## Cerdos 0.0054 0.0000
## Chamba (Campomanesia Lineatifolia) 0.0027 0.0089
## Cilantro 0.0027 0.0000
## Ciruela 0.0027 0.0089
## Conejo 0.0027 0.0089
## Corderos 0.0054 0.0000
## Críticos 0.0027 0.0000
## Curuba 0.0027 0.0000
## Datil 0.0000 0.0089
## Durazno 0.0163 0.0268
## Encuestada Sin Producto 0.0245 0.0000
## Forrajes 0.0027 0.0089
## Freijoa 0.0027 0.0000
## Frijol 0.0218 0.0089
## Frijol Verde 0.0027 0.0000
## Frutales 0.0109 0.0000
## Ganadería 0.0409 0.0000
## Ganadería Carne 0.0054 0.0089
## Gandería Doble Proposito 0.0136 0.0089
## Granadilla 0.0027 0.0000
## Granola 0.0027 0.0000
## Guanabana 0.0082 0.0000
## Guayaba 0.0082 0.0000
## Gulupa 0.0136 0.0000
## Harina De Alfalfa 0.0027 0.0089
## Hortalizas 0.0272 0.0179
## Huevos 0.0082 0.0000
## Lacteos 0.0027 0.0000
## Leche 0.1526 0.3125
## Leche De Cabra 0.0000 0.0179
## Lechuga 0.0027 0.0089
## Limon Tahití 0.0054 0.0089
## Lulo 0.0054 0.0089
## Maíz 0.0163 0.0089
## Manzana 0.0027 0.0000
## Manzana Y Pera 0.0027 0.0000
## Miel De Abeja 0.0136 0.0268
## Mojarra 0.0082 0.0000
## Mora 0.0300 0.0536
## Naranja 0.0054 0.0000
## Ovinos Y Caprinos 0.0163 0.0000
## Panela 0.0354 0.0357
## Papa 0.1172 0.1071
## Papa Nativa 0.0000 0.0089
## Papayuela 0.0054 0.0000
## Pera 0.0027 0.0000
## Piscicultura 0.0136 0.0089
## Pitaya 0.0054 0.0089
## Pollo 0.0082 0.0089
## Queso 0.0027 0.0179
## Quinua 0.0082 0.0089
## Sabila 0.0027 0.0000
## Sagu 0.0054 0.0000
## Siembra Y Produccion De Chin "Caña Brava - De Castilla" 0.0027 0.0000
## Silo 0.0027 0.0000
## Silo De Avena 0.0000 0.0089
## Tilapia 0.0027 0.0000
## Tomate 0.0136 0.0179
## Tomate De Arbol 0.0109 0.0000
## Transformacion De Lacteos 0.0000 0.0089
## Trucha Arcoiris 0.0027 0.0089
## Uchuva 0.0245 0.0000
## Venta De Animales En Pie 0.0027 0.0000
## Yuca 0.0054 0.0000
## Zanahoria 0.0136 0.0000
round(CPF_GxP, 4); round(CPC_GxP, 4)
##
## Agraz Aguacate Aguacate Hass Ahuyama Alfalfa
## Artesanias 0.0000 0.0000 0.0000 0.0000 0.0000
## Cereales 0.0000 0.0000 0.0000 0.0000 0.0000
## Cultivos Agroindustriales 0.0000 0.0000 0.0000 0.0000 0.0000
## Fruta 0.0333 0.0444 0.0222 0.0000 0.0000
## Ganaderia 0.0000 0.0000 0.0000 0.0000 0.0000
## Hierbas 0.0000 0.0000 0.0000 0.0000 0.0000
## Hortaliza/Vegetal 0.0000 0.0000 0.0000 0.0303 0.0000
## Lacteos 0.0000 0.0000 0.0000 0.0000 0.0000
## Leguminosa 0.0000 0.0000 0.0000 0.0000 0.0000
## Pastos 0.0000 0.0000 0.0000 0.0000 0.2500
## Peces 0.0000 0.0000 0.0000 0.0000 0.0000
## Sin producto 0.0000 0.0000 0.0000 0.0000 0.0000
## Tuberculo 0.0000 0.0000 0.0000 0.0000 0.0000
##
## Arandanos Araza Aromaticas Arracacha Arveja
## Artesanias 0.0000 0.0000 0.0000 0.0000 0.0000
## Cereales 0.0000 0.0000 0.0000 0.0000 0.0000
## Cultivos Agroindustriales 0.0000 0.0000 0.0000 0.0000 0.0000
## Fruta 0.0111 0.0111 0.0000 0.0000 0.0000
## Ganaderia 0.0000 0.0000 0.0000 0.0000 0.0000
## Hierbas 0.0000 0.0000 0.5000 0.0000 0.0000
## Hortaliza/Vegetal 0.0000 0.0000 0.0000 0.0000 0.0000
## Lacteos 0.0000 0.0000 0.0000 0.0000 0.0000
## Leguminosa 0.0000 0.0000 0.0000 0.0000 0.4118
## Pastos 0.0000 0.0000 0.0000 0.0000 0.0000
## Peces 0.0000 0.0000 0.0000 0.0000 0.0000
## Sin producto 0.0000 0.0000 0.0000 0.0000 0.0000
## Tuberculo 0.0000 0.0000 0.0000 0.0333 0.0000
##
## Avicolas Brocoli Cacao Cachama
## Artesanias 0.0000 0.0000 0.0000 0.0000
## Cereales 0.0000 0.0000 0.0000 0.0000
## Cultivos Agroindustriales 0.0000 0.0000 0.1481 0.0000
## Fruta 0.0000 0.0000 0.0000 0.0000
## Ganaderia 0.0213 0.0000 0.0000 0.0000
## Hierbas 0.0000 0.0000 0.0000 0.0000
## Hortaliza/Vegetal 0.0000 0.0303 0.0000 0.0000
## Lacteos 0.0000 0.0000 0.0000 0.0000
## Leguminosa 0.0000 0.0000 0.0000 0.0000
## Pastos 0.0000 0.0000 0.0000 0.0000
## Peces 0.0000 0.0000 0.0000 0.1429
## Sin producto 0.0000 0.0000 0.0000 0.0000
## Tuberculo 0.0000 0.0000 0.0000 0.0000
##
## Caducifolios, Pera Manzana Y Ciruela Café Caña
## Artesanias 0.0000 0.0000 0.0000
## Cereales 0.0000 0.0000 0.0000
## Cultivos Agroindustriales 0.0000 0.4198 0.0864
## Fruta 0.0111 0.0000 0.0000
## Ganaderia 0.0000 0.0000 0.0000
## Hierbas 0.0000 0.0000 0.0000
## Hortaliza/Vegetal 0.0000 0.0000 0.0000
## Lacteos 0.0000 0.0000 0.0000
## Leguminosa 0.0000 0.0000 0.0000
## Pastos 0.0000 0.0000 0.0000
## Peces 0.0000 0.0000 0.0000
## Sin producto 0.0000 0.0000 0.0000
## Tuberculo 0.0000 0.0000 0.0000
##
## Caña Panelera Caprinos Cebada Cebada Y Trigo
## Artesanias 0.0000 0.0000 0.0000 0.0000
## Cereales 0.0000 0.0000 0.1667 0.1111
## Cultivos Agroindustriales 0.0123 0.0000 0.0000 0.0000
## Fruta 0.0000 0.0000 0.0000 0.0000
## Ganaderia 0.0000 0.0426 0.0000 0.0000
## Hierbas 0.0000 0.0000 0.0000 0.0000
## Hortaliza/Vegetal 0.0000 0.0000 0.0000 0.0000
## Lacteos 0.0000 0.0000 0.0000 0.0000
## Leguminosa 0.0000 0.0000 0.0000 0.0000
## Pastos 0.0000 0.0000 0.0000 0.0000
## Peces 0.0000 0.0000 0.0000 0.0000
## Sin producto 0.0000 0.0000 0.0000 0.0000
## Tuberculo 0.0000 0.0000 0.0000 0.0000
##
## Cebolla Cebolla De Bulbo Cerdos
## Artesanias 0.0000 0.0000 0.0000
## Cereales 0.0000 0.0000 0.0000
## Cultivos Agroindustriales 0.0000 0.0000 0.0000
## Fruta 0.0000 0.0000 0.0000
## Ganaderia 0.0000 0.0000 0.0426
## Hierbas 0.0000 0.0000 0.0000
## Hortaliza/Vegetal 0.1212 0.0303 0.0000
## Lacteos 0.0000 0.0000 0.0000
## Leguminosa 0.0000 0.0000 0.0000
## Pastos 0.0000 0.0000 0.0000
## Peces 0.0000 0.0000 0.0000
## Sin producto 0.0000 0.0000 0.0000
## Tuberculo 0.0000 0.0000 0.0000
##
## Chamba (Campomanesia Lineatifolia) Cilantro Ciruela
## Artesanias 1.0000 0.0000 0.0000
## Cereales 0.0000 0.0000 0.0000
## Cultivos Agroindustriales 0.0000 0.0000 0.0000
## Fruta 0.0000 0.0000 0.0222
## Ganaderia 0.0000 0.0000 0.0000
## Hierbas 0.0000 0.5000 0.0000
## Hortaliza/Vegetal 0.0000 0.0000 0.0000
## Lacteos 0.0000 0.0000 0.0000
## Leguminosa 0.0000 0.0000 0.0000
## Pastos 0.0000 0.0000 0.0000
## Peces 0.0000 0.0000 0.0000
## Sin producto 0.0000 0.0000 0.0000
## Tuberculo 0.0000 0.0000 0.0000
##
## Conejo Corderos Críticos Curuba Datil Durazno
## Artesanias 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
## Cereales 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
## Cultivos Agroindustriales 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
## Fruta 0.0000 0.0000 0.0111 0.0111 0.0111 0.1000
## Ganaderia 0.0426 0.0426 0.0000 0.0000 0.0000 0.0000
## Hierbas 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
## Hortaliza/Vegetal 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
## Lacteos 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
## Leguminosa 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
## Pastos 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
## Peces 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
## Sin producto 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
## Tuberculo 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
##
## Encuestada Sin Producto Forrajes Freijoa Frijol
## Artesanias 0.0000 0.0000 0.0000 0.0000
## Cereales 0.0000 0.0000 0.0000 0.0000
## Cultivos Agroindustriales 0.0000 0.0000 0.0000 0.0000
## Fruta 0.0000 0.0000 0.0111 0.0000
## Ganaderia 0.0000 0.0000 0.0000 0.0000
## Hierbas 0.0000 0.0000 0.0000 0.0000
## Hortaliza/Vegetal 0.0000 0.0000 0.0000 0.0000
## Lacteos 0.0000 0.0000 0.0000 0.0000
## Leguminosa 0.0000 0.0000 0.0000 0.5294
## Pastos 0.0000 0.2500 0.0000 0.0000
## Peces 0.0000 0.0000 0.0000 0.0000
## Sin producto 1.0000 0.0000 0.0000 0.0000
## Tuberculo 0.0000 0.0000 0.0000 0.0000
##
## Frijol Verde Frutales Ganadería Ganadería Carne
## Artesanias 0.0000 0.0000 0.0000 0.0000
## Cereales 0.0000 0.0000 0.0000 0.0000
## Cultivos Agroindustriales 0.0000 0.0000 0.0000 0.0000
## Fruta 0.0000 0.0444 0.0000 0.0000
## Ganaderia 0.0000 0.0000 0.3191 0.0638
## Hierbas 0.0000 0.0000 0.0000 0.0000
## Hortaliza/Vegetal 0.0000 0.0000 0.0000 0.0000
## Lacteos 0.0000 0.0000 0.0000 0.0000
## Leguminosa 0.0588 0.0000 0.0000 0.0000
## Pastos 0.0000 0.0000 0.0000 0.0000
## Peces 0.0000 0.0000 0.0000 0.0000
## Sin producto 0.0000 0.0000 0.0000 0.0000
## Tuberculo 0.0000 0.0000 0.0000 0.0000
##
## Gandería Doble Proposito Granadilla Granola
## Artesanias 0.0000 0.0000 0.0000
## Cereales 0.0000 0.0000 0.0000
## Cultivos Agroindustriales 0.0000 0.0000 0.0000
## Fruta 0.0000 0.0111 0.0111
## Ganaderia 0.1277 0.0000 0.0000
## Hierbas 0.0000 0.0000 0.0000
## Hortaliza/Vegetal 0.0000 0.0000 0.0000
## Lacteos 0.0000 0.0000 0.0000
## Leguminosa 0.0000 0.0000 0.0000
## Pastos 0.0000 0.0000 0.0000
## Peces 0.0000 0.0000 0.0000
## Sin producto 0.0000 0.0000 0.0000
## Tuberculo 0.0000 0.0000 0.0000
##
## Guanabana Guayaba Gulupa Harina De Alfalfa
## Artesanias 0.0000 0.0000 0.0000 0.0000
## Cereales 0.0000 0.0000 0.0000 0.0000
## Cultivos Agroindustriales 0.0000 0.0000 0.0000 0.0000
## Fruta 0.0333 0.0333 0.0556 0.0000
## Ganaderia 0.0000 0.0000 0.0000 0.0000
## Hierbas 0.0000 0.0000 0.0000 0.0000
## Hortaliza/Vegetal 0.0000 0.0000 0.0000 0.0000
## Lacteos 0.0000 0.0000 0.0000 0.0000
## Leguminosa 0.0000 0.0000 0.0000 0.0000
## Pastos 0.0000 0.0000 0.0000 0.2500
## Peces 0.0000 0.0000 0.0000 0.0000
## Sin producto 0.0000 0.0000 0.0000 0.0000
## Tuberculo 0.0000 0.0000 0.0000 0.0000
##
## Hortalizas Huevos Lacteos Leche Leche De Cabra
## Artesanias 0.0000 0.0000 0.0000 0.0000 0.0000
## Cereales 0.0000 0.0000 0.0000 0.0000 0.0000
## Cultivos Agroindustriales 0.0000 0.0000 0.0000 0.0000 0.0000
## Fruta 0.0000 0.0000 0.0000 0.0000 0.0000
## Ganaderia 0.0000 0.0638 0.0000 0.0000 0.0000
## Hierbas 0.0000 0.0000 0.0000 0.0000 0.0000
## Hortaliza/Vegetal 0.3636 0.0000 0.0000 0.0000 0.0000
## Lacteos 0.0000 0.0000 0.0102 0.9286 0.0204
## Leguminosa 0.0000 0.0000 0.0000 0.0000 0.0000
## Pastos 0.0000 0.0000 0.0000 0.0000 0.0000
## Peces 0.0000 0.0000 0.0000 0.0000 0.0000
## Sin producto 0.0000 0.0000 0.0000 0.0000 0.0000
## Tuberculo 0.0000 0.0000 0.0000 0.0000 0.0000
##
## Lechuga Limon Tahití Lulo Maíz Manzana
## Artesanias 0.0000 0.0000 0.0000 0.0000 0.0000
## Cereales 0.0000 0.0000 0.0000 0.3889 0.0000
## Cultivos Agroindustriales 0.0000 0.0000 0.0000 0.0000 0.0000
## Fruta 0.0000 0.0333 0.0333 0.0000 0.0111
## Ganaderia 0.0000 0.0000 0.0000 0.0000 0.0000
## Hierbas 0.0000 0.0000 0.0000 0.0000 0.0000
## Hortaliza/Vegetal 0.0606 0.0000 0.0000 0.0000 0.0000
## Lacteos 0.0000 0.0000 0.0000 0.0000 0.0000
## Leguminosa 0.0000 0.0000 0.0000 0.0000 0.0000
## Pastos 0.0000 0.0000 0.0000 0.0000 0.0000
## Peces 0.0000 0.0000 0.0000 0.0000 0.0000
## Sin producto 0.0000 0.0000 0.0000 0.0000 0.0000
## Tuberculo 0.0000 0.0000 0.0000 0.0000 0.0000
##
## Manzana Y Pera Miel De Abeja Mojarra Mora Naranja
## Artesanias 0.0000 0.0000 0.0000 0.0000 0.0000
## Cereales 0.0000 0.0000 0.0000 0.0000 0.0000
## Cultivos Agroindustriales 0.0000 0.0988 0.0000 0.0000 0.0000
## Fruta 0.0111 0.0000 0.0000 0.1889 0.0222
## Ganaderia 0.0000 0.0000 0.0000 0.0000 0.0000
## Hierbas 0.0000 0.0000 0.0000 0.0000 0.0000
## Hortaliza/Vegetal 0.0000 0.0000 0.0000 0.0000 0.0000
## Lacteos 0.0000 0.0000 0.0000 0.0000 0.0000
## Leguminosa 0.0000 0.0000 0.0000 0.0000 0.0000
## Pastos 0.0000 0.0000 0.0000 0.0000 0.0000
## Peces 0.0000 0.0000 0.2143 0.0000 0.0000
## Sin producto 0.0000 0.0000 0.0000 0.0000 0.0000
## Tuberculo 0.0000 0.0000 0.0000 0.0000 0.0000
##
## Ovinos Y Caprinos Panela Papa Papa Nativa
## Artesanias 0.0000 0.0000 0.0000 0.0000
## Cereales 0.0000 0.0000 0.0000 0.0000
## Cultivos Agroindustriales 0.0000 0.2099 0.0000 0.0000
## Fruta 0.0000 0.0000 0.0000 0.0000
## Ganaderia 0.1277 0.0000 0.0000 0.0000
## Hierbas 0.0000 0.0000 0.0000 0.0000
## Hortaliza/Vegetal 0.0000 0.0000 0.0000 0.0000
## Lacteos 0.0000 0.0000 0.0000 0.0000
## Leguminosa 0.0000 0.0000 0.0000 0.0000
## Pastos 0.0000 0.0000 0.0000 0.0000
## Peces 0.0000 0.0000 0.0000 0.0000
## Sin producto 0.0000 0.0000 0.0000 0.0000
## Tuberculo 0.0000 0.0000 0.9167 0.0167
##
## Papayuela Pera Piscicultura Pitaya Pollo Queso
## Artesanias 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
## Cereales 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
## Cultivos Agroindustriales 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
## Fruta 0.0222 0.0111 0.0000 0.0333 0.0000 0.0000
## Ganaderia 0.0000 0.0000 0.0000 0.0000 0.0851 0.0000
## Hierbas 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
## Hortaliza/Vegetal 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
## Lacteos 0.0000 0.0000 0.0000 0.0000 0.0000 0.0306
## Leguminosa 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
## Pastos 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
## Peces 0.0000 0.0000 0.4286 0.0000 0.0000 0.0000
## Sin producto 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
## Tuberculo 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
##
## Quinua Sabila Sagu
## Artesanias 0.0000 0.0000 0.0000
## Cereales 0.2222 0.0000 0.1111
## Cultivos Agroindustriales 0.0000 0.0123 0.0000
## Fruta 0.0000 0.0000 0.0000
## Ganaderia 0.0000 0.0000 0.0000
## Hierbas 0.0000 0.0000 0.0000
## Hortaliza/Vegetal 0.0000 0.0000 0.0000
## Lacteos 0.0000 0.0000 0.0000
## Leguminosa 0.0000 0.0000 0.0000
## Pastos 0.0000 0.0000 0.0000
## Peces 0.0000 0.0000 0.0000
## Sin producto 0.0000 0.0000 0.0000
## Tuberculo 0.0000 0.0000 0.0000
##
## Siembra Y Produccion De Chin "Caña Brava - De Castilla"
## Artesanias 0.0000
## Cereales 0.0000
## Cultivos Agroindustriales 0.0123
## Fruta 0.0000
## Ganaderia 0.0000
## Hierbas 0.0000
## Hortaliza/Vegetal 0.0000
## Lacteos 0.0000
## Leguminosa 0.0000
## Pastos 0.0000
## Peces 0.0000
## Sin producto 0.0000
## Tuberculo 0.0000
##
## Silo Silo De Avena Tilapia Tomate Tomate De Arbol
## Artesanias 0.0000 0.0000 0.0000 0.0000 0.0000
## Cereales 0.0000 0.0000 0.0000 0.0000 0.0000
## Cultivos Agroindustriales 0.0000 0.0000 0.0000 0.0000 0.0000
## Fruta 0.0000 0.0000 0.0000 0.0000 0.0444
## Ganaderia 0.0000 0.0000 0.0000 0.0000 0.0000
## Hierbas 0.0000 0.0000 0.0000 0.0000 0.0000
## Hortaliza/Vegetal 0.0000 0.0000 0.0000 0.2121 0.0000
## Lacteos 0.0000 0.0000 0.0000 0.0000 0.0000
## Leguminosa 0.0000 0.0000 0.0000 0.0000 0.0000
## Pastos 0.1250 0.1250 0.0000 0.0000 0.0000
## Peces 0.0000 0.0000 0.0714 0.0000 0.0000
## Sin producto 0.0000 0.0000 0.0000 0.0000 0.0000
## Tuberculo 0.0000 0.0000 0.0000 0.0000 0.0000
##
## Transformacion De Lacteos Trucha Arcoiris Uchuva
## Artesanias 0.0000 0.0000 0.0000
## Cereales 0.0000 0.0000 0.0000
## Cultivos Agroindustriales 0.0000 0.0000 0.0000
## Fruta 0.0000 0.0000 0.1000
## Ganaderia 0.0000 0.0000 0.0000
## Hierbas 0.0000 0.0000 0.0000
## Hortaliza/Vegetal 0.0000 0.0000 0.0000
## Lacteos 0.0102 0.0000 0.0000
## Leguminosa 0.0000 0.0000 0.0000
## Pastos 0.0000 0.0000 0.0000
## Peces 0.0000 0.1429 0.0000
## Sin producto 0.0000 0.0000 0.0000
## Tuberculo 0.0000 0.0000 0.0000
##
## Venta De Animales En Pie Yuca Zanahoria
## Artesanias 0.0000 0.0000 0.0000
## Cereales 0.0000 0.0000 0.0000
## Cultivos Agroindustriales 0.0000 0.0000 0.0000
## Fruta 0.0000 0.0000 0.0000
## Ganaderia 0.0213 0.0000 0.0000
## Hierbas 0.0000 0.0000 0.0000
## Hortaliza/Vegetal 0.0000 0.0000 0.1515
## Lacteos 0.0000 0.0000 0.0000
## Leguminosa 0.0000 0.0000 0.0000
## Pastos 0.0000 0.0000 0.0000
## Peces 0.0000 0.0000 0.0000
## Sin producto 0.0000 0.0000 0.0000
## Tuberculo 0.0000 0.0333 0.0000
##
## Agraz Aguacate Aguacate Hass Ahuyama Alfalfa
## Artesanias 0 0 0 0 0
## Cereales 0 0 0 0 0
## Cultivos Agroindustriales 0 0 0 0 0
## Fruta 1 1 1 0 0
## Ganaderia 0 0 0 0 0
## Hierbas 0 0 0 0 0
## Hortaliza/Vegetal 0 0 0 1 0
## Lacteos 0 0 0 0 0
## Leguminosa 0 0 0 0 0
## Pastos 0 0 0 0 1
## Peces 0 0 0 0 0
## Sin producto 0 0 0 0 0
## Tuberculo 0 0 0 0 0
##
## Arandanos Araza Aromaticas Arracacha Arveja
## Artesanias 0 0 0 0 0
## Cereales 0 0 0 0 0
## Cultivos Agroindustriales 0 0 0 0 0
## Fruta 1 1 0 0 0
## Ganaderia 0 0 0 0 0
## Hierbas 0 0 1 0 0
## Hortaliza/Vegetal 0 0 0 0 0
## Lacteos 0 0 0 0 0
## Leguminosa 0 0 0 0 1
## Pastos 0 0 0 0 0
## Peces 0 0 0 0 0
## Sin producto 0 0 0 0 0
## Tuberculo 0 0 0 1 0
##
## Avicolas Brocoli Cacao Cachama
## Artesanias 0 0 0 0
## Cereales 0 0 0 0
## Cultivos Agroindustriales 0 0 1 0
## Fruta 0 0 0 0
## Ganaderia 1 0 0 0
## Hierbas 0 0 0 0
## Hortaliza/Vegetal 0 1 0 0
## Lacteos 0 0 0 0
## Leguminosa 0 0 0 0
## Pastos 0 0 0 0
## Peces 0 0 0 1
## Sin producto 0 0 0 0
## Tuberculo 0 0 0 0
##
## Caducifolios, Pera Manzana Y Ciruela Café Caña
## Artesanias 0 0 0
## Cereales 0 0 0
## Cultivos Agroindustriales 0 1 1
## Fruta 1 0 0
## Ganaderia 0 0 0
## Hierbas 0 0 0
## Hortaliza/Vegetal 0 0 0
## Lacteos 0 0 0
## Leguminosa 0 0 0
## Pastos 0 0 0
## Peces 0 0 0
## Sin producto 0 0 0
## Tuberculo 0 0 0
##
## Caña Panelera Caprinos Cebada Cebada Y Trigo
## Artesanias 0 0 0 0
## Cereales 0 0 1 1
## Cultivos Agroindustriales 1 0 0 0
## Fruta 0 0 0 0
## Ganaderia 0 1 0 0
## Hierbas 0 0 0 0
## Hortaliza/Vegetal 0 0 0 0
## Lacteos 0 0 0 0
## Leguminosa 0 0 0 0
## Pastos 0 0 0 0
## Peces 0 0 0 0
## Sin producto 0 0 0 0
## Tuberculo 0 0 0 0
##
## Cebolla Cebolla De Bulbo Cerdos
## Artesanias 0 0 0
## Cereales 0 0 0
## Cultivos Agroindustriales 0 0 0
## Fruta 0 0 0
## Ganaderia 0 0 1
## Hierbas 0 0 0
## Hortaliza/Vegetal 1 1 0
## Lacteos 0 0 0
## Leguminosa 0 0 0
## Pastos 0 0 0
## Peces 0 0 0
## Sin producto 0 0 0
## Tuberculo 0 0 0
##
## Chamba (Campomanesia Lineatifolia) Cilantro Ciruela
## Artesanias 1 0 0
## Cereales 0 0 0
## Cultivos Agroindustriales 0 0 0
## Fruta 0 0 1
## Ganaderia 0 0 0
## Hierbas 0 1 0
## Hortaliza/Vegetal 0 0 0
## Lacteos 0 0 0
## Leguminosa 0 0 0
## Pastos 0 0 0
## Peces 0 0 0
## Sin producto 0 0 0
## Tuberculo 0 0 0
##
## Conejo Corderos Críticos Curuba Datil Durazno
## Artesanias 0 0 0 0 0 0
## Cereales 0 0 0 0 0 0
## Cultivos Agroindustriales 0 0 0 0 0 0
## Fruta 0 0 1 1 1 1
## Ganaderia 1 1 0 0 0 0
## Hierbas 0 0 0 0 0 0
## Hortaliza/Vegetal 0 0 0 0 0 0
## Lacteos 0 0 0 0 0 0
## Leguminosa 0 0 0 0 0 0
## Pastos 0 0 0 0 0 0
## Peces 0 0 0 0 0 0
## Sin producto 0 0 0 0 0 0
## Tuberculo 0 0 0 0 0 0
##
## Encuestada Sin Producto Forrajes Freijoa Frijol
## Artesanias 0 0 0 0
## Cereales 0 0 0 0
## Cultivos Agroindustriales 0 0 0 0
## Fruta 0 0 1 0
## Ganaderia 0 0 0 0
## Hierbas 0 0 0 0
## Hortaliza/Vegetal 0 0 0 0
## Lacteos 0 0 0 0
## Leguminosa 0 0 0 1
## Pastos 0 1 0 0
## Peces 0 0 0 0
## Sin producto 1 0 0 0
## Tuberculo 0 0 0 0
##
## Frijol Verde Frutales Ganadería Ganadería Carne
## Artesanias 0 0 0 0
## Cereales 0 0 0 0
## Cultivos Agroindustriales 0 0 0 0
## Fruta 0 1 0 0
## Ganaderia 0 0 1 1
## Hierbas 0 0 0 0
## Hortaliza/Vegetal 0 0 0 0
## Lacteos 0 0 0 0
## Leguminosa 1 0 0 0
## Pastos 0 0 0 0
## Peces 0 0 0 0
## Sin producto 0 0 0 0
## Tuberculo 0 0 0 0
##
## Gandería Doble Proposito Granadilla Granola
## Artesanias 0 0 0
## Cereales 0 0 0
## Cultivos Agroindustriales 0 0 0
## Fruta 0 1 1
## Ganaderia 1 0 0
## Hierbas 0 0 0
## Hortaliza/Vegetal 0 0 0
## Lacteos 0 0 0
## Leguminosa 0 0 0
## Pastos 0 0 0
## Peces 0 0 0
## Sin producto 0 0 0
## Tuberculo 0 0 0
##
## Guanabana Guayaba Gulupa Harina De Alfalfa
## Artesanias 0 0 0 0
## Cereales 0 0 0 0
## Cultivos Agroindustriales 0 0 0 0
## Fruta 1 1 1 0
## Ganaderia 0 0 0 0
## Hierbas 0 0 0 0
## Hortaliza/Vegetal 0 0 0 0
## Lacteos 0 0 0 0
## Leguminosa 0 0 0 0
## Pastos 0 0 0 1
## Peces 0 0 0 0
## Sin producto 0 0 0 0
## Tuberculo 0 0 0 0
##
## Hortalizas Huevos Lacteos Leche Leche De Cabra
## Artesanias 0 0 0 0 0
## Cereales 0 0 0 0 0
## Cultivos Agroindustriales 0 0 0 0 0
## Fruta 0 0 0 0 0
## Ganaderia 0 1 0 0 0
## Hierbas 0 0 0 0 0
## Hortaliza/Vegetal 1 0 0 0 0
## Lacteos 0 0 1 1 1
## Leguminosa 0 0 0 0 0
## Pastos 0 0 0 0 0
## Peces 0 0 0 0 0
## Sin producto 0 0 0 0 0
## Tuberculo 0 0 0 0 0
##
## Lechuga Limon Tahití Lulo Maíz Manzana
## Artesanias 0 0 0 0 0
## Cereales 0 0 0 1 0
## Cultivos Agroindustriales 0 0 0 0 0
## Fruta 0 1 1 0 1
## Ganaderia 0 0 0 0 0
## Hierbas 0 0 0 0 0
## Hortaliza/Vegetal 1 0 0 0 0
## Lacteos 0 0 0 0 0
## Leguminosa 0 0 0 0 0
## Pastos 0 0 0 0 0
## Peces 0 0 0 0 0
## Sin producto 0 0 0 0 0
## Tuberculo 0 0 0 0 0
##
## Manzana Y Pera Miel De Abeja Mojarra Mora Naranja
## Artesanias 0 0 0 0 0
## Cereales 0 0 0 0 0
## Cultivos Agroindustriales 0 1 0 0 0
## Fruta 1 0 0 1 1
## Ganaderia 0 0 0 0 0
## Hierbas 0 0 0 0 0
## Hortaliza/Vegetal 0 0 0 0 0
## Lacteos 0 0 0 0 0
## Leguminosa 0 0 0 0 0
## Pastos 0 0 0 0 0
## Peces 0 0 1 0 0
## Sin producto 0 0 0 0 0
## Tuberculo 0 0 0 0 0
##
## Ovinos Y Caprinos Panela Papa Papa Nativa Papayuela
## Artesanias 0 0 0 0 0
## Cereales 0 0 0 0 0
## Cultivos Agroindustriales 0 1 0 0 0
## Fruta 0 0 0 0 1
## Ganaderia 1 0 0 0 0
## Hierbas 0 0 0 0 0
## Hortaliza/Vegetal 0 0 0 0 0
## Lacteos 0 0 0 0 0
## Leguminosa 0 0 0 0 0
## Pastos 0 0 0 0 0
## Peces 0 0 0 0 0
## Sin producto 0 0 0 0 0
## Tuberculo 0 0 1 1 0
##
## Pera Piscicultura Pitaya Pollo Queso Quinua Sabila
## Artesanias 0 0 0 0 0 0 0
## Cereales 0 0 0 0 0 1 0
## Cultivos Agroindustriales 0 0 0 0 0 0 1
## Fruta 1 0 1 0 0 0 0
## Ganaderia 0 0 0 1 0 0 0
## Hierbas 0 0 0 0 0 0 0
## Hortaliza/Vegetal 0 0 0 0 0 0 0
## Lacteos 0 0 0 0 1 0 0
## Leguminosa 0 0 0 0 0 0 0
## Pastos 0 0 0 0 0 0 0
## Peces 0 1 0 0 0 0 0
## Sin producto 0 0 0 0 0 0 0
## Tuberculo 0 0 0 0 0 0 0
##
## Sagu
## Artesanias 0
## Cereales 1
## Cultivos Agroindustriales 0
## Fruta 0
## Ganaderia 0
## Hierbas 0
## Hortaliza/Vegetal 0
## Lacteos 0
## Leguminosa 0
## Pastos 0
## Peces 0
## Sin producto 0
## Tuberculo 0
##
## Siembra Y Produccion De Chin "Caña Brava - De Castilla"
## Artesanias 0
## Cereales 0
## Cultivos Agroindustriales 1
## Fruta 0
## Ganaderia 0
## Hierbas 0
## Hortaliza/Vegetal 0
## Lacteos 0
## Leguminosa 0
## Pastos 0
## Peces 0
## Sin producto 0
## Tuberculo 0
##
## Silo Silo De Avena Tilapia Tomate Tomate De Arbol
## Artesanias 0 0 0 0 0
## Cereales 0 0 0 0 0
## Cultivos Agroindustriales 0 0 0 0 0
## Fruta 0 0 0 0 1
## Ganaderia 0 0 0 0 0
## Hierbas 0 0 0 0 0
## Hortaliza/Vegetal 0 0 0 1 0
## Lacteos 0 0 0 0 0
## Leguminosa 0 0 0 0 0
## Pastos 1 1 0 0 0
## Peces 0 0 1 0 0
## Sin producto 0 0 0 0 0
## Tuberculo 0 0 0 0 0
##
## Transformacion De Lacteos Trucha Arcoiris Uchuva
## Artesanias 0 0 0
## Cereales 0 0 0
## Cultivos Agroindustriales 0 0 0
## Fruta 0 0 1
## Ganaderia 0 0 0
## Hierbas 0 0 0
## Hortaliza/Vegetal 0 0 0
## Lacteos 1 0 0
## Leguminosa 0 0 0
## Pastos 0 0 0
## Peces 0 1 0
## Sin producto 0 0 0
## Tuberculo 0 0 0
##
## Venta De Animales En Pie Yuca Zanahoria
## Artesanias 0 0 0
## Cereales 0 0 0
## Cultivos Agroindustriales 0 0 0
## Fruta 0 0 0
## Ganaderia 1 0 0
## Hierbas 0 0 0
## Hortaliza/Vegetal 0 0 1
## Lacteos 0 0 0
## Leguminosa 0 0 0
## Pastos 0 0 0
## Peces 0 0 0
## Sin producto 0 0 0
## Tuberculo 0 1 0
Grupo × comercializacion (TAB_GxC)
p-value = 7.678e-05 (< 0.05) e rechaza H0 de independencia. Interpretación: hay evidencia estadística de que el grupo productivo está asociado con tener/no tener servicio de comercializacion (no se distribuye igual en todos los grupos).
Producto × comercializacion (TAB_PxC)
p-value = 0.05872 (> 0.05) No se rechaza H0 al 5% (está cerca). Interpretación: no hay evidencia suficiente (al 5%) para afirmar asociación clara entre producto y comercializacion; sin embargo, al 10% podría considerarse “marginal” (depende del criterio del curso).
Grupo × Producto (TAB_GxP)
p-value < 2.2e-16 Se rechaza H0 fuertemente. Interpretación: hay asociación muy marcada entre grupo y producto (lo cual es esperable porque “grupo” clasifica la naturaleza productiva).
Advertencia “Chi-squared approximation may be incorrect”
Esa advertencia aparece porque hay muchas celdas con conteos esperados bajos (muy frecuente en TAB_PxC y TAB_GxP). En el informe puedes decir:
“Dado el gran número de categorías y celdas con frecuencias bajas, la aproximación asintótica del chi-cuadrado puede ser inexacta; por ello la conclusión se interpreta con cautela y se complementa con perfiles (CPF/CPC) y análisis de correspondencias.”
# Pruebas Chi-cuadrado (Independencia)
PRUEBA_GxC <- chisq.test(TAB_GxC)
## Warning in stats::chisq.test(x, y, ...): Chi-squared approximation may be
## incorrect
PRUEBA_PxC <- chisq.test(TAB_PxC)
## Warning in stats::chisq.test(x, y, ...): Chi-squared approximation may be
## incorrect
PRUEBA_GxP <- chisq.test(TAB_GxP)
## Warning in stats::chisq.test(x, y, ...): Chi-squared approximation may be
## incorrect
PRUEBA_GxC
##
## Pearson's Chi-squared test
##
## data: TAB_GxC
## X-squared = 39.828, df = 12, p-value = 7.678e-05
PRUEBA_PxC
##
## Pearson's Chi-squared test
##
## data: TAB_PxC
## X-squared = 108.56, df = 87, p-value = 0.05872
PRUEBA_GxP
##
## Pearson's Chi-squared test
##
## data: TAB_GxP
## X-squared = 5748, df = 1044, p-value < 2.2e-16
Aquí tomamos como pareja única principal:
*Grupo (G) vs Servicio de comercializacion (C)**
porque es la más interpretable (menos categorías que Producto).
Los residuales estandarizados permiten identificar las combinaciones grupo–comercialización que se desvían significativamente del comportamiento esperado bajo independencia:
Lácteos – Sí (4.57): presenta un residual estandarizado altamente positivo, indicando que existen muchas más asociaciones con servicio de comercialización de las esperadas para este grupo.
Lácteos – No (-4.57): déficit marcado respecto a lo esperado, confirmando la fuerte asociación del grupo Lácteos con la comercialización.
Pastos – Sí (2.64): muestra también una asociación positiva con el servicio de comercialización, aunque con menor peso absoluto.
Ganadería – No (2.54) y Ganadería – Sí (-2.54): evidencian una fuerte asociación negativa con la comercialización, es decir, menos asociaciones con servicio de comercialización de las esperadas.
Leguminosa y Sin producto presentan residuales negativos en “Sí”, lo que confirma su baja integración a mecanismos formales de comercialización.
En conjunto, los residuales muestran que la comercialización se concentra principalmente en ciertos grupos productivos, mientras que otros permanecen rezagados.
TAB_TCP <- TAB_GxC
# Contingencia
TAB_TCP
##
## No Si
## Artesanias 1 1
## Cereales 16 2
## Cultivos Agroindustriales 62 19
## Fruta 72 18
## Ganaderia 43 4
## Hierbas 1 1
## Hortaliza/Vegetal 27 6
## Lacteos 58 40
## Leguminosa 16 1
## Pastos 3 5
## Peces 12 2
## Sin producto 9 0
## Tuberculo 47 13
# Chi-cuadrado para residuales
CHI_TCP <- chisq.test(TAB_TCP)
## Warning in stats::chisq.test(x, y, ...): Chi-squared approximation may be
## incorrect
# Residuales (crudos y estandarizados)
CHI_TCP$residuals
##
## No Si
## Artesanias -0.430055389 0.778481712
## Cereales 0.594769413 -1.076645296
## Cultivos Agroindustriales -0.007685192 0.013911652
## Fruta 0.366551905 -0.663528377
## Ganaderia 1.164758079 -2.108432745
## Hierbas -0.430055389 0.778481712
## Hortaliza/Vegetal 0.341282531 -0.617786025
## Lacteos -1.971749748 3.569240521
## Leguminosa 0.824308190 -1.492153959
## Pastos -1.264025544 2.288125659
## Peces 0.388834712 -0.703864480
## Sin producto 0.801379980 -1.450649556
## Tuberculo 0.151799557 -0.274785952
CHI_TCP$stdres
##
## No Si
## Artesanias -0.89123392 0.89123392
## Cereales 1.25378961 -1.25378961
## Cultivos Agroindustriales -0.01743571 0.01743571
## Fruta 0.84117660 -0.84117660
## Ganaderia 2.53641528 -2.53641528
## Hierbas -0.89123392 0.89123392
## Hortaliza/Vegetal 0.73143061 -0.73143061
## Lacteos -4.57210092 4.57210092
## Leguminosa 1.73578179 -1.73578179
## Pastos -2.63616081 2.63616081
## Peces 0.81614073 -0.81614073
## Sin producto 1.67307751 -1.67307751
## Tuberculo 0.33565258 -0.33565258
Las contribuciones indican qué categorías explican en mayor medida la inercia del análisis de correspondencias:
Lácteos (41.75%) es el grupo que más contribuye a la estructura del plano factorial, confirmando su papel central en la relación entre grupo y comercialización.
Pastos (17.16%) y Ganadería (14.57%) también aportan de forma importante, reforzando su capacidad de diferenciación.
Leguminosa (7.30%) y Sin producto (6.90%) aportan moderadamente a la inercia total.
Grupos como Cultivos agroindustriales, Tubérculo y Fruta presentan contribuciones bajas, lo que indica comportamientos más cercanos al promedio esperado.
Contribuciones de las categorías de comercialización
En la dimensión principal:
“Sí” aporta el 76.62% de la inercia,
“No” aporta el 23.38%.
Esto indica que la presencia del servicio de comercialización es el principal factor discriminante en el análisis, siendo el eje dominante de la correspondencia.
RES_CA_TCP <- CA(TAB_TCP, graph = FALSE)
# Contribuciones (%) filas y columnas a las dimensiones
RES_CA_TCP$row$contrib
## Artesanias Cereales Cultivos Agroindustriales
## 1.985975e+00 3.798588e+00 6.342119e-04
## Fruta Ganaderia Hierbas
## 1.442766e+00 1.456788e+01 1.985975e+00
## Hortaliza/Vegetal Lacteos Leguminosa
## 1.250700e+00 4.174732e+01 7.296326e+00
## Pastos Peces Sin producto
## 1.715682e+01 1.623510e+00 6.896075e+00
## Tuberculo
## 2.474378e-01
RES_CA_TCP$col$contrib
## [,1]
## No 23.38205
## Si 76.61795
El análisis de correspondencia simple unidimensional permite representar la relación Grupo × Servicio de comercialización sobre un único eje factorial.
En esta dimensión:
Los grupos Lácteos y Pastos se ubican próximos a la categoría “Sí”, reflejando una mayor integración a procesos de comercialización formal.
Los grupos Ganadería, Leguminosa, Sin producto y Cereales se posicionan cerca de la categoría “No”, evidenciando una menor participación en mecanismos de comercialización.
Grupos como Fruta, Cultivos agroindustriales y Tubérculo aparecen más cercanos al origen, lo que indica comportamientos intermedios o menos diferenciados.
Esta representación unidimensional confirma que el acceso a la comercialización es el principal eje de diferenciación entre los grupos productivos, y que existen perfiles claramente contrastantes dentro del sector agropecuario del departamento de Boyacá.
# Paquetes
library(dplyr)
library(stringr)
library(FactoMineR)
library(factoextra)
# 1) Cambia SOLO esta línea si tu data se llama distinto:
DF_BASE <- ASOCIACIONES_DE_PRODUCTORES_AGROPECUARIOS_DEPARTAMENTO_DE_BOYACA_20251024_ETL
# 2) Nombres de columnas (según lo que tú has mostrado)
col_grupo <- "Grupo"
col_comer <- "Tienen Servicio de comercializacion"
# 3) Validación rápida
stopifnot(col_grupo %in% names(DF_BASE))
stopifnot(col_comer %in% names(DF_BASE))
# 4) Subtabla para CA (Pareja única Grupo x Comercialización)
ASOC_CA <- DF_BASE[, c(col_grupo, col_comer)] |>
na.omit()
# Normalizar texto: quitar espacios, unificar, y volver factor
ASOC_CA[[col_grupo]] <- ASOC_CA[[col_grupo]] |> as.character() |> str_squish() |> as.factor()
ASOC_CA[[col_comer]] <- ASOC_CA[[col_comer]] |> as.character() |> str_squish() |> as.factor()
# Tabla de contingencia
TAB_TCP <- table(ASOC_CA[[col_grupo]], ASOC_CA[[col_comer]])
# Eliminar filas/columnas con suma 0 (evita errores raros)
TAB_TCP <- TAB_TCP[rowSums(TAB_TCP) > 0, colSums(TAB_TCP) > 0]
TAB_TCP
##
## No Si
## Artesanias 1 1
## Cereales 16 2
## Cultivos Agroindustriales 62 19
## Fruta 72 18
## Ganaderia 43 4
## Hierbas 1 1
## Hortaliza/Vegetal 27 6
## Lacteos 58 40
## Leguminosa 16 1
## Pastos 3 5
## Peces 12 2
## Sin producto 9 0
## Tuberculo 47 13
De acuerdo con (Díaz Morales & Morales Rivera, 2012), el análisis de correspondencias simples (ACS) puede extenderse cuando se requiere trabajar simultáneamente con varias variables categóricas. Para ello se emplea el análisis de correspondencias múltiples (ACM), el cual se construye a partir de una tabla disyuntiva completa, donde cada fila representa a una asociación de productores, mientras que las columnas corresponden a las modalidades de las variables categóricas seleccionadas, tales como Producto, Servicio de comercializacion y Valor agregado. En esta matriz, cada asociación es codificada de acuerdo con la categoría específica que presenta en cada variable. El ACM permite aplicar el método de correspondencias de manera conjunta sobre todas las variables categóricas, generando una representación global que sintetiza la relación entre los diferentes atributos productivos y comerciales. De esta manera, la población de asociaciones queda particionada de forma exhaustiva y exclusiva según sus características productivas (tipo de producto), comerciales (existencia de servicios de comercializacion) y de transformación (valor agregado). Esta sección complementa el ACS, cuyo análisis en la sección 3.2 se vio limitado por su naturaleza unidimensional y por la imposibilidad de obtener una representación bidimensional suficientemente informativa para todos los pares de variables. En contraste, mediante el ACM se integran las tres variables categóricas seleccionadas, permitiendo construir un primer plano factorial que captura gran parte de la variabilidad total del sistema. Esto ofrece una visión más completa de las relaciones entre los tipos de productos agrícolas, los procesos de valor agregado y los niveles de comercializacion dentro de las asociaciones del departamento de Boyacá.
El Análisis de Correspondencias Múltiples se realizó sobre 479 asociaciones, considerando variables categóricas relacionadas con municipio, grupo productivo, producto, servicio de comercialización y valor agregado.
Las dos primeras dimensiones explican una proporción moderada de la inercia, lo cual es habitual en ACM con muchas categorías.
La nube densa de puntos refleja una alta diversidad estructural entre asociaciones, sin una segmentación completamente rígida.
# Elige variables cualitativas para ACM (ajusta si alguna no existe)
vars_acm <- c(
"Municipio",
"Grupo",
"Producto",
"Tienen Servicio de comercializacion",
"Los productos tienen valor agregado",
"Han sido capacitados en buenas Prácticas"
)
# Quédate solo con las que realmente estén en tu DF
vars_acm <- vars_acm[vars_acm %in% names(DF_BASE)]
vars_acm
## [1] "Municipio" "Grupo"
## [3] "Producto" "Tienen Servicio de comercializacion"
## [5] "Los productos tienen valor agregado"
# Subset y limpieza
DF_ACM <- DF_BASE[, vars_acm, drop = FALSE] |>
na.omit()
# Pasar todo a factor y normalizar texto
DF_ACM <- DF_ACM |>
mutate(across(everything(), ~ as.factor(str_squish(as.character(.)))))
str(DF_ACM)
## tibble [479 × 5] (S3: tbl_df/tbl/data.frame)
## $ Municipio : Factor w/ 115 levels "ALMEIDA","AQUITANIA",..: 69 69 69 1 58 67 79 10 38 66 ...
## $ Grupo : Factor w/ 13 levels "Artesanias","Cereales",..: 4 4 4 4 4 4 4 4 4 7 ...
## $ Producto : Factor w/ 88 levels "Agraz","Aguacate",..: 1 1 1 2 2 2 2 3 3 4 ...
## $ Tienen Servicio de comercializacion: Factor w/ 2 levels "No","Si": 2 2 2 1 1 1 1 1 1 1 ...
## $ Los productos tienen valor agregado: Factor w/ 2 levels "No","Si": 1 1 1 1 1 1 1 1 1 1 ...
En el biplot se observa que:
Grupo Lácteos, Producto Leche y Servicio de comercialización = Sí aparecen cercanos, indicando asociaciones estructuralmente vinculadas.
Grupo Tubérculo y Producto Papa se asocian con Servicio de comercialización = No, reflejando limitaciones comerciales.
Cultivos Agroindustriales se posiciona cerca de productos con mayor transformación (ej. café), sugiriendo mayor orientación a valor agregado.
El biplot evidencia coherencia entre grupo, producto y nivel de comercialización.
RES_ACM <- FactoMineR::MCA(DF_ACM, graph = FALSE)
RES_ACM
## **Results of the Multiple Correspondence Analysis (MCA)**
## The analysis was performed on 479 individuals, described by 5 variables
## *The results are available in the following objects:
##
## name description
## 1 "$eig" "eigenvalues"
## 2 "$var" "results for the variables"
## 3 "$var$coord" "coord. of the categories"
## 4 "$var$cos2" "cos2 for the categories"
## 5 "$var$contrib" "contributions of the categories"
## 6 "$var$v.test" "v-test for the categories"
## 7 "$var$eta2" "coord. of variables"
## 8 "$ind" "results for the individuals"
## 9 "$ind$coord" "coord. for the individuals"
## 10 "$ind$cos2" "cos2 for the individuals"
## 11 "$ind$contrib" "contributions of the individuals"
## 12 "$call" "intermediate results"
## 13 "$call$marge.col" "weights of columns"
## 14 "$call$marge.li" "weights of rows"
fviz_mca_biplot(
RES_ACM,
repel = TRUE
)
Las categorías con cos² alto son las mejor representadas en el plano factorial, entre ellas:
Grupo Lácteos
Producto Leche
Servicio de comercialización (Sí / No)
Valor agregado (Sí / No)
Esto indica que las interpretaciones basadas en estas categorías son confiables, mientras que categorías con cos² bajo deben interpretarse con cautela.
# Calidad de representación de categorías (variables) en Dim 1 y Dim 2
fviz_mca_var(RES_ACM, col.var = "cos2", repel = TRUE)
# Si quieres ver solo las mejores categorías (cos2 alto):
fviz_mca_var(RES_ACM, col.var = "cos2", repel = TRUE, select.var = list(cos2 = 10))
Dimensión 1
Está dominada por:
Grupo Cultivos Agroindustriales
Producto Café
Grupo Tubérculo
Producto Papa
Representa un eje de diferenciación productiva y comercial.
Dimensión 2
Se ve influenciada por:
Grupo Lácteos
Producto Leche
Servicio de comercialización
Representa un eje de articulación organizacional y comercial.
# Contribución de categorías a Dim 1
fviz_contrib(RES_ACM, choice = "var", axes = 1, top = 20)
# Contribución de categorías a Dim 2
fviz_contrib(RES_ACM, choice = "var", axes = 2, top = 20)
El biplot ponderado por contribuciones permite identificar:
Categorías estructurantes del sistema productivo, principalmente Lácteos, Café, Papa y Comercialización.
Categorías periféricas con menor influencia, asociadas a productos o grupos menos frecuentes.
Este gráfico confirma que la estructura productiva de las asociaciones en Boyacá está fuertemente condicionada por el tipo de producto y el nivel de acceso a servicios de comercialización.
fviz_mca_biplot(
RES_ACM,
repel = TRUE,
col.var = "contrib"
)
En esta cuarta etapa del estudio, se presentan los cálculos, visualizaciones e interpretaciones correspondientes al análisis aplicado al conjunto de datos procesado en las fases previas (1, 2 y 3).
El propósito central de esta sección es desarrollar un análisis de conglomerados, orientado a identificar grupos de asociaciones agropecuarias que comparten características similares en términos de: Tipo de producto que ofrecen, Servicios de comercializacion que prestan, Nivel de valor agregado incorporado a su producción. Para ello, se emplean dos enfoques complementarios: Clúster jerárquico, representado mediante dendrogramas, que permite explorar la estructura general de similitud entre las asociaciones y visualizar cómo se agrupan progresivamente según sus atributos productivos y comerciales. Clúster no jerárquico (K-medias), utilizado para definir grupos óptimos y homogéneos, proporcionando una clasificación clara y operativa de las asociaciones en función de sus características. Este análisis permitirá reconocer patrones comunes, diferencias estructurales y perfiles productivos relevantes dentro del sector agropecuario del departamento de Boyacá, facilitando una comprensión más profunda del comportamiento organizativo, comercial y transformador de las asociaciones estudiadas.
Es una técnica de análisis multivariado empleada para organizar unidades de estudio en función de su nivel de similitud; permite explorar cómo se relacionan distintos elementos dentro de un conjunto de datos, revelando patrones estructurales que no son evidentes de forma directa. El procedimiento implica la estandarización de las variables, el cálculo de distancias entre las observaciones —frecuentemente mediante la distancia euclidiana— y la elección de un criterio de enlace, como el método de Ward, para determinar cómo se fusionan los grupos. El resultado se visualiza en un dendrograma, donde las uniones reflejan el grado de cercanía entre los elementos analizados. Al interpretar este dendrograma es posible identificar grupos que comparten características comunes, ya sea por tamaño, composición o rasgos operativos, lo que facilita la segmentación y el análisis comparativo dentro de cualquier contexto de estudio.
ASOCIACIONES_DE_PRODUCTORES_AGROPECUARIOS_DEPARTAMENTO_DE_BOYACA_20251024_ETL <- read_excel("ASOCIACIONES_DE_PRODUCTORES_AGROPECUARIOS_DEPARTAMENTO_DE_BOYACA_20251024_ETL.xlsx")
head(as.data.frame(ASOCIACIONES_DE_PRODUCTORES_AGROPECUARIOS_DEPARTAMENTO_DE_BOYACA_20251024_ETL))
## Municipio Numero total de asociados Numero de asociados Activos
## 1 RaQUIRA 31 46
## 2 RaQUIRA 16 6
## 3 RaQUIRA 30 15
## 4 ALMEIDA 14 7
## 5 PaEZ 153 57
## 6 QUÍPAMA 96 40
## Tienen Servicio de comercializacion Los productos tienen valor agregado
## 1 Si No
## 2 Si No
## 3 Si No
## 4 No No
## 5 No No
## 6 No No
## Han sido capacitados en Buenas Practicas Producto Grupo
## 1 Si Agraz Fruta
## 2 Si Agraz Fruta
## 3 Si Agraz Fruta
## 4 Si Aguacate Fruta
## 5 No Aguacate Fruta
## 6 No Aguacate Fruta
## La asociacion cuenta con terreno La asociacion cuenta con centro de acopio
## 1 Si Si
## 2 No No
## 3 No No
## 4 No No
## 5 No No
## 6 No No
## En los dos ultimos años les han aprobado proyectos Fertilizacion Organica.
## 1 Si Si
## 2 No No
## 3 No No
## 4 No Si
## 5 No No
## 6 No No
## Riego En Pisicultura: disponibilidad y conduccion del agua.
## 1 Si
## 2 Si
## 3 No
## 4 Si
## 5 No
## 6 No
## llevan registros de sus costos de produccion
## 1 Si
## 2 Si
## 3 No
## 4 No
## 5 No
## 6 Si
## La asociacion y/o asociados, realizan practicas para el uso y aprovechamiento de aguas de lluvia
## 1 Si
## 2 Si
## 3 Si
## 4 Si
## 5 No
## 6 No
## area total sembrada en Ha. Cual es el rendimiento en toneladas
## 1 27.0 1.5
## 2 12.0 5.0
## 3 7.0 2.0
## 4 2.5 1.2
## 5 25.0 0.0
## 6 2.0 0.0
## Area disponible en ha
## 1 0
## 2 0
## 3 6
## 4 85
## 5 0
## 6 0
## La asociacion realiza programaciones de planeacion de la siembra y produccion
## 1 Si
## 2 Si
## 3 No
## 4 Si
## 5 No
## 6 No
## Cuantos asociados estan vendiendo o comercializando
## 1 46
## 2 4
## 3 0
## 4 0
## 5 0
## 6 12
## La asociacion en el ultimo año ha participado en ferias agropecuarias
## 1 Si\r
## 2 Si\r
## 3 No
## 4 No
## 5 No
## 6 No
## Densidad_siembraporhectarea
## 1 1600
## 2 1700
## 3 1600
## 4 12000
## 5 20000
## 6 200
El análisis de conglomerados se realizó a partir de las variables cuantitativas relacionadas con la estructura productiva de las asociaciones agropecuarias del departamento de Boyacá, empleando la distancia euclidiana sobre datos estandarizados. La estandarización permitió eliminar el efecto de las diferentes escalas de medición, garantizando que todas las variables contribuyeran de manera equilibrada al cálculo de las distancias.
El dendrograma de disimilaridad evidencia una alta heterogeneidad entre las asociaciones, con múltiples uniones tempranas a baja altura y algunos casos que se integran a alturas considerablemente mayores, lo que sugiere la presencia de asociaciones con perfiles productivos marcadamente distintos.
data_dist <- ASOCIACIONES_DE_PRODUCTORES_AGROPECUARIOS_DEPARTAMENTO_DE_BOYACA_20251024_ETL[
, -c(1,4,5,6,7,8,9,10,11,12,13,14,15,19,21)
]
data_dist <- data.frame(lapply(data_dist, as.numeric))
rownames(data_dist) <- make.unique(
as.character(ASOCIACIONES_DE_PRODUCTORES_AGROPECUARIOS_DEPARTAMENTO_DE_BOYACA_20251024_ETL$Municipio)
)
dist_mat <- dist(scale(data_dist), method = "euclidean")
hc <- hclust(dist_mat, method = "ward.D2")
plot(hc, cex = 0.5, main = "Dendrograma de disimilaridad")
Para determinar el número óptimo de conglomerados se aplicó el criterio de Mojena utilizando distintos métodos de enlace:
Enlace simple: número óptimo de grupos = 256
Enlace completo: número óptimo de grupos = 259
Enlace promedio: número óptimo de grupos = 258
Los valores elevados obtenidos indican que, bajo este criterio, el conjunto de datos presenta una gran dispersión y diversidad, lo que es consistente con la amplia variedad de municipios, grupos productivos, niveles de organización y capacidades productivas presentes en el departamento de Boyacá.
No obstante, estos resultados también sugieren que el criterio de Mojena puede sobreestimar el número de conglomerados en bases de datos grandes y heterogéneas, por lo que se complementó el análisis con métodos visuales y no jerárquicos.
datos_clasif <- ASOCIACIONES_DE_PRODUCTORES_AGROPECUARIOS_DEPARTAMENTO_DE_BOYACA_20251024_ETL[, -c(1,4,5,6,7,8,9,10,11,12,13,14,15,19,21)
]
datos_clasif <- data.frame(lapply(datos_clasif, as.numeric))
dist_mat <- dist(scale(datos_clasif), method = "euclidean")
hc_single <- hclust(dist_mat, method = "single")
mojena <- function(hc){
n_hd <- length(hc$height)
alpha <- hc$height
alp_g <- numeric(n_hd - 1)
for(i in 1:(n_hd - 1)){
tramo <- alpha[(n_hd - i + 1):1]
alp_g[i] <- mean(tramo) + 1.25 * sd(tramo)
}
nog <- sum(alp_g <= alpha[-n_hd]) + 1
plot(alpha[-n_hd],
pch = 20,
col = (alp_g > alpha[-n_hd]) + 1,
main = paste("Union simple - Optimal number of groups =", nog),
ylab = expression(alpha[g]),
xlab = "Nodes")
return(nog)
}
mojena(hc_single)
## [1] 256
# Usamos la misma matriz de distancias ya calculada: dist_mat
# Clustering jerárquico: enlace completo
hc_complete <- hclust(dist_mat, method = "complete")
mojena <- function(hc){
n_hd <- length(hc$height)
alpha <- hc$height
alp_g <- numeric(n_hd - 1)
for(i in 1:(n_hd - 1)){
tramo <- alpha[(n_hd - i + 1):1]
alp_g[i] <- mean(tramo) + 1.25 * sd(tramo)
}
nog <- sum(alp_g <= alpha[-n_hd]) + 1
plot(alpha[-n_hd],
pch = 20,
col = (alp_g > alpha[-n_hd]) + 1,
main = paste("Union completa - Optimal number of groups =", nog),
ylab = expression(alpha[g]),
xlab = "Nodes")
return(nog)
}
mojena(hc_complete)
## [1] 259
# Usamos la misma matriz de distancias ya calculada: dist_mat
# Clustering jerárquico: enlace promedio
hc_average <- hclust(dist_mat, method = "average")
mojena <- function(hc){
n_hd <- length(hc$height)
alpha <- hc$height
alp_g <- numeric(n_hd - 1)
for(i in 1:(n_hd - 1)){
tramo <- alpha[(n_hd - i + 1):1]
alp_g[i] <- mean(tramo) + 1.25 * sd(tramo)
}
nog <- sum(alp_g <= alpha[-n_hd]) + 1
plot(alpha[-n_hd],
pch = 20,
col = (alp_g > alpha[-n_hd]) + 1,
main = paste("Union promedio - Optimal number of groups =", nog),
ylab = expression(alpha[g]),
xlab = "Nodes")
return(nog)
}
mojena(hc_average)
## [1] 258
El dendrograma con enlace simple presenta el conocido efecto de encadenamiento, donde muchas asociaciones se agrupan progresivamente a muy baja altura. Esto dificulta la identificación de conglomerados bien definidos y su interpretación sustantiva.
suppressWarnings(fviz_dend(hc_single, k = 3, cex = 0.5, k_colors = "npg", color_labels_by_k = T, rect = T))
El enlace completo genera conglomerados más compactos y equilibrados. Se observa una mejor separación entre grupos, lo que facilita la identificación de asociaciones con perfiles productivos similares y reduce el efecto de observaciones extremas.
fviz_dend(hc_complete, k = 3, cex = 0.5, k_colors = "npg", color_labels_by_k = T, rect = T)
El método de enlace promedio ofrece una solución intermedia entre el enlace simple y el completo. Los conglomerados obtenidos presentan una estructura más estable y representan adecuadamente la diversidad productiva sin generar agrupaciones excesivamente fragmentadas.
En los tres métodos se evidencia que, aunque existen múltiples subgrupos, es posible identificar macroestructuras comunes que agrupan asociaciones con características productivas y organizativas similares.
fviz_dend(hc_average, k = 3, cex = 0.5, k_colors = "npg", color_labels_by_k = T, rect = T)
Es un método de clasificación que permite dividir un conjunto de observaciones en un número fijo de grupos o clusters, definidos previamente. El algoritmo más utilizado es k-means, el cual forma grupos buscando que cada uno sea lo más homogéneo posible internamente y, a la vez, diferente de los demás. El proceso consiste en seleccionar el número de clusters (k), asignar centroides iniciales y, luego, ubicar cada observación en el grupo cuyo centro esté más cercano. A medida que el algoritmo avanza, los centroides se recalculan y las observaciones se reasignan hasta que el proceso se estabiliza. Este tipo de agrupación resulta útil para identificar patrones generales dentro de un conjunto de datos y construir perfiles que permitan comparar grupos entre sí. De esta manera, se facilita el análisis de características comunes y diferencias relevantes dentro del fenómeno estudiado.
Los métodos Elbow, Silhouette, Gap Statistic y Majority Rule convergen en soluciones de 3 y 4 clústeres como las más interpretables. Estas soluciones permiten distinguir:
Un clúster mayoritario de asociaciones pequeñas y medianas.
Clústeres minoritarios con asociaciones altamente productivas o con valores extremos en densidad y número de asociados.
El gráfico Elbow muestra una disminución pronunciada de la suma de cuadrados intra-grupo hasta k = 3, a partir del cual la reducción es marginal. Esto indica que tres conglomerados capturan de manera eficiente la estructura principal de los datos sin introducir complejidad innecesaria.
library(factoextra)
library(ggplot2)
set.seed(780729)
# ---- Re-crear data_scaled dentro del chunk ----
data_ <- ASOCIACIONES_DE_PRODUCTORES_AGROPECUARIOS_DEPARTAMENTO_DE_BOYACA_20251024_ETL[
, sapply(ASOCIACIONES_DE_PRODUCTORES_AGROPECUARIOS_DEPARTAMENTO_DE_BOYACA_20251024_ETL, is.numeric)
]
data_clean <- na.omit(data_)
data_clean <- data_clean[, apply(data_clean, 2, var) > 1e-8]
data_scaled <- scale(data_clean)
# ---- Control de tamaño ----
n_filas <- nrow(data_scaled)
if (n_filas < 3) {
stop("No hay suficientes observaciones para aplicar el método del codo")
}
k_max <- min(5, n_filas - 1)
# ---- Elbow ----
fviz_nbclust(
data_scaled,
FUNcluster = kmeans,
method = "wss",
k.max = k_max
) +
geom_vline(xintercept = 3, linetype = 2)
El método Silhouette confirma esta elección, ya que el valor promedio del coeficiente alcanza su máximo en k = 3, lo que indica una buena cohesión interna de los conglomerados y una adecuada separación entre ellos.
n_filas <- nrow(data_scaled)
k_max <- min(5, n_filas - 1)
fviz_nbclust(scale(data_scaled), kmeans, method = "silhouette", k.max = k_max)
El criterio Gap Statistic refuerza los resultados anteriores, señalando también a k = 3 como el número óptimo de conglomerados. Este resultado valida de forma estadística la partición obtenida y confirma la consistencia del modelo de clasificación.
suppressWarnings(fviz_nbclust(scale(data_scaled), kmeans, method = "gap_stat", k.max = k_max, nboot = 50))
set.seed(780729)
# 1. Seleccionar solo variables numéricas
data_ <- ASOCIACIONES_DE_PRODUCTORES_AGROPECUARIOS_DEPARTAMENTO_DE_BOYACA_20251024_ETL[
, sapply(ASOCIACIONES_DE_PRODUCTORES_AGROPECUARIOS_DEPARTAMENTO_DE_BOYACA_20251024_ETL, is.numeric)
]
# 2. Eliminar NA
data_clean <- na.omit(data_)
# 3. Eliminar variables con varianza cero
data_clean <- data_clean[, apply(data_clean, 2, var) > 1e-8]
# 4. Escalamiento
data_scaled <- scale(data_clean)
# 5. Control de tamaño mínimo
n_filas <- nrow(data_scaled)
if (n_filas < 3) {
stop("No hay suficientes observaciones para aplicar NbClust")
}
k_max <- min(5, n_filas - 1)
# 6. Aplicar NbClust (Majority Rule)
res_nb <- suppressWarnings(
NbClust(
data = data_scaled,
distance = "euclidean",
min.nc = 2,
max.nc = k_max,
method = "kmeans"
)
)
## *** : The Hubert index is a graphical method of determining the number of clusters.
## In the plot of Hubert index, we seek a significant knee that corresponds to a
## significant increase of the value of the measure i.e the significant peak in Hubert
## index second differences plot.
##
## *** : The D index is a graphical method of determining the number of clusters.
## In the plot of D index, we seek a significant knee (the significant peak in Dindex
## second differences plot) that corresponds to a significant increase of the value of
## the measure.
##
## *******************************************************************
## * Among all indices:
## * 9 proposed 2 as the best number of clusters
## * 7 proposed 3 as the best number of clusters
## * 2 proposed 4 as the best number of clusters
## * 6 proposed 5 as the best number of clusters
##
## ***** Conclusion *****
##
## * According to the majority rule, the best number of clusters is 2
##
##
## *******************************************************************
# 7. Extraer número óptimo de clústeres
best_k <- as.numeric(res_nb$Best.nc[1, 1])
cat("Número óptimo de clústeres según Majority Rule:", best_k)
## Número óptimo de clústeres según Majority Rule: 3
A partir de los resultados de los métodos jerárquicos y no jerárquicos, se concluye que el conjunto de asociaciones agropecuarias del departamento de Boyacá puede clasificarse en tres grandes conglomerados:
Conglomerado 1: Asociaciones con baja escala productiva, limitada área sembrada, bajo número de asociados activos y escasa o nula participación en procesos de comercialización formal.
Conglomerado 2: Asociaciones con niveles intermedios de producción, mayor número de asociados activos y presencia incipiente de prácticas organizativas y comerciales.
Conglomerado 3: Asociaciones con mayor capacidad productiva, mayor densidad de siembra, mayor número de asociados vinculados a la comercialización y mejores condiciones de organización y planificación productiva.
Esta clasificación permite identificar perfiles diferenciados de desarrollo agropecuario, lo que constituye una herramienta clave para la formulación de políticas públicas, programas de fortalecimiento asociativo y estrategias de intervención territorial.
El K-Means con 3 y 4 clústeres confirma la existencia de asociaciones atípicas con valores excepcionalmente altos en número de asociados o área sembrada, que influyen fuertemente en la estructura global. El clúster principal agrupa asociaciones con características promedio, mientras que los clústeres pequeños representan casos estratégicos o de alto impacto.
data_ <- ASOCIACIONES_DE_PRODUCTORES_AGROPECUARIOS_DEPARTAMENTO_DE_BOYACA_20251024_ETL[
, -c(1,4,5,6,7,8,9,10,11,12,13,14,15,19,21)
]
data_ <- data.frame(lapply(data_, as.numeric))
data_scaled <- scale(data_)
set.seed(121124)
print(kmeans(data_scaled, centers = 3, nstart = 25))
## K-means clustering with 3 clusters of sizes 9, 469, 1
##
## Cluster means:
## Numero.total.de.asociados Numero.de.asociados..Activos
## 1 -0.37023294 0.05749276
## 2 -0.01366405 -0.04714146
## 3 9.74053804 21.59191070
## area.total.sembrada..en.Ha. Cual.es.el.rendimiento.en.toneladas
## 1 -0.04953838 3.50715947
## 2 -0.01576804 -0.06701416
## 3 7.84105543 -0.13479309
## Area.disponible.en.ha Cuantos.asociados.estan.vendiendo.o.comercializando
## 1 2.38591411 4.11363257
## 2 -0.04569731 -0.07799983
## 3 -0.04119075 -0.44077131
## Densidad_siembraporhectarea
## 1 2.35811428
## 2 -0.04513094
## 3 -0.05661634
##
## Clustering vector:
## [1] 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
## [38] 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
## [75] 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
## [112] 2 2 2 2 1 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
## [149] 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
## [186] 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 1 2 2 2 2 2 2 2 2 1 2
## [223] 2 2 2 2 2 2 2 2 2 2 2 2 2 3 2 2 2 2 2 2 2 2 2 2 2 2 1 2 2 1 2 2 2 2 2 2 2
## [260] 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 1 2 2 2 2 2 2 2 2 2 2 2 2
## [297] 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
## [334] 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
## [371] 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 1 2
## [408] 2 2 2 2 2 2 2 2 2 2 1 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
## [445] 2 2 2 2 2 2 2 2 2 2 2 2 1 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
##
## Within cluster sum of squares by cluster:
## [1] 1260.406 1089.101 0.000
## (between_SS / total_SS = 29.8 %)
##
## Available components:
##
## [1] "cluster" "centers" "totss" "withinss" "tot.withinss"
## [6] "betweenss" "size" "iter" "ifault"
data_ <- ASOCIACIONES_DE_PRODUCTORES_AGROPECUARIOS_DEPARTAMENTO_DE_BOYACA_20251024_ETL[
, -c(1,4,5,6,7,8,9,10,11,12,13,14,15,19,21)
]
data_ <- data.frame(lapply(data_, as.numeric))
data_scaled <- scale(data_)
set.seed(121124)
print(kmeans(data_scaled, centers = 4, nstart = 25))
## K-means clustering with 4 clusters of sizes 1, 469, 8, 1
##
## Cluster means:
## Numero.total.de.asociados Numero.de.asociados..Activos
## 1 -0.62226855 -0.16162062
## 2 -0.01366405 -0.04714146
## 3 -0.33872848 0.08488193
## 4 9.74053804 21.59191070
## area.total.sembrada..en.Ha. Cual.es.el.rendimiento.en.toneladas
## 1 -0.13947117 -0.12092416
## 2 -0.01576804 -0.06701416
## 3 -0.03829678 3.96066993
## 4 7.84105543 -0.13479309
## Area.disponible.en.ha Cuantos.asociados.estan.vendiendo.o.comercializando
## 1 21.84029241 -0.44077131
## 2 -0.04569731 -0.07799983
## 3 -0.04588318 4.68293305
## 4 -0.04119075 -0.44077131
## Densidad_siembraporhectarea
## 1 -0.05531253
## 2 -0.04513094
## 3 2.65979263
## 4 -0.05661634
##
## Clustering vector:
## [1] 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
## [38] 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
## [75] 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
## [112] 2 2 2 2 3 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
## [149] 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
## [186] 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 3 2 2 2 2 2 2 2 2 3 2
## [223] 2 2 2 2 2 2 2 2 2 2 2 2 2 4 2 2 2 2 2 2 2 2 2 2 2 2 3 2 2 3 2 2 2 2 2 2 2
## [260] 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 3 2 2 2 2 2 2 2 2 2 2 2 2
## [297] 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
## [334] 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
## [371] 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 3 2
## [408] 2 2 2 2 2 2 2 2 2 2 3 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
## [445] 2 2 2 2 2 2 2 2 2 2 2 2 1 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
##
## Within cluster sum of squares by cluster:
## [1] 0.0000 1089.1008 789.7929 0.0000
## (between_SS / total_SS = 43.8 %)
##
## Available components:
##
## [1] "cluster" "centers" "totss" "withinss" "tot.withinss"
## [6] "betweenss" "size" "iter" "ifault"
data_ <- ASOCIACIONES_DE_PRODUCTORES_AGROPECUARIOS_DEPARTAMENTO_DE_BOYACA_20251024_ETL[
, -c(1,4,5,6,7,8,9,10,11,12,13,14,15,19,21)
]
data_ <- data.frame(lapply(data_, as.numeric))
data_scaled <- scale(data_)
set.seed(121124)
km_3 <- kmeans(data_scaled, centers = 3, nstart = 25)
suppressWarnings(fviz_cluster(kmeans(data_, 3, nstart = 25), data = data_, palette = c("#2E9FDF", "#00AFBB", "#E7B800"), ellipse.type = "euclid", star.plot = TRUE, repel = TRUE, ggtheme = theme_minimal()))
## Too few points to calculate an ellipse
## Too few points to calculate an ellipse
data_ <- ASOCIACIONES_DE_PRODUCTORES_AGROPECUARIOS_DEPARTAMENTO_DE_BOYACA_20251024_ETL[
, -c(1,4,5,6,7,8,9,10,11,12,13,14,15,19,21)
]
data_ <- data.frame(lapply(data_, as.numeric))
data_scaled <- scale(data_)
set.seed(121124)
km_4 <- kmeans(data_scaled, centers = 4, nstart = 25)
fviz_cluster(kmeans(data_, 2, nstart = 25), data = data_, palette = c("#2E9FDF", "#00AFBB", "#E7B800", "#E7B801"), ellipse.type = "euclid", star.plot = TRUE, repel = TRUE, ggtheme = theme_minimal()
)
## Too few points to calculate an ellipse
Este estudio tiene como propósito profundizar en el análisis estadístico de las relaciones existentes entre variables cuantitativas mediante la aplicación de métodos de regresión, con el fin de identificar, modelar y cuantificar cómo determinados factores influyen sobre indicadores de interés. A través del uso de técnicas analíticas rigurosas, se busca generar evidencia empírica sólida que permita interpretar patrones de comportamiento, respaldar procesos de planificación y optimizar la toma de decisiones fundamentadas en datos.
Constituye un modelo estadístico destinado a examinar la relación funcional entre dos variables cuantitativas: una variable independiente x y una variable dependiente Y. Bajo este enfoque, se asume que los cambios en x inducen variaciones sistemáticas en Y, las cuales pueden representarse mediante una estructura lineal expresada como: Y=β0+β1x+ε.Y = _0 + _1 x + .Y=β0+β1x+ε. En este modelo, β0_0β0 corresponde al intercepto y β1_1β1 a la pendiente, parámetros que cuantifican el comportamiento medio de la variable respuesta frente a modificaciones en la variable predictora. El término εagrupa los efectos aleatorios no explicados, sujeto a los supuestos clásicos de normalidad, independencia y varianza constante. La estimación de los parámetros se obtiene mediante el método de mínimos cuadrados, cuyo objetivo es minimizar la discrepancia entre los valores observados y los valores ajustados por el modelo. Este procedimiento produce estimadores insesgados y eficientes bajo los supuestos del modelo, permitiendo además evaluar la adecuación del ajuste mediante indicadores como el coeficiente de determinación (R^2), que mide la proporción de variabilidad explicada por la relación lineal. El análisis inferencial incluye pruebas de significancia para determinar si el parámetro de pendiente es estadísticamente distinto de cero, lo cual permite establecer la existencia de una asociación lineal entre las variables. Adicionalmente, la construcción de intervalos de confianza e intervalos de predicción facilita tanto la interpretación de los parámetros estimados como la estimación de valores futuros de la variable dependiente dentro de un rango de incertidumbre controlado. En conjunto, la RLS constituye una herramienta fundamental dentro del análisis estadístico, proporcionando una base sólida para estudiar patrones de dependencia lineal y para sustentar inferencias en contextos donde la relación entre dos variables puede caracterizarse de manera adecuada mediante una función lineal.
Los diagramas de caja muestran una asimetría positiva pronunciada en todas las variables productivas. La mayoría de asociaciones presentan valores bajos o moderados, mientras que unas pocas concentran valores extremos.
var_asociados <- ASOCIACIONES_DE_PRODUCTORES_AGROPECUARIOS_DEPARTAMENTO_DE_BOYACA_20251024_ETL[
, "Numero total de asociados"
]
summary(var_asociados)
## Numero total de asociados
## Min. : 0.00
## 1st Qu.: 22.00
## Median : 33.00
## Mean : 53.05
## 3rd Qu.: 60.00
## Max. :680.00
boxplot(
var_asociados,
main = "Diagrama de Caja: Numero Total de Asociados",
col = "gold"
)
Se observa una alta dispersión, con presencia de asociaciones muy grandes que actúan como outliers, confirmando una estructura organizativa desigual.
var_asociados <- ASOCIACIONES_DE_PRODUCTORES_AGROPECUARIOS_DEPARTAMENTO_DE_BOYACA_20251024_ETL[
, "Numero total de asociados"
]
summary(var_asociados)
## Numero total de asociados
## Min. : 0.00
## 1st Qu.: 22.00
## Median : 33.00
## Mean : 53.05
## 3rd Qu.: 60.00
## Max. :680.00
boxplot(
var_asociados,
main = "Diagrama de Caja: Número Total de Asociados",
col = "gold"
)
var_area <- ASOCIACIONES_DE_PRODUCTORES_AGROPECUARIOS_DEPARTAMENTO_DE_BOYACA_20251024_ETL[
, "area total sembrada en Ha."
]
summary(var_area)
## area total sembrada en Ha.
## Min. : 0.0
## 1st Qu.: 1.0
## Median : 6.0
## Mean : 158.7
## 3rd Qu.: 42.0
## Max. :18000.0
boxplot(
var_area,
main = "Diagrama de Caja: Área Total Sembrada (ha)",
col = "lightblue"
)
var_rendimiento <- ASOCIACIONES_DE_PRODUCTORES_AGROPECUARIOS_DEPARTAMENTO_DE_BOYACA_20251024_ETL[
, "Cual es el rendimiento en toneladas"
]
summary(var_rendimiento)
## Cual es el rendimiento en toneladas
## Min. : 0
## 1st Qu.: 1
## Median : 8
## Mean : 1682
## 3rd Qu.: 30
## Max. :219000
boxplot(
var_rendimiento,
main = "Diagrama de Caja: Rendimiento en Toneladas",
col = "lightgreen"
)
El area total sembra y el rendimiento ambas variables presentan fuerte concentración en valores bajos, con algunos casos excepcionales que explican gran parte de la variabilidad total. Esto indica que la producción agrícola está altamente concentrada en pocas asociaciones.
Los gráficos de dispersión muestran relaciones débiles y no lineales entre número de asociados, área sembrada y rendimiento, lo que sugiere que el tamaño organizativo no garantiza mayor eficiencia productiva.
datos <- ASOCIACIONES_DE_PRODUCTORES_AGROPECUARIOS_DEPARTAMENTO_DE_BOYACA_20251024_ETL
# Buscar columnas por patrón (a prueba de tildes/mayúsculas)
x1 <- datos[[grep("numero total", colnames(datos), ignore.case = TRUE)[1]]]
y1 <- datos[[grep("area total sembrada", colnames(datos), ignore.case = TRUE)[1]]]
plot(
x1, y1,
main = "Numero de Asociados vs Area Total Sembrada",
xlab = "Numero Total de Asociados",
ylab = "Area Total Sembrada (ha)",
pch = 16
)
datos <- ASOCIACIONES_DE_PRODUCTORES_AGROPECUARIOS_DEPARTAMENTO_DE_BOYACA_20251024_ETL
x2 <- datos[[grep("area total sembrada", colnames(datos), ignore.case = TRUE)[1]]]
y2 <- datos[[grep("rendimiento", colnames(datos), ignore.case = TRUE)[1]]]
plot(
x2, y2,
main = "Area Total Sembrada vs Rendimiento",
xlab = "Area Total Sembrada (ha)",
ylab = "Rendimiento (toneladas)",
pch = 16
)
datos <- ASOCIACIONES_DE_PRODUCTORES_AGROPECUARIOS_DEPARTAMENTO_DE_BOYACA_20251024_ETL
x3 <- datos[[grep("numero total", colnames(datos), ignore.case = TRUE)[1]]]
y3 <- datos[[grep("vendiendo|comercializando", colnames(datos), ignore.case = TRUE)[1]]]
plot(
x3, y3,
main = "Asociados Totales vs Asociados que Comercializan",
xlab = "Numero Total de Asociados",
ylab = "Asociados que Comercializan",
pch = 16
)
El análisis multivariado evidencia que las asociaciones agropecuarias de Boyacá presentan una estructura altamente heterogénea, donde la comercialización, el valor agregado y el tipo de producto son los principales factores de diferenciación. La mayoría de asociaciones operan a pequeña escala, mientras que un grupo reducido concentra la mayor capacidad productiva y comercial, lo que plantea desafíos importantes para el diseño de políticas de fortalecimiento asociativo y desarrollo rural.
x corresponde a la variable explicativa (Número total de asociados, según tu modelo).
Interpretación de los coeficientes
Intercepto (23.07) Representa el valor esperado del área sembrada cuando la variable explicativa es cero. En términos prácticos, indica que, aun con un valor mínimo de la variable explicativa, el modelo predice una base aproximada de 23 hectáreas sembradas. No tiene un significado operativo fuerte, pero sirve como punto de referencia del modelo.
Pendiente (2.56) Por cada unidad adicional en la variable explicativa, el área total sembrada aumenta en promedio 2.56 hectáreas. Esto evidencia una relación positiva entre el tamaño/estructura asociativa y la superficie cultivada.
# Data base real
datos <- ASOCIACIONES_DE_PRODUCTORES_AGROPECUARIOS_DEPARTAMENTO_DE_BOYACA_20251024_ETL
# Variable dependiente: Área total sembrada
y <- datos[[grep("area total sembrada", colnames(datos), ignore.case = TRUE)[1]]]
# Variable independiente: Número total de asociados
x <- datos[[grep("numero total", colnames(datos), ignore.case = TRUE)[1]]]
# Modelo RLS
modelo_RLS_area <- lm(y ~ x)
coef(modelo_RLS_area)
## (Intercept) x
## 23.071029 2.556619
El modelo explica aproximadamente el 2.23% de la variabilidad del área total sembrada. Esto indica que, aunque la relación es estadísticamente significativa, la capacidad explicativa es baja, lo cual es común en datos productivos con alta heterogeneidad entre asociaciones.
R² ajustado = 0.0203 Confirma que el modelo mantiene un poder explicativo similar al R², sin sobreajuste.
Significancia de los coeficientes
Pendiente (x):
Valor estimado: 2.5566
*p-value = 0.00105 ()
Existe una relación positiva y estadísticamente significativa entre la variable explicativa y el área sembrada. A medida que aumenta la variable independiente, el área sembrada tiende a incrementarse de forma sistemática.
Intercepto:
*p-value = 0.72
No es estadísticamente significativo, lo cual es habitual y no invalida el modelo, ya que el interés principal está en la pendiente.
Error estándar residual = 1091 ha Refleja una alta dispersión de los datos reales alrededor de la recta estimada, coherente con la presencia de valores extremos y asociaciones de tamaños muy distintos.
Prueba F global
F = 10.88
p-value = 0.001046
El modelo, en conjunto, es estadísticamente significativo, es decir, la regresión aporta más información que un modelo sin variables explicativas.
summary(modelo_RLS_area)
##
## Call:
## lm(formula = y ~ x)
##
## Residuals:
## Min 1Q Median 3Q Max
## -1260.2 -139.9 -86.0 -52.0 17918.1
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 23.0710 64.6179 0.357 0.72122
## x 2.5566 0.7752 3.298 0.00105 **
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 1091 on 477 degrees of freedom
## Multiple R-squared: 0.0223, Adjusted R-squared: 0.02025
## F-statistic: 10.88 on 1 and 477 DF, p-value: 0.001046
Regresión: La variable explicativa contribuye de manera significativa a explicar la variación del área sembrada. Residuos: La mayor parte de la variabilidad permanece sin explicar, lo que indica influencia de otros factores productivos, territoriales y organizativos no incluidos en el modelo.
p-value ANOVA = 0.001046 ()** Se rechaza la hipótesis nula de que la pendiente sea igual a cero.
Existe evidencia estadística suficiente para afirmar que la variable explicativa incide significativamente en el área total sembrada.
anova(modelo_RLS_area)
## Analysis of Variance Table
##
## Response: y
## Df Sum Sq Mean Sq F value Pr(>F)
## x 1 12943649 12943649 10.877 0.001046 **
## Residuals 477 567602148 1189942
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Al considerar los resultados presentados en la pestaña de Coeficientes del Modelo RLS, se establece que el modelo de regresión lineal simple tiene la siguiente formulación:
\[ \text{Área\_total\_sembrada} = \beta_0 + \beta_1 \times \text{Número\_total\_de\_asociados} \]
De acuerdo con los coeficientes estimados, la ecuación ajustada es:
\[ \widehat{\text{Área_total_sembrada}} = \hat{\beta}_0 + \hat{\beta}_1 \times \text{Número_total_de_asociados} \]
Este modelo, que puede inicialmente pensarse como una extensión de la regresión lineal simple para facilitar su comprensión, y que eventualmente será llamado en este estudio como RLM, tiene como ecuación general aditiva:\[y_i=\beta_0+\beta_1 x_{i1}+\cdots+\beta_k x_{ik}+\varepsilon_i, \hspace{3mm}i=1,2,\dots,n\hspace{10mm}(21)\] Además \(E(\epsilon)=0\) y \(V(\epsilon)=\sigma^2\). También, para hacer pruebas de hipótesis y calcular intervalos de confianza y de predicción, se supone que \(\epsilon\) está normalmente distribuida. Complementariamente, con base en el enfoque de los mínimos cuadrados ordinarios, la estimación de sus parámetros se plantea en términos de la minimización de una función de ensayo desde la cual se observan los cuadrados de las desviaciones de la varaible estudiada. La función de ensayo se representa como \(f(b_0,b_1,...,b_k)= \sum_{j}[y_i-(b_0+b_1x_{1j}+b_2x_{2j}+...+b_kx_{kj})]^2\). Esto conduce a un conjunto de ecuaciones normales lineales en \(b_0,b_1,...,b_k\), que al ser resueltas entregan las estimaciones de mínimos cuadrados de \(\hat{\beta_0},\hat{\beta_1},...,, \hat{\beta_k}\).
Con base en el conjunto de datos descrito en la sección sección 1.2. se formulará un modelo de regresión lineal múltiple para estudiar la relación lineal múltiple supuesta entre las varaibles definidas por los campos: área_total_sembrada (variable dependiente) y los demás como variables independientes: municipio, tipo_de_cultivo, participacion_ferias_agropecuarias, servicio_de_comercializacion.
Desarrollo analisis El estudio de regresión lineal múltiple ha sido procesado con R version 4.5.1 (2025-06-13 ucrt) mediado por RStudio 2022.07.2 Build 576 en una plataforma x86_64-w64-mingw32. El resumen incluye estadísticas tradicionales como media, mediana, rangos y dispersión. Por otro lado, para las variables cualitativas, el resumen estadístico se presenta mediante conteos absolutos, proporciones relativas y diagramas de barras que facilitan la interpretación visual de la distribución de categorías. Se menciona de nuevo que la variable dependiente del modelo es Max Heart Rate, la cual se analiza detalladamente en relación con las demás variables del conjunto.
Formulación del modelo de RLM entre las variables de estudio. La navegación a través de las pestañas muestra el resúmen y la tabla ANOVA del modelo de regresión lineal múltiple total y los coeficientes tanto del modelo mencionado como el logrado luego de reducirlo. Con base en la exploración de los datos en el apartado anterior, el resúmen y la tabla ANOVA del modelo total se formulan para la comparación de dos modelos RLM: uno que incluye a todas las varibles del conjunto de datos, y el otro que excluye a municipio, tipo_de_cultivo, participacion_ferias_agropecuarias, servicio_de_comercializacion. Se menciona de nuevo que área_total_sembrada es la variable dependiente. Al considerar los resultados presentados en la pestaña Coeficientes del Modelo RLM Total, se establece que el modelo de regresión lineal múltiple total relaciona a las variables de interés, las cuales se resumirán como: \(area_disponible\) (área_disponible), \(rendimiento_en_toneladas\) (rendimiento_en_toneladas), \(numero_de_asociados\) (numero_de_asociados), \(municipio\) (municipio) , \(tipo_de_cultivo\) (tipo_de_cultivo) , \(participacion_en_ferias_agropecuarias\) (participacion_en_ferias_agropecuarias) , \(servicio_de_comercializacion\) (servicio_de_comercializacion) .
Analisis del modelo RLM Para este modelo, se obvia la interpretación del intercepto debido a que su valor carece de sentido práctico. Esto se da cuando todas las variables predictoras son iguales a cero o están en su categoría base, lo cual resulta fisiológicamente imposible. La navegación a través de las pestañas, primero por Mejor Modelo Iterado según AIC, muestra que la decisión de excluir del modelo total a la variable SOP resultó acertada, el algoritmo iterado que considera componentes ANOVA y de desviación de residuales la excluyó en la cuarta iteración. Además, el mismo algoritmo determinó un modelo basado en las mismas variables del modelo reducido fundamento en la inspección de varaibles de las dos secciones precedentes. Comparando los modelos de regresión lineal múltiple, el Modelo RLM TOTAL con 23 parámetros muestra el mejor desempeño con un AIC de 11480.35 y un BIC de 12064.95, sugiriendo un equilibrio óptimo entre ajuste y complejidad. A pesar de tener más parámetros, este modelo proporciona un mejor ajuste a los datos en comparación con el Modelo RLM REDUCIDO y el Modelo Iterado STEP, ambos con 18 parámetros y un BIC significativamente más alto de 17258.92, indicando que estos modelos son menos eficientes en balancear el ajuste con la penalización por la cantidad de parámetros. Por lo tanto, el Modelo RLM TOTAL es preferible para predecir el peso en este conjunto de datos.
Este modelo, que eventualmente será llamado en este estudio como RLogS, establece que, en comparación con un modelo de regresión lineal simple que relacione una variable cuantitativa dependiente \(y\) con una varaible cuantitativa independiente \(x\), relaciona una variable categórica dicotómica (con valores posibles \(1\) (éxito) y \(0\) (fracaso)) dependiente \(y\) con el valor de probabilidad \(p(x)\in [0, 1]\) que depende de alguna variable cuantitativa \(x\). los modelos de regresión usados en este estudio pueden ser vistos como casos particulares del Modelo Lineal Generalizado (GLM por sus siglas en inglés). Este modelo extiende al modelo lineal general al lograr que la variable dependiente está relacionada linealmente con sus factores y covariables a través de alguna función de enlace y que la variable dependiente pueda tener una distribución diferente a la normal. Además de los modelos usados en este estudio, el GLM también cubre: modelos loglineales para datos de recuento, modelos log-log complementario para datos de supervivencia censurados por intervalos, y otros modelos estadísticos a través de la propia formulación general del modelo. Como GLM permite especificar distribuciones diferentes a la normal y una función de enlace (entendida como una transformación de la variable dependiente que permite la estimación del modelo) diferente a la identidad se puede trabajar con muchas combinaciones posibles de distribuciones y funciones de enlace, varias de las cuales pueden ser adecuadas para un conjunto de datos en particular, esto implica que la elección de la combinación estará orientada por consideraciones teóricas a priori, por la naturaleza de las variables, la experiencia del investigador y los resultados al comparar combinaciones.
En el caso por tratar, se trabajará con base en una distribución binomial (adecuada para variables que representan una respuesta binaria) con función de enlace logit:\[\pi(x)=\dfrac{e^{\beta_0+\beta_1 x}}{1+ e^{\beta_0 +\beta_1 x}}= \dfrac{1}{1+ e^{-(\beta_0+\beta_1 x)}}\hspace{10mm}(30)\](del inglés logarithmic unit: unidad logarítmica (natural)); que además es apropiada únicamente para la distribución binomial), por lo cual un nombre más adecuado para la regresión podría ser regresión logística binaria. Cabe anotar que el término logístico hace referencia a que la función de enlace constituye, en cierto sentido, un refinamiento del modelo exponencial de crecimiento, descrito por la función sigmoidea, de una magnitud asociada con un conjunto \(C\). Para facilitar las interpretaciones se entiende que la función de enlace \(\pi(x)\) proviene de una razón de probabilidades (conocida en idioma inglés como ODDS ratio (OR)), que a su vez es el argumento de un logaritmo: \(\log\left(\frac{\pi(x)}{1-\pi(x)}\right)\), así, se modela la probabilidad de que la variable de respuesta pertenezca al nivel de referencia \(1\) en función del valor de los predictores. Complementariamente, la transformación de probabilidades a razones de probabilidad es conserva la monotonicidad de sentidos. Además, la transformación convierte el intervalo de probabilidad \([0,1]\) a \((-\infty,\infty)\). Las propiedades que se dan entre las probabilidades complementarias de éxito y fracaso, sus razones y la función de enlace logit son:
| \(p(éxito)=p(fracaso)\) | \(OR=1\) | \(Logit\left(OR\right)=0\) |
| \(p(éxito)<p(fracaso)\) | \(OR<1\) | \(Logit\left(OR\right)<0\) |
| \(p(éxito)>p(fracaso)\) | \(OR>1\) | \(Logit\left(OR\right)>0\) |
Se entiende que la transformación \(Logit\) carece de sentido para la certeza del éxito o del fracaso.
Planteamiento del problema Con base en el conjunto de datos descrito en la sección CAMBIAR se formulará un modelo de regresión logística simple para estudiar la relación logística supuesta entre las varaibles definidas por los campos: municipio (variable independiente) y *área_total_sembrada** (variable dependiente), con base en una distribución binomial y la función de enlace \(Logit\). Desarrollo del análisis El estudio de regresión logistica simple ha sido procesado con R version 4.5.1 (2025-06-13 ucrt) mediado por RStudio 2022.07.2 Build 576 en una plataforma x86_64-w64-mingw32. Resumen estadístico de las variables de estudio La navegación a través de las pestañas muestra el resumen estadístico de la variable independiente municipio, incluyendo su boxplot e histograma. Para la variable dependiente área_total_sembrada, se presentará su diagrama de barras, así como los valores de su media y mediana. Además, se mostrará un diagrama de cajas conjunto que ilustra la relación entre ambas variables.
A partir de los análisis realizados en este trabajo, se puede concluir que la base de datos agropecuaria estudiada presenta una alta variabilidad inherente a los sistemas productivos reales, lo cual se refleja tanto en las estadísticas descriptivas como en los resultados de los modelos ajustados. El análisis exploratorio permitió identificar dispersiones amplias, asimetrías y relaciones débiles entre las variables cuantitativas, características comunes en estudios del sector agropecuario debido a la influencia simultánea de múltiples factores técnicos, económicos y contextuales.
El ajuste del modelo de regresión lineal simple evidenció que la variable explicativa seleccionada no presenta una relación lineal estadísticamente significativa con la variable respuesta. Esto se confirmó a través de coeficientes de regresión cercanos a cero, valores elevados de p-valor y un coeficiente de determinación muy bajo, lo que indica una capacidad explicativa prácticamente nula. En consecuencia, el modelo lineal simple resulta limitado para describir el comportamiento de la variable dependiente cuando se considera únicamente un predictor de manera aislada.
El análisis de varianza (ANOVA) del modelo corroboró estos resultados, mostrando que el modelo no es globalmente significativo. Asimismo, los intervalos de confianza de los coeficientes incluyeron el valor cero, reforzando la ausencia de evidencia estadística suficiente para afirmar la existencia de una relación lineal relevante. Los intervalos de predicción obtenidos fueron considerablemente amplios, lo que pone de manifiesto una alta dispersión de los datos individuales y una elevada incertidumbre en la predicción puntual, fenómeno consistente con la heterogeneidad propia de los sistemas agropecuarios.
La extensión del análisis hacia un modelo de regresión lineal múltiple permitió incorporar simultáneamente varias variables cuantitativas y cualitativas presentes en la base de datos, tales como características productivas y sociodemográficas. Aunque este enfoque mejora levemente la capacidad explicativa frente al modelo simple, los resultados muestran que una proporción significativa de la variabilidad de la variable respuesta permanece sin explicación. Esto sugiere la influencia de factores no observados o no incluidos en la base de datos, como condiciones climáticas específicas, prácticas de manejo, calidad del suelo, acceso a tecnología o variaciones temporales, los cuales suelen ser determinantes en el desempeño agropecuario.
Por su parte, la aplicación de modelos de regresión logística permitió analizar el comportamiento probabilístico de la variable respuesta frente a un umbral definido, ofreciendo una perspectiva complementaria al análisis lineal. Este enfoque resultó útil para interpretar los resultados en términos de probabilidades; sin embargo, los modelos también reflejaron niveles de incertidumbre relevantes, coherentes con la variabilidad observada en los datos y con la complejidad del fenómeno productivo analizado.
Desde el punto de vista metodológico, el uso de R, RStudio y RMarkdown fue fundamental para la correcta gestión, análisis y documentación reproducible de los datos. Estas herramientas facilitaron la limpieza de la base de datos, la implementación de modelos estadísticos, la visualización de resultados y la integración del análisis en un informe técnico estructurado, fortaleciendo competencias clave en gestión de datos aplicadas a la Ingeniería Industrial.
Finalmente, este trabajo fue desarrollado en la Universidad del Valle, seccional Zarzal, en el marco del curso Gestión de Datos para Ingeniería Industrial, correspondiente al periodo académico 2025-2. El estudio se entiende como un ejercicio académico aplicado, basado exclusivamente en la información contenida en la base de datos suministrada, sin pretensión de generalización. No obstante, la metodología empleada y los resultados obtenidos constituyen una base sólida para futuros estudios que incorporen un mayor número de variables y enfoques analíticos más robustos, orientados a una mejor comprensión y optimización de los sistemas agropecuarios.