Introducción

Contexto de la base de datos

Las Evaluaciones Agropecuarias Municipales (EVA) constituyen una de las fuentes de información más importantes para el sector agrícola colombiano. Esta base de datos, administrada por el Ministerio de Agricultura y Desarrollo Rural de Colombia, recopila información detallada sobre la producción agrícola a nivel municipal.

Características principales:

  • Fuente: Evaluaciones Agropecuarias Municipales (EVA)
  • Institución: Ministerio de Agricultura y Desarrollo Rural de Colombia
  • Período: 2006 - 2018 (según datos disponibles)
  • Cobertura geográfica: Departamentos y municipios de Colombia
  • Unidad de observación: Registro por cultivo, municipio y período
  • Objetivo: Caracterizar la producción agrícola municipal mediante indicadores de área sembrada, área cosechada, producción y rendimiento

Variables de interés:

Las variables analizadas se dividen en dos grandes grupos:

  1. Variables de identificación geográfica y cultivo: Departamento, municipio, grupo de cultivo, subgrupo, cultivo específico
  2. Variables productivas: Área sembrada (ha), área cosechada (ha), producción (toneladas) y rendimiento (t/ha)

Diccionario de variables

A continuación se presenta la clasificación detallada de las variables según su naturaleza estadística:

Variables Cualitativas (Nominales)

Variable Descripción Categorías / Niveles Uso en el análisis
DEPARTAMENTO Nombre del departamento donde se realizó la siembra 33 departamentos de Colombia Agrupación geográfica, comparación regional
MUNICIPIO Nombre del municipio donde se realizó la siembra 1,122 municipios aprox. Desagregación geográfica detallada
GRUPO Clasificación amplia del tipo de cultivo Transitorios, Permanentes, Forestales Comparación entre grandes categorías agrícolas
SUBGRUPO Clasificación intermedia del cultivo Cereales, Frutales, Hortalizas, etc. Agrupación más específica de cultivos
CULTIVO Nombre específico del cultivo Más de 100 cultivos (arroz, maíz, café, etc.) Análisis por cultivo específico
CICLO Clasificación por ciclo productivo Semestral, Anual, Perenne Comparación de ciclos productivos
ESTADO Estado del cultivo en el período Sembrado, Cosechado, En desarrollo Control de calidad de registros
SEMESTRE Período del año A (primer semestre), B (segundo semestre) Comparación estacional

Variables Cuantitativas

Variable Tipo Descripción Unidad Rango / Observaciones
AÑO_PERIODO Discreta Año en que se reportó la información Años calendario 2006 - 2018
ASEMBRADA Continua Área sembrada en hectáreas Hectáreas (ha) Valores positivos, pueden incluir valores atípicos de grandes productores
ACOSECHADA Continua Área cosechada en hectáreas Hectáreas (ha) Generalmente ≤ área sembrada (pérdidas potenciales)
PRODUCCION Continua Cantidad total producida Toneladas (t) Presenta valores faltantes en algunos registros
RENDIMIENTO Continua Relación producción / área cosechada Toneladas por hectárea (t/ha) Variable derivada: PRODUCCION / ACOSECHADA

Nota importante: La variable RENDIMIENTO fue calculada como PRODUCCION / ACOSECHADA durante el proceso de limpieza y preparación de datos, para facilitar el análisis de productividad.

Clasificación por tipo de variable

Tabla 1: Clasificación completa de variables por tipo
Tipo de Variable Nombre Descripción
Cualitativas Nominales DEPARTAMENTO Ubicación geográfica (departamento)
Cualitativas Nominales MUNICIPIO Ubicación geográfica (municipio)
Cualitativas Nominales GRUPO Categoría amplia de cultivo
Cualitativas Nominales SUBGRUPO Subcategoría de cultivo
Cualitativas Nominales CULTIVO Cultivo específico
Cualitativas Nominales CICLO Ciclo productivo del cultivo
Cualitativas Nominales ESTADO Estado del cultivo en el período
Cualitativas Nominales SEMESTRE Semestre del año
Cuantitativas Discretas AÑO_PERIODO Año de reporte
Cuantitativas Continuas ASEMBRADA Área sembrada en hectáreas
Cuantitativas Continuas ACOSECHADA Área cosechada en hectáreas
Cuantitativas Continuas PRODUCCION Producción total en toneladas
Cuantitativas Continuas RENDIMIENTO Rendimiento en t/ha (producción/área cosechada)

1. Configuración inicial y carga de datos

Estructura de los datos

## 'data.frame':    206068 obs. of  18 variables:
##  $ CODEP        : int  15 25 25 54 54 68 25 25 54 68 ...
##  $ DEPARTAMENTO : Factor w/ 32 levels "AMAZONAS","ANTIOQUIA",..: 6 14 14 22 22 27 14 14 22 27 ...
##  $ CODMUN       : chr  "15.114,00" "25.754,00" "25.214,00" "54.405,00" ...
##  $ MUNICIPIO    : Factor w/ 1019 levels "","ABEJORRAL",..: 116 851 232 477 603 421 851 232 603 421 ...
##  $ GRUPO        : Factor w/ 13 levels "CEREALES","FIBRAS",..: 7 7 7 7 7 7 7 7 7 7 ...
##  $ SUBGRUPO     : Factor w/ 120 levels "ACELGA","ACHIRA",..: 1 1 1 1 1 1 1 1 1 1 ...
##  $ CULTIVO      : Factor w/ 223 levels "ACELGA","ACHICORIA",..: 1 1 1 1 1 1 1 1 1 1 ...
##  $ DREGIONALSIST: Factor w/ 271 levels "ACELGA","ACHICORIA",..: 1 1 1 1 1 1 1 1 1 1 ...
##  $ A            : num  NA NA NA NA NA NA NA NA NA NA ...
##  $ ASEMBRADA    : num  2 82 2 3 1 1 72 2 1 1 ...
##  $ ACOSECHADA   : num  1 80 2 3 1 1 70 2 1 1 ...
##  $ PRODUCCION   : num  1 NA 26 48 5 6 NA 34 5 6 ...
##  $ RENDIMIENTO  : num  1 NA 13 16 5 6 NA 17 5 6 ...
##  $ ESTADO       : Factor w/ 23 levels "ACEITE CRUDO",..: 8 8 8 8 8 8 8 8 8 8 ...
##  $ NOMBREC      : Factor w/ 215 levels "","ACHRAS ZAPOTA",..: 29 29 29 29 29 29 29 29 29 29 ...
##  $ CICLO        : Factor w/ 3 levels "ANUAL","PERMANENTE",..: 3 3 3 3 3 3 3 3 3 3 ...
##  $ AÑO_PERIODO  : num  2006 2006 2006 2006 2006 ...
##  $ SEMESTRE     : Factor w/ 3 levels "","A","B": 3 3 3 3 3 3 2 2 2 2 ...

1. Medidas de tendencia central

##      CODEP                DEPARTAMENTO       CODMUN         
##  Min.   : 5.00   BOYACA         : 20576   Length:206068     
##  1st Qu.:17.00   ANTIOQUIA      : 18759   Class :character  
##  Median :41.00   CUNDINAMARCA   : 17805   Mode  :character  
##  Mean   :40.32   HUILA          : 15926                     
##  3rd Qu.:68.00   VALLE DEL CAUCA: 15774                     
##  Max.   :99.00   SANTANDER      : 14672                     
##                  (Other)        :102556                     
##       MUNICIPIO                        GRUPO          SUBGRUPO     
##  BOLIVAR   :  1012   FRUTALES             :50236   MAIZ   : 24965  
##  LA UNION  :   916   CEREALES             :36045   FRIJOL : 14693  
##  SAN PEDRO :   915   HORTALIZAS           :32032   TOMATE :  9654  
##  BUENAVISTA:   859   TUBERCULOS Y PLATANOS:30664   YUCA   :  9488  
##  GUADALUPE :   727   LEGUMINOSAS          :26368   PLATANO:  9048  
##  VILLANUEVA:   721   OTROS PERMANENTES    :21813   CAÑA   :  8090  
##  (Other)   :200918   (Other)              : 8910   (Other):130130  
##     CULTIVO                DREGIONALSIST          A            ASEMBRADA    
##  MAIZ   : 24965   MAIZ TRADICIONAL: 20069   Min.   : NA      Min.   :  0.0  
##  FRIJOL : 14693   FRIJOL          : 10776   1st Qu.: NA      1st Qu.:  9.0  
##  TOMATE :  9654   YUCA            :  9284   Median : NA      Median : 30.0  
##  YUCA   :  9488   PLATANO         :  8876   Mean   :NaN      Mean   :108.1  
##  PLATANO:  9048   TOMATE          :  7598   3rd Qu.: NA      3rd Qu.:114.0  
##  PAPA   :  7483   CAFE            :  7263   Max.   : NA      Max.   :999.0  
##  (Other):130737   (Other)         :142202   NA's   :206068   NA's   :12552  
##    ACOSECHADA       PRODUCCION     RENDIMIENTO    
##  Min.   :  0.00   Min.   :  0     Min.   : 0.000  
##  1st Qu.:  7.00   1st Qu.: 22     1st Qu.: 1.400  
##  Median : 25.00   Median : 80     Median : 4.045  
##  Mean   : 98.69   Mean   :182     Mean   :   Inf  
##  3rd Qu.:100.00   3rd Qu.:252     3rd Qu.:10.000  
##  Max.   :999.00   Max.   :999     Max.   :   Inf  
##  NA's   :10888    NA's   :40318   NA's   :44510   
##                     ESTADO                        NOMBREC      
##  FRUTO FRESCO          :59682   ZEA MAYS              : 25199  
##  GRANO SECO            :57290   PHASEOLUS VULGARIS    : 14693  
##  HORTALIZA FRESCA      :31742   LYCOPERSICUM ESCULETUM:  9654  
##  TUBERCULO FRESCO      :21755   MANIHOT ESCULENTA     :  9488  
##  PADDY VERDE           : 7416   MUSA X PARADISIACA    :  9007  
##  CAFE VERDE EQUIVALENTE: 7263   SACCHARUM OFFICINARUM :  8090  
##  (Other)               :20920   (Other)               :129937  
##          CICLO         AÑO_PERIODO   SEMESTRE 
##  ANUAL      : 14482   Min.   :2006    :97125  
##  PERMANENTE : 82643   1st Qu.:2009   A:58003  
##  TRANSITORIO:108943   Median :2013   B:50940  
##                       Mean   :2012            
##                       3rd Qu.:2015            
##                       Max.   :2018            
## 

2. Medidas de dispersión

Tabla 2: Medidas de dispersión para variables cuantitativas
Variable Varianza Desviación Estándar Coeficiente de Variación (%) Rango Rango Intercuartil
ASEMBRADA ASEMBRADA 32182.40 179.39 165.99 999 105.0
ACOSECHADA ACOSECHADA 29876.87 172.85 175.15 999 93.0
PRODUCCION PRODUCCION 51936.41 227.90 125.24 999 230.0
RENDIMIENTO RENDIMIENTO 136.79 11.70 155.18 289 8.6
Tabla 3: Clasificación de la dispersión según coeficiente de variación
Variable Coeficiente de Variación (%) Nivel de Dispersión
ASEMBRADA ASEMBRADA 165.99 Alta dispersión
ACOSECHADA ACOSECHADA 175.15 Alta dispersión
PRODUCCION PRODUCCION 125.24 Alta dispersión

3. Medidas de posición

##         ASEMBRADA ACOSECHADA PRODUCCION
## Mínimo          0          0          0
## Q1              9          7         22
## Mediana        30         25         80
## Q3            114        100        252
## Máximo        999        999        999
##    ASEMBRADA ACOSECHADA PRODUCCION
## D1         3          3          6
## D2         7          5         16
## D3        11         10         30
## D4        20         15         50
## D5        30         25         80
## D6        50         41        126
## D7        85         74        200
## D8       153        138        322
## D9       338        300        540
##     ASEMBRADA ACOSECHADA PRODUCCION
## P1          1          0          0
## P5          2          1          3
## P10         3          3          6
## P25         9          7         22
## P50        30         25         80
## P75       114        100        252
## P90       338        300        540
## P95       528        500        720
## P99       850        850        924

3. Valores atípicos (Outliers)

## ### Valores atípicos por variable
## **Área sembrada**
## 
## - **Rango normal:** 9 - 114 ha
## - **Límite inferior:** -148.5 ha
## - **Límite superior:** 271.5 ha
## 
## - No hay outliers bajos
## 
## - **Outliers altos:** 24376 registros (12.6%)
##   * **Rango:** 272 - 999 ha
##   * **Valores más frecuentes (top 20):**
##     - 300 ha: 1247 veces
##     - 400 ha: 946 veces
##     - 500 ha: 783 veces
##     - 350 ha: 718 veces
##     - 600 ha: 573 veces
##     - 450 ha: 540 veces
##     - 700 ha: 426 veces
##     - 800 ha: 425 veces
##     - 320 ha: 378 veces
##     - 280 ha: 345 veces
##     - 550 ha: 323 veces
##     - 900 ha: 279 veces
##     - 380 ha: 270 veces
##     - 420 ha: 261 veces
##     - 650 ha: 213 veces
##     - 750 ha: 211 veces
##     - 850 ha: 205 veces
##     - 290 ha: 201 veces
##     - 360 ha: 197 veces
##     - 310 ha: 195 veces
##     - ... y 708 valores más
## 
## **Área cosechada**
## 
## - **Rango normal:** 7 - 100 ha
## - **Límite inferior:** -132.5 ha
## - **Límite superior:** 239.5 ha
## 
## - No hay outliers bajos
## 
## - **Outliers altos:** 25130 registros (12.88%)
##   * **Rango:** 240 - 999 ha
##   * **Valores más frecuentes (top 20):**
##     - 300 ha: 1125 veces
##     - 250 ha: 911 veces
##     - 400 ha: 797 veces
##     - 500 ha: 661 veces
##     - 350 ha: 611 veces
##     - 450 ha: 488 veces
##     - 600 ha: 488 veces
##     - 800 ha: 393 veces
##     - 280 ha: 379 veces
##     - 320 ha: 370 veces
##     - 700 ha: 363 veces
##     - 240 ha: 329 veces
##     - 380 ha: 298 veces
##     - 260 ha: 256 veces
##     - 270 ha: 256 veces
##     - 550 ha: 242 veces
##     - 900 ha: 242 veces
##     - 420 ha: 240 veces
##     - 290 ha: 227 veces
##     - 650 ha: 194 veces
##     - ... y 740 valores más
## 
## **Producción**
## 
## - **Rango normal:** 22 - 252 t
## - **Límite inferior:** -323 t
## - **Límite superior:** 597 t
## 
## - No hay outliers bajos
## 
## - **Outliers altos:** 14118 registros (8.52%)
##   * **Rango:** 598 - 999 t
##   * **Valores más frecuentes (top 20):**
##     - 600 t: 1107 veces
##     - 800 t: 601 veces
##     - 900 t: 567 veces
##     - 750 t: 477 veces
##     - 720 t: 471 veces
##     - 700 t: 467 veces
##     - 630 t: 317 veces
##     - 840 t: 311 veces
##     - 960 t: 276 veces
##     - 640 t: 238 veces
##     - 650 t: 213 veces
##     - 660 t: 193 veces
##     - 675 t: 189 veces
##     - 780 t: 186 veces
##     - 680 t: 144 veces
##     - 810 t: 134 veces
##     - 880 t: 130 veces
##     - 875 t: 121 veces
##     - 690 t: 117 veces
##     - 990 t: 116 veces
##     - ... y 382 valores más

4. Gráficos

4.1 Histograma básico de rendimiento

4.2 Múltiples histogramas

4.3 Histograma con curva de densidad

4.4 Histograma con percentiles destacados

4.5 Histograma sin outliers extremos

Análisis Crítico de Datos - Santander

PREGUNTA 1: SOBRE EL RENDIMIENTO POR GRUPO DE CULTIVO

¿Por qué los cultivos permanentes muestran mayor rendimiento que los transitorios?

Estadísticos de rendimiento por grupo de cultivo
GRUPO_CORTO n_registros rendimiento_promedio rendimiento_mediana cv
Hortalizas 1933 15.54 15.00 63.53
Flores 10 11.40 15.00 51.35
Frutales 2458 11.00 9.58 68.16
TUBERCULOS Y PLATANOS 1323 10.63 10.00 53.89
Oleaginosas 24 3.04 3.20 21.23
Leguminosas 2154 2.80 1.33 145.51
PLANTAS AROMATICAS, CONDIMENTARIAS Y MEDICINALES 24 2.64 1.00 160.21
Cereales 1997 2.07 1.80 89.37
OTROS PERMANENTES 1415 2.02 0.86 144.07
OTROS TRANSITORIOS 226 1.66 1.60 24.70
Fibras 100 1.24 1.00 49.88
Forestales 112 1.10 1.00 37.71

¿Qué nos dicen los cultivos tradicionales? El segundo gráfico muestra que las frutas tienen el mayor rendimiento entre los cultivos tradicionales, seguidas por hortalizas y tubérculos. Los cereales presentan el rendimiento más bajo, lo que refleja su menor productividad por hectárea.

¿Qué potencial tienen los cultivos especializados? El tercer gráfico revela que cultivos como flores y oleaginosas tienen rendimientos considerablemente altos, aunque con menos registros. Esto sugiere una oportunidad para diversificar la producción agrícola de Santander hacia cultivos de mayor valor agregado.


PREGUNTA 2: SOBRE EFICIENCIA PRODUCTIVA

¿Por qué hay tanta diferencia entre área sembrada y cosechada?

¿Por qué el histograma tiene un pico cerca del 100% pero también muchos valores bajos? El pico en eficiencias altas (90-100%) corresponde a cultivos bien gestionados donde casi toda el área sembrada se cosecha. Sin embargo, la larga cola hacia la izquierda (eficiencias bajas) revela problemas recurrentes: pérdidas por condiciones climáticas adversas, plagas, o errores en el registro.

¿Qué nos dice la forma de la distribución sobre la calidad de los datos? La presencia de un pico en 0% sugiere que hay muchos registros donde se sembró pero nunca se cosechó. ¿Son pérdidas reales o simplemente no se actualizó el registro?


PREGUNTA 3: SOBRE ESTABILIDAD EN EL TIEMPO

¿Por qué el rendimiento fluctúa tanto entre años?

¿Por qué el rendimiento cayó drásticamente en 2015? La caída pronunciada en 2015. Este año coincidió con el fenómeno de El Niño más fuerte registrado en Colombia en décadas. Las intensas sequías afectaron especialmente a cultivos de secano (que dependen de la lluvia), reduciendo drásticamente los rendimientos.

¿Por qué la línea de la mediana es más estable que el promedio? La mediana (línea roja) es menos sensible a valores extremos. Cuando hay años con pérdidas catastróficas (como 2015), el promedio se desplaza hacia abajo mientras la mediana se mantiene más estable. Esto sugiere que las caídas no son generalizadas, sino concentradas en ciertos cultivos o regiones.

¿Por qué hay años con pocos registros? El gráfico de registros por año muestra variaciones importantes. ¿Esto se debe a que realmente hubo menos actividad agrícola o a problemas en la recolección de datos? Los años con menos registros pueden estar subrepresentando la realidad.


PREGUNTA 4: SOBRE CONCENTRACIÓN DE PRODUCCIÓN

¿Por qué tan pocos cultivos dominan la producción total?

¿Por qué la producción está tan concentrada en pocos cultivos? En el primer gráfico: el café, la caña panelera y el plátano dominan la producción. Esto refleja la estructura agrícola tradicional de Santander, donde estos cultivos tienen gran extensión territorial y tradición productiva.

¿Por qué la curva de concentración tiene forma de “L” invertida? La curva muestra que los primeros 3 cultivos concentran más del 50% de la producción, y los primeros 10 superan el 80%. Esto es un patrón de “cola larga”: pocos cultivos dominan, mientras que muchos cultivos tienen participaciones marginales.

¿Qué implica esta concentración para la vulnerabilidad del sector? Si la producción depende de tan pocos cultivos, ¿qué pasa si el precio del café cae o una plaga afecta la caña panelera? Esta concentración representa un riesgo económico importante para la región.


PREGUNTA 5: SOBRE VARIABILIDAD GEOGRÁFICA

¿Por qué algunos municipios tienen rendimientos tan dispares?

¿Por qué municipios cercanos tienen rendimientos tan diferentes? En el caso de la variabilidad: municipios como Floridablanca pueden tener rendimientos muy superiores a otros. La topografía de Santander es extremadamente variable: municipios en zonas altas de la cordillera tienen climas fríos ideales para café, mientras que los del valle del Magdalena tienen climas cálidos aptos para cultivos diferentes.

¿Qué factores explican que un municipio tenga el mejor rendimiento? El municipio con mayor rendimiento probablemente se especializa en cultivos de alto valor como café de altura o caña panelera. ¿Será que tiene mejores suelos, más tecnología o tradición agrícola?

¿Por qué hay municipios con pocos registros? Los municipios con menos de 20 registros fueron excluidos del gráfico. ¿Esto significa que tienen poca actividad agrícola o que los datos no se reportan adecuadamente?


PREGUNTA 6: SOBRE CICLOS PRODUCTIVOS

¿Por qué los cultivos semestrales y perennes tienen distribuciones tan diferentes?

¿Por qué los cultivos semestrales tienen un pico tan marcado en bajos rendimientos? La curva azul (semestrales): tiene un pico pronunciado cerca de 0-10 t/ha. Los cultivos semestrales como maíz y arroz tienen ciclo corto y son muy vulnerables. Cuando fallan por sequía o plagas, fallan completamente, generando ese grupo de rendimientos muy bajos.

¿Por qué los cultivos perennes tienen una cola larga hacia la derecha? La curva verde (perennes) muestra una cola larga hacia la derecha. Esto indica que algunos cultivos perennes (caña panelera) alcanzan rendimientos muy altos, mientras que otros (café) se mantienen en rangos moderados. La dispersión refleja la diversidad dentro del grupo.

¿Por qué los cultivos anuales están en medio? La curva roja (anuales) tiene una posición intermedia. Cultivos como yuca o plátano tienen mayor resiliencia que los semestrales pero no alcanzan los rendimientos máximos de los perennes.


PREGUNTA 7: SOBRE CONSISTENCIA DE DATOS

¿Por qué hay registros donde el área cosechada es mayor que la sembrada?

¿Por qué hay registros con área cosechada mayor que sembrada? El gráfico de dispersión muestra puntos con pérdida negativa (por encima de la línea azul). Esto es físicamente imposible y representa errores de digitación. ¿Será que se intercambiaron las columnas al reportar?

¿Por qué las pérdidas mayores al 50% son tan comunes? El gráfico de barras muestra años con muchas pérdidas severas. ¿Esto se debe a eventos climáticos reales o a problemas en cómo se reportan los datos? Las líneas horizontales en el gráfico de dispersión (en 0%, 20%, 50%) sugieren que algunos reportes usan porcentajes estimados en lugar de cálculos exactos.

¿Por qué hay un pico de inconsistencias en ciertos años? 2015 muestra muchas pérdidas severas. Esto coincide con el fénomeno El Niño. Pero también hay años con muchas inconsistencias de “cosecha mayor a siembra” que probablemente son errores de registro, no eventos reales.


PREGUNTA 8: SOBRE SEMESTRALIDAD

¿Hay diferencias significativas entre el primer y segundo semestre?

¿Por qué hay diferencias entre semestres? El primer gráfico muestra que la mediana del segundo semestre (B) es ligeramente mayor. La estacionalidad climática en Santander marca dos temporadas: la primera mitad del año es más seca, la segunda tiene mayores precipitaciones. Esto afecta directamente el rendimiento de cultivos de secano.

¿Por qué algunos cultivos se comportan mejor en un semestre que en otro? El segundo gráfico muestra que el maíz rinde mejor en el primer semestre (aprovechando las lluvias de marzo-mayo), mientras que el café tiene sus cosechas principales en el segundo semestre. Cada cultivo se adapta al calendario de lluvias.

¿Qué implica esta estacionalidad para la seguridad alimentaria? Si las cosechas se concentran en un semestre, ¿qué pasa con el abastecimiento durante el resto del año? La estacionalidad puede generar excedentes seguidos de escasez.


PREGUNTA 9: SOBRE RENDIMIENTO POR SUBGRUPO

¿Qué subgrupos de cultivo tienen mejor desempeño?

¿Por qué las frutas tienen mayor rendimiento que los cereales? “Frutales” está en la parte superior del gráfico. Las frutas como plátano, piña y naranja generan mayor biomasa por unidad de área que los cereales. Además, muchos frutales son cultivos perennes que producen durante todo el año.

¿Por qué las hortalizas tienen rendimiento intermedio pero alta variabilidad? Las hortalizas incluyen desde cultivos de hoja (lechuga) con ciclos muy cortos hasta cultivos de fruto (tomate) con ciclos más largos. Esta diversidad dentro del subgrupo genera una distribución amplia.

¿Qué subgrupo tiene mayor potencial de crecimiento? Los subgrupos con menor rendimiento (como “Cereales” y “Tubérculos”) podrían beneficiarse de mejoras tecnológicas. ¿Será que están cultivados en zonas marginales o con baja inversión?


PREGUNTA 10: SOBRE TENDENCIAS DE ÁREA

¿Cómo ha evolucionado el área sembrada a lo largo del tiempo?

¿Por qué el área total fluctuó tanto? El primer gráfico muestra variaciones importantes. Las caídas en años específicos coinciden con períodos de sequía severa (El Niño) que desincentivaron la siembra. También pueden reflejar cambios en los precios internacionales del café.

¿Por qué el área promedio por registro ha aumentado? El segundo gráfico muestra una tendencia ascendente. Esto sugiere una concentración de la producción: los pequeños productores podrían estar abandonando la actividad, mientras que los medianos y grandes expanden su área.

¿Qué implicaciones tiene esta tendencia? La desaparición de pequeños productores puede afectar la equidad rural y la diversidad productiva. ¿Estamos perdiendo variedad de cultivos por esta concentración?


PREGUNTA 11: SOBRE RENDIMIENTO POR ESTADO

¿El estado del cultivo afecta el rendimiento reportado?

¿Por qué los cultivos “En desarrollo” tienen rendimiento reportado? El primer gráfico muestra que los cultivos “En desarrollo” tienen rendimiento, lo cual es un error conceptual. ¿Será que se reportó antes de la cosecha? ¿Son estimaciones o errores de digitación?

¿Por qué la proporción de estados cambia con el tiempo? El segundo gráfico muestra que la categoría “Cosechado” ha aumentado su participación desde 2015. Esto podría reflejar mejoras en los sistemas de registro, no necesariamente cambios en la actividad agrícola.

¿Qué implicaciones tiene esto para el análisis? Incluir cultivos “En desarrollo” o “Sembrado” en el análisis de rendimiento puede sesgar los resultados. ¿Deberíamos filtrar estos casos para obtener estimaciones más precisas?


PREGUNTA 12: SOBRE CORRELACIONES SORPRENDENTES

¿Existen relaciones inesperadas entre variables?

¿Por qué la relación área-producción no es perfectamente lineal? El primer gráfico muestra una nube de puntos con dispersión alrededor de la línea roja. Si toda el área sembrada se cosechara con el mismo rendimiento, la relación sería perfecta. La dispersión indica que hay variaciones en rendimiento entre diferentes predios y cultivos.

¿Por qué la relación rendimiento-producción es más débil? El segundo gráfico tiene una pendiente menos pronunciada y más dispersión. Esto se debe a que la producción total depende del área, no solo del rendimiento. Un cultivo con alto rendimiento pero poca área puede tener menor producción total que uno con rendimiento moderado pero gran extensión.

¿Qué nos dicen los puntos extremos? Los puntos en la esquina superior derecha representan cultivos con alta producción. ¿Son grandes productores o errores de registro? Identificar estos casos puede ayudar a mejorar la calidad de los datos.


PREGUNTA 13: SOBRE COMPARACIÓN CON OTRAS REGIONES

¿Cómo se compara Santander con el resto del país?

¿Por qué Santander está por encima o debajo del promedio nacional? Dónde se ubica la barra de Santander en relación con la línea azul. Si está por encima, indica productividad superior, posiblemente por la tradición cafetera y diversidad de pisos térmicos. Si está por debajo, sugiere oportunidades de mejora.

¿Qué departamentos tienen mejor desempeño? Los departamentos en la parte superior del gráfico tienen los mayores rendimientos. ¿Qué factores comunes tienen? Pueden ser climas favorables, tecnificación o cultivos de alto valor.

¿Qué explica la variabilidad entre departamentos? La combinación de factores climáticos (altitud, precipitación), tipos de cultivo predominantes, infraestructura y políticas departamentales explica por qué algunos departamentos superan ampliamente a otros.


PREGUNTA 14: SOBRE ESTACIONALIDAD POR CULTIVO

¿Qué cultivos son más estacionales?

¿Qué implica la estacionalidad para la planificación agrícola? Los productores pueden optimizar sus siembras concentrándose en el semestre donde cada cultivo alcanza su máximo potencial. Esto puede mejorar significativamente la productividad.

¿Cómo afecta la estacionalidad a la seguridad alimentaria? La concentración de cosechas en un semestre puede generar excedentes seguidos de escasez. Diversificar cultivos con diferentes ventanas productivas ayuda a estabilizar la oferta durante todo el año.

CONCLUSIONES:

El análisis exhaustivo de las Evaluaciones Agropecuarias Municipales (EVA) entre 2006 y 2018 demuestra que, si bien la base de datos constituye una fuente de información robusta y de gran cobertura para el sector agrícola colombiano, presenta limitaciones críticas en la calidad del registro que deben ser abordadas antes de cualquier inferencia estadística, tales como inconsistencias físicas (área cosechada mayor que la sembrada), rendimientos asignados a cultivos no cosechados y patrones de redondeo que sugieren estimaciones en lugar de mediciones reales. A nivel nacional, las variables productivas revelan una heterogeneidad extrema con coeficientes de variación superiores al 125%, lo que evidencia profundas desigualdades entre cultivos, regiones y tipos de productor.

En el caso particular de Santander, se identificó una alta concentración productiva en solo tres cultivos (café, caña panelera y plátano), lo que representa una vulnerabilidad económica significativa ante fenómenos climáticos o fluctuaciones del mercado, como quedó demostrado con la drástica caída del rendimiento durante el fenómeno de El Niño en 2015. No obstante, el estudio también revela oportunidades claras para la diversificación hacia cultivos de alto rendimiento como flores y oleaginosas, así como la necesidad imperante de implementar controles de validación en la captura de datos y filtrar los registros por estado “Cosechado” para obtener estimaciones precisas. En conclusión, la base EVA es un instrumento valioso pero perfectible, cuyo verdadero potencial transformador depende de mejoras en la calidad del dato y de políticas agrícolas que fomenten la resiliencia climática y la diversificación productiva.