Emisiones de gases de efecto invernadero en Colombia

Colombia enfrenta uno de los desafíos ambientales más grandes de su historia. Aunque el país solo representa 0,6% de las emisiones globales de gases de efecto invernadero, ocupa uno de los primeros lugares en tasa de deforestación en América Latina y es considerado por el Banco Mundial como uno de los países más vulnerables al cambio climático. En otras palabras: Colombia contamina poco comparado con los gigantes globales, pero sufre desproporcionadamente sus consecuencias.

Mientras potencias como China, Estados Unidos, India y la Unión Europea emiten millones de toneladas de CO₂ por la industria pesada y el transporte, Colombia tiene un perfil distinto: Más del 55% de sus emisiones provienen del sector AFOLU, es decir, de la agricultura, la ganadería y el uso del suelo (IDEAM, 2021).Esto hace que la forma en que Colombia produce alimentos tenga un impacto decisivo en su huella climática.

¿Qué son los gases de efecto invernadero y por qué importan?

Los gases de efecto invernadero (GEI) incluyen CO₂, metano (CH₄), óxido nitroso (N₂O) y otros. Su función natural es retener parte del calor del sol, permitiendo que el planeta sea habitable. Pero cuando aumentan por actividades humanas, atrapan demasiado calor, generando el calentamiento global.

Datos impactantes…

El 90% de las emisiones ganaderas en Colombia provienen del metano entérico, es decir, de la digestión de los bovinos.

Un solo bovino puede emitir 120 kg de metano al año, equivalentes al CO₂ producido por un automóvil durante varios meses.

Colombia frente al mundo: una paradoja climática

A nivel mundial Colombia NO es un gran emisor, pero sí está:

Esta realidad hace que Colombia sea un país clave para investigar el vínculo entre:

Cantidad de bovinos,y Emisiones totales y ganaderas de GEI.

Porque, a diferencia de los países industrializados, nuestros gases no vienen de fábricas: vienen de las vacas y de los árboles que hemos talado.

La ganadería, por su parte, es el contribuyente dominante, responsable del 62% del total AFOLU debido al metano y al uso extensivo de pasturas.

Colombia tiene 37 millones de hectáreas dedicadas a ganadería, pero solo necesita la mitad para producir de manera eficiente (FAO, 2020).Esto significa que la expansión ganadera está directamente asociada a deforestación, degradación de suelos y mayores emisiones.

Dado que la ganadería y el uso del suelo son los pilares de las emisiones colombianas, este estudio se centra en dos relaciones clave que pueden explicar gran parte del problema climático del país:

1. La relación entre el número de bovinos y las emisiones ganaderas, para entender si el tamaño del inventario bovino está directamente asociado al aumento de metano y otros GEI.

2.La relación entre las emisiones del subsector ganadero y las emisiones pecuarias totales, para determinar si un mayor aporte del subsector ganadero incrementa proporcionalmente las emisiones globales del sector pecuario.

Hipótesis de investigación

Hipótesis 1: Más bovinos → más emisiones ganaderas

Hipótesis nula (H₀): No existe relación entre el número de bovinos y las emisiones ganaderas.

Hipótesis alternativa (H₁): Existe una relación positiva: a mayor número de bovinos, mayores emisiones ganaderas.

Existe una relación lineal positiva entre el número de bovinos (total_bovinos_2017) y las emisiones generadas por el subsector ganadero (emisiones_sub_sector_ganadero).

Justificación: Más animales implican mayor producción de metano y otros GEI derivados de la fermentación entérica. Esta hipótesis permite cuantificar el impacto directo de la ganadería sobre el clima.

Hipótesis 2: Mayor contribución del subsector ganadero → mayores emisiones pecuarias totales

Hipótesis nula (H₀): No existe relación entre las emisiones del subsector ganadero y las emisiones totales del sector pecuario.

Hipótesis alternativa (H₁): Existe una relación positiva: a mayores emisiones del subsector ganadero, mayores serán las emisiones pecuarias totales.

Se espera una relación lineal positiva entre:Emisiones Sub-sector Ganadero (Miles de ton CO₂ eq) y Emisiones Sector Pecuario (Miles de ton CO₂ eq)

Justificación: El subsector ganadero es la principal fuente de GEI dentro del sector pecuario, debido principalmente a la fermentación entérica del ganado y al manejo del estiércol. Si el subsector ganadero incrementa sus emisiones, es lógico que el total del sector pecuario también aumente, dado que este depende estructuralmente del primero.Esta hipótesis permite evaluar el peso real del subsector ganadero dentro de las emisiones pecuarias integrales.

MARCO TEÓRICO: Regresión Lineal Simple (RLS) y Metodología

El modelo de regresión lineal simple (RLS) se usa para analizar cómo una variable independiente X influye sobre una variable dependiente Y

Modelo general:

\[ Y=\beta _{0}+\beta _{1}X + \varepsilon \]

Donde:

Y: Variable dependiente.

X: Variable independiente

\(\beta_0\): Intercepto (valor de Y cuando X = 0)

\(\beta_1\): Pendiente (cambio en Y por cada unidad de cambio en X).

\(\epsilon\): Término de error (variabilidad no explicada por el modelo).

Fórmula simplificada de regresión lineal

Tambien podemos ver la fórmula de regresión lineal de forma simplificada:

\[ \hat{Y}=a + bX\]

Donde:

\(\hat{Y}\):Variable dependiente

X:Variable independiente

\(a\): El intercepto, o constante de la recta de regresión

\(b\): La pendiente, o coeficiente de regresión, que cuantifica el cambio esperado en \(Y\) por cada unidad de cambio en \(X\).Este parámetro es el foco de la prueba de hipótesis.

Siendo equivalente a la notación estándar \(Y = \beta_0 + \beta_1 X + \epsilon\) que mencioné previamente, pero omiten el término de error \(\epsilon\) para simplicidad en la explicación conceptual.

Metodología de Validación (5 Pasos)

El análisis se realiza siguiendo la estructura rigurosa para garantizar la validez, el poder explicativo y la utilidad predictiva de cada modelo:

1. Paso 1: Analizar la asociación (Correlación y Diagrama de Dispersión).

2. Paso 2: Determinar si el modelo es válido (Tabla ANOVA y prueba F).

3. Paso 3:Poder Explicativo: Determinación de la proporción de varianza explicada (\(R^2\))

4.Paso 4: Parámetros: Interpretación de los coeficientes \(a\) y \(b\) (intercepto y pendiente) de la Tabla de Coeficientes.

Paso 5: Construir la Ecuación y Predecir: Formalización del modelo \(\widehat{Y} = a + bX\) para su aplicación en pronósticos.

Base de datos usada

En este Rpubs se usó la base de datos llamada “ANÁLISIS DE LAS EMISIONES DE GASES DE EFECTO INVERNADERO (GEI) PRODUCTO DE LA ACTIVIDAD AGROPECUARIA EN LA REGIÓN CENTRAL”, publicada en el portal oficial de Datos Abiertos del Gobierno de Colombia dentro de la categoría Agricultura y Desarrollo Rural.

La información corresponde a la Región Administrativa y de Planeación Especial (RAP-E Región Central de Colombia), que integra los departamentos de Cundinamarca, Boyacá, Meta, Tolima y el Distrito Capital. El dataset describe las áreas con vocación ganadera bajo distintos arreglos (pastoriles, silvopastoriles y agrosilvopastoriles), junto con las emisiones de GEI por municipio, permitiendo analizar el peso de la actividad pecuaria frente a otros sectores emisores.

La base de datos está disponible públicamente en el portal de datos abiertos:

https://www.datos.gov.co/Agricultura-y-Desarrollo-Rural/ANALISIS-DE-LAS-EMISIONES-DE-GASES-DE-EFECTO-INVER/25nw-b8kq/about_data

library(readr)
library(dplyr)
emisiones <- read_csv("emisiones.csv")
names(emisiones)
##  [1] "Departamentos"                                                                                   
##  [2] "Codigo DANE - Depto"                                                                             
##  [3] "Municipio"                                                                                       
##  [4] "Codigo DANE - Mpio"                                                                              
##  [5] "Agroforestal (Ha)"                                                                               
##  [6] "ConservaciOn de Suelos  (Ha)"                                                                    
##  [7] "Ganadera (Ha)"                                                                                   
##  [8] "Vocacion"                                                                                        
##  [9] "Predios <10 cab"                                                                                 
## [10] "Predios 11 - 25 cab"                                                                             
## [11] "Predios 26-50 cab"                                                                               
## [12] "Predios 51-100 cab"                                                                              
## [13] "Predios 101-250 cab"                                                                             
## [14] "Predios 251-500 cab"                                                                             
## [15] "Predios 501-1000 cab"                                                                            
## [16] "Predios >1000 cab"                                                                               
## [17] "Total predios"                                                                                   
## [18] "% predios 11-50 cab"                                                                             
## [19] "Terneras < 12 Meses"                                                                             
## [20] "Terneros < 12 Meses"                                                                             
## [21] "Hembras 12 - 24 Meses"                                                                           
## [22] "Machos 12 - 24 Meses"                                                                            
## [23] "Hembras 24 - 36 Meses"                                                                           
## [24] "Machos 24 - 36 Meses"                                                                            
## [25] "Hembras > 36 Meses"                                                                              
## [26] "Machos > 36 Meses"                                                                               
## [27] "# Machos"                                                                                        
## [28] "% Machos"                                                                                        
## [29] "# Hembras"                                                                                       
## [30] "% Hembras"                                                                                       
## [31] "Total Bovinos - 2017"                                                                            
## [32] "Total Area sembrada de cultivos agroindustriales (ha)"                                           
## [33] "Total Area sembrada de cultivos de plAtano y tubErculos"                                         
## [34] "Total Area sembrada de frutas"                                                                   
## [35] "Total Area sembrada de cultivos de cereales"                                                     
## [36] "Total Area sembrada en flores, hortalizas, verduras y legumbres, plantas aromaticas y medcinales"
## [37] "Area total sembrada del sector agricola"                                                         
## [38] "# Cabezas/ Ha sembrada"                                                                          
## [39] "Sub-regiOn estratEgica (0-1)"                                                                    
## [40] "Emisiones Sector AgrIcola (Miles de ton CO2 eq)"                                                 
## [41] "Emisiones Sector Forestal (Miles de ton CO2 eq)"                                                 
## [42] "Sector Pecuario (Miles de ton CO2 eq)"                                                           
## [43] "Emisiones Sub-sector Ganadero (Miles de ton CO2 eq)"                                             
## [44] "Diferencia Sector pecuario - S-Sec GanaderIa (Miles de ton CO2 eq)"                              
## [45] "Sub-Sec. Gan. / Agri. + Forst.x + Dif S Pec-S Gan (%)"                                           
## [46] "Total Emisiones Brutas (Miles de toneladas de CO2 equivalente)"                                  
## [47] "Total  Absorciones (Miles toneladas de CO2 equivalente)"                                         
## [48] "Balance Municipal (miles Ton/aNo)"                                                               
## [49] "Absorciones / Emisiones"

ANÁLISIS ESTADÍSTICO I: Ganadería y Emisiones

Hipótesis 1: Más bovinos → más emisiones ganaderas

Solución a traves de los 5 pasos:

Paso 1: Analizar la asociación entre las variables de insumo

Diagrama de dispersión

plot(emisiones$`Emisiones Sub-sector Ganadero (Miles de ton CO2 eq)`~emisiones$`Total Bovinos - 2017`,
  xlab = "Total de Bovinos (2017)",
  ylab = "Emisiones Ganaderas (Miles de ton CO2 eq)",
  main = "Relación entre número de bovinos y emisiones ganaderas"
)

A medida que aumenta el número de bovinos, también aumentan las emisiones.Existe una relación lineal positiva, lo que confirma que más bovinos → más emisiones.

Correlación lineal

cor_test_result <- cor.test(
  emisiones$`Total Bovinos - 2017`,
  emisiones$`Emisiones Sub-sector Ganadero (Miles de ton CO2 eq)`,
  method = "pearson"
)

library(knitr)
library(kableExtra)
## 
## Adjuntando el paquete: 'kableExtra'
## The following object is masked from 'package:dplyr':
## 
##     group_rows
cor_table <- data.frame(
  Estadístico = c(
    "Coeficiente de correlación (r)",
    "Valor p",
    "Intervalo de confianza inferior",
    "Intervalo de confianza superior",
    "Estadístico t",
    "Grados de libertad (gl)"
  ),
  Valor = c(
    round(cor_test_result$estimate, 4),
    format.pval(cor_test_result$p.value,digits = 3, eps = .Machine$double.eps),
    round(cor_test_result$conf.int[1], 4),
    round(cor_test_result$conf.int[2], 4),
    round(cor_test_result$statistic, 4),
    cor_test_result$parameter
  ),
  Interpretacion=c(
    "Mide la fuerza de la relación. Aquí es casi perfecta y positiva: más bovinos → más emisiones.",
    "Indica si la relación es significativa. Tan pequeño significa que no es casualidad.",
    "Es el límite inferior donde probablemente está la correlación real. Confirma relación positiva fuerte.",
    "Es el límite superior del intervalo. También indica una correlación muy alta.",
    "Mide cuántas veces la correlación se aleja de 0. Un valor tan grande confirma relación real.",
    "Se calculan como n−2. Con ~315 municipios, gl altos dan mucha confianza al resultado."
  )
)

kable(cor_table, "html", caption = "Resultados del Test de Correlación de Pearson") %>%
  kable_styling(
    bootstrap_options = c("striped", "hover", "condensed"),
    full_width = TRUE,
    font_size = 20
  )
Resultados del Test de Correlación de Pearson
Estadístico Valor Interpretacion
Coeficiente de correlación (r) 0.9985 Mide la fuerza de la relación. Aquí es casi perfecta y positiva: más bovinos → más emisiones.
Valor p <2e-16 Indica si la relación es significativa. Tan pequeño significa que no es casualidad.
Intervalo de confianza inferior 0.9981 Es el límite inferior donde probablemente está la correlación real. Confirma relación positiva fuerte.
Intervalo de confianza superior 0.9988 Es el límite superior del intervalo. También indica una correlación muy alta.
Estadístico t 321.1092 Mide cuántas veces la correlación se aleja de 0. Un valor tan grande confirma relación real.
Grados de libertad (gl) 313 Se calculan como n−2. Con ~315 municipios, gl altos dan mucha confianza al resultado.

El análisis inicial muestra una relación muy fuerte entre las dos variables. En el diagrama de dispersión, los puntos se alinean casi perfectamente en una línea recta ascendente, lo que indica que a medida que aumenta el insumo, también aumentan las emisiones.

Este comportamiento visual se confirma con el coeficiente de correlación obtenido (r = 0.9985), el cual refleja una correlación positiva casi perfecta. Esto significa que ambas variables están estrechamente relacionadas y se mueven prácticamente al mismo ritmo.

En conclusión, existe una asociación lineal muy sólida entre las variables, lo que justifica el uso del modelo de regresión lineal simple en los siguientes pasos del análisis.

Paso 2: ¿Nuestro Modelo es Válido? (Tabla ANOVA)

La prueba F determina si la relación observada es estadísticamente significativa.

model1 <- lm(emisiones$`Emisiones Sub-sector Ganadero (Miles de ton CO2 eq)` ~ 
              emisiones$`Total Bovinos - 2017`)
summary_model1 <- summary(model1)

library(knitr)
library(kableExtra)

tabla <- data.frame(
  Estadístico = c(
    "Estadístico F",
    "Valor p del modelo",
    "Grados de libertad"
  ),
  Valor = c(
    format(summary_model1$fstatistic[1], scientific = TRUE, digits = 4),
    format.pval(pf(summary_model1$fstatistic[1],
                   summary_model1$fstatistic[2],
                   summary_model1$fstatistic[3],
                   lower.tail = FALSE),
                digits = 3),
                 summary_model1$df[2]
  ),
  Interpretación = c(
    "Indica si el modelo en conjunto es significativo; aquí es extremadamente alto.",
    "Evalúa si el modelo es significativo; p < 2.2e-16 indica evidencia muy fuerte.",
    "Se usaron 315 municipios. Esto indica que el modelo se basa en una muestra amplia y confiable"
  )
)

kable(tabla, "html", caption = "TABLA ANOVA") %>%
  kable_styling(
    bootstrap_options = c("striped", "hover", "condensed"),
    full_width = TRUE,
    font_size = 20
  )
TABLA ANOVA
Estadístico Valor Interpretación
Estadístico F 1.031e+05 Indica si el modelo en conjunto es significativo; aquí es extremadamente alto.
Valor p del modelo <2e-16 Evalúa si el modelo es significativo; p < 2.2e-16 indica evidencia muy fuerte.
Grados de libertad 313 Se usaron 315 municipios. Esto indica que el modelo se basa en una muestra amplia y confiable

La tabla ANOVA muestra que el modelo de regresión sí funciona. El valor F es muy alto (103100) y el valor p es muy pequeño (<2.2e-16), lo que significa que la relación entre el número de bovinos y las emisiones ganaderas es real y no es por casualidad. omo se usaron 315 municipios, el modelo tiene muchos datos y eso lo hace confiable. En resumen: más bovinos = más emisiones, y el modelo lo demuestra con fuerza estadística

Paso 3: ¿Qué tanto explica mi modelo? (Coeficiente de Determinación – \(R^2\))

model1 <- lm(emisiones$`Emisiones Sub-sector Ganadero (Miles de ton CO2 eq)` ~ 
               emisiones$`Total Bovinos - 2017`)
summary_model1 <- summary(model1)

library(knitr)
library(kableExtra)

tabla <- data.frame(
  Estadístico = c(
    "R-cuadrado (R²)"
  ),
  Valor = c(
    round(summary_model1$r.squared, 3)
  ),
  Interpretación = c(
    "El modelo explica casi el 100% de la variabilidad de las emisiones."
  )
)

kable(tabla, "html", caption = "Resultados del Modelo de Regresión Lineal") %>%
  kable_styling(
    bootstrap_options = c("striped", "hover", "condensed"),
    full_width = TRUE,
    font_size = 20
  )
Resultados del Modelo de Regresión Lineal
Estadístico Valor Interpretación
R-cuadrado (R²) 0.997 El modelo explica casi el 100% de la variabilidad de las emisiones.

El coeficiente de determinación R² = 0.997 indica que el modelo de regresión lineal es capaz de explicar el 99.7% de la variabilidad en las emisiones del subsector ganadero a partir del total de bovinos.

Este valor, extremadamente cercano a 1, muestra que existe una correspondencia casi perfecta entre la cantidad de bovinos y las emisiones generadas. En otras palabras, las variaciones en las emisiones están prácticamente determinadas por las variaciones en el número de bovinos, lo cual confirma que el modelo es altamente explicativo y capta adecuadamente la relación entre ambas variables.

Además, el R² ajustado, que penaliza el uso de variables innecesarias, también es 0.997, lo cual confirma que el modelo no está sobreajustado y que la relación es genuina y robusta.

En conclusión, el coeficiente de determinación demuestra que el modelo tiene un poder explicativo excepcional, por lo que es adecuado para análisis, interpretación y predicción dentro del contexto estudiado.

Paso 4: ¿Cuáles son los parámetros? (Tabla de coefiecientes)

El Paso 4 se enfoca en interpretar los parámetros del modelo de regresión, es decir, los coeficientes que definen la ecuación lineal:

Donde:

a es el intercepto (valor de Y cuando X = 0)

b es la pendiente (cuánto cambia Y por cada unidad de cambio en X)

model1 <- lm(emisiones$`Emisiones Sub-sector Ganadero (Miles de ton CO2 eq)` ~ 
              emisiones$`Total Bovinos - 2017`)
summary_model1 <- summary(model1)

library(knitr)
library(kableExtra)

tabla <- data.frame(
  Estadístico = c(
    "Intercepto (a)",
    "Pendiente (b)",
    "Error estándar b",
    "Estadístico t b",
    "Valor p b",
    "R-cuadrado (R²)",
    "R-cuadrado ajustado",
    "Error estándar residual",
    "Estadístico F",
    "Grados de libertad (gl)",
    "Valor p del modelo"
  ),
  Valor = c(
    round(summary_model1$coefficients[1,1], 6),
    round(summary_model1$coefficients[2,1], 6),
    format(summary_model1$coefficients[2,2], scientific = TRUE, digits = 4),
    round(summary_model1$coefficients[2,3], 4),
    format.pval(summary_model1$coefficients[2,4], digits = 3, eps = .Machine$double.eps),
    round(summary_model1$r.squared, 3),
    round(summary_model1$adj.r.squared, 3),
    round(summary_model1$sigma, 4),
    format(summary_model1$fstatistic[1], scientific = TRUE, digits = 4),
    summary_model1$df[2],
    format.pval(pf(summary_model1$fstatistic[1],
                   summary_model1$fstatistic[2],
                   summary_model1$fstatistic[3],
                   lower.tail = FALSE),
                digits = 3)
  ),
  Interpretación = c(
    "Valor promedio de emisiones cuando los bovinos son 0 (no tiene interpretación real, pero es parte del modelo).",
    "Por cada unidad adicional de bovinos, las emisiones aumentan en promedio esta cantidad.",
    "Indica la precisión de la estimación de β₁; entre más pequeño, mejor.",
    "Mide cuántos errores estándar se aleja β₁ de 0; un t enorme indica relación fuerte.",
    "Probabilidad de obtener estos datos si la pendiente fuera 0; extremadamente pequeño → relación real.",
    "El modelo explica casi el 100% de la variabilidad de las emisiones.",
    "Corrige por número de variables; aquí también es ~0.997, excelente ajuste.",
    "Qué tanto se desvían las emisiones reales del modelo; menor es mejor.",
    "Indica si el modelo en conjunto es significativo; aquí es extremadamente alto.",
    "Se calculan como n−2.Se usaron 315 municipios. Esto indica que el modelo se basa en una muestra amplia y confiable.",
    "Evalúa si el modelo es significativo; p < 2.2e-16 indica evidencia muy fuerte."
  )
)

kable(tabla, "html", caption = "Resultados del Modelo de Regresión Lineal") %>%
  kable_styling(
    bootstrap_options = c("striped", "hover", "condensed"),
    full_width = TRUE,
    font_size = 20
  )
Resultados del Modelo de Regresión Lineal
Estadístico Valor Interpretación
Intercepto (a) 0.054695 Valor promedio de emisiones cuando los bovinos son 0 (no tiene interpretación real, pero es parte del modelo).
Pendiente (b) 0.000635 Por cada unidad adicional de bovinos, las emisiones aumentan en promedio esta cantidad.
Error estándar b 1.978e-06 Indica la precisión de la estimación de β₁; entre más pequeño, mejor.
Estadístico t b 321.1092 Mide cuántos errores estándar se aleja β₁ de 0; un t enorme indica relación fuerte.
Valor p b <2e-16 Probabilidad de obtener estos datos si la pendiente fuera 0; extremadamente pequeño → relación real.
R-cuadrado (R²) 0.997 El modelo explica casi el 100% de la variabilidad de las emisiones.
R-cuadrado ajustado 0.997 Corrige por número de variables; aquí también es ~0.997, excelente ajuste.
Error estándar residual 0.8422 Qué tanto se desvían las emisiones reales del modelo; menor es mejor.
Estadístico F 1.031e+05 Indica si el modelo en conjunto es significativo; aquí es extremadamente alto.
Grados de libertad (gl) 313 Se calculan como n−2.Se usaron 315 municipios. Esto indica que el modelo se basa en una muestra amplia y confiable.
Valor p del modelo <2e-16 Evalúa si el modelo es significativo; p < 2.2e-16 indica evidencia muy fuerte.

La Tabla de Coeficientes confirma que el modelo de regresión es sólido y estadísticamente significativo. El intercepto es muy pequeño, lo que indica que, en ausencia de bovinos, las emisiones serían prácticamente nulas. La pendiente es positiva y alta, lo que demuestra que a medida que aumenta el número de bovinos también aumentan las emisiones ganaderas. Además, el error estándar reducido, junto con un valor t grande y un valor p extremadamente pequeño, confirman que esta relación no ocurre por azar. En conjunto, estos resultados validan que el número de bovinos es un predictor fuerte y confiable de las emisiones del sector ganadero.

En el Paso 4, al analizar los coeficientes del modelo, se observa que el valor p asociado al número de bovinos es menor a 0.05. Esto permite rechazar la hipótesis nula (H₀) y aceptar la hipótesis alternativa (H₁), confirmando que sí existe una relación positiva y significativa entre el número de bovinos y las emisiones ganaderas.

Paso 5:Construir la ecuación y predecir

El modelo de regresión lineal tiene esta forma:

\[ \hat{Y}=a + bX\]

Donde:

\(\hat{Y}\):Emisiones ganaderas estimadas (en miles de toneladas de CO₂ eq)

X:Número total de bovinos en 2017

\(a\): El intercepto, o constante de la recta de regresión = 054695

\(b\): Pendiente= 0.000635

Quedando la ecuación de regresión lineal simple así:

\[ \hat{Y}= 0.054695 + 0.000635 X\]

Ejemplo práctico

Supongamos que un municipio tiene 50,000 bovinos. Aplicamos la fórmula:

\[ \hat{Y}= 0.054695 + 0.000635 * 50.000\]

\[ \hat{Y}= 0.054695 + 0.000635 * 50.000= 31.81\]

Entonces, ese municipio emitiría aproximadamente 31.81 miles de toneladas de CO₂ eq en el sub-sector ganadero.

La ecuación del modelo permite estimar las emisiones ganaderas a partir del número de bovinos. Por ejemplo, un municipio con 50,000 bovinos emitiría cerca de 31.81 miles de toneladas de CO₂ eq. Esta herramienta es útil para predecir y comparar emisiones entre regiones según su carga ganadera.

La evidencia estadística permite aceptar la Hipótesis 1, que planteaba que a mayor número de bovinos, mayores son las emisiones del subsector ganadero.

Tras aplicar los cinco pasos del proceso estadístico (planteamiento de hipótesis, validación del modelo, evaluación del ajuste, análisis de coeficientes y construcción de la ecuación), se concluye que la Hipótesis 1 es verdadera: el número de bovinos influye directamente en el aumento de las emisiones del subsector ganadero.

El modelo es estadísticamente válido según la Tabla ANOVA (F muy alto y gl = 313), presenta una correlación casi perfecta (r ≈ 0.998) y explica prácticamente toda la variabilidad observada en las emisiones (R² ≈ 0.997). Además, la pendiente del modelo es positiva y significativa, indicando que cada bovino adicional incrementa las emisiones, confirmando así la relación planteada.

Con esta evidencia, se puede concluir que el crecimiento del hato bovino es un factor determinante en el comportamiento de las emisiones. Por ello, los resultados permiten recomendar medidas para reducir el impacto ambiental, tales como:

En síntesis: los cinco pasos demuestran que el número de bovinos es un predictor sólido y significativo de las emisiones ganaderas. Por lo tanto, la gestión ambiental del sector debe basarse en estrategias que reduzcan la presión del hato bovino sobre el ambiente.

ANÁLISIS ESTADÍSTICO II:Agroforestería y Mitigación

Hipótesis 2: Mayor contribución del subsector ganadero → mayores emisiones pecuarias totales

Solución a traves de los 5 pasos:

Paso 1: Analizar la asociación entre las variables de insumo

Diagrama de dispersión

plot(
  emisiones$`Sector Pecuario (Miles de ton CO2 eq)` ~ emisiones$`Emisiones Sub-sector Ganadero (Miles de ton CO2 eq)`,
  xlab = "Emisiones Sub-sector Ganadero (Miles de ton CO2 eq)",
  ylab = "Emisiones Totales del Sector Pecuario (Miles de ton CO2 eq)",
  main = "Relación entre emisiones ganaderas y el total pecuario"
)

El gráfico muestra una clara relación positiva entre las emisiones del subsector ganadero y las emisiones pecuarias totales.A medida que aumentan las emisiones provenientes del subsector ganadero, también aumentan las emisiones totales del sector pecuario. Los puntos se distribuyen formando una tendencia ascendente, lo que respalda la Hipótesis 2: “Mayor contribución del subsector ganadero → mayores emisiones pecuarias totales”.

Correlación lineal

cor_test_result <- cor.test(
  emisiones$`Emisiones Sub-sector Ganadero (Miles de ton CO2 eq)`,
  emisiones$`Sector Pecuario (Miles de ton CO2 eq)`,
  method = "pearson"
)

library(knitr)
library(kableExtra)

cor_table <- data.frame(
  Estadístico = c(
    "Coeficiente de correlación (r)",
    "Valor p",
    "Intervalo de confianza inferior",
    "Intervalo de confianza superior",
    "Estadístico t",
    "Grados de libertad (gl)"
  ),
  Valor = c(
    round(cor_test_result$estimate, 4),
    format.pval(cor_test_result$p.value,digits = 3, eps = .Machine$double.eps),
    round(cor_test_result$conf.int[1], 4),
    round(cor_test_result$conf.int[2], 4),
    round(cor_test_result$statistic, 4),
    cor_test_result$parameter
  ),
  Interpretacion=c(
    "Indica una correlación positiva extremadamente fuerte. A mayor aporte del subsector ganadero, mayores son las emisiones pecuarias totales.",
    "Indica si la relación es significativa. Tan pequeño significa que no es casualidad.",
    "Confirma que la correlación verdadera es altamente positiva; no hay posibilidad de correlación débil o negativa.",
    "Indica una correlación muy alta en el límite superior, reforzando la fuerza del vínculo.",
    "Valor muy elevado que indica que la correlación observada se aleja fuertemente de cero. Refuerza su significancia.",
    "Se calculan como n−2. Muestra que se usaron ~315 observaciones; un tamaño grande que da solidez estadística al resultado."
  )
)

kable(cor_table, "html", caption = "Resultados del Test de Correlación de Pearson") %>%
  kable_styling(
    bootstrap_options = c("striped", "hover", "condensed"),
    full_width = TRUE,
    font_size = 20
  )
Resultados del Test de Correlación de Pearson
Estadístico Valor Interpretacion
Coeficiente de correlación (r) 0.9276 Indica una correlación positiva extremadamente fuerte. A mayor aporte del subsector ganadero, mayores son las emisiones pecuarias totales.
Valor p <2e-16 Indica si la relación es significativa. Tan pequeño significa que no es casualidad.
Intervalo de confianza inferior 0.9104 Confirma que la correlación verdadera es altamente positiva; no hay posibilidad de correlación débil o negativa.
Intervalo de confianza superior 0.9416 Indica una correlación muy alta en el límite superior, reforzando la fuerza del vínculo.
Estadístico t 43.9354 Valor muy elevado que indica que la correlación observada se aleja fuertemente de cero. Refuerza su significancia.
Grados de libertad (gl) 313 Se calculan como n−2. Muestra que se usaron ~315 observaciones; un tamaño grande que da solidez estadística al resultado.

El diagrama de dispersión muestra un patrón claramente ascendente, indicando que a medida que aumentan las emisiones del subsector ganadero también aumentan las emisiones totales del sector pecuario. Esta relación visual se confirma estadísticamente mediante el coeficiente de correlación de Pearson, que es positivo y extremadamente fuerte (r = 0.9276), con un valor p < 2e-16, lo cual demuestra que la relación es altamente significativa. Además, el intervalo de confianza del 95% (0.9104 – 0.9416) confirma que la correlación verdadera en la población es muy elevada y consistentemente positiva.

En conjunto, tanto la evidencia gráfica como la estadística muestran que existe una asociación fuerte, positiva y robusta entre las emisiones ganaderas y las emisiones pecuarias totales, respaldando la idea de que un mayor aporte del subsector ganadero se relaciona con mayores emisiones pecuarias totales.

Paso 2: ¿Nuestro Modelo es Válido? (Tabla ANOVA)

La prueba F determina si la relación observada es estadísticamente significativa.

model2 <- lm(emisiones$`Sector Pecuario (Miles de ton CO2 eq)` ~ 
              emisiones$`Emisiones Sub-sector Ganadero (Miles de ton CO2 eq)`)
summary_model2 <- summary(model2)

library(knitr)
library(kableExtra)

tabla <- data.frame(
  Estadístico = c(
    "Estadístico F",
    "Valor p del modelo",
    "Grados de libertad"
  ),
  Valor = c(
    format(summary_model2$fstatistic[1], scientific = TRUE, digits = 4),
    format.pval(pf(summary_model2$fstatistic[1],
                   summary_model2$fstatistic[2],
                   summary_model2$fstatistic[3],
                   lower.tail = FALSE),
                digits = 3),
                 summary_model2$df[2]
  ),
  Interpretación = c(
    "Indica que el modelo lineal es altamente significativo. La variación en las emisiones pecuarias totales puede explicarse de manera sólida por la variación en las emisiones del subsector ganadero.",
    "Confirma que la relación entre las emisiones ganaderas y las emisiones pecuarias totales no es producto del azar.",
    "Muestran que el análisis se sustenta en una muestra amplia (~315 municipios), lo que refuerza la confiabilidad del modelo."
  )
)

kable(tabla, "html", caption = "TABLA ANOVA") %>%
  kable_styling(
    bootstrap_options = c("striped", "hover", "condensed"),
    full_width = TRUE,
    font_size = 20
  )
TABLA ANOVA
Estadístico Valor Interpretación
Estadístico F 1.93e+03 Indica que el modelo lineal es altamente significativo. La variación en las emisiones pecuarias totales puede explicarse de manera sólida por la variación en las emisiones del subsector ganadero.
Valor p del modelo <2e-16 Confirma que la relación entre las emisiones ganaderas y las emisiones pecuarias totales no es producto del azar.
Grados de libertad 313 Muestran que el análisis se sustenta en una muestra amplia (~315 municipios), lo que refuerza la confiabilidad del modelo.

La tabla ANOVA muestra que el estadístico F es extremadamente alto y que el valor p del modelo es menor que 2.2e-16, lo que indica que la relación lineal entre las emisiones del subsector ganadero y las emisiones pecuarias totales es estadísticamente significativa. Esto significa que el modelo lineal utilizado es válido y que la variación en las emisiones pecuarias totales puede ser explicada de forma sólida por la variación en las emisiones del subsector ganadero.

Además, los grados de libertad cercanos a 313 reflejan que el modelo se basa en una muestra amplia, lo cual aumenta la confiabilidad del análisis. En conjunto, la evidencia ANOVA respalda que el modelo es adecuado para representar la relación planteada en la Hipótesis 2.

Paso 3: ¿Qué tanto explica mi modelo? (Coeficiente de Determinación – \(R^2\))

model2 <- lm(emisiones$`Sector Pecuario (Miles de ton CO2 eq)` ~ 
          emisiones$`Emisiones Sub-sector Ganadero (Miles de ton CO2 eq)`)
summary_model2 <- summary(model2)

library(knitr)
library(kableExtra)

tabla <- data.frame(
  Estadístico = c(
    "R-cuadrado (R²)"
  ),
  Valor = c(
    round(summary_model2$r.squared, 3)
  ),
  Interpretación = c(
    "El modelo explica aproximadamente el 86% de la variabilidad de las emisiones pecuarias totales, lo que indica un ajuste fuerte y un alto poder explicativo."
  )
)

kable(tabla, "html", caption = "Resultados del Modelo de Regresión Lineal") %>%
  kable_styling(
    bootstrap_options = c("striped", "hover", "condensed"),
    full_width = TRUE,
    font_size = 20
  )
Resultados del Modelo de Regresión Lineal
Estadístico Valor Interpretación
R-cuadrado (R²) 0.86 El modelo explica aproximadamente el 86% de la variabilidad de las emisiones pecuarias totales, lo que indica un ajuste fuerte y un alto poder explicativo.

El coeficiente de determinación obtenido (R² = 0.86) indica que el modelo de regresión lineal explica aproximadamente el 86% de la variabilidad en las emisiones pecuarias totales a partir de las emisiones del subsector ganadero. Este valor representa un alto nivel de ajuste, lo que significa que la mayor parte de los cambios observados en las emisiones totales puede atribuirse directamente a la contribución del subsector ganadero.

En términos prácticos, el modelo posee un poder explicativo fuerte y consistente, lo que refuerza la evidencia a favor de la Hipótesis 2, al mostrar que las emisiones ganaderas son un determinante principal de las emisiones pecuarias totales.

Paso 4: ¿Cuáles son los parámetros? (Tabla de coefiecientes)

El Paso 4 del método que estás aplicando se enfoca en interpretar los parámetros del modelo de regresión, es decir, los coeficientes que definen la ecuación lineal:

Donde:

a es el intercepto (valor de Y cuando X = 0)

#- b es la pendiente (cuánto cambia Y por cada unidad de cambio en X)

model2 <- lm( emisiones$`Sector Pecuario (Miles de ton CO2 eq)` ~ 
              emisiones$`Emisiones Sub-sector Ganadero (Miles de ton CO2 eq)`)
summary_model2 <- summary(model2)

library(knitr)
library(kableExtra)

tabla <- data.frame(
  Estadístico = c(
    "Intercepto (a)",
    "Pendiente (b)",
    "Error estándar b",
    "Estadístico t b",
    "Valor p b",
    "R-cuadrado (R²)",
    "R-cuadrado ajustado",
    "Error estándar residual",
    "Estadístico F",
    "Grados de libertad (gl)",
    "Valor p del modelo"
  ),
  Valor = c(
    round(summary_model2$coefficients[1,1], 6),
    round(summary_model2$coefficients[2,1], 6),
    format(summary_model2$coefficients[2,2], scientific = TRUE, digits = 4),
    round(summary_model2$coefficients[2,3], 4),
    format.pval(summary_model2$coefficients[2,4], digits = 3, eps = .Machine$double.eps),
    round(summary_model2$r.squared, 3),
    round(summary_model2$adj.r.squared, 3),
    round(summary_model2$sigma, 4),
    format(summary_model2$fstatistic[1], scientific = TRUE, digits = 4),
    summary_model2$df[2],
    format.pval(pf(summary_model2$fstatistic[1],
                   summary_model2$fstatistic[2],
                   summary_model2$fstatistic[3],
                   lower.tail = FALSE),
                digits = 3)
  ),
  Interpretación = c(
    "Emisiones pecuarias esperadas cuando las emisiones del subsector ganadero son 0. Aunque no es un escenario realista, es parte del modelo matemático.",
    "Por cada 1 unidad adicional de emisiones ganaderas (mil ton CO₂ eq), las emisiones pecuarias totales aumentan 1.425 mil ton CO₂ eq en promedio. Indica una relación positiva fuerte.",
    "La estimación de la pendiente es muy precisa; un error estándar pequeño indica gran estabilidad del coeficiente.",
    "La pendiente está extremadamente alejada de 0 en términos estadísticos; evidencia sólida de relación lineal.",
    "Probabilidad casi nula de obtener estos datos si la pendiente fuera 0; confirma relación altamente significativa.",
    "El modelo explica el 86% de la variabilidad de las emisiones pecuarias totales. Excelente poder explicativo.",
    "Similar al R² dado que el modelo tiene una sola variable; indica muy buen ajuste.",
    "Variación promedio de los residuos; valores más bajos indican mejor ajuste.",
    "Indica si el modelo en conjunto es significativo; aquí es extremadamente alto.",
    "Se calculan como n−2.Se usaron 315 municipios. Esto indica que el modelo se basa en una muestra amplia y confiable.",
    "Evalúa si el modelo es significativo; p < 2.2e-16 indica evidencia muy fuerte."
  )
)

kable(tabla, "html", caption = "Resultados del Modelo de Regresión Lineal") %>%
  kable_styling(
    bootstrap_options = c("striped", "hover", "condensed"),
    full_width = TRUE,
    font_size = 20
  )
Resultados del Modelo de Regresión Lineal
Estadístico Valor Interpretación
Intercepto (a) 2.786915 Emisiones pecuarias esperadas cuando las emisiones del subsector ganadero son 0. Aunque no es un escenario realista, es parte del modelo matemático.
Pendiente (b) 1.425088 Por cada 1 unidad adicional de emisiones ganaderas (mil ton CO₂ eq), las emisiones pecuarias totales aumentan 1.425 mil ton CO₂ eq en promedio. Indica una relación positiva fuerte.
Error estándar b 3.244e-02 La estimación de la pendiente es muy precisa; un error estándar pequeño indica gran estabilidad del coeficiente.
Estadístico t b 43.9354 La pendiente está extremadamente alejada de 0 en términos estadísticos; evidencia sólida de relación lineal.
Valor p b <2e-16 Probabilidad casi nula de obtener estos datos si la pendiente fuera 0; confirma relación altamente significativa.
R-cuadrado (R²) 0.86 El modelo explica el 86% de la variabilidad de las emisiones pecuarias totales. Excelente poder explicativo.
R-cuadrado ajustado 0.86 Similar al R² dado que el modelo tiene una sola variable; indica muy buen ajuste.
Error estándar residual 8.7848 Variación promedio de los residuos; valores más bajos indican mejor ajuste.
Estadístico F 1.93e+03 Indica si el modelo en conjunto es significativo; aquí es extremadamente alto.
Grados de libertad (gl) 313 Se calculan como n−2.Se usaron 315 municipios. Esto indica que el modelo se basa en una muestra amplia y confiable.
Valor p del modelo <2e-16 Evalúa si el modelo es significativo; p < 2.2e-16 indica evidencia muy fuerte.

Los parámetros del modelo muestran que existe una relación lineal positiva fuerte y altamente significativa entre las emisiones del subsector ganadero y las emisiones pecuarias totales. La pendiente (1.425) indica que un incremento en las emisiones ganaderas produce un aumento proporcional en las emisiones totales, lo que respalda directamente la Hipótesis 2. El intercepto carece de interpretación práctica, pero es parte del modelo. En conjunto, los coeficientes muestran un comportamiento estable, preciso y estadísticamente sólido.

Los parámetros estimados indican que el efecto del subsector ganadero sobre las emisiones pecuarias totales es positivo y altamente significativo. Dado que el valor p del coeficiente de la pendiente es mucho menor que 0.05, se rechaza la hipótesis nula y se acepta la hipótesis alternativa planteada. Por tanto, existe evidencia estadística sólida para afirmar que un mayor nivel de emisiones ganaderas se asocia directamente con un incremento en las emisiones totales del sector pecuario, respaldando la Hipótesis 2 del modelo.

Paso 5:Construir la ecuación y predecir

El modelo de regresión lineal tiene esta forma:

\[ \hat{Y}=a + bX\]

Donde:

:Emisiones pecuarias totales estimadas (Miles de ton CO₂ eq)

X: Emisiones del subsector ganadero (Miles de ton CO₂ eq)

\(a\): El intercepto, o constante de la recta de regresión= 2.786915

\(b\): Pendiente= 1.425088

Quedando la ecuación de regresión lineal simple así:

\[ \hat{Y}= 2.786915 + 1.425088 X\]

Ejemplo práctico

Supongamos que un municipio genera 6,000 miles de toneladas de CO₂ eq en el subsector ganadero.

Aplicamos la fórmula:

\[ \hat{Y}= 2.786915 + 1.425088 * 6.000\]

\[ \hat{Y}= 2.786915 + 1.425088 * 6.000= 8553.314915\]

La ecuación del modelo permite estimar las emisiones pecuarias totales a partir de las emisiones del subsector ganadero.

Por ejemplo, un municipio con 6,000 miles de ton CO₂ eq en emisiones ganaderas tendría aproximadamente 8,553 miles de ton CO₂ eq en emisiones pecuarias totales.

Confirmando que a mayor aporte del subsector ganadero, mayores son las emisiones pecuarias totales, respaldando la Hipótesis Alternativa (H₁).

La construcción de la ecuación del modelo de regresión lineal permitió estimar las emisiones pecuarias totales a partir de las emisiones generadas específicamente por el subsector ganadero. La ecuación obtenida, Y=2.786915+1.425088X, muestra que por cada unidad adicional de emisiones ganaderas, las emisiones totales del sector pecuario aumentan en promedio 1.425088 unidades. Esto confirma que la relación entre ambas variables es positiva, directa y estadísticamente significativa, ratificando la validez del modelo. Gracias a esto, se evidencia que un incremento en las emisiones ganaderas conduce directamente a un aumento proporcional en las emisiones pecuarias totales.

El ejemplo práctico desarrollado demuestra la utilidad del modelo: cuando se introduce un valor específico de emisiones ganaderas, la ecuación permite predecir con precisión el nivel de emisiones totales del sector. Este ejercicio confirma empíricamente los resultados obtenidos y respalda la Hipótesis Alternativa (H₁), según la cual existe una relación positiva entre ambas variables. Con ello, se rechaza la Hipótesis Nula (H₀), dado que los datos analizados muestran que sí hay un efecto claro y consistente del subsector ganadero sobre las emisiones pecuarias totales.

El modelo, al demostrar una fuerte capacidad predictiva, se convierte en una herramienta clave para identificar los municipios con mayores niveles de emisiones y prever escenarios futuros asociados al crecimiento ganadero. Este tipo de análisis es esencial para la planificación territorial y para orientar la toma de decisiones en el manejo ambiental del sector pecuario. Los resultados sugieren que las acciones de mitigación deben centrarse en el subsector ganadero, pues su comportamiento influye significativamente en el total de emisiones. Por lo tanto, se hace necesario implementar estrategias como el manejo sostenible del ganado, la optimización de la alimentación animal, la incorporación de tecnologías como biodigestores y el fortalecimiento de programas gubernamentales orientados a reducir la huella ambiental de la actividad ganadera.

En conjunto, los hallazgos del Paso 5 confirman que el subsector ganadero es un determinante principal de las emisiones pecuarias totales y que su gestión adecuada es fundamental para diseñar políticas efectivas de mitigación del cambio climático. El modelo no solo valida la hipótesis planteada, sino que también proporciona una herramienta precisa y útil para apoyar la formulación de estrategias ambientales basadas en evidencia.

Conclusión

El análisis estadístico realizado confirma que tanto el número de bovinos como las emisiones del subsector ganadero son determinantes directos del comportamiento de las emisiones pecuarias en los municipios estudiados. Para la Hipótesis 1, la correlación casi perfecta y el modelo con un R² cercano a 1 demostraron que el tamaño del hato bovino explica prácticamente la totalidad de las emisiones ganaderas, por lo que se acepta la hipótesis alternativa y se rechaza la nula.

De manera consistente, los resultados de la Hipótesis 2 mostraron que las emisiones del subsector ganadero guardan una relación positiva, fuerte y altamente significativa con las emisiones pecuarias totales, permitiendo nuevamente aceptar la hipótesis alternativa y descartar la ausencia de relación.

En conjunto, los hallazgos evidencian que la ganadería es el principal motor de las emisiones agropecuarias y que su gestión adecuada es fundamental para reducir el impacto climático del sector. Estas conclusiones enfatizan la necesidad de adoptar prácticas ganaderas más eficientes, tecnologías de mitigación de metano y sistemas sostenibles como los silvopastoriles, con el fin de avanzar hacia un modelo rural más responsable y ambientalmente viable.

Referencias