Data Science es la ciencia centrada en el estudio de los datos. Se encarga de extraer información de grandes cantidades de datos. Está combina la estadística, las matemáticas y la informática para interpretar datos. Además, su objetivo principal es tomar decisiones.
El Machine Learning en Agricultura se basa en una disciplina que en el ámbito de la Inteligencia Artificial desarrolla sistemas que aprenden automáticamente, continúa su desarrollo y ya tenemos ejemplos prácticos multisectoriales en los que verla en acción.
El Analítica Big Data el cual cada vez más gestores agroalimentarios están utilizando este sistemas de analítica avanzada, donde al combinar datos que provienen de su desempeño y de fuentes externas para extraer inteligencia, conclusiones y tendencias de ellas a la hora de fijar precios.
El objetivo de este caso de estudio es comparar la emisión proveniente de \(CH_{4}\) por el proceso de fermentación entérica en la agricultura a nivel mundial, base a información obtenida en la base de datos de Organización de las Naciones Unidas para la Alimentación y la Agricultura.
El metano (\(CH_{4}\)) es un hidrocarburo y el principal componente del gas natural. El metano es además un potente y abundante “gas de efecto invernadero” el cual lo convierte en un importante contribuyente al cambio climático, especialmente a corto plazo. Este es emitido durante la producción y transporte de carbón, gas natural y petróleo. Las emisiones de gases también resultan de la ganadería y otras prácticas agrícolas y de la descomposición del desperdicio orgánico en los vertederos de desechos sólidos municipales y de ciertos sistemas de tratamiento de aguas de desecho.
El metano ocupa el segundo GHG más abundante después del dióxido de carbono (\(CO_{2}\)), es responsable del 14% de las emisiones a nivel mundial. Aunque el metano es emitido en la atmósfera en cantidades más pequeñas que el \(CO_{2}\), su potencial para el calentamiento global (por ejemplo, la capacidad del gas para atrapar el calor en la atmósfera) es 25 veces mayor. Por consiguiente, las emisiones de metano actualmente contribuyen en más de un tercio del calentamiento antropogénico actual.
La fermentación entérica por otro lado es un proceso que tiene lugar en el aparato digestivo de ciertas especies animales. Los microorganismos residentes en el tracto digestivo descomponen mediante procesos de fermentación anaeróbica los carbohidratos de los alimentos ingeridos, transformándolos en moléculas simples y solubles que pueden ser utilizadas por el animal. Uno de los subproductos de esta fermentación anaeróbica es el metano (\(CH_{4}\)) que puede ser exhalado o expulsado por el extremo terminal del tracto digestivo. La cantidad de metano producida y emitida por los animales depende básicamente de la constitución de su aparato digestivo y de su dieta alimentaria.
datatable(FAOSTAT)datatable(FAOSTATUS)ggplot(data = FAOSTAT)+
geom_line(mapping = aes(x = Fecha, y = Valor), colour="red") +
xlab("Fecha (año)") +
ylab("Emisión de CH4 (gigagramos)") +
ggtitle("Emisión de Metano en México desde 1990 hasta 2018")ggplot(data = FAOSTATUS)+
geom_line(mapping = aes(x = Fecha, y = Valor), colour="red") +
xlab("Fecha (año)") +
ylab("Emisión de CH4 (gigagramos)") +
ggtitle("Emisión de Metano en Estados Unidos desde 1990 hasta 2018")pairs(FAOSTAT, col="red")cor(FAOSTAT)## Fecha Valor
## Fecha 1.000000 0.744547
## Valor 0.744547 1.000000
Con un coeficiente de correlación de 0.744547 se puede decir que la correlación entre las emisiones de metano entre México y Estados Unidos durante los últimos 29 años no es tan alta, ni mucho menos una casualidad. Sin embargo, esta correlación no es nula ya que la correlación entre ambos datos sigue estando presente.
regresion = lm(Fecha ~ Valor, data=FAOSTAT)
summary(regresion)##
## Call:
## lm(formula = Fecha ~ Valor, data = FAOSTAT)
##
## Residuals:
## Min 1Q Median 3Q Max
## -14.166 -2.080 0.287 4.191 8.164
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 1.844e+03 2.763e+01 66.750 < 2e-16 ***
## Valor 1.971e-03 3.401e-04 5.795 3.63e-06 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 5.788 on 27 degrees of freedom
## Multiple R-squared: 0.5544, Adjusted R-squared: 0.5378
## F-statistic: 33.59 on 1 and 27 DF, p-value: 3.634e-06
El valor de p es muy pequeño, por lo cual se puede seguir aceptando que existe una correlación.
Ecuación de la recta de mínimos cuadrados \(y\)
\[ y = 1.844e+03 + 1.971e-03x \]
Con esta ecuación podemos modelar y predecir valores
plot(FAOSTAT$Valor, FAOSTAT$Fecha, xlab="Emisión de CH4 (gigagramos)", ylab="Fecha (año)")
abline(regresion, col="red")