Proyecto final producción de la uva
Introduccion
La uva de mesa es considerada una de las principales frutas en el sector agrícola mexicano, se caracteriza por ser una de las principales frutas de exportación. En el año 2012, México produjo poco más de 279 mil toneladas de uva de mesa con un valor de la producción de 6,330 millones de pesos; la superficie sembrada fue de 17,716 hectáreas. La mayor parte de la producción (93%) se obtiene del estado de Sonora (Torres, 2013).
En el estado de Sonora la uva de mesa es el cultivo con mayor valor económico, con un valor aproximado de 200 millones de dólares, con una producción de 7 millones de jornales en promedio al año (Chávez, 2016).
Ultimadamente la sequia que se ha vivido en el estado de sonora es muy fuerte y ha estado afectando a la produccion de varios cultivos ya que existe una ezcases de agua para riego y con el aumento de temperatura termina secando el cultivo y dañando el ecosistema por la falta de humedad.
Por ello se analizará la produccion de uva con la sequia medida en % de area afectada por sequias obtenido de la SMN utilizando la estadistica de los datos.
Antecedentes
Produccion de uva
La produccion de la uva en el estado de Sonora
Se producejo en el municipio de Hermosillo un 90% de uva de mesa a comparacion de los municipios de Sonora
Monitoreo de la sequia MSN y sector agricola
Daños en MDP por año debido a las sequias registradas por SMN
Objetivo del trabajo
¿Cuanto % de area en los suelos por sequias es afectado en el estado de Sonora?
¿La produccion de uva se ha mantenido constante,con variaciones, crecimiento o decrecimiento?
¿Existe una relacion entre la produccion y las sequias?
Teoría
¿Que es la sequia?
Viñedo totalmente seco debido a las sequias
Una definición conveniente de la sequía es la propuesta por la American Meteorological Society (Campos, 1996) la cual señala que: “La sequía es un lapso caracterizado por un prolongado y anormal déficit de humedad”
¿Qué clases de sequía existen?
- Sequía meteorológica: este tipo de sequía se debe a la ausencia o escasez de precipitaciones durante un período determinado.
- Sequía agrícola: este tipo de sequía afecta más a los cultivos. Puede ser debida a una ausencia de lluvias o una actividad agrícola mal planificada.
- Sequía hidrológica: este tipo de sequía se produce cuando las reservas de agua de la zona están por debajo de la media. Se puede deber a falta de lluvias o a la inadecuada actividad humana.
Principales causas de la sequia
Ausencia o escasez de lluvias, sobre todo, durante las épocas que le corresponden, por lo que el agua es escasa.
Las actividades humanas como la sobreexplotación de tierras agrícolas, el riego excesivo o la deforestación, fomentan la erosión y afectan negativamente a la capacidad del suelo para almacenar y retener el agua. Estos efectos se desencadenan sobre todo a nivel local.
Actividades que fomentan el cambio climático y sobrecalentamiento global, tanto las actividades humanas como naturales. Esto provocará aumento de precipitaciones con inundaciones en determinados lugares y períodos de sequía y calentamiento, en otros. Son, por tanto, efectos a nivel global.
La utilización en agricultura de productos tóxicos como el amoníaco, aumenta el riesgo de desertización.
Períodos irregulares de precipitaciones.
Precipitacion media anual
Precipitación media es el promedio a largo plazo en profundidad (sobre espacio y tiempo) de precipitación anual en el país. La precipitación se define como cualquier tipo de agua que cae de las nubes en forma líquida o sólida.
Consecuencias de la sequia
Pérdida de producciones agrícolas y tierras para el ganado, con la consiguiente pérdida de ingresos y alimentos. Además, al haber escasa producción de determinados alimentos, estos suben de precio por la ley de la oferta y la demanda.
Malnutrición, deshidratación y enfermedades.
Hambruna debida a la escasez de alimentos.
Migración de seres humanos y especies animales.
Daños al hábitat.
Pérdida de la biodiversidad o lo que es lo mismo, la reducción e incluso extinción de especies vegetales y animales.
Tormentas de polvo, por la desertificación y erosión.
Inestabilidad mundial, que puede desembocar en conflictos y guerras por los recursos naturales.
Menor oferta de alimentos en el mercado.
Metodología
Regresion lineal
La regresión lineal es una técnica de modelado estadístico que se emplea para describir una variable de respuesta continua como una función de una o varias variables predictoras. Puede ayudar a comprender y predecir el comportamiento de sistemas complejos o a analizar datos experimentales, financieros y biológicos.
Las técnicas de regresión lineal permiten crear un modelo lineal. Este modelo describe la relación entre una variable dependiente y (también conocida como la respuesta) como una función de una o varias variables independientes Xi (denominadas predictores). La ecuación general correspondiente a un modelo de regresión lineal es:
\[ Y=β0+∑ βiXi+ϵi \]
donde β representa las estimaciones de parámetros lineales que se deben calcular y ϵ representa los términos de error
Series temporales
Una serie temporal se define como una colección de observaciones de una variable recogidas secuencialmente en el tiempo. Estas observaciones se suelen recoger en instantes de tiempo equiespaciados. Si los datos se recogen en instantes temporales de forma continua, se debe o bien digitalizar la serie, es decir, recoger sólo los valores en instantes de tiempo equiespaciados, o bien acumular los valores sobre intervalos de tiempo (Parra, 2019).
En el tratamiento de series temporales que vamos a abordar, únicamente se considerará la información presente y pasada de la variable investigada. Si la variable investigada es \(Y\) y se dispone de los valores que toma dicha variable desde el momento 1 hasta \(T\) el conjunto de información disponible vendrá dado por:
\[\ Y_{1}, Y_{2}, Y_{3}, ... Y_{T-1}, Y_{T}\]
Los índices estandarizados de sequía (SI), evalúan la diferencia que existe entre los valores de la variable analizada y la condición considerada como “normal” en una muestra normalizada. Así, los valores numéricos del índice SI representan anomalías de la variable de interés respecto a la media.
Todos estos índices, univariados y multivariados, se determinan de forma mensual para todo el territorio nacional y con diferentes escalas temporales (1, 3, 6 ,9 y 12 meses).
χ2 de Pearson (test de independencia)
El test χ2 de independencia, también conocido como χ2 de Pearson se emplea para estudiar si existe asociación entre dos variables categóricas, es decir, si las proporciones de una variable son diferentes dependiendo del valor que adquiera la otra variable, cuando los datos son independientes. El test de independencia cuantifica y sumariza cómo de distinto es el número de eventos observados en cada nivel con respecto al número esperado acorde con Ho. Esto permite identificar si la desviación total es mayor que la que cabría esperar simplemente por azar.
Hipótesis
H0 : Las variables son independientes por lo que una variable no varía entre los distintos niveles de la otra variable.
Ha : Las variables son dependientes, una variable varía entre los distintos niveles de la otra variable.
Resultados y discusión
library(readxl)
<- read_excel("~/R/Uva.xlsx") Uva
Gráfica de los principales productores de uva en México
library(readxl)
library(hpackedbubble)
##
## Attaching package: 'hpackedbubble'
## The following object is masked from 'package:datasets':
##
## CO2
<- read_excel("~/R/Uva.xlsx")
Uvas hpackedbubble(Uvas$Estado, Uvas$`Produccion_obtenida_(ton)`, Uvas$`Valor_de_la_produccion_(millones)`,
title = "Estados de los Mayores productores de Uva en México",
pointFormat = "<b>{point.name}:</b> {point.y}",
dataLabelsFilter = 200,
packedbubbleMinSize = "30%",
packedbubbleMaxSize = "40%",
theme = "sky",
packedbubbleZMin = 0,
packedbubbleZmax = 1000, split = 1,
gravitational = 0.02,
parentNodeLimit = 1,
dragBetweenSeries = 0,
seriesInteraction = 0,
width = "100%")
library(readxl)
<- read_excel("UvaE.xlsx")
Uvas view(Uvas)
Gráfica de los principales municipios que producen uva en el estado de Sonora
<- plot_ly(Uvas, x = ~Municipio, y =~Produccion, type = 'bar', name = 'Datos')
fig <- fig %>% add_trace(y = ~Produccion, name = 'Produccion_obtenida_(ton)')
fig <- fig %>% add_trace(y = ~Superficie, name = 'Superficie_cosechada_(ha)')
fig <- fig %>% add_trace(y = ~Valor, name = 'Valor de la producción en millones de pesos')
fig <- fig %>% layout(yaxis = list(title = 'Producción de uvas'), barmode = 'group')
fig fig
setwd("~/R")
<- read_excel("~/R/SequiaSonora.xlsx")
Sequia View(Sequia)
Visualizar tabla en series de tiempo del % de área afectada por sequías
Visualizar la gráfica por series de tiempo de la sequía en Sonora
library(forecast)
## Registered S3 method overwritten by 'quantmod':
## method from
## as.zoo.data.frame zoo
plot(Sequia.ts, col = "brown", main = "% Area afecta por sequia en Sonora", ylab = "% Area afectada", xlab ="Tiempo", lwd=1, type="l", pch=10)
Se puede observar las mediciones del monitor de sequias en Mexico (MSN), en la cual se toman datos por mes, además se utilizo la función de series de tiempo para ajustarlo a 1 año los 12 meses como frecuencias.
Las series de tiempo permiten conocer la variación temporal de las distintas variables e índices de sequía en una región predeterminada (considerando división política o hidrografía). Donde D0 es normalmente seco, D1 es sequía moderada, D2 sequía severa, D3 sequía extrema y D4 sequía excepcional.
En la gráfica se observa que la mayor parte entre los niveles D1 y D2 se encuentra en oscilaciones muy constantes de esta serie temporal por lo que se puede deducir que en todos los años los porcentajes de área afectada por sequía se encuentran la mayor parte entre D1 Y D2.
Se observa que en la grafica D4 ocurrio una sequía del nivel más alto, es decir, una sequía excepcional en la cual tuvo tiempos que llegaron hasta más de 50% de área afectada siendo éste indicador muy fuerte para nuestra agricultura en el caso de la Uva.<- ts(Sequia$D4, start=c(2010,1), frequency = 12)
Sequia.ts plot(Sequia.ts, col = "brown", main = "Sequia Excepcional en Sonora", ylab = "% Area afectada", xlab ="Tiempo", lwd=1, type="l", pch=10)
Tabla de la Uva en sonora desde 2010 a 2019
<- read_excel("~/R/Uva_agricultura.xlsx")
Uva_agricultura
data.table(Uva_agricultura)
## Año SPI Sembrada Cosecha Produccion (ton) mercado ($/ton)
## 1: 2010 422 18954.00 18952.00 227005.8 16491.64
## 2: 2011 421 19015.00 19015.00 210038.2 20150.15
## 3: 2012 421 19970.00 18883.00 303106.1 21505.18
## 4: 2013 421 20393.00 19006.00 271580.0 19450.08
## 5: 2014 422 20096.00 18709.00 250806.9 15432.38
## 6: 2015 425 20811.00 19651.00 285232.8 16220.77
## 7: 2016 425 21144.00 20343.00 266800.9 18799.84
## 8: 2017 425 22864.11 21148.61 334355.3 18926.73
## 9: 2018 427 23540.61 22520.61 338266.7 23387.05
## 10: 2019 430 23706.50 22908.50 368187.8 26760.92
## Valor de produccion (mdp) MDIa
## 1: 3743698 26.57
## 2: 4232302 82.91
## 3: 6518350 11.92
## 4: 5282252 20.00
## 5: 3870547 44.96
## 6: 4626695 22.15
## 7: 5015815 30.49
## 8: 6328251 18.89
## 9: 7911059 55.79
## 10: 9853045 26.43
<- Uva_agricultura$Año
Año <- Uva_agricultura$`Valor de produccion (mdp)`
Valor_mdp <- Uva_agricultura$SPI
Precipitacion <- Uva_agricultura$`mercado ($/ton)`
Precio_mercado <- Uva_agricultura$MDIa
MDIa <- Uva_agricultura$`Produccion (ton)`
Produccion <- Uva_agricultura$Cosecha
Cosecha <- Uva_agricultura$Sembrada
Sembrada <- data.table(Valor_mdp, Precio_mercado, Precipitacion, MDIa, Produccion, Cosecha, Sembrada) datos
Gráfico de dispersión para la producción de uva a través del tiempo
<- ggplot(data = datos) +
x geom_point(aes(Año, Produccion)) +
geom_line(aes(Año, Produccion)) +
xlab("Años") +
ylab("Produccion (ton)") +
labs(colour="") +
ggtitle("producción de uva (Sonora)")+
scale_y_continuous(labels = comma)
ggplotly(x)
qqnorm(Produccion)
qqline(Produccion)
Gráfica de dispersión del valor del de producción de la uva a través de los años
<- ggplot(data = datos) +
x geom_line(aes(Año, Valor_mdp)) +
xlab("Año") +
ylab("Valor de la producción (mdp)") +
ggtitle("Relación entre el tiempo con el valor de producción (Sonora)")+
scale_y_continuous(labels = comma)
ggplotly(x)
qqnorm(log10(Valor_mdp), main = "Valor de la producción mdp", col = "blue")
qqline(log10(Valor_mdp))
par (mfrow = c(1,2))
hist(Uva_agricultura$`mercado ($/ton)`, breaks = 10, main = "", xlab = " Log10 (Sequia extrema)", border="blue")
qqnorm(log10(Uva_agricultura$`mercado ($/ton)`), main = "", col = "blue")
qqline(log10(Uva_agricultura$`mercado ($/ton)`))
Tabla de correlación de los 7 predictores
round( cor( x = datos, method = "pearson"), 3)
## Valor_mdp Precio_mercado Precipitacion MDIa Produccion Cosecha
## Valor_mdp 1.000 0.921 0.773 -0.178 0.911 0.863
## Precio_mercado 0.921 1.000 0.602 0.068 0.689 0.742
## Precipitacion 0.773 0.602 1.000 -0.095 0.783 0.938
## MDIa -0.178 0.068 -0.095 1.000 -0.405 0.008
## Produccion 0.911 0.689 0.783 -0.405 1.000 0.833
## Cosecha 0.863 0.742 0.938 0.008 0.833 1.000
## Sembrada 0.847 0.644 0.887 -0.154 0.921 0.948
## Sembrada
## Valor_mdp 0.847
## Precio_mercado 0.644
## Precipitacion 0.887
## MDIa -0.154
## Produccion 0.921
## Cosecha 0.948
## Sembrada 1.000
Gráfica de normalidad de nuestros predictores
multi.hist(x = datos, dcol = c("blue", "red"), dlty = c("dotted", "solid"),main = "")
Matriz de correlacion entre los 7 predictores
library(GGally)
ggpairs(datos, lower = list(continuous = "smooth"),
diag = list(continuous = "barDiag"), axisLabels = "none")
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.
Modelar nuestra regresion lineal múltiple
<- lm(Produccion ~ Valor_mdp + Precio_mercado + Precipitacion + MDIa, data = datos )
modelo
summary(modelo)
##
## Call:
## lm(formula = Produccion ~ Valor_mdp + Precio_mercado + Precipitacion +
## MDIa, data = datos)
##
## Residuals:
## 1 2 3 4 5 6 7 8 9 10
## -9059 3073 1220 1016 -9636 4228 6510 7942 2794 -8088
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 1.064e+06 8.215e+05 1.295 0.25189
## Valor_mdp 5.229e-02 7.720e-03 6.773 0.00107 **
## Precio_mercado -1.605e+01 3.436e+00 -4.671 0.00548 **
## Precipitacion -1.801e+03 1.927e+03 -0.934 0.39299
## MDIa 4.038e+01 1.968e+02 0.205 0.84554
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 8757 on 5 degrees of freedom
## Multiple R-squared: 0.9835, Adjusted R-squared: 0.9702
## F-statistic: 74.32 on 4 and 5 DF, p-value: 0.0001217
Selección de predictores para nuestra función de producción de uva
step(object = modelo, direction = "both", trace = 1)
## Start: AIC=184.62
## Produccion ~ Valor_mdp + Precio_mercado + Precipitacion + MDIa
##
## Df Sum of Sq RSS AIC
## - MDIa 1 3227934 386688857 182.71
## - Precipitacion 1 66961535 450422458 184.23
## <none> 383460923 184.62
## - Precio_mercado 1 1673416003 2056876925 199.42
## - Valor_mdp 1 3518396521 3901857443 205.82
##
## Step: AIC=182.71
## Produccion ~ Valor_mdp + Precio_mercado + Precipitacion
##
## Df Sum of Sq RSS AIC
## - Precipitacion 1 69369997 456058854 182.35
## <none> 386688857 182.71
## + MDIa 1 3227934 383460923 184.62
## - Precio_mercado 1 3184825613 3571514469 202.94
## - Valor_mdp 1 6846530915 7233219771 209.99
##
## Step: AIC=182.36
## Produccion ~ Valor_mdp + Precio_mercado
##
## Df Sum of Sq RSS AIC
## <none> 4.5606e+08 182.35
## + Precipitacion 1 6.9370e+07 3.8669e+08 182.71
## + MDIa 1 5.6364e+06 4.5042e+08 184.23
## - Precio_mercado 1 3.4739e+09 3.9299e+09 201.89
## - Valor_mdp 1 1.1716e+10 1.2172e+10 213.20
##
## Call:
## lm(formula = Produccion ~ Valor_mdp + Precio_mercado, data = datos)
##
## Coefficients:
## (Intercept) Valor_mdp Precio_mercado
## 2.990e+05 4.754e-02 -1.452e+01
Modelar con los nuevos predictores la regresión lineal múltiple
<- lm(Produccion ~ Precipitacion + MDIa, data = datos )
modelo
summary(modelo)
##
## Call:
## lm(formula = Produccion ~ Precipitacion + MDIa, data = datos)
##
## Residuals:
## Min 1Q Median 3Q Max
## -40495 -18149 -307 20206 36666
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -5015986.5 1416628.9 -3.541 0.00946 **
## Precipitacion 12569.6 3338.0 3.766 0.00702 **
## MDIa -785.6 471.0 -1.668 0.13926
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 30250 on 7 degrees of freedom
## Multiple R-squared: 0.7236, Adjusted R-squared: 0.6447
## F-statistic: 9.164 on 2 and 7 DF, p-value: 0.0111
confint(lm(formula = Produccion ~ Precipitacion + MDIa, data = datos))
## 2.5 % 97.5 %
## (Intercept) -8365781.474 -1666191.4918
## Precipitacion 4676.457 20462.6913
## MDIa -1899.243 328.1137
Conclusión
Referencias
•(2019, 11 octubre). CAUSAS Y CONSECUENCIAS MÁS COMUNES DE LA SEQUÍA. Mancomunidad de Tentudia. http://www.mancomunidaddetentudia.com/portal/causas-y-consecuencias-mas-comunes-de-la-sequia/
• Sánchez, R. (2016, 5 septiembre). El monitor de la sequía en México. Scielo. http://www.scielo.org.mx/scielo.php?script=sci_arttext&pid=S2007-24222016000500197
. (2019, 7 septiembre). Precipitación media histórica por entidad federativa. Semarnat. http://dgeiawf.semarnat.gob.mx:8080/ibi_apps/WFServlet?IBIF_ex=D3_AGUA01_01&IBIC_user=dgeia_mce&IBIC_pass=dgeia_mce&NOMBREENTIDAD=*&NOMBREANIO=*
• Penelo, L. (2020, 1 octubre). Uvas: propiedades, beneficios y valor nutricional. La Vanguardia. https://www.lavanguardia.com/comer/materia-prima/20180709/45716664292/uvas-frutas-propiedades-beneficios.html#:%7E:text=Las%20uvas%20son%20ricas%20en,%2C%20manganeso%2C%20azufre%20y%20selenio.
• Amat., J. (2016, 21 octubre). RPubs - Test exacto de Fisher, chi-cuadrado de Pearson, McNemar y Q-Cochran. RPubs. https://rpubs.com/Joaquin_AR/220579
•(2020, 24 septiembre). ¿Cuál es el suelo ideal para la vid? Características. Curso cata de vino, enoturismo y elaboración de vino https://www.cursocatadelvino.com/cual-es-el-suelo-ideal-para-la-vid-caracteristicas/
Codigo para descarga
::embed_file("Proyecto final Equipo 3.Rmd") xfun
Download Proyecto final Equipo 3.Rmd
::embed_file("Uva_agricultura.xlsx") xfun
::embed_file("SequiaSonora.xlsx") xfun
::embed_file("Uva.xlsx") xfun
::embed_file("UvaE.xlsx") xfun
::embed_file("Daños por sequias.png") xfun
Download Daños por sequias.png
::embed_file("sequía7.jpg") xfun
::embed_file("Uva de mesa.jpg") xfun
::embed_file("uva2.jpg") xfun
::embed_file("Viñedo-muerto.jpg") xfun