- SEGUNDO CASO DE ESTUDIO: ANÁLISIS DE PRODUCTIVIDAD EN ACUACULTURA “CASO GRANJAS DE CAMARÓN”
- Acerca de este archivo.
- Importación de datos
- Gráfico semanal de peso actual por estanque
- Gráfico semanal de incremento de peso por estanque
- Gráfico de dispersión
- Análisis de normalidad
- Representación gráfica de éxitos vs fracasos
- Modelo generalizado de regresión
- Si tenemos 12 estanques con dimensiones similares, ¿por qué en la semana número 12 no todos los estanques tienen camarones que pesan 12 gramos?
SEGUNDO CASO DE ESTUDIO: ANÁLISIS DE PRODUCTIVIDAD EN ACUACULTURA “CASO GRANJAS DE CAMARÓN”
México ocupa el 15º lugar global en producción de recursos acuícolas y pesqueros (SOFIA 2020).Por sus recursos humanos y naturales, Sonora tiene un enorme potencial pesquero y acuícola.La actividad acuícola ha sido muy relevante en años recientes. Luego del desplome del cultivo de camarón, la producción se recuperó y va en aumento a partir de 2014. En este caso de estudio estamos viendo los datos reales directamente de una granja acuícola. - [R] (https://www.cedo.org/read/cedo-es/importancia-pesca-acuicultura-sonora/)
Acerca de este archivo.
- Esta asignación consiste en analizar los datos, contestar preguntas y hacer recomiendaciones, con el uso de la regresión logística.
setwd("~/Estadistica")
library(readxl)
library(tidyverse)## -- Attaching packages --------------------------------------- tidyverse 1.3.0 --
## v ggplot2 3.3.3 v purrr 0.3.4
## v tibble 3.0.5 v dplyr 1.0.4
## v tidyr 1.1.2 v stringr 1.4.0
## v readr 1.4.0 v forcats 0.5.1
## -- Conflicts ------------------------------------------ tidyverse_conflicts() --
## x dplyr::filter() masks stats::filter()
## x dplyr::lag() masks stats::lag()
library(prettydoc)
library(readr)
library(DT)
library(pacman)
p_load("base64enc","htmltools","mime","xfun","prettydoc","readr","knitr","DT","dplyr","ggplot2","plotly","gganimate","gifski","scales")Importación de datos
CAMARONES <- read.csv("~/Estadistica/CAMARONES.csv")
View(CAMARONES)Gráfico semanal de peso actual por estanque
ggplot(data = CAMARONES) +
geom_point(mapping = aes(x = Semana, y = PesoActual, color = Estanque)) ## Incremento
Incremento <- (CAMARONES$PesoActual - CAMARONES$PesoAnterior)Gráfico semanal de incremento de peso por estanque
ggplot(data = CAMARONES) +
geom_point(mapping = aes(x = Semana, y = Incremento, color = Estanque)) ## Matriz de correlación
Semana <- CAMARONES$Semana
PesoAnterior <- CAMARONES$PesoAnterior
PesoActual <- CAMARONES$PesoActual
AlimentoSemana <- CAMARONES$AlimentoSemana
datos <- data.frame(Semana, PesoAnterior, PesoActual, AlimentoSemana, Incremento)
pairs(datos)cor(datos)## Semana PesoAnterior PesoActual AlimentoSemana Incremento
## Semana 1.0000000 0.9832002 0.9817825 0.9441085 0.6282754
## PesoAnterior 0.9832002 1.0000000 0.9915841 0.9510608 0.5957456
## PesoActual 0.9817825 0.9915841 1.0000000 0.9514703 0.6947139
## AlimentoSemana 0.9441085 0.9510608 0.9514703 1.0000000 0.6187860
## Incremento 0.6282754 0.5957456 0.6947139 0.6187860 1.0000000
Gráfico de dispersión
ggplot(data = CAMARONES, aes(x = AlimentoSemana, y = PesoActual)) +
geom_point(colour = "red4") +
ggtitle("Diagrama de dispersión") +
theme_bw() +
theme(plot.title = element_text(hjust = 0.5))Análisis de normalidad
Representación gráfica
par(mfrow = c(1, 2))
hist(AlimentoSemana, breaks = 10, main = "", xlab = "Alimento Semanal", border = "green")
hist(PesoActual, breaks = 10, main = "", xlab = "Peso Actual",
border = "red") ### Análisis de cuantiles
qqnorm(AlimentoSemana, main = "Alimento Semanal", col = "darkred")
qqline(AlimentoSemana)qqnorm(PesoActual, main = "Peso Actual", col = "red")
qqline(PesoActual)camarones1 <- read_excel("camarones1.xlsx")
View(camarones1)hist(camarones1$AlimentoDiario)table(camarones1$Exito)##
## 0 1
## 9 3
Representación gráfica de éxitos vs fracasos
colores <- NULL
colores[camarones1$Exito==0] <-"blue"
colores[camarones1$Exito==1] <-"pink"
plot(camarones1$AlimentoDiario, camarones1$Exito, pch=21, bg=colores, xlab="Alimento", ylab="Pesos ideales")
legend ("bottomleft", c("Peso no ideal", "peso ideal"), pch=21, col = c("blue","pink"))Modelo generalizado de regresión
- Es un método de regresión que permite estimar la probabilidad de una variable cualitativa binaria en función de una variable cuantitativa. Una de las principales aplicaciones de la regresión logística es la de clasificación binaria, en el que las observaciones se clasifican en un grupo u otro dependiendo del valor que tome la variable empleada como predictor.
reg <- glm (Exito ~ AlimentoDiario, family=binomial, data= camarones1)
summary(reg)##
## Call:
## glm(formula = Exito ~ AlimentoDiario, family = binomial, data = camarones1)
##
## Deviance Residuals:
## Min 1Q Median 3Q Max
## -1.28965 -0.68424 -0.39705 -0.00008 2.00729
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) -35.1229 25.8776 -1.357 0.175
## AlimentoDiario 0.1194 0.0901 1.325 0.185
##
## (Dispersion parameter for binomial family taken to be 1)
##
## Null deviance: 13.496 on 11 degrees of freedom
## Residual deviance: 11.311 on 10 degrees of freedom
## AIC: 15.311
##
## Number of Fisher Scoring iterations: 5
datos <- data.frame(AlimentoDiario = seq(270, 300, 0.1))
probabilidades <- predict(reg, datos, type = 'response')
plot(camarones1$AlimentoDiario,camarones1$Exito, pch = 21, bg = colores, xlab = "Alimento", ylab = "Pesos ideales")
legend('topleft', c("Peso no ideal", "peso ideal"), pch = 21, col = c('green', 'blue'))
lines(datos$AlimentoDiario, probabilidades, col = 'red', lwd = 2)