U1A7

EQUIPO 6: Angélica Payán Serna, Karen Gutierrez Velásquez y Andrea Higuera Chavez

18/02/2021

SEGUNDO CASO DE ESTUDIO: ANÁLISIS DE PRODUCTIVIDAD EN ACUACULTURA “CASO GRANJAS DE CAMARÓN”

México ocupa el 15º lugar global en producción de recursos acuícolas y pesqueros (SOFIA 2020).Por sus recursos humanos y naturales, Sonora tiene un enorme potencial pesquero y acuícola.La actividad acuícola ha sido muy relevante en años recientes. Luego del desplome del cultivo de camarón, la producción se recuperó y va en aumento a partir de 2014. En este caso de estudio estamos viendo los datos reales directamente de una granja acuícola. - [R] (https://www.cedo.org/read/cedo-es/importancia-pesca-acuicultura-sonora/)

Acerca de este archivo.

  • Esta asignación consiste en analizar los datos, contestar preguntas y hacer recomiendaciones, con el uso de la regresión logística.
setwd("~/Estadistica")
library(readxl)
library(tidyverse)
## -- Attaching packages --------------------------------------- tidyverse 1.3.0 --
## v ggplot2 3.3.3     v purrr   0.3.4
## v tibble  3.0.5     v dplyr   1.0.4
## v tidyr   1.1.2     v stringr 1.4.0
## v readr   1.4.0     v forcats 0.5.1
## -- Conflicts ------------------------------------------ tidyverse_conflicts() --
## x dplyr::filter() masks stats::filter()
## x dplyr::lag()    masks stats::lag()
library(prettydoc)
library(readr)
library(DT)
library(pacman)
p_load("base64enc","htmltools","mime","xfun","prettydoc","readr","knitr","DT","dplyr","ggplot2","plotly","gganimate","gifski","scales")

Importación de datos

CAMARONES <- read.csv("~/Estadistica/CAMARONES.csv")
View(CAMARONES)

Gráfico semanal de peso actual por estanque

ggplot(data = CAMARONES) +
  geom_point(mapping = aes(x = Semana, y = PesoActual, color = Estanque))

## Incremento

Incremento <- (CAMARONES$PesoActual - CAMARONES$PesoAnterior)

Gráfico semanal de incremento de peso por estanque

ggplot(data = CAMARONES) +
  geom_point(mapping = aes(x = Semana, y = Incremento, color = Estanque))

## Matriz de correlación

Semana <- CAMARONES$Semana
PesoAnterior <- CAMARONES$PesoAnterior 
PesoActual <- CAMARONES$PesoActual
AlimentoSemana <- CAMARONES$AlimentoSemana
datos <- data.frame(Semana, PesoAnterior, PesoActual, AlimentoSemana, Incremento)
pairs(datos)

cor(datos)
##                   Semana PesoAnterior PesoActual AlimentoSemana Incremento
## Semana         1.0000000    0.9832002  0.9817825      0.9441085  0.6282754
## PesoAnterior   0.9832002    1.0000000  0.9915841      0.9510608  0.5957456
## PesoActual     0.9817825    0.9915841  1.0000000      0.9514703  0.6947139
## AlimentoSemana 0.9441085    0.9510608  0.9514703      1.0000000  0.6187860
## Incremento     0.6282754    0.5957456  0.6947139      0.6187860  1.0000000

Gráfico de dispersión

ggplot(data = CAMARONES, aes(x = AlimentoSemana, y = PesoActual)) + 
  geom_point(colour = "red4") +
  ggtitle("Diagrama de dispersión") +
  theme_bw() +
  theme(plot.title = element_text(hjust = 0.5))

Análisis de normalidad

Representación gráfica

par(mfrow = c(1, 2))
hist(AlimentoSemana, breaks = 10, main = "", xlab = "Alimento Semanal", border = "green")
hist(PesoActual, breaks = 10, main = "", xlab = "Peso Actual",
     border = "red")

### Análisis de cuantiles

qqnorm(AlimentoSemana, main = "Alimento Semanal", col = "darkred")
qqline(AlimentoSemana)

qqnorm(PesoActual, main = "Peso Actual", col = "red")
qqline(PesoActual)

camarones1 <- read_excel("camarones1.xlsx")
View(camarones1)
hist(camarones1$AlimentoDiario)

table(camarones1$Exito)
## 
## 0 1 
## 9 3

Representación gráfica de éxitos vs fracasos

colores <- NULL
colores[camarones1$Exito==0] <-"blue"
colores[camarones1$Exito==1] <-"pink"
plot(camarones1$AlimentoDiario, camarones1$Exito, pch=21, bg=colores, xlab="Alimento", ylab="Pesos ideales")
legend ("bottomleft", c("Peso no ideal", "peso ideal"), pch=21, col = c("blue","pink"))

Modelo generalizado de regresión

  • Es un método de regresión que permite estimar la probabilidad de una variable cualitativa binaria en función de una variable cuantitativa. Una de las principales aplicaciones de la regresión logística es la de clasificación binaria, en el que las observaciones se clasifican en un grupo u otro dependiendo del valor que tome la variable empleada como predictor.
reg <- glm (Exito ~ AlimentoDiario, family=binomial, data= camarones1) 
summary(reg)
## 
## Call:
## glm(formula = Exito ~ AlimentoDiario, family = binomial, data = camarones1)
## 
## Deviance Residuals: 
##      Min        1Q    Median        3Q       Max  
## -1.28965  -0.68424  -0.39705  -0.00008   2.00729  
## 
## Coefficients:
##                Estimate Std. Error z value Pr(>|z|)
## (Intercept)    -35.1229    25.8776  -1.357    0.175
## AlimentoDiario   0.1194     0.0901   1.325    0.185
## 
## (Dispersion parameter for binomial family taken to be 1)
## 
##     Null deviance: 13.496  on 11  degrees of freedom
## Residual deviance: 11.311  on 10  degrees of freedom
## AIC: 15.311
## 
## Number of Fisher Scoring iterations: 5
datos <- data.frame(AlimentoDiario = seq(270, 300, 0.1))
probabilidades <- predict(reg, datos, type = 'response')
plot(camarones1$AlimentoDiario,camarones1$Exito, pch = 21, bg = colores, xlab = "Alimento", ylab = "Pesos ideales")
legend('topleft', c("Peso no ideal", "peso ideal"), pch = 21, col = c('green', 'blue'))
lines(datos$AlimentoDiario, probabilidades, col = 'red', lwd = 2)

Si tenemos 12 estanques con dimensiones similares, ¿por qué en la semana número 12 no todos los estanques tienen camarones que pesan 12 gramos?