Primer evaluacion de estado de la materia de probabilidad y estadística para isw

Caso de estudio 1: Acuacultura

Se tienen 12 semanas de datos de 12 estanques en los cuales a partir de la semana 2 se empiezan a pesar los camarones en crecimiento, también se cuantifica su nivel de comida.

En términos ideales los 12 estanques tendrían que llegar en la semana 12 a 12 gramos para poder realizar la cosecha, pero unicamente 3 de los 12 estanques llegaros a este peso.

Por que es un problema? Dado que se tendrá que invertir una semana o mas para poder llegar al peso ideal, y esto supone una perdida de dinero.

Datos

library(readr)
library(DT)
library(pacman)
p_load("tidyverse", "gridExtra", "tdt", "modeest", "fdth")
## Installing package into 'C:/Users/Usuario/Documents/R/win-library/3.6'
## (as 'lib' is unspecified)
## Warning: package 'tdt' is not available (for R version 3.6.3)
## Warning: unable to access index for repository http://www.stats.ox.ac.uk/pub/RWin/bin/windows/contrib/3.6:
##   no fue posible abrir la URL 'http://www.stats.ox.ac.uk/pub/RWin/bin/windows/contrib/3.6/PACKAGES'
## Warning: 'BiocManager' not available.  Could not check Bioconductor.
## 
## Please use `install.packages('BiocManager')` and then retry.
## Warning in p_install(package, character.only = TRUE, ...):
## Warning in library(package, lib.loc = lib.loc, character.only = TRUE,
## logical.return = TRUE, : there is no package called 'tdt'
## Warning in p_load("tidyverse", "gridExtra", "tdt", "modeest", "fdth"): Failed to install/load:
## tdt
CAMARONES <- read_csv("CAMARONES.csv")
## Parsed with column specification:
## cols(
##   Estanque = col_character(),
##   EstanqueN = col_double(),
##   Superficie = col_double(),
##   Dias = col_double(),
##   Semana = col_double(),
##   PesoAnterior = col_double(),
##   PesoActual = col_double(),
##   TamanioAlimento = col_double(),
##   AlimentoSemana = col_double(),
##   AlimentoDiario = col_double()
## )
datatable(CAMARONES)
  • Preguntas a responder
  1. Haga un planteamiento del problema a resolver con estadística y realice una descripción exploratoria de los datos (M M M, MD, CB)

Media

median(CAMARONES$PesoActual)
## [1] 4.73
median(CAMARONES$PesoAnterior)
## [1] 4.015

Mediana

mean(CAMARONES$PesoActual)
## [1] 5.28803
mean(CAMARONES$PesoAnterior)
## [1] 4.253091

Moda

mfv(CAMARONES$PesoActual)
## [1] 0.62
mfv(CAMARONES$PesoAnterior)
## [1] 0.62

Medidas de Dispersion (Varianza, Desviacion Estandar y Grafico de Caja y Bigote) Variacion

var(CAMARONES$PesoActual)
## [1] 11.49019
var(CAMARONES$PesoAnterior)
## [1] 9.215361

Desviacion Estándar

sd(CAMARONES$PesoActual)
## [1] 3.389719
sd(CAMARONES$PesoAnterior)
## [1] 3.035681

Grafico de caja y bigote

boxplot(CAMARONES$PesoActual)

boxplot(CAMARONES$PesoAnterior)

  1. ¿Que tienen de diferentes los estanques que si llegaron a 12 gramos en la semana 12 con respecto a los que no?(Regresion lineal, residuos, confianza)

Algunos estanques pudieron llegar a los 12 gramos. Esto varía dependiendo de cada estanque ya que todos los estanques tenian un tamaño de 5 a excpecion del estanque 11 y 12 y esto causa que varia todo lo demas.

  1. Con que variables se relaciona el aumento de peso de los camarones? Regresion Lineal
regresion <- lm(AlimentoSemana~PesoActual, data = CAMARONES)
summary(regresion)
## 
## Call:
## lm(formula = AlimentoSemana ~ PesoActual, data = CAMARONES)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -526.00  -89.86    9.59   90.77  380.46 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  285.864     24.864   11.50   <2e-16 ***
## PesoActual   139.697      3.963   35.25   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 153.7 on 130 degrees of freedom
## Multiple R-squared:  0.9053, Adjusted R-squared:  0.9046 
## F-statistic:  1243 on 1 and 130 DF,  p-value: < 2.2e-16

Residuos

par(mfrow = c(1,2))
plot(regresion)

Confianza

confint(regresion)
##                2.5 %   97.5 %
## (Intercept) 236.6740 335.0544
## PesoActual  131.8572 147.5372
  1. Los camarones que iniciaron con mayor peso son también los que terminaron con mayor peso?¿Como varía el crecimiento?

No. El crecimiento variara dependiendo de su semana.

  1. Realice un analisis de regresion logística para determinar que hace que los camarones lleguen a 12 gramos.
reg <- glm(AlimentoSemana~PesoActual, data = CAMARONES)
summary(reg)
## 
## Call:
## glm(formula = AlimentoSemana ~ PesoActual, data = CAMARONES)
## 
## Deviance Residuals: 
##     Min       1Q   Median       3Q      Max  
## -526.00   -89.86     9.59    90.77   380.46  
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  285.864     24.864   11.50   <2e-16 ***
## PesoActual   139.697      3.963   35.25   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## (Dispersion parameter for gaussian family taken to be 23637.97)
## 
##     Null deviance: 32447689  on 131  degrees of freedom
## Residual deviance:  3072936  on 130  degrees of freedom
## AIC: 1707.9
## 
## Number of Fisher Scoring iterations: 2
datos <- data.frame(PesoActual=seq(0,12, 0.1))
prob <- predict(reg, datos, type="response")
plot(CAMARONES$PesoActual,CAMARONES$AlimentoSemana, pch=21, xlab="Peso Actual", ylab="Alimento Diario")
lines(datos$PesoActual, prob, col="red", lwd=2)