U1EV1

River

10/13/2020


Primer evaluación de estado de la materia de probabilidad y estdística para ingeniería de software

Caso de estudio 1: Acuacualtura

Se tienen 12 semanas de datos de 12 estanques en los cuales a partir de la semana númer 2 se empiezan la pesar los camarones en crecimiento, también se cuantifica su nivel de comida.

En términos ideales los 12 estanques tendrían que llegar en la semana número 12 a 12 gramos para poder entonces realizar la ‘cosecha’, pero únicamente 3 de los 12 estanques llegaros a este peso.

¿Por qué esto es un problema? dado que se tendrá que invertir una semana (o más) para poder llegar al peso ideal, y esto supone una pérdida de dinero

Datos

library(readr)
library(DT)
library(pacman)
p_load("tidyverse", "gridExtra", "tdt", "modeest", "fdth")
## Installing package into 'C:/Users/Rvr/Documents/R/win-library/3.6'
## (as 'lib' is unspecified)
## Warning: package 'tdt' is not available (for R version 3.6.3)
## Warning: unable to access index for repository http://www.stats.ox.ac.uk/pub/RWin/bin/windows/contrib/3.6:
##   cannot open URL 'http://www.stats.ox.ac.uk/pub/RWin/bin/windows/contrib/3.6/PACKAGES'
## Warning: 'BiocManager' not available.  Could not check Bioconductor.
## 
## Please use `install.packages('BiocManager')` and then retry.
## Warning in p_install(package, character.only = TRUE, ...):
## Warning in library(package, lib.loc = lib.loc, character.only = TRUE,
## logical.return = TRUE, : there is no package called 'tdt'
## Warning in p_load("tidyverse", "gridExtra", "tdt", "modeest", "fdth"): Failed to install/load:
## tdt
CAMARONES <- read_csv("CAMARONES.csv")
## Parsed with column specification:
## cols(
##   Estanque = col_character(),
##   EstanqueN = col_double(),
##   Superficie = col_double(),
##   Dias = col_double(),
##   Semana = col_double(),
##   PesoAnterior = col_double(),
##   PesoActual = col_double(),
##   TamanioAlimento = col_double(),
##   AlimentoSemana = col_double(),
##   AlimentoDiario = col_double()
## )
datatable(CAMARONES)

1.- Haga un planteamiento del problema a resolver con estadística y realice una descripción exploratoria de los datos (MMM, MD, CB)

Mediana, Media y Moda

Mediana

median(CAMARONES$PesoActual)
## [1] 4.73
median(CAMARONES$PesoAnterior)
## [1] 4.015

Media

mean(CAMARONES$PesoActual)
## [1] 5.28803
mean(CAMARONES$PesoAnterior)
## [1] 4.253091

Moda

mfv(CAMARONES$PesoActual)
## [1] 0.62
mfv(CAMARONES$PesoAnterior)
## [1] 0.62

Medidas de Dispersion (Varianza, Desviacion Estandar y Grafico de Caja y Bigote)

Variacion

var(CAMARONES$PesoActual)
## [1] 11.49019
var(CAMARONES$PesoAnterior)
## [1] 9.215361

Desviacion Estandar

sd(CAMARONES$PesoActual)
## [1] 3.389719
sd(CAMARONES$PesoAnterior)
## [1] 3.035681

Grafico de Caja y Bigote

boxplot(CAMARONES$PesoActual)

boxplot(CAMARONES$PesoAnterior)

2.- ¿Que tienen de diferentes los estanques que SI llegaron a 12 gramos en la semana 12 con respecto a los que no?

  • Ciertos estanques pudieron llegar a los 12 gramos para ser precisos solo 3. Esto iba a variar dependiendo de cada estanque ya que todos los estanques tenian un tamaño de 5 a excpecion del estanque 11 y 12 y esto causa que varia todo lo demas.

3.- ¿Con qué variables se relaciona el aumento de peso de los camarones? (regresión lineal, residuos, confianza)

Regresion Lineal

regresion <- lm(AlimentoSemana~PesoActual, data = CAMARONES)
summary(regresion)
## 
## Call:
## lm(formula = AlimentoSemana ~ PesoActual, data = CAMARONES)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -526.00  -89.86    9.59   90.77  380.46 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  285.864     24.864   11.50   <2e-16 ***
## PesoActual   139.697      3.963   35.25   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 153.7 on 130 degrees of freedom
## Multiple R-squared:  0.9053, Adjusted R-squared:  0.9046 
## F-statistic:  1243 on 1 and 130 DF,  p-value: < 2.2e-16

Residuos

par(mfrow = c(1,2))
plot(regresion)

Confianza

confint(regresion)
##                2.5 %   97.5 %
## (Intercept) 236.6740 335.0544
## PesoActual  131.8572 147.5372

4.- ¿Los camarones que iniciaron con mayor peso ( semana 2) son también los que terminaron en mayor peso? ¿Cómo varía el crecimiento?

  • No, el crecimiento variara dependiendo de su semana.

5.- Realice un análisis de regresión logística para determinar que hace que los camarones llegen a 12 gramos.

reg <- glm(AlimentoSemana~PesoActual, data = CAMARONES)
summary(reg)
## 
## Call:
## glm(formula = AlimentoSemana ~ PesoActual, data = CAMARONES)
## 
## Deviance Residuals: 
##     Min       1Q   Median       3Q      Max  
## -526.00   -89.86     9.59    90.77   380.46  
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  285.864     24.864   11.50   <2e-16 ***
## PesoActual   139.697      3.963   35.25   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## (Dispersion parameter for gaussian family taken to be 23637.97)
## 
##     Null deviance: 32447689  on 131  degrees of freedom
## Residual deviance:  3072936  on 130  degrees of freedom
## AIC: 1707.9
## 
## Number of Fisher Scoring iterations: 2
datos <- data.frame(PesoActual=seq(0,12, 0.1))
prob <- predict(reg, datos, type="response")
plot(CAMARONES$PesoActual,CAMARONES$AlimentoSemana, pch=21, xlab="Peso Actual", ylab="Alimento Diario")
lines(datos$PesoActual, prob, col="pink", lwd=2)