EVALUACION1

Andrea Felix

12/10/2020

setwd("~/PROBABILIDAD")
library(modeest)
library(fdth)
## 
## Attaching package: 'fdth'
## The following object is masked from 'package:modeest':
## 
##     mfv
## The following objects are masked from 'package:stats':
## 
##     sd, var
library(readr)
library(DT)

Primer evaluacion de estado de la materia de probabilidad y estadistica para Ing. de Software

Caso de estudio 1: Acuacultura

Se tienen 12 semanas de datos de 12 estanques en los cuales a partir de la semana numero 2, se empiezan a pesar los camarones en crecimientos, tambien se cuantifica su nivel de comida.

Datos

shrimps <- read_csv("CAMARONES.csv")
## Parsed with column specification:
## cols(
##   Estanque = col_character(),
##   EstanqueN = col_double(),
##   Superficie = col_double(),
##   Dias = col_double(),
##   Semana = col_double(),
##   PesoAnterior = col_double(),
##   PesoActual = col_double(),
##   TamanioAlimento = col_double(),
##   AlimentoSemana = col_double(),
##   AlimentoDiario = col_double()
## )

Tabla de datos

datatable(shrimps)

En terminos ideales los 12 estanques tendrian que llegar en la semana numero 12 a 12 gramos, para poder entonces realizar la “cosecha”, pero unicamente 3 de los 12 estanques llegaron a este peso.

¿Por que esto es un problema? Dado que se tendra que invertir una semana o mas para poder llegar al peso ideal, y eso supone una perdida de dinero.

  • Preguntas a responder
  1. Haga un planteamiento del problema a resolver con estadistica y realice una descripcion exploratoria de los datos (MMM, MD, CB)

Mediana

#Peso anterior
median(shrimps$PesoAnterior)
## [1] 4.015
#Peso actual
median(shrimps$PesoActual)
## [1] 4.73

Media

#Peso anterior
mean(shrimps$PesoAnterior)
## [1] 4.253091
#Peso actual
mean(shrimps$PesoActual)
## [1] 5.28803

Moda

#Peso anterior
mfv(shrimps$PesoAnterior)
## [1] 0.62
#Peso actual
mfv(shrimps$PesoActual)
## [1] 0.62

Cuantiles

#Peso anterior
summary(shrimps$PesoAnterior)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   0.130   1.550   4.015   4.253   6.338  10.360
#Peso actual
summary(shrimps$PesoActual)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   0.600   2.163   4.730   5.288   7.955  12.260

Tablas de distribucion de frecuencia

#Peso anterior
tdist <-fdt(shrimps$PesoAnterior, breaks = "Sturges")
tdist
##     Class limits  f   rf rf(%)  cf  cf(%)
##   [0.1287,1.277) 24 0.18 18.18  24  18.18
##   [1.277,2.4253) 23 0.17 17.42  47  35.61
##  [2.4253,3.5737) 13 0.10  9.85  60  45.45
##   [3.5737,4.722) 18 0.14 13.64  78  59.09
##   [4.722,5.8703) 15 0.11 11.36  93  70.45
##  [5.8703,7.0186) 13 0.10  9.85 106  80.30
##   [7.0186,8.167)  8 0.06  6.06 114  86.36
##   [8.167,9.3153)  7 0.05  5.30 121  91.67
##  [9.3153,10.464) 11 0.08  8.33 132 100.00
#Peso actual
tdisto <-fdt(shrimps$PesoActual, breaks = "Sturges")
tdisto
##     Class limits  f   rf rf(%)  cf  cf(%)
##   [0.594,1.9038) 27 0.20 20.45  27  20.45
##  [1.9038,3.2137) 17 0.13 12.88  44  33.33
##  [3.2137,4.5235) 20 0.15 15.15  64  48.48
##  [4.5235,5.8334) 16 0.12 12.12  80  60.61
##  [5.8334,7.1432) 15 0.11 11.36  95  71.97
##  [7.1432,8.4531)  9 0.07  6.82 104  78.79
##  [8.4531,9.7629)  9 0.07  6.82 113  85.61
##  [9.7629,11.073)  8 0.06  6.06 121  91.67
##  [11.073,12.383) 11 0.08  8.33 132 100.00

Graficas (poligonos) de distribucion de frecuencia

#Peso anterior (absoluto)
plot(tdist, type ="fp")

#Peso anterior (relativo)
plot(tdist, type ="rfp")

#Peso anterior (acumulado)
plot(tdist, type ="cfp")

#Peso actual (absoluto)
plot(tdisto, type ="fp")

#Peso actual (relativo)
plot(tdisto, type ="rfp")

#Peso actual (acumulado)
plot(tdisto, type ="cfp")

Graficas de caja y bigote

#Peso anterior
boxplot(shrimps$PesoAnterior)

#Peso actual
boxplot(shrimps$PesoActual)

Desviacion estandar

#Peso anterior
sd(shrimps$PesoAnterior)
## [1] 3.035681
#Peso actual
sd(shrimps$PesoActual)
## [1] 3.389719
  1. Qué tienen de diferentes los estanques que SI llegaron a 12 gramos en la semana 12 con respecto a los que no?

En el estudio que se realizo, se puede observar que hay 3 estanques los cuales si llegaron a la marca necesaria, los cuales fueron: N1, N8 y N12, las semenjanzas que se presentan dentro de los 3 estanques fueron la cantidad de alimento (diario y semanal), por lo tanto el crecimiento fue similar en los 3 estanques. Se tiene en cuenta que los estanques 11 y 12, tienen una superficie diferentes que los demas, es mas grande (6.2), los estanques restantes tienen una superficie de 5. Durantes las primeras 5 semanas, se ve un aumento en el crecimiento de 5 de los estanques, y continua siendo asi hasta la semana 8, en la cual se aumento la cantidad de alimento en algunos estanques que habian estado retrasados (1,2 y 8), despues de una semana hubo variaciones en los estanques pero no de una manera critica, ya que no tenian mucho diferencia entre si pero en la semana 10, se puede ver que la cantidad de alimento vario de manera critica y se obtuvo una varianza mucho mayor que la anterior, siendo de 30. Durante la semana 11, se vio mucho mas reflejada esta varianza, aumentando hasta 100. Pero en la semana 12, se disminuyo hasta 20, de igual manera los unicos estanques que se desalloraron de manera correcta y esperada fueron los 1,8 y 12, por lo tanto se ve que el crecimiento de los camarones se da en las semanas intermedias, por lo tanto si la cantidad de comida es mayor y constante en las semanas intermedias, se da el crecimiento de los camarones esperado.

  1. ¿Con qué variables se relaciona el aumento de peso de los camarones? (Regresion lineal, residuos, confianza)

Regresion lineal

# Peso actual
rshrimps <- lm(AlimentoSemana ~ PesoActual, data=shrimps)
summary(rshrimps)
## 
## Call:
## lm(formula = AlimentoSemana ~ PesoActual, data = shrimps)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -526.00  -89.86    9.59   90.77  380.46 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  285.864     24.864   11.50   <2e-16 ***
## PesoActual   139.697      3.963   35.25   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 153.7 on 130 degrees of freedom
## Multiple R-squared:  0.9053, Adjusted R-squared:  0.9046 
## F-statistic:  1243 on 1 and 130 DF,  p-value: < 2.2e-16
# Grafica
plot(shrimps$AlimentoSemana, shrimps$PesoActual, xlab="Alimento semanal", ylab = "Peso Actual")

abline(rshrimps)

Residuos

par(mfrow= c(1,1))
plot(rshrimps)

Confianza

confint(rshrimps)
##                2.5 %   97.5 %
## (Intercept) 236.6740 335.0544
## PesoActual  131.8572 147.5372

Se puede observar que se cuenta con el 97.5% de confianza, lo que se puede interpretar como cofiable pero sin eliminar el pequeño margen de riesgo.

  1. ¿Los camarones que iniciaron con mayor peso (semana 2) son también los que terminaron en mayor peso? ¿cómo varia el crecimiento?

Los camarones con mayor peso en este periodo no terminaron siendo los de mayor peso al final, la razon de esto se ve reflejada en el crecimiento no lineal que se puede observar en el transcurso de las semanas, dandose a comprender que el crecimiento de los camarones se da en las semanas intermedias variando en conjunto con la cantidad de alimento y los tamaños de estos.

  1. Realice un análisis de regresion logística para determinar que hace que los camarones llegen a 12 gramos.¿Qué tienen de diferentes los estanques que SI llegaron a 12 gramos en la semana 12 con respecto a los que no?
rshr <- glm(AlimentoSemana~PesoActual, data = shrimps)
summary(rshr)
## 
## Call:
## glm(formula = AlimentoSemana ~ PesoActual, data = shrimps)
## 
## Deviance Residuals: 
##     Min       1Q   Median       3Q      Max  
## -526.00   -89.86     9.59    90.77   380.46  
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  285.864     24.864   11.50   <2e-16 ***
## PesoActual   139.697      3.963   35.25   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## (Dispersion parameter for gaussian family taken to be 23637.97)
## 
##     Null deviance: 32447689  on 131  degrees of freedom
## Residual deviance:  3072936  on 130  degrees of freedom
## AIC: 1707.9
## 
## Number of Fisher Scoring iterations: 2
dat <- data.frame(PesoActual = seq(0,12,0.1))
pb <- predict(rshr, dat, type= "response")
plot(shrimps$PesoActual,shrimps$AlimentoSemana, pch=21, xlab="Peso actual", ylab="Alimento semanal")
legend("bottomleft", c("No defecto", "Si defecto"),pch =21, col=c("green","red") )
lines(dat$PesoActual, pb, col="black", lwd=2)