library(readr)
library(DT)

camarones <- read_csv("CAMARONES.csv")
## Parsed with column specification:
## cols(
##   EstanqueN = col_double(),
##   Superficie = col_double(),
##   Dias = col_double(),
##   Semana = col_double(),
##   PesoAnterior = col_double(),
##   PesoActual = col_double(),
##   TamanioAlimento = col_double(),
##   AlimentoSemana = col_double(),
##   AlimentoDiario = col_double()
## )
datatable(camarones)

# Primera evaluación de estado de la materia de Probabilidad y Estadistica

caso de estudio 1: Acuacultura

Se tienen 12 semana de datos de 12 estanques en los cuales a partir de la semana número 2 se empiezan la pesa de los cámarones en crecimiento, tambien se cuantifica su nivel de comida.

En terminos ideales los 12 estanques tendrían que llegar en la semana número 12 a 12 gramos para poder entonces realizar la “Cosecha”, peri únicamente 3 de los 12 estanques llegaron a este peso.

¿Por qué esto es un problema? Dado que se tendrá que invertir una semana o mas para poder llegar al peso ideal, y esto supone una perdida de dinero.

  1. Haga un planteamiento del problema a resolver con estadística y realice una descripción exploratoria de los datos (MMM, MD, CB)

El problema a resolver, es por qué algunos camarones crecen a las 12 semanas y otros no consiguen ese tamaño y se tiene que invertir más dinero en su encubamiento.

Mediana, Media y Moda

Calculemos la Media

mean(camarones$PesoAnterior)
## [1] 4.253091
mean(camarones$PesoActual)
## [1] 5.28803

Calculemos la mediana

median(camarones$PesoAnterior)
## [1] 4.015
median(camarones$PesoActual)
## [1] 4.73

Calculemos la moda

library(modeest)
mfv(camarones$PesoAnterior)
## [1] 0.62 1.32
mfv(camarones$PesoActual)
## [1] 0.62 1.32

Medidas de dispersión

Varianza

var(camarones$PesoActual)
## [1] 11.49019
var(camarones$PesoAnterior)
## [1] 9.215361

Desviación estandar

sd(camarones$PesoAnterior)
## [1] 3.035681
sd(camarones$PesoActual)
## [1] 3.389719

Rango intercuartil

summary(camarones$PesoAnterior)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   0.130   1.550   4.015   4.253   6.338  10.360
summary(camarones$PesoActual)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   0.600   2.163   4.730   5.288   7.955  12.260

Gráfico de Caja y Bigote

boxplot(camarones$PesoAnterior)

boxplot(camarones$PesoActual)

  1. ¿Qué tienen de diferente los estanques que sí llegaron a los 12 gramos en la semana 12 con respecto a los que no? Hubieron 3 estanques que llegaron a los 12 gramos, los estanques 1, 8 y 12. Estos están ligados con los tamaños de alimento, alimento diario y semanal. Tengamos en cuenta que, el estanque 11 y 12 tienen de superficie 6.2, y los demas tienen un tamaño de 5. Hast en la semana 5, el tamaño del alimento de los últimos 5 estanques hubo un incremento en 0.2. Después, se mantuvo estable hasta la semana 8. hubo un aumentó en los alimentos diarios y semanales, en los estanques 1, 2 y 8. En la semana 9, se encontraron varias variaciones, pero no muchas. No sobrepasaron la diferencia de 20 entre sí. En la semana 10, se encontró mucha variación en los alimentos diarios y semanales hasta el punto de tener una varianza mayor a 30. En la semana 11, la variación fue mucho mas en estos alimentos hasta una varianza de 100. Y finalmente en la semana 12, no se encontró mucha varianza, una varianza de 20. Pero solamente el estanque 1, 8 y 12 llegaron a 12 gramos. El analisis nos lleva a entender que la relevancia entre la comida se da porque hay unas variaciones de cantidades.

  2. ¿Con qué variables se relaciona el aumento de peso de los camarones? (Regresión lineal, residuos, confianza)

Regresión lineal

regresion <- lm(AlimentoSemana~PesoActual, data= camarones)
summary(regresion)
## 
## Call:
## lm(formula = AlimentoSemana ~ PesoActual, data = camarones)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -526.00  -89.86    9.59   90.77  380.46 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  285.864     24.864   11.50   <2e-16 ***
## PesoActual   139.697      3.963   35.25   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 153.7 on 130 degrees of freedom
## Multiple R-squared:  0.9053, Adjusted R-squared:  0.9046 
## F-statistic:  1243 on 1 and 130 DF,  p-value: < 2.2e-16
plot(camarones$AlimentoSemana, camarones$PesoActual, xlab= "Alimento semanal", ylab="Peso Actual")
abline(regresion)

Residuos

par(mfrow=c(1,2))
plot(regresion)

Confianza

confint(regresion)
##                2.5 %   97.5 %
## (Intercept) 236.6740 335.0544
## PesoActual  131.8572 147.5372

El intervalo de confianza es del 97.5%

  1. ¿Los camarones que iniciaron con mayor peso (semana 2) son también los que terminaron en mayor peso?, ¿Cómo varia el crecimiento?

No, no terminaron siendo los de mayor peso. El crecimiento varia dependiendo de la semana, de su alimento diario y del alimento semanal, pues en las semanas intermedias del total, el crecimiento dio un aumento.

  1. Realice un análisis de regresión logística para determinar que hace que los camarones lleguen a 12 gramos.
reg <- glm(AlimentoSemana~PesoActual, data=camarones)
summary(reg)
## 
## Call:
## glm(formula = AlimentoSemana ~ PesoActual, data = camarones)
## 
## Deviance Residuals: 
##     Min       1Q   Median       3Q      Max  
## -526.00   -89.86     9.59    90.77   380.46  
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  285.864     24.864   11.50   <2e-16 ***
## PesoActual   139.697      3.963   35.25   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## (Dispersion parameter for gaussian family taken to be 23637.97)
## 
##     Null deviance: 32447689  on 131  degrees of freedom
## Residual deviance:  3072936  on 130  degrees of freedom
## AIC: 1707.9
## 
## Number of Fisher Scoring iterations: 2
datos <- data.frame(PesoActual=seq(0,12, 0.1))
probabilidades <- predict(reg, datos, type="response")
plot(camarones$PesoActual,camarones$AlimentoSemana, pch=21, xlab="Peso Actual", ylab="Alimento Diario")
lines(datos$PesoActual, probabilidades, col="blue", lwd=2)