Evaluacion1

Nicole Urias

16/10/2020

Primer evaluación de estado de la materia de probabilidad y estadística para ingenierías

Caso de estudio 1: Acuacualtura

Se tienen 12 semanas de datos de 12 estanques en los cuales a partir de la semana númer 2 se empiezan la pesar los camarones en crecimiento, también se cuantifica su nivel de comida.

En términos ideales los 12 estanques tendrían que llegar en la semana número 12 a 12 gramos para poder entonces realizar la ‘cosecha’, pero únicamente 3 de los 12 estanques llegaros a este peso.

¿Por qué esto es un problema? dado que se tendrá que invertir una semana (o más) para poder llegar al peso ideal, y esto supone una pérdida de dinero

  • Preguntas a responder

Haga un planteamiento del problema a resolver con estadística y realice una descripción exploratoria de los datos (MMM, MD, CB)

Datos

library(prettydoc)
library(readr)
library(DT)
CAMARONES <- read_csv("CAMARONES.csv")
## Parsed with column specification:
## cols(
##   Estanque = col_character(),
##   EstanqueN = col_double(),
##   Superficie = col_double(),
##   Dias = col_double(),
##   Semana = col_double(),
##   PesoAnterior = col_double(),
##   PesoActual = col_double(),
##   TamanioAlimento = col_double(),
##   AlimentoSemana = col_double(),
##   AlimentoDiario = col_double()
## )
datatable(CAMARONES)

semana 12

library(readr)
library(DT)
CAMARONES2 <- read_csv("CAMARONES2.csv")
## Parsed with column specification:
## cols(
##   Estanque = col_character(),
##   EstanqueN = col_double(),
##   Superficie = col_double(),
##   Dias = col_double(),
##   Semana = col_double(),
##   PesoAnterior = col_double(),
##   PesoActual = col_double(),
##   TamanioAlimento = col_double(),
##   AlimentoSemana = col_double(),
##   AlimentoDiario = col_double()
## )
datatable(CAMARONES2)

## Tabla de distribucion de frecuencia

library(fdth)
## 
## Attaching package: 'fdth'
## The following objects are masked from 'package:stats':
## 
##     sd, var
alimentocamarones <- CAMARONES2$AlimentoDiario
distribucion <- fdt(alimentocamarones, breaks="Sturges")
distribucion
##       Class limits f   rf rf(%) cf  cf(%)
##   [268.714,274.85) 3 0.25 25.00  3  25.00
##   [274.85,280.986) 2 0.17 16.67  5  41.67
##  [280.986,287.121) 3 0.25 25.00  8  66.67
##  [287.121,293.257) 2 0.17 16.67 10  83.33
##  [293.257,299.393) 2 0.17 16.67 12 100.00

graficas de frecuencia

# 1er histograma
hist(alimentocamarones,breaks="sturges",col='red')

sort(alimentocamarones)
##  [1] 271.4286 271.4286 271.4286 275.0000 278.5714 282.1429 282.1429 285.7143
##  [9] 289.2857 292.8571 296.4286 296.4286

medidas de frecuencia central

media

mean(alimentocamarones)
## [1] 282.7381

mediana

median(alimentocamarones)
## [1] 282.1429

moda

mfv(alimentocamarones)
## [1] 271.4286

varianza

var(alimentocamarones)
## [1] 90.05875

desviacion estandar

sd(alimentocamarones)
## [1] 9.489929

grafico de caja y bigote

boxplot(alimentocamarones, col="blue")

library(ggplot2)
ggplot(data = CAMARONES2)+geom_point(mapping = aes(x=AlimentoDiario, y=PesoActual),col='blue',lwd=4)

¿Que tienen de diferentes los estanques que SI llegaron a 12 gramos en la semana 12 con respecto a los que no?

Se puedo observa que todos los estanques recibian todo por igual (alimento, las condiciones del estanque, pero se observa que eso no es lo importante en este caso para que los camarones se desarrollen al mimso tiempo en todos los estanques ya que depende de muchos factores diferentes a la cantidad de comida).

##- ¿Con qué variables se relaciona el aumento de peso de los camarones? (regresión lineal, residuos, confianza)

regresion lineal

modelorecta <- lm(AlimentoDiario ~ PesoActual, data = CAMARONES2)
summary(modelorecta)
## 
## Call:
## lm(formula = AlimentoDiario ~ PesoActual, data = CAMARONES2)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -11.735  -8.101   0.297   6.549  15.283 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)  
## (Intercept)  218.029     69.231   3.149   0.0103 *
## PesoActual     5.605      5.992   0.935   0.3716  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 9.544 on 10 degrees of freedom
## Multiple R-squared:  0.08046,    Adjusted R-squared:  -0.01149 
## F-statistic: 0.875 on 1 and 10 DF,  p-value: 0.3716

ecuacion de la recta

\[=208+5.605X\] # intervalo de confienza

confint(modelorecta)
##                 2.5 %    97.5 %
## (Intercept) 63.772654 372.28469
## PesoActual  -7.746283  18.95704

prueba de Shapiro Wilk

shapiro.test(modelorecta$residuals)
## 
##  Shapiro-Wilk normality test
## 
## data:  modelorecta$residuals
## W = 0.92389, p-value = 0.3198

matriz correlativa

Alimentodiario <- CAMARONES2$AlimentoDiario
Pesoactual <- CAMARONES2$PesoActual 
pairs(data.frame(Alimentodiario,Pesoactual),col='green',lwd=2, main= 'Matriz de correlaciones')

##- ¿Los camarones que iniciaron con mayor peso ( semana 2) son también los que terminaron en mayor peso? ¿Cómo varía el crecimiento?

no. se oberva que en los estanques 6 y 7 empezaron con pesos mayores pero al final ninguno logro el peso deseado en comparaciones a los otros.

##- Realice un análisis de regresión logística para determinar que hace que los camarones llegen a 12 gramos.

modelorectag <- lm(AlimentoDiario ~ PesoActual, data = CAMARONES)
summary(modelorectag)
## 
## Call:
## lm(formula = AlimentoDiario ~ PesoActual, data = CAMARONES)
## 
## Residuals:
##    Min     1Q Median     3Q    Max 
## -75.14 -12.84   1.37  12.97  54.35 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  40.8377     3.5520   11.50   <2e-16 ***
## PesoActual   19.9567     0.5661   35.25   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 21.96 on 130 degrees of freedom
## Multiple R-squared:  0.9053, Adjusted R-squared:  0.9046 
## F-statistic:  1243 on 1 and 130 DF,  p-value: < 2.2e-16
plot(CAMARONES$AlimentoDiario,CAMARONES$PesoActual, xlab = "Alimento diario", ylab = "Peso actual", col='green', lwd=1)

abline(modelorectag)