Primer evaluación de estado de la materia de probabilidad y estadística para ingenierías
Caso de estudio 1: Acuacualtura
Se tienen 12 semanas de datos de 12 estanques en los cuales a partir de la semana númer 2 se empiezan la pesar los camarones en crecimiento, también se cuantifica su nivel de comida.
En términos ideales los 12 estanques tendrían que llegar en la semana número 12 a 12 gramos para poder entonces realizar la ‘cosecha’, pero únicamente 3 de los 12 estanques llegaros a este peso.
¿Por qué esto es un problema? dado que se tendrá que invertir una semana (o más) para poder llegar al peso ideal, y esto supone una pérdida de dinero
- Preguntas a responder
Haga un planteamiento del problema a resolver con estadística y realice una descripción exploratoria de los datos (MMM, MD, CB)
Datos
## Parsed with column specification:
## cols(
## Estanque = col_character(),
## EstanqueN = col_double(),
## Superficie = col_double(),
## Dias = col_double(),
## Semana = col_double(),
## PesoAnterior = col_double(),
## PesoActual = col_double(),
## TamanioAlimento = col_double(),
## AlimentoSemana = col_double(),
## AlimentoDiario = col_double()
## )
semana 12
## Parsed with column specification:
## cols(
## Estanque = col_character(),
## EstanqueN = col_double(),
## Superficie = col_double(),
## Dias = col_double(),
## Semana = col_double(),
## PesoAnterior = col_double(),
## PesoActual = col_double(),
## TamanioAlimento = col_double(),
## AlimentoSemana = col_double(),
## AlimentoDiario = col_double()
## )
## Tabla de distribucion de frecuencia
##
## Attaching package: 'fdth'
## The following objects are masked from 'package:stats':
##
## sd, var
alimentocamarones <- CAMARONES2$AlimentoDiario
distribucion <- fdt(alimentocamarones, breaks="Sturges")
distribucion## Class limits f rf rf(%) cf cf(%)
## [268.714,274.85) 3 0.25 25.00 3 25.00
## [274.85,280.986) 2 0.17 16.67 5 41.67
## [280.986,287.121) 3 0.25 25.00 8 66.67
## [287.121,293.257) 2 0.17 16.67 10 83.33
## [293.257,299.393) 2 0.17 16.67 12 100.00
graficas de frecuencia
## [1] 271.4286 271.4286 271.4286 275.0000 278.5714 282.1429 282.1429 285.7143
## [9] 289.2857 292.8571 296.4286 296.4286
medidas de frecuencia central
grafico de caja y bigote
library(ggplot2)
ggplot(data = CAMARONES2)+geom_point(mapping = aes(x=AlimentoDiario, y=PesoActual),col='blue',lwd=4)¿Que tienen de diferentes los estanques que SI llegaron a 12 gramos en la semana 12 con respecto a los que no?
Se puedo observa que todos los estanques recibian todo por igual (alimento, las condiciones del estanque, pero se observa que eso no es lo importante en este caso para que los camarones se desarrollen al mimso tiempo en todos los estanques ya que depende de muchos factores diferentes a la cantidad de comida).
##- ¿Con qué variables se relaciona el aumento de peso de los camarones? (regresión lineal, residuos, confianza)
regresion lineal
##
## Call:
## lm(formula = AlimentoDiario ~ PesoActual, data = CAMARONES2)
##
## Residuals:
## Min 1Q Median 3Q Max
## -11.735 -8.101 0.297 6.549 15.283
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 218.029 69.231 3.149 0.0103 *
## PesoActual 5.605 5.992 0.935 0.3716
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 9.544 on 10 degrees of freedom
## Multiple R-squared: 0.08046, Adjusted R-squared: -0.01149
## F-statistic: 0.875 on 1 and 10 DF, p-value: 0.3716
ecuacion de la recta
\[=208+5.605X\] # intervalo de confienza
## 2.5 % 97.5 %
## (Intercept) 63.772654 372.28469
## PesoActual -7.746283 18.95704
prueba de Shapiro Wilk
##
## Shapiro-Wilk normality test
##
## data: modelorecta$residuals
## W = 0.92389, p-value = 0.3198
matriz correlativa
Alimentodiario <- CAMARONES2$AlimentoDiario
Pesoactual <- CAMARONES2$PesoActual
pairs(data.frame(Alimentodiario,Pesoactual),col='green',lwd=2, main= 'Matriz de correlaciones')##- ¿Los camarones que iniciaron con mayor peso ( semana 2) son también los que terminaron en mayor peso? ¿Cómo varía el crecimiento?
no. se oberva que en los estanques 6 y 7 empezaron con pesos mayores pero al final ninguno logro el peso deseado en comparaciones a los otros.
##- Realice un análisis de regresión logística para determinar que hace que los camarones llegen a 12 gramos.
##
## Call:
## lm(formula = AlimentoDiario ~ PesoActual, data = CAMARONES)
##
## Residuals:
## Min 1Q Median 3Q Max
## -75.14 -12.84 1.37 12.97 54.35
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 40.8377 3.5520 11.50 <2e-16 ***
## PesoActual 19.9567 0.5661 35.25 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 21.96 on 130 degrees of freedom
## Multiple R-squared: 0.9053, Adjusted R-squared: 0.9046
## F-statistic: 1243 on 1 and 130 DF, p-value: < 2.2e-16
plot(CAMARONES$AlimentoDiario,CAMARONES$PesoActual, xlab = "Alimento diario", ylab = "Peso actual", col='green', lwd=1)
abline(modelorectag)