- Primer evaluacion de estado de la materia de probabilidad y estadistica para Ing. de Software
- Caso de estudio 1: Acuacultura
- Datos
- Tabla de datos
- Mediana
- Media
- Moda
- Cuantiles
- Tablas de distribucion de frecuencia
- Graficas (poligonos) de distribucion de frecuencia
- Graficas de caja y bigote
- Desviacion estandar
- Regresion lineal
- Residuos
- Confianza
##
## Attaching package: 'fdth'
## The following object is masked from 'package:modeest':
##
## mfv
## The following objects are masked from 'package:stats':
##
## sd, var
Primer evaluacion de estado de la materia de probabilidad y estadistica para Ing. de Software
Caso de estudio 1: Acuacultura
Se tienen 12 semanas de datos de 12 estanques en los cuales a partir de la semana numero 2, se empiezan a pesar los camarones en crecimientos, tambien se cuantifica su nivel de comida.
Datos
## Parsed with column specification:
## cols(
## Estanque = col_character(),
## EstanqueN = col_double(),
## Superficie = col_double(),
## Dias = col_double(),
## Semana = col_double(),
## PesoAnterior = col_double(),
## PesoActual = col_double(),
## TamanioAlimento = col_double(),
## AlimentoSemana = col_double(),
## AlimentoDiario = col_double()
## )
Tabla de datos
En terminos ideales los 12 estanques tendrian que llegar en la semana numero 12 a 12 gramos, para poder entonces realizar la “cosecha”, pero unicamente 3 de los 12 estanques llegaron a este peso.
¿Por que esto es un problema? Dado que se tendra que invertir una semana o mas para poder llegar al peso ideal, y eso supone una perdida de dinero.
- Preguntas a responder
- Haga un planteamiento del problema a resolver con estadistica y realice una descripcion exploratoria de los datos (MMM, MD, CB)
Mediana
## [1] 4.015
## [1] 4.73
Media
## [1] 4.253091
## [1] 5.28803
Moda
## [1] 0.62
## [1] 0.62
Cuantiles
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.130 1.550 4.015 4.253 6.338 10.360
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.600 2.163 4.730 5.288 7.955 12.260
Tablas de distribucion de frecuencia
## Class limits f rf rf(%) cf cf(%)
## [0.1287,1.277) 24 0.18 18.18 24 18.18
## [1.277,2.4253) 23 0.17 17.42 47 35.61
## [2.4253,3.5737) 13 0.10 9.85 60 45.45
## [3.5737,4.722) 18 0.14 13.64 78 59.09
## [4.722,5.8703) 15 0.11 11.36 93 70.45
## [5.8703,7.0186) 13 0.10 9.85 106 80.30
## [7.0186,8.167) 8 0.06 6.06 114 86.36
## [8.167,9.3153) 7 0.05 5.30 121 91.67
## [9.3153,10.464) 11 0.08 8.33 132 100.00
## Class limits f rf rf(%) cf cf(%)
## [0.594,1.9038) 27 0.20 20.45 27 20.45
## [1.9038,3.2137) 17 0.13 12.88 44 33.33
## [3.2137,4.5235) 20 0.15 15.15 64 48.48
## [4.5235,5.8334) 16 0.12 12.12 80 60.61
## [5.8334,7.1432) 15 0.11 11.36 95 71.97
## [7.1432,8.4531) 9 0.07 6.82 104 78.79
## [8.4531,9.7629) 9 0.07 6.82 113 85.61
## [9.7629,11.073) 8 0.06 6.06 121 91.67
## [11.073,12.383) 11 0.08 8.33 132 100.00
Graficas (poligonos) de distribucion de frecuencia
Graficas de caja y bigote
Desviacion estandar
## [1] 3.035681
## [1] 3.389719
- Qué tienen de diferentes los estanques que SI llegaron a 12 gramos en la semana 12 con respecto a los que no?
En el estudio que se realizo, se puede observar que hay 3 estanques los cuales si llegaron a la marca necesaria, los cuales fueron: N1, N8 y N12, las semenjanzas que se presentan dentro de los 3 estanques fueron la cantidad de alimento (diario y semanal), por lo tanto el crecimiento fue similar en los 3 estanques. Se tiene en cuenta que los estanques 11 y 12, tienen una superficie diferentes que los demas, es mas grande (6.2), los estanques restantes tienen una superficie de 5. Durantes las primeras 5 semanas, se ve un aumento en el crecimiento de 5 de los estanques, y continua siendo asi hasta la semana 8, en la cual se aumento la cantidad de alimento en algunos estanques que habian estado retrasados (1,2 y 8), despues de una semana hubo variaciones en los estanques pero no de una manera critica, ya que no tenian mucho diferencia entre si pero en la semana 10, se puede ver que la cantidad de alimento vario de manera critica y se obtuvo una varianza mucho mayor que la anterior, siendo de 30. Durante la semana 11, se vio mucho mas reflejada esta varianza, aumentando hasta 100. Pero en la semana 12, se disminuyo hasta 20, de igual manera los unicos estanques que se desalloraron de manera correcta y esperada fueron los 1,8 y 12, por lo tanto se ve que el crecimiento de los camarones se da en las semanas intermedias, por lo tanto si la cantidad de comida es mayor y constante en las semanas intermedias, se da el crecimiento de los camarones esperado.
- ¿Con qué variables se relaciona el aumento de peso de los camarones? (Regresion lineal, residuos, confianza)
Regresion lineal
##
## Call:
## lm(formula = AlimentoSemana ~ PesoActual, data = shrimps)
##
## Residuals:
## Min 1Q Median 3Q Max
## -526.00 -89.86 9.59 90.77 380.46
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 285.864 24.864 11.50 <2e-16 ***
## PesoActual 139.697 3.963 35.25 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 153.7 on 130 degrees of freedom
## Multiple R-squared: 0.9053, Adjusted R-squared: 0.9046
## F-statistic: 1243 on 1 and 130 DF, p-value: < 2.2e-16
# Grafica
plot(shrimps$AlimentoSemana, shrimps$PesoActual, xlab="Alimento semanal", ylab = "Peso Actual")
abline(rshrimps)Confianza
## 2.5 % 97.5 %
## (Intercept) 236.6740 335.0544
## PesoActual 131.8572 147.5372
Se puede observar que se cuenta con el 97.5% de confianza, lo que se puede interpretar como cofiable pero sin eliminar el pequeño margen de riesgo.
- ¿Los camarones que iniciaron con mayor peso (semana 2) son también los que terminaron en mayor peso? ¿cómo varia el crecimiento?
Los camarones con mayor peso en este periodo no terminaron siendo los de mayor peso al final, la razon de esto se ve reflejada en el crecimiento no lineal que se puede observar en el transcurso de las semanas, dandose a comprender que el crecimiento de los camarones se da en las semanas intermedias variando en conjunto con la cantidad de alimento y los tamaños de estos.
- Realice un análisis de regresion logística para determinar que hace que los camarones llegen a 12 gramos.¿Qué tienen de diferentes los estanques que SI llegaron a 12 gramos en la semana 12 con respecto a los que no?
##
## Call:
## glm(formula = AlimentoSemana ~ PesoActual, data = shrimps)
##
## Deviance Residuals:
## Min 1Q Median 3Q Max
## -526.00 -89.86 9.59 90.77 380.46
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 285.864 24.864 11.50 <2e-16 ***
## PesoActual 139.697 3.963 35.25 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for gaussian family taken to be 23637.97)
##
## Null deviance: 32447689 on 131 degrees of freedom
## Residual deviance: 3072936 on 130 degrees of freedom
## AIC: 1707.9
##
## Number of Fisher Scoring iterations: 2
dat <- data.frame(PesoActual = seq(0,12,0.1))
pb <- predict(rshr, dat, type= "response")
plot(shrimps$PesoActual,shrimps$AlimentoSemana, pch=21, xlab="Peso actual", ylab="Alimento semanal")
legend("bottomleft", c("No defecto", "Si defecto"),pch =21, col=c("green","red") )
lines(dat$PesoActual, pb, col="black", lwd=2)