Primer evaluación de estado de la materia de probabilidad y estadística para ingenierías
Caso de estudio 1: Acuacualtura
Se tienen 12 semanas de datos de 12 estanques en los cuales a partir de la semana númer 2 se empiezan la pesar los camarones en crecimiento, también se cuantifica su nivel de comida.
En términos ideales los 12 estanques tendrían que llegar en la semana número 12 a 12 gramos para poder entonces realizar la ‘cosecha’, pero únicamente 3 de los 12 estanques llegaros a este peso.
¿Por qué esto es un problema? dado que se tendrá que invertir una semana (o más) para poder llegar al peso ideal, y esto supone una pérdida de dinero
- Preguntas a responder
Haga un planteamiento del problema a resolver con estadística y realice una descripción exploratoria de los datos (MMM, MD, CB)
¿Que tienen de diferentes los estanques que SI llegaron a 12 gramos en la semana 12 con respecto a los que no?
3.- ¿Con qué variables se relaciona el aumento de peso de los camarones? (regresión lineal, residuos, confianza)
4.- ¿Los camarones que iniciaron con mayor peso ( semana 2) son también los que terminaron en mayor peso? ¿Cómo varía el crecimiento?
5.- Realice un análisis de regresión logística para determinar que hace que los camarones llegen a 12 gramos.
Datos
## Parsed with column specification:
## cols(
## Estanque = col_character(),
## EstanqueN = col_double(),
## Superficie = col_double(),
## Dias = col_double(),
## Semana = col_double(),
## PesoAnterior = col_double(),
## PesoActual = col_double(),
## TamanioAlimento = col_double(),
## AlimentoSemana = col_double(),
## AlimentoDiario = col_double()
## )
I parte
Para semana 12; 1.planteamiento del problema a resolver con estadística y realice una descripción exploratoria de los datos (MMM, MD, CB)
## Parsed with column specification:
## cols(
## P = col_character(),
## EstanqueN = col_double(),
## Superficie = col_double(),
## Dias = col_double(),
## Semana = col_double(),
## PesoAnterior = col_double(),
## PesoActual = col_double(),
## TamanioAlimento = col_double(),
## AlimentoSemana = col_double(),
## AlimentoDiario = col_double(),
## cumplepeso = col_double()
## )
Tabla de distribucion de frecuencia
##
## Attaching package: 'fdth'
## The following objects are masked from 'package:stats':
##
## sd, var
alimento2 <- CAMARONES2$AlimentoDiario
distribucion <- fdt(alimento2, breaks="Sturges")
distribucion## Class limits f rf rf(%) cf cf(%)
## [268.714,274.85) 3 0.25 25.00 3 25.00
## [274.85,280.986) 2 0.17 16.67 5 41.67
## [280.986,287.121) 3 0.25 25.00 8 66.67
## [287.121,293.257) 2 0.17 16.67 10 83.33
## [293.257,299.393) 2 0.17 16.67 12 100.00
##Graficos.
Histograma
par(mfrow=c(3,1))
# Histograma de frecuencias absolutas
plot(distribucion, type="fh", col='blue', main="Histograma de frecuencias absolutas")
# Histograma de frecuencias relativas
plot(distribucion, type="rfh", col='pink', main="Histograma de frecuencias relativas" )
# Histograma de frecuencias acumuladas
plot(distribucion, type="cfh", col='black', main="Histograma de frecuencias acumuladas")Poligono de distribucion frecuencias
par(mfrow=c(3,1))
# Poligono de frecuencias absolutas
plot(distribucion, type="fp", col='blue', main="poligono de frecuencia absoluta")
# Poligono de frecuencias relativas
plot(distribucion, type="rfp", col='pink', main="poligono de frecuencia relativa")
# Poligono de frecuencias acumuladas
plot(distribucion, type="cfp", col='black', main="poligono de frecuencia acumulada")## [1] 271.4286 271.4286 271.4286 275.0000 278.5714 282.1429 282.1429 285.7143
## [9] 289.2857 292.8571 296.4286 296.4286
Medidas de tendencia central
Moda
##
## Attaching package: 'modeest'
## The following object is masked from 'package:fdth':
##
## mfv
## [1] 271.4286
Resumen
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 271.4 274.1 282.1 282.7 290.2 296.4
II parte
2. ¿Que tienen de diferentes los estanques que SI llegaron a 12 gramos en la semana 12 con respecto a los que no?
se observa que el alimento diario no tiene una directa relacion con el aumento de peso del camaron en los diferentes estanques analizados, mas sin embargo se puede ver que aquellos estanques que lograron los 12 gramos tenian un peso inicial mayor a 10 unidades, por otro lado esta la posibilidad de que las condiciones ambientales son distintas dentro de los estanques evaluados y esas son las que rigen el comportamiento de su crecimiento.
correlaciones entre las diferentes variables que tenemos
library(readr)
CAMARONES2 <- read_csv("CAMARONES2.csv",
col_types = cols(P = col_skip(), EstanqueN = col_number(),
Superficie = col_double(), Dias = col_number(),
Semana = col_number(), TamanioAlimento = col_number(),
AlimentoSemana = col_number(), cumplepeso = col_number()))
View(CAMARONES2)
cor(CAMARONES2)## Warning in cor(CAMARONES2): the standard deviation is zero
## EstanqueN Superficie Dias Semana PesoAnterior PesoActual
## EstanqueN 1.0000000 0.6477503 NA NA -0.17956716 0.1136682
## Superficie 0.6477503 1.0000000 NA NA -0.26676353 0.1078016
## Dias NA NA 1 NA NA NA
## Semana NA NA NA 1 NA NA
## PesoAnterior -0.1795672 -0.2667635 NA NA 1.00000000 0.6590602
## PesoActual 0.1136682 0.1078016 NA NA 0.65906024 1.0000000
## TamanioAlimento NA NA NA NA NA NA
## AlimentoSemana 0.5598435 0.6738525 NA NA 0.08881388 0.2836590
## AlimentoDiario 0.5598435 0.6738525 NA NA 0.08881388 0.2836590
## cumplepeso 0.0836242 0.2581989 NA NA 0.45234956 0.7774753
## TamanioAlimento AlimentoSemana AlimentoDiario cumplepeso
## EstanqueN NA 0.55984353 0.55984352 0.0836242
## Superficie NA 0.67385255 0.67385254 0.2581989
## Dias NA NA NA NA
## Semana NA NA NA NA
## PesoAnterior NA 0.08881388 0.08881388 0.4523496
## PesoActual NA 0.28365902 0.28365903 0.7774753
## TamanioAlimento 1 NA NA NA
## AlimentoSemana NA 1.00000000 1.00000000 0.4160582
## AlimentoDiario NA 1.00000000 1.00000000 0.4160582
## cumplepeso NA 0.41605821 0.41605821 1.0000000
III parte
3.- ¿Con qué variables se relaciona el aumento de peso de los camarones? (regresión lineal, residuos, confianza)
Regresion lineal
##
## Call:
## lm(formula = AlimentoDiario ~ PesoActual, data = CAMARONES2)
##
## Residuals:
## Min 1Q Median 3Q Max
## -11.735 -8.101 0.297 6.549 15.283
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 218.029 69.231 3.149 0.0103 *
## PesoActual 5.605 5.992 0.935 0.3716
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 9.544 on 10 degrees of freedom
## Multiple R-squared: 0.08046, Adjusted R-squared: -0.01149
## F-statistic: 0.875 on 1 and 10 DF, p-value: 0.3716
Ecuacion de la recta de minimos cuadrados.
\[ Y=218.029+5.605x \] ### intervalos de confianza
## 2.5 % 97.5 %
## (Intercept) 63.772654 372.28469
## PesoActual -7.746283 18.95704
Contraste de hipótesis
A través de la prueba de Shapiro-Wilk
##
## Shapiro-Wilk normality test
##
## data: modelorecta$residuals
## W = 0.92389, p-value = 0.3198
IV parte
4.- ¿Los camarones que iniciaron con mayor peso ( semana 2) son también los que terminaron en mayor peso? ¿Cómo varía el crecimiento?
mediante los datos estadisticos se puede comprender que los estanques 6 y 7 tienen los mayores pesos iniciales, mas se observa que al termino de la semana 12 no cumplieron con la espectativa que era llegar a los 12 gramos, por lo que no se puede ligar su crecimiento con que hayan tenido un mayor peso en un inicio.
V parte
Recta minimos cuadrados.
##
## Call:
## lm(formula = AlimentoDiario ~ PesoActual, data = CAMARONES2)
##
## Residuals:
## Min 1Q Median 3Q Max
## -11.735 -8.101 0.297 6.549 15.283
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 218.029 69.231 3.149 0.0103 *
## PesoActual 5.605 5.992 0.935 0.3716
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 9.544 on 10 degrees of freedom
## Multiple R-squared: 0.08046, Adjusted R-squared: -0.01149
## F-statistic: 0.875 on 1 and 10 DF, p-value: 0.3716
plot(CAMARONES2$AlimentoDiario,CAMARONES2$PesoActual, xlab = "Comida diaria", ylab = "Peso en gramos (camaron)", col="red", lwd=3)
abline(modelorectat)Regresion logistica
#calcular la frecuencia con la cual se presentan los valores de 0(menor que 12 g) y de 1(mayor o igual a 12g) para la semana 12
table(CAMARONES2$cumplepeso)##
## 0 1
## 9 3
- representando los defectos vs no defectos de una forma grafica
colores <- NULL
colores[CAMARONES2$cumplepeso==0] <- "yellow"
colores[CAMARONES2$cumplepeso==1] <- "red"
plot(CAMARONES2$AlimentoDiario, CAMARONES2$cumplepeso, pch = 21, bg = colores, xlab = 'Alimento diario', ylab = 'Probabilidad de peso en camarones de cumplir los 12g', main="Grafico representativo de si cumple o no cumple")
legend('bottomleft', c('No cumple', 'Si cumple'), pch = 21, col = c('yellow', 'red'))##
## Call:
## glm(formula = cumplepeso ~ AlimentoDiario, family = binomial,
## data = CAMARONES2)
##
## Deviance Residuals:
## Min 1Q Median 3Q Max
## -1.28965 -0.68424 -0.39705 -0.00008 2.00729
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) -35.1229 25.8776 -1.357 0.175
## AlimentoDiario 0.1194 0.0901 1.325 0.185
##
## (Dispersion parameter for binomial family taken to be 1)
##
## Null deviance: 13.496 on 11 degrees of freedom
## Residual deviance: 11.311 on 10 degrees of freedom
## AIC: 15.311
##
## Number of Fisher Scoring iterations: 5
datost <- data.frame(AlimentoDiario= seq(240,300,0.2))
probabilidades <- predict(regt, datost, type = "response")
#gráfica
plot(CAMARONES2$AlimentoDiario, CAMARONES2$cumplepeso, pch = 21, bg = colores, xlab = 'Alimento diario', ylab = 'Probabilidad de peso en camarones de cumplir los 12g', main="Grafico regresion logistica")
legend('bottomleft', c('No cumple', 'Si cumple'), pch = 21, col = c('yellow', 'red'))
lines(datost$AlimentoDiario, probabilidades, col="purple", lwd=4)conclusion.
se observa que la cantidad de alimento diario no tiene una relacion significativaccon la probabilidad de cumplir con los 12 gramos, por lo que se asume que el que cumplan con los 12 gramos sera de acuerdo a las condiciones ambientales del estanque donde se encuentren.