Primer evaluaciOn de estado de la materia de probabilidad y estadastica para ingenierias

Caso de estudio 1: Acuacualtura

Se tienen 12 semanas de datos de 12 estanques en los cuales a partir de la semana numero 2 se empiezan la pesar los camarones en crecimiento, tambien se cuantifica su nivel de comida.

En terminos ideales los 12 estanques tendran que llegar en la semana numero 12 a 12 gramos para poder entonces realizar la 'cosecha', pero unicamente 3 de los 12 estanques llegaros a este peso.

Importar datos

library(pacman)
p_load("readr","DT","prettydoc","fdth","modeest", "tidyverse", "gganimate", "gifski", "plotly")
CAMARONES <- read_csv("CAMARONES.csv")
## 
## -- Column specification -------------------------------------------------------------
## cols(
##   Estanque = col_character(),
##   EstanqueN = col_double(),
##   Superficie = col_double(),
##   Dias = col_double(),
##   Semana = col_double(),
##   PesoAnterior = col_double(),
##   PesoActual = col_double(),
##   TamanioAlimento = col_double(),
##   AlimentoSemana = col_double(),
##   AlimentoDiario = col_double()
## )
datatable(CAMARONES)

### Filtracion de datos

Peso.Estanque.1 <- t(CAMARONES$PesoActual [CAMARONES$Estanque == "Estanque 1"])
Peso.Estanque.2 <- t(CAMARONES$PesoActual [CAMARONES$Estanque == "Estanque 2"])
Peso.Estanque.3 <- t(CAMARONES$PesoActual [CAMARONES$Estanque == "Estanque 3"])
Peso.Estanque.4 <- t(CAMARONES$PesoActual [CAMARONES$Estanque == "Estanque 4"])
Peso.Estanque.5 <- t(CAMARONES$PesoActual [CAMARONES$Estanque == "Estanque 5"])
Peso.Estanque.6 <- t(CAMARONES$PesoActual [CAMARONES$Estanque == "Estanque 6"])
Peso.Estanque.7 <- t(CAMARONES$PesoActual [CAMARONES$Estanque == "Estanque 7"])
Peso.Estanque.8 <- t(CAMARONES$PesoActual [CAMARONES$Estanque == "Estanque 8"])
Peso.Estanque.9 <- t(CAMARONES$PesoActual [CAMARONES$Estanque == "Estanque 9"])
Peso.Estanque.10 <- t(CAMARONES$PesoActual [CAMARONES$Estanque == "Estanque 10"])
Peso.Estanque.11 <- t(CAMARONES$PesoActual [CAMARONES$Estanque == "Estanque 11"])
Peso.Estanque.12 <- t(CAMARONES$PesoActual [CAMARONES$Estanque == "Estanque 12"])

*Para tener los datos acumulados de cada tanque, se hace un segundo filtro de datos

Semanas <- seq(from = as.character("2"), to = as.character("12"))
vec1 <- as.vector(Peso.Estanque.1)
vec2 <- vec1[1:11]
num1 <- as.numeric(vec2)
qEstanque1 <- as.vector(num1)

Semanas <- seq(from = as.character("2"), to = as.character("12"))
vec1 <- as.vector(Peso.Estanque.2)
vec2 <- vec1[1:11]
num1 <- as.numeric(vec2)
qEstanque2 <- as.vector(num1)

Semanas <- seq(from = as.character("2"), to = as.character("12"))
vec1 <- as.vector(Peso.Estanque.3)
vec2 <- vec1[1:11]
num1 <- as.numeric(vec2)
qEstanque3 <- as.vector(num1)

Semanas <- seq(from = as.character("2"), to = as.character("12"))
vec1 <- as.vector(Peso.Estanque.4)
vec2 <- vec1[1:11]
num1 <- as.numeric(vec2)
qEstanque4 <- as.vector(num1)

Semanas <- seq(from = as.character("2"), to = as.character("12"))
vec1 <- as.vector(Peso.Estanque.5)
vec2 <- vec1[1:11]
num1 <- as.numeric(vec2)
qEstanque5 <- as.vector(num1)

Semanas <- seq(from = as.character("2"), to = as.character("12"))
vec1 <- as.vector(Peso.Estanque.6)
vec2 <- vec1[1:11]
num1 <- as.numeric(vec2)
qEstanque6 <- as.vector(num1)

Semanas <- seq(from = as.character("2"), to = as.character("12"))
vec1 <- as.vector(Peso.Estanque.7)
vec2 <- vec1[1:11]
num1 <- as.numeric(vec2)
qEstanque7 <- as.vector(num1)

Semanas <- seq(from = as.character("2"), to = as.character("12"))
vec1 <- as.vector(Peso.Estanque.8)
vec2 <- vec1[1:11]
num1 <- as.numeric(vec2)
qEstanque8 <- as.vector(num1)

Semanas <- seq(from = as.character("2"), to = as.character("12"))
vec1 <- as.vector(Peso.Estanque.9)
vec2 <- vec1[1:11]
num1 <- as.numeric(vec2)
qEstanque9 <- as.vector(num1)

Semanas <- seq(from = as.character("2"), to = as.character("12"))
vec1 <- as.vector(Peso.Estanque.10)
vec2 <- vec1[1:11]
num1 <- as.numeric(vec2)
qEstanque10 <- as.vector(num1)

Semanas <- seq(from = as.character("2"), to = as.character("12"))
vec1 <- as.vector(Peso.Estanque.11)
vec2 <- vec1[1:11]
num1 <- as.numeric(vec2)
qEstanque11 <- as.vector(num1)

Semanas <- seq(from = as.character("2"), to = as.character("12"))
vec1 <- as.vector(Peso.Estanque.12)
vec2 <- vec1[1:11]
num1 <- as.numeric(vec2)
qEstanque12 <- as.vector(num1)

Preguntas a responder

1.- Haga un planteamiento del problema a resolver con estadastica y realice una descripcion exploratoria de los datos (MMM, MD, CB)

Media, Mediana y Moda del E1

#Media
mean (qEstanque1)
## [1] 5.606364
#Mediana
median(qEstanque1)
## [1] 4.32
#Moda
mfv(qEstanque1)
##  [1]  0.77  1.32  2.03  3.13  4.25  4.32  6.21  7.64  9.46 10.36 12.18

Media, Mediana y Moda del E2

#Media
mean (qEstanque2)
## [1] 5.153636
#Mediana
median(qEstanque2)
## [1] 4.42
#Moda
mfv(qEstanque2)
##  [1]  0.78  1.32  1.96  3.01  3.52  4.42  6.31  6.95  8.02  9.23 11.17

Media, Mediana y Moda del E3

#Media
mean (qEstanque3)
## [1] 5.312727
#Mediana
median(qEstanque3)
## [1] 5.02
#Moda
mfv(qEstanque3)
##  [1]  0.69  1.37  1.73  2.86  4.05  5.02  5.81  6.21  8.69 10.36 11.65

Media, Mediana y Moda del E4

#Media
mean (qEstanque4)
## [1] 5.183636
#Mediana
median(qEstanque4)
## [1] 4.71
#Moda
mfv(qEstanque4)
##  [1]  0.72  1.45  2.45  3.38  4.09  4.71  5.33  6.53  8.32  9.37 10.67

Media, Mediana y Moda del E5

#Media
mean (qEstanque5)
## [1] 5.187273
#Mediana
median(qEstanque5)
## [1] 4.29
#Moda
mfv(qEstanque5)
##  [1]  0.61  1.49  2.36  3.06  3.90  4.29  5.53  6.08  8.40  9.72 11.62

Media, Mediana y Moda del E6

#Media
mean (qEstanque6)
## [1] 5.081818
#Mediana
median(qEstanque6)
## [1] 4.03
#Moda
mfv(qEstanque6)
##  [1]  0.62  1.43  1.83  2.91  3.42  4.03  5.33  6.51  8.51 10.19 11.12

Media, Mediana y Moda del E7

#Media
mean (qEstanque7)
## [1] 5.059091
#Mediana
median(qEstanque7)
## [1] 4
#Moda
mfv(qEstanque7)
##  [1]  0.64  1.32  1.77  2.88  3.91  4.00  5.29  6.42  7.88 10.01 11.53

Media, Mediana y Moda del E8

#Media
mean (qEstanque8)
## [1] 5.445455
#Mediana
median(qEstanque8)
## [1] 5.04
#Moda
mfv(qEstanque8)
##  [1]  0.62  1.38  2.08  3.58  4.20  5.04  5.65  7.09  7.94 10.06 12.26

Media, Mediana y Moda del E9

#Media
mean (qEstanque9)
## [1] 5.732727
#Mediana
median(qEstanque9)
## [1] 5.21
#Moda
mfv(qEstanque9)
##  [1]  0.70  1.75  2.14  3.62  4.95  5.21  6.93  6.99  8.83 10.13 11.81

Media, Mediana y Moda del E10

#Media
mean (qEstanque10)
## [1] 5.293636
#Mediana
median(qEstanque10)
## [1] 4.75
#Moda
mfv(qEstanque10)
##  [1]  0.62  1.74  2.17  3.34  4.50  4.75  5.83  6.65  8.01  9.41 11.21

Media, Mediana y Moda del E11

#Media
mean (qEstanque11)
## [1] 5.094545
#Mediana
median(qEstanque11)
## [1] 4.64
#Moda
mfv(qEstanque11)
##  [1]  0.71  1.57  2.09  3.19  3.85  4.64  5.72  6.00  8.00  9.01 11.26

Media, Mediana y Moda del E12

#Media
mean (qEstanque12)
## [1] 5.305455
#Mediana
median(qEstanque12)
## [1] 5.17
#Moda
mfv(qEstanque12)
##  [1]  0.60  1.39  1.93  2.97  4.17  5.17  5.86  6.25  7.85 10.12 12.05

Grafica de Frecuencia

alimentocamarones <- CAMARONES$AlimentoDiario
hist(alimentocamarones,breaks="sturges",col='darksalmon',main ="Histograma del alimento de camarones")

Varianza

var(alimentocamarones)
## [1] 5054.945

Grafica Caja y Bigote

boxplot(alimentocamarones, col="darksalmon")

###Grafica de dispersion

library(ggplot2)
ggplot(data = CAMARONES)+geom_point(mapping = aes(x=AlimentoDiario, y=PesoActual),col='darksalmon',lwd=2)

Matriz Correlativa

Alimentodiario <- CAMARONES$AlimentoDiario
Pesoactual <- CAMARONES$PesoActual 
pairs(data.frame(Alimentodiario,Pesoactual),col='darksalmon',lwd=1, main= 'Matriz de correlaciones')

##Histograma FA, FR, FRA

alimento2 <- CAMARONES$AlimentoDiario

distribucion <- fdt(alimento2, breaks="Sturges")
distribucion
##       Class limits  f   rf rf(%)  cf  cf(%)
##   [56.8543,83.803) 42 0.32 31.82  42  31.82
##   [83.803,110.752)  6 0.05  4.55  48  36.36
##    [110.752,137.7) 12 0.09  9.09  60  45.45
##    [137.7,164.649) 22 0.17 16.67  82  62.12
##  [164.649,191.598) 18 0.14 13.64 100  75.76
##  [191.598,218.547) 12 0.09  9.09 112  84.85
##  [218.547,245.495)  3 0.02  2.27 115  87.12
##  [245.495,272.444)  4 0.03  3.03 119  90.15
##  [272.444,299.393) 13 0.10  9.85 132 100.00
par(mfrow=c(3,1))

# Histograma de frecuencias absolutas
plot(distribucion, type="fh", col='darksalmon', main="Histograma de frecuencias absolutas")

# Histograma de frecuencias relativas
plot(distribucion, type="rfh", col='darksalmon', main="Histograma de frecuencias relativas" )

# Histograma de frecuencias acumuladas
plot(distribucion, type="cfh", col='darksalmon', main="Histograma de frecuencias acumuladas")

Poligono de Frecuencias

par(mfrow=c(3,1))

# Poligono de frecuencias absolutas
plot(distribucion, type="fp", col='darksalmon', main="poligono de frecuencia absoluta")

# Poligono de frecuencias relativas
plot(distribucion, type="rfp", col='darksalmon', main="poligono de frecuencia relativa")

# Poligono de frecuencias acumuladas
plot(distribucion, type="cfp", col='darksalmon', main="poligono de frecuencia acumulada")

2.-