setwd("~/EstadisticaAplicada")
library(pacman)
p_load("readxl", "prettydoc", "DT", "readr", "fdth", "modeest", "scott", "FD", "Sturges", "ggplot")
## Installing package into 'C:/Users/erika/Documents/R/win-library/3.6'
## (as 'lib' is unspecified)
## Warning: package 'scott' is not available (for R version 3.6.3)
## Warning: unable to access index for repository http://www.stats.ox.ac.uk/pub/RWin/bin/windows/contrib/3.6:
##   no fue posible abrir la URL 'http://www.stats.ox.ac.uk/pub/RWin/bin/windows/contrib/3.6/PACKAGES'
## Warning in p_install(package, character.only = TRUE, ...):
## Warning in library(package, lib.loc = lib.loc, character.only = TRUE,
## logical.return = TRUE, : there is no package called 'scott'
## Installing package into 'C:/Users/erika/Documents/R/win-library/3.6'
## (as 'lib' is unspecified)
## Warning: package 'Sturges' is not available (for R version 3.6.3)
## Warning: unable to access index for repository http://www.stats.ox.ac.uk/pub/RWin/bin/windows/contrib/3.6:
##   no fue posible abrir la URL 'http://www.stats.ox.ac.uk/pub/RWin/bin/windows/contrib/3.6/PACKAGES'
## Warning in p_install(package, character.only = TRUE, ...):
## Warning in library(package, lib.loc = lib.loc, character.only = TRUE,
## logical.return = TRUE, : there is no package called 'Sturges'
## Installing package into 'C:/Users/erika/Documents/R/win-library/3.6'
## (as 'lib' is unspecified)
## Warning: package 'ggplot' is not available (for R version 3.6.3)
## Warning: unable to access index for repository http://www.stats.ox.ac.uk/pub/RWin/bin/windows/contrib/3.6:
##   no fue posible abrir la URL 'http://www.stats.ox.ac.uk/pub/RWin/bin/windows/contrib/3.6/PACKAGES'
## Warning in p_install(package, character.only = TRUE, ...):
## Warning in library(package, lib.loc = lib.loc, character.only = TRUE,
## logical.return = TRUE, : there is no package called 'ggplot'
## Warning in p_load("readxl", "prettydoc", "DT", "readr", "fdth", "modeest", : Failed to install/load:
## scott, Sturges, ggplot
library(fdth)
library(plotly)
## Loading required package: ggplot2
## Registered S3 method overwritten by 'httr':
##   method         from  
##   print.response rmutil
## 
## Attaching package: 'plotly'
## The following object is masked from 'package:ggplot2':
## 
##     last_plot
## The following object is masked from 'package:stats':
## 
##     filter
## The following object is masked from 'package:graphics':
## 
##     layout

Primer evaluación de estado de la materia de probabilidad y estadística para ingenierías

Caso de estudio 1: Acuacualtura

Se tienen 12 semanas de datos de 12 estanques en los cuales a partir de la semana númer 2 se empiezan la pesar los camarones en crecimiento, también se cuantifica su nivel de comida.

En términos ideales los 12 estanques tendrían que llegar en la semana número 12 a 12 gramos para poder entonces realizar la ‘cosecha’, pero únicamente 3 de los 12 estanques llegaros a este peso.

¿Por qué esto es un problema? dado que se tendrá que invertir una semana (o más) para poder llegar al peso ideal, y esto supone una pérdida de dinero

  • Preguntas a responder
  1. Haga un planteamiento del problema a resolver con estadística y realice una descripción exploratoria de los datos (MMM, MD, CB)

  2. ¿Que tienen de diferentes los estanques que SI llegaron a 12 gramos en la semana 12 con respecto a los que no?

3.- ¿Con qué variables se relaciona el aumento de peso de los camarones? (regresión lineal, residuos, confianza)

4.- ¿Los camarones que iniciaron con mayor peso ( semana 2) son también los que terminaron en mayor peso? ¿Cómo varía el crecimiento?

5.- Realice un análisis de regresión logística para determinar que hace que los camarones llegen a 12 gramos.

Datos

library(readr)
library(DT)
CAMARONES <- read_csv("CAMARONES.csv")
## Warning: Missing column names filled in: 'X11' [11]
## Parsed with column specification:
## cols(
##   Estanque = col_character(),
##   EstanqueN = col_double(),
##   Superficie = col_double(),
##   Dias = col_double(),
##   Semana = col_double(),
##   PesoAnterior = col_double(),
##   PesoActual = col_double(),
##   TamanioAlimento = col_double(),
##   AlimentoSemana = col_double(),
##   AlimentoDiario = col_double(),
##   X11 = col_double()
## )
datatable(CAMARONES)
CAMARONES2 <- read_csv("CAMARONES2.csv")
## Warning: Missing column names filled in: 'X11' [11]
## Parsed with column specification:
## cols(
##   Estanque = col_character(),
##   EstanqueN = col_double(),
##   Superficie = col_double(),
##   Dias = col_double(),
##   Semana = col_double(),
##   PesoAnterior = col_double(),
##   PesoActual = col_double(),
##   TamanioAlimento = col_double(),
##   AlimentoSemana = col_double(),
##   AlimentoDiario = col_double(),
##   X11 = col_double()
## )
datatable(CAMARONES2)

`

alimentocam <-(CAMARONES2$AlimentoDiario)
library(fdth)
alimentocam
##  [1] 278.5714 271.4286 282.1429 285.7143 271.4286 282.1429 275.0000 292.8571
##  [9] 289.2857 271.4286 296.4286 296.4286

Definición de Estadistica

Tabla de Distribución de Frecuencia

dist <- fdt(alimentocam, breaks = "Sturges")
dist
##       Class limits f   rf rf(%) cf  cf(%)
##   [268.714,274.85) 3 0.25 25.00  3  25.00
##   [274.85,280.986) 2 0.17 16.67  5  41.67
##  [280.986,287.121) 3 0.25 25.00  8  66.67
##  [287.121,293.257) 2 0.17 16.67 10  83.33
##  [293.257,299.393) 2 0.17 16.67 12 100.00

Graficas de frecuencias

hist(alimentocam, breaks="Sturges")

#alimento camaron de frecuancia 
plot(dist, type = "fh", col="pink")

# Poligono de frecuancia acomulada
plot(dist, type = "cfp", col="blue")

# Histograma de frecuencia acomulada
plot(dist, type="cfh", col="green")

sort(alimentocam)
##  [1] 271.4286 271.4286 271.4286 275.0000 278.5714 282.1429 282.1429 285.7143
##  [9] 289.2857 292.8571 296.4286 296.4286

Medidas de Frecuencia Central

####Media

mean(alimentocam)
## [1] 282.7381

Mediana

median(alimentocam)
## [1] 282.1429

Moda

mfv(alimentocam)
## [1] 271.4286

Cuantiles

summary(alimentocam)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   271.4   274.1   282.1   282.7   290.2   296.4

Varianza

var(alimentocam)
## [1] 90.05875

Desviación Estandar

sd(alimentocam)
## [1] 9.489929

Grafico de caja y bigote

boxplot(alimentocam, col="pink")

ggplot(data = CAMARONES2) +
  geom_point(mapping = aes(x=AlimentoDiario, y=PesoActual), col="orange", lwd=2)

## 2da. Parte

¿Que tienen de diferentes los estanques que SI llegaron a 12 gramos en la semana 12 con respecto a los que no?

Regresión Lineal