Evaluacion1

HectorZapata

12/10/2020

Portada introduccion Cartas sobre la mesa

Datos

library(tidyverse)
## -- Attaching packages --------------------------------------- tidyverse 1.3.0 --
## v ggplot2 3.3.2     v purrr   0.3.4
## v tibble  3.0.3     v dplyr   1.0.2
## v tidyr   1.1.1     v stringr 1.4.0
## v readr   1.3.1     v forcats 0.5.0
## -- Conflicts ------------------------------------------ tidyverse_conflicts() --
## x dplyr::filter() masks stats::filter()
## x dplyr::lag()    masks stats::lag()
library(ggplot2)
library(pacman)
p_load(markdown, knitr, dplyr, tidyr, tidyverse, hashmap, lubridate,
       summarytools, ggpubr, kableExtra, reshape2,
       sf, tmap, readr, devtools, plotly, gganimate, gifski, ggplotly)
## Installing package into 'C:/Users/progr/OneDrive/Documentos/R/win-library/3.6'
## (as 'lib' is unspecified)
## Warning: package 'hashmap' is not available (for R version 3.6.3)
## Warning: unable to access index for repository http://www.stats.ox.ac.uk/pub/RWin/bin/windows/contrib/3.6:
##   no fue posible abrir la URL 'http://www.stats.ox.ac.uk/pub/RWin/bin/windows/contrib/3.6/PACKAGES'
## Warning: 'BiocManager' not available.  Could not check Bioconductor.
## 
## Please use `install.packages('BiocManager')` and then retry.
## Warning in p_install(package, character.only = TRUE, ...):
## Warning in library(package, lib.loc = lib.loc, character.only = TRUE,
## logical.return = TRUE, : there is no package called 'hashmap'
## Installing package into 'C:/Users/progr/OneDrive/Documentos/R/win-library/3.6'
## (as 'lib' is unspecified)
## Warning: package 'ggplotly' is not available (for R version 3.6.3)
## Warning: unable to access index for repository http://www.stats.ox.ac.uk/pub/RWin/bin/windows/contrib/3.6:
##   no fue posible abrir la URL 'http://www.stats.ox.ac.uk/pub/RWin/bin/windows/contrib/3.6/PACKAGES'
## Warning: 'BiocManager' not available.  Could not check Bioconductor.
## 
## Please use `install.packages('BiocManager')` and then retry.
## Warning in p_install(package, character.only = TRUE, ...):
## Warning in library(package, lib.loc = lib.loc, character.only = TRUE,
## logical.return = TRUE, : there is no package called 'ggplotly'
## Warning in p_load(markdown, knitr, dplyr, tidyr, tidyverse, hashmap, lubridate, : Failed to install/load:
## hashmap, ggplotly
library(readr)
library(DT)
CAMARONES <- read_csv("CAMARONES.csv")
## Parsed with column specification:
## cols(
##   Estanque = col_character(),
##   EstanqueN = col_double(),
##   Superficie = col_double(),
##   Dias = col_double(),
##   Semana = col_double(),
##   PesoAnterior = col_double(),
##   PesoActual = col_double(),
##   TamanioAlimento = col_double(),
##   AlimentoSemana = col_double(),
##   AlimentoDiario = col_double()
## )
datatable(CAMARONES )

Grafica de caja y bigote

inetentemos bisualisar la disperción de los datos

boxplot(CAMARONES$PesoAnterior)
boxplot(CAMARONES$PesoAnterior)

Como esta creciendo?

Aqui tenemos 2 graficas que representan el crecimiento de los estanques en cuanto a un objetivo ā€œ12 gramos o masā€

ggplot(data = CAMARONES) +
  geom_point(mapping = aes(x = Semana, y = PesoActual, color = Estanque))

ggplot(data =CAMARONES)+
geom_point(mapping = aes(x = EstanqueN, y = (PesoActual), color = Estanque))

Crecimiento de los estanques

Hablemos de la alimentación

Podremos observar como es la alimentacion de los camarones en cuanto a tiempo se refiere, podremos observar las diferencias entre las cantidades.

ggplot(data =CAMARONES)+
geom_point(mapping = aes(x = Semana, y =  AlimentoSemana, color = Estanque))

ggplot(data =CAMARONES)+
geom_point(mapping = aes(x = AlimentoSemana, y =  Superficie, color = Estanque))

Que tanto esta creciendo con respecto a la semana

Esta grafica nos muestra que tanto es el crecmiento con respecto a su crecimiento anterior

CRECIMIENTO<- (CAMARONES$PesoActual - CAMARONES$PesoAnterior) 
CRECIMIENTO
##   [1] 0.625 0.627 0.541 0.566 0.444 0.405 0.420 0.486 0.540 0.469 0.569 0.470
##  [13] 0.550 0.540 0.680 0.730 0.880 0.810 0.680 0.760 1.050 1.120 0.860 0.790
##  [25] 0.710 0.640 0.360 1.000 0.870 0.400 0.450 0.700 0.390 0.430 0.520 0.540
##  [37] 1.100 1.050 1.130 0.930 0.700 1.080 1.110 1.500 1.480 1.170 1.100 1.040
##  [49] 1.120 0.510 1.190 0.710 0.840 0.510 1.030 0.620 1.330 1.160 0.660 1.200
##  [61] 0.070 0.900 0.970 0.620 0.390 0.610 0.090 0.840 0.260 0.250 0.790 1.000
##  [73] 1.890 1.890 0.790 0.620 1.240 1.300 1.290 0.610 1.720 1.080 1.080 0.690
##  [85] 1.430 0.640 0.400 1.200 0.550 1.180 1.130 1.440 0.060 0.820 0.280 0.390
##  [97] 1.820 1.070 2.480 1.790 2.320 2.000 1.460 0.850 1.840 1.360 2.000 1.600
## [109] 0.900 1.210 1.670 1.050 1.320 1.680 2.130 2.120 1.300 1.400 1.010 2.270
## [121] 1.820 1.940 1.290 1.300 1.900 0.930 1.520 2.200 1.680 1.800 2.250 1.930
ggplot(data =CAMARONES)+
geom_point(mapping = aes(x = Semana, y = (PesoActual-PesoAnterior), color = Estanque))

Miremos como se comporta la matriz de correlación

Podremos observar todas las relaciones que se encuentran entre nuestros datos.

Semana <- CAMARONES$Semana
PesoAnterior <- CAMARONES$PesoAnterior 
PesoActual <- CAMARONES$PesoActual
AlimentoSemana <- CAMARONES$AlimentoSemana
matriz <- data.frame(Semana, PesoAnterior, PesoActual, AlimentoSemana, CRECIMIENTO)
pairs(matriz)

Ahor podemos mirar cada una de las relaciones con respecto a su comparativa de una forma ordenada y de esta manera podemos observar que entre mas ordenados los datos, mas relación hay y asi es como podemos descartar la posibilidad de que el alimento que se les da no esta afectando el crecimiento de los camarones

Diagrama de disperción

ggplot(data = CAMARONES, aes(x = AlimentoSemana, y = PesoActual)) + 
  geom_point(colour = "Blue") +
  ggtitle("Crecimiento") +
  theme_bw() +
  theme(plot.title = element_text(hjust = 0.8))

Nuestro modelo de Regresión lineal

regresion <- lm(formula = PesoActual ~ AlimentoSemana, data = CAMARONES)
summary(regresion)
## 
## Call:
## lm(formula = PesoActual ~ AlimentoSemana, data = CAMARONES)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -2.3032 -0.6334 -0.0752  0.6261  3.8672 
## 
## Coefficients:
##                  Estimate Std. Error t value Pr(>|t|)    
## (Intercept)    -1.3517189  0.2092451   -6.46 1.92e-09 ***
## AlimentoSemana  0.0064804  0.0001838   35.25  < 2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 1.047 on 130 degrees of freedom
## Multiple R-squared:  0.9053, Adjusted R-squared:  0.9046 
## F-statistic:  1243 on 1 and 130 DF,  p-value: < 2.2e-16
plot(CAMARONES$AlimentoSemana, CAMARONES$PesoActual, xlab="Alimento semanal", ylab="Peso actual")
abline(regresion)

## Observemos los residuos

par(mfrow = c(1,2))
plot(regresion)

## Que tan confiable es nuestro modelo?

confint(regresion)
##                       2.5 %       97.5 %
## (Intercept)    -1.765685249 -0.937752469
## AlimentoSemana  0.006116723  0.006844102

Mas a detalle

Manejemos los valores como 0 y 1, cero en caso de fallar en el pesaje ideal y 1 en caso de ser aceptado

library(readxl)
DatosCamarones <- read_excel("DatosCamarones.xlsx", 
    col_types = c("numeric", "numeric", "numeric"))
colores <- NULL
colores[DatosCamarones$Ɖxito==0] <-"red"
colores[DatosCamarones$Ɖxito==1] <-"green"
plot(DatosCamarones$EstanqueN, DatosCamarones$Ɖxito, pch=21, bg=colores, xlab="Peso Ideal", ylab="Estanque")
legend ("bottomleft", c("Ideal", "No ideal"), pch=21, col = c("red","green"))

# Conclusión Conclusión final