#estadistica descriptiva de datos de granja acuicola
#se tienen datos de 12 estanques de
#alimentacion y peso en semana la semana 8 de 12
setwd("~/PyE")
library(readxl)
camarones8 <- read_excel("camarones8.xlsx")
View(camarones8)

#variable de alimento
alimento <- camarones8$AlimentoDiario

#tabla de frecuencias
library(fdth)
## 
## Attaching package: 'fdth'
## The following objects are masked from 'package:stats':
## 
##     sd, var
dist <- fdt(alimento, breaks = "Sturges")
dist
##       Class limits  f   rf rf(%) cf  cf(%)
##   [165.471,173.21) 10 0.83 83.33 10  83.33
##   [173.21,180.949)  0 0.00  0.00 10  83.33
##  [180.949,188.687)  0 0.00  0.00 10  83.33
##  [188.687,196.426)  0 0.00  0.00 10  83.33
##  [196.426,204.164)  2 0.17 16.67 12 100.00
#se observan 5 limites de clase, pero los datos estan distribuidos en solo dos.

#para partir la pantalla en un arreglo de 3x2
par(mfrow=c (3,2))
hist(alimento, breaks = "Sturges")
plot(dist, type = "cfh")
plot(dist, type = "cfp")
plot(dist, type = "fh")
plot(dist, type = "fh", col="pink")

sort(alimento)
##  [1] 167.1429 167.1429 167.1429 167.1429 167.1429 167.1429 167.1429 167.8571
##  [9] 167.8571 167.8571 202.1429 202.1429
mean(alimento)#promedio, media, media arithmetica
## [1] 173.1548
median(alimento)#mediana
## [1] 167.1429
summary(alimento)#se observa que el valor maximo es mucho mas grande que mediana
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   167.1   167.1   167.1   173.2   167.9   202.1
#grafico de caja y bigote
boxplot(alimento)#Con este grafico es aun mas obvio la gran diferencia entre la mediana y ek maximo


#medidas de dispersion 
#varianza, distancia media entre la media y todos los valores
var(alimento)
## [1] 183.4377
#desviacion estandar 
sd(alimento)
## [1] 13.54392
#el grado de desviacion de los datos con respecto a su media es bastante grande al ser 13.54

#grafica de dispersion 
#del alimento diario en la semana 8 en gramos y el peso de los 
#camarones en gramos
library(ggplot2)

ggplot(data = camarones8)+
  geom_point(mapping = aes(x= AlimentoDiario, y=PesoActual))

#Como se puede observar la mayoria de los estanques (83%) se encuentran dentro de el primer limite de clase.
#Por lo tanto la desviacion estandar es alta, aún así los valores que se encuentran en el ultimo limite de clase
#son mucho más mayores que la suma de la mediana con la desviacion. A pesar de esto, un 83% de los datos son similares a la 
#mediana y media de los datos.
#este documento esta disponible en linea en la siguiente url 
#