# 1. #Folder de trabajo 
setwd("~/Documents/pye1pm")
#Nombre: Juan Badouin
#Carrera: Ing. Ambiental 
#Matrícula: 123456
#Materia: Probabildiad y estadística 

#Descripción del sitio de estudio: Los Hornos es un ejido del municipio de 
#Cajeme ubicado en el sur del estado mexicano de Sonora, en la zona del 
#valle del Yaqui. Según los datos del Censo de Población y Vivienda realizado 
#en 2020 por el Instituto Nacional de Estadística y Geografía (INEGI), 
#Los Hornos tiene un total de 707 habitantes.


# A) Análisis de frecuencia, tablas, histrogramas y polígonos

# Script para realizar histogramas y polígonos de frecuencia 
# de datos climáticos, de la estación de Hornos, Sonora.

# para activar la biblioteca "fdth": frecuencias, distribuciones,
# tablas e histogramas 

# 2. #Paquete para realizar: frecuencias, distribuciones, tablas, histogramas
library(fdth)
## 
## Attaching package: 'fdth'
## The following objects are masked from 'package:stats':
## 
##     sd, var
library(modeest)
## 
## Attaching package: 'modeest'
## The following object is masked from 'package:fdth':
## 
##     mfv
# Lo que hacemos cuando escribimos "library" es abrir el "libro" que acabamos
#de comporar 


#3. # Datos normales mensuales de la estación de Hornos, Sonora.
# Estos datos los vamos a guardar en una variable 

dist <- c(17.1, 18.0,19.3, 19.3, 22.1, 25.2, 29.3, 31.3, 31.0, 30.3, 26.5, 21.3, 17.5)

# Los datos corresponden en orden secuencial a los 12 meses del año (De enero a febrero)

# 4. Generación de tabla de frecuencias

tabla <- fdt(dist, breaks = "Sturges") 
tabla
##     Class limits f   rf rf(%) cf  cf(%)
##  [16.929,19.866) 5 0.38 38.46  5  38.46
##  [19.866,22.803) 2 0.15 15.38  7  53.85
##  [22.803,25.739) 1 0.08  7.69  8  61.54
##  [25.739,28.676) 1 0.08  7.69  9  69.23
##  [28.676,31.613) 4 0.31 30.77 13 100.00
#Donde
#f= frecuencia absoluta
#rf= frecuencia relativa
#rf(%) frecuencia relativa porcentual
#cf= frecuencia acumulada
#cf(%)=frecuencia acumulada porcentual

# 5. Ordenar los numeros (datos) de menor a mayor
sort(dist)
##  [1] 17.1 17.5 18.0 19.3 19.3 21.3 22.1 25.2 26.5 29.3 30.3 31.0 31.3
#6. Histogramas de frecuencia 

# Histograma de frecuencia absoluta 
plot(tabla, type="fh")

# Histograma de frecuencia acumulada 
plot(tabla, type="cfh")

# Histograma de frecuencia relativa 
plot(tabla, type="rfh")

#7. Polígonos de frecuencia 

# Polígono de frecuencia absoluta 
plot(tabla, type="fp")

# Polígono de frecuencia acumulada 
plot(tabla, type="cfp")

# Polígono de frecuencia relativa 
plot(tabla, type="rfp")

# B) Medidas de tendencia central 

# 1) Media 
mean(dist)
## [1] 23.70769
# 2) Mediana
median(dist)
## [1] 22.1
# 3) Moda
mlv(dist, method="mfv")  #mfv significa "most frequent value"
## [1] 19.3
# valor más frecuente 

# 4) Valor mínimo (MIn.), 1st Qu.(Primer cuantil)
# Median (Mediana), Mean (promedio), 3rd Qu. (tercer cuantil)
# Max. (Valor máximo)
summary(dist) 
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   17.10   19.30   22.10   23.71   29.30   31.30
# 5) Gráfico de caja y bigote
boxplot(dist)

# C) Medidas de de dispersión

#1) Varianza
var(dist)
## [1] 29.7991
# Si a la varianza le sacamos raiz cuadrada, como resultado
#vamos a obtener la:
#2) Desviación estándar 
sd(dist)
## [1] 5.458855
#

# Grafico de dispersión lineal 

plot(dist)