#Folder de trabajo 
setwd("~/Pye 1pm")

#Karina Valeria Flores Guerrero
#Ingenieria industrial y de sistemas 
#00000228709
#Probabilidad y estadistica 

#Bahia de Kino es un pueblo mexicano perteneciente al municipio de Hermosillo, 
#ubicado en la región centro-oeste del estado de Sonora, en la zona del desierto 
#sonorense y en la costa del Mar de Cortes.

# A) Analisis de frecuencia, tablas, histogramas y polígonos

# Script para realizar histogramas y poligonos de frecuencia 
# de datos climaticos, de la estacion de Bahia de Kino, Sonora.

# para activar la biblioteca "fdth": frecuencias, distribuciones,
# tablas e histogramas 

#Paquete para realizar: frecuencias, distribuciones, tablas, histogramas
library(fdth)
## 
## Attaching package: 'fdth'
## The following objects are masked from 'package:stats':
## 
##     sd, var
library(modeest)
## 
## Attaching package: 'modeest'
## The following object is masked from 'package:fdth':
## 
##     mfv
# Lo que hacemos cuando escribimos "library"es abrir el "libro" que acabamos de comprar

# Datos normales mensuales de la estacion de Bahia de Kino, Sonora.
# Estos datos los vamos a guardar en una variable 

dist <- c(13.2, 14.5, 15.7, 18.0, 20.7, 25.1, 28.4, 28.8, 27.6, 22.7, 17.1, 13.9)



# Los datos corresponden en orden secuencial a los 12 meses del año (De enero a febrero)

#Generacion de tabla de frecuencias

tabla <- fdt(dist, breaks = "Sturges") 
tabla
##     Class limits f   rf rf(%) cf  cf(%)
##  [13.068,16.272) 4 0.33 33.33  4  33.33
##  [16.272,19.476) 2 0.17 16.67  6  50.00
##   [19.476,22.68) 1 0.08  8.33  7  58.33
##   [22.68,25.884) 2 0.17 16.67  9  75.00
##  [25.884,29.088) 3 0.25 25.00 12 100.00
#Donde
#f= frecuencia absoluta
#rf= frecuencia relativa
#rf(%) frecuencia relativa porcentual
#cf= frecuencia acumulada
#cf(%)=frecuencia acumulada porcentual

#Ordenar los numeros (datos) de menor a mayor
sort(dist)
##  [1] 13.2 13.9 14.5 15.7 17.1 18.0 20.7 22.7 25.1 27.6 28.4 28.8
#Histogramas de frecuencia 

# Histograma de frecuencia absoluta 
plot(tabla, type="fh")

# Histograma de frecuencia acumulada 
plot(tabla, type="cfh")

# Histograma de frecuencia relativa 
plot(tabla, type="rfh")

#Poligonos de frecuencia 

# Polgono de frecuencia absoluta 
plot(tabla, type="fp")

# Poligono de frecuencia acumulada 
plot(tabla, type="cfp")

# Poligono de frecuencia relativa 
plot(tabla, type="rfp")

# B) Medidas de tendencia central

# 1) Media 
mean(dist)
## [1] 20.475
# 2) Mediana 
median(dist)
## [1] 19.35
# 3) Moda 
mlv(dist, method="mfv")  # mfv significa "most frequent value"
##  [1] 13.2 13.9 14.5 15.7 17.1 18.0 20.7 22.7 25.1 27.6 28.4 28.8
# 4) Cuantiles = Valor minimo(min), 1st Qu(primer cuantil), median (mediana),
#mean (promedio), 3rd Qu(tercer cuantil), max(valor maximo).
summary(dist)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   13.20   15.40   19.35   20.48   25.73   28.80
# 5) Gráfico de caja y bigote 
boxplot(dist)

# C) Medidas de dispersión 

# 1) Varianza 
var(dist)
## [1] 34.67659
# Si a la varianza le sacamos raiz cuadrada, como resultado 
#vamos a obtener la:
# 2) Desviación estándar 
sd(dist)
## [1] 5.888683
# Grafico de dispersión lineal 

plot(dist)