# Folder de trabajo 
setwd("~/Pye 1pm")

## Asignación #3 utilizando conjuntos de datos R 
## para un analisis exploratorio de datos 

# Para este ejemplo en particular utilizaremos datos de castores 

#Paquete 
library(pacman)
p_load("datasets")

## Datos acerca de castores 

data(beaver1)
## Warning in data(beaver1): data set 'beaver1' not found
castores <-beaver1

## Descripción de los datos 

#Reylons (1994) describe una pequeña parte de un estudio de la 
#dinamica de la temperatura a lo largo del plazo del castor canadensis en el 
#centro-norte de Wisconsin. La temperatura corporal se midió por telemetria cada
#10 minutos para cuatro hembras, pero alli se usan datos de un periodo de menos
#de un dia para cada uno de los animales. 

#Format 
#The beaver1 data frame has 114 rows and 4 columns on body temperature
#measurements at 10 minute intervals.

#The variables are as follows:

# day
#Day of observation (in days since the beginning of 1990), December 12-13 
#(beaver1) and November 3-4 (beaver2).

#time
#Time of observation, in the form 0330 for 3:30am

#temp
#Measured body temperature in degrees Celsius.

#activ
#Indicator of activity outside the retreat.

# Conociendo los datos 
  
head(castores) # Esto nos va adar las primeras 6 filas 
##   day time  temp activ
## 1 346  840 36.33     0
## 2 346  850 36.34     0
## 3 346  900 36.35     0
## 4 346  910 36.42     0
## 5 346  920 36.55     0
## 6 346  930 36.69     0
dim(castores) # cantidad de filas y columnas 
## [1] 114   4
## Medidas de tendencia central 

summary(castores)
##       day             time             temp           activ        
##  Min.   :346.0   Min.   :   0.0   Min.   :36.33   Min.   :0.00000  
##  1st Qu.:346.0   1st Qu.: 932.5   1st Qu.:36.76   1st Qu.:0.00000  
##  Median :346.0   Median :1415.0   Median :36.87   Median :0.00000  
##  Mean   :346.2   Mean   :1312.0   Mean   :36.86   Mean   :0.05263  
##  3rd Qu.:346.0   3rd Qu.:1887.5   3rd Qu.:36.96   3rd Qu.:0.00000  
##  Max.   :347.0   Max.   :2350.0   Max.   :37.53   Max.   :1.00000
# Valor minimo, primer cuartil, mediana, media, tercer cuartil, valor maximo 

##Grafico de caja y bigotes de la temperatura de los castores 

boxplot(castores$temp)

# Medidas de dispersión de la temperatura de los castores
# Varianza donde significa la diferencia que hay entre las temperaturas de los 
#castores
var(castores$temp)
## [1] 0.03741196
#Desviación estandar donde la desviación estandar es la cantidad que se desvia 
#dicha temperatura de castores de la temperatura normal que deberian de tener 
#normalmente 
sd(castores$temp)
## [1] 0.1934217
#Grafico de dispersión 
plot(castores$temp)

#Asignacion: añadir analisis de distribuicion de frecuencias 
#tablas e histogramas   
library(fdth)
## 
## Attaching package: 'fdth'
## The following objects are masked from 'package:stats':
## 
##     sd, var
library(modeest)
## 
## Attaching package: 'modeest'
## The following object is masked from 'package:fdth':
## 
##     mfv
#Generacion de tabla de frecuencias

tabla <- fdt(castores$temp, breaks = "Sturges") 
tabla
##     Class limits  f   rf rf(%)  cf  cf(%)
##  [35.967,36.209)  0 0.00  0.00   0   0.00
##  [36.209,36.451)  4 0.04  3.51   4   3.51
##  [36.451,36.694) 14 0.12 12.28  18  15.79
##  [36.694,36.936) 61 0.54 53.51  79  69.30
##  [36.936,37.178) 26 0.23 22.81 105  92.11
##  [37.178,37.421)  8 0.07  7.02 113  99.12
##  [37.421,37.663)  1 0.01  0.88 114 100.00
##  [37.663,37.905)  0 0.00  0.00 114 100.00
#Donde
#f= frecuencia absoluta
#rf= frecuencia relativa
#rf(%) frecuencia relativa porcentual
#cf= frecuencia acumulada
#cf(%)=frecuencia acumulada porcentual

#Ordenar los numeros (datos) de menor a mayor
sort(castores$temp)
##   [1] 36.33 36.34 36.35 36.42 36.50 36.54 36.55 36.55 36.59 36.62 36.62 36.64
##  [13] 36.65 36.67 36.67 36.69 36.69 36.69 36.70 36.71 36.71 36.72 36.73 36.74
##  [25] 36.75 36.75 36.75 36.75 36.76 36.76 36.77 36.77 36.78 36.78 36.79 36.79
##  [37] 36.80 36.80 36.80 36.81 36.81 36.82 36.82 36.82 36.83 36.83 36.84 36.84
##  [49] 36.85 36.85 36.85 36.85 36.86 36.86 36.87 36.87 36.87 36.87 36.88 36.88
##  [61] 36.88 36.88 36.89 36.89 36.89 36.89 36.89 36.89 36.89 36.91 36.91 36.91
##  [73] 36.92 36.92 36.92 36.93 36.93 36.93 36.93 36.94 36.94 36.94 36.94 36.95
##  [85] 36.95 36.96 36.97 36.97 36.97 36.98 36.98 36.99 36.99 36.99 37.00 37.00
##  [97] 37.00 37.01 37.02 37.05 37.07 37.09 37.10 37.10 37.15 37.18 37.20 37.20
## [109] 37.20 37.21 37.23 37.24 37.25 37.53
#Histogramas de frecuencia 
#Los histogramas de frecuencias son graficas fácil de observar que te representa 
#en este caso las temperaturas, dando intervalos y las frecuencias con las que se
#llevaron acabo dentro de dichos intervalos 

# Histograma de frecuencia absoluta 
plot(tabla, type="fh")

# Histograma de frecuencia acumulada 
plot(tabla, type="cfh")

# Histograma de frecuencia relativa 
plot(tabla, type="rfh")

#Poligonos de frecuencia 
#Los poligonos de frecuencia están basados en los histogramas, dandonos 
#comparaciones de las temperaturas de los castores

# Polgono de frecuencia absoluta 
plot(tabla, type="fp")

# Poligono de frecuencia acumulada 
plot(tabla, type="cfp")

# Poligono de frecuencia relativa 
plot(tabla, type="rfp")