# Folder de trabajo
setwd("~/Documents/pye1pm")
## Asignación #3 Utilizando conjuntos de datos de R
## Para un análisis exploratorio de datos 
# Para este ejemplo en particular utilizaremos datos de castores 
# Paquete 
library(pacman)  #Package manager 
p_load("datasets")
## Datos acerca de castores 
castores <-(beaver1)
## Descripcion de los datos
#Reynolds (1994) describe una pequeña parte de un estudio de la 
#dinámica de la temperatura a largo plazo del castor Castor 
#canadensis en el centro-norte de Wisconsin. La temperatura corporal
#se midió por telemetría cada 10 minutos para cuatro hembras,
#pero allí se usan datos de un 
#período de menos de un día para cada uno de los dos animales.


#Format
#The beaver1 data frame has 114 rows and 4 columns on body temperature measurements at 10 minute intervals.

#The variables are as follows:
  
 # day
#Day of observation (in days since the beginning of 1990), December 12–13 (beaver1) and November 3–4 (beaver2).

#time
#Time of observation, in the form 0330 for 3:30am

#temp
#Measured body temperature in degrees Celsius.

#activ
#Indicator of activity outside the retreat.

# conociendo los datos

head(castores) #esto nos va a dar las primeras 6 filas 
##   day time  temp activ
## 1 346  840 36.33     0
## 2 346  850 36.34     0
## 3 346  900 36.35     0
## 4 346  910 36.42     0
## 5 346  920 36.55     0
## 6 346  930 36.69     0
dim(castores) # cantidad de filas y columnas 
## [1] 114   4
## Medidas de tendencia central
summary(castores)
##       day             time             temp           activ        
##  Min.   :346.0   Min.   :   0.0   Min.   :36.33   Min.   :0.00000  
##  1st Qu.:346.0   1st Qu.: 932.5   1st Qu.:36.76   1st Qu.:0.00000  
##  Median :346.0   Median :1415.0   Median :36.87   Median :0.00000  
##  Mean   :346.2   Mean   :1312.0   Mean   :36.86   Mean   :0.05263  
##  3rd Qu.:346.0   3rd Qu.:1887.5   3rd Qu.:36.96   3rd Qu.:0.00000  
##  Max.   :347.0   Max.   :2350.0   Max.   :37.53   Max.   :1.00000
# valor minimo, primer cuartil, mediana, media, tercer cuartil, valor máximo
## grafico de caja y bigotes de la temperatura de los castores
boxplot(castores$temp)

#Medidas de dispersión de la temperatura de los castores
#Varianza
var(castores$temp)
## [1] 0.03741196
#desviación estándar
sd(castores$temp)
## [1] 0.1934217
#Gráfico de dispersión
plot(castores$temp)