# Folder de trabajo
setwd("~/Pye 1pm")
## Asignación #3 utilizando conjuntos de datos R
## para un analisis exploratorio de datos
# Para este ejemplo en particular utilizaremos datos de castores
#Paquete
library(pacman)
p_load("datasets")
## Datos acerca de castores
data(beaver1)
## Warning in data(beaver1): data set 'beaver1' not found
castores <-beaver1
## Descripción de los datos
#Reylons (1994) describe una pequeña parte de un estudio de la
#dinamica de la temperatura a lo largo del plazo del castor canadensis en el
#centro-norte de Wisconsin. La temperatura corporal se midió por telemetria cada
#10 minutos para cuatro hembras, pero alli se usan datos de un periodo de menos
#de un dia para cada uno de los animales.
#Format
#The beaver1 data frame has 114 rows and 4 columns on body temperature
#measurements at 10 minute intervals.
#The variables are as follows:
# day
#Day of observation (in days since the beginning of 1990), December 12-13
#(beaver1) and November 3-4 (beaver2).
#time
#Time of observation, in the form 0330 for 3:30am
#temp
#Measured body temperature in degrees Celsius.
#activ
#Indicator of activity outside the retreat.
# Conociendo los datos
head(castores) # Esto nos va adar las primeras 6 filas
## day time temp activ
## 1 346 840 36.33 0
## 2 346 850 36.34 0
## 3 346 900 36.35 0
## 4 346 910 36.42 0
## 5 346 920 36.55 0
## 6 346 930 36.69 0
dim(castores) # cantidad de filas y columnas
## [1] 114 4
## Medidas de tendencia central
summary(castores)
## day time temp activ
## Min. :346.0 Min. : 0.0 Min. :36.33 Min. :0.00000
## 1st Qu.:346.0 1st Qu.: 932.5 1st Qu.:36.76 1st Qu.:0.00000
## Median :346.0 Median :1415.0 Median :36.87 Median :0.00000
## Mean :346.2 Mean :1312.0 Mean :36.86 Mean :0.05263
## 3rd Qu.:346.0 3rd Qu.:1887.5 3rd Qu.:36.96 3rd Qu.:0.00000
## Max. :347.0 Max. :2350.0 Max. :37.53 Max. :1.00000
# Valor minimo, primer cuartil, mediana, media, tercer cuartil, valor maximo
##Grafico de caja y bigotes de la temperatura de los castores
boxplot(castores$temp)

# Medidas de dispersión de la temperatura de los castores
# Varianza donde significa la diferencia que hay entre las temperaturas de los
#castores
var(castores$temp)
## [1] 0.03741196
#Desviación estandar donde la desviación estandar es la cantidad que se desvia
#dicha temperatura de castores de la temperatura normal que deberian de tener
#normalmente
sd(castores$temp)
## [1] 0.1934217
#Grafico de dispersión
plot(castores$temp)

#Asignacion: añadir analisis de distribuicion de frecuencias
#tablas e histogramas
library(fdth)
##
## Attaching package: 'fdth'
## The following objects are masked from 'package:stats':
##
## sd, var
library(modeest)
##
## Attaching package: 'modeest'
## The following object is masked from 'package:fdth':
##
## mfv
#Generacion de tabla de frecuencias
tabla <- fdt(castores$temp, breaks = "Sturges")
tabla
## Class limits f rf rf(%) cf cf(%)
## [35.967,36.209) 0 0.00 0.00 0 0.00
## [36.209,36.451) 4 0.04 3.51 4 3.51
## [36.451,36.694) 14 0.12 12.28 18 15.79
## [36.694,36.936) 61 0.54 53.51 79 69.30
## [36.936,37.178) 26 0.23 22.81 105 92.11
## [37.178,37.421) 8 0.07 7.02 113 99.12
## [37.421,37.663) 1 0.01 0.88 114 100.00
## [37.663,37.905) 0 0.00 0.00 114 100.00
#Donde
#f= frecuencia absoluta
#rf= frecuencia relativa
#rf(%) frecuencia relativa porcentual
#cf= frecuencia acumulada
#cf(%)=frecuencia acumulada porcentual
#Ordenar los numeros (datos) de menor a mayor
sort(castores$temp)
## [1] 36.33 36.34 36.35 36.42 36.50 36.54 36.55 36.55 36.59 36.62 36.62 36.64
## [13] 36.65 36.67 36.67 36.69 36.69 36.69 36.70 36.71 36.71 36.72 36.73 36.74
## [25] 36.75 36.75 36.75 36.75 36.76 36.76 36.77 36.77 36.78 36.78 36.79 36.79
## [37] 36.80 36.80 36.80 36.81 36.81 36.82 36.82 36.82 36.83 36.83 36.84 36.84
## [49] 36.85 36.85 36.85 36.85 36.86 36.86 36.87 36.87 36.87 36.87 36.88 36.88
## [61] 36.88 36.88 36.89 36.89 36.89 36.89 36.89 36.89 36.89 36.91 36.91 36.91
## [73] 36.92 36.92 36.92 36.93 36.93 36.93 36.93 36.94 36.94 36.94 36.94 36.95
## [85] 36.95 36.96 36.97 36.97 36.97 36.98 36.98 36.99 36.99 36.99 37.00 37.00
## [97] 37.00 37.01 37.02 37.05 37.07 37.09 37.10 37.10 37.15 37.18 37.20 37.20
## [109] 37.20 37.21 37.23 37.24 37.25 37.53
#Histogramas de frecuencia
#Los histogramas de frecuencias son graficas fácil de observar que te representa
#en este caso las temperaturas, dando intervalos y las frecuencias con las que se
#llevaron acabo dentro de dichos intervalos
# Histograma de frecuencia absoluta
plot(tabla, type="fh")

# Histograma de frecuencia acumulada
plot(tabla, type="cfh")

# Histograma de frecuencia relativa
plot(tabla, type="rfh")

#Poligonos de frecuencia
#Los poligonos de frecuencia están basados en los histogramas, dandonos
#comparaciones de las temperaturas de los castores
# Polgono de frecuencia absoluta
plot(tabla, type="fp")

# Poligono de frecuencia acumulada
plot(tabla, type="cfp")

# Poligono de frecuencia relativa
plot(tabla, type="rfp")
