Ejercicio 2: EDA (Exploratory Data Analysis)
Utilizando el conjunto de datos conocido como āQUAKES DATASETā
El conjunto de datos proporciona las ubicaciones de 1000 eventos sĆsmicos de MB>4,0. Los hechos ocurrieron en un cubo cerca de Fiji desde 1964.
Imagen Ilustrativa
Hay dos planos claros de actividad sĆsmica. Uno es una unión de placas importante; la otra es la trinchera de Tonga frente a Nueva Zelanda. Estos datos constituyen una submuestra de un conjunto de datos mĆ”s grande que contiene 5000 observaciones.
Paquetes
library(pacman)
p_load("datasets", "DT", "fdth")
Datos
data("quakes")
dim(quakes)
## [1] 1000 5
[1]1000 5
Conociendo los datos por medio de una tabla interactiva
datatable(quakes)
Medidas de tendencia central
summary(quakes)
## lat long depth mag
## Min. :-38.59 Min. :165.7 Min. : 40.0 Min. :4.00
## 1st Qu.:-23.47 1st Qu.:179.6 1st Qu.: 99.0 1st Qu.:4.30
## Median :-20.30 Median :181.4 Median :247.0 Median :4.60
## Mean :-20.64 Mean :179.5 Mean :311.4 Mean :4.62
## 3rd Qu.:-17.64 3rd Qu.:183.2 3rd Qu.:543.0 3rd Qu.:4.90
## Max. :-10.72 Max. :188.1 Max. :680.0 Max. :6.40
## stations
## Min. : 10.00
## 1st Qu.: 18.00
## Median : 27.00
## Mean : 33.42
## 3rd Qu.: 42.00
## Max. :132.00
Ilustrando las MTC con un grƔfico de caja y bigote
boxplot(quakes)
# Para dibujar una lĆnea roja de la media de la profundidad
abline(h= mean(quakes$depth), col= "red")
Medidas de dispersión
Varianza
var(quakes$long)
## [1] 36.83879
Desviación estÔndar
sd(quakes$long)
## [1] 6.069497
Tabla de frecuencia, histogramas y polĆgonos
tabla <- fdt(quakes$long, breaks= "Sturges")
tabla
## Class limits f rf rf(%) cf cf(%)
## [164.013,166.377) 35 0.04 3.5 35 3.5
## [166.377,168.74) 90 0.09 9.0 125 12.5
## [168.74,171.104) 57 0.06 5.7 182 18.2
## [171.104,173.467) 19 0.02 1.9 201 20.1
## [173.467,175.831) 5 0.00 0.5 206 20.6
## [175.831,178.194) 8 0.01 0.8 214 21.4
## [178.194,180.557) 145 0.14 14.5 359 35.9
## [180.557,182.921) 381 0.38 38.1 740 74.0
## [182.921,185.284) 166 0.17 16.6 906 90.6
## [185.284,187.648) 89 0.09 8.9 995 99.5
## [187.648,190.011) 5 0.00 0.5 1000 100.0
#Donde
#f= frecuencia absoluta
#rf= frecuencia relativa
#rf(%) frecuencia relativa porcentual
#cf= frecuencia acumulada
#cf(%)=frecuencia acumulada porcentualbla
Histogramas
Histrograma de frecuencia absoluta
plot(tabla, type="fh")
Histrograma de frecuencia relativa
plot(tabla, type="rfh")
Histrograma de frecuencia acumulada
plot(tabla, type="cfh")
PolĆgonos
PolĆgono de frecuencia absoluta
plot(tabla, type="fp")
PolĆgono de frecuencia relativa
plot(tabla, type="rfp")
PolĆgono de frecuencia relativa
plot(tabla, type="cfp")
Diagrama de Dispersión
plot(quakes$long)