A2U1

Carlos Valle

02/02/2022

Ejercicio 2: EDA (Exploratory Data Analysis)

Utilizando el conjunto de datos conocido como ā€œQUAKES DATASETā€

El conjunto de datos proporciona las ubicaciones de 1000 eventos sĆ­smicos de MB>4,0. Los hechos ocurrieron en un cubo cerca de Fiji desde 1964.

Imagen Ilustrativa

Hay dos planos claros de actividad sísmica. Uno es una unión de placas importante; la otra es la trinchera de Tonga frente a Nueva Zelanda. Estos datos constituyen una submuestra de un conjunto de datos mÔs grande que contiene 5000 observaciones.

Paquetes

library(pacman)
p_load("datasets", "DT", "fdth")

Datos

data("quakes")
dim(quakes)
## [1] 1000    5

[1]1000 5

Conociendo los datos por medio de una tabla interactiva

datatable(quakes)

Medidas de tendencia central

summary(quakes)
##       lat              long           depth            mag      
##  Min.   :-38.59   Min.   :165.7   Min.   : 40.0   Min.   :4.00  
##  1st Qu.:-23.47   1st Qu.:179.6   1st Qu.: 99.0   1st Qu.:4.30  
##  Median :-20.30   Median :181.4   Median :247.0   Median :4.60  
##  Mean   :-20.64   Mean   :179.5   Mean   :311.4   Mean   :4.62  
##  3rd Qu.:-17.64   3rd Qu.:183.2   3rd Qu.:543.0   3rd Qu.:4.90  
##  Max.   :-10.72   Max.   :188.1   Max.   :680.0   Max.   :6.40  
##     stations     
##  Min.   : 10.00  
##  1st Qu.: 18.00  
##  Median : 27.00  
##  Mean   : 33.42  
##  3rd Qu.: 42.00  
##  Max.   :132.00

Ilustrando las MTC con un grƔfico de caja y bigote

boxplot(quakes) 
# Para dibujar una lĆ­nea roja de la media de la profundidad
abline(h= mean(quakes$depth), col= "red")

Medidas de dispersión

Varianza

var(quakes$long)
## [1] 36.83879

Desviación estÔndar

sd(quakes$long)
## [1] 6.069497

Tabla de frecuencia, histogramas y polĆ­gonos

tabla <- fdt(quakes$long, breaks= "Sturges")
tabla
##       Class limits   f   rf rf(%)   cf cf(%)
##  [164.013,166.377)  35 0.04   3.5   35   3.5
##   [166.377,168.74)  90 0.09   9.0  125  12.5
##   [168.74,171.104)  57 0.06   5.7  182  18.2
##  [171.104,173.467)  19 0.02   1.9  201  20.1
##  [173.467,175.831)   5 0.00   0.5  206  20.6
##  [175.831,178.194)   8 0.01   0.8  214  21.4
##  [178.194,180.557) 145 0.14  14.5  359  35.9
##  [180.557,182.921) 381 0.38  38.1  740  74.0
##  [182.921,185.284) 166 0.17  16.6  906  90.6
##  [185.284,187.648)  89 0.09   8.9  995  99.5
##  [187.648,190.011)   5 0.00   0.5 1000 100.0
#Donde
#f= frecuencia absoluta
#rf= frecuencia relativa
#rf(%) frecuencia relativa porcentual
#cf= frecuencia acumulada
#cf(%)=frecuencia acumulada porcentualbla 

Histogramas

Histrograma de frecuencia absoluta

plot(tabla, type="fh")

Histrograma de frecuencia relativa

plot(tabla, type="rfh")

Histrograma de frecuencia acumulada

plot(tabla, type="cfh")

PolĆ­gonos

PolĆ­gono de frecuencia absoluta

plot(tabla, type="fp")

PolĆ­gono de frecuencia relativa

plot(tabla, type="rfp")

PolĆ­gono de frecuencia relativa

plot(tabla, type="cfp")

Diagrama de Dispersión

plot(quakes$long)