Introducción

Los sismos en Chile sin duda son un gran tema para la población en general. Grandes terremotos han afectado al país, y muchos Chilenos recuerdan los grandes terremotos que han azotado a Chile. Chile es un país por carácterística como una zona geográfica con bastantes movimientos telúricos.

Bajo ésta primicia, se hace indispensable estudiar los datos de cada sismo, establecer lugares donde mas ocurren, donde han registrado los con mayor intensidad, cuales han ocasionado mayores daños, etc. Para ello existe una institución llamada “CSN” Centro Sismológico Nacional bajo la dirección de la Facultad de Ciencias Físicas y Matemáticas de la Universidad de Chile.

El CSN, es el organismo técnico encargado del monitoreo de la actividad sísmica a lo largo de todo el territorio nacional. La misión principal del CSN, es entregar los datos e información sismológica a la Oficina Nacional de Emergencia del Ministerio del Interior y Seguridad Pública (Onemi), Servicio Hidrográfico y Oceanográfico de la Armada (SHOA), autoridades, mundo científico y a la comunidad en general.

La finalidad del estudio, consiste en determinar si con la información obtenida, podemos relacionar los datos de los sismos de Chile en relación al tiempo y magnitud de los mismos.

Descripción de los datos

Los datos encontrados en la página de http://www.sismologia.cl se encuentra sólo resumidos a través de la web, y se muestran de la siguiente forma:

Resumen Sismos La página web sólo muestra los últimos sismos, por ende es necesario capturar de alguna forma el listado completo de sismos para confeccionar un set de datos a analizar.

Procesamiento

Obtención

Realizando diferentes análisis, a través de la aplicación de la técnica de “Web Crawler”, se realiza la captura de datos a través de una rutina programada en lenguaje ruby, la cual se encarga de capturar la tabla de datos en la página de http://www.simologia.cl, recopila los objetos web y transforma los datos capturados línea por línea a un archivo CSV. El rango de fechas en que se realiza la captura es desde el 01/01/2000 al 28/11/2019.

El código de la rutina en lenguaje Ruby es el siguiente:

Los datos son capturados, se reune la información necesaria, los campos son: Fecha Local, Fecha UTC, Latitud, Longitud, Profundidad, Magnitud y Referencia Geográfica.

Una vez que ya se ha realizado la captura de datos, el archivo CSV obtenido luego de la ejecución de la rutina en ruby, el resultado del CSV es el siguiente:

Los datos son capturados sin títulos de columnas, por lo cual se agregan en el arhcivo CSV de forma manual.

Procesamiento de datos

Se realiza la lectura del archivo CSV a través de R, con la siguiente instrucción. Y luego se realiza la instrucción str, para revisar la estructura. Se obtienen los siguientes resultados:

## 'data.frame':    96202 obs. of  7 variables:
##  $ Fecha.Local          : Factor w/ 96126 levels "01/01/2001 07:59:08",..: 3146 3145 3144 6509 6508 6507 6506 9771 9770 9769 ...
##  $ Fecha.UTC            : Factor w/ 96126 levels "01/01/2001 10:59:08",..: 3142 3141 3140 6502 6501 6500 6499 9775 9774 9773 ...
##  $ Latitud              : num  -32.4 -31.5 -33.8 -34.1 -32.2 ...
##  $ Longitud             : Factor w/ 8899 levels "- 81.084","-1.535",..: 4555 4950 4971 5656 5388 5317 5277 3906 3732 4092 ...
##  $ Profundidad.km.      : num  95.2 35.7 45.8 39.6 33.8 15.2 33 99.7 121 13.3 ...
##  $ Magnitud             : Factor w/ 1650 levels "''","0.0 ","0.8 ",..: 280 630 598 2 2 528 464 464 2 2 ...
##  $ Referencia.Grografica: Factor w/ 30964 levels "0 km al E de Tierra Amarilla",..: 10767 7479 13254 13398 22075 17300 18368 19450 15145 16432 ...

De forma posterior, se revisan los nombres de las columnas:

## [1] "Fecha.Local"           "Fecha.UTC"             "Latitud"              
## [4] "Longitud"              "Profundidad.km."       "Magnitud"             
## [7] "Referencia.Grografica"

Transformación

Se determina si en el set de datos existen datos Nulos o NA.

## [1] FALSE

La columna de datos Magnitud posee valores no númericos, para el análisis que debemos realizar, necesitamos convertir esta columna en valores numéricos, el primer paso es obtener los primeros 3 valores de la magnitud y asignarla a una columna nueva “Magnitud nueva”:

La columna “Magnitud Nueva”, posee caracteres del tipo comillas simples y transformamos los valores a numéricos, por lo cual se deben limpiar de la siguiente manera:

Luego de tener ordenados los datos, y seteados al tipo de datos, se eliminan los datos con valores “NA”:

La columna “MagnitudNueva” se encuentra en formato “char”, por lo cual debe ser cambiada de la siguiente forma:

Procesos

Ya con los datos limpios, procedemos a calcular la media, mediana y la máxima.

## [1] 3.26421
## [1] 3.2
## [1] 0
## [1] 8.8
##               Fecha.Local                  Fecha.UTC        Latitud      
##  01/02/2016 07:54:30:    2   01/02/2016 10:54:30:    2   Min.   :-75.23  
##  01/03/2003 13:05:05:    2   01/03/2003 16:05:05:    2   1st Qu.:-33.30  
##  01/03/2015 18:56:58:    2   01/03/2015 21:56:58:    2   Median :-30.73  
##  01/05/2006 08:25:04:    2   01/05/2006 12:25:04:    2   Mean   :-28.54  
##  02/01/2009 07:51:14:    2   02/01/2009 10:51:14:    2   3rd Qu.:-22.30  
##  03/05/2010 02:33:28:    2   03/05/2010 06:33:28:    2   Max.   : 65.15  
##  (Other)            :96190   (Other)            :96190                   
##     Longitud     Profundidad.km.     Magnitud    
##  -71.713:   57   Min.   :  0.00   3.0    : 5170  
##  -71.700:   54   1st Qu.: 27.80   2.9    : 5153  
##  -71.692:   53   Median : 48.00   2.8    : 5090  
##  -71.718:   52   Mean   : 71.89   3.1    : 4849  
##  -71.650:   51   3rd Qu.:108.60   2.7    : 4678  
##  -71.720:   51   Max.   :700.00   3.2    : 4580  
##  (Other):95884                    (Other):66682  
##               Referencia.Grografica MagnitudNueva  
##  74 km al NO de Futaleufú:  147     Min.   :0.000  
##  39 km al E de Colina    :  146     1st Qu.:2.800  
##  38 km al E de Colina    :  118     Median :3.200  
##  40 km al E de Colina    :  118     Mean   :3.264  
##  75 km al NO de Futaleufú:  113     3rd Qu.:3.700  
##  72 km al NO de Futaleufú:  111     Max.   :8.800  
##  (Other)                 :95449

Con ésta información, ahora clasificaremos las magnitudes de los temblores en tres grupos: “Alto”, “Medio” y “Bajo”

Es importante visualizar como se dispersan los datos, por lo cual veremos los datos distribuidos en un Histograma.

A continuación un boxplot, el cual nos ayuda a determinar la concentración de los datos, outliaers, etc.

Se realizan cambios en los formatos de fecha, con el fin de analizar los sismos en el transcurso del tiempo:

## 
## Attaching package: 'lubridate'
## The following object is masked from 'package:base':
## 
##     date

Para el análisis, es necesario crear una nueva columna en el set de datos, sólo con el año en cuestión:

Separamos los registros en rangos de 6 años:

El último boxplot, muestra los sismos separados por rangos de 6 años en relación a su magnitud.

Resultados

Con todos los datos analizados, podemos determinar que Chile sin duda es un país sísmico. Bajo el análisis de los datos recopilados, hay muchos sismos bajo la categoría de “Altos”.

De la totalidad de los datos, con 19 años de registros, se han separado en intérvalos de 6 años, logramos observar que cada 6 años existen temblores superiores a 7 Grados Richter. A la vez en cada separación de 6 años se observan una gran cantidad de datos “outliaers” que superan la media hacia arriba, o sea a temblores mas fuertes.

Discusión

Al principio sin haber realizado la separación de cada 6 años, sólo era visible que somos un país con alta cantidad de sismos, luego de la separación y análisis de cada 6 años, se logra observar con claridad que cada cierta cantidad de años tenemos sismos superiores a 7 grados Richter.

Conclusión

Las conclusiones a éste análisis son variadas, se estima que se llegó a los resulatdos esperados, la finalidad era encontrar un patrón de temblores cada cierta cantidad de años, se logró determinar que cada 6 años de un total de 19, existe por lo menos un sismo superior a 7 grados Richter.

Referencias

Las funciones utilizadas en éste análisis fueron: