#INTRODUCCIÓN La geología es una disciplina sumamente importante para la compresión de procesos que moldean la superficie de la tierra, entre estos se tiene la dinámica de las placas tectónicas y la actividad sísmica. A través del análisis de datos geológicos, es posible identificar patrones que permiten evaluar riesgos naturales, entender la distribución de los sismos y caracterizar distintos tipos de límites tectónicos. En este taller, se trabajó en el software R pubs, un conjunto de datos que incluye información sobre placas tectónicas, tipos de límites, velocidades de deriva, frecuencia de eventos sísmicos y profundidades de los sismos. Este tipo de información resulta fundamental para analizar cómo las características geodinámicas de las placas influyen en la ocurrencia y comportamiento de los sismos.

Se aplicarán técnicas de análisis exploratorio de datos (EDA) con el objetivo de visualizar, resumir y comprender las relaciones entre las variables estudiadas. Los resultados obtenidos permitirán extraer información clave que apoye la toma de decisiones en estudios geocientíficos y en la gestión del riesgo asociado a la actividad sísmica. #Cargar paquetes necesarios

library(readxl)
## Warning: package 'readxl' was built under R version 4.4.3
library(ggplot2)
library(dplyr)
## 
## Adjuntando el paquete: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(tidyr)

Cargar la base de datos

data <- read_excel("C:/Users/mguzm/Desktop/ANALISIS/Base_Datos_Tectonica.xlsx")

Parte 1: Análisis Descriptivo

En esta sección se realizó un análisis descriptivo de las variables contenidas en el archivo, con el objetivo de obtener una primera aproximación a la distribución, tendencia central y dispersión de los valores registrados. Las variables analizadas incluyen: tipo de límite tectónico, velocidad de deriva de las placas (cm/año), frecuencia anual de sismos y profundidad de los sismos (km).

Se calcularon medidas estadísticas como la media, la mediana, el mínimo, el máximo y la desviación estándar para las variables numéricas, lo que permitió identificar posibles patrones y rangos característicos en cada tipo de límite tectónico. Además, se examinó la distribución de los datos mediante representaciones gráficas como boxplots, lo cual facilitó la detección de valores atípicos y comparaciones entre grupos.

El análisis reveló diferencias significativas en la profundidad y frecuencia de sismos según el tipo de límite (convergente, divergente o transformante), así como variaciones notables en la velocidad de deriva. Estos resultados son fundamentales para comprender el comportamiento tectónico de las distintas placas y su relación con la actividad sísmica.

Tablas Descriptivas

Resumen estadístico de variables numéricas

summary(data)  
##     ID_Zona       Placa_Tectonica    Tipo_Limite        Velocidad_Deriva_cmAño
##  Min.   :  1.00   Length:100         Length:100         Min.   :1.119         
##  1st Qu.: 25.75   Class :character   Class :character   1st Qu.:3.530         
##  Median : 50.50   Mode  :character   Mode  :character   Median :5.019         
##  Mean   : 50.50                                         Mean   :5.364         
##  3rd Qu.: 75.25                                         3rd Qu.:7.032         
##  Max.   :100.00                                         Max.   :9.883         
##  Frecuencia_Sismos_Anual Profundidad_Sismos_Km
##  Min.   : 0.00           Min.   : 24.68       
##  1st Qu.:13.00           1st Qu.:204.15       
##  Median :25.50           Median :353.29       
##  Mean   :24.06           Mean   :363.36       
##  3rd Qu.:34.00           3rd Qu.:526.35       
##  Max.   :48.00           Max.   :698.61

En esta parte se puede observar un resumen estadístico de las variables numéricas del conjunto de datos, entre estas se encuentran: La velocidad de deriva de las placas tectónicas la cual presentó valores entre 1.12 y 9.88 cm/año, con una media de 5.36 cm/año. La frecuencia anual de sismos varió de 0 a 48 eventos, con un promedio de 24.06, mientras que la profundidad de los sismos osciló entre 24.68 y 698.61 km, con una media de 363.36 km. Estos valores proporcionan un panorama general sobre el comportamiento y la distribución de la actividad tectónica registrada en las distintas zonas analizadas.

Frecuencia de placas tectónicas

table(data$Placa_Tectonica) 
## 
##    Euroasiática Indoaustraliana           Nazca        Pacífica    Sudamericana 
##              21              23              16              19              21

Se realizó un conteo de la frecuencia de registros por placa tectónica. Los resultados indican que la placa Indo-australiana es la más representada en el conjunto de datos con 23 registros, seguida por las placas Euroasiática y Sudamericana, ambas con 21 registros. La placa Pacífica cuenta con 19 registros y la placa de Nazca con 16. Esta distribución sugiere una cobertura relativamente equilibrada entre las diferentes placas, lo cual permite realizar comparaciones entre regiones tectónicas con un número representativo de observaciones.

Frecuencia de tipos de límite

table(data$Tipo_Limite)
## 
##   Convergente    Divergente Transformante 
##            33            36            31

Asimismo, se mostraron frecuencias de que tipo de límite se están estudiando según el tipo de placa. Los resultados demuestran que hay mayoría de límites divergentes con una frecuencia de 36, seguida por los límites convergentes y transformantes. Esto nos ayuda a comparar entre placas los tipos de límites presentes y como afectan la sismicidad en ciertas regiones.

Gráficos Descriptivos

Histograma de la Velocidad de Deriva

ggplot(data, aes(x = Velocidad_Deriva_cmAño)) +
  geom_histogram(binwidth = 0.5, fill = "skyblue", color = "black") +
  ggtitle("Distribución de la Velocidad de Deriva (cm/año)") +
  xlab("Velocidad de Deriva (cm/año)") +
  ylab("Frecuencia") +
  theme_minimal()

Este gráfico muestra la distribución de la velocidad de deriva de las placas tectónicas. Se observa una distribución multimodal, con varios picos alrededor de los valores de 2.5 cm/año, 5 cm/año y 7.5 cm/año.Esto indica que las velocidades de deriva no se concentran en un solo valor, sino que hay varios grupos de placas con velocidades características. Estos valores sugieren que en la mayoría de las placas en el conjunto de datos tienen una velocidad de desplazamiento moderada. Los valores más bajos (alrededor de 1 cm/año) y más altos (cercanos a 10 cm/año) están representados por una menor cantidad de zonas, lo que sugiere que los extremos en la velocidad de deriva son menos comunes. Esta distribución permite suponer que el movimiento de las placas en general es relativamente estable, pero que existen algunas zonas donde la dinámica tectónica es significativamente más lenta o rápida, lo cual podría influir en la actividad sísmica de las regiones que forman parte de estas zonas.

Gráfico de Barras de los Tipos de Límite

ggplot(data, aes(x = Tipo_Limite, fill = Tipo_Limite)) +
  geom_bar() +
  ggtitle("Frecuencia de Tipos de Límite Tectónico") +
  xlab("Tipo de Límite") +
  ylab("Frecuencia") +
  theme_minimal()

Este gráfico muestra la cantidad de registros en cada tipo de límite tectónico. Se observa que el tipo de límite más frecuente es el divergente, seguido del convergente y, por último, el transformante. Esto sugiere que en la base de datos hay más eventos o registros asociados a los límites divergentes. Este gráfico es sumamente interesante puesto que los límites divergentes suelen estar asociados a actividad volcánica, lo que podría influir en la menor frecuencia o profundidad de sismos en estas zonas. En contraste los tipos de límites convergentes suelen estar asociados a mayoe profundidad sísmica y actividad tectónica intensa. La menor presencia de límites transformantes, que se caracterizan por un desplazamiento lateral entre placas, también es relevante, ya que suelen ser responsables de sismos superficiales pero intensos, como ocurre en fallas activas como la de San Andrés.

Boxplot de Profundidad de Sismos por Tipo de Límite

ggplot(data, aes(x = Tipo_Limite, y = Profundidad_Sismos_Km, fill = Tipo_Limite)) +
  geom_boxplot() +
  ggtitle("Distribución de la Profundidad de los Sismos por Tipo de Límite") +
  xlab("Tipo de Límite") +
  ylab("Profundidad de Sismos (Km)") +
  theme_minimal()

Este gráfico muestra la distribución de la profundidad de los sismos según el tipo de límite tectónico. Se observa que los sismos en límites convergentes y transformantes tienen una distribución similar, con medianas alrededor de los 300-400 km. En cambio, los sismos en límites divergentes tienen una mayor variabilidad, con una mediana más alta y algunos valores que alcanzan profundidades superiores a 600 km.Esto sugiere que los límites divergentes pueden generar sismos a mayores profundidades en algunos casos.

Al observar conjuntamente el gráfico de barras y el boxplot, se puede notar que el tipo de límite tectónico más frecuente es el divergente, seguido por el convergente y finalmente el transformante. Sin embargo, esta frecuencia no se traduce directamente en mayor profundidad de los sismos. Aunque los límites divergentes predominan en número, presentan una gran variabilidad en la profundidad de los eventos sísmicos, con un rango amplio que abarca desde sismos muy superficiales hasta profundos. Por su parte, los límites transformantes, a pesar de ser los menos frecuentes, muestran una mediana de profundidad mayor que los otros dos tipos, lo que sugiere que en estas zonas los sismos tienden a ocurrir a mayores profundidades. En cambio, los límites convergentes, conocidos por su asociación con zonas de subducción y terremotos potentes, presentan en este caso una mediana de profundidad más baja, aunque con una distribución también amplia. Este contraste entre frecuencia y profundidad indica que no necesariamente los límites más comunes son los que generan los sismos más profundos, resaltando la complejidad de los procesos tectónicos involucrados.

Parte 2: Estimaciones Estadísticas

Número de observaciones

n <- nrow(data)
print(nrow(data))
## [1] 100

1. Intervalo de confianza para la Media

media <- mean(data$Velocidad_Deriva_cmAño, na.rm = TRUE)
desv_est <- sd(data$Velocidad_Deriva_cmAño, na.rm = TRUE)
error_media <- qt(0.975, df = n-1) * (desv_est / sqrt(n))
ic_media <- c(media - error_media, media + error_media)
print(ic_media)
## [1] 4.892126 5.835515

Este análisis muestra el cálculo del intervalo de confianza para la media de la Velocidad de Deriva (en cm/año). El resultado final nos indica que, con un nivel de confianza del 95%, la media poblacional de la velocidad de deriva se encuentra entre 4.89 cm/año y 5.84 cm/año. En otras palabras, si se repitiera este estudio muchas veces con diferentes muestras, el 95% de las veces ese intervalo contendría la verdadera media de la velocidad de deriva. Este tipo de análisis es útil para tener una idea más precisa sobre el valor real de la media cuando trabajamos con una muestra y no con toda la población. Desde la geología, el intervalo de confianza para la media de la velocidad de deriva es clave porque permite estimar con precisión cómo se mueven las placas tectónicas. Esto ayuda a entender mejor la dinámica terrestre, predecir zonas de actividad sísmica y apoyar modelos de evolución geológica con datos más confiables.

2. Intervalo de confianza para una Proporción

prop <- sum(data$Tipo_Limite == "Convergente") / n
error_prop <- qnorm(0.975) * sqrt((prop * (1 - prop)) / n)
ic_prop <- c(prop - error_prop, prop + error_prop)
print(ic_prop)
## [1] 0.23784 0.42216

El intervalo de confianza entre 0.23784 y 0.42216 indica que, con un 95% de certeza, entre el 23.8% y el 42.2% de los límites analizados son de tipo “Convergente”. Aunque no son mayoritarios, representan una proporción significativa. Desde la perspectiva geológica, estos límites están asociados a la colisión de placas tectónicas, lo que implica posibles zonas de actividad sísmica, formación de montañas o vulcanismo. Su presencia en el estudio es relevante porque puede estar vinculada a dinámicas territoriales particulares, como riesgos geológicos, distribución de recursos naturales o delimitaciones influenciadas por la topografía. Por tanto, entender la proporción de este tipo de límite contribuye a interpretar no solo la configuración física del territorio, sino también sus implicaciones sociales, políticas y ambientales.

3. Intervalo de confianza para la Varianza

varianza <- var(data$Frecuencia_Sismos_Anual, na.rm = TRUE)
gl <- n - 1
chi_inf <- qchisq(0.025, df = gl)
chi_sup <- qchisq(0.975, df = gl)
ic_varianza <- c((gl * varianza) / chi_sup, (gl * varianza) / chi_inf)
print(ic_varianza)
## [1] 148.7723 260.4329

El intervalo de confianza calculado para la varianza de la frecuencia anual de sismos, que va de 148.77 a 260.43, indica que, con un 95% de certeza, la variabilidad real en la cantidad de sismos registrados por año se encuentra dentro de ese rango. Esta alta dispersión sugiere que la frecuencia de sismos no es constante, sino que presenta fluctuaciones importantes entre distintas regiones o periodos. En el contexto geológico del estudio, esta variabilidad puede estar asociada a diferencias estructurales del subsuelo como lo son los diferentes tipos de límites, además se puede tener en cuenta como la cercanía a fallas activas o zonas de subducción, donde la actividad tectónica es más intensa. La relevancia de este resultado radica en que permite dimensionar el nivel de incertidumbre y riesgo que enfrentan los territorios analizados, lo cual es fundamental para la planificación territorial, el diseño de infraestructuras resilientes y la implementación de estrategias de gestión del riesgo sísmico.

4. Diferencia de Medias

grupo1 <- data$Velocidad_Deriva_cmAño[data$Tipo_Limite == "Convergente"]
grupo2 <- data$Velocidad_Deriva_cmAño[data$Tipo_Limite == "Divergente"]
media1 <- mean(grupo1, na.rm = TRUE)
media2 <- mean(grupo2, na.rm = TRUE)
desv1 <- sd(grupo1, na.rm = TRUE)
desv2 <- sd(grupo2, na.rm = TRUE)
n1 <- length(grupo1)
n2 <- length(grupo2)
error_diff <- qt(0.975, df = min(n1, n2)-1) * sqrt((desv1^2/n1) + (desv2^2/n2))
ic_diff_medias <- c((media1 - media2) - error_diff, (media1 - media2) + error_diff)
print(ic_diff_medias)
## [1] -0.7058808  1.6436512

El intervalo de confianza para la diferencia de medias entre la velocidad de deriva en límites convergentes y divergentes es de [-0.7059, 1.6437], lo que indica que no hay evidencia estadística de una diferencia significativa entre ambos. Desde el enfoque geológico, aunque los límites convergentes y divergentes responden a dinámicas muy distintas colisión y separación de placas, respectivamente, este resultado sugiere que, en los datos analizados, sus velocidades de desplazamiento no difieren de forma clara, posiblemente por variaciones locales o por la escala general del estudio.

5. Diferencia de Proporciones

prop1 <- sum(data$Tipo_Limite == "Convergente") / n
prop2 <- sum(data$Tipo_Limite == "Divergente") / n
error_diff_prop <- qnorm(0.975) * sqrt((prop1 * (1 - prop1) / n) + (prop2 * (1 - prop2) / n))
ic_diff_prop <- c((prop1 - prop2) - error_diff_prop, (prop1 - prop2) + error_diff_prop)
print(ic_diff_prop)
## [1] -0.1616973  0.1016973

El intervalo de confianza para la diferencia de proporciones entre límites convergentes y divergentes es de [-0.1617, 0.1017], lo que indica que no hay evidencia estadística suficiente para afirmar que una de estas proporciones sea significativamente mayor que la otra. Desde una perspectiva geológica, aunque estos tipos de límites implican dinámicas tectónicas muy distintas, este resultado sugiere que su representación en el territorio analizado es estadísticamente comparable.

6. Razón de Varianzas

var1 <- var(grupo1, na.rm = TRUE)
var2 <- var(grupo2, na.rm = TRUE)
ratio_varianza <- var1 / var2
gl1 <- length(grupo1) - 1
gl2 <- length(grupo2) - 1
f_inf <- qf(0.025, df1 = gl1, df2 = gl2)
f_sup <- qf(0.975, df1 = gl1, df2 = gl2)
ic_ratio_var <- c(ratio_varianza / f_sup, ratio_varianza / f_inf)
print(ic_ratio_var)
## [1] 0.6095585 2.4212448

El intervalo de confianza para la razón de varianzas entre los grupos (convergente/divergente) es [0.6096, 2.4212], lo que indica que no se puede afirmar con certeza que una de las varianzas sea significativamente mayor que la otra. En términos geológicos, esto sugiere que la variabilidad en la velocidad de deriva es comparable entre ambos tipos de límites tectónicos (como se logró observar en el primer gráfico de barras). A pesar de sus diferencias estructurales como la subducción en convergentes y la expansión en divergentes, la dispersión en sus velocidades no muestra diferencias estadísticamente claras, lo cual refuerza la idea de una dinámica tectónica más compleja de lo que una simple clasificación puede reflejar.

##CONCLUSIÓN

En este análisis estadístico sobre los diferentes tipos de límites de pacas tectónicas se logró revelar que, no parecen haber diferencias significativas en el caso de proporciones, medias, varianzas ni dispersión de los parámetros estudiados entre límites convergentes y divergentes. Aunque, si se observa desde una perspectiva geológica los límites si contienen diferencias en como cambian la superficie de la tierra. Esto sugiere que la dinámica tectónica, aunque estructuralmente distinta, puede presentar comportamientos similares en ciertos aspectos cuantificables a escala regional o global. Además, la ausencia de diferencias significativas invita a considerar factores locales, como la interacción entre placas específicas, las condiciones del manto superior o el tipo de litosfera involucrada, como posibles explicaciones para esta aparente uniformidad. En conjunto, los resultados refuerzan la importancia de complementar el análisis estadístico con interpretaciones geológicas profundas para comprender la complejidad del comportamiento tectónico terrestre.

```