Algunos temas de interes para posibles investigaciones en la maestría

logo

Msc. Roberto Trespalacios

Programa de Maestría en Estadística Aplicada

Universidad Tecnológica de Bolivar

Temas

  • Machine learning: Modelos ocultos de Markov (HMM) y redes neuronales artificiales (ANN)
  • Clasificación de curvas usando análisis de datos funcionales
  • Modelación de datos geoespaciales y espacio-temporales

Modelación de datos geoespaciales y espacio-temporales

Actualmente, estamos trabajando en la modelación de los ciclos sismicos en la Isla de Puerto Rico. La motivación de este trabajo, se debe a la gran incidencia de los terremotos en la región. Desde diciembre de 2019 ha ocurrido una actividad sísmica fuerte en Puerto Rico, principalmente en el suroeste de la isla, y ha sido evidente que los municipios no cuentan con las infraestructuras adecuadas para este tipo de emergencias. Muchos terremotos notorios, siendo el más fuerte de magnitud 6.4 Mw, se han dado desde entonces. Los municipios de mayor impacto tanto en la cantidad de sismos como en la intensidad de ellos fueron Guánica y Guayanilla, aunque pueblos cercanos a estos también han sido afectados significativamente y se tuvieron que crear refugios para las personas. A partir de febrero de 2020 hubo disminución de sismos hasta junio, luego continuó siendo menos la actividad sísmica hasta diciembre de 2020 en que hubo un ligero aumento para luego cesar más.

Las técnicas de interpolación pueden clasificarse en las siguientes cinco clases principales:

  • Interpolación de punto/interpolación de área
  • Interpolaciones globales/locales
  • Interpolaciones exactas/aproximadas
  • Interpolaciones estocástica/determinista
  • Interpolaciones graduales/abruptas

Interpolación para puntos/linea/área

  • En la interpolación de puntos, dado un número de puntos cuyas ubicaciones y valores son conocidos, determine los valores de otros puntos en ubicaciones predeterminadas.
  • La interpolación de puntos se usa para datos que se pueden recopilar en ubicaciones de puntos.
  • Ejemplo: lecturas de estaciones meteorológicas, alturas de puntos, lecturas de pozos de petróleo, mediciones de porosidad.
  • La interpolación punto a punto es el tipo de interpolación espacial que se realiza con más frecuencia en GIS(Sistema de informacion georeferencial).
    Datos de precipitaciones

Interpolación para puntos/linea/área

  • Los datos de entrada no necesariamente tienen que ser puntos. De hecho, puntos, líneas y/o áreas pueden ser interpoladas.
  • A menudo, los mapas tienen la elevación representada como isolíneas, donde la elevación es la misma a lo largo de una línea particular.
  • Si tales isolíneas se digitalizaran, podrían interpolarse para crear una superficie continua (DEM). Pero a menudo, las isolíneas son el resultado de una primera interpolación.
    Lineas de contornos para la elevación

Interpolación para puntos/linea/área

  • La tercera opción, la interpolación basada en áreas, no es muy común, pero existe sin embargo.
  • En la interpolación por áreas, dado un conjunto de datos mapeados en un conjunto de zonas de origen, determina los valores de los datos para un conjunto diferente de zonas objetivo.
  • Ejemplo: si se tiene un ráster poblacional, que muestra el número de personas por \( km^2 \) y se quiere estimar la población por municipio, se podría utilizar dicho método.
    Conteos de población para secciones censales, estimación de poblaciones para distritos electorales

Interpolación global/local

  • Los métodos de interpolación global aplican una única función(método) matemática a todos los puntos de datos observados y generalmente producen superficies lisas.
  • Un cambio en un valor de entrada afecta todo el mapa.
  • La interpolación global se usa cuando hay una hipótesis sobre la forma de los datos sobre la superficie en general.
  • Los métodos locales aplican repetidamente una única función matemática a pequeños subconjuntos del conjunto total de puntos de datos observados y luego vinculan estas superficies regionales para crear una superficie compuesta que cubre todo el área de estudio.
  • Un cambio en un valor de entrada solo afecta el resultado dentro de la ventana.
  • Algunos interpoladores locales pueden ampliarse para incluir una gran proporción de los puntos de datos en el conjunto, lo que los hace en un sentido global.

Interpolación exacta/aproximada

  • Los métodos exactos de interpolación de puntos respetan todos los puntos de datos observados para los cuales hay datos disponibles.
  • Esto significa que la superficie producida pasa exactamente a través de los puntos de datos observados, y no debe suavizar o alterar sus valores.
  • Los métodos exactos son más apropiados cuando hay un alto grado de apego a las mediciones realizadas en los puntos de datos observados.
  • Interpoladores proximales, B-splines y el método Kriging, estiman sobre todos los puntos de datos dados
  • Los métodos de interpolación aproximados no tienen que respetar los puntos de datos observados, pero pueden suavizarlos o modificarlos para que se ajusten a una tendencia general.
  • Los métodos aproximados son más apropiados cuando existe un grado de incertidumbre en torno a las mediciones realizadas en el punto de muestra.

Interpolación gradual/abrupta

  • Los métodos de interpolación gradual y abrupta se distinguen por la continuidad de la superficie producida.
  • Los métodos graduales producen una superficie lisa entre los puntos de muestra, mientras que los métodos abruptos producen superficies con una apariencia escalonada.
  • El modelo de terreno puede requerir ambos métodos, ya que puede ser necesario reproducir cambios graduales entre los puntos observados, por ejemplo en un terreno ondulado, y cambios abruptos en los que se producen acantilados y valles.
  • Un ejemplo típico de un interpolador gradual es el promedio móvil ponderado por distancia.
  • Usualmente produce una superficie interpolada con cambios graduales.
  • Sin embargo, si el número de puntos usados en el promedio móvil se reduce a un número pequeño, o incluso uno, habría cambios abruptos en la superficie. Ejemplo: Frentes meteorológicos producirá valores rápidamente cambiantes pero continuos. Fallas geológicas producirá cambios abruptos.

Interpolación determinística o estocástica

  • Los métodos determinísticos de interpolación se pueden usar cuando hay suficiente conocimiento sobre la superficie geográfica que se modela para permitir que su carácter se describa como una función matemática.
  • Desafortunadamente, esto rara vez es el caso de las superficies utilizadas para representar las características del mundo real.
  • Para manejar esta incertidumbre, se usan modelos estocásticos (aleatorios) para incorporar variación aleatoria en la superficie interpolada.
  • Los métodos estocásticos incorporan el concepto de aleatoriedad.
  • La superficie interpolada se conceptualiza como una de muchas que se podrían haber observado, todas las cuales podrían haber producido los puntos de datos conocidos.
  • Los interpoladores estocásticos incluyen análisis de superficie de tendencia, los procedimientos tales como el análisis de superficie de tendencia permiten calcular la significación estadística de la superficie y la incertidumbre de los valores predichos.
    Análisis de Fourier y Kriging

Ejemplo: Precipitación en California

Trabajaremos con los datos de Precipitacion de California.

processing file: sec_4_geo.Rpres
Quitting from lines 247-249 (sec_4_geo.Rpres) 
Error: '~/Desktop/curso_glm_utb/geo-estadistica/pres.geo/sec_4_geo/precipitacion.csv' does not exist.
Execution halted