- Datos funcionales: Clasificación de datos funcionales del ritmo circadiano de las abejas meliferas
- Datos espacio-temporales: Análisis de datos sismicos en Puerto Rico para el periodo de diciembre 2019 hasta enero 2021
- Machine learning: Catálisis de alto rango dinámico(HDR): Dinámica estructural de nivel atómico en catalizadores
El Ritmo circadiano de los seres vivos importante para el estudio de procesos fisiológicos complejos tales como:
El Premio Nobel de Fisiología o Medicina 2017: Jeffrey C. Hall (New York), Michael Rosbash (Kansas) y Michael W. Young(Miami) “Por sus descubrimientos en los mecanismos moleculares que controlan el ritmo circadiano”.
Definición (Gasser-1984, Rice y Silverman-1991)
Los datos funcionales consisten en una muestra aleatoria de funciones de valores reales independientes, \( \chi_1(t), \dots, \chi_n(t) \), en un intervalo compacto \( I = [0, T] \subseteq \mathbb{R} \).
Métodos de expansión de base (\( B \)):
Algunas bases más usadas para \( \phi \), son: Bspline, Furier, Wavelets, etc.
\( E(\varepsilon_{i})=0 \) y \( Var(\varepsilon_{i})=\sigma^2 \)
Lomb-Scargle periodograma - Lomb (1976) and Scargle (1982) Schuster (1898) define el periodograma como una medida del poder relativo de una serie temporal en función de la frecuencia.
Este método define periodicidades ocultas, o pequeñas variaciones periódicas oculta detrás de fluctuaciones irregulares.
Sea \( X_i=X_{t_i} \), para \( i=1,2,\dots, n \), entonces \( \bar{X}=\frac{\sum_{i=1}^n X_i}{n} \) y \( \hat{\sigma}^2=\frac{\sum_{i=1}^n(X_i-\bar{X})}{n-1} \)
El Lomb-Scargle periodograma se define como:
\[ \left( \frac{ \left[ \sum_{j}(X_j-\bar{X})cosw(t_j-\tau) \right]^2}{\sum_{j}cos^2w(t_j-\tau) }\right) + \frac{ \left[ \sum_{j}(X_j-\bar{X}senw(t_j-\tau) \right]^2}{\sum_{j}sen^2w(t_j-\tau) } \]
Aquí \( \tau \) está definido por \( \tan(2w\tau)=\frac{\sum_{j}sen2w(t_j\tau)}{\sum_{j}cos2w(t_j\tau)} \)
Estamos interesados en la probabilidad de que la potencia del periodograma a la frecuencia dada sea mayor que un umbral especificado \( z \). Esto es dado por
\[ P[Z>z] =1- P_Z(z)=e^{-z/\sigma_X^2} \]
Cuando \( z \rightarrow \infty \) es exponencialmente menos probable que un nivel de potencia tan alto (o superior) pueda ser producido solo por ruido puro. Analogamente, es más probable que el nivel de potencia observado se deba a un determinismo genuino (es decir, no ruido) en la señal medida.
Sea \( X_t=(x_1,x_2,\dots, x_n) \) una serie de actividad en el tiempo. Definimos las subseries \( I_{j,k} \) de \( X_t \), para \( k \) fijo:
\[ I_{j,k} = X_{1 \leqslant t \leqslant (j \times k)} = (x_1, x_2, \dots, x_{j \times k}), \quad j = 1, 2, \dots, n/k \]
Para determinar la potencia (p−value) de la prueba de periodicidad para cada \( i \); de tal manera, que el tiempo \( t \) tal que la serie de p−values < 0.05 lo denominamos \( t_{stable} \), y lo representamos así:
\[ t_{stable}=\max_{1 \leqslant t \leqslant n}\{t \mid p_{t-1} > p_t \hspace{0.2cm} \wedge \hspace{0.2cm} p_{t}<0.05 \} \]
La curva \( x_i \) modela la serie de p-values \( p_{t(i)}=(p_1,…,p_{t_{stable}},…,p_{k−1},p_k) \), de la abeja i.
Podemos decir, que el tiempo \( tstable \) define el comportamiento del inicio del ritmo circadiano de la abeja \( i \).
Actograma: actividad de las abejas
Serie: actividad de las abejas
Periodo de actividad de la abeja
Evolución de la serie de p-valores
Clasificación final de las abejas por temperatura
Actualmente, estamos trabajando en la modelación espacio temporal de los ciclos sismicos en la isla de Puerto Rico. En esta parte, presentaremos algunos análisis previos descriptivos sobre la parte espacial y temporal del fenomeno de los sismos en la región del caribe que comprende la isla y sus alrededores.
Los municipios de mayor impacto tanto en la cantidad de sismos como en la intensidad de ellos fueron Guánica y Guayanilla, aunque pueblos cercanos a estos también han sido afectados significativamente y se tuvieron que crear refugios para las personas. Desde diciembre de 2019 ha ocurrido una actividad sísmica fuerte en Puerto Rico, principalmente en el suroeste de la isla, y ha sido evidente que los municipios no cuentan con las infraestructuras adecuadas para este tipo de emergencias.
Mediante el mapa podemos ver la gran proporción de sismos en los dos grupos de intensidad igual o mayor que 2.08 Mw y menor que 4.24 Mw.
Del mapa anterior, vemos también que el 100% de los sismos con intensidad mayor a 5.32 Mw ocurrieron en el área sur- oeste de Puerto Rico ya sea en tierra o en el mar, y todos con un radio aproximadamente menor a 25km del centro de masa (lat = 18.03999, lon = -66.8949).
No obstante, frente a los otros rangos de intensidad de sismos, como los 71 sismos con intensidad mayor o igual a 4.24 Mw que representan el 0.51% del total, aunque el porcentaje de estos últimos es pequeño estos sismos son los más significativos y el motivo de nuestro estudio.
La cantidad de incidencias según localización fue muy variada y más adelante mostraremos detalles de las 37 localizaciones más destacadas según ese número.
Es importante mencionar que las primeras 9 que lideran este ranking de localizaciones epicentros después del océano (10227) fueron:
Estas 9 localizaciones muestran frecuencias superiores a 125 sismos; y en conjunto con las del océano acumulan 13 140 sismos (aprox. 94.44% del total).
En la distribución mensual de la cantidad de sismos ocurridos durante el periodo de estudio podemos resaltar la gran diferencia observada de la cantidad de sismos ocurridos en enero 2020 respecto a los demás meses del 2020 y la primera quincena del 2021.
Hubo más de 4500 sismos, que se redujeron en tres cuartas partes durante el mes de febrero 2020 y continuaron disminuyendo julio 2020; para luego continuar decreciendo en diciembre del 2020.
Aproximadamente el 91% de los sismos se presentan en una región circular cuyo centro es el centro de masa (a esta regón la llamaremos región I). El área de la región I es de 5026.3 \( Km^2 \). La región rectangular que abarca completa para nuestro análisis; de coordenadas lat 17.2 \( S \), 19.5 \( N \) y lon 68.2 \( O \), 65 \( E \), la llamaremos región II; esta región tiene un área de 76748.9 \( Km^2 \) (ver mapa inicial).
Existe un punto de cambio en la serie de la magnitud de los sismos; este punto se da el 07/01/2020 a las 3:29 am, en donde se registra un sismo de 2.48 Mw, de profundidad de 3 Km, en la falla Punto Montalva.
Esta ruptura es la antesala del aumento en la magnitud promedio de los sismos en la serie que fue de 2.25 Mw y posteriormente aumenta a 2.64 Mw.
El promedio en la profundidad, que era de 27.3 Km antes del punto de ruptura y que pasa a ser 10.88 Km posteriormente.
Lo anterior significa que:
Ejemplo: la energía liberada por una explosión nuclear de 10 kilotones es de 106 MJ y equivale a un terremoto de magnitud igual a 5.5 Mw.
Introduction
What are Catalysts Catalysts Surface Structural Motifs Why Does it Matter? TEM images Enzymes smFRET Denoising Denoising TEM images High Dimensionality Dimension Reduction for TEM images Modeling Dynamics in Proteins Change Point Analysis Hidden Markov Models (HMM) HMM for FRET HMM
La dinámica estructural de nivel atómico en catalizadores es un proyecto de la NSF financiado con el objetivo de aprovechar las herramientas de estadísticas modernas y machine learning para realizar actividades basadas en descubrir caracteristicas de los catalizadores, basandose en la dinamica a nivel atómico.
El proyecto se basó en la experiencia complementaria en ciencia de materiales, biofísica, estadística y ciencia de datos.
En la fase I, el objetivo de la investigación es explorar, describir y cuantificar la dinámica estructural a nivel atómico del sistema catalitico catalíticos con foco en enzimas y nanopartículas.
El proceso de transformación química catalítica está asociado con reordenamientos estructurales dinámicos y el grado de La reconfiguración es específica del sistema (es decir, catalizador, reactivos y productos).
Hasta hace poco, estas evoluciones estructurales eran relativamente inexplorado debido a la falta de herramientas experimentales con suficiente Resoluciones espaciales y temporales.
Aquí exploraremos la evolución espacio-temporal de sistemas de nanopartículas y enzimas que utilizan una combinación de novedosos instrumentación de última generación, ciencia de datos y técnicas de modelado.
Si \( E_i \) es la energía del reactivo, \( E_f \) la energía del producto, y \( E_i > E_f \) , a medida que avanza la reacción, el panorama energéticodebe enfrentar una barrera de energía, \( E_a \).
La técnica TEM, o microscopía de la transmisión electrónica de un objeto (TEM) dispara un haz deelectrones a través de una muestra para producir una imagen ampliada de un objeto.
Ejemplo: Imagen TEM y cómo puede mostrar iones positivos (catión)cambiando
a) Imagen TEM de la superficie de la molecula \( CeO2 \) (111) de una \( CeO_2 \); la columna \( Ce \) aparece difusa en cada sitio de paso. La serie de imágenes consecutivas de la b) a la d), muestran un cambio cationico de 0.5 en cada paso(ver flechas).
Análisis de puntos de cambio
Usando el algoritmo de multiple puntos de cambio (ecp) (Matteson and James 2014) de forma simultanea para el donante (donor) (violeta), receptor (aceptor) (verde) y la eficiencia del FRET (gráfico de la serie insertada (negro)); el algoritmo identifica los puntos donde los estados cambian.
Despues de \( t = 2 seg \) y \( t = 4 seg \), un cambio falso en solo la señal del receptor es detectada; pero esto no fue detectada en la señal de la eficiencia del FRET. Luego, un poco más tarde, el tinte de la señal del aceptor se oscurece. El tinte de la señal del donante se oscurece alrededor de \( t = 9 seg \)
\[ \frac{\text{fluorescencia del receptor}}{(fluorescencia del receptor + fluorescencia del donante)} \]
\[ P(x, s|\theta) = \psi_{n=2}^ = P( s_n| s_{n− 1}, A)_{n=1}^ = P(x_n|s_n, \mu, \sigma^2) \]
Modelos ocultos de Markov (HMM) y redes neuronales artificiales (ANN)