Junio 20 - 2018

Temario

  • Introducción

Temario

  • Introducción
  • Definición de datos funcionales
    • Datos funcionales con expansiones de base
    • Periodograma de una serie de datos
    • Análisis de una serie de p-valores
    • Modelado de serie de p-valores (Dato funcional)

Temario

  • Introducción
  • Datos funcionales
    • Definición de datos funcionales y expansiones de base
    • Periodograma de una serie de datos
    • Análisis de una serie de p-valores
    • Modelado de serie de p-valores (Dato funcional)
  • Aplicación: al inicio del ritmo circadiano de abejas de la miel
    • Pre-procesamiento de datos
    • Actograma y serie de la actividad de las abejas
    • Clasificación de los datos funcionales

Introducción

Ritmo circadiano

El ritmo circadiano de los seres vivos importante para el estudio de procesos fisiológicos complejos tales como:

  • Ciclos de sueño
  • Comportamiento
  • Niveles de hormonales
  • Temperatura corporal
  • Metabolismo
  • Patrones de actividad
  • Busqueda de alimentos
  • Asimilación de medicamentos

logo

Trabajos importantes recientes en ritmo circadiano

logo


El Premio Nobel de Fisiología o Medicina 2017: Jeffrey C. Hall (New York), Michael Rosbash (Kansas) y Michael W. Young(Miami) "Por sus descubrimientos en los mecanismos moleculares que controlan el ritmo circadiano".

Datos funcionales

Definición de datos funcionales
Gasser(1984), Rice y Silverman(1991)

Los datos funcionales consisten en una muestra aleatoria de valores reales independientes funciones, \(\chi_1(t),\dots, \chi_n(t)\), en un intervalo compacto \(I = [0, T] \subseteq \mathbb{R}\) .

  • Cada \(x_i\) se pueden considerar realizaciones de un proceso estocástico unidimensional.
  • A menudo se supone que están en un espacio de Hilbert, como \(L^2(I)\).
  • Diremos que \(\chi(t) \in L^2(I)\) es un proceso estocástico \(\Leftrightarrow\) \(E\left[ \int_I \chi^2(t)dt \right] < \infty\).

Expanción base para datos funcionales

  • Representación de funciones no paramétricas de tiempo continuo.
  • Métodos de expansión de base (\(\textit{B}\)): \[ \chi_i(t)= \sum_{k=1}^k c_{ik}\phi_k(t) + \varepsilon_{i} \] \(\phi_k \in \textit{B}\), predefinidos y los coeficientes \(c_{ik} \in \mathbb{R}\).
  • Algunas bases más usadas para \(\phi\), son: Bspline, Furier, Wavelets, etc.
  • \(E(\varepsilon_{i})=0\) y \(Var(\varepsilon_{i})=\sigma^2\).

logo

Periodograma de la serie de datos \(X_t =\chi_i(t)\) para un \(i\) fijo.

Lomb-Scargle periodograma - Lomb (1976) and Scargle (1982)

  • Schuster (1898) define el periodograma como una medida del poder relativo de una serie temporal en función de la frecuencia.

  • Este método define periodicidades ocultas, o pequeñas variaciones periódicas oculta detrás de fluctuaciones irregulares.

Periodograma de la serie de datos \(X_t =\chi_i(t)\) para un \(i\) fijo

Sea \(X_i=X_{t_i}\) para \(i=1,2,\dots, n\), entonces \(\bar{X}=\frac{\sum_{i=1}^n X_i}{n}\) y \(\hat{\sigma}^2=\frac{\sum_{i=1}^n(X_i-\bar{X})}{n-1}\)

El Lomb-Scargle periodograma se define como:

\[ \left( \frac{ \left[ \sum_{j}(X_j-\bar{X})cosw(t_j-\tau) \right]^2}{\sum_{j}cos^2w(t_j-\tau) }\right) + \frac{ \left[ \sum_{j}(X_j-\bar{X}senw(t_j-\tau) \right]^2}{\sum_{j}sen^2w(t_j-\tau) } \] Aquí \(\tau\) está definido por \(tan(2w\tau)=\frac{\sum_{j}sen2w(t_j\tau)}{\sum_{j}cos2w(t_j\tau)}\)

Periodograma de la serie de datos \(X_t =\chi_i(t)\) para un \(i\) fijo

  • Estamos interesados en la probabilidad de que la potencia del periodograma a la frecuencia dada sea mayor que un umbral especificado \(z\). Esto es dado por

\[ Pr[Z>z] =1- P_Z(z)=e^{-z/\sigma_X^2} \]

  • Cuando \(z \rightarrow \infty\), es exponencialmente menos probable que un nivel de potencia tan alto (o superior) pueda ser producido solo por ruido puro.
  • Analogamente, es más probable que el nivel de potencia observado se deba a un determinismo genuino (es decir, no ruido) en la señal medida.

Análisis de la serie de p-valores

  • Sea \(X_t = (x_1, x_2, \dots, x_n)\) una serie de actividad en el tiempo.
  • Definimos las subseries \(I_{j,k}\) de \(X_t\), para \(k\) fijo: \[I_{j,k} = X_{1 \leqslant t \leqslant (j \times k)} = (x_1, x_2, \dots, x_{j \times k}), \quad j = 1, 2, \dots, n/k.\]
  • Determinar la potencia (\(p-value\)) de la prueba de periodicidad para cada \(i\).
  • El tiempo \(t\) tal que la serie de \(p-values < 0.05\) lo denominamos \(t_{stable}\).
    Lo representamos así:

\[ t_{stable}=\max_{1 \leqslant t \leqslant n}\{t \mid p_{t-1} > p_t \hspace{0.2cm} \wedge \hspace{0.2cm} p_{t}<0.05 \} \]

Análisis de la serie de p-valores

Curvas funcionales Bsplines de los p-valores

La curva \(x_i\) modela la serie de p-values \[p_t(i) = (p_1, \dots, p_{t_{stable}}, \dots, p_{k-1}, p_k)\] de la abeja \(i\).

  • Podemos decir, que el tiempo \(t_{stable}\) define el comportamiento del inicio del ritmo circadiano de la abeja \(i\).

logo

Aplicación

Ritmo circadiano de abejas de la miel
(Apis mellifera)

  • Los datos provienen de un experimento con dos grupos (2 grupos: \(25^\circ C\) y \(35^\circ C\)).
  • Cada uno de ellos con cuatro monitores (4 monitores).
  • Cada monitor con 32 abejas.
  • El tiempo de registro de actividad fué por 9 días (168 horas)
  • Las mediciones están hechas cada minuto.
logo

logo

Serie de actividad y pre-procesamiento de datos

Actograma: actividad de las abejas

output_option output_option

Serie: actividad de las abejas

output_option output_option

Periodogramas y series de p-valores

Periodo de actividad de la abeja

output_option output_option

Evolución de la serie de p-valores

output_option output_option

Curvas para todas las abejas del monitor 41 a una temperatura de \(35^\circ C\)

output_option

Clasificación de las abejas en cada temperatura

output_option output_option

Temperatura \(25 C^\circ\) \(35C^\circ\)
Clase 1 2 3 1 2 3
Inicio de periodo (horas) 27.58 27708.92 189.15 17.66 12.91 27.45
Cantidad de datos atipicos 3 2 1 2

¡Gracias!