Rumo a um novo filtro de anomalias baseadas em distribuições de probabilidade

Motivação

  • Há muitos métodos de detecção de anomalias em séries temporais, podem se subdividir em supervisionados e não supervisionados
  • No que tange aos métodos não-supervisionados, existem diversos algoritmos disponíveis. Alguns exemplos incluem DBSCAN, K-MEANS e AUTOENCODER.
  • Esses algoritmos podem detectar anomalias em séries temporais, no entanto, eles tem algumas limitações, uma delas é que só podem detectar a sequência anômala, não as observações individuais dentro da sequência que são anômalas

Método

  • Distribuição Única: Todas as janelas anômalas são agrupadas em uma única distribuição, em seguida o tipo de distribuição é identificado (normal, uniforme, etc.) e ao definir um limiar, pontos acima do mesmo são considerados anômalos.
  • Distribuição Única das janelas normalizadas: Todas as janelas são normalizadas por observações na janela e as sequências anômalas são agrupadas em uma única distribuição, em seguida o tipo de distribuição é identificado (normal, uniforme, etc.) e ao definir um limiar, pontos acima do mesmo são considerados anômalos.
  • Janelas Estendidas: As janelas anômalas são aumentadas para um tamanho maior, Essa técnica visa melhorar a estimativa das distribuições de probabilidade e pontos anômalos são identificados com base na distribuição estimada da janela estendida.

Avaliação Experimental

Série estacionária com ponto anômalo

Série estacionária com sequência anômala

Série não estacionária com ponto anômalo

Próximos passos

  • Aguardar a alteração do professor Ogasawara da biblioteca do Harbinger para ter output com as séries das anomalias já com diferenciação.
  • Escrever a metodologia em formalidade matemática (Aceitamos ajuda) 🍻 .

Obrigado!