Rumo a um novo filtro de anomalias baseadas em distribuições de probabilidade
Motivação
- Há muitos métodos de detecção de anomalias em séries temporais, podem se subdividir em supervisionados e não supervisionados
- No que tange aos métodos não-supervisionados, existem diversos algoritmos disponíveis. Alguns exemplos incluem DBSCAN, K-MEANS e AUTOENCODER.
- Esses algoritmos podem detectar anomalias em séries temporais, no entanto, eles tem algumas limitações, uma delas é que só podem detectar a sequência anômala, não as observações individuais dentro da sequência que são anômalas
Método
- Distribuição Única: Todas as janelas anômalas são agrupadas em uma única distribuição, em seguida o tipo de distribuição é identificado (normal, uniforme, etc.) e ao definir um limiar, pontos acima do mesmo são considerados anômalos.
- Distribuição Única das janelas normalizadas: Todas as janelas são normalizadas por observações na janela e as sequências anômalas são agrupadas em uma única distribuição, em seguida o tipo de distribuição é identificado (normal, uniforme, etc.) e ao definir um limiar, pontos acima do mesmo são considerados anômalos.
- Janelas Estendidas: As janelas anômalas são aumentadas para um tamanho maior, Essa técnica visa melhorar a estimativa das distribuições de probabilidade e pontos anômalos são identificados com base na distribuição estimada da janela estendida.
Próximos passos
- Aguardar a alteração do professor Ogasawara da biblioteca do Harbinger para ter output com as séries das anomalias já com diferenciação.
- Escrever a metodologia em formalidade matemática (Aceitamos ajuda) 🍻 .