Głównym wyzwaniem badawczym jest precyzyjna estymacja czasu pozostałego do wystąpienia awarii krytycznej, zdefiniowanego jako Remaining Useful Life (RUL).
Tradycyjne modele serwisowania opierają się na sztywnych interwałach czasowych, co często prowadzi do przedwczesnej wymiany sprawnych komponentów lub, co gorsza, do nieprzewidzianych awarii w trakcie eksploatacji. Wykorzystanie wielowymiarowych danych sensorowych pozwala na monitorowanie stanu zdrowia silnika w czasie rzeczywistym i przejście na model predykcyjny.
Aplikacja pozwalająca na analizę i wyświetlanie danych, uzyskanych w wyniku działania uczenia maszynwego, znajduje się tutaj: https://understawka.shinyapps.io/ProjektRPodstawkaRemigiusz/
Surowe dane sensorowe pochodzące z bazy NASA C-MAPSS, charakteryzują się dużą wariancją oraz różnorodnością skali pomiarowej. Algorytmy uczenia maszynowego, żeby mogły poprawnie identyfikować wzorce degradacji, potrzebowały niezbędnej obróbki wstępnej.
Kluczowym elementem przygotowania danych było zwiększenie stosunku sygnału do szumu. Zastosowano średnią kroczącą z oknem 5 cykli pracy. Pozwoliło to na wygładzenie chwilowych fluktuacji sensorów, wynikających np. z błędów pomiarowych lub chwilowych zakłóceń i wyciągnięcie faktycznego trendu degradacji materiałowej podzespołów.
Ze względu na to, że sensory mierzą parametry fizyczne o skrajnie różnych rzędach wielkości np. temperatury mierzone w setkach stopni oraz ciśnienia w dziesiątkach jednostek, zastosowano standaryzację. Sprowadza ona wszystkie zmienne do bezwymiarowej skali, gdzie 0 reprezentuje średnią, a wartości +/- reprezentują odległość od niej mierzoną, w odchyleniach standardowych. Zapobiega to dominacji modelu przez sensory o naturalnie wyższych wartościach liczbowych.
Poniższy wykres prezentuje zachowanie sensora s4. Jest to jeden z najbardziej krytycznych parametrów termodynamicznych silnika.
Wyraźna tendencja wzrostowa sensora s4, szczególnie widoczna po 140 cyklu pracy, jest bezpośrednim dowodem na postępujące zużycie badanych elementów oraz spadek efektywności ich działania. Wartości dodatnie oznaczają, że parametry silnika zaczynają niebezpiecznie odbiegać od normy eksploatacyjnej.
Współczesna diagnostyka operuje na dziesiątkach czujników jednocześnie. Analiza każdego z nich z osobna jest nieefektywna. Zastosowano Analizę Składowych Głównych (PCA), która pozwala ująć informację z 21 sensorów w dwóch syntetycznych wskaźnikach: PC1 i PC2.
Punkty na wykresie PCA tworzą tzw. trajektorię degradacji. Przesunięcie punktów wzdłuż osi PC1 od fioletu do żółci, to matematyczny zapis procesu starzenia się maszyny. Metoda ta pozwala zidentyfikować stan silnika, nawet jeśli żaden pojedynczy sensor nie przekroczył jeszcze progu alarmowego.
Aby uzyskać konkretną liczbę cykli pozostałych do awarii, wytrenowano model Wielokrotnej Regresji Liniowej. Model ten przypisuje wagi poszczególnym sensorom, tworząc funkcję predykcyjną.
Analiza korelacji wskazuje, które sensory dostarczają modelowi najwięcej informacji. Sensory o najwyższym współczynniku, bliskim 1.0, są decydujące dla trafności prognozy.
| Sensor | Korelacja_abs | |
|---|---|---|
| s4 | s4 | 0.728 |
| s11 | s11 | 0.727 |
| s21 | s21 | 0.719 |
| s15 | s15 | 0.719 |
| s20 | s20 | 0.714 |
Zastosowane metody przetwarzania sygnałów i redukcji wymiarowości pozwoliły na stworzenie stabilnego modelu predykcyjnego. Wyniki wizualizacji PCA potwierdzają, że proces degradacji silnika jest procesem mierzalnym i powtarzalnym, co umożliwia skuteczne planowanie działań serwisowych.
Kluczowe wnioski i obserwacje:
Wydajność modelu: Zaprezentowany model wykazuje bardzo wysoką precyzję dla zbiorów danych o stałych warunkach operacyjnych, np. FD001, gdzie proces degradacji jest dominującym źródłem wariancji danych.
Ograniczenia: Należy podkreślić, że obecny model oparty na regresji liniowej napotyka trudności w przypadku zbiorów o zmiennych warunkach lotu, takich jak FD002, FD004. W takich przypadkach różnice wynikające ze zmian wysokości i prędkości lotu, maskują sygnał degradacji, co czyni prostą regresję niewystarczającą.
Perspektywy: Rozszerzenie modelu o algorytmy nieliniowe, np. Random Forest oraz normalizację sensorów względem konkretnych reżimów pracy, pozwoliłoby na uzyskanie satysfakcjonujących wyników, również dla bardziej złożonych baz danych NASA C-MAPSS.