1. Cel i zakres projektu

Głównym wyzwaniem badawczym jest precyzyjna estymacja czasu pozostałego do wystąpienia awarii krytycznej, zdefiniowanego jako Remaining Useful Life (RUL).

Tradycyjne modele serwisowania opierają się na sztywnych interwałach czasowych, co często prowadzi do przedwczesnej wymiany sprawnych komponentów lub, co gorsza, do nieprzewidzianych awarii w trakcie eksploatacji. Wykorzystanie wielowymiarowych danych sensorowych pozwala na monitorowanie stanu zdrowia silnika w czasie rzeczywistym i przejście na model predykcyjny.

Aplikacja pozwalająca na analizę i wyświetlanie danych, uzyskanych w wyniku działania uczenia maszynwego, znajduje się tutaj: https://understawka.shinyapps.io/ProjektRPodstawkaRemigiusz/

2. Metodologia Przetwarzania Wstępnego

Surowe dane sensorowe pochodzące z bazy NASA C-MAPSS, charakteryzują się dużą wariancją oraz różnorodnością skali pomiarowej. Algorytmy uczenia maszynowego, żeby mogły poprawnie identyfikować wzorce degradacji, potrzebowały niezbędnej obróbki wstępnej.

2.1. Inżynieria cech i filtracja sygnałów

Kluczowym elementem przygotowania danych było zwiększenie stosunku sygnału do szumu. Zastosowano średnią kroczącą z oknem 5 cykli pracy. Pozwoliło to na wygładzenie chwilowych fluktuacji sensorów, wynikających np. z błędów pomiarowych lub chwilowych zakłóceń i wyciągnięcie faktycznego trendu degradacji materiałowej podzespołów.

2.2. Standaryzacja Z-score

Ze względu na to, że sensory mierzą parametry fizyczne o skrajnie różnych rzędach wielkości np. temperatury mierzone w setkach stopni oraz ciśnienia w dziesiątkach jednostek, zastosowano standaryzację. Sprowadza ona wszystkie zmienne do bezwymiarowej skali, gdzie 0 reprezentuje średnią, a wartości +/- reprezentują odległość od niej mierzoną, w odchyleniach standardowych. Zapobiega to dominacji modelu przez sensory o naturalnie wyższych wartościach liczbowych.

3. Charakterystyka Degradacji

Poniższy wykres prezentuje zachowanie sensora s4. Jest to jeden z najbardziej krytycznych parametrów termodynamicznych silnika.

Wyraźna tendencja wzrostowa sensora s4, szczególnie widoczna po 140 cyklu pracy, jest bezpośrednim dowodem na postępujące zużycie badanych elementów oraz spadek efektywności ich działania. Wartości dodatnie oznaczają, że parametry silnika zaczynają niebezpiecznie odbiegać od normy eksploatacyjnej.

4. Redukcja wymiarowości (PCA)

Współczesna diagnostyka operuje na dziesiątkach czujników jednocześnie. Analiza każdego z nich z osobna jest nieefektywna. Zastosowano Analizę Składowych Głównych (PCA), która pozwala ująć informację z 21 sensorów w dwóch syntetycznych wskaźnikach: PC1 i PC2.

Punkty na wykresie PCA tworzą tzw. trajektorię degradacji. Przesunięcie punktów wzdłuż osi PC1 od fioletu do żółci, to matematyczny zapis procesu starzenia się maszyny. Metoda ta pozwala zidentyfikować stan silnika, nawet jeśli żaden pojedynczy sensor nie przekroczył jeszcze progu alarmowego.

5. Modelowanie predykcyjne

Aby uzyskać konkretną liczbę cykli pozostałych do awarii, wytrenowano model Wielokrotnej Regresji Liniowej. Model ten przypisuje wagi poszczególnym sensorom, tworząc funkcję predykcyjną.

Analiza korelacji wskazuje, które sensory dostarczają modelowi najwięcej informacji. Sensory o najwyższym współczynniku, bliskim 1.0, są decydujące dla trafności prognozy.

Tabela 1: Ranking najważniejszych indykatorów diagnostycznych
Sensor Korelacja_abs
s4 s4 0.728
s11 s11 0.727
s21 s21 0.719
s15 s15 0.719
s20 s20 0.714

6. Podsumowanie i ograniczenia modelu

Zastosowane metody przetwarzania sygnałów i redukcji wymiarowości pozwoliły na stworzenie stabilnego modelu predykcyjnego. Wyniki wizualizacji PCA potwierdzają, że proces degradacji silnika jest procesem mierzalnym i powtarzalnym, co umożliwia skuteczne planowanie działań serwisowych.

Kluczowe wnioski i obserwacje:

  1. Wydajność modelu: Zaprezentowany model wykazuje bardzo wysoką precyzję dla zbiorów danych o stałych warunkach operacyjnych, np. FD001, gdzie proces degradacji jest dominującym źródłem wariancji danych.

  2. Ograniczenia: Należy podkreślić, że obecny model oparty na regresji liniowej napotyka trudności w przypadku zbiorów o zmiennych warunkach lotu, takich jak FD002, FD004. W takich przypadkach różnice wynikające ze zmian wysokości i prędkości lotu, maskują sygnał degradacji, co czyni prostą regresję niewystarczającą.

  3. Perspektywy: Rozszerzenie modelu o algorytmy nieliniowe, np. Random Forest oraz normalizację sensorów względem konkretnych reżimów pracy, pozwoliłoby na uzyskanie satysfakcjonujących wyników, również dla bardziej złożonych baz danych NASA C-MAPSS.