WPROWADZENIE

Przygotowany projekt na celu ma zinterpretowanie danych organizacyjnych, które w tym wypadku mają pomóc odnaleźć trendy związane z ludźmi, pracownikami firmy w danych, a także pomóc działowi Human Resources w podjęciu odpowiednich kroków które będą w stanie zminimalizować Attrition - czyli odejścia personelu. Dane wykorzystane do wykonania analizy zawierają informacje o 1470 pracownikach, dotyczące ich wykształcenia, wynagrodzenia, roli zawodowej czy też kwestii prywatnych - dotyczących wieku bądź stanu cywilnego. Celem jest zbadanie korelacji między tymi czynnikami a tym, czy dane jednostki decydowały się odejść z firmy. Celem projektu jest zatem przewidzenie odejść pracowników i zrozumienie czynników wpływających na to zjawisko.

Stawiona jest tym samym hipoteza, że istnieje statystycznie istotny związek między jednym lub więcej z analizowanych czynników a Attrition w organizacji.

Analiza zostaje przygotowana w oparciu o założenia tj.:

Analizowana zmienna Attrition jest zmienną binarną, należącą do zmiennych kategorycznych, przyjmującą jedną z dwóch możliwych wartości - w tym przypadku Yes oraz No.

DATA CLEANSING & DATA WRANGLING

# Uruchomienie danych
knitr::opts_chunk$set(cache = TRUE)
dane <- read.csv("HR.csv")

Poniższy kod przedstawia proces przygotowywania danych, obejmujący zarówno czyszczenie, jak i wrangling. Operacje te mają na celu dostosowanie danych do analizy, eliminując niepotrzebne informacje, kategoryzując zmienne oraz usuwając wartości odstające i duplikaty. W pierwszej kolejności wyeliminowano kolumny zawierające zbędne lub nieistotne informacje dla analizy, takie jak EmployeeCount, EmployeeNumber, czy różne poziomy satysfakcji z pracy.

# Usuwanie zbędnych kolumn
kolumny_do_usuniecia <- c('EmployeeCount', 'EmployeeNumber', 'EnvironmentSatisfaction', 'JobInvolvement', 'JobLevel',
                           'JobSatisfaction', 'MonthlyIncome','MonthlyRate', 'Over18', 'PercentSalaryHike',
                           'PerformanceRating', 'StandardHours',
                           'WorkLifeBalance', 'YearsWithCurrManager', 'StockOptionLevel','DailyRate')
HR_cleaned <- dane[, !names(dane) %in% kolumny_do_usuniecia]

Następnie przeprowadzono konwersję wybranych kolumn zawierających dane w formacie “character” (znaki) na format “factor” (czynnik). Operacja ta została zastosowana do kilku kluczowych zmiennych, aby ułatwić ich interpretację i dalszą analizę statystyczną.

# Zmiana niektórych kolumn "chr" na zmienne factor:

# Zmiana decyzji o opuszczeniu firmy, płci i nadgodzin na zmienne binarne:
HR_cleaned$Attrition <- as.factor(HR_cleaned$Attrition)
# Nie opuszcza - 0; Opuszcza - 1
HR_cleaned$Gender <- as.factor(HR_cleaned$Gender)
# Kobieta - 0; Mężczyzna - 1
HR_cleaned$OverTime <- as.factor(HR_cleaned$OverTime)
# No - 0; Yes - 1

# Zmiana kolumn na porządkowe i nominalne:
HR_cleaned$BusinessTravel <- factor(HR_cleaned$BusinessTravel)
# Non-Travel - 0; Travel_Rarely = 1, Travel_Frequently = 2
HR_cleaned$Department <- factor(HR_cleaned$Department)
# HumanResources = 0; Sales = 1; Research & Development = 2
HR_cleaned$EducationField <- factor(HR_cleaned$EducationField)
# Other = 0; Human Resources = 1; Life Sciences = 2; Marketing = 3; Medical = 4; Technical Degree = 5 
HR_cleaned$JobRole <- factor(HR_cleaned$JobRole)
# Human Resources = 0; Laboratory Technician = 1; Sales Representative = 2; Healthcare Representative = 3, Sales Executive = 4; Research Scientist = 5; Manager = 6; Manufacturing Director = 7; Research Director = 8
HR_cleaned$MaritalStatus <- factor(HR_cleaned$MaritalStatus)
# Single = 0; Married = 1; Divorced = 2

Dokonano zmiany nazw kolumn w zbiorze danych w celu nadania im bardziej zrozumiałych i zwięzłych opisów. Nowe nazwy kolumn są bardziej czytelne i pozwalają lepiej zidentyfikować zawartość każdej zmienniej.

# Zmiana nazw kolumn
nowe_nazwy <- c('Wiek', 'Decyzjaoopuszczeniufirmy','Delegacja', 'Dział', 'OdległośćOdDomu', 'PoziomEdukacji','UkończonyKierunek', 'Płeć','PłacaGodzinowa', 'RolaZawodowa', 'StanCywilny', 'PoprzedniPracodawcy', 'Nadgodziny','ZadowoleniezRelacji','StażPracy','IlośćSzkoleń','StażwFirmie','StażnaStanowisku','OstatniAwans')
colnames(HR_cleaned) <- nowe_nazwy

Stworzono nową kategorię wieku (PrzedziałWieku), dzieląc go na przedziały od 18 do 70+ lat.

# Tworzenie przedziałów wieku
HR_cleaned$PrzedziałWieku <- cut(HR_cleaned$Wiek, breaks = c(18, 26, 35, 44, 53, 61, 70, Inf), labels = c("18-26", "27-35", "36-44", "45-53", "54-62", "63-70","70+"))
HR_cleaned$PrzedziałWieku <- as.factor(HR_cleaned$PrzedziałWieku)

W kolejnym kroku przeprowadzono kategoryzację ról zawodowych w celu uproszczenia analizy i lepszej interpretacji danych dotyczących stanowisk w firmie. Zastosowano poniższą logikę kategoryzacji:

Pozostałe przypadki zachowano bez zmian. W rezultacie, dodano nową zmieną PozycjaZawodowa do zbioru danych, która zawiera kategorie przypisane według powyższej logiki. Ta operacja ułatwia analizę danych dotyczących ról zawodowych, eliminując nadmiar szczegółów i standaryzując kategorie.

# Przypisanie ról zawodowych do odpowiednich kategorii 
HR_cleaned <- HR_cleaned %>%
  mutate(PozycjaZawodowa = case_when(
    RolaZawodowa %in% c("Research Director", "Manufacturing Director") ~ "Dyrektor",
    RolaZawodowa == "Manager" ~ "Manager",
    RolaZawodowa %in% c("Sales Executive", "Research Scientist") ~ "Specjalista",
    RolaZawodowa == "Human Resources" ~ "Kadry",
    RolaZawodowa %in% c("Healthcare Representative", "Sales Representative") ~ "Przedstawiciel",
    RolaZawodowa == "Laboratory Technician" ~ "Technik",
    TRUE ~ as.character(RolaZawodowa)
  ))

Przetłumaczono kategorie dla zmiennych, aby uczynić dane bardziej zrozumiałymi. Sprawdzono i usunięto ewentualne duplikaty w danych oraz zidentyfikowano czy występują w danych wartości NaN, czyli niebędące danymi numerycznymi.

# Spolszczenie zmiennych
levels(HR_cleaned$Decyzjaoopuszczeniufirmy) <- c("Nie", "Tak")
levels(HR_cleaned$Delegacja) <- c("Brak", "Rzadko", "Często")
levels(HR_cleaned$Dział) <- c("HR", "Sprzedaż", "R&D")
levels(HR_cleaned$Nadgodziny) <- c("Brak nadgodzin", "Nadgodziny")
levels(HR_cleaned$UkończonyKierunek) <- c("Inny", "HR","Przyrodniczy","Marketing","Medyczny","Techniczny")
levels(HR_cleaned$StanCywilny) <- c("Panna/Kawaler", "Żonaty/Zamężna", "Rozwiedziony/Rozwiedziona")
# Sprawdzenie, czy istnieją duplikaty
duplicate_rows <- HR_cleaned[duplicated(HR_cleaned) | duplicated(HR_cleaned, fromLast = TRUE), ]

# Usunięcie duplikatów
HR_cleaned <- distinct(HR_cleaned)
# Sprawdzenie, czy są wartości NaN i ich usunięcie
sum(is.na(HR_cleaned))
## [1] 8
HR_cleaned <- na.omit(HR_cleaned)

Następnie dokonano selekcji wierszy ze zbioru danych, koncentrując się na tych, które zawierają niewielką liczbę brakujących danych. Przyjęto kryterium, aby wybrać jedynie te wiersze, w których liczba brakujących wartości wynosi maksymalnie 3.

Operacja ta ma na celu zachowanie jedynie tych obserwacji, które są stosunkowo kompletne pod względem dostępnych danych. Ograniczenie liczby brakujących informacji pomaga w dalszych analizach, eliminując potencjalne zakłócenia wynikające z dużego odsetka brakujących danych w konkretnych wierszach.

# Wybierz tylko te wiersze, w których liczba brakujących wartości jest mniejsza lub równa 3
HR_cleaned <- HR_cleaned[rowSums(is.na(HR_cleaned)) <= 3, ]

Wszystkie numeryczne kolumny (oprócz zmiennych kategorycznych) zostały poddane procesowi imputacji brakujących wartości. Wykorzystano do tego funkcję mutate we frameworku dplyr.

Funkcja across umożliwiła zastosowanie operacji imputacji do wielu kolumn jednocześnie. Imputacja została przeprowadzona poprzez uzupełnienie brakujących wartości średnią dla danej kolumny, pomijając wartości brakujące w obliczeniach.

Kolumny kategoryczne (faktory), takie jak “Decyzjaoopuszczeniufirmy”, “Płeć”, “Delegacja”, “Dział”, “UkończonyKierunek”, “RolaZawodowa”, “StanCywilny”, “Nadgodziny” i “PrzedziałWieku” zostały wyłączone z procesu imputacji. Imputacja była stosowana tylko do zmiennych numerycznych. Funkcja ifelse została użyta do zastąpienia brakujących wartości średnią w przypadku ich występowania. Działanie to pozwala na utrzymanie spójności danych numerycznych, eliminując brakujące wartości i umożliwiając dalszą analizę danych. Imputacja wartości średnich pozwala na utrzymanie integralności statystyk danych w zakresie, którego dotyczy imputacja.

W dalszym kroku dokonano ponownej weryfikacji obecności wartości NaN po zastosowaniu procesu imputacji. Ze względu na wynik wskazujący na brak wartości NaN można uznać, że proces imputacji został zakończony pomyślnie, a dane są gotowe do dalszej eksploracji.

# Imputacja brakujących wartości średnią dla odpowiednich kolumn (z wyjątkiem "faktorów")

HR_cleaned <- HR_cleaned %>%
  mutate(across(
    .cols = -c(Decyzjaoopuszczeniufirmy, Płeć, Delegacja, Dział, UkończonyKierunek, RolaZawodowa, StanCywilny, Nadgodziny, PrzedziałWieku),
    ~ifelse(is.na(.), mean(., na.rm = TRUE), .)
  ))
# Sprawdzenie, czy są wartości NaN
sum(is.na(HR_cleaned))
## [1] 0

Wartości odstające zostały zidentyfikowane i usunięte z poszczególnych numerycznych kolumn przy użyciu metody IQR (zakres międzykwartylowy). Zdefiniowane zostały jako te, które znajdują się poza zakresem określonym na podstawie IQR. Dolny i górny limit zostały ustalone na podstawie kwantyli Q1 i Q3 oraz dodatkowego współczynnika progowego (threshold), równego 2.5. Proces usuwania wartości odstających został zastosowany iteracyjnie do każdej numerycznej kolumny w zbiorze danych. Celem tego etapu było zapewnienie, że analiza danych odbywa się na zbiorze, który nie zawiera wartości skrajnych, co może wpływać na dokładność statystyk i wyników analizy.

# Usuwanie wartości odstających przy pomocy IQR

numeryczne_kolumny <- sapply(HR_cleaned, is.numeric)

HR_temp <- HR_cleaned

for (col in colnames(HR_temp[, numeryczne_kolumny, drop = FALSE])) {
  Q1 <- quantile(HR_temp[[col]], 0.25)
  Q3 <- quantile(HR_temp[[col]], 0.75)
  threshold <- 2.5
  IQR <- Q3 - Q1
  dolny_limit <- Q1 - threshold * IQR
  gorny_limit <- Q3 + threshold * IQR
  
  wybrane_wiersze <- HR_temp[[col]] < dolny_limit | HR_temp[[col]] > gorny_limit
  HR_temp <- HR_temp[!wybrane_wiersze, ]
  
  HR_cleaned<-HR_temp
}

Przeprowadzono analizę obecności brakujących danych w zmiennych kategorycznych, używając funkcji sapply do iteracyjnego sprawdzania każdej kolumny. Wyniki przedstawiono jako wektor, podając liczbę braków dla każdej zmiennej. Brak wykrytych braków danych w kolumnach kategorycznych świadczy o ich kompletności i gotowości do dalszej analizy.

# Sprawdzenie braków danych dla wszystkich faktorów
braki_danych_faktory <- sapply(HR_cleaned[, sapply(HR_cleaned, is.factor)], function(x) sum(is.na(x)))

# Wyświetlenie wyników
print(braki_danych_faktory)
## Decyzjaoopuszczeniufirmy                Delegacja                    Dział 
##                        0                        0                        0 
##        UkończonyKierunek                     Płeć             RolaZawodowa 
##                        0                        0                        0 
##              StanCywilny               Nadgodziny           PrzedziałWieku 
##                        0                        0                        0

Dokonano konwersji głównej zmiennej, informującej o decyzji pracownika o opuszczeniu firmy, na format liczb całkowitych. Użyto warunku ifelse, aby przypisać wartości binarne (Nie opuszcza - 0, Opuszcza - 1) na podstawie pierwotnych kategorii (Tak/Nie). Zmienne binarne zostały następnie przekształcone do formatu liczb całkowitych, ułatwiając dalsze analizy.

# Konwersja zmiennej numerycznej na całkowitą
HR_cleaned$OdejściezFirmy <- ifelse(HR_cleaned$Decyzjaoopuszczeniufirmy == "Tak", 1, 0)
HR_cleaned$OdejściezFirmy <- as.integer(HR_cleaned$OdejściezFirmy)

Ostateczne dane są gotowe do głębszej analizy opisowej i wyciągania istotnych wniosków dotyczących zasobów ludzkich w firmie.

ANALIZA OPISOWA

Tabela 1. Statystyka opisowa odległości od domu pod względem rotacji z firmy
Zmienna analizowana Pozostanie w firmie Odejście z firmy
Odległość od domu
Min 1 1
Max 29 29
Kwartyl dolny 2 3
Mediana 7 9
Kwartyl górny 13 17
Średnia 8.91 10.74
Odch. std. 8.01 8.41
IQR 11 14
Odchylenie ćwiartkowe 5.5 7
Odch. std. w % 0.9 0.78
Odch. ćwiartkowe w % 1.57 1.56
Skośność 1.03 0.58
Kurtoza 2.96 2.07

Dla pracowników pozostających w firmie minimalna odległość od domu wynosi 1, a maksymalna 29. Mediana wynosi 7, co oznacza, że 50% pracowników mieszka w odległości 7 lub mniej jednostek od domu. Średnia odległość wynosi 8.91, z odchyleniem standardowym 8.01, co wskazuje na pewną zmienność w danych.

Dla pracowników odchodzących, wzorce są podobne, ale z nieco wyższymi wartościami. Minimalna odległość wynosi 1, a maksymalna 29. Mediana wynosi 9, co może sugerować, że pracownicy opuszczający firmę często mieszkają dalej od miejsca pracy w porównaniu do tych, którzy pozostają. Średnia odległość wynosi 10.74, a odchylenie standardowe 8.41.

Dodatkowo, analizując zmienność, widzimy, że odchylenie ćwiartkowe (połowa rozstępu międzykwartylowego) wynosi 5.5 dla pozostających i 7 dla odchodzących. To sugeruje, że dla pracowników odchodzących odległość od domu jest bardziej zróżnicowana.

Skośność dla pozostających wynosi 1.03, co oznacza pewną asymetrię rozkładu danych w prawo, natomiast dla odchodzących wynosi 0.58, co wskazuje na mniejszą asymetrię.

Podsumowując, odległość od domu różni się między pracownikami pozostającymi a odchodzącymi, zarówno pod względem tendencji centralnych, jak i miar zmienności.

Tabela 2. Statystyka opisowa wieku pod względem rotacji z firmy
Zmienna analizowana Pozostanie w firmie Odejście z firmy
Wiek
Min 19 19
Max 60 58
Kwartyl dolny 31 28
Mediana 36 31
Kwartyl górny 43 37.25
Średnia 37.27 33.23
Odch. std. 8.73 9.18
IQR 12 9.25
Odchylenie ćwiartkowe 6 4.62
Odch. std. w % 0.23 0.28
Odch. ćwiartkowe w % 0.33 0.3
Skośność 0.47 0.81
Kurtoza 2.62 3.12

Dla pracowników pozostających w firmie średni wiek wynosi 37.27 lat, przy minimalnym wieku 19 i maksymalnym 60. Mediana wynosi 36, co oznacza, że połowa pracowników ma 36 lat lub mniej. Wartości kwartylowe (Q1, Q3) to odpowiednio 31 i 43. Odchylenie standardowe wynosi 8.73, co wskazuje na pewną zmienność wieku.

Dla pracowników odchodzących, średni wiek wynosi 33.23 lata, minimalny to 19, a maksymalny 58. Mediana wynosi 31, a wartości kwartylowe to 28 i 37.25. Odchylenie standardowe wynosi 9.18, co oznacza pewną zmienność wieku w tej grupie.

Analizując zmienność, odchylenie ćwiartkowe (połowa rozstępu międzykwartylowego) dla pracowników pozostających wynosi 6, a dla odchodzących 4.62, co może sugerować mniejszą zmienność wieku w grupie odchodzących.

Procentowe odchylenie standardowe wynosi 0.23% dla pozostających i 0.28% dla odchodzących, co wskazuje na niewielką zmienność w obu grupach.

Skośność dla pracujących wynosi 0.47, co sugeruje pewną asymetrię rozkładu w prawo, podczas gdy dla odchodzących wynosi 0.81, co wskazuje na większą asymetrię.

Kurtoza dla pracujących wynosi 2.62, a dla odchodzących 3.12, co wskazuje na pewną spiczastość w obu grupach, szczególnie dla odchodzących.

Podsumowując, obie grupy różnią się wiekiem, zarówno pod względem tendencji centralnych, jak i miar zmienności, asymetrii i “spiczastości” rozkładu.

Tabela 3. Statystyka opisowa poziomu edukacji pod względem rotacji z firmy
Zmienna analizowana Pozostanie w firmie Odejście z firmy
Poziom edukacji
Min 1 1
Max 5 5
Kwartyl dolny 2 2
Mediana 3 3
Kwartyl górny 4 4
Średnia 2.92 2.83
Odch. std. 1.02 1
IQR 2 2
Odchylenie ćwiartkowe 1 1
Odch. std. w % 0.35 0.35
Odch. ćwiartkowe w % 0.67 0.67
Skośność -0.32 -0.33
Kurtoza 2.44 2.46

Dla pracowników pozostających w firmie, wyniki wskazują, że średni poziom edukacji wynosi 2.92, co oznacza, że większość pracowników ma wyższy poziom edukacji niż średni. Mediana wynosi 3, co sugeruje, że poziom edukacji dla połowy pracowników jest równy 3 lub wyższy. Skośność minimalnie ujemna (-0.32) wskazuje na nieznaczną asymetrię w lewo, co oznacza, że rozkład jest nieco bardziej skoncentrowany wokół wyższych wartości poziomu edukacji. Wartość kurtozy (2.44) sugeruje, że rozkład jest lekko spiczasty, co może oznaczać, że istnieje pewne skupienie wartości wokół średniej.

W przypadku pracowników opuszczających firmę, obserwujemy podobne tendencje centralne. Średni poziom edukacji wynosi 2.83, a mediana również jest równa 3. Skośność jest minimalnie ujemna (-0.33), co wskazuje na niewielką asymetrię w lewo, podobną do grupy pozostającej. Kurtoza wynosi 2.46, sugerując lekką spiczastość rozkładu.

Podsumowując, zarówno pracownicy pozostający w firmie, jak i ci odchodzący, wykazują podobne tendencje centralne w poziomie edukacji, z lekką asymetrią w lewo i spiczastym rozkładem. Różnice między grupami są minimalne, co sugeruje, że poziom edukacji nie jest kluczowym czynnikiem decydującym o opuszczeniu firmy.

Tabela 4. Statystyka opisowa płacy godzinowej pod względem rotacji z firmy
Zmienna analizowana Pozostanie w firmie Odejście z firmy
Płaca godzinowa
Min 30 31
Max 100 100
Kwartyl dolny 48 50
Mediana 66 65.5
Kwartyl górny 84 84.25
Średnia 66.07 65.99
Odch. std. 20.34 20.26
IQR 36 34.25
Odchylenie ćwiartkowe 18 17.12
Odch. std. w % 0.31 0.31
Odch. ćwiartkowe w % 0.55 0.52
Skośność -0.06 0.06
Kurtoza 1.79 1.83

Dla pracowników pozostających w firmie, wyniki wskazują, że płaca godzinowa mieści się w zakresie od 30 do 100 jednostek, z medianą wynoszącą 66.07. Średnia płaca godzinowa wynosi 66.07, co sugeruje, że ogólna tendencja centralna oscyluje wokół tej wartości. Skośność bliska zeru (-0.06) wskazuje na niemal symetryczny rozkład, jednakże obecność minimalnej wartości odstającej (outlier) może wpływać na wynik. Wartość kurtozy (1.79) jest niższa niż oczekiwano, co wskazuje na stosunkowo łagodny kształt rozkładu w porównaniu do rozkładu normalnego.

W przypadku pracowników odchodzących z firmy, obserwujemy podobne tendencje centralne. Mediana wynosi 65.5, a średnia płaca godzinowa wynosi 65.99. Zakres płacy godzinowej wynosi od 31 do 100 jednostek. Skośność bliska zeru (0.06) sugeruje niemal symetryczny rozkład. Kurtoza wynosi 1.83, co wskazuje na lekko spiczasty rozkład, ale nadal umiarkowany.

Podsumowując, płace godzinowe dla obu grup pracowników (pozostających i odchodzących) są podobne, oscylując wokół wartości mediany 66-65.5. Choć rozkłady są niemal symetryczne, obserwuje się pewne odstępstwa od normalności, zwłaszcza w obecności wartości odstających i lekkiej spiczastości w rozkładzie płacy godzinowej.

Tabela 5. Statystyka opisowa zadowolenia z relacji w pracy pod względem rotacji z firmy
Zmienna analizowana Pozostanie w firmie Odejście z firmy
Zadowolenie z relacji w pracy
Min 1 1
Max 4 4
Kwartyl dolny 2 1.75
Mediana 3 3
Kwartyl górny 4 4
Średnia 2.74 2.55
Odch. std. 1.07 1.12
IQR 2 2.25
Odchylenie ćwiartkowe 1 1.12
Odch. std. w % 0.39 0.44
Odch. ćwiartkowe w % 0.67 0.75
Skośność -0.32 -0.12
Kurtoza 1.86 1.65

Dla pracowników pozostających w firmie, wyniki związane z zadowoleniem z relacji w pracy prezentują się następująco. Minimalny poziom zadowolenia wynosi 1, maksymalny 4, a mediana wynosi 3. Średnia ocena zadowolenia wynosi 2.74. Wartości te wskazują na umiarkowane dobre zadowolenie wśród pracowników pozostających w firmie. Skośność wynosząca -0.32 wskazuje na pewną asymetrię rozkładu danych w lewo, co sugeruje, że większość pracowników ma tendencję do oceniania swojego zadowolenia z relacji w pracy na poziomie wyższym niż średnia.

W przypadku pracowników odchodzących z firmy, obserwujemy, że minimalny i maksymalny poziom zadowolenia z relacji w pracy są identyczne jak dla pracowników pozostających (od 1 do 4). Mediana wynosi 3, co wskazuje na to, że 50% pracowników oceniało swoje zadowolenie na poziomie 3 lub wyższym. Średnia wynosi 2.55, co jest nieco niższe niż dla pracowników pozostających. Skośność wynosząca -0.12 sugeruje pewną asymetrię rozkładu danych w lewo, ale jest ona mniej wyraźna niż w przypadku pracowników pozostających.

Podsumowując, zadowolenie z relacji w pracy dla obu grup pracowników jest na ogół umiarkowanie dobre, ale pracownicy odchodzący wydają się być nieco mniej zadowoleni niż ci, którzy pozostają. Asymetria rozkładu w lewo wskazuje na to, że większość pracowników ocenia swoje zadowolenie z relacji w pracy na stosunkowo wysokim poziomie.

Tabela 6. Statystyka opisowa stażu pracy pod względem rotacji z firmy
Zmienna analizowana Pozostanie w firmie Odejście z firmy
Staż Pracy
Min 1 0
Max 37 31
Kwartyl dolny 6 3
Mediana 10 6
Kwartyl górny 15 10
Średnia 11.15 7.38
Odch. std. 7.18 5.75
IQR 9 7
Odchylenie ćwiartkowe 4.5 3.5
Odch. std. w % 0.64 0.78
Odch. ćwiartkowe w % 0.9 1.17
Skośność 1.16 1.34
Kurtoza 4.06 5.24

Dla pracowników pozostających w firmie obserwujemy, że minimalny staż pracy wynosi 1 rok, maksymalny 37 lat, a mediana jest równa 10 lat. Średni staż pracy wynosi 11.15 lat, co sugeruje, że większość pracowników ma dość długi staż. Skośność wynosząca 1.16 wskazuje na asymetrię rozkładu danych w prawo, co oznacza, że istnieje pewna grupa pracowników z bardzo długim stażem pracy, co podnosi średnią. Kurtoza wynosząca 4.06 sugeruje, że rozkład jest wyjątkowo skupiony wokół średniej, ale z długimi ogonami, co potwierdza obecność pracowników z bardzo długim stażem.

W przypadku pracowników odchodzących z firmy, minimalny staż pracy wynosi 0 lat, maksymalny 31 lat, a mediana jest równa 6 lat. Średni staż pracy wynosi 7.38 lat, co wskazuje na to, że grupa ta ma zazwyczaj krótszy staż pracy w porównaniu do pracowników pozostających w firmie. Skośność wynosząca 1.34 wskazuje na silną asymetrię rozkładu danych w prawo, co oznacza, że istnieje podgrupa pracowników z bardzo krótkim stażem pracy. Kurtoza wynosząca 5.24 sugeruje, że rozkład jest bardziej spłaszczony niż w przypadku pracowników pozostających, co potwierdza większą zróżnicowanie stażu wśród pracowników odchodzących.

Podsumowując, analiza stażu pracy w kontekście decyzji o opuszczeniu firmy sugeruje, że pracownicy pozostający mają zazwyczaj dłuższy staż pracy niż ci, którzy odchodzą. W obu grupach występują jednak zarówno pracownicy z krótkim, jak i długim stażem, co wpływa na rozkład danych.

Tabela 7. Statystyka opisowa stażu w firmie pod względem rotacji z firmy
Własności Pozostali Odeszli
Staż w Firmie
Min 0 0
Max 26 24
Kwartyl dolny 3 1
Mediana 5 3
Kwartyl górny 9 6
Średnia 6.41 4.15
Odch. std. 4.77 3.77
IQR 6 5
Odchylenie ćwiartkowe 3 2.5
Odch. std. w % 0.74 0.91
Odch. ćwiartkowe w % 1.2 1.67
Skośność 1.38 1.69
Kurtoza 5.25 7.54

Dla pracowników pozostających w firmie obserwujemy, że minimalny staż w firmie wynosi 0 lat, maksymalny 26 lat, a mediana jest równa 5 lat. Średni staż w firmie wynosi 6.41 lat. Skośność wynosząca 1.38 sugeruje asymetrię rozkładu danych w prawo, co oznacza, że istnieje podgrupa pracowników z długim stażem w firmie, co podnosi średnią. Kurtoza wynosząca 5.25 sugeruje, że rozkład jest wyjątkowo skupiony wokół średniej, ale z długimi ogonami, co potwierdza obecność pracowników z bardzo długim stażem w firmie.

W przypadku pracowników odchodzących z firmy, minimalny staż w firmie wynosi 0 lat, maksymalny 24 lata, a mediana jest równa 3 lat. Średni staż w firmie wynosi 4.15 lat. Skośność wynosząca 1.69 sugeruje silną asymetrię rozkładu danych w prawo, co oznacza, że istnieje podgrupa pracowników z krótkim stażem w firmie. Kurtoza wynosząca 7.54 sugeruje, że rozkład jest bardziej spłaszczony niż w przypadku pracowników pozostających, co potwierdza większą zróżnicowanie stażu wśród pracowników odchodzących.

Podsumowując, analiza stażu w firmie w kontekście decyzji o opuszczeniu firmy sugeruje, że pracownicy pozostający mają zazwyczaj dłuższy staż w firmie niż ci, którzy odchodzą. W obu grupach występują jednak zarówno pracownicy z krótkim, jak i długim stażem w firmie, co wpływa na rozkład danych.

Tabela 8. Statystyka opisowa stażu na stanowisku pod względem rotacji z firmy
Zmienna analizowana Pozostanie w firmie Odejście z firmy
Staż na stanowisku w firmie
Min 0 0
Max 17 12
Kwartyl dolny 2 0
Mediana 3 2
Kwartyl górny 7 3.25
Średnia 4.1 2.54
Odch. std. 3.39 2.65
IQR 5 3.25
Odchylenie ćwiartkowe 2.5 1.62
Odch. std. w % 0.82 1.04
Odch. ćwiartkowe w % 1.67 1.62
Skośność 0.92 1.09
Kurtoza 3.56 3.34

Dla pracowników pozostających w firmie obserwujemy, że minimalny staż na stanowisku wynosi 0 lat, maksymalny 17 lat, a mediana jest równa 3 lata. Średni staż na stanowisku wynosi 4.1 lat. Skośność wynosząca 0.92 sugeruje pewną asymetrię rozkładu danych w prawo, co oznacza, że istnieje grupa pracowników z długim stażem na stanowisku, co podnosi średnią. Kurtoza wynosząca 3.56 sugeruje, że rozkład jest nieco bardziej spłaszczony niż rozkład normalny, co potwierdza obecność pracowników z zarówno krótkim, jak i długim stażem na stanowisku.

W przypadku pracowników odchodzących z firmy, minimalny staż na stanowisku wynosi 0 lat, maksymalny 12 lat, a mediana jest równa 2 lata. Średni staż na stanowisku wynosi 2.54 lata. Skośność wynosząca 1.09 sugeruje silną asymetrię rozkładu danych w prawo, co oznacza, że istnieje podgrupa pracowników z krótkim stażem na stanowisku. Kurtoza wynosząca 3.34 sugeruje, że rozkład jest również nieco bardziej spłaszczony niż rozkład normalny, co potwierdza większą zróżnicowanie stażu na stanowisku wśród pracowników odchodzących.

Podsumowując, analiza stażu na stanowisku w firmie w kontekście decyzji o opuszczeniu firmy wskazuje, że pracownicy pozostający zazwyczaj mają dłuższy staż na swoich stanowiskach niż ci, którzy odchodzą. W obu grupach występują jednak zarówno pracownicy z krótkim, jak i długim stażem na stanowisku, co wpływa na rozkład danych.

Tabela 9. Statystyka opisowa czasu od awansu pod względem rotacji z firmy
Zmienna analizowana Pozostanie w firmie Odejście z firmy
Czas od awansu
Min 0 0
Max 7 7
Kwartyl dolny 0 0
Mediana 1 1
Kwartyl górny 2 2
Średnia 1.49 1.39
Odch. std. 1.97 2.07
IQR 2 2
Odchylenie ćwiartkowe 1 1
Odch. std. w % 1.32 1.5
Odch. ćwiartkowe w % 2 2
Skośność 1.54 1.74
Kurtoza 4.43 4.93

Dla pracowników, którzy pozostali w firmie, obserwujemy, że minimalny czas od awansu wynosi 0 lat, maksymalny 7 lat, a mediana jest równa 1 lat. Średni czas od awansu wynosi 1.49 lat. Skośność wynosząca 1.54 sugeruje, że rozkład danych jest asymetryczny w prawo, co oznacza, że istnieje grupa pracowników z dłuższym czasem od awansu, co podnosi średnią. Kurtoza wynosząca 4.43 wskazuje na to, że rozkład jest silnie skupiony wokół średniej, co potwierdza koncentrację danych w okolicach mediany.

Dla pracowników, którzy opuścili firmę, minimalny czas od awansu wynosi 0 lat, maksymalny 7 lat, a mediana również wynosi 1 lat. Średni czas od awansu wynosi 1.39 lat. Skośność wynosząca 1.74 sugeruje, że również w tej grupie rozkład danych jest asymetryczny w prawo, a kurtoza wynosząca 4.93 potwierdza skupienie danych wokół średniej.

Podsumowując, analiza czasu od awansu w kontekście decyzji o opuszczeniu firmy wskazuje, że zarówno dla pracowników pozostających, jak i odchodzących, istnieje pewna zróżnicowanie czasu od awansu, ale obie grupy mają podobne tendencje centralne i miary zmienności. Warto zauważyć, że skośność i kurtoza są wyższe niż w rozkładzie normalnym, co sugeruje, że dane są skoncentrowane wokół mediany z długim ogonem danych w kierunku wyższych wartości.

Tabela 10. Statystyka opisowa ilości poprzednich pracodawców pod względem rotacji z firmy
Zmienna analizowana Pozostanie w firmie Odejście z firmy
Poprzedni Pracodawcy
Min 0 0
Max 9 9
Kwartyl dolny 1 1
Mediana 2 2
Kwartyl górny 4 5
Średnia 2.71 3
Odch. std. 2.49 2.67
IQR 3 4
Odchylenie ćwiartkowe 1.5 2
Odch. std. w % 0.92 0.89
Odch. ćwiartkowe w % 1.5 2
Skośność 1.02 0.83
Kurtoza 3.03 2.44

Dla pracowników, którzy pozostali w firmie, obserwujemy, że minimalna ilość poprzednich pracodawców wynosi 0, maksymalna 9, a mediana jest równa 2. Średnia ilość poprzednich pracodawców wynosi 2.71. Skośność wynosząca 1.02 sugeruje, że rozkład danych jest asymetryczny w prawo, co oznacza, że istnieje grupa pracowników z większą ilością poprzednich pracodawców, co podnosi średnią. Kurtoza wynosząca 3.03 wskazuje na to, że rozkład jest mocno skoncentrowany wokół średniej, co potwierdza koncentrację danych wokół mediany.

Dla pracowników, którzy opuścili firmę, minimalna ilość poprzednich pracodawców wynosi 0, maksymalna 9, a mediana również wynosi 2. Średnia ilość poprzednich pracodawców wynosi 3. Skośność wynosząca 0.83 sugeruje, że również w tej grupie rozkład danych jest asymetryczny w prawo, a kurtoza wynosząca 2.44 potwierdza skupienie danych wokół średniej.

Podsumowując, analiza ilości poprzednich pracodawców w kontekście decyzji o opuszczeniu firmy wskazuje, że zarówno dla pracowników pozostających, jak i odchodzących, istnieje pewne zróżnicowanie tej zmiennej, ale obie grupy mają podobne tendencje centralne i miary zmienności. Skośność i kurtoza są wyższe niż w rozkładzie normalnym, co sugeruje, że dane są skoncentrowane wokół mediany z długim ogonem danych w kierunku wyższych wartości.

Tabela 11. Statystyka opisowa liczby szkoleń pod względem rotacji z firmy
Zmienna analizowana Pozostanie w firmie Odejście z firmy
Ilość Szkoleń
Min 0 0
Max 5 5
Kwartyl dolny 2 2
Mediana 3 2
Kwartyl górny 3 3
Średnia 2.67 2.56
Odch. std. 1.1 1.14
IQR 1 1
Odchylenie ćwiartkowe 0.5 0.5
Odch. std. w % 0.41 0.45
Odch. ćwiartkowe w % 0.33 0.5
Skośność 0.25 0.05
Kurtoza 3.43 3.37

Dla pracowników, którzy pozostali w firmie, obserwujemy, że minimalna liczba szkoleń wynosi 0, maksymalna 5, a mediana jest równa 3. Średnia liczba szkoleń wynosi 2.67. Skośność wynosząca 0.25 sugeruje, że rozkład danych jest nieco asymetryczny w prawo, co może oznaczać, że większość pracowników przeszła umiarkowaną liczbę szkoleń, ale istnieje grupa z większą ilością.

Dla pracowników, którzy opuścili firmę, minimalna liczba szkoleń wynosi 0, maksymalna 5, a mediana wynosi 2. Średnia liczba szkoleń wynosi 2.56. Skośność wynosząca 0.05 sugeruje, że rozkład danych jest bliski symetrii. Kurtoza wynosząca 3.37 wskazuje na to, że dane są skupione wokół mediany, ale istnieje pewne rozproszenie w ogonach rozkładu.

Podsumowując, analiza liczby szkoleń w kontekście decyzji o opuszczeniu firmy wskazuje, że obie grupy pracowników mają podobne tendencje centralne, ale rozkłady różnią się pod względem asymetrii. Grupa pozostająca w firmie wykazuje pewien stopień asymetrii w prawo, podczas gdy grupa odchodząca jest bardziej symetryczna. Skośność i kurtoza dla obu grup są jednak stosunkowo wysokie, co sugeruje pewne zróżnicowanie danych.

Podsumowanie

Analiza opisowa pozwala na wydzielenie dwóch głównych grup zmiennych potencjalnie wyjaśniających zjawisko odejść z firmy. Pierwsza z nich wyróżnia się już na wstępie znaczącymi różnicami. Szczególnie można wyróżnić m.in. wysoką medianę odległości dojazdu pracowników odchodzących do miejsca pracy, co prawdopodobnie wpływa na ich skłonność do opuszczenia przedsiębiorstwa. Dodatkowo, obserwuje się wyraźne rozbieżności wiekowe, gdzie pracownicy decydujący się na odejście są wyraźnie młodsi w porównaniu do tych pozostających. Aspekt ten stanowi kluczowy element zrozumienia dynamiki i oczekiwań różnych grup pracowników, potencjalnie wpływających na ich decyzje dotyczące długofalowego zaangażowania w firmę. W ramach tej grupy zmiennych identyfikuje się również pracowników charakteryzujących się większą mobilnością zawodową, często zmieniających pracodawców. Okazuje się, że to właśnie taka kategoria pracowników najczęściej decyduje się na opuszczenie badanej firmy. Druga grupa zmiennych prezentuje sytuacje bardziej niejednoznaczne, gdzie na obecnym etapie nie można wyciągnąć jednoznacznych wniosków. Przykładem może być analiza zróżnicowania stażu pracy jedynie w obrębie badanej firmy.

Otrzymane wyniki wskazują, że zarówno nowi, jak i doświadczeni pracownicy mogą opuszczać firmę, co stanowi obszar wymagający bardziej szczegółowej analizy. Na tym etapie niemożliwe jest również określenie, czy decyzje o pozostaniu lub odejściu z firmy są powiązane z osiągnięciami edukacyjnymi pracowników. Ponadto, brak istotnych różnic w płacach dla obu grup powoduje, że konieczna będzie bardziej zniuansowanej polityki kadrowej. Wymaga to weryfikacji wszystkich pytań badawczych i identyfikacji innych potencjalnych przyczyn odejść pracowników. Celem kolejnego etapu analizy jest zweryfikowanie statystycznej istotności odpowiedzi na postawione pytania badawcze. To umożliwi potwierdzenie różnic w grupie zmiennych, które wyłaniają się jako potencjalne wyjaśnienia odejść z firmy. Równocześnie, będziemy weryfikować sytuacje, gdy dotychczasowe zmienne nie ujawniły przyczyn odejść, co pozwoli na pełniejsze zrozumienie zjawiska rotacji pracowników.

ANALIZA POSIADANYCH DANYCH

Przygotowany został zestaw pytań badawczych, z których pomocą możliwa będzie do przygotowania prognoza odejść pracowników z firmy w kolejnych okresach:

  1. CZY MOŻNA ZIDENTYFIKOWAĆ SEGMENT PRACOWNIKÓW, DLA KTÓRYCH RYZYKO ODEJŚCIA JEST SZCZEGÓLNIE WYSOKIE?

  2. CZY ZBYT DUŻE OBCIĄŻENIE PRACĄ WPŁYWA DECYZJĘ O OPUSZCZENIU FIRMY?

    • Czy godziny nadliczbowe wpływają na na decyzję o opuszczeniu firmy?

    • Czy istnieje powiązanie wieku i obecności godzin nadliczbowych w kontekście odejść z pracy?

  3. CZY ŻYCIE PRYWATNE MA WPŁYW NA DECYZJĘ O OPUSZCZENIU FIRMY?

    • Czy odległość od domu wpływa na decyzję o opuszczeniu firmy?

    • Czy stan cywilny koreluje z odejściami pracowników?

    • Czy uciążliwość delegacji służbowych wpływa na decyzję o opuszczeniu firmy?

  4. CZY POZIOM ZAROBKÓW MA WPŁYW NA DECYZJĘ O OPUSZCZENIU FIRMY?

    • Czy relacja pomiędzy poziomem wynagrodzenia a średnim poziomem wynagrodzenia na danej pozycji zawodowej wpływa na decyzję o opuszczeniu firmy?

    • Czy relacja pomiędzy poziomem wynagrodzenia a średnim poziomem wynagrodzenia przy danym poziomie wykształcenia wpływa na decyzję o opuszczeniu firmy?

    • Czy relacja pomiędzy poziomem wynagrodzenia a średnim poziomem wynagrodzenia w danym dziale wpływa na decyzję o opuszczeniu firmy?

  5. CZY ZADOWOLENIE Z RELACJI ZAWODOWYCH WPŁYWA NA DECYZJĘ O OPUSZCZENIU FIRMY?

  6. CZY BRAK ROZWOJU ZAWODOWEGO WPŁYWA NA DECYZJĘ O OPUSZCZENIU FIRMY?

    • Czy awanse w firmie zmniejszają ryzyko odejść pracowników?

    • Czy liczba szkoleń w ostatnim roku jest powiązana z odejściami pracowników?

    • Czy poziom edukacji wpływa na decyzję o opuszczeniu firmy?

    • Czy rodzaj ukończonego kierunku wpływa na decyzję o opuszczeniu firmy?

    • Czy pozycja zawodowa wpływa na decyzję o opuszczeniu firmy?

  7. CZY DOTYCHCZASOWA BIOGRAFIA ZAWODOWA WPŁYWA NA DECYZJĘ O OPUSZCZENIU FIRMY?

    • Czy pracownicy z krótszym stażem pracy są bardziej skłonni do opuszczenia firmy?

    • Czy pracownicy z większą iloscią poprzednich pracodawców są bardziej skłonni do opuszczenia firmy?

    • Czy pracownicy z krótszym stażem w firmie są bardziej skłonni do opuszczenia firmy?

    • Czy pracownicy z krótszym stażem w jednej roli zawodowej są bardziej skłonni do opuszczenia firmy?

Na podstawie powyższych pytań, przeprowadzona została analiza statystyczna danych, a taże analiza regresji logistycznej, zależności między zmiennymi, czy też analiza ilościowa i eksploracyjna danych. W trakcie procesu analizy wykorzystywane zostały także różnorodne wykresy oraz wizualizacje, umożliwiające wizualizację danych.

PYTANIA BADAWCZE I INTERPRETACJA OTRZYMANYCH W ICH ANALIZIE WYNIKÓW

  1. CZY MOŻNA ZIDENTYFIKOWAĆ SEGMENT PRACOWNIKÓW, DLA KTÓRYCH RYZYKO ODEJŚCIA JEST SZCZEGÓLNIE WYSOKIE?
Estimate Std. Error z value Pr(>|z|)
(Intercept) -2.7115457 1.4582360 -1.8594697 0.0629606
Wiek -0.0323076 0.0135471 -2.3848353 0.0170868
DelegacjaRzadko 1.8721286 0.4354197 4.2995950 0.0000171
DelegacjaCzęsto 1.0144384 0.4080773 2.4858978 0.0129225
DziałSprzedaż -0.8395656 0.4207376 -1.9954612 0.0459926
DziałR&D -0.2751838 0.4208481 -0.6538792 0.5131896
OdległośćOdDomu 0.0422927 0.0107157 3.9467871 0.0000792
PoziomEdukacji 0.0022392 0.0892220 0.0250974 0.9799773
PłećMale 0.3386254 0.1852020 1.8284112 0.0674879
PłacaGodzinowa 0.0550060 0.0496185 1.1085766 0.2676129
StanCywilnyŻonaty/Zamężna 0.1185716 0.2535909 0.4675705 0.6400917
StanCywilnyRozwiedziony/Rozwiedziona 1.2692423 0.2534282 5.0082914 0.0000005
PoprzedniPracodawcy 0.1580263 0.0373978 4.2255498 0.0000238
NadgodzinyNadgodziny 1.7126744 0.1850277 9.2563149 0.0000000
ZadowoleniezRelacji -0.3078526 0.0824383 -3.7343402 0.0001882
StażPracy -0.0836117 0.0237069 -3.5268930 0.0004205
IlośćSzkoleń -0.1003217 0.0813972 -1.2324949 0.2177643
StażwFirmie -0.0321839 0.0454995 -0.7073452 0.4793520
StażnaStanowisku -0.1443149 0.0582188 -2.4788377 0.0131811
OstatniAwans 0.1950798 0.0533164 3.6589099 0.0002533
OdsetekSredniejPłacyPozycja_cent -0.0889563 0.4302971 -0.2067322 0.8362190
OdsetekSredniejPłacyDział_cent 0.0330797 0.4392943 0.0753020 0.9399744
OdsetekSredniejPłacyPoziomEdukacji_cent -0.3194781 0.3321299 -0.9619070 0.3360963

Analizując wyniki modelu regresji logistycznej, możemy zidentyfikować segment pracowników, dla których ryzyko odejścia jest szczególnie wysokie. Jesteśmy w stanie wyróżnić zmienne istotne (p-value < 0.05), które mają wpływ na ryzyko odejścia, a są to: Delegacja (Rzadko, Często) Dział (Sprzedaż) OdległośćOdDomu StanCywilny (Rozwiedziony/Rozwiedziona) PoprzedniPracodawcy Nadgodziny ZadowoleniezRelacji StażPracy OstatniAwans

Wartości współczynników dla każdej zmiennej wskazują, jak bardzo dana zmienna wpływa na logarytm szans odejścia. Pozytywne wartości oznaczają zwiększenie ryzyka odejścia, a ujemne - zmniejszenie.

Segmentami pracowników zwiększonego ryzyka odejścia są zatem: Pracownicy, którzy rzadko lub często podróżują służbowo (Delegacja). Pracownicy działu sprzedaży (DziałSprzedaż). Pracownicy, którzy są rozwiedzeni lub rozwiedzione (StanCywilnyRozwiedziony/Rozwiedziona). Pracownicy, którzy mieli więcej niż jednego poprzedniego pracodawcę (PoprzedniPracodawcy). Pracownicy, którzy pracują nadgodziny (Nadgodziny). Pracownicy, którzy są mniej zadowoleni z relacji w pracy (ZadowoleniezRelacji). Pracownicy, którzy mają krótki staż pracy w firmie (StażPracy). Pracownicy, którzy mieli ostatni awans (OstatniAwans).

Pozostałe zmienne nie są istotne w kontekście ryzyka odejścia, co oznacza, że nie mają one statystycznie istotnego wpływu na decyzję o opuszczeniu firmy. Podsumowując, pracownicy zidentyfikowani w oparciu o powyższe zmienne są bardziej narażeni na ryzyko odejścia. Warto skoncentrować się na tych segmentach pracowników, aby podejmować odpowiednie działania retencyjne i poprawić ich zaangażowanie w firmie.

  1. CZY ZBYT DUŻE OBCIĄŻENIE PRACĄ WPŁYWA DECYZJĘ O OPUSZCZENIU FIRMY?

    • Czy godziny nadliczbowe wpływają na na decyzję o opuszczeniu firmy?

Estimate Std. Error z value Pr(>|z|) Significance
(Intercept) -2.152985 0.1083861 -19.864033 <2e-16 ***
NadgodzinyNadgodziny 1.369982 0.1555661 8.806432 <2e-16 ***

Na podstawie wyników modelu regresji logistycznej, można stwierdzić, że godziny nadliczbowe (Nadgodziny) mają statystycznie istotny wpływ na decyzję o opuszczeniu firmy.

Pracownicy pracujący nadgodziny mają o 1.37 razy większe szanse na opuszczenie firmy w porównaniu do tych, którzy nie pracują nadgodzin.

Na podstawie modelu można stwierdzić iż godziny nadliczbowe mają istotny wpływ na decyzję o opuszczeniu firmy, a pracownicy pracujący nadgodziny wykazują większe ryzyko odejścia w porównaniu do tych, którzy nie pracują nadgodzin.

HIPOTEZY STATYSTYCZNE:

  1. Rozkład rotacji w firmie względem występowania nadgodzin

Hipoteza zerowa (H0): Brak zależności między ilością nadgodzin a odejściem z firmy.

Hipoteza alternatywna (H1): Istnieje zależność między ilością nadgodzin a odejściem z firmy. Wnioski: Odrzucenie H0 na rzecz H1 wskazuje, że ilość nadgodzin jest istotnie związana z odejściem z firmy.

  1. Związek między Nadgodzinami a Odejściem z Firmy: Wykres Drzewkowy Ilorazu Szans

Hipoteza zerowa (H0): Ilość nadgodzin nie ma wpływu na prawdopodobieństwo odejścia z firmy.

Hipoteza alternatywna (H1): Ilość nadgodzin ma istotny wpływ na prawdopodobieństwo odejścia z firmy.

Wnioski: Odrzucenie H0 na rzecz H1 wskazuje, że ilość nadgodzin jest istotnym predyktorem odejścia z firmy. Analizy przedstawione na obydwu wykresach wskazują na istotność statystyczną związku między ilością nadgodzin a odejściem z firmy

Estimate Std. Error z value Pr(>|z|) Significance
(Intercept) -0.1042856 0.4903998 -0.2126542 0.8315967
Wiek -0.0589438 0.0143800 -4.0990014 0.0000415 ***
NadgodzinyNadgodziny 1.6895885 0.6968435 2.4246312 0.0153239
Wiek:NadgodzinyNadgodziny -0.0069128 0.0199193 -0.3470398 0.7285614

Współczynnik dla zmiennej Wiek wynosi -0.058944, a P-value (<4.15e-05) jest bardzo niskie, co sugeruje, że wiek pracownika ma statystycznie istotny wpływ na decyzję o opuszczeniu firmy. Znaki ujemne wskazują, że starsi pracownicy mają mniejsze szanse na opuszczenie firmy w porównaniu do młodszych.

Współczynnik dla zmiennej NadgodzinyNadgodziny wynosi 1.689589, a P-value (0.0153) jest niższe niż 0.05, co sugeruje, że obecność godzin nadliczbowych ma statystycznie istotny wpływ na decyzję o opuszczeniu firmy. Znaki dodatnie wskazują, że pracownicy pracujący nadgodziny mają większe szanse na opuszczenie firmy w porównaniu do tych, którzy nie pracują nadgodzin.

Współczynnik interakcji między wiekiem a obecnością godzin nadliczbowych wynosi -0.006913, a P-value (0.7286) jest wyższe niż 0.05, co oznacza, że interakcja ta nie jest statystycznie istotna. To sugeruje, że wpływ godzin nadliczbowych na decyzję o opuszczeniu firmy nie zależy istotnie od wieku pracowników.

Na podstawie tego modelu można stwierdzić, że zarówno wiek, jak i obecność godzin nadliczbowych mają wpływ na decyzję pracowników o opuszczeniu firmy. Młodsi pracownicy oraz ci, którzy pracują nadgodziny, wydają się mieć większe ryzyko odejścia. Interakcja między wiekiem a nadgodzinami nie jest jednak istotna w tym kontekście.

HIPOTEZY STATYSTYCZNE:

Hipoteza zerowa (H0): Nie ma istotnego związku między wiekiem a decyzją o opuszczeniu firmy, niezależnie od ilości nadgodzin.

Hipoteza alternatywna (H1): Istnieje istotny związek między wiekiem a decyzją o opuszczeniu firmy, z uwzględnieniem ilości nadgodzin.

Wnioski: Wartość p (p-value) wynosząca 1.4e-09 jest znacznie mniejsza niż poziom istotności 0.05, co prowadzi do odrzucenia hipotezy zerowej na rzecz hipotezy alternatywnej. Oznacza to, że istnieje istotny związek między wiekiem a decyzją o opuszczeniu firmy, przy uwzględnieniu ilości nadgodzin.

  1. CZY ŻYCIE PRYWATNE MA WPŁYW NA DECYZJĘ O OPUSZCZENIU FIRMY?

    • Czy odległość od domu wpływa na decyzję o opuszczeniu firmy?

Estimate Std. Error z value Pr(>|z|) Significance
(Intercept) -1.8794750 0.1185253 -15.857164 <2e-16 ***
OdległośćOdDomu 0.0262243 0.0088060 2.978008 0.00290128761332265 **

Wartość współczynnika dla zmiennej OdległośćOdDomu wynosi 0.0262. Oznacza to, że przyrost o jednostkę w odległości od domu zwiększa logarytmiczną szansę odejścia z firmy o 0.0262. Ponieważ wartość ta jest dodatnia, wzrost odległości od domu jest związany z większymi szansami na odejście z firmy.

HIPOTEZY STATYSTYCZNE

Hipoteza zerowa (H0): Nie ma istotnego związku między odległością od domu a decyzją o opuszczeniu firmy.

Hipoteza alternatywna (H1): Istnieje istotny związek między odległością od domu a decyzją o opuszczeniu firmy.

Wnioski: Wartość p (p-value) wynosząca 2.73e-03 jest mniejsza niż poziom istotności 0.05, co oznacza, że hipoteza zerowa zostaje odrzucona na rzecz hipotezy alternatywnej. Możemy uznać, że istnieje istotny związek między odległością od domu a decyzją o opuszczeniu firmy.

Estimate Std. Error z value Pr(>|z|) Significance
(Intercept) -2.0676536 0.1876195 -11.0204599 <2e-16 ***
StanCywilnyŻonaty/Zamężna 0.0669352 0.2262522 0.2958433 0.767349785557839
StanCywilnyRozwiedziony/Rozwiedziona 1.0686420 0.2185263 4.8902206 1.00723014020407e-06

Współczynniki otrzymane w modelu:

Współczynnik dla kategorii “StanCywilnyRozwiedziony/Rozwiedziona” jest dodatni i istotny statystycznie, co oznacza, że osoby o statusie rozwiedzionym/rozwiedzionej mają większe szanse na odejście z firmy w porównaniu do osób żonatych/zamężnych.

Istnieje statystycznie istotna zależność między stanem cywilnym a decyzją o odejściu z firmy, jednakże dotyczy to głównie osób rozwiedzionych/rozwiedzionych. Osoby rozwiedzione/rozwiedzione są bardziej podatne na odejście z firmy w porównaniu do osób żonatych/zamężnych. Stan cywilny, jako zmienna, może mieć wpływ na retencję pracowników.

HIPOTEZY STATYSTYCZNE

  1. Rozkład rotacji w firmie względem stanu cywilnego

Hipoteza zerowa (H0): Brak zależności między stanem cywilnym a odejściem z firmy.

Hipoteza alternatywna (H1): Istnieje zależność między stanem cywilnym a odejściem z firmy.

Odrzucenie H0 na rzecz H1 wskazuje, że stan cywilny jest istotnie związany z odejściem z firmy.

  1. Wykres Ilorazu Szans dla Zmiennej Stanu Cywilnego

Hipoteza zerowa (H0): Stan cywilny nie ma wpływu na prawdopodobieństwo odejścia z firmy (w odniesieniu do wartości referencyjnej “1”).

Hipoteza alternatywna (H1): Stan cywilny ma istotny wpływ na prawdopodobieństwo odejścia z firmy (w odniesieniu do wartości referencyjnej “1”).

Odrzucenie H0 na rzecz H1 wskazuje, że istnieje istotny związek między stanem cywilnym a odejściem z firmy.

  1. Wykres Drzewkowy Ilorazu Szans dla Odejścia z Firmy w Kontekście Stanu Cywilnego

Hipoteza zerowa (H0): Stan cywilny nie ma wpływu na prawdopodobieństwo odejścia z firmy.

Hipoteza alternatywna (H1): Stan cywilny ma istotny wpływ na prawdopodobieństwo odejścia z firmy.

Odrzucenie H0 na rzecz H1 potwierdza, że stan cywilny jest istotnym czynnikiem związanym z odejściem z firmy.

Wnioski: Wszystkie trzy analizy wskazują na to, że stan cywilny jest statystycznie istotnie związany z odejściem z firmy. Podejścia parametryczne (pierwsze dwa wykresy) oraz podejście nieparametryczne (wykres drzewkowy) potwierdzają tę zależność. Otrzymane bardzo niskie wartości p-value sugerują silny związek między zmienną niezależną (stanem cywilnym) a zmienną zależną (odejściem z firmy).

Estimate Std. Error z value Pr(>|z|) Significance
(Intercept) -2.5389739 0.3462409 -7.332968 0.0000000 ***
DelegacjaRzadko 1.4891517 0.3759140 3.961416 0.0000745 ***
DelegacjaCzęsto 0.8213224 0.3582006 2.292912 0.0218531

Otrzymane z modelu współczynniki:

Osoby, które rzadko podróżują służbowo, mają większe szanse na pozostanie w firmie w porównaniu do tych, które nie podróżują służbowo. Podróżowanie służbowe (zarówno rzadko, jak i często) jest związane z wyższym prawdopodobieństwem odejścia z firmy w porównaniu do braku podróży służbowych.

Wyniki sugerują, że uciążliwość delegacji służbowych może mieć wpływ na decyzję o opuszczeniu firmy. Pracownicy podróżujący rzadko są mniej skłonni do odejścia niż ci, którzy podróżują często.

HIPOTEZY STATYSTYCZNE:

  1. Rozkład rotacji w firmie względem częstości delegacji

Hipoteza zerowa (H0): Brak zależności między częstością delegacji a odejściem z firmy.

Hipoteza alternatywna (H1): Istnieje zależność między częstością delegacji a odejściem z firmy.

Odrzucenie H0 na rzecz H1 wskazuje, że częstość delegacji jest istotnie związana z odejściem z firmy.

  1. Wykres Drzewkowy Ilorazu Szans Odejścia z Firmy a Częstości Delegacji

Hipoteza zerowa (H0): Częstość delegacji nie ma wpływu na prawdopodobieństwo odejścia z firmy.

Hipoteza alternatywna (H1): Częstość delegacji ma istotny wpływ na prawdopodobieństwo odejścia z firmy.

Odrzucenie H0 na rzecz H1 wskazuje, że częstość delegacji jest statystycznie istotnym czynnikiem związanym z odejściem z firmy.

Wnioski: Oba podejścia (parametryczne i nieparametryczne) sugerują istotny związek między częstością delegacji a odejściem z firmy. Podejścia te potwierdzają, że pracownicy, którzy często są delegowani, mogą mieć większe prawdopodobieństwo odejścia z firmy. Otrzymane niskie wartości p-value wskazują na istotność statystyczną tej zależności.

  1. CZY POZIOM ZAROBKÓW MA WPŁYW NA DECYZJĘ O OPUSZCZENIU FIRMY?

    • Czy relacja pomiędzy poziomem wynagrodzenia a średnim poziomem wynagrodzenia na danej pozycji zawodowej wpływa na decyzję o opuszczeniu firmy?
Estimate Std. Error z value Pr(>|z|) Significance
(Intercept) -2.5389739 0.3462409 -7.332968 0.0000000 ***
DelegacjaRzadko 1.4891517 0.3759140 3.961416 0.0000745 ***
DelegacjaCzęsto 0.8213224 0.3582006 2.292912 0.0218531

Wartość otrzymanego współczynnika:

Współczynnik dla zmiennej “OdsetekSredniejPłacyPozycja_cent” nie jest istotny statystycznie. Oznacza to brak istotnego związku między relacją pomiędzy poziomem wynagrodzenia a średnim poziomem wynagrodzenia na danej pozycji zawodowej a decyzją o opuszczeniu firmy. Na podstawie tego modelu nie można stwierdzić, że relacja pomiędzy poziomem wynagrodzenia a średnim poziomem wynagrodzenia na danej pozycji zawodowej wpływa istotnie na decyzję o opuszczeniu firmy.

Estimate Std. Error z value Pr(>|z|) Significance
(Intercept) -1.5549411 0.1628738 -9.5469103 <2e-16 ***
OdsetekSredniejPłacyDział_cent -0.0101177 0.0264956 -0.3818639 0.702562287810894

Wartość otrzymanego współczynnika:

Współczynnik dla zmiennej “OdsetekSredniejPłacyDział_cent” nie jest istotny statystycznie. Oznacza to, że brak istotnego związku między relacją pomiędzy poziomem wynagrodzenia a średnim poziomem wynagrodzenia w danym dziale a decyzją o opuszczeniu firmy. Na podstawie tego modelu nie można stwierdzić, że relacja pomiędzy poziomem wynagrodzenia a średnim poziomem wynagrodzenia w danym dziale wpływa istotnie na decyzję o opuszczeniu firmy.

Estimate Std. Error z value Pr(>|z|) Significance
(Intercept) -1.584507 0.1608461 -9.8510773 <2e-16 ***
OdsetekSredniejPłacyPoziomEdukacji_cent -0.006796 0.0261254 -0.2601308 0.794762873826329

Wartość otrzymanych współczynników:

Współczynnik dla zmiennej “OdsetekSredniejPłacyPoziomEdukacji_cent” nie jest istotny statystycznie. Oznacza to brak istotnego związku między relacją pomiędzy poziomem wynagrodzenia a średnim poziomem wynagrodzenia przy danym poziomie wykształcenia a decyzją o opuszczeniu firmy.

Na podstawie tego modelu nie można stwierdzić, że relacja pomiędzy poziomem wynagrodzenia a średnim poziomem wynagrodzenia przy danym poziomie wykształcenia wpływa istotnie na decyzję o opuszczeniu firmy.

  1. CZY ZADOWOLENIE Z RELACJI ZAWODOWYCH WPŁYWA NA DECYZJĘ O OPUSZCZENIU FIRMY?

Estimate Std. Error z value Pr(>|z|) Significance
(Intercept) -1.2039097 0.1939877 -6.206114 0.0000000 ***
ZadowoleniezRelacji -0.1582655 0.0691949 -2.287243 0.0221817

Wartość współczynnika:

Współczynnik dla zmiennej “ZadowoleniezRelacji” jest istotny statystycznie i wynosi -0.15827. Oznacza to, że zmniejszenie zadowolenia z relacji zawodowych wiąże się ze zmniejszeniem prawdopodobieństwa opuszczenia firmy.

Na podstawie tego modelu można stwierdzić, że zadowolenie z relacji zawodowych wpływa istotnie na decyzję o opuszczeniu firmy. W miarę malejącego zadowolenia z relacji zawodowych rośnie prawdopodobieństwo odejścia z firmy.

HIPOTEZY STATYSTYCZNE:

Hipoteza zerowa (H0): Nie ma istotnej statystycznie różnicy w ilorazie szans odejść z firmy między różnymi ocenami relacji.

Hipoteza alternatywna (H1): Istnieje istotna statystycznie różnica w ilorazie szans odejść z firmy między różnymi ocenami relacji.

Otrzymane p-value (0.11) nie pozwala odrzucić hipotezy zerowej na poziomie istotności 0.05.

  1. CZY BRAK ROZWOJU ZAWODOWEGO WPŁYWA NA DECYZJĘ O OPUSZCZENIU FIRMY?

    • Czy awanse w firmie zmniejszają ryzyko odejść pracowników?

Estimate Std. Error z value Pr(>|z|) Significance
(Intercept) -1.5846163 0.0929382 -17.0502213 <2e-16 ***
OstatniAwans -0.0264107 0.0389751 -0.6776298 0.498006458633779

Wartość otrzymanego współczynnika:

Współczynnik dla zmiennej “OstatniAwans” nie jest istotny statystycznie, co oznacza, że brak jest jednoznacznego dowodu na to, że awanse w firmie mają istotny wpływ na ryzyko odejść pracowników.

Na podstawie tego modelu nie można jednoznacznie stwierdzić, że awanse w firmie mają statystycznie istotny wpływ na ryzyko odejść pracowników. Wyniki sugerują brak jednoznacznego związku między ostatnim awansem a decyzją pracowników o opuszczeniu firmy.

HIPOTEZY STATYSTYCZNE

Hipoteza zerowa (H0): Nie ma istotnego związku między czasem od ostatniego awansu a decyzją o opuszczeniu firmy.

Hipoteza alternatywna (H1): Istnieje istotny związek między czasem od ostatniego awansu a decyzją o opuszczeniu firmy.

Wnioski: Wartość p (p-value) wynosząca 0.5 sugeruje, że nie ma istotnego związku statystycznego między czasem od ostatniego awansu a decyzją o opuszczeniu firmy. W tym przypadku, nie ma podstaw do odrzucenia hipotezy zerowej. Wyniki wskazują, że nie mamy podstaw do stwierdzenia, że czas od ostatniego awansu wpływa istotnie na decyzję o opuszczeniu firmy w analizowanym zbiorze danych.

Estimate Std. Error z value Pr(>|z|) Significance
(Intercept) -1.3883492 0.1916173 -7.245428 0.0000000 ***
IlośćSzkoleń -0.0897014 0.0684591 -1.310293 0.1900969

Współczynniki modelu:

Współczynnik dla zmiennej “IlośćSzkoleń” nie jest istotny statystycznie, co oznacza, że brak jest jednoznacznego dowodu na to, że liczba szkoleń w ostatnim roku ma istotny wpływ na ryzyko odejść pracowników.

Na podstawie tego modelu nie można jednoznacznie stwierdzić, że liczba szkoleń w ostatnim roku ma statystycznie istotny wpływ na ryzyko odejść pracowników. Wyniki sugerują brak jednoznacznego związku między ilością szkoleń a decyzją pracowników o opuszczeniu firmy.

HIPOTEZY STATYSTYCZNE

Hipoteza zerowa (H0): Nie ma istotnego związku między ilością szkoleń a decyzją o opuszczeniu firmy.

Hipoteza alternatywna (H1): Istnieje istotny związek między ilością szkoleń a decyzją o opuszczeniu firmy.

Wnioski: Wartość p (p-value) wynosząca 0.19 sugeruje, że nie ma istotnego związku statystycznego między ilością szkoleń a decyzją o opuszczeniu firmy. W tym przypadku, nie ma podstaw do odrzucenia hipotezy zerowej. Nie mamy podstaw do stwierdzenia, że ilość szkoleń wpływa istotnie na decyzję o opuszczeniu firmy w analizowanym zbiorze danych.

Estimate Std. Error z value Pr(>|z|) Significance
(Intercept) -1.3815572 0.2226065 -6.206276 0.000000 ***
PoziomEdukacji -0.0837239 0.0735278 -1.138670 0.254841

Współczynniki modelu:

Współczynnik dla zmiennej “PoziomEdukacji” nie jest istotny statystycznie, co oznacza, że brak jest jednoznacznego dowodu na to, że poziom edukacji pracowników ma istotny wpływ na ryzyko odejść pracowników.

Na podstawie tego modelu nie można jednoznacznie stwierdzić, że poziom edukacji pracowników ma statystycznie istotny wpływ na ryzyko odejść. Wyniki sugerują brak jednoznacznego związku między poziomem edukacji a decyzją pracowników o opuszczeniu firmy.

HIPOTEZY STATYSTYCZNE:

Hipoteza zerowa (H0): Nie ma istotnego związku między poziomem edukacji a decyzją o opuszczeniu firmy.

Hipoteza alternatywna (H1): Istnieje istotny związek między poziomem edukacji a decyzją o opuszczeniu firmy.

Wnioski: Wartości p dla testu Spearmana (p = 0.25) i testu regresji logistycznej (p = 0.57) sugerują, że nie ma istotnego związku statystycznego między poziomem edukacji a decyzją o opuszczeniu firmy. W obu przypadkach, nie ma podstaw do odrzucenia hipotezy zerowej. Nie mamy podstaw do stwierdzenia, że poziom edukacji wpływa istotnie na decyzję o opuszczeniu firmy w analizowanym zbiorze danych.

Estimate Std. Error z value Pr(>|z|) Significance
(Intercept) -0.9985288 0.4421407 -2.2583960 0.0239210
UkończonyKierunekHR -0.7694457 0.4587996 -1.6770844 0.0935260
UkończonyKierunekPrzyrodniczy -0.2362156 0.4856226 -0.4864182 0.6266707
UkończonyKierunekMarketing -0.7902500 0.4651136 -1.6990475 0.0893102
UkończonyKierunekMedyczny -0.7932306 0.5491348 -1.4445100 0.1485956
UkończonyKierunekTechniczny -0.1351748 0.4926427 -0.2743870 0.7837872

Współczynniki modelu:

Jest to wartość szacowana dla grupy referencyjnej (tu: “UkończonyKierunekInny”). Wartość ta oznacza logarytm szansy odejścia z firmy dla grupy referencyjnej. UkończonyKierunekHR: -0.7694

HIPOTEZY STATYSTYCZNE

Hipoteza zerowa (H0): Nie ma istotnego związku między rodzajem ukończonego kierunku a decyzją o opuszczeniu firmy.

Hipoteza alternatywna (H1): Istnieje istotny związek między rodzajem ukończonego kierunku a decyzją o opuszczeniu firmy.

Wnioski: Wartość p wynosząca 0.02 sugeruje, że istnieje istotny związek między rodzajem ukończonego kierunku a decyzją o opuszczeniu firmy. Odrzucamy hipotezę zerową na rzecz hipotezy alternatywnej. Rodzaj ukończonego kierunku może mieć istotny wpływ na decyzję pracowników o opuszczeniu firmy.

Estimate Std. Error z value Pr(>|z|) Significance
(Intercept) -3.0231312 0.3413135 -8.8573456 <2e-16 ***
PozycjaZawodowaKadry 1.8444762 0.4748360 3.8844489 0.00010256224012114 ***
PozycjaZawodowaManager -0.0371395 0.6821795 -0.0544425 0.956582644785235
PozycjaZawodowaPrzedstawiciel 1.6436166 0.3877172 4.2392150 2.24302751999462e-05
PozycjaZawodowaSpecjalista 1.4414432 0.3594241 4.0104244 6.06097104274706e-05
PozycjaZawodowaTechnik 1.8723332 0.3741681 5.0039899 5.61557001574215e-07

Współczynniki modelu:

Podsumowując, pozycje zawodowe, takie jak “Kadry”, “Przedstawiciel”, “Specjalista” i “Technik”, wydają się mieć istotny wpływ na decyzję pracowników o opuszczeniu firmy. Menedżerska pozycja nie wydaje się mieć istotnego wpływu na tę decyzję.

HIPOTEZY STATYSTYCZNE

Hipoteza zerowa (H0): Nie ma istotnego związku między pozycją zawodową a decyzją o opuszczeniu firmy.

Hipoteza alternatywna (H1): Istnieje istotny związek między pozycją zawodową a decyzją o opuszczeniu firmy.

Wnioski: Wartość p wynosząca 1.39e-07 jest bardzo niska, co sugeruje, że istnieje istotny związek między pozycją zawodową a decyzją o opuszczeniu firmy. Odrzucamy hipotezę zerową na rzecz hipotezy alternatywnej. Pozycja zawodowa pracowników może mieć istotny wpływ na ich decyzję o opuszczeniu firmy.

  1. CZY DOTYCHCZASOWA BIOGRAFIA ZAWODOWA WPŁYWA NA DECYZJĘ O OPUSZCZENIU FIRMY?

    • Czy pracownicy z krótszym stażem pracy są bardziej skłonni do opuszczenia firmy?

Estimate Std. Error z value Pr(>|z|) Significance
(Intercept) -0.6860266 0.1410933 -4.862219 1.2e-06 ***
StażPracy -0.1039069 0.0152002 -6.835913 0.0e+00 ***

Wartość współczynnika modelu:

Zarówno współczynnik dla “StażPracy”, jak i intercept są statystycznie istotne (p < 0.05). Oznacza to, że istnieje statystycznie istotna różnica w ilorazie szansy odejścia z firmy w zależności od stażu pracy.

HIPOTEZY STATYSTYCZNE

Hipoteza zerowa (H0): Staż pracy nie ma istotnego wpływu na decyzję o opuszczeniu firmy.

Hipoteza alternatywna (H1): Staż pracy ma istotny wpływ na decyzję o opuszczeniu firmy.

Wnioski: Na podstawie p-value wynoszącego 1.10e-12 odrzucamy hipotezę zerową na rzecz hipotezy alternatywnej. Oznacza to, że istnieje istotna statystycznie zależność między stażem pracy a decyzją o opuszczeniu firmy. Wartości p-value na poziomie istotności 0.05 sugerują, że możemy przyjąć, iż istnieje pewna statystyczna różnica w odnośnej liczbie pracowników opuszczających firmę w zależności od ich stażu pracy.

Model regresji logistycznej został zastosowany, aby ocenić wpływ ilości poprzednich pracodawców na decyzję o opuszczeniu firmy. Wyniki analizy są następujące:

Na podstawie analizy regresji logistycznej nie ma wystarczająco mocnych dowodów statystycznych na to, aby odrzucić hipotezę zerową, co sugeruje brak istotnego wpływu ilości poprzednich pracodawców na decyzję o opuszczeniu firmy. Dla ilości poprzednich pracodawców p-value wynosi 0.124, co jest wyższe niż standardowy poziom istotności 0.05. Możemy więc stwierdzić, że ilość poprzednich pracodawców nie wydaje się być silnym predyktorem odejścia z firmy.

Estimate Std. Error z value Pr(>|z|) Significance
(Intercept) -1.7491586 0.1134908 -15.412343 <2e-16 ***
PoprzedniPracodawcy 0.0444015 0.0288338 1.539912 0.123581800939256

HIPOTEZY STATYSTYCZNE

Hipoteza zerowa (H0): Nie ma istotnej statystycznie zależności między ilością poprzednich pracodawców a decyzją o opuszczeniu firmy.

Hipoteza alternatywna (H1): Istnieje istotna statystycznie zależność między ilością poprzednich pracodawców a decyzją o opuszczeniu firmy.

Wnioski: Na podstawie analizy statystycznej, nie ma podstaw do odrzucenia hipotezy zerowej na poziomie istotności 0.05. Oznacza to, że brak jest statystycznie istotnej różnicy w ilości pracowników opuszczających firmę w zależności od tego, ile mieli poprzednich pracodawców. Odpowiednio, ilość poprzednich pracodawców nie wydaje się być kluczowym czynnikiem wpływającym na decyzję pracowników o odejściu z firmy.

Estimate Std. Error z value Pr(>|z|) Significance
(Intercept) -0.8856514 0.1260019 -7.028872 0 ***
StażwFirmie -0.1437356 0.0228226 -6.297944 0 ***

Współczynnik dla Stażu w Firmie wynosi -0.14374. Interpretacja tego współczynnika w kontekście regresji logistycznej może być taka, że każdy dodatkowy rok stażu w firmie zmniejsza logarytm szansy opuszczenia firmy o -0.14374. Wartości współczynnika exp(StażwFirmie) wynoszą 0.8661167, co sugeruje, że dla jednego roku stażu w firmie logarytm szansy opuszczenia firmy maleje o około 13.4%.

Dodatkowo, wyniki testu zwracają p-value = 3.02e-10, co jest znacząco mniejsze niż poziom istotności 0.05. W związku z tym odrzucamy hipotezę zerową o braku wpływu stażu w firmie na decyzję o opuszczeniu firmy. Istnieje istotna statystycznie zależność między stażem w firmie a decyzją o odejściu.

HIPOTEZY STATYSTYCZNE

Hipoteza zerowa (H0): Staż w firmie nie ma wpływu na decyzję o opuszczeniu firmy.

Hipoteza alternatywna (H1): Staż w firmie ma istotny wpływ na decyzję o opuszczeniu firmy.

Wnioski: Analiza regresji logistycznej sugeruje, że istnieje istotna statystycznie zależność między stażem w firmie a decyzją o opuszczeniu firmy (p-value = 1.04e-10). Współczynnik logistyczny może zostać użyty do interpretacji kierunku zależności między zmiennymi.

Współczynnik dla Stażu na stanowisku (-0.17752) oznacza, że każdy dodatkowy rok stażu na stanowisku zmniejsza logarytm szansy odejścia z firmy o -0.17752. Wnioski: Wartości p-value dla obu współczynników są znacząco mniejsze niż 0.05, co wskazuje na istotność statystyczną. Oznacza to, że zarówno Intercept, jak i Staż na stanowisku mają istotny wpływ na szanse odejścia z firmy. Dodatkowy rok stażu na stanowisku jest związany z mniejszymi szansami na odejście z firmy.

Estimate Std. Error z value Pr(>|z|) Significance
(Intercept) -1.0464247 0.1097909 -9.531065 <2e-16 ***
StażnaStanowisku -0.1775176 0.0290242 -6.116195 9.58357515518216e-10

HIPOTEZY STATYSTYCZNE

Hipoteza zerowa (H0): Staż na stanowisku nie ma wpływu na decyzję o odejściu z firmy.

Hipoteza alternatywna (H1): Istnieje istotna statystycznie zależność między stażem na stanowisku a decyzją o odejściu z firmy.

Wnioski: Wyniki testu wskazują na p-value = 2.81e-10, co jest znacząco mniejsze niż przyjęty poziom istotności 0.05. Odrzucamy więc hipotezę zerową na rzecz hipotezy alternatywnej. Istnieje istotna statystycznie zależność między stażem na stanowisku a decyzją o odejściu z firmy.

PODSUMOWANIE

Nasz projekt, oparty na zanonimizowanych danych, obejmuje również informacje strategiczne dla badanej firmy, co uniemożliwia ujawnienie źródła tych danych. W fazie wstępnej skupiliśmy się na oczyszczeniu wszystkich danych, przeprowadzając walidację, eliminując brakujące obserwacje oraz identyfikując przypadki odstające. Po ukończeniu tego etapu przeszliśmy do analizy opisowej zmiennych oraz weryfikacji hipotez statystycznych bazujących na postawionych wcześniej pytaniach badawczych. Na podstawie przeprowadzonej analizy, możemy wyciągnąć wiążące wnioski. Biorąc je pod uwagę przedstawiamy zalecenia dotyczące polityki firmy w odniesieniu do identyfikacji i zarządzania ryzykiem rotacji:

Zbyt duże obciążenie pracą i wpływ życia prywatnego przyczynia się istotnie na decyzję o opuszczeniu firmy. Godziny nadliczbowe, częstość delegacji i odległość od domu są związane z wyższym prawdopodobieństwem odejścia. Rekomendujemy politykę ograniczającą ilość godzin nadliczbowych, aby zmniejszyć obciążenie pracą i zminimalizować ryzyko rotacji. Zachęcamy do równoważenia czasu pracy poprzez elastyczne harmonogramy i możliwość pracy zdalnej.

Należy także zwrócić uwagę na wpływ stanu cywilnego i wieku, które okazują się ważnymi determinantami. Osoby rozwiedzione mają większe szanse na odejście w porównaniu do osób singli i osób w związku małżeńskim. Podobnie jest także w przypadku młodych osób. Są to grupy najbardziej elastyczne, polityka kadrowa dla tych grup pracowników powinna uwzględniać ich specyficzne potrzeby i oczekiwania. Postulujemy wsparcie pracowników w utrzymaniu równowagi między życiem zawodowym a prywatnym poprzez programy wsparcia, takie jak opieka nad dziećmi czy pomoc w organizacji podróży służbowych. Firma zarazem powinna udostępniać programy rozwoju zawodowego, takie jak szkolenia i awanse, aby zwiększać zaangażowanie młodych pracowników i utrzymać talenty.

Nie ma jednoznacznych dowodów na istotny wpływ relacji pomiędzy poziomem wynagrodzenia a średnim poziomem wynagrodzenia, bez względu jaki był punkt referencyjny. Chociaż te czynniki nie mają istotnego wpływu na rotację pracowników - przedsiębiorstwa powinny zastosować poniższe rekomendacje. W szczególności dotyczy to monitorowania średnich wynagrodzenia rynku pracy i utrzymywania konkurencyjnych płac. Te działania mogą pomóc w celu polepszenia efektywności i zadowolenia pracowników z pracy. Szczególnie poprawa drugiego czynnika posiada duży potencjał do ograniczenia rotacji.

Zadowolenie z relacji międzyludzkich w pracy ma duży i istotny wpływ na decyzję o opuszczeniu firmy. Ważnym narzędziem mogą okazać się programy poprawiające atmosferę pracy i relacje między pracownikami, aby zwiększyć zadowolenie z relacji zawodowych. Konieczne będzie działania w zakresie monitorowania wskaźników zadowolenia pracowników, a także szkolenia z zakresu rozwijania kompetencji miękkich, takie jak komunikacja, współpraca zespołowa i rozwiązywanie problemów.

W kontekście trajektorii zawodowych, nie istnieją jednoznaczne dowody na to, czy awanse w firmie, liczba szkoleń w ostatnim roku, czas od ostatniego awansu, poziom edukacji pracowników lub rodzaj ukończonego kierunku mają istotny wpływ na ryzyko odejścia pracowników. Jednak podobnie jak w obszarze pensji; może to wywierać wpływ na efektywność pracy. W szczególności postulujemy wprowadzenie regularnych ocen okresowych, aby identyfikować potencjalne obszary rozwoju talentów i odpowiednie prowadzenie polityki kadrowej.

Ostatecznie, skoncentrowanie się na wyżej wymienionych obszarach polityki kadrowej może przyczynić się do zmniejszenia rotacji pracowników i poprawy wyników badanego przedsiębiorstwa.