Identyfikacja i analiza różnic w charakterystyce treningowej oraz parametrach fizjologicznych w zależności od płci

Wstęp

Celem niniejszego raportu jest analiza danych dotyczących siłowni. Zbiór danych zawiera 973 obserwacji oraz 15 zmiennych.

Głównym celem niniejszego raportu jest identyfikacja i analiza różnic w charakterystyce treningowej oraz parametrach fizjologicznych w zależności od płci.

Ma to na celu sprawdzenie, jak płeć różnicuje podejście do aktywności fizycznej, wydolność organizmu oraz efekty treningowe mierzone za pomocą spalonych kalorii czy wskaźnika BMI. Dlatego też struktura raportu została zaprojektowana tak, aby każda zmienna była analizowana w bezpośrednim podziale na zmienną Plec. Pozwala to na bieżąco konfrontować wyniki kobiet i mężczyzn, co ułatwia dostrzeżenie istotnych statystycznie różnic i anomalii w obrębie każdej z grup.

Opis danych

Dane zawierają następujące zmienne, ich nazwy zostały przetłumaczone na język Polski:

Zmienne: oryginalne i przetłumaczone nazwy
Oryginalna nazwa Nowa nazwa
Age Wiek
Gender Plec
Weight..kg. Waga_kg
Height..m. Wzrost_m
Max_BPM Max_BPM
Avg_BPM Srednie_BPM
Resting_BPM Spoczynkowe_BPM
Session_Duration..hours. Czas_trwania_sesji_h
Calories_Burned Spalone_kalorie
Workout_Type Rodzaj_treningu
Fat_Percentage Procent_tkanki_tluszczowej
Water_Intake..liters. Spozycie_wody_l
Workout_Frequency..days.week. Czestotliwosc_treningow_dni_tydzien
Experience_Level Poziom_zaawansowania
BMI BMI

Przygotowanie danych

Zmienne Plec, Rodzaj_treningu oraz Poziom_zaawansowania zostały przekonwertowane na faktory, a ich poziomy (etykiety) przetłumaczone na język polski. Zmiana ta jest niezbędna do poprawnego przeprowadzenia imputacji danych, aby algorytmy uzupełniające braki traktowały te kolumny jako kategorie.

Braki danych

Przed przystąpieniem do imputacji sprawdzono strukturę brakujących danych w zbiorze. Poniższa tabela prezentuje liczbę oraz procent braków dla poszczególnych zmiennych.

Podsumowanie brakujących danych (liczba i procent)
Zmienna Liczba braków Procent braków
Rodzaj_treningu 150 15.4
BMI 150 15.4
Wiek 100 10.3
Plec 0 0
Waga_kg 0 0
Wzrost_m 0 0
Max_BPM 0 0
Srednie_BPM 0 0
Spoczynkowe_BPM 0 0
Czas_trwania_sesji_h 0 0
Spalone_kalorie 0 0
Procent_tkanki_tluszczowej 0 0
Spozycie_wody_l 0 0
Czestotliwosc_treningow_dni_tydzien 0 0
Poziom_zaawansowania 0 0

Poniższa tabela prezentuje szczegółową statystykę brakujących obserwacji. Analiza wykazała, że problem niekompletnych danych dotyczy jedynie trzech zmiennych:

  • Rodzaj_treningu oraz BMI: odnotowano po 150 braków, co stanowi 15,4% zbioru.

  • Wiek: brakuje 100 obserwacji, czyli 10,3% całości.

Pozostałe zmienne (m.in. Plec, Waga_kg, Wzrost_m) są kompletne i nie zawierają brakujących wartości.

Poniższy wykres obrazuje powiązania między brakującymi wartościami w różnych zmiennych. Wysokie słupki dla pojedynczych zmiennych (np. tylko Wiek lub tylko BMI) przy jednoczesnym braku licznych grup wspólnych wskazują, że braki są rozproszone.

Brak widocznego systematycznego wzorca współwystępowania sugeruje mechanizm MCAR (Missing Completely at Random). Oznacza to, że braki danych występują całkowicie losowo i nie zależą od wartości innych zmiennych w zbiorze.

Imputacja brakujących danych

BMI

Ze względu na obecność zmiennych Waga_kg oraz Wzrost_m, które są kompletne (nie zawierają braków danych), odstąpiono od imputacji statystycznej zmiennej BMI. Zamiast tego, wartość wskaźnika została obliczona ponownie dla wszystkich obserwacji zgodnie ze wzorem: \[BMI = \frac{Waga}{Wzrost^2}\] Podejście to eliminuje braki danych w kolumnie BMI i gwarantuje precyzyjne wartości, wynikające z fizycznych parametrów badanych osób.

Liczba braków po imputacji BMI = 0

Wiek i Rodzaj_treningu

Ze względu na charakterystykę braków danych oraz ich rozproszenie, zdecydowano się na zastosowanie metody imputacji wielokrotnej (Multiple Imputation by Chained Equations - MICE). Metoda ta jest odpowiednia dla danych z brakami MCAR i pozwala na zachowanie zmienności oraz struktury danych.

Liczba braków po imputacji Wiek = 0

Liczba braków po imputacji Rodzaj_treningu = 0

Aby ocenić poprawność przeprowadzonej imputacji dla zmiennej Wiek, porównano rozkłady gęstości danych oryginalnych (przed uzupełnieniem) oraz danych kompletnych (po zastosowaniu MICE). Pokrywanie się obu wykresów wskazuje na to, że imputacja nie wprowadziła sztucznych zniekształceń do struktury danych.

Podczas procesu imputacji powstał nowy zbiór danych z poimputowanymi wartościami, nazwany jako dane_komp.

Walidacja danych

Po zakończeniu procesu imputacji, przeprowadzono walidację danych w celu zapewnienia ich spójności i poprawności. Sprawdzono, czy wartości w poszczególnych zmiennych mieszczą się w oczekiwanych zakresach oraz czy nie występują anomalie. Szczegóły reguł walidacyjnych opisano w poniższej tabeli.

Szczegółowy opis reguł walidacyjnych
Zmienna Zastosowana reguła logiczna
Wiek Wartość > 0 oraz < 120 (realny wiek człowieka)
Waga_kg Wartość musi być liczbą dodatnią (> 0)
Wzrost_m Wartość musi być liczbą dodatnią (> 0)
Max_BPM Wartość > 0 oraz wyższa niż Średnie BPM
Srednie_BPM Wartość > 0; musi być pomiędzy Spoczynkowym a Max BPM
Spoczynkowe_BPM Wartość > 0 oraz niższa niż Średnie BPM
Czas_trwania_sesji_h Wartość musi być liczbą dodatnią (> 0)
Spalone_kalorie Wartość musi być liczbą dodatnią (> 0)
Procent_tkanki_tluszczowej Wartość w przedziale otwartym (0, 100)
Spozycie_wody_l Wartość musi być liczbą dodatnią (> 0)
BMI Musi równać się: Waga / Wzrost^2 (zaokrąglenie do 0.01) oraz > 0

Następnie, przeprowadzono konfrontację danych z zestawem reguł walidacyjnych. Poniższy wykres przedstawia wyniki tej konfrontacji, ilustrując liczbę spełnionych oraz niespełnionych reguł dla zbioru danych dane_komp.

Jedynie reguła Max_BPM > Srednie_BPM nie została spełniona, a błąd ten wystąpił 28 razy.

Naprawa danych niespełniających reguł

W celu naprawy danych niespełniających reguł, błędne wartości zamieniono na braki danych, a następnie uzupełniono imputacją kNN. Zdecydowano się na tą metodą ponieważ wcześniej używana metoda MICE nie przyniosła porządanych rezultatów.

Po zastosowaniu metody kNN, ponownie przeprowadzono walidację danych, aby upewnić się, że wszystkie reguły zostały spełnione. Poniższy wykres przedstawia wyniki konfrontacji po naprawie danych.

Jak można zauważyć, po naprawie danych wszystkie reguły walidacyjne zostały spełnione, co potwierdza skuteczność zastosowanej metody.

Dane końcowe, po przeprowadzeniu imputacji oraz walidacji, zostały nazwane jako dane_popr.

Analiza danych

W celu uzyskania jak największej kompleksowości oraz spójności analiz, zdecydowano się na zaagregowanie wyników według zmiennych, zamiast klasycznego podziału na typy analiz.

Oznacza to, że każda kluczowa zmienna w zbiorze zostanie poddana pełnemu procesowi badawczemu w jednym bloku tematycznym, obejmującym:

  • Wizualizację danych,

  • Analizę opisową,

  • Wnioskowanie statystyczne.

Zgodnie z zapowiedzią, celem raportu jest wykazanie różnic między kobietami a mężczyznami. W związku z tym, analiza każdej zmiennej została podzielona na Plec, co pozwala na bezpośrednie porównanie statystyk, rozkładów oraz istotności różnic w obu grupach.

Waga, Wzrost oraz BMI

BMI jest wynikową dwóch zmiennych: Waga_kg oraz Wzrost_m. Wykresy pokazują, że mężczyźni są zazwyczaj ciężsi i wyżsi od kobiet, co bezpośrednio przekłada się na ich wyższe wyniki BMI. Warto zauważyć, że o ile u kobiet wskaźnik ten jest dość wyrównany, o tyle u mężczyzn występuje dużo większy rozrzut danych oraz wartości skrajne, co świadczy o większym zróżnicowaniu tej grupy.

Analiza wskaźnika BMI na podstawie poniższej tabeli, potwierdza różnice w budowie ciała badanych grup. Mężczyźni charakteryzują się wyraźnie wyższą masą ciała w relacji do wzrostu, co obrazuje mediana wynosząca 26,22 przy 22,92 w grupie kobiet.

Kluczowym wnioskiem z danych jest znacznie większe zróżnicowanie wyników wśród mężczyzn. Podczas gdy wskaźnik BMI u kobiet jest bardziej skoncentrowany wokół średniej, u mężczyzn obserwujemy bardzo szeroki wachlarz wartości, od wyników minimalnych po ekstremalnie wysokie, sięgające niemal 50. Świadczy o tym rozstęp międzykwartylowy (IQR = 10,57), który jest niemal dwukrotnie wyższy niż u kobiet.

Dodatnia skośność oraz wysokie odchylenie standardowe w grupie męskiej potwierdzają, że problem nadmiernej masy ciała jest w niej bardziej złożony. Występowanie licznych wartości odstających wyraźnie podnosi ogólną średnią i wskazuje na dużą różnorodność sylwetek w męskiej częsci badanej grupy.

BMI w podziale na płeć
Statystyka Ogółem (N=973) Kobiety (N=462) Mężczyźni (N=511)
BMI         
   Min 12.32 12.47 12.32
   Max 49.84 35.04 49.84
   Kwartyl dolny 20.11 19.4325 21.16
   Mediana 24.16 22.92 26.22
   Kwartyl górny 28.56 26.05 31.725
   Średnia 24.91 22.73 26.89
   Odch. std. 6.66 4.48 7.63
   IQR 8.45 6.62 10.57
   Odchylenie ćwiartkowe 4.22 3.31 5.28
   Odch. std. w % 0.27 0.2 0.28
   Odch. ćwiartkowe w % 0.35 0.29 0.4
   Skośność 0.76 0 0.46
   Kurtoza 0.73 -0.54 -0.18

Na podstawie wyników testów statystycznych dwóch średnich, zawartych na poniższym wykresie, można stwierdzić, że istnieją istotne statystycznie różnice w wartościach BMI między kobietami a mężczyznami. Dodatkowo wykres jasno potwierdza, że wyniki mężczyzn są znacznie bardziej rozproszone oraz że mężczyźni charakteryzują się wyższym odsetkiem wartości skrajnych, co potwierdza większe zróźnicowanie tej grupy.

Tętno

Ze względu na dużą liczbę zmiennych związanych z tętnem (Max_BPM, Srednie_BPM, Spoczynkowe_BPM), zdecydowano się na przeprowadzenie kompleksowej analizy jedynie tętna średniego. Wybór ten wynika z faktu, że Srednie_BPM najlepiej oddaje ogólną wydolność i obciążenie organizmu, niwelując chwilowe skoki czy spadki wartości.

Powyższy wykres pudełkowy obrazuje rozkład średniego tętna (Srednie_BPM) zarejestrowanego podczas sesji treningowych, z podziałem na płeć. W przeciwieństwie do analizowanych wcześniej parametrów fizycznych (waga, wzrost), gdzie dymorfizm płciowy był wyraźnie widoczny, w przypadku intensywności treningu mierzonej tętnem, obserwujemy znaczne podobieństwo między kobietami a mężczyznami.

Analiza opisowa przedstawiona w poniższej tabeli potwierdza tę obserwację. Zarówno średnia, mediana, jak i rozstęp wartości Srednie_BPM są bardzo zbliżone w obu grupach płciowych. Różnice w odchyleniu standardowym oraz IQR są minimalne, co wskazuje na podobną zmienność wyników wśród kobiet i mężczyzn.

Średnie tętno treningowe według płci
Statystyka Ogółem (N=973) Kobiety (N=462) Mężczyźni (N=511)
Srednie_BPM         
   Min 120 120 120
   Max 169 169 169
   Kwartyl dolny 131 131 132
   Mediana 143 143 142
   Kwartyl górny 156 155 156
   Średnia 143.42 143.24 143.57
   Odch. std. 14.14 14.16 14.13
   IQR 25 24 24
   Odchylenie ćwiartkowe 12.5 12 12
   Odch. std. w % 0.1 0.1 0.1
   Odch. ćwiartkowe w % 0.17 0.17 0.17
   Skośność 0.1 0.07 0.14
   Kurtoza -1.18 -1.2 -1.17

Na podstawie wyników testów statystycznych dwóch średnich, zawartych na poniższym wykresie, można stwierdzić, że nie ma istotnych statystycznie różnic w wartościach średniego tętna między kobietami a mężczyznami. Wykres dodatkowo potwierdza, że rozkłady obu grup są bardzo podobne pod względem kształtu i rozproszenia danych.

Czas trwania sesji

Powyższy wykres pokazuje ile czasu trwa sesja treningowa (Czas_trwania_sesji_h) w zależności od płci (Plec). Dzięki temu można szybko ocenić, czy jedna grupa ma wyraźnie dłuższe lub krótsze sesje.

Z przedstawionego porównania wynika, że rozkład czasu trwania sesji u kobiet i mężczyzn jest bardzo podobny. Wartości w obu grupach są zbliżone, a zakres i rozproszenie wyników nie wskazują na wyraźną przewagę którejkolwiek płci. W analizowanych danych płeć nie wydaje się czynnikiem wpływającym na długość sesji, a obserwowane różnice, jeśli występują, mają niewielkie znaczenie.

Ciekawszą zależnością jest natomiast relacja pomiędzy Czas_trwania_sesji_h, a średnią liczbą spalonych kalorii (Spalone_kalorie), przedstawiona na wykresie punktowym. Każdy punkt odpowiada obserwacji, a kolory rozróżniają płeć, dzięki czemu na jednym wykresie można jednocześnie porównać przebieg zależności w obu grupach.

Wykres pokazuje wyraźny, rosnący trend. Im dłużej trwa sesja, tym większa jest średnia liczba spalonych kalorii. Co istotne, zależność ta jest widoczna zarówno u kobiet, jak i u mężczyzn, ale punkty dla mężczyzn częściej układają się „wyżej” przy podobnych czasach trwania. Sugeruje to, że przy zbliżonej długości sesji mężczyźni przeciętnie spalają więcej kalorii, co może wynikać m.in. z różnic w intensywności wysiłku, masie ciała czy poziomie obciążenia podczas treningu. Dodatkowo widać, że przy dłuższych sesjach rozrzut wyników staje się większy, co wskazuje, że końcowy efekt kaloryczny zależy nie tylko od czasu, ale również od sposobu realizacji treningu, takich jak tempo, obciążenie, czy przerwy.

Spalone kalorie

Poniższy wykres pudełkowy obrazuje rozkład spalonych kalorii podczas sesji treningowych, z podziałem na płeć. Widać wyraźnie, że mężczyźni spalają znacznie więcej kalorii niż kobiety, co jest zgodne z oczekiwaniami ze względu na różnice w masie ciała i metabolizmie.

Analiza opisowa przedstawiona w poniższej tabeli potwierdza tę obserwację. Zarówno średnia, mediana, jak i rozstęp wartości Spalone_kalorie są wyraźnie wyższe w grupie mężczyzn w porównaniu do kobiet. Różnice w odchyleniu standardowym oraz IQR również wskazują na większą zmienność wyników wśród mężczyzn.

Spalone kalorie według płci
Statystyka Ogółem (N=973) Kobiety (N=462) Mężczyźni (N=511)
Spalone_kalorie         
   Min 303 303 331
   Max 1783 1625 1783
   Kwartyl dolny 720 710.25 742
   Mediana 893 867 937
   Kwartyl górny 1076 1016 1138.5
   Średnia 905.42 862.25 944.46
   Odch. std. 272.64 249.61 286.59
   IQR 356 305.75 396.5
   Odchylenie ćwiartkowe 178 152.88 198.25
   Odch. std. w % 0.3 0.29 0.3
   Odch. ćwiartkowe w % 0.4 0.35 0.42
   Skośność 0.28 0.17 0.26
   Kurtoza -0.07 -0.1 -0.22

Na podstawie wyników testów statystycznych dwóch średnich, zawartych na poniższym wykresie, można stwierdzić, że istnieją istotne statystycznie różnice w wartościach spalonych kalorii między kobietami a mężczyznami. Wykres dodatkowo potwierdza, że rozkłady obu grup różnią się pod względem kształtu i rozproszenia danych, z wyraźnie wyższymi wartościami w grupie mężczyzn.

Rodzaj treningu

Kolejny wykres przedstawia strukturę wyboru rodzaju treningu w obrębie płci w formie słupków skumulowanych do 100%. Oznacza to, że nie porównujemy tutaj łącznej liczby treningów między kobietami i mężczyznami, lecz proporcje, czyli jaki odsetek treningów w danej grupie płci stanowi każdy typ aktywności (Cardio, HIIT, Strenght, Yoga).

Z wykresu wynika, że profil treningowy kobiet i mężczyzn jest ogólnie zbliżony, ponieważ udziały poszczególnych rodzajów treningu są w obu grupach porównywalne i żaden typ nie dominuje w sposób skrajny. Widoczne są jednak drobne różnice, ponieważ u kobiet nieco większy udział ma Cardio, natomiast u mężczyzn relatywnie większy udział stanowi Yoga. Jednocześnie HIIT oraz Strenght utrzymują bardzo podobne proporcje w obu grupach, co sugeruje, że te formy aktywności są wybierane w zbliżony sposób niezależnie od płci.

Aby zweryfikować, czy obserwowane różnice mają charakter statystycznie istotny, wykonano test niezależności chi-kwadrat (Pearsona). Wynik testu nie wykazał istotnej zależności między płcią a wybieranym typem treningu, a siła ewentualnego związku jest znikoma. Oznacza to, że w badanej próbie kobiety i mężczyźni wybierają podobne formy aktywności, a zauważalne na wykresie różnice mają głównie charakter opisowy.

Procent tkanki tłuszczowej

Procent_tkanki_tluszczowej okazał się szczególnie ciekawą zmienną. Wykres pudełkowy widoczny poniżej przedstawia porównanie procentowej zawartości tkanki tłuszczowej u kobiet i mężczyzn.

Widoczna jest wyraźna różnica między płciami. Rozkład dla kobiet znajduje się wyżej niż dla mężczyzn, co oznacza, że kobiety w analizowanej próbie mają generalnie większy udział tkanki tłuszczowej. Różnica ma charakter systematyczny, ponieważ dotyczy całego rozkładu, a nie pojedynczych przypadków. Pojedyncze wartości odstające po stronie niskich wartości sugerują obecność osób o wyjątkowo niskiej zawartości tkanki tłuszczowej w stosunku do reszty badanych.

Na wykresie wyżej widzieliśmy porównanie procentowej zawartości tkanki tłuszczowej w podziale na płeć w ujęciu „pudełkowym”, czyli z naciskiem na wartości typowe i rozrzut. Tutaj natomiast mamy wykres gęstości, który pokazuje jak często pojawiają się poszczególne poziomy tkanki tłuszczowej wśród kobiet i mężczyzn, czyli jak wygląda „kształt” rozkładu w obu grupach.

Widać wyraźnie, że krzywa dla kobiet jest przesunięta w stronę wyższych wartości, co potwierdza wcześniejszą obserwację, że kobiety częściej osiągają wyższy poziom tkanki tłuszczowej. Jednocześnie obie krzywe częściowo się nakładają, co oznacza, że istnieje zakres wartości wspólny dla obu płci, część mężczyzn i część kobiet mieści się w podobnych przedziałach. Różnica ujawnia się przede wszystkim w tym, gdzie przypada „największe zagęszczenie” wyników. U mężczyzn bardziej koncentruje się ono w niższych i średnich zakresach, a u kobiet częściej w średnich i wyższych. Taki wykres dobrze pokazuje, że różnice nie dotyczą pojedynczych obserwacji, tylko wynikają z innego rozkładu całej populacji w obu grupach.

Na poprzednich wykresach widać było, że między płciami pojawiają się różnice w cechach związanych z budową ciała, ale tamte porównania miały charakter głównie opisowy. Pokazywały kształt rozkładów i ich przesunięcia. Poniższy wykres stanowi syntetyczne podsumowanie tej części analizy.

Właśnie ten wykres potwierdza wszystko, co wynikało z poprzednich wizualizacji. Różnica między płciami nie jest przypadkowa. Test Welcha daje ekstremalnie małe p, więc statystycznie jest to bardzo silny efekt, a wartość Hedgesa wskazuje, że różnica ma też znaczenie praktyczne (to nie jest „kosmetyczne” przesunięcie). Ten wykres jednoznacznie potwierdza, że kobiety i mężczyźni w badanej próbie istotnie różnią się poziomem tkanki tłuszczowej.

Spożycie wody podczas treningu

Następną zmienną jest spożycie wody podczas trenigu. Poniższy wykres pudełkowy przedstawia porównanie spożycia wody podczas treningu między kobietami a mężczyznami. Widać wyraźnie, że mężczyźni spożywają więcej wody niż kobiety, co jest zgodne z wcześniejszą obserwacją z wykresu punktowego.

Kolejny wykres, który możemy zobaczyć poniżej, przedstawia zależność między czasem trwania sesji treningowej a ilością spożytej wody, z podziałem na płeć. Obserwacje wskazują, że zarówno kobiety, jak i mężczyźni wykazują tendencję do zwiększania spożycia wody wraz z wydłużaniem czasu treningu. Jednakże, mężczyźni generalnie spożywają więcej wody niż kobiety przy podobnym czasie trwania sesji. Może to wynikać z większej masy ciała, wyższej intensywności treningu lub innych czynników fizjologicznych.

Co ciekawe, na wykresie widać wyraźną anomalię od ok. 1,5 godziny treningu. Dla dłuższych sesji wartości spożycia wody przestają się rozpraszać i układają się niemal w stałe poziome pasy. U mężczyzn obserwujemy koncentrację wyników w okolicach 3,5 l, a u kobiet w okolicach 2,7 l, co sugeruje „sztuczne” ucięcie lub przypisanie stałych wartości (np. ograniczenie skali, zaokrąglanie, domyślne ustawienia w pomiarze lub błąd w rejestracji danych dla treningów powyżej 1,5 h). W efekcie zależność między czasem treningu a spożyciem wody w tym zakresie może być częściowo zniekształcona i wymaga ostrożnej interpretacji.

Częstotliwość treningów w tygodniu

Następną analizowaną zmienną jest Czestotliwosc_treningow_dni_tydzien (częstotliwość treningów w tygodniu), przedstawiona w podziale na płeć w formie słupków skumulowanych do 100%. Wykres pokazuje, że rozkład liczby dni treningowych jest wśród kobiet i mężczyzn bardzo podobny. Najczęściej deklarowane są 3 dni treningowe w tygodniu oraz 4 dni. Rzadziej pojawiają się treningi 2 razy w tygodniu oraz 5 razy w tygodniu.

Aby sprawdzić, czy płeć różnicuje częstotliwość treningów, wykonano test niezależności chi-kwadrat (Pearsona). Wynik wskazuje, że nie ma istotnej statystycznie zależności między płcią a liczbą dni treningowych w tygodniu, a siła związku jest w praktyce zerowa. Oznacza to, że w badanej próbie kobiety i mężczyźni trenują z porównywalną częstotliwością, a obserwowane różnice procentowe mają wyłącznie marginalny charakter.

Następnie, aby pokazać, w których grupach (łącząc poziom zaawansowania i częstotliwość treningów w tygodniu) znajduje się najwięcej osób, wykorzystano mapę cieplną przedstawioną osobno dla kobiet i mężczyzn. Im ciemniejsze pole, tym większa liczba badanych w danej kombinacji.

Z wykresu wynika, że zarówno wśród kobiet, jak i mężczyzn największe skupienie osób występuje przede wszystkim przy poziomie średniozaawansowanym oraz treningach wykonywanych około 3–4 razy w tygodniu. Oznacza to, że najliczniejszą część próby stanowią osoby o umiarkowanym poziomie umiejętności, trenujące regularnie kilka razy w tygodniu. Wśród mężczyzn dodatkowo wyraźniej zaznacza się grupa początkujących trenujących 2 razy w tygodniu, natomiast u kobiet rozkład wśród początkujących jest bardziej „rozciągnięty” i częściej obejmuje także 3 dni treningowe. Najmniej osób pojawia się w „skrajnych” konfiguracjach (np. bardzo wysoka częstotliwość treningów przy niskim poziomie zaawansowania), co sugeruje, że częstsze treningi częściej współwystępują z wyższym poziomem zaawansowania.

Poziom zaawansowania

Nastepną analizowaną zmienną był Poziom_zaawansowania, wprowadzony przy okazji częstotliwości treningów. Wykres poniżej przedstawia strukturę analizowanej zmiennej w obrębie płci (słupki skumulowane do 100%), czyli pokazuje, jaki odsetek kobiet i mężczyzn deklaruje poziom początkujący, średniozaawansowany i zaawansowany. Z danych wynika, że rozkład jest praktycznie identyczny w obu grupach.

Wśród kobiet najliczniejszą grupę stanowią osoby średniozaawansowane (42%), następnie początkujące (39%), a najmniejszy udział mają osoby zaawansowane (19%). Analogiczny obraz widać u mężczyzn, poeniważ średniozaawansowani to 42%, początkujący 39%, a zaawansowani 20%. Aby sprawdzić, czy płeć wiąże się z poziomem zaawansowania, wykonano test niezależności chi-kwadrat (Pearsona). Wynik wskazuje na brak istotnej zależności, a siła związku jest w praktyce zerowa. W praktyce oznacza to, że w badanej próbie kobiety i mężczyźni mają bardzo podobną strukturę poziomów zaawansowania, a ewentualne różnice są wyłącznie kosmetyczne.

Aby jeszcze lepiej przedstawić strukturę badanej próby, na wykresie zestawiono udział kobiet i mężczyzn w poszczególnych poziomach zaawansowania. W każdym z poziomów widoczna jest niewielka przewaga mężczyzn, jednak proporcje pozostają bardzo stabilne, udział mężczyzn wynosi ok. 52–53%, a kobiet ok. 47–48% niezależnie od poziomu. Oznacza to, że płeć nie różnicuje w istotny sposób rozkładu poziomów zaawansowania, struktura jest zbliżona w całej próbie.

Jednocześnie wykres pokazuje różnice w liczebności samych poziomów: najwięcej osób znajduje się w grupie średniozaawansowanej, nieco mniej w grupie początkującej, a najmniej w grupie zaawansowanej. Sugeruje to, że badana populacja koncentruje się głównie na poziomie średnim, natomiast udział osób deklarujących poziom zaawansowany jest wyraźnie mniejszy, przy zachowaniu podobnych proporcji płci.

Struktura demograficzna próby

Wykres poniżej przedstawia strukturę płci w badanej grupie. W próbie widoczna jest nieznaczna przewaga mężczyzn, którzy stanowią 52,5% respondentów, podczas gdy kobiety stanowią 47,5%. Oznacza to, że grupa jest dość zrównoważona pod względem płci, a różnica między udziałem kobiet i mężczyzn jest niewielka, co sprzyjało porównaniom między tymi dwiema kategoriami w poprzednich analizach.

W dalszej kolejności przeanalizowano strukturę wieku w obrębie płci, przedstawioną jako rozkład procentowy (100% w ramach każdej płci). W obu grupach dominują kategorie wiekowe 36–45 oraz 46–55, co sugeruje, że badana próba składa się głównie z osób w wieku średnim. U kobiet udziały tych grup wynoszą odpowiednio 23,8% (36–45) i 24,7% (46–55), natomiast u mężczyzn 25,6% (36–45) i 24,9% (46–55).

Różnice między płciami są niewielkie, ale widoczne. Kobiety częściej niż mężczyźni należą do najmłodszej grupy 16–25 (22,1% vs 18%), podczas gdy u mężczyzn nieco większy udział ma grupa 56–65 (10% vs 8,2%). Grupa 26–35 pozostaje praktycznie na tym samym poziomie w obu płciach (21,2% u kobiet i 21,5% u mężczyzn). Ogólnie rozkład wieku jest zbliżony dla kobiet i mężczyzn, z lekką tendencją do „młodszej” struktury wśród kobiet i nieco „starszej” wśród mężczyzn.

Podsumowanie

Niniejszy raport przeprowadził kompleksową analizę danych dotyczących charakterystyki treningowej oraz parametrów fizjologicznych w zależności od płci. Główne wnioski z analizy są następujące:

  1. Różnice w budowie ciała: Mężczyźni charakteryzują się wyższą wagą, wzrostem oraz wskaźnikiem BMI w porównaniu do kobiet. Ponadto, rozkład BMI u mężczyzn jest bardziej zróżnicowany, co wskazuje na większą różnorodność sylwetek w tej grupie.
  2. Tętno treningowe: Analiza średniego tętna podczas sesji treningowych wykazała brak istotnych statystycznie różnic między kobietami a mężczyznami. Obie grupy prezentują podobne wartości i rozkłady tej zmiennej.
  3. Spalone kalorie: Mężczyźni spalają znacznie więcej kalorii podczas treningów w porównaniu do kobiet. Różnice te są istotne statystycznie i potwierdzone zarówno analizą opisową, jak i testami statystycznymi.
  4. Brak różnic w profilu behawioralnym: Wbrew stereotypom, płeć nie różnicuje sposobu podejścia do aktywności fizycznej. Nie odnotowano istotnej statystycznie zależności między płcią a wybieranym rodzajem treningu.Struktura poziomu zaawansowania oraz częstotliwość treningów w tygodniu są niemal bliźniacze w obu grupach. Wskazuje to, że motywacja i nawyki treningowe badanej populacji są niezależne od płci.
  5. Jakość danych i anomalie: Dane charakteryzowały się losowym rozkładem braków (MCAR), co pozwoliło na skuteczną imputację. Zidentyfikowano jednak anomalię w zmiennej dotyczącej spożycia wody dla treningów trwających powyżej 1,5 godziny (nienaturalnie stałe wartości), co sugeruje ograniczenia metodologiczne w pomiarze długotrwałych sesji i wymaga ostrożności interpretacyjnej w tym zakresie.

Podsumowując, analiza dowodzi, że płeć jest silną determinantą parametrów fizjologicznych (budowa, spalanie, nawodnienie), ale nie determinuje profilu sportowego (wybór dyscypliny, intensywność, częstotliwość). Wnioski te sugerują, że plany treningowe dla kobiet i mężczyzn mogą być zbliżone pod kątem struktury i intensywności, a różnicowane głównie w zakresie oczekiwanych rezultatów kalorycznych i zapotrzebowania na płyny.