Identyfikacja i analiza różnic w charakterystyce treningowej oraz parametrach fizjologicznych w zależności od płci
Wstęp
Celem niniejszego raportu jest analiza danych dotyczących siłowni. Zbiór danych zawiera 973 obserwacji oraz 15 zmiennych.
Głównym celem niniejszego raportu jest identyfikacja i analiza różnic w charakterystyce treningowej oraz parametrach fizjologicznych w zależności od płci.
Ma to na celu sprawdzenie, jak płeć różnicuje podejście do aktywności
fizycznej, wydolność organizmu oraz efekty treningowe mierzone za pomocą
spalonych kalorii czy wskaźnika BMI.
Dlatego też struktura raportu została zaprojektowana tak, aby każda
zmienna była analizowana w bezpośrednim podziale na zmienną
Plec. Pozwala to na bieżąco konfrontować wyniki kobiet i
mężczyzn, co ułatwia dostrzeżenie istotnych statystycznie różnic i
anomalii w obrębie każdej z grup.
Opis danych
Dane zawierają następujące zmienne, ich nazwy zostały przetłumaczone na język Polski:
| Oryginalna nazwa | Nowa nazwa |
|---|---|
| Age | Wiek |
| Gender | Plec |
| Weight..kg. | Waga_kg |
| Height..m. | Wzrost_m |
| Max_BPM | Max_BPM |
| Avg_BPM | Srednie_BPM |
| Resting_BPM | Spoczynkowe_BPM |
| Session_Duration..hours. | Czas_trwania_sesji_h |
| Calories_Burned | Spalone_kalorie |
| Workout_Type | Rodzaj_treningu |
| Fat_Percentage | Procent_tkanki_tluszczowej |
| Water_Intake..liters. | Spozycie_wody_l |
| Workout_Frequency..days.week. | Czestotliwosc_treningow_dni_tydzien |
| Experience_Level | Poziom_zaawansowania |
| BMI | BMI |
Przygotowanie danych
Zmienne Plec, Rodzaj_treningu oraz
Poziom_zaawansowania zostały przekonwertowane na
faktory, a ich poziomy (etykiety) przetłumaczone na język
polski. Zmiana ta jest niezbędna do poprawnego przeprowadzenia imputacji
danych, aby algorytmy uzupełniające braki traktowały te kolumny jako
kategorie.
Braki danych
Przed przystąpieniem do imputacji sprawdzono strukturę brakujących danych w zbiorze. Poniższa tabela prezentuje liczbę oraz procent braków dla poszczególnych zmiennych.
| Zmienna | Liczba braków | Procent braków |
|---|---|---|
| Rodzaj_treningu | 150 | 15.4 |
| BMI | 150 | 15.4 |
| Wiek | 100 | 10.3 |
| Plec | 0 | 0 |
| Waga_kg | 0 | 0 |
| Wzrost_m | 0 | 0 |
| Max_BPM | 0 | 0 |
| Srednie_BPM | 0 | 0 |
| Spoczynkowe_BPM | 0 | 0 |
| Czas_trwania_sesji_h | 0 | 0 |
| Spalone_kalorie | 0 | 0 |
| Procent_tkanki_tluszczowej | 0 | 0 |
| Spozycie_wody_l | 0 | 0 |
| Czestotliwosc_treningow_dni_tydzien | 0 | 0 |
| Poziom_zaawansowania | 0 | 0 |
Poniższa tabela prezentuje szczegółową statystykę brakujących obserwacji. Analiza wykazała, że problem niekompletnych danych dotyczy jedynie trzech zmiennych:
Rodzaj_treninguorazBMI: odnotowano po 150 braków, co stanowi 15,4% zbioru.Wiek: brakuje 100 obserwacji, czyli 10,3% całości.
Pozostałe zmienne (m.in. Plec, Waga_kg,
Wzrost_m) są kompletne i nie zawierają brakujących
wartości.
Poniższy wykres obrazuje powiązania między brakującymi wartościami w
różnych zmiennych. Wysokie słupki dla pojedynczych zmiennych (np. tylko
Wiek lub tylko BMI) przy jednoczesnym braku
licznych grup wspólnych wskazują, że braki są rozproszone.
Brak widocznego systematycznego wzorca współwystępowania sugeruje mechanizm MCAR (Missing Completely at Random). Oznacza to, że braki danych występują całkowicie losowo i nie zależą od wartości innych zmiennych w zbiorze.
Imputacja brakujących danych
BMI
Ze względu na obecność zmiennych Waga_kg oraz
Wzrost_m, które są kompletne (nie zawierają braków danych),
odstąpiono od imputacji statystycznej zmiennej BMI. Zamiast tego,
wartość wskaźnika została obliczona ponownie dla wszystkich obserwacji
zgodnie ze wzorem: \[BMI =
\frac{Waga}{Wzrost^2}\] Podejście to eliminuje braki danych w
kolumnie BMI i gwarantuje precyzyjne wartości, wynikające z fizycznych
parametrów badanych osób.
Liczba braków po imputacji BMI = 0
Wiek i Rodzaj_treningu
Ze względu na charakterystykę braków danych oraz ich rozproszenie, zdecydowano się na zastosowanie metody imputacji wielokrotnej (Multiple Imputation by Chained Equations - MICE). Metoda ta jest odpowiednia dla danych z brakami MCAR i pozwala na zachowanie zmienności oraz struktury danych.
Liczba braków po imputacji Wiek = 0
Liczba braków po imputacji Rodzaj_treningu =
0
Aby ocenić poprawność przeprowadzonej imputacji dla zmiennej Wiek, porównano rozkłady gęstości danych oryginalnych (przed uzupełnieniem) oraz danych kompletnych (po zastosowaniu MICE). Pokrywanie się obu wykresów wskazuje na to, że imputacja nie wprowadziła sztucznych zniekształceń do struktury danych.
Podczas procesu imputacji powstał nowy zbiór danych z poimputowanymi
wartościami, nazwany jako dane_komp.
Walidacja danych
Po zakończeniu procesu imputacji, przeprowadzono walidację danych w celu zapewnienia ich spójności i poprawności. Sprawdzono, czy wartości w poszczególnych zmiennych mieszczą się w oczekiwanych zakresach oraz czy nie występują anomalie. Szczegóły reguł walidacyjnych opisano w poniższej tabeli.
| Zmienna | Zastosowana reguła logiczna |
|---|---|
| Wiek | Wartość > 0 oraz < 120 (realny wiek człowieka) |
| Waga_kg | Wartość musi być liczbą dodatnią (> 0) |
| Wzrost_m | Wartość musi być liczbą dodatnią (> 0) |
| Max_BPM | Wartość > 0 oraz wyższa niż Średnie BPM |
| Srednie_BPM | Wartość > 0; musi być pomiędzy Spoczynkowym a Max BPM |
| Spoczynkowe_BPM | Wartość > 0 oraz niższa niż Średnie BPM |
| Czas_trwania_sesji_h | Wartość musi być liczbą dodatnią (> 0) |
| Spalone_kalorie | Wartość musi być liczbą dodatnią (> 0) |
| Procent_tkanki_tluszczowej | Wartość w przedziale otwartym (0, 100) |
| Spozycie_wody_l | Wartość musi być liczbą dodatnią (> 0) |
| BMI | Musi równać się: Waga / Wzrost^2 (zaokrąglenie do 0.01) oraz > 0 |
Następnie, przeprowadzono konfrontację danych z zestawem reguł
walidacyjnych. Poniższy wykres przedstawia wyniki tej konfrontacji,
ilustrując liczbę spełnionych oraz niespełnionych reguł dla zbioru
danych dane_komp.
Jedynie reguła Max_BPM >
Srednie_BPM nie została spełniona, a błąd ten wystąpił 28
razy.
Naprawa danych niespełniających reguł
W celu naprawy danych niespełniających reguł, błędne wartości zamieniono na braki danych, a następnie uzupełniono imputacją kNN. Zdecydowano się na tą metodą ponieważ wcześniej używana metoda MICE nie przyniosła porządanych rezultatów.
Po zastosowaniu metody kNN, ponownie przeprowadzono walidację danych, aby upewnić się, że wszystkie reguły zostały spełnione. Poniższy wykres przedstawia wyniki konfrontacji po naprawie danych.
Jak można zauważyć, po naprawie danych wszystkie reguły walidacyjne zostały spełnione, co potwierdza skuteczność zastosowanej metody.
Dane końcowe, po przeprowadzeniu imputacji oraz walidacji, zostały
nazwane jako dane_popr.
Analiza danych
W celu uzyskania jak największej kompleksowości oraz spójności analiz, zdecydowano się na zaagregowanie wyników według zmiennych, zamiast klasycznego podziału na typy analiz.
Oznacza to, że każda kluczowa zmienna w zbiorze zostanie poddana pełnemu procesowi badawczemu w jednym bloku tematycznym, obejmującym:
Wizualizację danych,
Analizę opisową,
Wnioskowanie statystyczne.
Zgodnie z zapowiedzią, celem raportu jest wykazanie różnic
między kobietami a mężczyznami. W związku z tym, analiza każdej
zmiennej została podzielona na Plec, co pozwala na
bezpośrednie porównanie statystyk, rozkładów oraz istotności różnic w
obu grupach.
Waga, Wzrost oraz BMI
BMI jest wynikową dwóch zmiennych: Waga_kg
oraz Wzrost_m. Wykresy pokazują, że mężczyźni są
zazwyczaj ciężsi i wyżsi od kobiet, co bezpośrednio przekłada się na ich
wyższe wyniki BMI. Warto zauważyć, że o ile u
kobiet wskaźnik ten jest dość wyrównany, o tyle u mężczyzn występuje
dużo większy rozrzut danych oraz wartości skrajne, co świadczy o
większym zróżnicowaniu tej grupy.
Analiza wskaźnika BMI na podstawie poniższej tabeli,
potwierdza różnice w budowie ciała badanych grup. Mężczyźni
charakteryzują się wyraźnie wyższą masą ciała w relacji do
wzrostu, co obrazuje mediana wynosząca 26,22 przy 22,92 w
grupie kobiet.
Kluczowym wnioskiem z danych jest znacznie większe
zróżnicowanie wyników wśród mężczyzn. Podczas gdy wskaźnik
BMI u kobiet jest bardziej skoncentrowany wokół średniej,
u mężczyzn obserwujemy bardzo szeroki wachlarz
wartości, od wyników minimalnych po ekstremalnie wysokie,
sięgające niemal 50. Świadczy o tym rozstęp międzykwartylowy (IQR =
10,57), który jest niemal dwukrotnie wyższy niż u kobiet.
Dodatnia skośność oraz wysokie odchylenie standardowe w grupie męskiej potwierdzają, że problem nadmiernej masy ciała jest w niej bardziej złożony. Występowanie licznych wartości odstających wyraźnie podnosi ogólną średnią i wskazuje na dużą różnorodność sylwetek w męskiej częsci badanej grupy.
| Statystyka | Ogółem (N=973) | Kobiety (N=462) | Mężczyźni (N=511) |
|---|---|---|---|
| BMI | |||
| Min | 12.32 | 12.47 | 12.32 |
| Max | 49.84 | 35.04 | 49.84 |
| Kwartyl dolny | 20.11 | 19.4325 | 21.16 |
| Mediana | 24.16 | 22.92 | 26.22 |
| Kwartyl górny | 28.56 | 26.05 | 31.725 |
| Średnia | 24.91 | 22.73 | 26.89 |
| Odch. std. | 6.66 | 4.48 | 7.63 |
| IQR | 8.45 | 6.62 | 10.57 |
| Odchylenie ćwiartkowe | 4.22 | 3.31 | 5.28 |
| Odch. std. w % | 0.27 | 0.2 | 0.28 |
| Odch. ćwiartkowe w % | 0.35 | 0.29 | 0.4 |
| Skośność | 0.76 | 0 | 0.46 |
| Kurtoza | 0.73 | -0.54 | -0.18 |
Na podstawie wyników testów statystycznych dwóch średnich, zawartych na poniższym wykresie, można stwierdzić, że istnieją istotne statystycznie różnice w wartościach BMI między kobietami a mężczyznami. Dodatkowo wykres jasno potwierdza, że wyniki mężczyzn są znacznie bardziej rozproszone oraz że mężczyźni charakteryzują się wyższym odsetkiem wartości skrajnych, co potwierdza większe zróźnicowanie tej grupy.
Tętno
Ze względu na dużą liczbę zmiennych związanych z tętnem
(Max_BPM, Srednie_BPM,
Spoczynkowe_BPM), zdecydowano się na przeprowadzenie
kompleksowej analizy jedynie tętna średniego. Wybór ten wynika z faktu,
że Srednie_BPM najlepiej oddaje ogólną wydolność i
obciążenie organizmu, niwelując chwilowe skoki czy spadki
wartości.
Powyższy wykres pudełkowy obrazuje rozkład średniego tętna
(Srednie_BPM) zarejestrowanego podczas sesji treningowych,
z podziałem na płeć. W przeciwieństwie do analizowanych wcześniej
parametrów fizycznych (waga, wzrost), gdzie
dymorfizm płciowy był wyraźnie widoczny, w przypadku intensywności
treningu mierzonej tętnem, obserwujemy znaczne podobieństwo
między kobietami a mężczyznami.
Analiza opisowa przedstawiona w poniższej tabeli potwierdza tę
obserwację. Zarówno średnia, mediana, jak i rozstęp wartości
Srednie_BPM są bardzo zbliżone w obu grupach płciowych.
Różnice w odchyleniu standardowym oraz IQR są minimalne, co wskazuje na
podobną zmienność wyników wśród kobiet i mężczyzn.
| Statystyka | Ogółem (N=973) | Kobiety (N=462) | Mężczyźni (N=511) |
|---|---|---|---|
| Srednie_BPM | |||
| Min | 120 | 120 | 120 |
| Max | 169 | 169 | 169 |
| Kwartyl dolny | 131 | 131 | 132 |
| Mediana | 143 | 143 | 142 |
| Kwartyl górny | 156 | 155 | 156 |
| Średnia | 143.42 | 143.24 | 143.57 |
| Odch. std. | 14.14 | 14.16 | 14.13 |
| IQR | 25 | 24 | 24 |
| Odchylenie ćwiartkowe | 12.5 | 12 | 12 |
| Odch. std. w % | 0.1 | 0.1 | 0.1 |
| Odch. ćwiartkowe w % | 0.17 | 0.17 | 0.17 |
| Skośność | 0.1 | 0.07 | 0.14 |
| Kurtoza | -1.18 | -1.2 | -1.17 |
Na podstawie wyników testów statystycznych dwóch średnich, zawartych na poniższym wykresie, można stwierdzić, że nie ma istotnych statystycznie różnic w wartościach średniego tętna między kobietami a mężczyznami. Wykres dodatkowo potwierdza, że rozkłady obu grup są bardzo podobne pod względem kształtu i rozproszenia danych.
Czas trwania sesji
Powyższy wykres pokazuje ile czasu trwa sesja treningowa
(Czas_trwania_sesji_h) w zależności od płci
(Plec). Dzięki temu można szybko ocenić, czy jedna grupa ma
wyraźnie dłuższe lub krótsze sesje.
Z przedstawionego porównania wynika, że rozkład czasu trwania sesji u kobiet i mężczyzn jest bardzo podobny. Wartości w obu grupach są zbliżone, a zakres i rozproszenie wyników nie wskazują na wyraźną przewagę którejkolwiek płci. W analizowanych danych płeć nie wydaje się czynnikiem wpływającym na długość sesji, a obserwowane różnice, jeśli występują, mają niewielkie znaczenie.
Ciekawszą zależnością jest natomiast relacja pomiędzy
Czas_trwania_sesji_h, a średnią liczbą spalonych kalorii
(Spalone_kalorie), przedstawiona na wykresie punktowym.
Każdy punkt odpowiada obserwacji, a kolory rozróżniają płeć, dzięki
czemu na jednym wykresie można jednocześnie porównać przebieg zależności
w obu grupach.
Wykres pokazuje wyraźny, rosnący trend. Im dłużej trwa sesja, tym większa jest średnia liczba spalonych kalorii. Co istotne, zależność ta jest widoczna zarówno u kobiet, jak i u mężczyzn, ale punkty dla mężczyzn częściej układają się „wyżej” przy podobnych czasach trwania. Sugeruje to, że przy zbliżonej długości sesji mężczyźni przeciętnie spalają więcej kalorii, co może wynikać m.in. z różnic w intensywności wysiłku, masie ciała czy poziomie obciążenia podczas treningu. Dodatkowo widać, że przy dłuższych sesjach rozrzut wyników staje się większy, co wskazuje, że końcowy efekt kaloryczny zależy nie tylko od czasu, ale również od sposobu realizacji treningu, takich jak tempo, obciążenie, czy przerwy.
Spalone kalorie
Poniższy wykres pudełkowy obrazuje rozkład spalonych kalorii podczas sesji treningowych, z podziałem na płeć. Widać wyraźnie, że mężczyźni spalają znacznie więcej kalorii niż kobiety, co jest zgodne z oczekiwaniami ze względu na różnice w masie ciała i metabolizmie.
Analiza opisowa przedstawiona w poniższej tabeli
potwierdza tę obserwację. Zarówno średnia, mediana, jak i rozstęp
wartości Spalone_kalorie są wyraźnie wyższe w grupie
mężczyzn w porównaniu do kobiet. Różnice w odchyleniu standardowym oraz
IQR również wskazują na większą zmienność wyników wśród mężczyzn.
| Statystyka | Ogółem (N=973) | Kobiety (N=462) | Mężczyźni (N=511) |
|---|---|---|---|
| Spalone_kalorie | |||
| Min | 303 | 303 | 331 |
| Max | 1783 | 1625 | 1783 |
| Kwartyl dolny | 720 | 710.25 | 742 |
| Mediana | 893 | 867 | 937 |
| Kwartyl górny | 1076 | 1016 | 1138.5 |
| Średnia | 905.42 | 862.25 | 944.46 |
| Odch. std. | 272.64 | 249.61 | 286.59 |
| IQR | 356 | 305.75 | 396.5 |
| Odchylenie ćwiartkowe | 178 | 152.88 | 198.25 |
| Odch. std. w % | 0.3 | 0.29 | 0.3 |
| Odch. ćwiartkowe w % | 0.4 | 0.35 | 0.42 |
| Skośność | 0.28 | 0.17 | 0.26 |
| Kurtoza | -0.07 | -0.1 | -0.22 |
Na podstawie wyników testów statystycznych dwóch średnich, zawartych na poniższym wykresie, można stwierdzić, że istnieją istotne statystycznie różnice w wartościach spalonych kalorii między kobietami a mężczyznami. Wykres dodatkowo potwierdza, że rozkłady obu grup różnią się pod względem kształtu i rozproszenia danych, z wyraźnie wyższymi wartościami w grupie mężczyzn.
Rodzaj treningu
Kolejny wykres przedstawia strukturę wyboru rodzaju treningu w obrębie płci w formie słupków skumulowanych do 100%. Oznacza to, że nie porównujemy tutaj łącznej liczby treningów między kobietami i mężczyznami, lecz proporcje, czyli jaki odsetek treningów w danej grupie płci stanowi każdy typ aktywności (Cardio, HIIT, Strenght, Yoga).
Z wykresu wynika, że profil treningowy kobiet i mężczyzn jest ogólnie zbliżony, ponieważ udziały poszczególnych rodzajów treningu są w obu grupach porównywalne i żaden typ nie dominuje w sposób skrajny. Widoczne są jednak drobne różnice, ponieważ u kobiet nieco większy udział ma Cardio, natomiast u mężczyzn relatywnie większy udział stanowi Yoga. Jednocześnie HIIT oraz Strenght utrzymują bardzo podobne proporcje w obu grupach, co sugeruje, że te formy aktywności są wybierane w zbliżony sposób niezależnie od płci.
Aby zweryfikować, czy obserwowane różnice mają charakter statystycznie istotny, wykonano test niezależności chi-kwadrat (Pearsona). Wynik testu nie wykazał istotnej zależności między płcią a wybieranym typem treningu, a siła ewentualnego związku jest znikoma. Oznacza to, że w badanej próbie kobiety i mężczyźni wybierają podobne formy aktywności, a zauważalne na wykresie różnice mają głównie charakter opisowy.
Procent tkanki tłuszczowej
Procent_tkanki_tluszczowej okazał się szczególnie
ciekawą zmienną. Wykres pudełkowy widoczny poniżej przedstawia
porównanie procentowej zawartości tkanki tłuszczowej u kobiet i
mężczyzn.
Widoczna jest wyraźna różnica między płciami. Rozkład dla kobiet znajduje się wyżej niż dla mężczyzn, co oznacza, że kobiety w analizowanej próbie mają generalnie większy udział tkanki tłuszczowej. Różnica ma charakter systematyczny, ponieważ dotyczy całego rozkładu, a nie pojedynczych przypadków. Pojedyncze wartości odstające po stronie niskich wartości sugerują obecność osób o wyjątkowo niskiej zawartości tkanki tłuszczowej w stosunku do reszty badanych.
Na wykresie wyżej widzieliśmy porównanie procentowej zawartości tkanki tłuszczowej w podziale na płeć w ujęciu „pudełkowym”, czyli z naciskiem na wartości typowe i rozrzut. Tutaj natomiast mamy wykres gęstości, który pokazuje jak często pojawiają się poszczególne poziomy tkanki tłuszczowej wśród kobiet i mężczyzn, czyli jak wygląda „kształt” rozkładu w obu grupach.
Widać wyraźnie, że krzywa dla kobiet jest przesunięta w stronę wyższych wartości, co potwierdza wcześniejszą obserwację, że kobiety częściej osiągają wyższy poziom tkanki tłuszczowej. Jednocześnie obie krzywe częściowo się nakładają, co oznacza, że istnieje zakres wartości wspólny dla obu płci, część mężczyzn i część kobiet mieści się w podobnych przedziałach. Różnica ujawnia się przede wszystkim w tym, gdzie przypada „największe zagęszczenie” wyników. U mężczyzn bardziej koncentruje się ono w niższych i średnich zakresach, a u kobiet częściej w średnich i wyższych. Taki wykres dobrze pokazuje, że różnice nie dotyczą pojedynczych obserwacji, tylko wynikają z innego rozkładu całej populacji w obu grupach.
Na poprzednich wykresach widać było, że między płciami pojawiają się różnice w cechach związanych z budową ciała, ale tamte porównania miały charakter głównie opisowy. Pokazywały kształt rozkładów i ich przesunięcia. Poniższy wykres stanowi syntetyczne podsumowanie tej części analizy.
Właśnie ten wykres potwierdza wszystko, co wynikało z poprzednich wizualizacji. Różnica między płciami nie jest przypadkowa. Test Welcha daje ekstremalnie małe p, więc statystycznie jest to bardzo silny efekt, a wartość Hedgesa wskazuje, że różnica ma też znaczenie praktyczne (to nie jest „kosmetyczne” przesunięcie). Ten wykres jednoznacznie potwierdza, że kobiety i mężczyźni w badanej próbie istotnie różnią się poziomem tkanki tłuszczowej.
Spożycie wody podczas treningu
Następną zmienną jest spożycie wody podczas trenigu. Poniższy wykres pudełkowy przedstawia porównanie spożycia wody podczas treningu między kobietami a mężczyznami. Widać wyraźnie, że mężczyźni spożywają więcej wody niż kobiety, co jest zgodne z wcześniejszą obserwacją z wykresu punktowego.
Kolejny wykres, który możemy zobaczyć poniżej, przedstawia zależność między czasem trwania sesji treningowej a ilością spożytej wody, z podziałem na płeć. Obserwacje wskazują, że zarówno kobiety, jak i mężczyźni wykazują tendencję do zwiększania spożycia wody wraz z wydłużaniem czasu treningu. Jednakże, mężczyźni generalnie spożywają więcej wody niż kobiety przy podobnym czasie trwania sesji. Może to wynikać z większej masy ciała, wyższej intensywności treningu lub innych czynników fizjologicznych.
Co ciekawe, na wykresie widać wyraźną anomalię od ok. 1,5 godziny treningu. Dla dłuższych sesji wartości spożycia wody przestają się rozpraszać i układają się niemal w stałe poziome pasy. U mężczyzn obserwujemy koncentrację wyników w okolicach 3,5 l, a u kobiet w okolicach 2,7 l, co sugeruje „sztuczne” ucięcie lub przypisanie stałych wartości (np. ograniczenie skali, zaokrąglanie, domyślne ustawienia w pomiarze lub błąd w rejestracji danych dla treningów powyżej 1,5 h). W efekcie zależność między czasem treningu a spożyciem wody w tym zakresie może być częściowo zniekształcona i wymaga ostrożnej interpretacji.
Częstotliwość treningów w tygodniu
Następną analizowaną zmienną jest
Czestotliwosc_treningow_dni_tydzien (częstotliwość
treningów w tygodniu), przedstawiona w podziale na płeć w formie słupków
skumulowanych do 100%. Wykres pokazuje, że rozkład liczby dni
treningowych jest wśród kobiet i mężczyzn bardzo podobny.
Najczęściej deklarowane są 3 dni treningowe w tygodniu oraz 4
dni. Rzadziej pojawiają się treningi 2 razy w tygodniu oraz 5
razy w tygodniu.
Aby sprawdzić, czy płeć różnicuje częstotliwość treningów, wykonano test niezależności chi-kwadrat (Pearsona). Wynik wskazuje, że nie ma istotnej statystycznie zależności między płcią a liczbą dni treningowych w tygodniu, a siła związku jest w praktyce zerowa. Oznacza to, że w badanej próbie kobiety i mężczyźni trenują z porównywalną częstotliwością, a obserwowane różnice procentowe mają wyłącznie marginalny charakter.
Następnie, aby pokazać, w których grupach (łącząc poziom zaawansowania i częstotliwość treningów w tygodniu) znajduje się najwięcej osób, wykorzystano mapę cieplną przedstawioną osobno dla kobiet i mężczyzn. Im ciemniejsze pole, tym większa liczba badanych w danej kombinacji.
Z wykresu wynika, że zarówno wśród kobiet, jak i mężczyzn największe skupienie osób występuje przede wszystkim przy poziomie średniozaawansowanym oraz treningach wykonywanych około 3–4 razy w tygodniu. Oznacza to, że najliczniejszą część próby stanowią osoby o umiarkowanym poziomie umiejętności, trenujące regularnie kilka razy w tygodniu. Wśród mężczyzn dodatkowo wyraźniej zaznacza się grupa początkujących trenujących 2 razy w tygodniu, natomiast u kobiet rozkład wśród początkujących jest bardziej „rozciągnięty” i częściej obejmuje także 3 dni treningowe. Najmniej osób pojawia się w „skrajnych” konfiguracjach (np. bardzo wysoka częstotliwość treningów przy niskim poziomie zaawansowania), co sugeruje, że częstsze treningi częściej współwystępują z wyższym poziomem zaawansowania.
Poziom zaawansowania
Nastepną analizowaną zmienną był Poziom_zaawansowania,
wprowadzony przy okazji częstotliwości treningów. Wykres poniżej
przedstawia strukturę analizowanej zmiennej w obrębie płci (słupki
skumulowane do 100%), czyli pokazuje, jaki odsetek kobiet i mężczyzn
deklaruje poziom początkujący, średniozaawansowany i zaawansowany.
Z danych wynika, że rozkład jest praktycznie identyczny w obu
grupach.
Wśród kobiet najliczniejszą grupę stanowią osoby średniozaawansowane (42%), następnie początkujące (39%), a najmniejszy udział mają osoby zaawansowane (19%). Analogiczny obraz widać u mężczyzn, poeniważ średniozaawansowani to 42%, początkujący 39%, a zaawansowani 20%. Aby sprawdzić, czy płeć wiąże się z poziomem zaawansowania, wykonano test niezależności chi-kwadrat (Pearsona). Wynik wskazuje na brak istotnej zależności, a siła związku jest w praktyce zerowa. W praktyce oznacza to, że w badanej próbie kobiety i mężczyźni mają bardzo podobną strukturę poziomów zaawansowania, a ewentualne różnice są wyłącznie kosmetyczne.
Aby jeszcze lepiej przedstawić strukturę badanej próby, na wykresie zestawiono udział kobiet i mężczyzn w poszczególnych poziomach zaawansowania. W każdym z poziomów widoczna jest niewielka przewaga mężczyzn, jednak proporcje pozostają bardzo stabilne, udział mężczyzn wynosi ok. 52–53%, a kobiet ok. 47–48% niezależnie od poziomu. Oznacza to, że płeć nie różnicuje w istotny sposób rozkładu poziomów zaawansowania, struktura jest zbliżona w całej próbie.
Jednocześnie wykres pokazuje różnice w liczebności samych poziomów: najwięcej osób znajduje się w grupie średniozaawansowanej, nieco mniej w grupie początkującej, a najmniej w grupie zaawansowanej. Sugeruje to, że badana populacja koncentruje się głównie na poziomie średnim, natomiast udział osób deklarujących poziom zaawansowany jest wyraźnie mniejszy, przy zachowaniu podobnych proporcji płci.
Struktura demograficzna próby
Wykres poniżej przedstawia strukturę płci w badanej grupie. W próbie widoczna jest nieznaczna przewaga mężczyzn, którzy stanowią 52,5% respondentów, podczas gdy kobiety stanowią 47,5%. Oznacza to, że grupa jest dość zrównoważona pod względem płci, a różnica między udziałem kobiet i mężczyzn jest niewielka, co sprzyjało porównaniom między tymi dwiema kategoriami w poprzednich analizach.
W dalszej kolejności przeanalizowano strukturę wieku w obrębie płci, przedstawioną jako rozkład procentowy (100% w ramach każdej płci). W obu grupach dominują kategorie wiekowe 36–45 oraz 46–55, co sugeruje, że badana próba składa się głównie z osób w wieku średnim. U kobiet udziały tych grup wynoszą odpowiednio 23,8% (36–45) i 24,7% (46–55), natomiast u mężczyzn 25,6% (36–45) i 24,9% (46–55).
Różnice między płciami są niewielkie, ale widoczne. Kobiety częściej niż mężczyźni należą do najmłodszej grupy 16–25 (22,1% vs 18%), podczas gdy u mężczyzn nieco większy udział ma grupa 56–65 (10% vs 8,2%). Grupa 26–35 pozostaje praktycznie na tym samym poziomie w obu płciach (21,2% u kobiet i 21,5% u mężczyzn). Ogólnie rozkład wieku jest zbliżony dla kobiet i mężczyzn, z lekką tendencją do „młodszej” struktury wśród kobiet i nieco „starszej” wśród mężczyzn.
Podsumowanie
Niniejszy raport przeprowadził kompleksową analizę danych dotyczących charakterystyki treningowej oraz parametrów fizjologicznych w zależności od płci. Główne wnioski z analizy są następujące:
- Różnice w budowie ciała: Mężczyźni charakteryzują się wyższą wagą, wzrostem oraz wskaźnikiem BMI w porównaniu do kobiet. Ponadto, rozkład BMI u mężczyzn jest bardziej zróżnicowany, co wskazuje na większą różnorodność sylwetek w tej grupie.
- Tętno treningowe: Analiza średniego tętna podczas sesji treningowych wykazała brak istotnych statystycznie różnic między kobietami a mężczyznami. Obie grupy prezentują podobne wartości i rozkłady tej zmiennej.
- Spalone kalorie: Mężczyźni spalają znacznie więcej kalorii podczas treningów w porównaniu do kobiet. Różnice te są istotne statystycznie i potwierdzone zarówno analizą opisową, jak i testami statystycznymi.
- Brak różnic w profilu behawioralnym: Wbrew stereotypom, płeć nie różnicuje sposobu podejścia do aktywności fizycznej. Nie odnotowano istotnej statystycznie zależności między płcią a wybieranym rodzajem treningu.Struktura poziomu zaawansowania oraz częstotliwość treningów w tygodniu są niemal bliźniacze w obu grupach. Wskazuje to, że motywacja i nawyki treningowe badanej populacji są niezależne od płci.
- Jakość danych i anomalie: Dane charakteryzowały się losowym rozkładem braków (MCAR), co pozwoliło na skuteczną imputację. Zidentyfikowano jednak anomalię w zmiennej dotyczącej spożycia wody dla treningów trwających powyżej 1,5 godziny (nienaturalnie stałe wartości), co sugeruje ograniczenia metodologiczne w pomiarze długotrwałych sesji i wymaga ostrożności interpretacyjnej w tym zakresie.
Podsumowując, analiza dowodzi, że płeć jest silną determinantą parametrów fizjologicznych (budowa, spalanie, nawodnienie), ale nie determinuje profilu sportowego (wybór dyscypliny, intensywność, częstotliwość). Wnioski te sugerują, że plany treningowe dla kobiet i mężczyzn mogą być zbliżone pod kątem struktury i intensywności, a różnicowane głównie w zakresie oczekiwanych rezultatów kalorycznych i zapotrzebowania na płyny.