Słowa kluczowe: spożycie alkoholu, wyniki w nauce, analiza wielowymiarowa, segmentacja studentów, uwarunkowania ekonomiczne, statystyka opisowa.


Wprowadzenie

Cel badania

Głównym celem niniejszego projektu jest zbadanie wielowymiarowych zależności między spożyciem alkoholu, stylem życia a wynikami w nauce oraz funkcjonowaniem poznawczym studentów.

Problem badawczy: Analiza wpływu kultury picia w środowisku akademickim na karierę edukacyjną.

Analiza opiera się na danych ankietowych. Aby zapewnić rzetelność wnioskowania statystycznego, dane poddano procesom czyszczenia oraz imputacji. Badane czynniki podzielono na cztery kluczowe grupy zmiennych:

  • Ekonomiczne: stypendia, dochód, zakwaterowanie.
  • Społeczne: relacje z rodzicami, aprobata rodziców dla konsumpcji alkoholu.
  • Behawioralne: częstotliwość imprezowania, absencja na zajęciach.
  • Demograficzne: płeć, wiek.

Pytania badawcze

W ramach analizy postawiono następujące pytania badawcze:

  1. Bezpośredni wpływ alkoholu na wyniki: Czy istnieje istotna statystycznie, ujemna korelacja między ilością spożywanego alkoholu a średnią ocen (GPA)?
  2. Rola statusu ekonomicznego: Czy wyższy dochód rozporządalny (allowance) stymuluje intensywniejsze życie towarzyskie, pośrednio wpływając na obniżenie wyników w nauce?
  3. Środowisko zamieszkania a kultura studencka: Czy rodzaj zakwaterowania różnicuje siłę związku między spożyciem alkoholu a liczbą opuszczonych zajęć?
  4. Psychospołeczne determinanty: Czy jakość relacji z rodzicami oraz ich aprobata dla spożywania alkoholu stanowią istotne predyktory ryzykownych zachowań studentów?
  5. Efekt kompensacji: Czy zwiększony nakład pracy własnej (dodatkowe godziny nauki w tygodniu) jest w stanie zniwelować negatywny wpływ “imprezowego stylu życia” na średnią ocen?
  6. Ryzyko akademickie: W jakim stopniu “imprezowy styl życia” zwiększa ryzyko niezdania przedmiotów?
  7. Różnice międzypłciowe (Gender Gap): Czy płeć studenta różnicuje wzorce spożycia alkoholu i jego wpływ na oceny?

Czyszczenie danych

W tym etapie surowe dane ankietowe zostały poddane standaryzacji i transformacji, aby umożliwić ich dalszą analizę statystyczną. Wykonano następujące operacje:

Tabela 1: Słownik zmiennych
Nazwa zmiennej Opis zmiennej
sex Płeć respondenta
grade_12 Średnia ocen z 12 klasy (GPA)
last_year Rok studiów w roku 2023
faculty Kierunek studiów
grade_last_y Średnia ocen za rok akademicki 2023
accomodation Status zakwaterowania (prywatne vs publiczne)
allowance Miesięczny budżet
scholarship Czy student posiadał stypendium
studying Dodatkowe godziny nauki tygodniowo
partying Częstotliwość wychodzenia na imprezy
drinks Liczba drinków spożywanych jednej nocy
classes_missed Liczba zajęć opuszczonych przez alkohol
modules_failed Liczba niezdanych przedmiotów
relationship Czy student jest w związku
parents_alcohol_approval Czy rodzice akceptują spożywanie alkoholu
relationship_w_parents Relacja z rodzicami

Analiza i diagnoza braków danych

Przed przystąpieniem do uzupełniania danych, przeprowadzono wizualną inspekcję brakujących wartości przy użyciu pakietu naniar. Pozwoliło to na podjęcie kluczowych decyzji:

  1. Eliminacja rekordów: Usunięto obserwacje posiadające braki w kluczowych zmiennych strukturalnych: sex (płeć), faculty (wydział) oraz last_year (rok studiów). Zmienne te definiują profil studenta i są trudne do wiarygodnego odtworzenia metodami statystycznymi.
  2. Identyfikacja mechanizmu braków: Potwierdzono, że część braków ma charakter strukturalny (np. brak ocen z poprzedniego roku dla studentów pierwszego roku), co wyklucza prostą imputację średnią dla całej populacji.

Imputacja danych

Pozostałe braki danych (w zmiennych takich jak allowance, scholarship czy grades) uzupełniono, wykorzystując algorytm k-Nearest Neighbors (kNN). Metoda ta polega na znalezieniu dla każdej niepełnej obserwacji grupy najbardziej podobnych do niej studentów (“sąsiadów”) i uzupełnieniu braku na podstawie ich danych.

Dobór parametru \(k=5\):

Decyzja o wyborze 5 sąsiadów wynika z konieczności zachowania równowagi między wariancją a obciążeniem estymatora:

Dla zmiennej grade_last_y zastosowano podejście hybrydowe: imputacja została skorygowana logicznie dla studentów pierwszego roku, aby nie przypisywać im ocen z okresu, gdy jeszcze nie studiowali. Zmienne czysto osobiste (relationship, parents_alcohol_approval oraz relationship_w_parents) pozostawiono bez zmian ze względu na ryzyko błędu predykcji.

Weryfikacja jakości imputacji

W celu potwierdzenia poprawności działania algorytmu przeprowadzono analizę wizualną dla zmiennych o najwyższym odsetku braków (\(>5\%\)): allowance oraz accommodation.

Metodyka weryfikacji

Zestawienie powyższych kategorii ze zmienną grade_12 pozwoliło na ocenę jakości uzupełnionych danych:

  • Naturalność rozkładu: Wartości uzupełnione (oznaczone kolorem czerwonym) płynnie wpisują się w rozkład danych oryginalnych.
  • Brak artefaktów: Nie zaobserwowano nienaturalnych skupisk punktów, co potwierdza stabilność struktury zbioru po imputacji.

Wniosek: Proces imputacji nie wprowadził istotnych zniekształceń do struktury danych, co pozwala na uznanie zbioru za wiarygodny i gotowy do dalszego wnioskowania statystycznego.

Wizualizacja danych

Segmentacja studentów: Identyfikacja wzorców

W celu zidentyfikowania dominujących profili w populacji studenckiej, przeprowadzono dwuetapową analizę skupień. Pierwszym krokiem było ustalenie optymalnej liczby grup (klastrów), na jakie należy podzielić badanych.

Krok 1: Wybór liczby grup (Metoda Łokcia)

Zastosowano metodę “łokcia” (Elbow Method), która bada, jak zmienia się spójność wewnątrz grup wraz z ich liczbą. Szukamy punktu, w którym przyrost jakości podziału zaczyna gwałtownie maleć.

Decyzja analityczna: Krzywa na wykresie ulega wyraźnemu załamaniu (tworzy “łokieć”) przy wartości k = 3. Oznacza to, że wyodrębnienie trzech grup jest najbardziej efektywnym kompromisem między precyzją podziału a czytelnością wyników. Dalsze rozdrabnianie populacji nie przynosi istotnego wzrostu jakości dopasowania.

Krok 2: Charakterystyka grup (Mapa Archetypów)

Po ustaleniu liczby klastrów (\(k=3\)), zastosowano algorytm k-means w połączeniu z analizą głównych składowych (PCA). Pozwoliło to na rzutowanie wielowymiarowych cech studentów na płaszczyznę 2D i wizualizację powstałych archetypów.

Interpretacja wykresu:

Wykres przedstawia przestrzeń zachowań studentów rozpiętą na dwóch głównych wymiarach (składowych głównych):

  1. Oś X (Wymiar 1 - Styl Życia): Odpowiada głównie za intensywność życia towarzyskiego. Im dalej w prawo, tym częstsze imprezy i wyższe spożycie alkoholu.
  2. Oś Y (Wymiar 2 - Wyniki): Koreluje z efektywnością akademicką. Im wyżej, tym wyższe oceny i większy nakład pracy własnej.

Zidentyfikowane grupy:

  • Imprezowicz (Czerwony): Grupa dominująca w prawej części wykresu. Charakteryzuje się wysoką aktywnością towarzyską, co często wiąże się z niższymi wynikami w nauce (ujemna korelacja).
  • Prymus (Niebieski): Skupiony w górnej części wykresu. Studenci ci poświęcają najwięcej czasu na naukę i osiągają najwyższe średnie (GPA), kosztem ograniczonego życia towarzyskiego.
  • Przeciętniak (Zielony): Grupa środkowa, balansująca między dwiema skrajnościami. Stanowi ona “bufor” i reprezentuje studentów starających się godzić umiarkowane rozrywki z akceptowalnymi wynikami.

Wpływ statusu ekonomicznego na styl życia i wyniki

W tej sekcji poddano weryfikacji pytanie badawcze: czy wyższy dochód rozporządzalny stymuluje intensywniejsze życie towarzyskie?

Metodologia i wskaźniki

Aby umożliwić obiektywne porównanie grup, wprowadzono dwa parametry analityczne:

  • Podział budżetu: Próbę badawczą podzielono na dwa segmenty względem miesięcznego kieszonkowego:
    • Niższy budżet: \(\le 5000\) R.
    • Wyższy budżet: \(> 5000\) R.
  • Indeks Towarzyski: Stworzono zagregowany wskaźnik (skala 0–13 pkt), będący sumą punktów za:
    • Częstotliwość imprezowania (partying): 0–4 pkt (w tym wartość 1.5 dla “Only weekends”).
    • Ilość spożywanego alkoholu (drinks): 0–9 pkt.
    • Wskaźnik ten obrazuje całkowitą intensywność stylu życia studenta.

Interpretacja mapy gęstości

Wizualizacja wykorzystuje metodę estymacji gęstości jądrowej (2D Kernel Density). Skala kolorystyczna wskazuje na stopień koncentracji obserwacji w danej przestrzeni.

Kluczowe wnioski

  1. Pieniądze jako stymulant: W grupie z wyższym budżetem „ośrodek ciężkości” (żółty obszar) wyraźnie przesuwa się w prawą stronę osi X. Potwierdza to, że większe zasoby finansowe ułatwiają dostęp do płatnych rozrywek i sprzyjają częstszej konsumpcji alkoholu.
  2. Zwiększone ryzyko akademickie: Choć w obu grupach najwyższe oceny korelują z niską intensywnością imprezowania, grupa zasobna wykazuje znacznie większe rozproszenie w stronę wysokiej intensywności towarzyskiej. Sugeruje to, że nadmiar środków sprzyja przedkładaniu zabawy nad obowiązki.
  3. Dyscyplina niższych dochodów: Studenci z niższym budżetem wykazują silniejszą koncentrację w obszarze umiarkowanego życia towarzyskiego, co przekłada się na statystycznie stabilniejsze i bardziej przewidywalne wyniki w nauce.

Podsumowanie: Wyższy status ekonomiczny działa jako katalizator życia towarzyskiego. Zwiększając dostępność kosztownych rozrywek, staje się on pośrednim czynnikiem ryzyka dla wyników akademickich poprzez wyraźną zmianę priorytetów czasowych studenta.

Środowisko zamieszkania a kultura studencka

W tej części analizy sprawdzono, czy rodzaj zakwaterowania (akademik vs. mieszkanie prywatne) moderuje związek między spożyciem alkoholu a absencją na zajęciach.

Hipoteza: Weryfikujemy, czy „kontrola społeczna” w akademikach lub większa swoboda w mieszkaniach prywatnych wpływa na dyscyplinę studentów.

Interpretacja wyników

Poniższa wizualizacja koncentruje się na analizie ryzyka. Oś Y pokazuje odsetek studentów, którzy przekroczyli “bezpieczny próg” absencji (2 lub więcej opuszczonych zajęć), w zależności od intensywności życia towarzyskiego.

  • Punkt krytyczny (Eskalacja): Do poziomu 5-8 drinków obie grupy zachowują się podobnie – ryzyko wysokiej absencji oscyluje wokół 30-36%. Kluczowa różnica pojawia się przy ekstremalnym spożyciu (8+).
  • Efekt akademika: W środowisku akademika następuje gwałtowna “eksplozja” ryzyka – aż 70% intensywnie imprezujących studentów zaniedbuje zajęcia. Krzywa wznosi się tu znacznie bardziej stromo niż w przypadku mieszkań prywatnych (gdzie wskaźnik ten zatrzymuje się na 47%).
  • Wniosek środowiskowy: Dane sugerują, że akademik stanowi środowisko sprzyjające eskalacji zachowań skrajnych. Prawdopodobnie “efekt domina” i obecność współlokatorów sprawiają, że po ostrych imprezach znacznie trudniej jest zmobilizować się do pójścia na uczelnię niż w cichszym mieszkaniu prywatnym.

Analiza efektu kompensacji

Wykres trójwymiarowy służy do weryfikacji hipotezy kompensacji. Badamy interakcję trzech zmiennych jednocześnie: intensywności życia towarzyskiego (oś X), nakładu pracy własnej (oś Y) oraz wyników w nauce (oś Z). Szukamy odpowiedzi na kluczowe pytanie: czy dodatkowe godziny nauki są w stanie zneutralizować negatywny wpływ intensywnego imprezowania na średnią ocen (GPA)?

Interpretacja modelu 3D

Analiza przestrzenna pozwala na sformułowanie następujących spostrzeżeń dotyczących strategii studentów:

  • Strefa sukcesu (Kolor żółty): Najwyższe wyniki (szczyt osi Z) koncentrują się w obszarze, gdzie wysoki nakład nauki spotyka się z niską lub umiarkowaną intensywnością imprez.
  • Granice kompensacji: Choć zwiększenie liczby godzin nauki (przesunięcie wzdłuż osi Y) pozytywnie wpływa na wynik, nie jest w stanie w pełni zniwelować skutków ekstremalnego imprezowania. W rogu wykresu odpowiadającym maksymalnej rozrywce – nawet przy dużej ilości nauki – dominują kolory ciemniejsze (niższe oceny).
  • Wniosek analityczny: Model sugeruje występowanie prawa malejących przychodów. Dodatkowa nauka jest skuteczna, ale przy bardzo intensywnym życiu towarzyskim jej efektywność drastycznie spada – prawdopodobnie ze względu na obniżoną koncentrację i kondycję psychofizyczną, której nie da się po prostu “zauczyć”.

Różnice międzypłciowe

Analiza wpływu alkoholu na wyniki byłaby niepełna bez uwzględnienia czynników demograficznych.

Poniższy wykres weryfikuje, czy płeć studenta różnicuje odporność na akademickie skutki życia towarzyskiego oraz czy dynamika spadku ocen jest uniwersalna dla obu grup.

Interpretacja wyników

Wizualizacja ta jest złożona, ponieważ łączy analizę średnich (linie) z pełnym rozkładem danych (wykresy skrzypcowe w tle).

  • Zbieżność trendów: Obie linie trendu wykazują wyraźną tendencję spadkową. Oznacza to, że niezależnie od płci, zwiększona konsumpcja alkoholu koreluje z obniżeniem wyników w nauce.
  • Analiza dystrybucji (Skrzypce): Tło wykresu pokazuje, że w grupach o wysokim spożyciu (5-8 oraz 8+) rozrzut wyników jest znacznie większy. Oznacza to, że choć średnia spada, zdarzają się jednostki (wąskie “szczyty” skrzypiec), które mimo imprezowania utrzymują wysokie oceny – jednak jest to margines błędu statystycznego.
  • Wniosek końcowy: Płeć nie jest silnym moderatorem tej zależności. Krzywe dla kobiet i mężczyzn przebiegają niemal równolegle, co sugeruje, że mechanizm negatywnego wpływu alkoholu na zdolności kognitywne jest uniwersalny i niezależny od płci biologicznej.

Analiza opisowa

Statystyki opisowe wyników akademickich (GPA)

Statystyki opisowe wyników akademickich (GPA)
N Średnia Mediana Odchylenie Minimum Maksimum
398 68.4 68 9.98 30 96

Rozkład wyników akademickich (GPA)

Przeprowadzona analiza statystyczna zmiennej charakteryzującej wyniki w nauce (GPA) na próbie \(N = 398\) studentów pozwala na sformułowanie następujących wniosków dotyczących struktury osiągnięć akademickich badanej populacji:

1. Przeciętny poziom i typowy wynik Rozkład ocen przypomina klasyczną krzywą Gaussa (rozkład normalny), co jest sytuacją pożądaną w statystyce. Potwierdza to fakt, że średnia ocena (\(\bar{x} = 68.4\%\)) jest niemal identyczna jak mediana (\(Me = 68\%\)). Taka zbieżność oznacza, że grupa jest symetryczna, ponieważ nie ma tu wyraźnej przewagi osób z wynikami bardzo niskimi ani bardzo wysokimi. Najwięcej studentów (dominanta) uzyskuje wyniki w przedziale 70–75%, co wskazuje, że standardem w badanej grupie jest poziom “dobry”.

2. Zróżnicowanie wyników (Dyspersja) Wartość odchylenia standardowego (\(SD = 9.98\)) świadczy o umiarkowanym zróżnicowaniu wyników. W praktyce oznacza to, że większość badanej grupy (ok. 68% studentów) mieści się w przedziale wyników od ok. 58% do 78%. Sugeruje to, że poziom wiedzy studentów jest stosunkowo wyrównany, choć oczywiście występują naturalne różnice indywidualne.

3. Rozpiętość osiągnięć Mimo koncentracji wyników wokół średniej, w grupie występuje pełne spektrum osiągnięć (rozstęp wynosi 66 punktów procentowych). Najniższy zanotowany wynik to 30%, a najwyższy 96%. Wskazuje to na obecność w badanej grupie zarówno nielicznych osób zagrożonych niezaliczeniem (widocznych na wykresie jako pojedyncze przypadki poniżej 40%), jak i studentów wybitnych. Są to jednak wyjątki na tle całej populacji.

Podsumowanie: Zmienna GPA posiada pożądane właściwości statystyczne (bliskość rozkładu normalnego, brak drastycznych asymetrii), co czyni ją wiarygodnym wskaźnikiem do dalszych analiz korelacyjnych, np. w kontekście badania wpływu konsumpcji alkoholu na efektywność akademicką.

Porównanie wyników kobiet i mężczyzn

Zastosowanie wizualizacji typu Raincloud Plot łączącej estymator gęstości jądrowej, wykres pudełkowy oraz surowe dane punktowe pozwala na wielowymiarową ocenę zależności między płcią a efektywnością kształcenia.

Analiza porównawcza struktury ocen w podziale na płeć

1. Przeciętny poziom wyników (Mediana) Analiza środkowych wartości na wykresach pokazuje, że przeciętny poziom ocen jest niemal identyczny dla obu płci. Zarówno kobiety, jak i mężczyźni osiągają medianę wyników w okolicach 68%. Oznacza to, że w badanej grupie płeć nie determinuje tego, czy ktoś uczy się przeciętnie lepiej, czy gorzej.

2. Kształt rozkładu ocen Krzywe widoczne nad wykresami mają bardzo zbliżony kształt dla obu grup. Wskazuje to, że struktura ocen jest analogiczna, zarówno wśród kobiet, jak i mężczyzn najliczniejsze grupy studentów uzyskują podobne wyniki. Nie widać tutaj zjawiska, w którym jedna z płci dominowałaby wyraźnie w grupie najlepszych lub najsłabszych studentów.

3. Zróżnicowanie i rozpiętość wyników Rozrzut punktów pod wykresem pokazuje, że w obu grupach występują bardzo zróżnicowane postawy. Zarówno wśród kobiet, jak i mężczyzn znajdziemy osoby z wynikami bardzo wysokimi, jak i pojedyncze przypadki wyników skrajnie niskich (poniżej 40%). Zakres zmienności jest porównywalny, co potwierdza, że poziom zróżnicowania wiedzy jest niezależny od płci.

Podsumowanie: Na podstawie analizy wizualnej można postawić hipotezę o braku istotnego statystycznie związku między płcią a wynikami GPA w badanej próbie. Ewentualne różnice są subtelne i prawdopodobnie nie mają znaczenia praktycznego.

Profil studenta w kontekście statusu stypendialnego

NIESTYPENDYŚCI

STYPENDYŚCI

Cecha

Mean / N

SD / %

Mean / N

SD / %

Liczba obserwacji (N)

353

45

Średnia ocen (GPA)

68.48

10.17

67.78

8.38

PŁEĆ

Kobieta

164

46.5

18

40

Mężczyzna

189

53.5

27

60

CZAS NAUKI [h]

0

20

5.7

0

0

1-3

74

21

8

17.8

3-5

91

25.8

13

28.9

5-8

71

20.1

8

17.8

8+

97

27.5

16

35.6

IMPREZOWANIE/TYDZIEŃ

0

13

3.7

4

8.9

1 raz

97

27.5

11

24.4

Tylko weekendy

94

26.6

16

35.6

2 razy

76

21.5

9

20

3 razy

57

16.1

5

11.1

4+ razy

16

4.5

0

0

Analiza opisowa według stypendium

1. Charakterystyka osiągnięć akademickich (GPA) Dane wskazują na dużą spójność obu grup w zakresie wyników nauczania. Średnia ocen (GPA) niestypendystów (68,48) jest niemal identyczna z wynikiem stypendystów (67,78). Sugeruje to, że w badanej populacji status stypendialny nie zależy wyłącznie od ocen, co może wskazywać na istotną rolę kryteriów socjalnych w procesie przyznawania wsparcia finansowego.

2. Struktura demograficzna i reprezentacja płci Wyniki ujawniają wyraźną różnicę w rozkładzie płci wśród osób otrzymujących pomoc finansową. W grupie stypendystów odnotowano znaczną przewagę mężczyzn (60%), podczas gdy u niestypendystów podział ten jest bardziej wyrównany (53,5% vs 46,5%). Taka struktura może wynikać ze specyfiki sytuacji materialnej badanych grup lub uwarunkowań systemowych na danym wydziale.

3. Inwestycja czasu w samokształcenie: Nauka Stypendyści wykazują wyższą dyscyplinę i większy nakład pracy własnej. W tej grupie nikt nie zadeklarował braku nauki (0% vs 5,7% u niestypendystów), a ponad 35% osób uczy się powyżej 8 godzin tygodniowo. Świadczy to o silnej motywacji stypendystów do utrzymania dobrych wyników i dbałości o status studenta.

4. Styl życia i organizacja czasu: Imprezowanie Sposób spędzania czasu wolnego przez stypendystów wskazuje na efektywne zarządzanie czasem. Znacznie częściej wybierają oni model odpoczynku skumulowany w weekendy (35,6% vs 26,6%), co pozwala im na pełną koncentrację na obowiązkach akademickich w ciągu tygodnia roboczego.

Podsumowanie: Profil stypendysty wyłaniający się z danych to profil studenta o wysokiej dyscyplinie pracy i umiejętności optymalizacji czasu wolnego. Choć średnie oceny obu grup są porównywalne, stypendyści wyróżniają się większym zaangażowaniem w naukę własną oraz bardziej ustrukturyzowanym stylem życia, co sprzyja stabilności ich wyników akademickich.

Typologia zachowań związanych ze spożyciem alkoholu

Analiza struktury spożycia ujawnia dominujący “styl picia” w badanej grupie. Ilustracja obrazuje deklarowaną liczbę drinków spożywanych podczas pojedynczego wyjścia towarzyskiego. \(N = 398\)

Wzorce konsumpcji alkoholu “Intensywność”

1. Analiza struktury spożycia alkoholu Wizualizacja danych wskazuje na znaczące zróżnicowanie w postawach studentów wobec alkoholu. Najliczniejszą grupę stanowią osoby o wysokim poziomie konsumpcji (5-8 jednostek), które obejmują 28% badanej populacji (110 osób). Sugeruje to, że dominującym modelem w grupie badawczej jest spożycie o charakterze intensywnym.

2. Skala zjawisk skrajnych: Abstynencja vs Ryzyko Zjawisko całkowitej abstynencji ma charakter niszowy i dotyczy jedynie 7% respondentów (26 osób). Po przeciwnej stronie znajduje się grupa wykazująca ryzykowne wzorce spożycia (8+ jednostek), która jest liczna i obejmuje aż 22% badanych (86 osób).

3. Charakterystyka spożycia umiarkowanego i symbolicznego Grupy deklarujące spożycie symboliczne (1-3 jednostki) oraz umiarkowane (3-5 jednostek) reprezentują po 22% udziału w próbie (odpowiednio 89 i 87 osób). Sumarycznie blisko połowa badanych utrzymuje się w przedziale niskiego i średniego spożycia, co wskazuje na wyraźną polaryzację postaw między studentami zachowującymi kontrolę nad konsumpcją a grupą pijącą intensywnie.

4. Tendencje ogólne i profil grupy Łączny udział osób pijących powyżej 5 jednostek (kategorie wysoka i ryzykowna) wynosi aż 50% całej populacji badawczej. Wynik ten jest istotny z punktu widzenia higieny trybu życia i może korelować z innymi zachowaniami zdrowotnymi oraz wynikami akademickimi, które były analizowane we wcześniejszych sekcjach raportu.

Podsumowanie: Dane przedstawione na grafice ukazują model konsumpcji o wysokim stopniu intensywności. Dominacja grup o spożyciu wysokim i ryzykownym (łącznie połowa badanych) przy marginalnym odsetku abstynentów świadczy o szerokiej akceptacji społecznej dla częstego i obfitego spożywania alkoholu w badanej grupie studenckiej.

Analiza korelacji

Wpływ alkoholu na wyniki w nauce

W celu sprawdzenia zależności między ilością spożywanego alkoholu a średnią ocen (GPA), przeprowadzono analizę korelacji rangowej Spearmana.

Wyniki analizy

  • Współczynnik korelacji (\(\rho\)): -0.086
  • Poziom istotności (\(p\)): < 0.001

Interpretacja statystyczna: Analiza wykazała istotną statystycznie (\(p < 0.001\)), lecz bardzo słabą ujemną korelację.

Wnioski

  1. Pewność wyniku (Istotność): Bardzo niska wartość \(p\) (< 0.001) potwierdza, że ujemny wynik nie jest dziełem przypadku. W badanej populacji rzeczywiście istnieje tendencja: osoby pijące więcej mają statystycznie niższe oceny, jednak jest to zależność bardzo delikatna.
  2. Siła efektu (Wielkość): Współczynnik \(\rho = -0.086\) oznacza korelację śladową. Ilość wypitego alkoholu wyjaśnia mniej niż 1% zmienności wyników w nauce. W praktyce oznacza to, że znając tylko ilość spożywanego przez studenta alkoholu, nie jesteśmy w stanie przewidzieć jego ocen.
  3. Mechanizmy kompensacyjne: Tak słaby związek sugeruje, że studenci skutecznie oddzielają życie towarzyskie od nauki. Ewentualny negatywny wpływ alkoholu jest prawdopodobnie niwelowany przez inne czynniki (np. nadrabianie zaległości w dni bez imprez) lub ujawnia się dopiero przy skrajnym spożyciu, które w tej próbie stanowi mniejszość.

Podsumowanie: Hipoteza o negatywnym wpływie alkoholu na oceny została potwierdzona statystycznie, jednak siła tego oddziaływania jest marginalna. Samo spożycie alkoholu nie jest głównym wyznacznikiem sukcesu akademickiego – kluczowe wydają się inne czynniki.

Wnioskowanie statystyczne

Porównanie GPA względem miejsca zamieszkania

Sprawdzamy, czy środowisko akademika sprzyja gorszemu GPA w porównaniu do mieszkania prywatnego. Została zbadana różnica w wynikach w ostatnim roku dla studentów, którzy są teraz przynajmniej na 2 roku.

Interpretacja wyników i wnioski

  • Wynik testu Wilcoxona wskazuje na p-value = 0.6482 > 0,05, zatem nie ma podstaw do odrzucenia hipotezy zerowej i można uznać, że nie stwierdzono istotnej statystycznie różnicy w średnich i medianach.
  • Rozkłady wyników są bardzo podobne w obu grupach; mediany GPA są zbliżone, a rozstępy międzykwartylowe są porównywalne.
  • W grupie “Private” widoczna jest pojedyncza wartość odstająca (outlier), jednak nie wpływa ona na ogólny wniosek o braku istotnych różnic między grupami.

Wniosek: Podsumowując, miejsce zamieszkania (prywatne vs. nieprywatne) nie ma istotnego wpływu na wyniki w nauce (GPA) w badanej próbie studentów.

Zależność między aprobatą rodziców wobec spożywania alkoholu a tygodniowym poziomem jego konsumpcji

Na powyższej heatmapie przedstawiono zależność między aprobatą rodziców a liczbą spożywanych drinków, wyrażoną w procentach w obrębie każdej grupy.

Interpretacja wyników i wnioski

  • Osoby z aprobatą rodziców częściej deklarują spożycie alkoholu. Największy udział występuje w grupie spożywającej 5-8 drinków podczas wyjścia, a sam rozkład jest widocznie przesunięty w stronę większej konsumpcji alkoholu.
  • Osoby bez aprobaty rodziców rzadziej deklarują wysokie spożycie alkoholu. Największy udział występuje w grupie spożywającej 1-3 drinków podczas wyjścia, a rozkład jest bardziej skoncentrowany na niskim oraz umiarkowanym spożyciu.
  • Brak aprobaty rodziców wiąże się z większym odsetkiem abstynentów. W grupie z aprobatą 5,2% badanych studentów deklaruje się jako osoby niepijące, natomiast w grupie bez aprobaty jest to aż 14,6%.

Wniosek: Analiza wskazuje na wyraźne zróżnicowanie wzorców spożycia alkoholu w zależności od postawy rodziców wobec picia. Studenci, których rodzice aprobują spożywanie alkoholu, częściej deklarują wyższe poziomy konsumpcji (5–8 oraz 8+ drinków), podczas gdy wśród osób bez takiej aprobaty dominują zachowania umiarkowane (1–3 drinki) lub całkowita abstynencja. Wyniki sugerują, że postawy rodzicielskie mogą odgrywać istotną rolę w kształtowaniu nawyków związanych ze spożyciem alkoholu wśród młodych dorosłych.

Wyniki testu niezależności Chi-kwadrat
Statystyka Chi² Stopnie swobody (df) Wartość p Metoda
16.06 4 0.003 Pearson’s Chi-squared test

W celu potwierdzenia wniosków sformułowanych na podstawie heatmapy przeprowadzono test Chi-kwadrat niezależności.

  • Wynik testu: Wykazano istnienie statystycznie istotnej zależności pomiędzy aprobatą rodziców wobec spożycia alkoholu a liczbą spożywanych drinków przez studentów:
    • \(\chi^2(4) = 16,06\)
    • \(p = 0,003\)

Interpretacja: Ponieważ wartość \(p < 0,05\), odrzucamy hipotezę o niezależności zmiennych. Oznacza to, że rozkład spożycia alkoholu istotnie różni się w zależności od postawy rodziców – ich aprobata (lub jej brak) jest silnym predyktorem zachowań studentów.

Średnie spożycie alkoholu na wydziałach

Wykres przedstawia średnie spożycie alkoholu (liczbę drinków) w zależności od wydziału.

Interpretacja wyników i wnioski

  • Najwyższe średnie spożycie alkoholu występuje na wydziałach nauk rolniczych, prawa oraz zarządzania i ekonomii.
  • Najniższe średnie spożycie alkoholu obserwowane jest natomiast na wydziałach edukacji, medycyny i nauk ścisłych.
  • Różnice między wydziałami są widoczne wizualnie (ok. 4-6,5 w skali indeksu), jednak nie są one bardzo duże. Przeprowadzony test Kruskala-Wallisa wykazał wartość p-value = 0,1213 > 0,05, która świadczy o braku istotnych statystycznie różnic w poziomie spożycia alkoholu pomiędzy wydziałami. Oznacza to, że zaobserwowane różnice w średnich wartościach mogą wynikać z losowych wahań w próbie, a nie z rzeczywistych różnic między populacjami studentów poszczególnych wydziałów.

Wniosek: Choć studenci niektórych wydziałów (np. nauk rolniczych i prawa) deklarują wyższe średnie spożycie alkoholu niż studenci wydziałów takich jak nauki ścisłe czy medycyna, różnice te nie są istotne statystycznie. Test Kruskala–Wallisa nie potwierdził istnienia istotnych różnic w poziomie spożycia alkoholu pomiędzy wydziałami.

Porównanie GPA względem czasu poświęconego na naukę

Wykres przedstawia porównanie wyników GPA studentów w zależności od czasu poświęcanego na naukę własną: grupa 1 to do 5 godzin tygodniowo (n = 206), natomiast grupa 2: powyżej 5 godzin tygodniowo (n = 192).

Interpretacje wyników i wnioski

  • Średnie (trimmed mean) GPA w obu grupach są niemal identyczne (grupa 1: 68,42; grupa 2: 67,90).
  • Rozkłady wyników GPA w obu grupach są bardzo podobne; zbliżone mediany, podobny zakres wartości oraz nie wykazują wyraźnego przesunięcia jednej grupy względem drugiej.
  • Przeprowadzony test t Yuena (odporny na obserwacje odstające) zwrócił wartość p-value = 0,63 > 0,05, zatem nie stwierdzono istotnej statystycznie różnicy w GPA pomiędzy studentami uczącymi się do 5 godzin tygodniowo a tymi, którzy uczą się więcej. Przedział ufności obejmuje 0, co dodatkowo potwierdza brak istotnego efektu.

Wniosek: Czas poświęcony na naukę własną (powyżej lub poniżej 5 godzin tygodniowo) nie różnicuje istotnie wyników GPA. Studenci uczący się więcej niż 5 godzin tygodniowo nie osiągają statystycznie istotnie wyższych wyników niż studenci uczący się krócej.

Wpływ intensywności nauki i imprezowania na średnią ocen (GPA)

Wykres przedstawia interakcję między intensywnością nauki a częstotliwością imprezowania w odniesieniu do średniego GPA. Zastosowana częstotliwość imprezowania kształtuje się następująco (w ujęciu tygodniowym): 0 imprez = Nigdy, 1 impreza lub wyłącznie w weekendy = Rzadko, 2+ imprez = Często.

Interpretacja wyników i wnioski

  • Przy braku imprezowania intensywność nauki wyraźnie różnicuje wyniki. Między grupą uczącą się poniżej 5 godzin tygodniowo a tą powyżej 5 godzin występuje przewaga GPA rzędu 10 p.p. na korzyść tych uczących się więcej.
  • W grupie rzadko imprezującej dochodzi do ciekawego odwrócenia – osoby uczące się mniej (linia czerwona) osiągają wyższe wyniki niż te uczące się dużo (linia zielona).
  • Przy dużej częstotliwości imprez sytuacja wraca do “normy”, gdzie większy nakład nauki przekłada się na nieco wyższe oceny, choć różnica jest znacznie mniejsza niż w grupie nieimprezującej (2 p.p.).

Wniosek: Intensywne imprezowanie niweluje korzyści płynące z dużej ilości nauki. Najwyższe wyniki osiągają studenci, którzy dużo się uczą i całkowicie rezygnują z imprez. Co ciekawe, przy umiarkowanym (rzadkim) imprezowaniu, osoby poświęcające mniej czasu na naukę radzą sobie lepiej od tych, które uczą się dużo, co może sugerować występowanie innych czynników (np. efektywność nauki, balans życie-studia).

Szacowany wpływ czasu nauki i wydziału na wynik GPA

Wykres przedstawia wyniki modelu regresji ilustrującego wpływ liczby godzin nauki oraz przynależności do wydziału na poziom GPA wraz z 95% przedziałami ufności.

Interpretacja wyników i wnioski

  • Zmienna liczba godzin nauki (study num) nie wykazuje istotnego wpływu na wynik GPA; oszacowany współczynnik jest bliski zeru, a przedział ufności obejmuje wartość 0, co wskazuje na brak statystycznie istotnej zależności między czasem nauki a osiągnięciami akademickimi.
  • Przynależność do wydziału różnicuje poziom GPA: Studenci wydziałów Medicine and Health Services, Engineering oraz Education osiągają przeciętnie wyższe wyniki GPA w porównaniu z grupą referencyjną, natomiast studenci wydziałów AgriSciences, Economic & Management Sciences oraz Law uzyskują przeciętnie niższe wartości GPA.
  • Najsilniejszy ujemny efekt obserwuje się dla wydziału AgriSciences, natomiast najwyższy dodatni efekt dla kierunków związanych z medycyną i ochroną zdrowia.
  • Szerokość przedziałów ufności dla części wydziałów wskazuje na większą niepewność estymacji, co sugeruje ostrożność w interpretacji siły poszczególnych efektów.

Wniosek: Wyniki modelu regresji wskazują, że przynależność do wydziału ma istotniejsze znaczenie dla poziomu GPA niż sama liczba godzin poświęcanych na naukę. Najwyższe wartości GPA obserwuje się wśród studentów kierunków medycznych i inżynierskich, natomiast najniższe wśród studentów nauk rolniczych oraz ekonomiczno-zarządczych. Czas nauki, analizowany samodzielnie, nie stanowi istotnego predyktora wyników akademickich.

Wyniki analizy kowariancji (ANCOVA)
Czynnik Suma kwadratów df Statystyka F p.value Wartość p
study_num 8.6 1 0.09 0.7689417 0.769
faculty 938.4 7 1.35 0.2251489 0.225

Powyższa analiza została dodatkowo poparta analizą kowariancji (ANCOVA), w której zbadano wpływ liczby godzin nauki (study_num) oraz wydziału (faculty) na poziom GPA, przy jednoczesnym uwzględnieniu obu czynników w jednym modelu. Analiza ta nie potwierdziła istotnego wpływu czasu nauki ani wydziału na poziom GPA, co sugeruje, że obserwowane wcześniej różnice mają charakter opisowy i nie znajdują potwierdzenia statystycznego w modelu.

Uporządkowany model logitowy

Wyniki porządkowego modelu logitowego
Czynnik OR Dolna gr. Górna gr. p-value
Częstotliwość imprezowania 0.69 0.55 0.86 0.001
Opuszczanie zajęć 1.23 1.01 1.49 0.040

Metodologia

Zastosowana metoda: Regresja Logistyczna dla Zmiennych Porządkowych.

W celu zbadania czynników wpływających na skalę niepowodzeń akademickich zastosowano model proporcjonalnych szans. Jest to specyficzny rodzaj regresji, dedykowany do analizy zmiennych, które posiadają naturalny porządek, ale nie są liczbami ciągłymi. Zastosowano następujące uporządkowanie: Brak niezdanych przedmiotów < 1 niezdany < 2 niezdane < 3 niezdane.

Interpretacje i wnioski

Opuszczanie zajęć: Zmienna ta jest istotnym statystycznie czynnikiem ryzyka. Każdy wzrost częstotliwości opuszczania zajęć o jeden poziom wiąże się ze wzrostem szansy na gorszy wynik egzaminacyjny (tj. oblanie większej liczby przedmiotów) o 23%.

Częstotliwość imprezowania: Wynik ten jest wysoce istotny i wskazuje na silną, odwrotną zależność. Wartość OR poniżej 1.0 oznacza, że wyższa aktywność towarzyska (przy stałym poziomie nieobecności) wiąże się ze spadkiem ryzyka porażki. Konkretnie, wyższy poziom aktywności towarzyskiej obniża szansę na niepowodzenie o około 31%.

Wniosek: Wynik ten sugeruje, że życie towarzyskie może pełnić funkcję “bufora stresu” lub sprzyjać budowaniu kapitału społecznego (wspólna nauka, wymiana notatek). Studenci aktywni towarzysko radzą sobie lepiej niż osoby izolujące się, pod warunkiem, że imprezowanie nie prowadzi do opuszczania zajęć.

Podsumowanie

Analiza została oparta na szerokim sondażu studenckim obejmującym dane demograficzne, ekonomiczne i behawioralne oraz informacje o GPA i spożyciu alkoholu.

Przygotowanie danych i metodologia

Dane zostały wcześniej uporządkowane: usunięto obserwacje bez kluczowych zmiennych (płeć, wydział, rok studiów), sprawdzono wartości skrajne oraz uzupełniono braki metodą k-Nearest Neighbors (\(k = 5\)), z dodatkowymi korektami dla wybranych grup, np. studentów pierwszego roku.

Jakość imputacji była kontrolowana wizualnie i statystycznie, aby ograniczyć ryzyko zniekształceń wyników.

Wyniki opisowe i charakterystyka próby

Wyniki opisowe pokazały silne zróżnicowanie wzorców picia:

  • Intensywność spożycia: Około połowa badanych deklarowała intensywne spożycie alkoholu w kategoriach 5–8 i 8+.
  • Abstynenci: Stanowili jedynie około 7% próby.
  • Rozkład GPA: Zbliżony do normalnego:
    • Średnia: \(\approx 68,4\%\)
    • Mediana: \(\approx 68\%\)
    • Odchylenie standardowe: \(\approx 9,98\)

Pozwalało to traktować tę zmienną jako stabilny punkt odniesienia w dalszych analizach.

Zależność alkohol a wyniki akademickie

Zależność ta okazała się statystycznie istotna, ale bardzo słaba:

  • Współczynnik Spearmana: \(\rho = -0,086\) (\(p < 0,001\)).
  • Wyjaśnienie zmienności: Alkohol wyjaśnia mniej niż 1% zmienności GPA.

Wynik ten sugeruje, że samo picie nie jest głównym czynnikiem decydującym o sukcesie akademickim, a jego negatywne skutki ujawniają się głównie w przypadkach skrajnych lub są częściowo równoważone przez inne zachowania, takie jak intensywniejsza nauka w tygodniach bez imprez.

Rola czynników kontekstowych

Istotną rolę odegrały czynniki kontekstowe:

  • Budżet: Studenci o wyższym budżecie częściej prowadzili intensywne życie towarzyskie, co pośrednio zwiększało ryzyko gorszych wyników.
  • Miejsce zamieszkania: W akademikach przy bardzo wysokim spożyciu odsetek osób opuszczających co najmniej dwa zajęcia sięgał około 70%. W mieszkaniach prywatnych wynosił około 47%.
  • Model logitowy: Potwierdził, że zarówno intensywność picia, jak i środowisko mieszkaniowe istotnie zwiększają prawdopodobieństwo absencji.

Mechanizmy kompensacji i uwarunkowania społeczne

Analiza pokazała, że większy nakład pracy własnej wiąże się z wyższym GPA, jednak tylko do pewnego poziomu.

  • Kompensacja: Dodatkowe godziny nauki mogą częściowo neutralizować skutki umiarkowanego imprezowania, ale przy bardzo intensywnym stylu życia efekt ten słabnie.
  • Płeć: Nie okazała się istotnym moderatorem zależności.
  • Aprobata rodziców: Istotnie związana z wyższą konsumpcją (\(\chi^2 = 16,06\); \(p = 0,003\)).
  • Stypendia: Pobieranie stypendium sprzyjało większej dyscyplinie i stabilniejszym wynikom.

Ograniczenia i wnioski praktyczne

Badanie ma swoje ograniczenia: dane są samoopisowe i obserwacyjne, dlatego nie pozwalają jednoznacznie rozstrzygać o przyczynach i skutkach. Mimo starannej imputacji pozostaje pewien poziom niepewności.

Rekomendacje: Z praktycznego punktu widzenia wyniki sugerują, że uczelnie powinny traktować problem spożycia alkoholu nie tylko jako kwestię zdrowia, ale także jako element wpływający pośrednio na funkcjonowanie akademickie.

Najbardziej sensowne wydają się działania kierowane do konkretnych grup ryzyka, zwłaszcza mieszkańców akademików oraz studentów o wysokim budżecie. Całość pokazuje, że wpływ alkoholu na GPA jest niewielki, ale jego znaczenie rośnie w określonych kontekstach społecznych i przy bardzo intensywnych wzorcach konsumpcji.