Materiał i metoda

Analiza odpowiedzi na ankietę mierzącą Postawę względem Statystyki (PwS) Badanie przeprowadzone wśród studentów PO i RM PSW w październiku 2024 (01/10/2024–10/10/2024).

Postawa

Postawę zmierzono za pomocą 28 pytań, które mierzą cztery różne aspekty postawy: afekt, kompetencje poznawcz, wartość i trudność. Mierzymy pozytywną postawę stąd pytania 2, 3, 5, 6, 9–12, 14, 16, 18–22 oraz 25–28 są mierzone za pomocą skali odwróconej:

Afekt

  1. Polubię statystykę
  2. Będę się czuł niepewnie gdy będę musiał rozwiązywać zadania statystyczne. (r)
  3. Podczas kolokwiów ze statystyki będę sfrustrowany (r)
  4. Będę zestresowany na zajęciach ze statystyki (r)
  5. Chętnie wezmę udział w zajęciach ze statystyki
  6. Statystyka mnie przeraża (r)

Kompetencje poznawcze

  1. Mój sposób myślenia powoduje że mam kłopoty ze zrozumieniem statystyki (r)
  2. Nie mam pojęcia o co chodzi w statystyce (r)
  3. Zajmując się statystyką popełniam wiele błędów matematycznych (r)
  4. Mogę nauczyć się statystyki
  5. Zrozumiem wzory statystyczne
  6. Zrozumienie pojęć ze statystyki będzie dla mnie trudne (r)

Wartość

  1. Statystyka jest bezwartościowa (r)
  2. Statystyka powinna być obowiązkowym przedmiotem na studiach
  3. Znajomość statystyki ułatwi mi znalezienie pracy
  4. Profesjonalista nie potrzebuje znajomości statystyki (r)
  5. Za wyjątkiem wykorzystania w pracy zawodowej statystyka jest bezużyteczna (r)
  6. Wykorzystuję statystykę w codziennym życiu
  7. Na co dzień rzadko się widzi wykorzystanie statystyki (r)
  8. Statystyka nie przyda się w moim zawodzie (r)
  9. Statystyka nie ma żadnego znaczenia w moim życiu (r)

Trudność (a w zasadzie Łatwość)

  1. Wzory statystyczne są łatwe do zrozumienia
  2. Statystyka jest skomplikowana (r)
  3. Większość ludzi szybko uczy się statystyki
  4. Nauczenie się statystyki wymaga dużej dyscypliny (r)
  5. Statystyka wymaga żmudnych obliczeń (r)
  6. Statystyka jest wysoce specjalistyczna (r)
  7. Większość ludzi musi nauczyć się nowego sposobu myślenia aby zajmować się statystyką (r)

Odpowiedzi na wszystkie pytania: zdecydowanie się nie zgadzam | nie zgadzam się | raczej nie zgadzam się | nie mam zdania | raczej się zgadzam | zgadzam się | zdecydowanie się zgadzam

Jeżeli osoba uważa statystykę za superłatwą to wartość PwS wyniesie 28; jeżeli osoba uważa statystykę za supertrudną to PwS=196.

Samoskuteczność

Mierzono także samoskuteczność za pomocą zestawu 10 pytań:

Zawsze jestem w stanie rozwiązać trudne problemy, jeśli tylko wystarczająco się staram

Jeśli ktoś mi się sprzeciwia, mam sposoby, aby osiągnąć to co chcę

Łatwo jest mi trzymać się swoich celów

Jestem przekonany, że skutecznie poradziła/poradziłbym sobie z niespodziewanymi wydarzeniami

Dzięki swojej pomysłowości dać sobie radę w nieoczekiwanych sytuacjach

Potrafię rozwiązać większość problemów, jeśli włożę w to odpowiednio dużo wysiłku

Potrafię zachować spokój w obliczu trudności, gdyż mogę polegać na swoich umiejętnościach radzenie sobie

Gdy zmagam się z jakimś problemem, zwykle znajduję kilka rozwiązań

Gdy jestem w kłopotliwej sytuacji, na ogół wiem, co robić

Niezależnie od tego co mnie spotyka, potrafię sobie z tym poradzić

Odpowiedzi na wszystkie pytania: zdecydowanie nie | nie | ani tak/ani nie | tak | zdecydowanie tak.

Pozostałe zmienne

Ankieta zawierała ponadto następujące pytania:

Przybliżona ocena z matematyki na maturze; procent z możliwością odmowy odpowiedzi

Płeć; K/M

Wiek (w latach),

Przybliżona odległość od miejsca zamieszkania do PSW w kilometrach; od zera do 300

Kierunek studiów

Miejsce studiowania

Mamy następujące zmienne: samoskuteczność, pws, pws.afekt, pws.trudnosc, pws.kompetencje, pws.wartosc, wiek, wynik.na.maturze, płeć, odleglość.od.PSW, kierunek, miejsce.studiowania

samoskuteczność, pws, pws.afekt, pws.trudnosc, pws.kompetencje, pws.wartosc są sumami odpowiednich rang i są traktowane jako liczby

wiek, wynik.na.maturze, odleglość.od.PSW są liczbami

płeć, kierunek, miejsce.studiowania są mierzone na skali nominalnej

wynik.na.maturze zawiera wiele odmów – pomijamy w analizie

Mamy jakby dwa badania w jednym samoskuteczność + pws + płeć + kierunek + wiek + wynik.na.maturze absolutnie wystarczy.

Odległość, miejsce są z innej bajki…

Reasumując 42 pytania = 10 zmiennych (jeżeli dobrze liczę) + dwie niepotrzebne :-)

Metryczka

Łącznie otrzymano 162 ankiet.

Płeć respondentów

płeć n %
K 120 74.07407
M 42 25.92593

albo na wykresie

Badani wg wieku wieku

m me q1 q3 sd
34.58 33 23 46.75 11.47

Zachodzi podejrzenie że rozkład wg wieku jest połączeniem dwóch rozkładów jednomodalnych.

Wiek według płci

sex n m me q1 q3 sd q.dev
K 120 36.98 37.0 24.75 48 11.51 11.62
M 42 27.74 25.5 21.00 34 8.19 6.50

Ciekawostka średnia 36.975 \(\approx\) 37 (w grupie kobiet).

Odległość od PSW

m me q1 q3 sd
51.15 38 10 70 51.92

Odległość a miejsce

miejsce n m me q1 q3 sd q.dev
Gdańsk 102 33.97 22.5 9.25 43.00 42.86 16.88
Kwidzyn 44 83.89 95.0 40.00 111.25 52.85 35.62
Toruń 16 70.69 60.0 44.50 80.00 54.77 17.75

Samoskuteczność

max min m me q1 q3 sd q.dev
50 26 37.27 37 35 40 4.58 2.5

Szczegóły histogramu (jakby ktoś był ciekaw):

##    count xmin xmax      freq
## 1      3   25   27  1.851852
## 2      7   27   29  4.320988
## 3      6   29   31  3.703704
## 4     14   31   33  8.641975
## 5     21   33   35 12.962963
## 6     33   35   37 20.370370
## 7     32   37   39 19.753086
## 8     21   39   41 12.962963
## 9     15   41   43  9.259259
## 10     4   43   45  2.469136
## 11     2   45   47  1.234568
## 12     1   47   49  0.617284
## 13     3   49   51  1.851852

Liczba ankietowanych o wartości samoskuteczności mniejszej od q1 = 39. Liczba ankietowanych o wartości samoskuteczności większej od q3 = 30.

(wartości się powtarzają: 26, 26, 27, 28, 28, 28, 28, 29, 29, 29, 30, 30, 31, 31, 31, 31, 32, 32, 32, 32, 32, 32, 32, 33, 33, 33, 33, 33, 33, 33, 34, 34, 34, 34, 34, 34, 34, 34, 34, 35, 35, 35, 35, 35, 35, 35, 35, 35, 35, 35, 35, 36, 36, 36, 36, 36, 36, 36, 36, 36, 36, 36, 36, 36, 36, 36, 36, 37, 37, 37, 37, 37, 37, 37, 37, 37, 37, 37, 37, 37, 37, 37, 37, 37, 38, 38, 38, 38, 38, 38, 38, 38, 38, 38, 38, 38, 38, 39, 39, 39, 39, 39, 39, 39, 39, 39, 39, 39, 39, 39, 39, 39, 39, 39, 39, 39, 40, 40, 40, 40, 40, 40, 40, 40, 40, 40, 40, 40, 40, 40, 40, 40, 41, 41, 41, 41, 41, 42, 42, 42, 42, 42, 43, 43, 43, 43, 43, 43, 43, 43, 43, 43, 44, 44, 45, 45, 46, 47, 49, 50, 50, 50)

Samoskuteczność a płeć

sex m me q1 q3 sd
K 36.95 37 34 40 4.86
M 38.19 39 36 40 3.56

Samoskuteczność a odległość

oClass n m me q1 q3 sd
m 52 37.98 37.0 35.00 40.00 4.65
s 40 34.98 36.5 30.75 38.25 4.95
d 70 38.06 38.0 36.00 40.00 3.87

Dzielimy odległość na klasy (m, s, d):

  • mała (0-15),

  • średnia (16-40),

  • duża (41 i więcej)

Rozkład wartości zmiennej Postawa wobec statystyki

max min m me q1 q3 sd q.dev
166 51 115.61 117 105 126 18.9 10.5

Średnia wartość PwS wyniosła 115.61 (co stanowi 59% wartości maksymalnej).

Płeć a PwS

sex m me q1 q3 sd
K 112.92 115.0 103.0 124 18.77
M 123.29 120.5 112.5 130 17.27

albo na wykresie

Średnie wartości poszczególnych wymiarów (min = 1; max = 7):

sex m
K 3.995833
M 4.472222
sex m
K 4.076389
M 4.646825
sex m
K 4.409259
M 4.724868
sex m
K 3.544048
M 3.721088

Na wykresie pudełkowym:

Wiek a PwS

Czy pws zależy od wieku (np. starsi respondenci mają większe PwS)?

## 
## Call:
## lm(formula = pws ~ wiek, data = d1)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -64.122 -11.612   1.204  10.278  50.336 
## 
## Coefficients:
##             Estimate Std. Error t value            Pr(>|t|)    
## (Intercept) 118.7338     4.7388  25.056 <0.0000000000000002 ***
## wiek         -0.0903     0.1301  -0.694               0.489    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 18.93 on 160 degrees of freedom
## Multiple R-squared:  0.003001,   Adjusted R-squared:  -0.00323 
## F-statistic: 0.4817 on 1 and 160 DF,  p-value: 0.4887

Zależność nieistotna statystycznie.

## `geom_smooth()` using formula = 'y ~ x'

Czy istnieje zależność między PwS oraz płcią?

Stosujemy test t Welcha. Hipotezą zerową (wstępnym założeniem) jest, że pomiędzy PsW i płcią nie ma zależności. Formalnie, że średnie wartości w obu grupach zmiennej psw są identyczne.

Grupa1 Grupa2 n1 n2 t p
K M 120 42 -3.270243 0.00161

Hipotezę zerową należy odrzucić. Mężczyźni mają statystycznie istotne wyższe pozytywne nastawienie do statystyki.

Sprawdzamy założenia dotyczące normalności (test Shapiro-Wilka)

płeć S-W p
K 0.9738621 0.0193939
M 0.9532575 0.0845354

Rozkład w grupie K nie jest normalny. Wykorzystanie testu t Welcha nie było uzasadnione. Należy zastosować test U-Manna-Whitneya.

Grupa1 Grupa2 n1 n2 U p
K M 120 42 1793.5 0.00551

Hipotezę zerową należy odrzucić. Mężczyźni mają statystycznie istotne wyższe pozytywne nastawienie do statystyki.

Kierunek a PwS

kierunek średni pws
Pielęgniarstwo 113.0678
Ratownictwo Medyczne 122.4318

Przypuszczalnie istnieje silna zależność pomiędzy kierunkiem a płcią (można to zweryfikować np. testem Chi-kwadrat)

Wartości rzeczywiste (tabela 2x2):

##    kierunek
## sex Pielęgniarstwo Ratownictwo Medyczne
##   K            110                   10
##   M              8                   34

Wartości teoretyczne (tabela 2x2):

##    kierunek
## sex Pielęgniarstwo Ratownictwo Medyczne
##   K       87.40741             32.59259
##   M       30.59259             11.40741

Czy różnice są istotne? Prawdopodobieństwo tak dużych różnic przy założeniu że nie ma związku między kierunkiem a płcią wynosi:

## [1] 0.0000000000000000005335969

Albo 5.335969e-19 Coś jak wyrzucić orła 60 razy pod rząd w 60 rzutach monetą. Na poziomie istotności odrzucamy hipotezę zerową myląc się raz na 1874073884161992192 powtórzeń.

Czy istnieje zależność pomiędzy pws.trudnosc a wiekiem?

Regresja liniowa

## 
## Call:
## lm(formula = pws.trudnosc ~ wiek, data = d1)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -15.0528  -2.9358   0.9756   2.9189  13.8905 
## 
## Coefficients:
##             Estimate Std. Error t value            Pr(>|t|)    
## (Intercept) 25.62003    1.20575  21.248 <0.0000000000000002 ***
## wiek        -0.01418    0.03311  -0.428               0.669    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 4.817 on 160 degrees of freedom
## Multiple R-squared:  0.001146,   Adjusted R-squared:  -0.005097 
## F-statistic: 0.1835 on 1 and 160 DF,  p-value: 0.669
##             2.5 % 97.5 %
## (Intercept) 23.24  28.00
## wiek        -0.08   0.05

Czy istnieje zależność między wiekiem a psw.wartosc

## 
## Call:
## lm(formula = pws.wartosc ~ wiek, data = d1)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -23.343  -4.428  -1.129   5.269  20.714 
## 
## Coefficients:
##             Estimate Std. Error t value            Pr(>|t|)    
## (Intercept) 40.91223    1.97677  20.697 <0.0000000000000002 ***
## wiek        -0.01424    0.05428  -0.262               0.793    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 7.897 on 160 degrees of freedom
## Multiple R-squared:  0.0004301,  Adjusted R-squared:  -0.005817 
## F-statistic: 0.06885 on 1 and 160 DF,  p-value: 0.7934
##             2.5 % 97.5 %
## (Intercept) 37.01  44.82
## wiek        -0.12   0.09

nie ma zależności.

pws a samoskutecznosc

## 
## Call:
## lm(formula = pws ~ samoskutecznosc, data = d1)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -58.473  -9.798   0.534   9.828  46.048 
## 
## Coefficients:
##                 Estimate Std. Error t value      Pr(>|t|)    
## (Intercept)       72.212     11.755   6.143 0.00000000617 ***
## samoskutecznosc    1.164      0.313   3.720      0.000276 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 18.19 on 160 degrees of freedom
## Multiple R-squared:  0.0796, Adjusted R-squared:  0.07384 
## F-statistic: 13.84 on 1 and 160 DF,  p-value: 0.0002756
##                 2.5 % 97.5 %
## (Intercept)     49.00  95.43
## samoskutecznosc  0.55   1.78
## `geom_smooth()` using formula = 'y ~ x'

pws a płeć i samoskuteczność

## 
## Call:
## lm(formula = pws ~ samoskutecznosc + sex, data = d1)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -56.673  -8.828  -0.009  11.205  40.083 
## 
## Coefficients:
##                 Estimate Std. Error t value      Pr(>|t|)    
## (Intercept)      73.7203    11.5210   6.399 0.00000000167 ***
## samoskutecznosc   1.0610     0.3087   3.437       0.00075 ***
## sexM              9.0445     3.2156   2.813       0.00553 ** 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 17.81 on 159 degrees of freedom
## Multiple R-squared:  0.1232, Adjusted R-squared:  0.1122 
## F-statistic: 11.17 on 2 and 159 DF,  p-value: 0.00002882
##                 2.5 % 97.5 %
## (Intercept)     50.97  96.47
## samoskutecznosc  0.45   1.67
## sexM             2.69  15.40

Literatura

Abraham Ayebo, Jered Bright, Christian Ballam, Examining the Factor Structure of the Survey of Attitudes Towards Statistics among Undergraduate Health Science Students, https://doi.org/10.29333/iejme/5942

Yuhai Zhang i inni, Attitudes toward statistics in medical postgraduates: measuring, evaluating and monitoring, http://www.biomedcentral.com/1472-6920/12/117

Norizan Anwar, Aniza Jamaluddin and Hanis Diyana Kamarudin, Attitude of Students towards Statistics Application, Global J. Bus. Soc. Sci. Review 1 (3) 78–83 (2013)