Abstract
Analiza danych z ankiet doktoranta Tomasza Szweda.Przejdźmy do analizy uwarunkowań. Badanym uczniom zadano szereg pytań ankietowych. Pytania te zostały podzielone na kilka logicznych grup. W takich też grupach przeprowadzać będziemy naszą analizę, stopniowo odnajdując te czynniki które są istotne ze statystycznego punktu widzenia.
Pierwszą grupą pytań były pytania dotyczące metod i sposobów przygotowywania się ucznia do matury. W tej grupie zadano uczniom jedenaście pytań. Przedstawmy je skrótowo według kolejności:
Na te pytania uczeń mógł odpowiedzieć wybierając jedną z pięciu możliwych wartości:
Odpowiedziom tym przydzielono pewne wartości liczbowe. Ta transformacja zostanie dokładniej omówiona w dalszej części analizy. Teraz wystarczy, że powiemy iż odpowiedź “bardzo często” otrzymała wartość jeden, “trudno powiedzieć” - wartość zero, a odpowiedź “bardzo rzadko” otrzymała wartość minus jeden. Oczywiście odpowiedzi pośrednie otrzymały odpowiednio proporcjonalne pośrednie wartości. Dla tak przetransformowanych wartości można było w łatwy sposób określić średnią w dowolnej grupie uczniów, która odzwierciedla średnią częstość używania danej metody przygotowania do matury.
Analizę tych czynników będziemy prowadzić w odniesieniu do przyjętego i nazwanego przez nas “wyniku przyzwoitego”. Wynik ten zastał przez nas arbitralnie określony na poziomie \(50\%\), czyli \(25\) punktów. Oczywiście, można było prowadzić ta analizę pod względem progu zdawalności. Jednak bardzo mały odsetek uczniów nie przekraczających tego progu mógłby nie ujawnić zbyt wielu istotnych czynników. Było to szczególnie ważne w kontekście planowanego wykorzystania regresji logistycznej do badania czynników wpływających na sukces. Ustawienie progu sukcesu zbyt nisko mogło by dać bardzo niepewne wyniki i nie ujawnić znaczących czynników. To również zostanie uzasadnione bardziej szczegółowo w dalszej części analizy.
W pierwszej kolejności spójrzmy więc na odpowiednie częstości odpowiedzi, od razu dzieląc badaną populację względem sukcesu przyzwoitego.
Pierwsza, wizualna analiza od razu uwidacznia kilka ciekawych, acz niewielkich różnic. Największe dotyczą korepetycji, internetu, materiałów CKE, zadań domowych oraz arkuszy maturalnych. Choć trzeba zaznaczyć, że różnice te nie są aż tak duże. Przy rozpiętości możliwych wyników od \(-1\) do \(1\), różnica na poziomie \(0.2\) stanowi zaledwie tylko \(10\%\). Największa różnica występuje w przypadku arkuszy maturalnych oraz korepetycji, choć i tu jest to zaledwie \(0.3\) czyli \(15\%\). Warto też zwrócić uwagę, że korepetycje oraz internet występują znacznie częściej w grupie która nie przekroczyła progu przyzwoitego wyniku. Z kolei czynniki takie jak materiały CKE i arkusze maturalne występowały częściej w grupie przekraczającej ten próg i były jednocześnie najczęściej wskazywanymi sposobami przygotowania do matury. Wyjątkowo słabym zainteresowaniem zaś cieszyły się, i to jednakowo w obu grupach, narzędzia IT oraz praca w grupach. Za to praca z podręcznikiem, zadania domowe i próbne matury były dość często wskazywane w obu grupach z nieco większą różnicą różnicą w przypadku zadań domowych na korzyść grupy zaliczającej sukces.
Sprawdźmy więc jak te odpowiedzi kształtowały się pomiędzy poszczególnymi kategoriami szkół.
Znów na czoło wysuwa się pytanie drugie czyli korepetycje. Szczególnie w kategorii B gdzie wystąpiła największa różnica. Jest rzeczą zastawiającą, że w przypadku korepetycji w tej kategorii, największą popularnością cieszyły się one wśród uczniów, którzy nie zaliczyli sukcesu przy jednoczesnym, prawie identycznym braku zainteresowania nimi, wśród wszystkich uczniów zaliczających sukces przyzwoity (sic!). Widać tu także wyraźnie, że niezależnie od kategorii narzędzia IT nie wzbudzają wśród uczniów prawie żadnego zainteresowania. Tak samo praca w grupach, do której z wyjątkową niechęcią podchodzą uczniowie, co charakterystyczne, nie zaliczający sukcesu z szkół kategorii C. Niezmiennie widać także, że dużym zainteresowaniem cieszą się praca z podręcznikiem oraz arkusze maturalne. Niezaprzeczalnym liderem są zaś próbne matury z najwyższym wynikiem w szkołach kategorii C, choć tylko dla uczniów zaliczających sukces. Wyjątkowo zaś neutralnym zainteresowaniem cieszą się prawie wszystkie metody przygotowania, poza arkuszami maturalnymi, uczniów w szkołach kategorii C, którzy nie przekraczają naszego progu przyzwoitego wyniku. Przypomnijmy, że w tej kategorii wszyscy uczniowie zdali maturę. Widać także, że w przypadku kursów przedmaturalnych zainteresowanie nimi spada wraz z kategorią szkoły a z kolei zainteresowanie arkuszami maturalnymi rośnie wraz kategorią szkoły, chociaż występują tu różnice pomiędzy uczniami osiągającymi a nie osiągającymi próg przyzwoity.
Na koniec przygotujmy jeszcze raz taka mapę cieplną odpowiedzi z podziałem na poszczególne szkoły. Ze względu jednak na zwiększenie czytelności zrezygnujmy tym razem z nanoszenia wartości średnich wyników na poszczególne pola. Należy także dodać, że tym razem wyniki zostały przefiltrowane w taki sposób aby w jednej grupie były co najmniej 3 osoby. Z tego powodu więc brakuje tu wyników tych kilku uczniów ze szkoły o kodzie KIE którzy zaliczyli sukces oraz tych kilku uczniów z szkoły o kodzie OP3 którzy sukcesu nie zaliczyli. Ponadto warto zanotować, że szkoły zostały ułożone według rosnącej mediany wyniku maturalnego.
Tym razem możemy zauważyć wyjątkowo słabe zainteresowanie prawie każdym ze sposobów przygotowania do matury (poza pracą z podręcznikiem) wśród uczniów nie zaliczających sukcesu ze szkół o kodach KIE oraz OP2. Oczywiście niezmiennie bardzo słabym zainteresowaniem cieszą się narzędzia IT oraz praca w grupach, z szczególnie wyróżniającym się, najsłabszym zainteresowaniem wśród uczniów niezaliczających sukcesu. Dużym zainteresowaniem natomiast nadal cieszą się próbne matury, zadania domowe, podręcznik i arkusze maturalne (oczywiście nie licząc niezaliczających uczniów z KIE oraz OP2).Ciekawym jest także, że zajęcia dodatkowe oraz internet cieszą się zainteresowaniem w szkołach słabszych, oraz odwrotnie nie są uważane za coś istotnego w szkołach z lepszymi wynikami. Nie bez znaczenia jest także fakt, że takie sposoby przygotowania jak zajęcia dodatkowe, kursy przedmaturalne, korepetycje oraz dla wszystkich szkół z najlepszym wynikiem (lewy górny róg) nie cieszą się zbytnim zainteresowaniem.
Aby móc jednak w pełni ocenić, na założonym poziomie istotności, wpływ poszczególnych czynników użyjemy modelu regresji logistycznej. W pierwszym kroku sprawdźmy jednak czy pomiędzy tymi predyktorami nie występują silne współzależności. Posłużymy się tu opisaną wcześniej mapą cieplną współczynników korelacji Spearamana.
Jak widać na powyższej mapie cieplnej, istnieje niewielka korelacja pomiędzy czynnikami takimi jak praca z materiałami CKE oraz z arkuszami maturalnymi z poprzednich lat, co wydaje się dość zrozumiałe i zasadne. W pozostałych przypadkach korelacja jest albo słaba albo wręcz bardzo słaba. Poza tym warto zwrócić uwagę, że praktycznie brak jest jakiejkolwiek istotnej korelacji pomiędzy szkołą a którymkolwiek z ze sposobów przygotowania do matury.
Brak jakichkolwiek silnych współzależności pozwala nam ze spokojem przejść do modelu regresji logistycznej. W tym miejscu należy jednak nadmienić, że w analizie będą porównywane dwa modele. Jeden model będzie konstruowany na podstawie wyników maturalnych natomiast drugi będzie budowany na podstawie wyników testu diagnostycznego. Oba modele poddawane będą tej samej analizie eliminującej predyktory opisanej we wcześniejszych rozdziałach.
Przejdźmy więc do analizy pierwszych współczynników regresji logistycznej. Dla łatwej analizy zostaną one prezentowane na omówionym wcześniej wykresie.
Ten, zdawało by się prosty wykres niesie ogromną ilość informacji. Po pierwsze widać, że na prawdopodobieństwo sukcesu w obu egzaminach wpływają w podobny sposób wyraz wolny (\(\beta_0\)) (na wykresie oznaczany (Intercept)), Szkoła (\(\beta_{Szkoła}\)), oraz korepetycje (\(\beta_{I.2}\)). Wartość prawdopodobieństwa testowego testu Walda jest we wszystkich tych przypadkach poniżej \(0.001\). Na dodatek w obu modelach szerokości przedziałów ufności tych współczynników są dość porównywalne.
W przypadku matury nie liczą się praktycznie żadne inne predyktory! Co prawda proces ich eliminacji pozostawił jeszcze zadania domowe (\(\beta_{I.7}\)), jednak w tym przypadku p-wartość jest większa od założonego przez nas poziomu istotności, co nie pozwala nam na odrzucenie hipotezy zerowej o braku liniowej zależności ze zmienną objaśnianą. Czynnik ten ma co prawda znaczenie dla testu diagnostycznego jednak ma on równocześnie bardzo szeroki przedział ufności. Poza tym, dla testu diagnostycznego istotność statystyczną zyskały jeszcze zajęcia dodatkowe (\(\beta_{I.1}\)), choć i tu również z dość szerokim przedziałem ufności, oraz czynnik związany z internetem (\(\beta_{I.4}\)), choć w tym przypadku jest to czynnik ograniczający.
Warto w tym miejscu wyjaśnić jaki przyjęto sposób transformacji zmiennych kategorialnych. Co prawda korzystaliśmy już z tych wartości podczas analizy częstości odpowiedzi jednakże przyjęte poziomy zostały celowo dobrane tak aby ułatwić analizę wyników regresji logistycznej. Omówimy to więc po kolei. Przypomnijmy więc, że dla zmiennych takich jak pytania I.1
do I.11
występowało pięć możliwych odpowiedzi:
Te pięć wartości kategorialnych należało przed zastosowaniem funkcji regresji logistycznej przetransformować na wartości liczbowe. Można było w tym celu wykonać prostą transformację zmiennej faktoryzowanej na kolejne wartości liczbowe, oczywiście po zapewnieniu określonego porządku rosnącego np. w taki oto sposób:
Jednak takie przyjęcie wartości liczbowych utrudniało by interpretację wyestymowanych współczynników regresji. W całej tej analizie, w przypadku zmiennych z pięcioma możliwymi wartościami, przyjęto nieco inny sposób transformacji, gdzie wartościom kategorialnym przypisano następujące wartości liczbowe:
Oczywiście zmiana ta nie mogła w żaden sposób wpłynąć na sam model regresji, jego precyzję oraz na istotność wyestymowanych współczynników regresji, a jedynie nieznacznie na ich wartość. Jednak teraz można już o wiele prościej interpretować uzyskane wyniki. Dodatkowo należy przypomnieć, że na wykresie prezentowane są wykładnicze wartości współczynników \(\beta\). Jednak dla uproszczenia zapisu będziemy się nadal posługiwać prostym zapisem pomijając exponent. Aby ułatwić odczytywanie konkretnych wartości liczbowych współczynników regresji przywołajmy jeszcze raz wcześniejszy wykres, tym razem uzupełniając go o odpowiednie etykiety z wartościami.
I tak dla przykładu, na powyższym wykresie możemy odczytać, że dla testu diagnostycznego współczynnik \(\beta_{I.7}\) czyli zadania domowe, ma wartość \(1.58\). Ponieważ jest on większy od jedności oznacza to, że ten czynnik ma stymulujący wpływ na sukces. Dodatkowo, przy zastosowaniu takiej transformacji jak opisano powyżej, możemy od razu określić jak duży ten wpływ jest. W tym przypadku, jeżeli uczeń odpowiedział “bardzo często”, jego szansa rosła o \(82\%\). Jeżeli odpowiedział “trudno powiedzieć” czynnik ten nie ma znaczenia i nie zmienia szansy powodzenia. W przypadku gdy odpowiedział “bardzo rzadko”, jego szansa maleje, i należy ją pomnożyć przez odwrotność tego współczynnika. Tak więc w tym przypadku wartość jego szansy maleje o \(1-\frac{1}{1.58}=37\%\).
Bardzo zaskakująca może wydawać się w tym momencie wartość współczynnika \(\beta_{I.2}\), czyli wpływ korepetycji. Jak widać• na wykresie jest ona bowiem mniejsza od jedności a to oznacza, że ten czynnik ma wpływ ograniczający. Czy to aby nie jest błąd? Jak można wytłumaczyć taki wynik? Wartość \(\beta_{I.2}\) wynosi \(0.53\) a to oznacza, że jeżeli uczeń odpowiedział, że bardzo często korzysta z korepetycji to jego szansa maleje o \(47\%\) (sic!). Natomiast jeżeli uczeń nie korzysta z korepetycji, to jego szansa na sukces rośnie o \(\frac{1}{0.53}-1=89\%\). Trzeba przyznać, że na pierwszy rzut oka to dość zaskakujący wynik. Jednak tylko z pozoru te dane stoją w sprzeczności ze zdrową logiką. Należy je bowiem umiejętnie czytać. Przypomnijmy więc sobie pierwsze wykresy obrazujące popularność metod przygotowania do matury w poszczególnych grupach. Wynikało z nich jasno, że z korepetycji znacznie częściej korzystali uczniowie którym ostatecznie nie udało się przekroczyć progu przyzwoitego wyniku, w odróżnieniu do ich kolegów którzy ten próg przekroczyli. Oznacza to, że z korepetycji korzystają częściej uczniowie słabi. W tym kontekście wyniki te należy interpretować następująco: jeżeli należysz do grupy która potrzebuje korepetycji to oznacza, że należysz również do grupy słabszych uczniów a w związku z tym twoja szansa na powodzenie jest odpowiednio mniejsza. Maleje ona jednak nie z powodu tego, że pobierasz korepetycje. To z pewnością przyczyni się do lepszego wyniku. Maleje ona jednak z powodu tego, że należysz do grupy słabiej radzącej sobie z tym tematem.
Można jednak zapytać w jaki sposób została przetransformowana zmienna kategorialna Szkoła
. Na początku analizy wartościom kategorialnym tej zmiennej objaśniającej przypisano mediany wyników maturalnych w danej szkole. Jednak takie postępowanie można krytykować, dopatrując się działania tak jakbyśmy badali wpływ zmiennej \(x\) na wynik zmiennej \(x\). Jeżeli bowiem w zmiennej objaśniającej Szkoła
zakodowana będzie wartość wyniku maturalnego który, co oczywiste, zakodowany jest również w zmiennej objaśnianej czyli w prawdopodobieństwie sukcesu, to czy taki model nadal będzie poprawny? Z kolei nie można pominąć faktu, że szkoły uzyskują różne wyniki. Można się spodziewać, że pominięcie tego czynnika będzie mieć negatywny wpływ na dokładność modelu. Aby w pełni przekonać się czy i jakiego typu transformację należy wykonać, przeprowadzono mały eksperyment. W tym celu przygotowano pięć różnych modeli logistycznych. Pierwszy model (A) był pozbawiony zmiennej Szkoła
. Kolejne cztery modele były wyznaczone w oparciu o dane, w których zmienną Szkoła
transformowano na następujące wartości:
Sprawdźmy najpierw jaki będzie to miało wpływ na współczynniki regresji \(\beta\).
Analizując powyższy wykres należy przede wszystkim zwrócić uwagę, że pod względem kryterium informacyjnego Akaikego AIC (ale tak samo i Bayesowskiego kryterium informacyjnego Schwarza - BIC) najlepiej dopasowanym modelem jest model B, w którym zastosowano transformowanie zmiennej Szkoła
na wartość średniej. Model ten jednak jest lepszy do modeli C i D (mediana, trimean) tylko bardzo nieznacznie. Z kolei najgorszym modelem (biorąc pod uwagę te same kryteria) okazał się model pozbawiony predyktora Szkoła
, czyli model A. Model E, czyli model z transformowanymi wartościami na kolejne liczby naturalne, jest nieco gorszy od modeli B, C czy D. Spójrzmy jednak na poszczególne wartości współczynników \(\beta\) wraz z ich przedziałami ufności. Widać wyraźnie, że pozbawienie modelu predyktora Szkoła
spowodowało, że współczynnik \(\beta_0\) osiągnął dość wysoką wartość, zdecydowanie różną od pozostałych modeli, jednak z bardzo szerokim przedziałem ufności. Z wykresu możemy także odczytać, że wejściowa szansa w tym modelu wynosi w przybliżeniu \(2.9\) w przedziale ufności od \(1.7\) do \(4.7\). Tymczasem wejściowa szansa w modelach gdzie ta zmienna występuje, niezależnie od metody transformacji, wynosi tylko kilka tysięcznych, przy jednocześnie bardzo wąskim przedziale ufności. Ten fakt można wyrazić następująco: - jeżeli nie uczysz się w żadnej szkole twoje szanse zdania matury są bliskie zeru. Wartość szansy zaś bierze się przede wszystkim ze zmiennej Szkoła
. Może się tu wydawać, że dla modelu E jest ona znacznie większa niż dla pozostałych modeli z predyktorem Szkoła
. Należy jednak uświadomić sobie w jaki sposób oblicza się odpowiedni czynnik szansy. Przeprowadźmy więc kilka prostych wyliczeń. Aby to zrobić przywołajmy wcześniejszy wykres z wartościami wyłącznie dla modeli C i E.
Pomijając na chwilę pozostałe zmienne, możemy np. dla modelu C zapisać równanie szansy:
\(o=e^{\beta_0}{(e^{\beta_{Szkoła}})}^{Me(Szkoła)}\)
W przypadku szkoły, której mediana wyników maturalnych wynosi \(34.5\) (w naszym przypadku jest to szkoła o kodzie OGL), wartość szansy wynosi:
\(o=0.01*1.183^{34.5}=3.3\)
co odpowiada prawdopodobieństwu sukcesu \(0.77\). Ta sama szkoła w naszym naszym modelu E (z transformacją na kolejne liczby naturalne) otrzymała wartość 4. Wyznaczmy więc szansę dla tego modelu:
\(o=0.132*2.042^{4}=2.3\)
co odpowiada prawdopodobieństwu sukcesu \(0.7\).
Nie można jednak zapominać, iż w przypadku modelu E, współczynnik \(\beta_{Szkoła}\) ma dość szeroki przedział ufności.Można także zwrócić uwagę, że transformowanie wartości szkoła kolejnymi liczbami naturalnymi spowodowało iż przedyktor I.6
należy uznać, na przyjętym przez nas poziomie istotności za zależny liniowo od zmiennej objaśnianej.
Wróćmy znów do porównania wszystkich pięciu modeli. Zauważy, że po pozbawienie modelu zmiennej Szkoła
istotne okazały się się takie zmienne jak I.4
(internet) oraz I.10
(podręcznik), oba o działaniu ograniczającym, oraz dwa predyktory o czynnikach stymulujących I.7
(zadania domowe) oraz I.11
(arkusze maturalne). Można to interpretować następująco: jeżeli nie brać pod uwagę do której szkoły chodzą uczniowie to praca nad zadaniami domowymi oraz arkuszami maturalnymi wpłynie na wzrost szansy o \(1.72*3.22=5.53\) czyli ponad pięciokrotnie, podczas gdy eksploracja zasobów internetowych ograniczy tę szansę o \(42\%\). Nie należy jednak zapominać o dużej niepewności szansy wejściowej (\(\beta_0\)), której przedział ufności mieści się w granicach \(1.7\) do \(4.7\).
Sprawdźmy jednak na ile precyzyjne są nasze modele. Zbudujmy je jednak na nowo usuwając nieistotne (przy założonym przez nas poziomie istotności) predyktory. Następnie wykorzystajmy opisaną wcześniej macierz konfuzji.
Jeżeli przyjrzymy się wskaźnikom oceny poszczególnych modeli, to z pewnością zauważymy, że najniższą dokładnością (\(Accu\)) charakteryzuje się model A dla którego jego średnia wartość wynosi \(0.79\) (co oznacza, że model ten myli się w 21% przypadków), oraz jego niską precyzję (\(Prec\)) przy jednoczesnym bardzo wysokim wycofaniu (\(Rec\)). O wiele lepiej wypadają tu modele z predyktorem Szkoła
. Bardzo zbliżone wartości, zarówno wskaźnika precyzji jak i wycofania, świadczą o tym, że te modela mylą się w obu kierunkach, czyli zarówno prognozując sukces przy występującej porażce (ok. \(14\%\) przypadków) jak i przewidując porażkę uczniom którym się powiedzie (\(4\%\) przypadków). Porównując zaś wartości wskaźnika \(F1\) dochodzimy do wniosku, że najlepiej wypada model C, gdzie kategorialna zmienna Szkoła została przetransformowana na wartość mediany. Za nim uplasowały się, z bardzo zbliżonym wynikiem \(F1\) modele B (średnia), D (trimean) oraz E (liczby naturalne). Takie wartości mogą wynikać z faktu, braku zgodności z rozkładem normalnym wyników maturalnych i po raz kolejny uwidaczniają konieczność posługiwania się wartością mediany.
Wnioski płynące z tej analizy będą wykorzystywane w dalszej części pracy. W każdej grupie badanych czynników będzie uwzględniany predyktor Szkoła
którego kategorialne wartości będą transformowane na wartość mediany dla danej szkoły.
Z czystej ciekawości badacza sprawdźmy jeszcze jakie otrzymamy wyniki, jeżeli zastosujemy model regresji liniowej. Oczywiście musimy przy tym pamiętać, o konieczności sprawdzenia czy model ten spełnia założenia regresji liniowej. Zróbmy więc kilka szybkich obliczeń.
Aby jednak móc lepiej porównać poszczególne współczynniki regresji zestawmy w jednym miejscu wykres dla modeli regresji liniowej z wykresem dla modeli logistycznych. Dokonując tego porównania należy jednak wziąć pod uwagę, że w przypadku modeli regresji logistycznej współczynniki \(\beta\) są prezentowane w wartościach wykładniczych. Dla tego w tym przypadku czynniki ograniczające odnaleźć można poniżej wartości jeden. W przypadku modeli liniowych te czynniki, które wpływają ograniczająco mają ujemne wartości. Ponadto kolejność predyktorów jest nieco inna co wynika z kolejności występowania danych predyktorów w określonym modelu.
Analizując otrzymane współczynniki regresji liniowej w pierwszej kolejności powinniśmy zwrócić uwagę na bardzo wąski przedział ufności współczynnika \(\beta_{Szkoła}\) przy jednocześnie bardzo niskim prawdopodobieństwie testowym, którego wartość jest mniejsza od \(0.001\). Tymczasem wartości wyrazów wolnych \(\beta_0\), choć o podobnej wartości prawdopodobieństwa testowego mają najszersze przedziały ufności. Jest to odwrotnie niż w przypadku modeli regresji logistycznych. Niezależnie od tych różnic dla obu typów modeli są to bardzo istotne czynniki. Kolejnym podobieństwem jest ograniczający i bardzo znaczący czynnik \(\beta_{I.2}\) czyli korepetycje. W obu typach regresji współczynniki te mają podobnie wąskie przedziały ufności z podobnie niską wartością prawdopodobieństwa testowego.
W przypadku zmiennej I.1
(zajęcia dodatkowe) współczynniki regresji liniowej są niezależne od zmiennej objaśnianej. W przypadku regresji logistycznych ten czynnik okazał się istotny tylko w przypadku modelu skonstruowanego dla testu diagnostycznego. Spójrzmy teraz na zmienną I.4
(internet). Jak widać w obu przypadkach czynnik ten okazał się jednakowo czynnikiem ograniczającym. Co prawda w przypadku modeli logistycznych miał on znaczenie znów tylko dla testu diagnostycznego. Dalej, zmienna I.6
(próbne matury), istotna w obu modelach regresji liniowej, w przypadku regresji logistycznej w ogóle nie występuje. Z kolei zmienna I.7
, dla regresji liniowej jest również istotna w obu modelach, gdy tymczasem dla regresji logistycznej jest ona istotna tylko dla modelu dotyczącego testu diagnostycznego. Ostatnie dwie zmienne modeli liniowych to I.11
oraz I.5
, przy czym pierwsza z nich jest istotna tylko w odniesieniu do matur a druga w odniesieniu do testu diagnostycznego nie występują lub nie są istotne w modelach regresji logistycznej.
W tym miejscu można jednak próbować wyciągnąć wniosek (błędny), że skoro dla regresji liniowych wartości wyestymowanych współczynników \(\beta\) są tak bardzo podobne (tzn. występują dla tych samych predyktorów, przy takiej samej p-wartości oraz podobnych szerokościach przedziałów ufności) zarówno dla testu diagnostycznego jak i dla matury, to te modele lepiej opisują rzeczywistą sytuację. Bez sprawdzenia zgodności z założeniami regresji liniowej były by to oczywiście zbyt pochopny wniosek. Jednak zanim to zrobimy należy uzmysłowić sobie co te wartości dla nas oznaczają. Otóż wartość wyrazu wolnego \(\beta_0 = 4\) mówi, że uczeń “na wejściu” powinien uzyskać co najmniej 4 punkty, dalej to do jakiej szkoły chodzi daje mu kolejne punkty równe \(\beta_{Szkoła} = 0.77\) razy mediana wyniku szkoły, czyli dla poprzedniego przykładu, tzn. szkoły o kodzie OGL która uzyskała medianę równą \(34.5\) dało by mu to wynik równy \(4+0.77*34.5 = 30.5\) punktów. Tymczasem takie czynniki jak często odrabiane zadania domowe mogą ten wynik zmienić o niecałe 2 punkty (\(\beta_{I.7} = 1.94\)). Dokładnie o taką samą wartość zmieni się wynik jeżeli uczeń często korzystał z arkuszy maturalnych (\(\beta_{I.11} = 1.94\)). Jeżeli zaś należał do grupy często korzystającej z korepetycji to jego wynik będzie mniejszy o 3 punkty (\(\beta_{I.2} = -3\)), a jeżeli często szukał pomocy w internecie to jego wynik będzie mniejszy o niecałe dwa punkty (\(\beta_{I.4} =-1.9\)). Widać więc wyraźnie, że większa część wyniku pochodzi i tak ze zmiennej Szkoła
. Pozostałem zmienne zmieniają wynik o zaledwie 2, 3 punkty.
Sprawdźmy jednak jak nasze modele spełniają założenia regresji liniowej. Dokonajmy to na podstawie wizualnej oceny analizując kilka wybranych wykresów diagnostycznych.
Analiza wykresów diagnostycznych uwidacznia niedostateczną liniowość tych modeli oraz szczególnie heteroskedastyczność rezyduów co nie pozwala nam na przyjęcie tych modeli i wnioskowanie dotyczące przedziałów ufności weystymowanych współczynników.
Cała powyższa analiza prowadzi do dość nieoczekiwanych wniosków które stoją w konflikcie z założoną tezą o korelacji pomiędzy pracą własną ucznia a osiąganym wynikiem maturalnym. Dla czego tak się stało? Jak można to interpretować? Chcąc dokładnie zbadać przyczynę takiego stanu rzeczy wykonano jeszcze kilka szybkich analiz. Każdą z z odpowiedzi na pierwszą grupę pytań ankietowych dotyczących metod przygotowań uczniów do matury można potraktować jako swoisty nakład pracy, a przy zastosowanej transformacji (\(-1...0...+1\)) wystarczy proste zsumowanie tych odpowiedzi dla każdego ucznia. Powinniśmy w ten sposób otrzymać pewien wskaźnik przyjmujący wartości od \(-11\) do \(+11\) odzwierciedlający nakład pracy ucznia przygotowującego się do matury. Zobaczmy więc jak wartość tego wskaźnika kształtowała się w poszczególnych kategoriach szkół.
Na wyniki nakładu pracy zostały nałożone (w formie czerwonych punktów), odpowiednio przeskalowane mediany wyników maturalnych. Już sama, pobieżna tylko analiza tego wykresu uwidacznia nam bardzo wyraźny fakt braku jakiejkolwiek istotnej różnicy pomiędzy tymi grupami. Potwierdza to także test Wilcoxona. Dla dopełnienia tego obrazu sprawdźmy współczynnik korelacji Pearsona pomiędzy nakładem pracy a wynikiem maturalnym, który w tym przypadku wynosi 0.083, co świadczy o absolutnym braku jakiejkolwiek korelacji.
Przejdźmy zatem do wyników osiągniętych w poszczególnych szkołach.
Jedyna, jedyna szkoła która wyróżnia się z tego zbioru, to szkoła o kodzie KIE. Wyróżnia się ona jednak w bardzo negatywny sposób. Dla prawie wszystkich uczniów tej szkoły nakład pracy wyniósł poniżej zera. Przypomnijmy, że jest to szkoła w której maturę zdało tylko \(18\%\) uczniów. Dla wszystkich pozostałych szkół wyniki są bardzo podobne, co potwierdza nam test Wilcoxona. Można zauważyć, że mediana jest tu prawie zawsze większa od zera (poza szkołą o kodzie OP2). W każdej szkole są uczniowie którzy bardzo często korzystają z różnych sposobów przygotowania do matury jak i tacy którzy sięgają po te pomoce bardzo rzadko. Co znamienne czterech uczniów z najniższym wynikiem nakładu pracy wystąpiło w szkołach osiągających najlepsze wyniki. Jest zadziwiające, że nie można dopatrzeć się tu żadnej korelacji pomiędzy nakładem pracy uczniów a osiąganymi wynikami szkoły. Wyznaczmy więc współczynnik korelacji Pearsona, jednak tym razem potraktujmy szkołę o kodzie KIE jako wynik odstający i nie uwzględniajmy ich w obliczeniach tego współczynnika. Tak wyznaczony współczynnik korelacji wynosi -0.013 co również świadczy o braku jakiejkolwiek korelacji pomiędzy nakładem pracy a osiąganym wynikiem z niewielkim wskazaniem, że nakład pracy w słabszych szkołach jest nieco większy niż w szkołach o najlepszych wynikach.
Dopełnieniem tej analizy niechaj będzie kolejny już wykres, ilustrujący bardzo precyzyjnie dlaczego pomiędzy nakładem pracy a wynikiem maturalnym brak jest jakiejkolwiek korelacji. Będzie to wykres prezentujący wynik maturalny każdego ucznia w funkcji wyliczonego tu nakładu pracy. Aby jednak punkty wykresu wzajemnie się nie nakładały, na ich pozycje nałożono niewielkie dodatkowe losowe przesunięcie. Dodatkowo na wykresie zaznaczono linę określające próg maturalny (linia czerwona) oraz próg wyniku przyzwoitego (linia niebieska).
Jak można zauważyć pomiędzy nakładem pracy o wartości \(-5\) a \(5\) występuje praktycznie każdy możliwy wynik maturalny. Warto też zwrócić uwagę na dwa szczególne wyniki. Analizując poprzedni wykres można było zauważyć, że jeden jedyny uczeń który nie wskazał aktywności w ani jednym punkcie ankiety to uczeń ze szkoły o kodzie OP2. Bardzo łatwo można go odnaleźć na powyższym wykresie. Jest to punkt najdalej na lewo. Jak widać uczeń ten zdał maturę, choć udało mu się tylko nieznacznie przekraczając próg zdawalności. Natomiast jeden z uczniów ze szkoły ZAW (dolny prawy punkt), który zaznaczył aktywność w prawie wszystkich jedenastu punktach, niestety nie przekroczył progu zdawalności, co jest niezwykle smutnym spostrzeżeniem.
Wprowadźmy zatem jeszcze jeden, nowy próg, i spróbujmy przeprowadzić całą tę analizę jeszcze raz. Tym razem jako próg przyjmijmy 40 punktów, czyli 80% maksymalnego wyniku. Próg ten nazwijmy wynikiem wysokim. Sprawdźmy zatem czy takie podniesienie poprzeczki uwidoczni jakieś istotne zmiany oraz jak to wpłynie na wartości współczynników regresji logistycznej. Na początek porównajmy odpowiedzi na poszczególne pytania ankietowe w odniesieniu do nowego progu. Zbierzmy to jednak na jednym wykresie aby łatwiej można było dokonać odpowiednich, wizualnych porównań.
Jak możemy zauważyć te dwie mapy cieplne prawie nie różnią się od siebie. Jeżeli występują tu różnice to są one bardzo subtelne i w większości nie przekraczają \(0.1\). Wykonajmy więc jeszcze porównanie w poszczególnych kategoriach szkół. Jednak tym razem, mając na uwadze czytelność wykresów zrezygnowano z podawania wartości liczbowych na wykresach.
Proste wizualne porównanie również nie pozwala nam wychwycić większych różnic pomiędzy tymi wynikami. Czy zatem można się spodziewać, że wpłynie to na wartości współczynników regresji? Zróbmy odpowiednie rachunki.
Tym razem porównajmy otrzymane wartości wyłącznie dla wyników egzaminu maturalnego. Pamiętając jednak wcześniejsze zależności od predyktora Szkoła
skonstruujmy cztery modele. Po dwa dla progu przyzwoitego oraz dwa dla progu wysokiego. Wprowadźmy następujące oznaczenie modeli:
Szkoła
Szkoła
Szkoła
Szkoła
Oczywiście każdy z modeli będzie poddawany metodzie eliminacji nieistotnych predyktorów. Wyniki będziemy prezentować na dobrze już znanym wykresie współczynników regresji.
Kolejny raz wykres ten niesie ogromną ilość informacji. Po pierwsze możemy zauważyć, że pozbawienie modelu predyktora Szkoła
zawsze wpływa na zwiększenie wartości wyrazu wolnego \(\beta_0\). Jednak w przypadku progu wysokiego współczynnik ten zwiększył swoją wartość tylko nieznacznie, i to przy stosunkowo niewielkiej szerokości przedziału ufności. Natomiast w przypadku progu przyzwoitego wzrost ten jest znacznie większy oraz dodatkowo, towarzyszy temu znaczne poszerzenie przedziału ufności. Spróbujmy zatem oszacować szansę, a co za tym idzie i prawdopodobieństwo płynące z wyrazu wolnego (tzw. szansa na wejście). W przypadku modelu M2
wartość \(\beta_0\) wynosi 2.86 w przedziale od 1.74 do 4.7 co dopowiada prawdopodobieństwu sukcesu 0.74 w przedziale od 0.64 do 0.82 co oznacza, że jeżeli uczeń na wszystkie pytania ankietowe odpowiedział “trudno powiedzieć” model klasyfikuje go jako osobę która osiągnie sukces.
Zupełnie inaczej wygląda to w przypadku modelu dla progu wysokiego. Tutaj \(\beta_0\) wynosi 0.51 w przedziale od 0.31 do 0.81 co dopowiada prawdopodobieństwu sukcesu 0.34 w przedziale od 0.24 do 0.45. Tak więc w tym przypadku o sukcesie, bez innych czynników nie ma mowy. Można stąd także wyciągnąć wniosek, że podniesienie progu do \(80\%\) spowodowało, że znaczenie do jakiej szkoły chodzi dany uczeń jest już znacznie mniejsze.
Następnie warto zwrócić uwagę, że dla obu modeli uwzględniających predyktor Szkoła
zarówno wyraz wolny \(\beta_0\) jak i współczynnik regresji dla tej zmiennej \((\beta_{Szkoła})\) mają prawie takie same wartości, bardzo podobną p-wartość oraz jednakowo, bardzo wąskie przedziały ufności. Kolejny raz potwierdza się więc, że zmienna Szkoła
jest bardzo istotnym czynnikiem, niosącym znaczną część szansy powodzenia, niezależnie od wysokości progu sukcesu. I tak dla przykładu uczniowie ze szkoły o kodzie OGL której mediana wyników maturalnych wynosi \(34.5\) pomnażają swoją wejściową szansę równą 710^{-4} razy 428.0857895 co w rezultacie daje szansę 0.3, co z kolei odpowiada prawdopodobieństwu 0.23. Oczywiście nadal jest to za mało aby móc liczyć na sukces. Teraz znaczenia nabierają pozostałe predyktory.
Idźmy jednak dalej. To co w następnej kolejności jest niezwykle interesujące, to wpływ czynnika I.2
czyli, tak często występujące już wcześniej korepetycje. Jak widać czynnik ten pojawia się w każdym modelu z prawie taką samą, ograniczającą wartością, przy bardzo niskim prawdopodobieństwie testowym i bardzo wąskim przedziale ufności. Widać stąd jak silny jest to czynnik. Nie ma znaczenia czy próg ustawimy na \(50\%\) czy też podniesiemy go do \(80\%\). Niezmiennie, jeżeli uczeń należy do grupy pobierającej korepetycje to oznacza, że jest na tyle słaby, że jego szansa na sukces maleje, i to niezależnie jak wysoko próg tego sukcesu jest ustawiony. Bardzo podobnie zachowuje się także predyktor I.4
czyli korzystanie z internetu.Co prawda dla progu przyzwoitego i po uwzględnieniu zmiennej Szkoła
predyktor ten został wyeliminowany jako nieistotny, to jednak w pozostałych trzech modelach wystąpił z bardzo zbliżona wartością oraz przedziałami ufności. Co to dla nas oznacza? Jest bardzo prawdopodobne, że ci uczniowie którzy przygotowywali się do matury korzystając z z zasobów internetu, pozostawali tam zbyt długo tracąc część czasu na zdobywanie wiedzy niekoniecznie na maturze przydatnej. Można tu jednak wyciągnąć taki wniosek, że przygotowywanie się poprzez korzystanie z zasobów internetowych oraz serwisu YouTube zajmuje uczniom sporo czasu jednak czas ten nie przekłada się na zbytnie podniesienie ich wiedzy i umiejętności.
Dalej, na wykresie tym możemy zauważyć jeszcze jeden czynnik który wystąpił w każdym z czterech modeli, przy zbliżonej wartości i podobnych przedziałach ufności. Jest to zmienna I.7
czyli odrabianie zadań domowych. Tym razem jednak jest to zmienna bezsprzecznie stymulująca i co warto zauważyć, największy wpływ ma ona dla modelu M3S w którym pomnaża szansę dwukrotnie. Można to wyrazić następująco, ważna jest szkoła do której chodzisz, jednak aby osiągnąć wysoki wynik powinieneś poważnie traktować zadania domowe, bo zwiększasz sobie w ten sposób szansę osiągnięcia tego wyniku. Dodatkowo widać, że model M3S
jest jedynym modelem w którym wystąpił predyktor I.1
czyli zajęcia dodatkowe. Daje on uczniowi wzrost szansy o dodatkowe \(50\%\). Jest to też bardzo znamienne, że ten czynnik wystąpił jedynie w przypadku właśnie tego modelu.
Bardzo ciekawe są natomiast wyniki dla zmiennej I.10
, czyli korzystanie z podręcznika. Jak widać na wykresie jest to jedyny czynnik który przyjął dwie skrajne wartości. Skrajne w tym sensie, że w przypadku modelu M2
ma on wpływ ograniczający, a w przypadku modelu M3S
ma wpływ stymulujący, o wartości podobnej do zajęć dodatkowych. Zrozumieć można to w ten sposób. Bez określenia szkoły do której chodzi dany uczeń, praca z podręcznikiem na niewiele się zdaje. Dopiero jeżeli uczeń ten uczęszcza do odpowiedniej szkoły z odpowiednio dobrymi wynikami i chciałby sam osiągnąć wysoki wynik na maturze, to korzystając z podręcznika z pewnością zwiększa swoje szanse.
Jest jeszcze jedne czynnik który ma wpływ stymulujący. Jest nim I.9
czyli praca w grupach. Jak możne pamiętamy był to sposób przygotowywania do matury wyjątkowo rzadko wskazywany przez uczniów, niezależnie od szkoły. Analizując wcześniejsze wizualizacje można było zauważyć, że uczniowie którzy nie osiągali sukcesu dla założonych przez nas progów nieco najrzadziej korzystali w tego sposobu przygotowania. Co prawda uczniowie przekraczający nasze progi również rzadko wskazywali ten czynnik jednak nieznacznie częściej od swoich poprzedników. Tą subtelną różnice wychwycił nasz model regresji logistycznej który wskazuje nam, że mimo tak słabego zainteresowania tym sposobem, ma on jednak znaczenie. Co prawda p-wartość przekroczyła przyjęty przez nas poziom istotności jedynie w przypadku modelu M3
, to nie można pominąć, że predyktor ten pozostał także w modelu M3S
i to z prawie taką samą wartością. Nie bez znaczenia jest również fakt, że tego czynnika brak jest w modelu M2S
a w modelu M2
ma bardzo wysoką p-wartość. Świadczy to o tym, że praca w grupach nabiera znaczenia dopiero wtedy kiedy mówimy o odpowiednio wysokich wynikach.
Ostatnie dwie zmienne to I.5
(materiały CKE) oraz I.11
(arkusze maturalne). To, że predyktory te pozostały wyłącznie w modelach bez zmiennej Szkoła
oznacza, że z tych sposobów przygotowania do matury korzysta się w mniej więcej w podobny sposób w każdej badanej szkole. Jednak znaczenie nabierają one wyłącznie dla wysokich wyników. Oczywiście w obu przypadkach są to czynniki stymulujące.
Na koniec warto jeszcze zwrócić uwagę na wartości kryterium informacyjnego Akaikiego. Oczywiście nie możemy tu porównywać modeli dla progu przyzwoitego z modelami dla progu wysokiego. Modele te bowiem zawierają różną liczbę predyktorów. Stąd wartości tego kryterium będą się znacznie różnić. Jednak w przypadku modeli M3
oraz M3S
mamy dokładnie taką sama liczbę predyktorów. Proste porównanie więc wartości AIC dla tych modeli wyraźnie wskazuje na znacznie lepsze dopasowanie modelu z predyktorem Szkoła
.
Sprawdźmy zatem, jakie wskaźniki jakościowe zwrócą nam te cztery modele.
Wykres ten może nas wprowadzić w niejaką konfuzję. I to nie dla tego, że powstał na bazie macierzy konfuzji. Możemy tu bowiem odczytać, że najlepszym modelem jest model M2S
a tylko nieznacznie gorszy od niego jest model M2
. Zanim jednak wyciągniemy zbyt pochopne wnioski trzeba zdać sobie sprawę z jednego faktu. Załóżmy, że mamy dane w których występuje \(70\%\) sukcesów, oraz co oczywiste \(30\%\) porażek. Załóżmy następnie, że dla tych danych skonstruowaliśmy odpowiedni model który poddalibyśmy weryfikacji macierzą konfuzji. Jeżeli taki model odpowiedział by prognozując sukces dla wszystkich pomiarów, co oczywiście świadczyło by o bezużyteczności tego modelu, to zarówno dokładność tego modelu (Accu
) jak i jego precyzja (Prec
) wyniosła by \(70\%\) przy wycofaniu (Rec
) równym \(100\%\). Jest to tak zwany paradoks dokładności.
Sprawdźmy zatem jak to jest w naszym przypadku. Dla progu przyzwoitego stosunek sukcesów do całkowitej ilości badanych wynosi 0.8. Jak widać model M2
uzyskał dokładnie taką wartość wskaźnika dokładności Accu
! Dodatkowo bardzo wysoka wartość wskaźnika wycofania Rec
przy znacznie niższej wartości wskaźnika precyzji Prec
, świadczą o tym, że tak jak w naszym przykładzie model ten, dla progu przyzwoitego prognozuje prawie wszystkim pełny sukces. Bierze się to bezsprzecznie z bardzo wysokiej wartości wyrazu wolnego \(\beta_0\) w tym modelu, co go ostatecznie prawie całkowicie dyskwalifikuje.
W tym kontekście model `M2S’ wykazuje się nico lepszymi wskaźnikami. Niestety tu również mamy do czynienia z znaczną różnica pomiędzy wycofaniem a precyzją co także świadczy, że dla większości badanych model ten prognozował sukces. Mimo wszystko model ten niesie już jakieś minimalnie wartościowe wskazówki.
Zupełnie inaczej wygląda to w przypadku progu wysokiego i modeli M3
oraz szczególnie modelu M3S
. Dla tego progu, proporcja sukcesu wynosi 0.46. Jeżeli teraz porównamy to z wskaźnikiem dokładności wynoszącym w modelu M3S
\(0.77\), to dojdziemy do wniosku, że model ten, mimo znacznie niższego wskaźnika Accu
, jest znacznie lepszy od modelu M2S
. W tym modelu także uzyskaliśmy prawie identyczne wartości wskaźników precyzji oraz wycofania. Świadczy to o tym, że ten model się myli, jednak myli się równomiernie w obie strony prognozując tyle samo błędnych sukcesów jak i błędnych porażek, oczywiście w odniesieniu do prawdziwych sukcesów.
Nie można także pominąć bardzo dużej różnicy pomiędzy wskaźnikami dla modelu M3S
a M3
. Kolejny raz przekonujemy się jak bardzo istotne jest to, aby konstruując nasze modele uwzględniać predyktor Szkoła
. Innymi słowy jest niezwykle istotne do jakiej szkoły chodzi badany uczeń, niezależnie od tego jakiej wysokości próg bierzmy pod uwagę.
W tym miejscu warto także zadać sobie pytanie jaki wpływ na jakość modelu miała stosowana przez nas metoda krokowej eliminacji predyktorów. Ostatnio można się bowiem dość często spotkać z twierdzeniem, że metoda da jest już nieco przestarzała. Sprawdźmy zatem jak wpływała ona na nasze modele. W tym celu przygotujemy jeszcze jeden model który nazwiemy tutaj M4S
. W modelu tym pozostawimy wszystkie predyktory od I.1
do I.11
, po czym porównamy go z modelem M3S
. Zacznijmy od analizy wykresu współczynników regresji, aby przekonać się jakie wartości otrzymały współczynniki regresji dla usuniętych predyktorów.
Jak widać na powyższym wykresie usunięcie predyktorów spowodowało, że niektóre współczynniki regresji mają nieznacznie różną wartość. Tak jest w przypadku zmiennej I.4
oraz I.7
. Ponadto, dla zmiennej I.10
po usunięciu predyktorów p-wartość zmalała do poziomu pozwalającego nam odrzucić hipotezę zerową o braku zależności liniowej ze zmienną objaśnianą. Zauważmy także, że wartości współczynników regresji dla usuniętych zmiennych różnią się od jedności nie więcej niż o \(0.25\) oraz, że wartość prawdopodobieństwa testowego jest w każdym z tych przypadków większa od \(0.1\). Ostatnim, na co powinniśmy zwrócić uwagę to wartości kryteriów informacyjnych AIC oraz BIC które, co oczywiste, są mniejsze dla modelu z usuniętymi predyktorami.
Sprawdźmy teraz jak te modele będą odpowiadać, korzystając ze znanego już wykresu wskaźników jakościowych.
Wnioski jakie możemy wyciągnąć z powyższego wykresu są dość oczywiste. Widać wyraźnie, że pozostawienie w modelu nieistotnych predyktorów, powoduje pogorszenie odpowiedzi takiego modelu. Choć oczywiście to pogorszenie nie jest bardzo znaczące, jednak nie można go pominąć. Warto też zwrócić uwagę, że pogorszenie to było raczej w kierunku większego optymizmu modelu. Wynika to z porównania zakresu dla wskaźników Prec
oraz Rec
. W przypadku modelu M4S
widać większe wyraźnie większe przesunięcie zakresów dla tych wyników co świadczy, jak już się wcześniej przekonaliśmy, o częstszym prognozowaniu sukcesu.
Test ten ostatecznie uwidocznił oraz potwierdził zasadność eliminacji nieistotnych predyktorów z modelu. Metoda ta będzie więc konsekwentnie stosowana w trakcie całej dalszej analizy.
Na sam koniec tej części analizy zwizualizujmy jeszcze prawdopodobieństwo sukcesu, które skonstruowane przez nas modele zwracają dla naszych danych. Obliczenia będziemy prowadzić osobno dla modeli zawierających predyktor Szkoła
oraz dla modeli pozbawionych tego predyktora, zarówno dla progu przyzwoitego jak i progu wysokiego, trzymając się przyjętych wcześniej oznaczeń dla poszczególnych modeli regresji.
Zaprezentowany powyżej wykres na początek kilku słów komentarza. Po pierwsze jest to wykres prawdopodobieństwa sukcesu w funkcji logarytmu szansy. Po drugie do wykreślonej w ten sposób sigmoidy dodano odpowiednie przedziały ufności o szerokości \(0.95\). Może jednak zastanawiać, dlaczego przedziały te nie mają gładkiego charakteru i widać tam wyraźne ostre piki, szczególnie w przypadku modelu M2
. Trzeba jednak zdawać sobie sprawę, że w tym przypadku mamy do czynienia z regresją wieloczynnikową, a więc szansa, a co za tym idzie prawdopodobieństwo wynika z wielu różnych zmiennych objaśniających. Dla każdego zaś z predyktorów odpowiedni współczynnik regresji \(\beta_i\) miał swój własny przedział ufności. Złożenie wszystkich tych czynników powoduje, że przedział ufności dla wynikowego prawdopodobieństwa nie odznacza się gładkim kształtem jaki można uzyskać w przypadku regresji jednoczynnikowej.
Pod trzecie należy wyjaśnić że, na wykres ten dodano punkty dla każdego poszczególnego wyniku. Jednak aby uniknąć wzajemnego nakładania się tych punktów, do ich pozycji dodano, często stosowane w tej analizie, niewielkie losowe przesunięcia. Ponadto wykreślono wyłącznie punkty dla których model niepoprawnie określił sukces. Oznaczenie FP
(ang. false positive) oznacza tych uczniów, dla których model przewidział sukces, mimo iż osiągnęli porażkę. Oznaczenie FN
(ang. false negative) oznacza tych uczniów, którzy w rzeczywistości, dla przyjętego przez nas progu sukces osiągnęli, z czym model się nie zgadza.
To co również jest warte zauważenia to fakt, który mieliśmy już okazję wcześniej poznać. Model M2
, czyli model bez predyktora Szkoła
zwraca bardzo bardzo dużo fałszywych sukcesów, przy niewielu fałszywych porażkach, co na powyższym wykresie zobrazowane jest dużą ilością punktów FP
przy nieznacznej ilości punktów FN
. Widać także, że dodanie zmiennej Szkoła
spowodowało znaczne poszerzenie zakresu logarytmu szansy oraz zmniejszenie ilości fałszywych pozytywów.
Zobaczmy jednak jak prawdopodobieństwo sukcesu będzie się kształtować kiedy rozdzielimy nasze wyniki na poszczególne szkoły. Aby jednak obszary szans dla poszczególnych szkół nie przesłaniały się wzajemnie rozdzielmy to także według kategorii szkoły.
Jest niezwykle zaskakujące, że mimo iż model M2
pozbawiony jest predyktora Szkoła
to w przypadku uczniów szkół kategorii C dla każdego przewiduje sukces choć myli się tu w kilku przypadkach. Tymczasem w przypadku kategorii A zakres logarytmu szans jest dość szeroki i w przybliżeniu podobny, niezależnie od szkoły. Podobnie w przypadku trzech szkół z kategorii B. Kiedy jednak do modelu dodam predyktor Szkoła
, to widać jak przedziały logarytmu szans zawężają się, co dzieje się szczególnie w przypadku szkół o kodach KIE, KKO oraz szkół kategorii C.
Zobaczmy więc jak te wykresy będą się prezentować jeżeli progiem będzie wynik wysoki.
Tym razem modele te wracają znacznie więcej nietrafionych wyników. Widać to szczególnie w przypadku modelu M3
. Oczywiście musimy pamiętać o paradoksie dokładności oraz o tym, że w przypadku progu wysokiego proporcja sukcesów była zdecydowanie niższa niż w przypadku progu przyzwoitego. Drugi efekt na który powinniśmy zwrócić uwagę, to znacznie szerszy przedział logarytmu szansy dla modelu M3S
który w tym przypadku rozciąga się od prawie \(-7.5\) do ponad czterech. W przypadku modelu M2S
zakres ten był znacznie węższy i obejmował wartości od \(-4\) do \(+4\).
Przejdźmy na koniec do wykresu prawdopodobieństwa sukcesu dla progu wysokiego, w podziale dla badanych szkół.
Tym razem szerokości przedziałów logarytmu szansy wynikające z modelu bez predyktora Szkoła
są już znacznie bardziej zbliżone. Dopiero dodanie tej zmiennej objaśniającej zawęża te szerokości, przesuwając szansę dla wszystkich uczniów z szkół kategorii A poniżej zera, a uczniom ze szkół kategorii c w większości powyżej zera.
Na tym zakończmy tą dość rozbudowaną analizę metod przygotowywania uczniów do egzaminu maturalnego. Wszystkie wyciągnięte w tej części wnioski będą konsekwentnie stosowane w dalszej części pracy.
Druga część uwarunkować nakierowana była na osobowość ucznia, jego zainteresowania oraz motywację jaką przejawiał. W tej części zadano uczniom czternaście pytań ankietowych, które hasłowo można określić jak w poniższej tabeli.
Na te pytania uczeń mógł dać jedną z poniższych pięciu odpowiedzi.
Te kategoryczne zmienne zostały przetransformowane w dokładnie taki sam sposób jak w przypadku pytań z metod przygotowywania do matury. I tak “zdecydowanie nie” otrzymało wartość minus jeden a “zdecydowanie tak” wartość jeden. Reszta proporcjonalnie w tym samym kluczu.
Dodatkowo wszyscy uczniowie zostali przebadani przy pomocy oddzielnego kwestionariusza badania motywacji osiągnięć zwanego KBMO. Wynikiem tego kwestionariusza była wartość liniowa w zakresie od \(20\) do \(100\) określająca poziom motywacji ucznia. W odpowiednim momencie zajmiemy się również tymi wynikami, co będzie wyraźnie zaznaczone. Nie należy jednak łączyć tej motywacji z samooceną wynikającą z pytania II.2
.
Na początek jednak zbadajmy jak kształtowały się odpowiedzi badanych uczniów, od razu dzieląc naszą populację pod względem obu wyników, zarówno przyzwoitego jak i wysokiego.
Na początku skupmy się na różnicach. Widać od razu jak duże różnice występują we własnej ocenie uczniów w odniesieniu do swoich zdolności matematycznych, motywacji do nauki tego przedmiotu, podejścia do samodzielnej pracy oraz zainteresowań przedmiotami ścisłymi (II.1
, II.2
, II.3
, II.7
). Co jest też dość oczywiste, znacznie wyżej oceniają się tutaj uczniowie odnoszący sukces, niezależnie od ustawionych przez nas progów.
Dalej można by wskazać wiele czynników o bardzo zbliżonych, jeżeli nie takich samych wartościach. Widać, wysoką znajomość zasad egzaminu maturalnego (II.4
) oraz równie wysoką sympatię, jaką uczniowie darzą swoich nauczycieli (II.14
), przy minimalnie wyższych wartościach wśród uczniów “sukcesu”. Tak samo wysoko uczniowie oceniają swoją znajomość przynajmniej jednego języka obcego (II.8
).
Na średnio wysokim poziomie uczniowie oceniają zainteresowanie swoich rodziców czynionymi przez nich postępami w tej dziedzinie (II.12
), oraz wsparcie jakie otrzymują od swoich nauczycieli (II.13
). Co ciekawe, nie można się dopatrzeć prawie żadnych różnic dla poziomu tego wsparcia, co bardzo dobrze świadczy o samych nauczycielach. Wpierają jednakowo i tych którzy osiągają wysokie wyniki jak i tych którzy są nieco słabsi. A przynajmniej jest tak w odczuciu samych uczniów.
Równie średnio wysokie wskazania uczniów występują w odniesieniu do aktywności na portalach społecznościowych (II.9
).
Dość neutralne, ale też i nieróżnicowane względem progów, okazały się takie czynniki jak zainteresowania sportem (II.5
), zaangażowanie społeczne (II.6
) oraz systematyczność (II.11
), która została minimalnie niżej oceniona przez uczniów “porażki”.
Wśród tych odpowiedzi najbardziej może cieszyć wyjątkowo słabe zainteresowanie grami komputerowymi (II.10
). Tym bardziej, że jest ono nawet nieznacznie słabsze dla uczniów z grupy nie odnoszącej wysokich wyników.
Sprawdźmy teraz czy dostrzeżemy jakieś rozbieżności jeżeli wyniki podzielimy dodatkowo według kategorii szkoły.
Zasadniczo, wyniki te nie odbiegają w jakiś zdecydowany sposób od wyników prezentowanych na poprzednim wykresie. Zwróćmy jednak na początek uwagę na dwa “najcieplejsze” oraz dwa “najchłodniejsze” punkty. Najwyższą znajomość zasad (II.4
) oraz najwyższą sympatię względem swego nauczyciela wskazali uczniowie odnoszący sukces z szkół kategorii A. Z kolei najniższe średnie odpowiedzi możemy zanotować w odniesieniu do zainteresowań przedmiotami ścisłymi (II.7
) oraz zainteresowań grami komputerowymi (II.10
), które występują wśród uczniów nie zaliczających sukcesu przyzwoitego w szkołach kategorii C. Ogólnie jednak można powiedzieć, że najbardziej istotne różnice które wychwyciliśmy na wcześniejszym wykresie, w przypadku podziału na kategorie szkoły występują w podobnych proporcjach.
Ciekawym jest jednak, że w przypadku wsparcia nauczycieli (II.13
) widzimy teraz nieco większe zróżnicowanie. Jak widać najbardziej wspierani czują się tu uczniowie ze szkół kategorii A, czyli szkół z najsłabszymi wynikami. Tymczasem dla kategorii B oraz C widać już zróżnicowanie odpowiedzi. Teraz uczniowie zaliczający sukces, niezależnie od jego poziomu doświadczają większego wsparcia od uczniów tych sukcesów nie odnoszący.
Wydaje się także, że w przypadku takich pytań jak II.6
czyli zaangażowanie społeczne oraz II.11
czyli systematyczna praca, po rozdzieleniu danych według kategorii szkoły uwidacznia się nieco mniejsze zaangażowanie uczniów zaliczających sukces.
Ostatnim co warto zauważyć jest wzrastające poczucie umiejętności językowych wraz ze wzrostem kategorii szkoły przy takich samych ocenach względem sukcesów. Jest to jednak dość oczywisty efekt. Szkoły odnoszące wysokie wyniki na maturze z matematyki z pewnością odnoszą również wysokie wyniki w innych przedmiotach. Stąd również przekonanie uczniów i ich własna wysoka samoocena odnośnie umiejętności lingwistycznych.
Pora teraz na wykazanie się możliwościami w odnajdywaniu istotnych czynników dla metody regresji logistycznej. Tak jak poprzednio, pozostańmy tu przy tych samych, przyjętych wcześniej nazwach odpowiednich modeli (M2
, M2S
, M3
oraz M3S
). Oczywiście pozostawiając zmienną Szkoła
z stosowaną i sprawdzoną wcześniej transformacją na wartość mediany. Jednak najpierw sprawdźmy czy pomiędzy tymi zmiennymi nie istnieje silna korelacja. Do tego celu wykorzystajmy znany już wykres mapy cieplnej współkorelacji Spearmana.
Jedyna, dość znaczna korelacja występuje w przypadku zmiennej II.1
czyli zdolnościami matematycznymi a zmienną II.7
czyli zainteresowaniami naukami ścisłymi. Jest to dość oczywiste i logiczne spostrzeżenie. Choć wartość tego współczynnika nie jest jeszcze bardzo wysoka, to należy zwrócić szczególną uwagę czy predyktory te wystąpią w naszych modelach. Kolejna wysoką korelację można zauważyć w przypadku zmiennych II.13
oraz II.14
, czyli pomiędzy wsparciem nauczyciela a sympatią którą obdarzają go uczniowie, co również jest dość oczywistym następstwem.
Ostatnie dwa współczynniki korelacji warte naszej uwagi to współczynniki korelacji pomiędzy zdolnościami matematycznymi (II.1
) a motywacją do nauki (II.2
) oraz samodzielną pracą (II.3
). Poza tym brak jest jakiejkolwiek znaczącej korelacji, co pozwala nam ze spokojem przejść do modelowania. Proces ten rozpoczniemy oczywiście od analizy wykresu współczynników regresji.
Tym razem otrzymaliśmy wykres który nas zaskakuje znacznie mniej, niż wyniki uzyskiwane w poprzednim rozdziale. Najsilniejszy czynnik było łatwo przewidzieć i kompletnie nie dziwi nas wartość współczynnika regresji \(\beta_{II.1}\). Przypomnijmy, że jest to własna ocena uczniów co do poziomu radzeniem sobie z materiałem uczonym na lekcjach matematyki. Jak na razie jest to czynnik który otrzymał najwyższy współczynnik szansy, choć trzeba przyznać, że z równie szerokim przedziałem ufności. Szczególnie dla modeli M3
oraz M3S
. Oczywistym jest również, że dla progu przyzwoitego daje on już znacznie mniejszą szansę, co uwidocznione jest w mniejszej wartości tego współczynnika regresji dla modeli M2
oraz M2S
.
Dalej warto zwrócić uwagę, że nieco inaczej niż w poprzedniej części analizy, dodanie predyktora Szkołą
ma już znacznie mniejsze znaczenie. Co prawda brak tego predyktora znów spowodował zwiększenie wartości wyrazu wolnego \(\beta_0\), jednak stało się tak tylko w przypadku modelu M2
, czyli modelu dla progu przyzwoitego. Jednak już w przypadku modelu dla progu wysokiego wzrost ten jest już minimalny.
Kolejne dwa, silnie stymulujące predyktory to I.3
czyli samodzielna praca, oraz I.7
czyli zainteresowania naukami ścisłymi. Co może budzić nieznaczne zdziwienie, to jedynie brak tego predyktora w modelu M2S
. Widać stąd, że praca samodzielna przestaje mieć znaczenie, jeżeli bierzemy pod uwagę wynik przyzwoity i oceniamy to w kontekście szkoły do której uczęszcza dany uczeń. Mówiąc wprost szkoła zapewnia mu już taki wynik, i nie ma to ścisłego związku z jego samodzielną pracą. Porównując jednak wartości dla zmiennej I.7
widzimy, że zainteresowania naukami ścisłymi dają nieco większa szansę dla progu przyzwoitego i minimalnie mniejszą dla progu wysokiego.
Ostatni, stymulujący predyktor związany jest z umiejętnościami językowymi, choć jak widać ma on znaczenie jedynie, kiedy nie uwzględnimy szkoły. Po wprowadzeniu do modelu zmiennej Szkoła
ten czynnik został wyeliminowany w procesie krokowej eliminacji predyktorów.
Spójrzmy teraz na czynniki ograniczające. Wystąpiły one dla takich zmiennych jak znajomość zasad egzaminu maturalnego (I.4
), systematyczność (I.11
) oraz społeczne zaangażowanie. Jednak, podobnie jak w przypadku korepetycji, nie oznacza to że systematyczna praca czy zaangażowanie społeczne zmniejsza szansę na osiągnięcie wysokich wyników, ale oznacza to tylko tyle, ze uczniowie którzy taki wynik osiągają po prostu są nieco mniej systematyczni oraz mniej zaangażowani społecznie, co można było zauważyć na wcześniejszym wykresie. Można tutaj również dopatrzeć się niejakiej zbieżności z bardzo szeroką rozpiętością włożonej pracy w kontekście braku korelacji z wynikami maturalnymi którą wykryliśmy w badając te uwarunkowania. Nie należy także zapominać, że w przypadku tych predyktorów p-wartość była na tyle wysoka, że nie pozwala nam to na odrzucenie hipotezy zerowej o braku liniowej zależności ze zmienna objaśnianą.
Jedyny czynnik wśród czynników ograniczających który uzyskał odpowiednio niską wartość prawdopodobieństwa testowego to czynnik związany z wsparciem ze strony nauczyciela. Czynnik ten jednak wystąpił jedynie w modelu M2
. Jak jednak pamiętamy na poprzednim wykresie mogliśmy zauważyć większe wsparcie nauczycieli dla uczniów z szkół kategorii A, czyli szkół z najniższymi wynikami co całkowicie tłumaczy wartość tego współczynnika regresji.
Największym jednak zaskoczeniem może być brak predyktora II.2
, czyli motywacji własnej ucznia, w ani jednym ze skonstruowanych przez nas modeli. Choć wstępna analiza średnich odpowiedzi na prezentowanych wyżej mapach cieplnych wykazywała na istniejące różnice pomiędzy uczniami odnoszącymi a nie odnoszącymi sukces, to jednak w żadnym z modeli czynnik ten nie przetrwał procesu eliminacji predyktorów. Widać stąd, brak jakiejkolwiek zależności pomiędzy motywacją a osiąganym wynikiem. Ten fakt będziemy jeszcze badać odnosząc się do wyników z wspomnianego już wcześniej kwestionariusza badania motywacji osiągnięć.
Teraz jednak przejdźmy do oceny jakości naszych modeli, tym razem jednak, mając w pamięci wcześniejsze problemy z paradoksem dokładności, skoncentrujmy się wyłącznie na modelach skonstruowanych dla progu wysokiego. Dodajmy jednak do tego zestawu model M4S
. Będzie to model podobny do modelu M3S
, z którego jednak usuniemy dwa ograniczające predyktory II.4
oraz `II.11
, czyli zmienne które co prawda przeszły przez proces eliminacji predyktorów, jednak dla których p-wartość była większa od założonego przez nas poziomu istotności.
Pierwszym co należy zauważyć, to bardzo podobna różnica pomiędzy modelem z, a modelem bez predyktora Szkoła
. Może nas to jedynie utwierdzić w przekonaniu co do słuszności wcześniej wyciąganych wniosków o istotności tego predyktora. Przywołując także w pamięci wskaźniki uzyskane dla modeli dla metod przygotowań do matury możemy zauważyć, że tym razem uzyskujemy znacznie wyższą dokładność (Acc
) oraz równie wysokie, oraz niewiele różniące się od siebie wskaźniki precyzji (Prec
) oraz wycofania (Rec
), co wskazuje na o wiele lepszą jakość odpowiedzi tych modeli, wyrażoną w mniejszej ilości błędnych prognoz. Zwróćmy także uwagę na minimalnie niższą, w porównaniu do modelu M3S
, wartość wskaźników modelu M4S
. Jak widać usunięcie predyktorów pozostawionych przez proces ich eliminacji, mimo przekroczenia dla nich progu istotności przez p-wartość, nieznacznie pogorszyła jakość odpowiedzi tak skonstruowanego modelu.
Dopełnieniem tej analizy niech będą wykresy prawdopodobieństwa sukcesu. Jednak jak wcześniej pozostańmy jedynie przy modelach dla progu wysokiego.
Jak możemy zauważyć, szerokość zakresu logarytmu szansy rozciąga się na bardzo podobnej szerokości jak w przypadku modeli konstruowanych dla metod przygotować do matury. Jednak w tym przypadku mamy znacznie mniej błędnych prognoz co oczywiście potwierdza wnioski które wyciągnęliśmy z analizy wcześniejszego wykresu wskaźników jakościowych.
Tym razem obserwujemy znacznie mniejsze, względem modeli dla metod przygotowania do matury, skrócenie zakresu logarytmu szansy, po wyłączeniu z modelu predyktora Szkoła
. Jedyna szkoła gdzie ono wyraźnie występuje to szkoła o kodzie KIE. Jest to jednak, jak może pamiętamy, szkoła uzyskująca najniższe wyniki.
Nie zapominajmy jednak, że w naszych danych mamy także wyniki testu diagnostycznego. Sprawdźmy zatem czy wystąpią, a jeżeli tak się stanie, to jakie wystąpią różnice pomiędzy współczynnikami regresji modeli skonstruowanych dla sukcesu wysokiego maturalnego oraz dla sukcesu wysokiego testu diagnostycznego.
To co warto na początku analizy powyższego wykresu odnotować, to bardzo zbliżone wartości współczynników \(\beta_0\) oraz \(\beta_{Szkoła}\) przy ich jednakowo niskiej p-wartości oraz jednakowo wąskim przedziale ufności. Świadczy to niezmiennie o jednakowo ważnym wpływie zmiennej Szkołą
na osiąganie wysokiego wyniku, i to niezależnie od rodzaju testu. Jednak bardzo ciekawe są różnice pomiędzy wartościami współczynników regresji dla predyktorów II.1
, czyli własnymi zdolnościami, a predyktorem II.7
, czyli zainteresowaniami przedmiotami ścisłymi. Jak widać umiejętności własne mają ogromnie duże znaczenie dla osiągnięcia wysokiego wyniku maturalnego. Jednak dla osiągnięcia tak samo wysokiego wyniku z testu diagnostycznego szansa płynąca z tego czynnika jest już wielokrotnie niższa. Zupełnie odwrotnie jest w przypadku zainteresowań matematyką oraz przedmiotami ścisłymi (II.7
). Tutaj znacznie większą szansę daje ten czynnik w przypadku testu diagnostycznego niż w przypadku testu maturalnego.
Zwróćmy także uwagę, że w przypadku testu maturalnego znaczenie ma zmienna II.3
, czyli praca samodzielna, przy braku tego czynnika dla testu diagnostycznego, podczas gdy odwrotnie zmienna II.13
, czyli wsparcie nauczyciela ma znaczenie da testu diagnostycznego, przy całkowitym braku znaczenia tej zmiennej dla testu maturalnego. Nie możemy także pominąć, że dwa predyktory o wpływie ograniczającym (II.4
oraz II.11
) nie wystąpiły w modelu dla testu diagnostycznego. Kolejny raz widać zatem, że zakres wiedzy potrzebny do zaliczenia testu diagnostycznego był nieco inny od zakresu wiedzy i poziomu własnych umiejętności potrzebnych w przypadku testu maturalnego. Ważne także w tym przypadku było wsparcie nauczyciela.
Na zakończenie tej części analizy wróćmy do wspominanych już wcześniej wyników z kwestionariusza badania motywacji osiągnięć KBMO. Sprawdźmy, czy istnieje zależność pomiędzy motywacją a osiąganym przez badanych uczniów wynikiem maturalnym. Naszą analizę rozpocznijmy od przygotowania wykresu rozproszenia dla tych dwóch zmiennych, wizualnie szacując rodzaj ewentualnej zależności pomiędzy tymi zmiennymi.
Jak widać na powyższym wykresie brak jest absolutnie jakiejkolwiek zależności pomiędzy tymi zmiennymi. Świadczy o tym, zamieszona na wykresie, bardzo niska wartość współczynnika korelacji Pearsona, jak i przebieg wstępnie dopasowanej gładkiej krzywej. Aby jednak wycisnąć z naszych danych maksimum informacji wykonajmy jeszcze raz ten sam wykres, tym razem uwzględniając jeszcze kategorię szkoły.
To czego nabieramy po analizie tego wykresu to jeszcze głębsze przekonanie o braku jakiejkolwiek zależności pomiędzy motywacją a wynikiem maturalnym. Jest to prawdziwe i niezależne od kategorii szkoły. To co możemy tu stwierdzić to, że w szkołach rożnych kategorii uczniowie uzyskują różne wyniki, co zawarte jest w przesunięciu pomiędzy gładkimi krzywymi dopasowania. Ale ta wiedzę już posiadamy. Jedyny wniosek jaki w tym momencie przychodzi na myśl to potwierdzenie starego angielskiego przysłowia o tym, że Dobrymi chęciami piekło jest wybrukowane.