## tibble [323 × 6] (S3: tbl_df/tbl/data.frame)
## $ IDSTUD : num [1:323] 10111 10125 20207 30111 40105 ...
## ..- attr(*, "label")= chr "STUDENT ID"
## ..- attr(*, "format.spss")= chr "F8.0"
## ..- attr(*, "display_width")= int 9
## $ BS4GSEX : dbl+lbl [1:323] 1, 1, 2, 2, 2, 1, 1, 1, 1, 1, 2, 1, 1, 1, 1, 1, 2, 2, ...
## ..@ label : chr "GEN\\SEX OF STUDENT"
## ..@ format.spss : chr "F1.0"
## ..@ display_width: int 9
## ..@ labels : Named num [1:3] 1 2 9
## .. ..- attr(*, "names")= chr [1:3] "GIRL" "BOY" "OMITTED"
## $ BSMMAT01: num [1:323] 709 661 729 802 374 ...
## ..- attr(*, "label")= chr "1ST PLAUSIBLE VALUE MATHEMATICS"
## ..- attr(*, "format.spss")= chr "F6.2"
## ..- attr(*, "display_width")= int 10
## $ BSDMPATM: dbl+lbl [1:323] 1, 1, 1, 1, 3, 2, 1, 2, 1, 1, 3, 2, NA, 1...
## ..@ label : chr "INDEX STDS POS AFFECT TO MATH (PATM)"
## ..@ format.spss : chr "F1.0"
## ..@ display_width: int 10
## ..@ labels : Named num [1:4] 1 2 3 9
## .. ..- attr(*, "names")= chr [1:4] "HIGH" "MEDIUM" "LOW" "OMITTED"
## $ BSDMSVM : dbl+lbl [1:323] 1, 1, 1, 1, 1, 1, 2, 1, 2, 1, 1, 1, 1, 1, 1, 1, 1, 1, ...
## ..@ label : chr "INDEX OF STUDENTS VALUING MATH (SVM)"
## ..@ format.spss : chr "F1.0"
## ..@ display_width: int 9
## ..@ labels : Named num [1:4] 1 2 3 9
## .. ..- attr(*, "names")= chr [1:4] "HIGH" "MEDIUM" "LOW" "OMITTED"
## $ BSDMSCM : dbl+lbl [1:323] 1, 1, 1, 1, NA, 3, 1, NA, 2, 3, 3, 3, 3, 1...
## ..@ label : chr "INDEX OF SELF-CONFID LEARNING MATH (SCM)"
## ..@ format.spss : chr "F1.0"
## ..@ display_width: int 9
## ..@ labels : Named num [1:4] 1 2 3 9
## .. ..- attr(*, "names")= chr [1:4] "HIGH" "MEDIUM" "LOW" "OMITTED"
Belgenin R ortamına sorunsuz aktarıldığı görülmektedir. Toplamda 323 birey, 6 değişken (ID dahil) bulunmaktadır.
## IDSTUD BS4GSEX BSMMAT01 BSDMPATM
## Min. : 10111 Min. : 1.000 Min. : 47.88 Min. :1.00
## 1st Qu.: 360421 1st Qu.: 1.000 1st Qu.:366.57 1st Qu.:1.00
## Median : 720204 Median : 2.000 Median :432.21 Median :1.00
## Mean : 747826 Mean : 1.588 Mean :446.86 Mean :1.26
## 3rd Qu.:1125212 3rd Qu.: 2.000 3rd Qu.:535.90 3rd Qu.:1.00
## Max. :1500466 Max. :22.000 Max. :802.42 Max. :3.00
## NA's :23
## BSDMSVM BSDMSCM
## Min. : 1.000 Min. :1.000
## 1st Qu.: 1.000 1st Qu.:1.000
## Median : 1.000 Median :2.000
## Mean : 1.165 Mean :1.719
## 3rd Qu.: 1.000 3rd Qu.:2.000
## Max. :11.000 Max. :3.000
## NA's :7 NA's :21
Veri seti incelendiğinde cinsiyet değişkeninde 1 tane yanlış girilmiş veri bulunmaktadır (22 olarak girilmiş). Benzer şekilde BSDMSVM’de de 11 olarak girilmiş bir veri bulunmaktadır (veriler 1-4 aralığında olmalı). BSDMPATM’da 23, BSDMSVM’da 7 ve BSDMSCM’de 21 kayıp veri bulunmaktadır.
Bu doğrultuda öncelikle hatalı girilen veriler veri setinden temizlenmeli ya da düzeltilmelidir.
veri <- haven::zap_labels(veri)
veri <- veri %>%
mutate(
BS4GSEX = recode(BS4GSEX, `22` = 2),
BSDMSVM = recode(BSDMSVM, `11` = 1))Bir sonraki adımda kayıp veriler analiz edilmelidir. Bu adımda kaç eksik veri olduğu ve verilerin rastgelelik gösterip göstermediği test edilmelidir.
## IDSTUD BS4GSEX BSMMAT01 BSDMPATM BSDMSVM BSDMSCM
## 0.000000 0.000000 0.000000 7.120743 2.167183 6.501548
Eksik veri oranı %5’in altındaysa kayıp verilerin rastgelelik gösterdiği yorumu yapılabilir ancak üzerindeyse MCAR testi yapılabilir. Bu durumda BSDMSVM değişkeni %5’in aldında oran gösterirken; BSDMPATM ve BSDMSCM bu değerin üzerindedir.
## # A tibble: 1 × 4
## statistic df p.value missing.patterns
## <dbl> <dbl> <dbl> <int>
## 1 94.1 22 6.81e-11 6
MCAR testi sonucunda p değeri 0.05’in altında çıkmıştır. Bu durumda veri setindeki eksik verilerin rastgelelik gösterdiği yani MCAR olduğu söylenemez. Bu bakımdan eksik verileri silmek uygun olmayabilir. Bunun yerine çoklu atama yöntemi kullanılabilir.
#5 farklı veri seti, 50 iterasyon, pmm yöntemi seçildi.
imputed_data <- mice(veri, m = 5, maxit = 50, method = 'pmm', seed = 123)
imputed_data$imp #hangi değişkenlere ne değer atandını gösterir.veri_temiz <- complete(imputed_data, 1) #üretilen verilerden ilkini seçip temiz veri olarak devam edildi.
summary(veri_temiz)## IDSTUD BS4GSEX BSMMAT01 BSDMPATM
## Min. : 10111 Min. :1.000 Min. : 47.88 Min. :1.000
## 1st Qu.: 360421 1st Qu.:1.000 1st Qu.:366.57 1st Qu.:1.000
## Median : 720204 Median :2.000 Median :432.21 Median :1.000
## Mean : 747826 Mean :1.526 Mean :446.86 Mean :1.269
## 3rd Qu.:1125212 3rd Qu.:2.000 3rd Qu.:535.90 3rd Qu.:1.000
## Max. :1500466 Max. :2.000 Max. :802.42 Max. :3.000
## BSDMSVM BSDMSCM
## Min. :1.00 Min. :1.000
## 1st Qu.:1.00 1st Qu.:1.000
## Median :1.00 Median :2.000
## Mean :1.13 Mean :1.749
## 3rd Qu.:1.00 3rd Qu.:2.000
## Max. :3.00 Max. :3.000
## Variable(s) ignored: IDSTUD, BSMMAT01
## ### Frequencies
## #### veri_temiz$BS4GSEX
## **Type:** Numeric
##
## | | Freq | % | % Cum. |
## |----------:|-----:|-------:|-------:|
## | **1** | 153 | 47.37 | 47.37 |
## | **2** | 170 | 52.63 | 100.00 |
## | **Total** | 323 | 100.00 | 100.00 |
##
## #### veri_temiz$BSDMPATM
## **Label:** INDEX STDS POS AFFECT TO MATH (PATM)
## **Type:** Numeric
##
## | | Freq | % | % Cum. |
## |----------:|-----:|-------:|-------:|
## | **1** | 257 | 79.57 | 79.57 |
## | **2** | 45 | 13.93 | 93.50 |
## | **3** | 21 | 6.50 | 100.00 |
## | **Total** | 323 | 100.00 | 100.00 |
##
## #### veri_temiz$BSDMSVM
## **Type:** Numeric
##
## | | Freq | % | % Cum. |
## |----------:|-----:|-------:|-------:|
## | **1** | 286 | 88.54 | 88.54 |
## | **2** | 32 | 9.91 | 98.45 |
## | **3** | 5 | 1.55 | 100.00 |
## | **Total** | 323 | 100.00 | 100.00 |
##
## #### veri_temiz$BSDMSCM
## **Label:** INDEX OF SELF-CONFID LEARNING MATH (SCM)
## **Type:** Numeric
##
## | | Freq | % | % Cum. |
## |----------:|-----:|-------:|-------:|
## | **1** | 155 | 47.99 | 47.99 |
## | **2** | 94 | 29.10 | 77.09 |
## | **3** | 74 | 22.91 | 100.00 |
## | **Total** | 323 | 100.00 | 100.00 |
## Descriptive Statistics
## veri_temiz$BSMMAT01
## Label: 1ST PLAUSIBLE VALUE MATHEMATICS
## N: 323
##
## BSMMAT01
## ------------- ----------
## Mean 446.86
## Std.Dev 119.85
## Min 47.88
## Median 432.21
## Max 802.42
Sonuçlara bakıldığında BSMMAT01 değişkeni dışında tüm değişkenler uygun aralıklarda görünmektedir. BSMMAT01 değişkeni sürekli değişkendir ve ranjı geniştir. Bu bakımdan uç değer olabilir, yorumu makuldur.
Ayrıca Z puan ile BSMMAT01 değişkeni incelenebilir.
## BS4GSEX BSMMAT01 BSDMPATM BSDMSVM BSDMSCM
## 1 -1.05 2.18 -0.47 -0.34 -0.93
## 2 -1.05 1.79 -0.47 -0.34 -0.93
## 3 0.95 2.36 -0.47 -0.34 -0.93
## 4 0.95 2.97 -0.47 -0.34 -0.93
## 5 0.95 -0.61 3.02 -0.34 0.31
## 6 -1.05 -0.61 1.28 -0.34 1.55
##
## Min Max
## -------------- ------- ------
## BS4GSEX -1.05 0.95
## BSDMPATM -0.47 3.02
## BSDMSCM -0.93 1.55
## BSDMSVM -0.34 4.92
## BSMMAT01 -3.33 2.97
Z puanlara bakıldığında BSDMSVM ile BSMMAT01 değişkenlerinde uç değerler olduğu görülmektedir.
## $IDSTUD
## numeric(0)
##
## $BS4GSEX
## numeric(0)
##
## $BSMMAT01
## [1] 802.42009 47.87577
##
## $BSDMPATM
## [1] 3 2 2 3 2 2 2 2 2 3 2 2 3 3 2 2 2 3 2 3 3 3 2 3 2 2 2 2 2 3 2 2 2 2 2 2 2 3
## [39] 2 3 2 2 3 3 2 3 3 2 2 2 3 2 3 2 2 3 2 2 2 2 2 2 2 2 3 2
##
## $BSDMSVM
## [1] 2 2 2 2 2 2 2 3 2 2 3 2 2 2 2 2 2 2 2 2 2 3 2 2 2 3 2 2 2 2 2 2 2 2 2 2 3
##
## $BSDMSCM
## numeric(0)
Not: mahalonobis uzaklığı da hesaplanmaya çalışılmış ancak yapılamamıştır. Bunun sebebi veri setinde yalnızca tek bir sürekli değişkenin yer alması olabilir. Bu nedenle yalnızca z puana göre uç değerler incelenmiştir.
z.veri_temiz <- veri_temiz %>%
select(BS4GSEX, BSDMPATM, BSDMSVM, BSDMSCM, BSMMAT01) %>%
scores(type = "z") %>%
round(2)z_uc_deger <- apply(abs(z.veri_temiz), 1, function(x) any(x > 3))
veri_temiz <- veri_temiz[!z_uc_deger, ]
dim(veri_temiz)## [1] 297 6
Veri setinde 297 veri kalmıştır.
## [1] 0.3236059
## [1] 0.141423
Çaprıklık değeri 0.32 olarak elde edilmiştir. Bu durumda verinin hafif sağa çarpık ve normalliğe yakın olduğu yorumu yapılabilir.
## [1] 2.288213
Çarpıklık katsayısı ve standart hatası oranlandığında 2.29 değeri elde edilmiştir. Bu durumda +- 1.96 sınırı biraz aşılmıştır ve hafif bir normallikten sapma olduğu yorumu yapılabilir.
Verilerin normal dağılımdan anlamlı bir şekilde farklılaşadığı temel hipoteziyle test etmektedir.
##
## Jarque-Bera Normality Test
##
## data: veri_temiz$BSMMAT01
## JB = 5.9964, p-value = 0.04988
## alternative hypothesis: greater
Jarque-bera testi sonuçlarına göre p değeri 0.05 ile tam sınırda kalmaktadır. Teknik olarak normallik sağlanmamaktadır ancak elde edilen diğer kanıtlara ve grafiklere bakılarak normallik kabul edilebilir, yorumu yapılabilir.
Değişkene ait saçılım grafiği incelenerek incelenebilir. Grafikte ovallik olması doğrusal bir ilişkinin olduğunu; yayılan düzensiz bir akışın olması ise doğrusallığın olmadığını göstermektedir.
ggplot(data = veri_temiz, aes(sample = BSMMAT01)) +
geom_qq() +
geom_qq_line(color = "red") +
ggtitle("BSMMAT01") +
theme_minimal()Veriler kategorik olduğundan saçılım grafiklerinde ovallik değil köşelerde yoğunlaşan bir görüntü oluşmaktadır.
| BS4GSEX | BSMMAT01 | BSDMPATM | BSDMSVM | BSDMSCM | |
|---|---|---|---|---|---|
| BS4GSEX | 1.00 | 0.12 | 0.00 | 0.05 | -0.02 |
| BSMMAT01 | 0.12 | 1.00 | -0.17 | -0.05 | -0.51 |
| BSDMPATM | 0.00 | -0.17 | 1.00 | 0.07 | 0.25 |
| BSDMSVM | 0.05 | -0.05 | 0.07 | 1.00 | 0.03 |
| BSDMSCM | -0.02 | -0.51 | 0.25 | 0.03 | 1.00 |
model1 <- lm(BSMMAT01 ~ BS4GSEX + BSDMPATM + BSDMSVM + BSDMSCM, data = veri_temiz)
ols_vif_tol(model1) %>% kable(digits = 2)| Variables | Tolerance | VIF |
|---|---|---|
| BS4GSEX | 1.00 | 1.00 |
| BSDMPATM | 0.94 | 1.07 |
| BSDMSVM | 0.99 | 1.01 |
| BSDMSCM | 0.94 | 1.07 |
Modeldeki tüm değişkenlerin VIF değerleri 5’in altında ve Tolerans değerleri 0.2’nin üzerinde bulunmuştur.Bu nedenle çoklu doğrusal bağlantı sorunu bulunmadığı kabul edilmiştir.
##
## Call:
## lm(formula = BSMMAT01 ~ BS4GSEX + BSDMPATM + BSDMSVM + BSDMSCM,
## data = veri_temiz)
##
## Residuals:
## Min 1Q Median 3Q Max
## -257.27 -66.15 -11.24 70.33 286.68
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 570.382 34.683 16.445 <2e-16 ***
## BS4GSEX 26.096 11.852 2.202 0.0285 *
## BSDMPATM -13.848 17.383 -0.797 0.4263
## BSDMSVM -18.106 20.656 -0.877 0.3814
## BSDMSCM -74.885 7.858 -9.530 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 101.9 on 292 degrees of freedom
## Multiple R-squared: 0.2708, Adjusted R-squared: 0.2609
## F-statistic: 27.12 on 4 and 292 DF, p-value: < 2.2e-16
Çoklu regresyon için cinsiyet, matematiğe değer verme, matematiğe
karşı tutum ve matematik öğrenmede kendine güven değişkenlerinin
matematik başarısını yordayıp yordamadığını belirlemek amacıyla model
kurulmuştur.
Model istatistikleri incelendiğinde, modelin anlamlı olduğu
görülmektedir (F(4, 292) = 27.12, p < .001). Bağımsız değişkenler,
matematik başarısının yaklaşık %27’sini açıklamaktadır(R² = .2708, Adj.
R² = .2609).
Cinsiyet değişkeninin matematik başarısını anlamlı yordadığı
bulunmuştur. Erkek ve kız öğrenciler arasında başarı puanı açısından
anlamlı fark vardır. Matematiğe değer verme değişkeninin matematik
başarısına katkı sağlamadığı görülmüştür. Matematiğe karşı tutum
değişkeninin matematik başarısını anlamlı şekilde yordamadığı
bulunmuştur. Matematik öğrenmede kendine güven değişkeni matematik
başarısının güçlü ve anlamlı bir yordayıcısı olmuştur. Modeldeki en
güçlü yordayıcı olarak öne çıkmaktadır.
##
## Attaching package: 'MASS'
## The following object is masked from 'package:olsrr':
##
## cement
## The following object is masked from 'package:dplyr':
##
## select
## Start: AIC=2751.81
## BSMMAT01 ~ BS4GSEX + BSDMPATM + BSDMSVM + BSDMSCM
##
## Df Sum of Sq RSS AIC
## - BSDMPATM 1 6594 3040691 2750.5
## - BSDMSVM 1 7984 3042080 2750.6
## <none> 3034097 2751.8
## - BS4GSEX 1 50376 3084473 2754.7
## - BSDMSCM 1 943605 3977702 2830.2
##
## Step: AIC=2750.46
## BSMMAT01 ~ BS4GSEX + BSDMSVM + BSDMSCM
##
## Df Sum of Sq RSS AIC
## - BSDMSVM 1 8984 3049676 2749.3
## <none> 3040691 2750.5
## + BSDMPATM 1 6594 3034097 2751.8
## - BS4GSEX 1 50189 3090880 2753.3
## - BSDMSCM 1 1045875 4086566 2836.3
##
## Step: AIC=2749.33
## BSMMAT01 ~ BS4GSEX + BSDMSCM
##
## Df Sum of Sq RSS AIC
## <none> 3049676 2749.3
## + BSDMSVM 1 8984 3040691 2750.5
## + BSDMPATM 1 7595 3042080 2750.6
## - BS4GSEX 1 48065 3097740 2752.0
## - BSDMSCM 1 1052311 4101987 2835.4
##
## Call:
## lm(formula = BSMMAT01 ~ BS4GSEX + BSDMSCM, data = veri_temiz)
##
## Residuals:
## Min 1Q Median 3Q Max
## -254.477 -64.997 -8.855 66.123 289.479
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 538.661 22.928 23.493 <2e-16 ***
## BS4GSEX 25.453 11.825 2.153 0.0322 *
## BSDMSCM -76.626 7.608 -10.072 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 101.8 on 294 degrees of freedom
## Multiple R-squared: 0.2671, Adjusted R-squared: 0.2621
## F-statistic: 53.57 on 2 and 294 DF, p-value: < 2.2e-16
Başlangıçta modele tüm değişkenler dahil edilmişti. Ancak bir önceki
maddede de görüldüğü üzere bazı değişkenler modele katkı
sağlayamamıştır. Bu nedenle aşamalı regresyon sonucunda katkı sağlamayan
değişkenler çıkarılmış ve en iyi model elde edilmiştir.
Sonuçlara göre, cinsiyet ve matematik öğrenmede kendine güven
değişkenleri birlikte matematik başarısını anlamlı şekilde yordamakta ve
diğer değişkenler (matematiğe değer verme ve matematiğe karşı tutum)
modele anlamlı bir katkı sağlamamaktadır.
Model, istatistiksel olarak anlamlıdır (F(2, 294) = 53.57, p <
.001). Modele göre, cinsiyet ve matematik öğrenmede kendine güven
değişkenleri birlikte matematik başarısının yaklaşık %27’sini
açıklamaktadır (R² = .2671, Adj. R² = .2621).Özellikle, matematik
öğrenmede kendine güven değişkeninin matematik başarısına etkisi oldukça
büyüktür.
Aracılık için cinsiyetin kendine güven aracılığıyla matematik başarısını etkileyip etkilemediğine bakılacaktır.
##
## Call:
## lm(formula = BSDMSCM ~ BS4GSEX, data = veri_temiz)
##
## Residuals:
## Min 1Q Median 3Q Max
## -0.6918 -0.6918 -0.6556 0.3444 1.3444
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 1.72793 0.14376 12.02 <2e-16 ***
## BS4GSEX -0.03615 0.09047 -0.40 0.69
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.7794 on 295 degrees of freedom
## Multiple R-squared: 0.000541, Adjusted R-squared: -0.002847
## F-statistic: 0.1597 on 1 and 295 DF, p-value: 0.6897
Cinsiyetin kendine güven üzerinde anlamlı bir etkisi bulunmamaktadır.
Yani kendine güven aracı değişkeni doğrudan cinsiyetten etkilenmiyor.
##
## Call:
## lm(formula = BSMMAT01 ~ BS4GSEX + BSDMSCM, data = veri_temiz)
##
## Residuals:
## Min 1Q Median 3Q Max
## -254.477 -64.997 -8.855 66.123 289.479
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 538.661 22.928 23.493 <2e-16 ***
## BS4GSEX 25.453 11.825 2.153 0.0322 *
## BSDMSCM -76.626 7.608 -10.072 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 101.8 on 294 degrees of freedom
## Multiple R-squared: 0.2671, Adjusted R-squared: 0.2621
## F-statistic: 53.57 on 2 and 294 DF, p-value: < 2.2e-16
Cinsiyet ve kendine güven matematik başarısını anlamlı şekilde
yorduyor. Modele göre birlikte matematik başarısındaki varyansın
yaklaşık %27’sini açıklıyor.
Yani tam bir aracılık yoktur. Ancak cinsiyet ve başarı arasında
doğrudan etki vardır ve kendine güven güçlü bir ek yordayıcıdır.
Peki ya Cinsiyet, kendine güvenin matematik başarısı üzerindeki etkisini değiştiriyor mu? diye sorarak da düzenleyici etkiye bakılabilir.
##
## Call:
## lm(formula = BSMMAT01 ~ BSDMSCM + BS4GSEX + etk, data = veri_temiz)
##
## Residuals:
## Min 1Q Median 3Q Max
## -259.830 -67.042 -6.067 65.536 284.126
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 499.61 44.25 11.291 <2e-16 ***
## BSDMSCM -53.37 23.79 -2.243 0.0256 *
## BS4GSEX 51.74 28.08 1.842 0.0664 .
## etk -15.71 15.23 -1.032 0.3029
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 101.8 on 293 degrees of freedom
## Multiple R-squared: 0.2698, Adjusted R-squared: 0.2623
## F-statistic: 36.08 on 3 and 293 DF, p-value: < 2.2e-16
Her iki değişkenin anlamlı yordayıcılar olduğu bilinmekteydi. Ancak
etkileşim de modele eklendiğinde (özgüven × cinsiyet) matematik
başarısını anlamlı şekilde yordamadığı görülmüştür.
Model genel olarak anlamlı bulunmuştur (F(3, 293) = 36.08, p <
.001) ve açıklanan varyans oranı %27 civarındadır (R² = .2698, Adj. R² =
.2623).
Buna göre, cinsiyetin matematik öğrenmede kendine güven ile mat
ematik başarısı arasındaki ilişkiyi düzenleyici bir etkisi
bulunmamaktadır.