Bu haftaki konumuz Hiyerarşik Lojistik Modeller yani Çok Düzeyli Regresyon :)
İlk olarak gerekli olabilecek kütüphaneleri çağırıyorum.
library(tidyverse)
## Warning: package 'ggplot2' was built under R version 4.5.3
## Warning: package 'dplyr' was built under R version 4.5.3
## ── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
## ✔ dplyr 1.2.1 ✔ readr 2.1.6
## ✔ forcats 1.0.1 ✔ stringr 1.6.0
## ✔ ggplot2 4.0.2 ✔ tibble 3.3.0
## ✔ lubridate 1.9.4 ✔ tidyr 1.3.1
## ✔ purrr 1.2.0
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag() masks stats::lag()
## ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors
library(sjmisc)
## Warning: package 'sjmisc' was built under R version 4.5.3
##
## Attaching package: 'sjmisc'
##
## The following object is masked from 'package:purrr':
##
## is_empty
##
## The following object is masked from 'package:tidyr':
##
## replace_na
##
## The following object is masked from 'package:tibble':
##
## add_case
library(car)
## Zorunlu paket yükleniyor: carData
##
## Attaching package: 'car'
##
## The following object is masked from 'package:dplyr':
##
## recode
##
## The following object is masked from 'package:purrr':
##
## some
library(lme4)
## Zorunlu paket yükleniyor: Matrix
##
## Attaching package: 'Matrix'
##
## The following objects are masked from 'package:tidyr':
##
## expand, pack, unpack
library(broom)
## Warning: package 'broom' was built under R version 4.5.3
Derste yapılan analizlerin benzerlerini popular2 veri seti üzerinden tekrarlamaya çalışacağım.
Veri setini aktarayım.
library(haven)
popular2 <- read_sav("C:/Users/ibrahim/Desktop/OLC733/popular2.sav")
Sorular:
Sınıflara göre dışadönüklük puanları ne kadar farklılık gösterir?
Öğrencilerin dışadönüklük puanları ile popülerlik puanları arasındaki ilişkinin gücü tüm sınıflarda benzer midir?
Dışadönüklük puanları yüksek olan sınıfların popülerlik puanları da mı yüksektir?
Cinsiyete göre ortalama popülerlik düzeyi kontrol altına alındıktan sonra dışadönüklük puanları ve popülerlik ilişkisi açısından nasıl karşılaştırılır?
mod01 <- lmer (extrav ~ 1 + (1|class),data=popular2)
summary(mod01)
## Linear mixed model fit by REML ['lmerMod']
## Formula: extrav ~ 1 + (1 | class)
## Data: popular2
##
## REML criterion at convergence: 6217.2
##
## Scaled residuals:
## Min 1Q Median 3Q Max
## -3.7836 -0.7205 -0.0244 0.7499 3.1571
##
## Random effects:
## Groups Name Variance Std.Dev.
## class (Intercept) 0.4178 0.6464
## Residual 1.1796 1.0861
## Number of obs: 2000, groups: class, 100
##
## Fixed effects:
## Estimate Std. Error t value
## (Intercept) 5.21439 0.06909 75.47
Toplam dışadönüklük puanının varyansının %25 inin sınıflar arasındaki farklılıklardan kaynaklandığı görülmektedir.
Sınıf (0.41/(0.41+1.17))=0.25
mod01 %>% S()
## Linear mixed model fit by REML
## Call: lmer(formula = extrav ~ 1 + (1 | class), data = popular2)
##
## Estimates of Fixed Effects:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) 5.21439 0.06909 75.47 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Estimates of Random Effects (Covariance Components):
## Groups Name Std.Dev.
## class (Intercept) 0.6464
## Residual 1.0861
##
## Number of obs: 2000, groups: class, 100
##
## logLik df AIC BIC
## -3108.59 3 6223.19 6239.99
Olası değerler aralığı 5.21 +-1.96*karekök(0.41)= (3.96, 6.41)
Değerler 3.96 ile 6.41 değerleri arasında dağılmaktadır.
mod1_s1 <- lm(extrav~1, data=popular2)
anova(mod01, mod1_s1)
## refitting model(s) with ML (instead of REML)
## Data: popular2
## Models:
## mod1_s1: extrav ~ 1
## mod01: extrav ~ 1 + (1 | class)
## npar AIC BIC logLik -2*log(L) Chisq Df Pr(>Chisq)
## mod1_s1 2 6610.7 6621.9 -3303.4 6606.7
## mod01 3 6219.7 6236.5 -3106.8 6213.7 393.03 1 < 2.2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Sınıflar arasındaki dışadönüklük puanlarında anlamlı farklılıklar mevcuttur ve bu farklılıklar rastgele etkiler modeli tarafından başarıyla yakalanmaktadır (p<0.001).
mod02 <- lmer(popular ~ Cextrav + (1|class), data= popular2)
summary(mod02)
## Linear mixed model fit by REML ['lmerMod']
## Formula: popular ~ Cextrav + (1 | class)
## Data: popular2
##
## REML criterion at convergence: 5832.6
##
## Scaled residuals:
## Min 1Q Median 3Q Max
## -3.0644 -0.7267 0.0165 0.7088 3.3587
##
## Random effects:
## Groups Name Variance Std.Dev.
## class (Intercept) 0.8406 0.9168
## Residual 0.9304 0.9646
## Number of obs: 2000, groups: class, 100
##
## Fixed effects:
## Estimate Std. Error t value
## (Intercept) 5.07824 0.09421 53.90
## Cextrav 0.48631 0.02015 24.13
##
## Correlation of Fixed Effects:
## (Intr)
## Cextrav 0.000
mod02 %>% S
## Linear mixed model fit by REML
## Call: lmer(formula = popular ~ Cextrav + (1 | class), data = popular2)
##
## Estimates of Fixed Effects:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) 5.07824 0.09421 53.90 <2e-16 ***
## Cextrav 0.48631 0.02015 24.13 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Estimates of Random Effects (Covariance Components):
## Groups Name Std.Dev.
## class (Intercept) 0.9168
## Residual 0.9646
##
## Number of obs: 2000, groups: class, 100
##
## logLik df AIC BIC
## -2916.32 4 5840.64 5863.04
mod03 <- lmer(popular ~ Cextrav + (Cextrav |class), data=popular2)
summary(mod03)
## Linear mixed model fit by REML ['lmerMod']
## Formula: popular ~ Cextrav + (Cextrav | class)
## Data: popular2
##
## REML criterion at convergence: 5779.4
##
## Scaled residuals:
## Min 1Q Median 3Q Max
## -3.1961 -0.7291 0.0146 0.6816 3.2217
##
## Random effects:
## Groups Name Variance Std.Dev. Corr
## class (Intercept) 0.89178 0.9443
## Cextrav 0.02599 0.1612 -0.88
## Residual 0.89492 0.9460
## Number of obs: 2000, groups: class, 100
##
## Fixed effects:
## Estimate Std. Error t value
## (Intercept) 5.03127 0.09702 51.86
## Cextrav 0.49286 0.02546 19.36
##
## Correlation of Fixed Effects:
## (Intr)
## Cextrav -0.552
mod03 %>% S()
## Linear mixed model fit by REML
## Call: lmer(formula = popular ~ Cextrav + (Cextrav | class), data = popular2)
##
## Estimates of Fixed Effects:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) 5.03127 0.09702 51.86 <2e-16 ***
## Cextrav 0.49286 0.02546 19.36 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Estimates of Random Effects (Covariance Components):
## Groups Name Std.Dev. Corr
## class (Intercept) 0.9443
## Cextrav 0.1612 -0.88
## Residual 0.9460
##
## Number of obs: 2000, groups: class, 100
##
## logLik df AIC BIC
## -2889.70 6 5791.39 5825.00
mod04 <- lmer(popular ~ Cextrav +
Zextrav + sex +
Cextrav: Zextrav+
Cextrav:sex +
(1+Cextrav | class), data=popular2)
## fixed-effect model matrix is rank deficient so dropping 1 column / coefficient
S(mod04)
## Linear mixed model fit by REML
## Call: lmer(formula = popular ~ Cextrav + Zextrav + sex + Cextrav:Zextrav +
## Cextrav:sex + (1 + Cextrav | class), data = popular2)
##
## Estimates of Fixed Effects:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) 4.37059 0.08662 50.458 <2e-16 ***
## Cextrav 0.41740 0.02743 15.220 <2e-16 ***
## sex 1.24543 0.03648 34.136 <2e-16 ***
## Cextrav:Zextrav 0.02647 0.01086 2.438 0.0148 *
## Cextrav:sex 0.04671 0.03001 1.556 0.1197
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Estimates of Random Effects (Covariance Components):
## Groups Name Std.Dev. Corr
## class (Intercept) 0.8204
## Cextrav 0.1587 -0.71
## Residual 0.7436
##
## Number of obs: 2000, groups: class, 100
##
## logLik df AIC BIC
## -2438.51 9 4895.03 4945.44
summary(mod04)
## Linear mixed model fit by REML ['lmerMod']
## Formula: popular ~ Cextrav + Zextrav + sex + Cextrav:Zextrav + Cextrav:sex +
## (1 + Cextrav | class)
## Data: popular2
##
## REML criterion at convergence: 4877
##
## Scaled residuals:
## Min 1Q Median 3Q Max
## -3.02276 -0.64877 -0.00704 0.67905 3.11580
##
## Random effects:
## Groups Name Variance Std.Dev. Corr
## class (Intercept) 0.67299 0.8204
## Cextrav 0.02519 0.1587 -0.71
## Residual 0.55289 0.7436
## Number of obs: 2000, groups: class, 100
##
## Fixed effects:
## Estimate Std. Error t value
## (Intercept) 4.37059 0.08662 50.458
## Cextrav 0.41740 0.02743 15.220
## sex 1.24543 0.03648 34.136
## Cextrav:Zextrav 0.02647 0.01086 2.438
## Cextrav:sex 0.04671 0.03001 1.556
##
## Correlation of Fixed Effects:
## (Intr) Cextrv sex Cxtr:Z
## Cextrav -0.371
## sex -0.211 -0.067
## Cxtrv:Zxtrv -0.118 0.018 -0.009
## Cextrav:sex -0.010 -0.574 0.028 -0.088
## fit warnings:
## fixed-effect model matrix is rank deficient so dropping 1 column / coefficient
Bu ders gözetmenlik haftasına geldiği için derse yüz yüze katılamamıştım. Fakat kayıtlardan dinleyerek ödevi yapmaya çalıştım. Konunun mantığının genel olarak zihnimde oturduğunu düşünüyorum. Analizleri yüzeysel olarak yaptım. Geçen dönemki R dersini düşündüğümde çok temel şeyleri yaparken (veri setini yüklemek) nasıl kaygılandığımı hatırlıyorum. Şu an ise ileri düzey analizleri kodlar aracılığıyla hızlıca yazdırabiliyoruz. Bu sefer de bu analizleri yorumlamak ve hangi sorunun cevabı için hangisini uygulamak gerektiğini öğrenme imkanı buluyoruz. Bu derste yüksek lisans öğrenimimdeki istatistik bilgilerinin tekrar üzerinden geçilmeye ne kadar muhtaç olduğunu daha da iyi anlıyorum. Dersi açık ve anlaşılır bir şekilde anlattığınız ve eksikliklerimizi fark etmemizi sağladığınız için teşekkür ederim Kübra hocam.