HLM; gözlemlerin belirli bir hiyerarşik yapı içinde kümelendiği veriyi analiz etmek için kullanılır.
Neden kullanılır;
Gözlemlerin bağımsızlığı varyansını yönetmesi, Varyans ayrıştırması Eğimlerin değişkenliği
Gözlemsel Birimler: Düzey 1 (L1): Belli koşullar altında elde edilen en alt birim ölçümleri.
Deneysel Birimler: Düzey 2 (L2): Gruplama faktörünün düzeyleri (Gruplar, okullar veya tekrarlı ölçümlerde bireyler).
Gözlemsel birimlerdeki ölçümler, her bir deneysel birimin içinde birbiriyle ilişkilidir; yani bağımsız değildir.
Analizdeki İndeksler; i indeksi: Düzey 1 birimlerini temsil eder.
j indeksi: Düzey 2 birimlerini temsil eder.
Düzey 1’de i indeksi, düzey 2’de j indeksi kullanılacaktır. j. okuldaki i. öğrenciden bahsedilir.
Yij: j. okuldaki i. öğrencinin puanı
Wj: j. okulun bir özelliğine ilişkin puan
Boylamsal Veri (Longitudinal Data) Örneği;
Tekrarlı ölçüm çalışmalarında:
Düzey 1 (t indeksi): Zaman içindeki ölçümler. Düzey 2 (i indeksi): Bireyler. Özet: i. öğrenci için t. zamanındaki puan.
Üç Düzeyli Yapı Örneği
Düzey 1: Zaman (Ölçümler) Düzey 2: Öğrenciler Düzey 3: Okullar
Puanlar öğrenciler içinde, öğrenciler ise okullar içinde yuvalanmıştır.
Düzey 1’de t indeksi, düzey 2’de i indeksi kullanılacaktır. i. öğrenci için t. puandan bahsedilir.
Geleneksel Yaklaşımın Problemleri;
Şu durumlarda geleneksel yaklaşım problem yaşar; veri dengeli değilse, veri içinde kayıp puanlar varsa, yuvalanmış yapı 2 düzeyden fazlaysa.
Üst Düzeyde Toplama (Aggregation) problemi; bilgi ve güç kaygı, katsayıların yanlış yorumlanması (Ekolojik yanılgı)
Alt Düzeye Yayma (Disaggregation); Grup özelliklerini (L2) her bir bireye (L1) kopyalanır. Gözlemlerin bağımsızlığı varsayımı ağır şekilde ihlal edilir ve standart hatalar olduğundan küçük tahmin edilerek hatalı anlamlılık sonuçları üretilir.
HLM iki farklı veri yapısı için kullanılır;
Bağlamsal Modeller (Contextual Models): Düzey 1 birey düzeyine, Düzey 2 ise grup (örn. okul, sınıf) düzeyine karşılık gelir.
Büyüme Modelleri (Growth Models): Düzey 1 tekrarlı ölçümlere (zaman), Düzey 2 ise birey düzeyine karşılık gelir.
Her iki modelde de bağımlı değişken her zaman düzey 1’de bulunur.
Neden Kullanılır?
• Veri birden fazla düzeye (kümelenmeye) sahipse. • Veride farklı düzeylere ait karma değişkenler bulunuyorsa. • Gruplardaki gözlem sayıları birbirinden farklıysa (dengesiz veri). • Bir regresyon ilişkisi (eğim) gruptan gruba değişkenlik gösteriyorsa.
Temel Mantık 1. Düzey 1’de her bir grup için ayrı bir regresyon eşitliği oluşturur. 2. Regresyon eşitliğinin parametrelerinin (kesişim ve eğim katsayıları) Düzey 2 birimlerinde (gruplar arasında) değişkenlik göstermesine izin verir. 3. Düzey 2 değişkenlerini, Düzey 1 parametrelerindeki bu varyansı (farklılaşmayı) açıklamak için kullanır. 4. Düzeyler içindeki ve düzeyler arasındaki ana etkilerin ve etkileşim (kesişim) etkilerinin test edilmesine olanak tanır.
Basit Doğrusal Regresyon ve Merkezleme Yordayıcı değişkenin (X) sıfır olması pratikte anlamsız olduğundan merkezleme işlemi yapılır. Yordayıcı değişkenin her bir değerinden aynı sabit değer (genellikle genel ortalama - grand mean) çıkarılır.
Merkezleme Sonrası Yorum (Örnek): • β0: Ortalama matematik başarı puanı (Yani, SES değeri tam ortalamada olan bir öğrencinin yordanan matematik başarısı). • β1: SES değerindeki bir birimlik değişime karşılık matematik başarı puanındaki değişim.
J Sayıda Okuldaki İlişkinin Modellenmesi
Her okulun (j) kendine ait bir kesişim (β0j) ve eğim (β1j) katsayısı vardır. Bu katsayıların evrendeki (popülasyondaki) dağılımları şu şekildedir:
• E(β0j)=γ0: Okul evreni için ortalama kesişim katsayısı • Var(β0j)=τ00: Kesişim katsayılarının evren varyansı • E(β1j)=γ1: Okul evreni için ortalama eğim katsayısı • Var(β1j)=τ11: Eğim katsayılarının evren varyansı • Cov(β0j,β1j)=τ10: Kesişim ve eğim katsayıları arasındaki kovaryans
Bu aşamada β0j ve β1j katsayıları birer bağımlı değişken haline gelir ve Düzey 2 yordayıcıları (W) ile modellenir.
β0j=γ00+γ01Wj+u0j β1j=γ10+γ11Wj+u1j
Örnek (Okul Türü Etkisi): • γ00: Devlet okulları için yordanan ortalama matematik başarısı. • γ01: Özel ve devlet okulları arasındaki yordanan ortalama matematik başarısı farkı. • γ10: Devlet okulları için yordanan SES-başarı eğimi. • γ11: Özel ve devlet okulları arasında yordanan SES-başarı eğimi farkı. • u0j: Wj sabit tutulduğunda j okulunun kesişim üzerindeki kendine özgü etkisi (hata). • u1j: Wj sabit tutulduğunda j okulunun eğim üzerindeki kendine özgü etkisi (hata).
Rastgele Etkiler ANOVA (Boş Model / Null Model) Bu, analiz sürecinin başlangıç noktasıdır. Modele hiçbir yordayıcı (bağımsız) değişken eklenmez.
Popülerlik puanlarındaki toplam varyansı “Sınıflar Arası” ve “Sınıf İçi” (bireysel) olarak ikiye böler. “Sınıflar arasında anlamlı bir fark var mı?”
Rastgele Katsayı Modeli (Random-Coefficient Model) Bu aşamada modele 1. düzeyden (öğrenci düzeyi) bir değişken (örneğin Cinsiyet) eklenir.
Her sınıfın ortalaması farklı olabilir (Rastgele Kesişim).
Cinsiyetin popülerlik üzerindeki etkisi her sınıfta farklı olabilir (Rastgele Eğim).
“Kız ve erkek öğrenciler arasındaki popülerlik farkı, sınıftan sınıfa değişiyor mu?”
Cinsiyetin sınıflar arasındaki “değişken etkisini” (varyansını) görürüz.
Kesişim ve Eğimin Bağımlı Olduğu Model (Intercept and Slopes as Outcomes)
Bu, analizin açıklayıcı aşamasıdır. Artık sınıflar arasındaki farkın “nedenini” sorgularız ve 2. düzeye bir değişken (örneğin Öğretmen Deneyimi) ekleriz.
İkinci düzeydeki bir değişkenin, birinci düzeydeki katsayıları nasıl etkilediğine bakar.
“Deneyimli öğretmenler, sınıftaki genel popülerliği ve cinsiyetler arası farkı nasıl etkiliyor?”
Çapraz Düzey Etkileşimi: Öğretmen deneyiminin, sınıflar arası popülerlik farklarının ne kadarını açıkladığını buluruz.
Çok Düzeyli Modellerde Merkezleme Özellikle IQ, Yaş veya SES gibi “sıfır” değeri olmayan veya anlamsız olan değişkenleri yorumlanabilir yapmak için kullanılır.
Grup-Ortalamasında Merkezleme (Group-Mean Centering): Her öğrencinin puanından, kendi sınıfının/okulunun ortalaması çıkarılır.
Genel-Ortalamada Merkezleme (Grand-Mean Centering): Her öğrencinin puanından, tüm veri setinin (evrenin) ortalaması çıkarılır.
Hiyerarşik Lineer Modeller (Hierarchical Linear Models - HLM)
Veriler hiyerarşik veya iç içe geçmiş (nested) bir yapıdadır.
Örnek: Öğrenci,Sınıfın içinde; Sınıf,Okulun içinde.
Geleneksel Yöntemlerdeki Sorunlar
Aggregation Bias (Toplulaştırma Yanlılığı): Değişkenlerin farklı düzeylerde farklı anlamlara gelmesi.
Hatalı Tahmin Edilen Kesinlik: Standart hatalar olduğundan küçük tahmin edilir (bu da Tip 1 hata riskini artırır).
Analiz Birimi Sorunu: Analizin öğrenci düzeyinde mi yoksa okul düzeyinde mi yapılacağı karmaşası.
HLM’nin 3 Temel Amacı:
Bireysel etkilerin daha iyi tahmin edilmesi: Küçük örneklemli gruplarda, tüm örneklemden “güç ödünç alarak” (shrinkage) daha güvenilir tahminler elde etmek (Empirical Bayes tahmini).
Çapraz düzeylerin (cross-level) etkilerinin modellenmesi: Bir düzeydeki değişkenin, başka bir düzeyde gerçekleşen bir ilişkiyi nasıl etkilediğinin test edilmesi.
Varyans-Kovaryans Bileşenlerinin Ayrıştırılması: Toplam varyansın ne kadarının birey (gruplar içi), ne kadarının okul (gruplar arası) kaynaklı olduğunun belirlenmesi.
Model Parametreleri ve Tahmin Yöntemleri
Temel Tanımlar:
Intercept (Kesişim - beta_0): x=0 olduğunda Y’nin aldığı değer.Eğim (Slope - beta_1): x’deki her 1 birimlik artışın Y’de yarattığı değişim.
İki Düzeyli HLM’de Tahmin Edilen 3 Parametre:
Sabit etkiler (Fixed effects)
Rastgele düzey 1 katsayıları (Random coefficients)
Varyans-kovaryans bileşenleri
Sabit Etkiler: En uygun şekilde ağırlıklandırılarak hesaplanır. Genelleştirilmiş En Küçük Kareler (GLS) yöntemi kullanılır. Örneklemi büyük, varyansı küçük olan (yani kesinliği yüksek) gruba öncelik verir.
Empirical Bayes ve Shrinkage: Eğer bir okulun örneklemi (N) küçükse, o okulun tahmini genel ortalamaya veya modelin tahmin ettiği değere doğru daraltılır (shrinkage). Bu, beklenen hata kareler ortalamasını minimize eden en optimal yaklaşımdır.
Varyans-Kovaryans Bileşenleri (MLF - MLR): Bu bileşenler Maximum Likelihood (ML) ile tahmin edilir.
MLF (Full ML): Sabit etkilerin kesin bilindiği varsayılır.
MLR (Restricted ML): Sabit etkilerin bilinmediği ve tahmin edilmesi gerektiğini hesaba katar. Düzey-2 örneklem küçükse (N < 30-50) bu tercih edilmelidir.Hesaplamalar için EM Algoritması veya Fisher Scoring gibi ardışık yaklaşım algoritmaları kullanılır.
Hipotez Testi ve Model Yapısı
Sabit Etkiler: Tekil parametreler için t-testi, çoklu parametreler için genel doğrusal hipotez veya Olabilirlik Oranı (Likelihood Ratio) testleri kullanılır.
Varyans Bileşenleri: “Bu regresyon eğimi okullar arasında anlamlı bir şekilde değişiyor mu?” sorusuna yanıt aranır. Ki-kare testleri veya Deviance testleri kullanılır.
Yordayıcı değişkenler farklı hiyerarşik düzeylerde olduğunda, bağımlı değişkendeki varyansı analiz etmek için kullanılan sıradan En Küçük Kareler (OLS) regresyonu yetersiz kalır.
Hiyerarşik Yapı Örneği:
Veri yapısı en alt düzeyden yukarıya doğru şu şekilde sıralanır:
Düzey 4: Ülke (l) Düzey 3: Okul (k) Düzey 2: Sınıf (j) Düzey 1: Öğrenci (i)
Bağımlı değişken ve ona ait yordayıcılar Düzey 1’ dedir.
HLM analizi boylamsal veri için de kullanılabilir.
Aynı anda hem gruplar arası hem grup içi değişkenliği analiz etme imkanı verir.
Bu bölüm basit regresyon örneği ile başlıyor. Tek bir okul içindeki öğrenci Sosyoekonomik Statüsü (SES) ile matematik başarısı arasındaki ilişkiyi ele alır. Standart bir OLS regresyonunda kesişim (intercept-β0), SES’in sıfır olduğu durumdaki beklenen başarıyı; eğim (slope-β1) ise SES’teki bir birimlik artışın başarıya etkisini gösterir.
Model iki okula genişletildiğinde, kesişimlerdeki farklılıklar okulların “etkililiğini” (effectiveness), eğimlerdeki (SES-başarı ilişkisinin gücü) farklılıklar ise okulların “eşitlikçiliğini” (equity) temsil eder.
Araştırmacı bu modeli j sayıda okuldan oluşan bir evrene genişlettiğinde, artık kesişimler ve eğimler sabit sayılar değil, okullar arasında iki değişkenli normal dağılıma (bivariate normal distribution) sahip rastgele değişkenler haline gelir: β0j ve β1j.
Geleneksel regresyon burda hatalı hale gelir çünkü aynı okuldaki öğrencilerin hataları birbirine bağımlı hale gelir ve hata varyansları eşitlik (homoscedasticity) varsayımını ihlal eder.
One-Way ANOVA with Random Effects
En basit hiyerarşik doğrusal model, rastgele etkili tek yönlü ANOVA ile eşdeğerdir.
Hiçbir yordayıcının olmadığı, sadece kesişimlerin gruplar arası rastgele değiştiği en temel modeldir. Düzey-1 (grup içi) ve Düzey-2 (gruplar arası) varyanslarını ayrıştırır ve başarıdaki farklılıkların ne kadarının okullar arasında olduğunu gösteren Sınıfiçi Korelasyon Katsayısı’nı (Intraclass Correlation Coefficient - ICC) hesaplamamızı sağlar.
Random-Coefficients Regression Model Hem kesişimin hem de Düzey-1 eğimlerinin gruplar arası rastgele değişmesine izin verilir, ancak Düzey-2 yordayıcıları henüz modele eklenmez (Düzey-2’de koşulsuz model)
Intercepts- and Slopes-as-Outcomes Eğimin ve kesişimin, Düzey-2’deki değişkenlerle (okul özellikleri) açıklandığı tam HLM modelidir. Okulların (düzey-2 birimleri) hangi özellikleri, neden bazı okulların diğerlerinden daha yüksek ortalamalara sahip olduğunu ve neden bazı okulların diğerlerinden daha büyük SES etkilerine sahip olduğunu yordamaya yardımcı olur.
X ve W’nun yerini seçme (Merkezleme)
Doğal Metrik (Natural Metric): Orijinal ölçek olduğu gibi bırakılır.Eğer yordayıcının (X) sıfır değeri gerçek hayatta karşılığı olmayan bir değerse kesişim parametresi tamamen anlamsız ve yorumlanamaz hale gelir.
Genel Ortalama Merkezlemesi (Grand-Mean Centering): Her puandan tüm örneklemin ortalaması çıkarılır. Kesişim (beta_0j), o grup için “düzeltilmiş ortalama” (adjusted mean) haline gelir. Farklı grupları “ortalama bir birey” üzerinden kıyaslamamızı sağlar.
Grup Ortalaması Merkezlemesi (Group-Mean Centering): Her puandan kendi grubunun ortalaması çıkarılır.Kesişim (beta_0j), grubun yalın ortalaması (unadjusted mean) olur. Bu yöntemle Düzey-1’deki bireysel etkiyi, Düzey-2’deki grup etkisinden tamamen ayrıştırırız. Bireyin kendi grubu içindeki göreli konumu ile ilgileniyorsak bu yöntem seçilir.
İkili (Dummy) Değişkenlerde Merkezleme: Cinsiyet (0=Erkek, 1=Kadın) gibi değişkenlerde merkezleme yapmak. Örneğin; Cinsiyet genel ortalamada merkezlenirse, kesişim (beta_0j) o okulun cinsiyete göre düzeltilmiş başarı puanını verir.
Bu hafta hiyerarşik lineer modellere giriş yaptık, ama ne giriş:) Modele hiç değişken eklemeden sadece varyansa bakmanın önemini ve buna göre de analiz yapmanın gerekli olup olmadığına karar verileceğini anladım. Formüldeki indisleri hala çözmeye çalışıyorum. Merkezlemenin gerekliliğini ve yöntemlerini öğrendim. Hiyerarşik modellerin kavramsal derinliğini anlamakta gerçekten zorlandım. Bu hafta sadece teoriyi kafamda oturtmaya çalışıyorum. Uygulama haftaya olacak, belki modelleri tek tek kurup çıktıları tek tek yorumlayınca her şey daha somutlaşabilir. Bu konu henüz benim için sisli…