Paste tıklandığında bize bir syntax ekranı açılır ve analizin kodları gelir
Hocamız yeni bir anlatıma geçerek şöyle dedi: “Peki arkadaşlar sizin veri setinizdeki ortalama acaba Türkiye’yi yansıtıyor mu, yansıtmıyor mu şeklinde bir test yapacak olsaydık ne yapardık?”
Hocamız, One-Sample T-Test’in temel amacını ve kullanım alanlarını da örneklerle açıklamıştır. Bu test, elimizdeki örneklemden elde edilen ortalamanın bilinen bir popülasyon ortalaması veya kabul edilen kritik bir değer ile istatistiksel olarak anlamlı bir fark gösterip göstermediğini test etmek için kullanılır.
Örneğin:
TGSS 2024 veri setindeki boy ortalaması, Türkiye genelindeki yetişkin popülasyonun ortalama boyu olan 170 cm’den farklı mı?
Tıpta ise genel popülasyondaki ortalama kan şekeri değeri ile bizim örneklemimizde ölçülen kan şekeri ortalaması arasında anlamlı bir fark var mı?
Veya belirli bir kritik eşik değerinin (örneğin tehlikeli kabul edilen bir seviyenin) üstünde mi yoksa altında mı diye bakmak isteyebiliriz.
Kısacası, elinizde bilinen bir referans değer (popülasyon ortalaması veya klinik eşik) varsa ve örneklem ortalamanızın bu referans değerden istatistiksel olarak farklı olup olmadığını kontrol etmek istiyorsanız, tam da bu analiz (One-Sample T-Test) kullanılır.
Bu yöntem, hem sosyal bilimlerde hem de tıpta çok sık başvurulan temel bir çıkarımsal istatistik aracıdır.
Hocamız şimdi One-Sample T-Test analizini çalıştırmıştır.
Bu testte:
Test Variable olarak height (boy) değişkenini seçmiş,
Test Value olarak da 170 cm değerini girmiştir.
Amacı, TGSS 2024 veri setindeki örneklem boy ortalamasının (yaklaşık 167.4 cm), bilinen veya hipotetik bir popülasyon ortalaması olan 170 cm’den istatistiksel olarak anlamlı şekilde farklı olup olmadığını test etmektir.
One-Sample T-Test Sonuçları: Boy Ortalamasının 170 cm ile Karşılaştırılması
Örneklem boy ortalaması = 167.43 cm (N = 1701)
Test Value = 170 cm
t = -10.459
Two-Sided p < 0.001 (0.05’ten çok daha küçük)
Bu sonuç, örneklem ortalaması ile test edilen 170 cm arasında istatistiksel olarak anlamlı bir fark olduğunu göstermektedir (p < 0.001).
Hocamızın da belirttiği gibi:“Buradaki anlamlılık değeri 0.05’ten küçük olduğu için, elimdeki örneklem ortalaması ile farazi Türkiye ortalaması (170 cm) arasında istatistiksel olarak anlamlı bir fark vardır.” Kısacası, TGSS 2024’teki katılımcıların ortalama boyu, 170 cm’den anlamlı derecede düşüktür.
Bu aşamada başa Temporary. ekleyip istediğimiz başka kodlamalar yapabiliriz.
Örneğin kadınlar ve erkekleri baz alarak analizi yapalım. Önce erkekleri kıyaslayalım. (Erkek 1 Kadın 2 olarak data setimizde belirlenmiş)
TGSS 2024’teki erkeklerin ortalama boyu, Türkiye’deki yetişkin erkek popülasyonunun kabul edilen ortalaması olan 175 cm’den istatistiksel olarak anlamlı şekilde farklı mıdır? Bu soru One-Sample T-Test ile Syntax kullanılarak test edilecektir.
One-Sample T-Test ile Erkeklerin Boy Ortalamasının Türkiye Popülasyon Ortalaması (175 cm) ile Karşılaştırılması (Syntax Kullanımı)
Tarayıp yeşil play tuşuna basarız.
One-Sample T-Test Sonucunun Yorumu: Küçük Farkın İstatistiksel Anlamlılığı İstatistiki olarak 173 ile 175 arasında çok çok küçük bir fark olmasına rağmen yine de istatistiksel olarak anlamlı bir fark oluştu. Erkeklerin TGSS 2024 veri setindeki ortalama boyu 173.45 cm iken, test edilen popülasyon ortalaması 175 cm idi. Aradaki fark yalnızca yaklaşık 1.55 cm’dir. Ancak örneklem büyüklüğü (N = 873) sayesinde bu küçük fark istatistiksel olarak anlamlı bulunmuştur (p < 0.001).
Bu örnek, çıkarımsal istatistiğin önemli bir özelliğini net bir şekilde göstermektedir: Büyük örneklemlerde çok küçük ortalama farklar bile istatistiksel olarak anlamlı çıkabilir. Bu nedenle anlamlılık (statistical significance) ile pratik önem (practical significance / effect size) mutlaka ayrı ayrı değerlendirilmelidir.
One-Sample T-Test ile Kadınların Boy Ortalamasının Türkiye Popülasyon Ortalaması (162 cm) ile Karşılaştırılması (Syntax Kullanımı)
Kodu kadınlara göre düzenledikten sonra;
Tarayıp yeşil play tuşuna basarız.
One-Sample T-Test ile Kadınların Boy Ortalamasının 162 cm ile Karşılaştırılması Hocamız “Bakın aynı şekilde diyor ki bizim örneklemimizdekiyle Türkiye’deki test değeri (162 cm) arasında 1 cm bile olsa fark buldu. İstatistik olarak farklıdır dedi.” Yani aradaki fark sadece 0.91 cm olmasına rağmen, büyük örneklem büyüklüğü sayesinde bu fark istatistiksel olarak anlamlı bulunmuştur (p < 0.001). Dolayısıyla TGSS 2024’teki kadınların ortalama boyu, test edilen 162 cm değerinden istatistiksel olarak anlamlı derecede düşüktür.
Önce medeni durum (evlilik durumu) gibi çok gruplu bir değişkenle kilo ortalamalarını ANOVA ile yapalım. (Daha önce yapmıştık tekrar hatırlayalım.)
Options’da daha evvel Anova kısmı halen aktif olduğu için direk OK’yi tıklıyoruz.
Sonuç olarak istastistiki olarak anlamlı bir fark görmüştük
Hocamız, az önceki medeni durum (evlilik durumu) gibi çok gruplu bir değişkenle kilo ortalamalarını ANOVA ile incelediklerini hatırlattıktan sonra yeni bir senaryo ortaya koyuyor:“Peki ben tüm grupları değil, sadece içinden iki spesifik grubu karşılaştırmak istiyorum. Örneğin ‘Evli, eşiyle birlikte yaşayan’ ile ‘Evli, eşiyle birlikte ayrı yaşayan’ gruplarının kilo ortalamaları arasında fark var mı?”
Yani değişken birden fazla kategori içerse bile (burada 6 grup var), biz sadece iki belirli kategoriyi seçip aralarında Independent Samples T-Test yapmak istiyoruz.
Bu durumda:
Ardından bu iki grubu seçerek sadece onları analiz edebiliriz.
Böylece çok gruplu bir değişkenden istediğimiz iki alt grubu bağımsız olarak kıyaslayabiliriz.
Continue ve OK tıklandıktan sonra;
Evli Gruplar Arasında Kilo Ortalamalarının Independent Samples T-Test ile Karşılaştırılması (Eşiyle Birlikte Yaşayan vs. Birlikte Yaşamayan)
Evli, eşiyle birlikte yaşayan (N = 1042, Ortalama = 76.52 kg)
Evli, eşiyle birlikte yaşamayan (N = 42, Ortalama = 70.93 kg)
Öncelikle Levene’s Test for Equality of Variances (varyansların homojenliği testi) yapıldı. Test sonucu Sig. = 0.499 > 0.05 çıktığı için iki grubun varyanslarının eşit olduğu kabul edildi.
Bu nedenle “Equal variances assumed” (üst satır) sonucunu kullandık. Bu satırdaki Two-Sided p değeri 0.018 (< 0.05) olarak bulduk.
Sonuç :Evli ve eşiyle birlikte yaşayanlarla, evli olup eşiyle birlikte yaşamayanlar arasında kilo ortalaması bakımından istatistiksel olarak anlamlı bir fark vardır (p = 0.018).
Sorumuz şu: “Acaba kadınlar ve erkekler yapay zekadan haberdar olmak noktasında birbirinden farklı mı değil mi?”
Bu amaçla:
Cinsiyet (kadın / erkek) → kategorik değişken
(gender)
Yapay zekadan haberdar olma durumu (Evet / Hayır) → kategorik
değişken (digaifam)
olduğu için çapraz tablo (Crosstabs) analizi yapacaktır.
Bu analiz, iki kategorik değişken arasındaki ilişkinin hem görsel hem de istatistiksel olarak değerlendirilmesinde kullanılan temel yöntemdir.
İlk önce;
Yapay Zeka Kavramına Haberdarlık Durumunun Genel Frekans Dağılımı Cinsiyet dağılımı veri setinde oldukça dengelidir:
Erkekler %50.9 (1331 kişi) Kadınlar %49.1 (1284 kişi)
“Yapay zeka kavramını daha önce hiç duydunuz mu?” sorusuna valid cevap veren 1724 kişi incelendiğinde şu sonuçlar elde edilmiştir:
Evet, duydum: 1355 kişi → %78.6
Hayır, duymadım: 369 kişi → %21.4
Hocamız özellikle Valid Percent değerlerine dikkat çekmiştir. Çünkü toplam 891 kişi bu soruyu hiç görmemiştir (TGSS araştırmasında kullanılan bir yöntemi nedeniyle farklı katılımcı gruplarına farklı soru setleri gösterilmektedir).
Genel sonuç:TGSS 2024 veri setine göre, soruya cevap veren yetişkinlerin yaklaşık %78.6’sı yapay zeka kavramından haberdar olduğunu belirtirken, %21.4’ü bu kavramı daha önce hiç duymadığını ifade etmiştir.
Bu genel dağılımı gördükten sonra “Şimdi kadınlarla erkekler arasında fark var mı?” sorusuna cevap bulalım