Bagimsiz Orneklem T Testi
Bu çalışmada düzenli egzersiz yapan ve egzersiz yapmayan öğrencilerin stres puanları arasında anlamlı bir fark olup olmadığı incelenmiştir.
Bağımlı değişken: Stres puanı
Bağımsız değişken: Grup
Gruplar: Egzersiz yapanlar ve egzersiz yapmayanlar
Hipotezler
H0: Egzersiz yapan ve egzersiz yapmayan öğrencilerin stres puanı ortalamaları arasında anlamlı bir fark yoktur.
H1: Egzersiz yapan ve egzersiz yapmayan öğrencilerin stres puanı ortalamaları arasında anlamlı bir fark vardır.
Paketlerin Yüklenmesi
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(ggplot2)
library(car)
## Warning: package 'car' was built under R version 4.5.3
## Zorunlu paket yükleniyor: carData
## Warning: package 'carData' was built under R version 4.5.3
##
## Attaching package: 'car'
## The following object is masked from 'package:dplyr':
##
## recode
library(broom)
Veri Setinin Oluşturulması
set.seed(123)
stres_veri <- data.frame(
id = 1:40,
grup = rep(c("egzersiz_yapan", "egzersiz_yapmayan"), each = 20),
stres = c(
rnorm(20, mean = 45, sd = 6),
rnorm(20, mean = 55, sd = 6)
)
)
head(stres_veri)
## id grup stres
## 1 1 egzersiz_yapan 41.63715
## 2 2 egzersiz_yapan 43.61894
## 3 3 egzersiz_yapan 54.35225
## 4 4 egzersiz_yapan 45.42305
## 5 5 egzersiz_yapan 45.77573
## 6 6 egzersiz_yapan 55.29039
Veri Setini İnceleme
glimpse(stres_veri)
## Rows: 40
## Columns: 3
## $ id <int> 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 1…
## $ grup <chr> "egzersiz_yapan", "egzersiz_yapan", "egzersiz_yapan", "egzersiz_…
## $ stres <dbl> 41.63715, 43.61894, 54.35225, 45.42305, 45.77573, 55.29039, 47.7…
Bu bölümde veri setinin kaç satır ve kaç sütundan oluştuğu incelenmiştir.
Eksik Veri Kontrolü
colSums(is.na(stres_veri))
## id grup stres
## 0 0 0
Bu adımda veri setinde eksik değer olup olmadığı kontrol edilmiştir. Eksik veri olmadığı için analize devam edilmiştir.
Grup Değişkeninin Düzenlenmes
stres_veri$grup <- as.factor(stres_veri$grup)
table(stres_veri$grup)
##
## egzersiz_yapan egzersiz_yapmayan
## 20 20
Bu işlemde grup değişkeni kategorik değişken haline getirilmiştir.
Betimsel İstatistikler
stres_istatistik <- stres_veri %>%
group_by(grup) %>%
summarise(
N = n(),
Ortalama = mean(stres),
Standart_Sapma = sd(stres)
)
stres_istatistik
## # A tibble: 2 × 4
## grup N Ortalama Standart_Sapma
## <fct> <int> <dbl> <dbl>
## 1 egzersiz_yapan 20 45.8 5.84
## 2 egzersiz_yapmayan 20 54.7 4.98
Normallik Testi
stres_veri %>%
group_by(grup) %>%
summarise(
shapiro_p = shapiro.test(stres)$p.value
)
## # A tibble: 2 × 2
## grup shapiro_p
## <fct> <dbl>
## 1 egzersiz_yapan 0.725
## 2 egzersiz_yapmayan 0.466
p değerleri 0.05’ten büyük ise grupların normal dağılıma uygun olduğu kabul edilir.
Varyans Homojenliği Testi
leveneTest(stres ~ grup, data = stres_veri)
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 1 0.076 0.7843
## 38
Levene testi sonucunda p değeri 0.05’ten büyükse varyansların homojen olduğu kabul edilir.
Görselleştirme
ggplot(stres_veri, aes(x = grup, y = stres, fill = grup)) +
geom_boxplot(alpha = 0.6) +
geom_jitter(width = 0.1, alpha = 0.6) +
labs(
title = "Gruplara Gore Stres Puanlari",
x = "Grup",
y = "Stres Puani"
) +
theme_minimal()
Grafik incelendiğinde egzersiz yapan öğrencilerin stres puanlarının
egzersiz yapmayan öğrencilere göre daha düşük olduğu görülmektedir.
Bağımsız Örneklem T Testi
t_test_sonuc <- t.test(
stres ~ grup,
data = stres_veri,
var.equal = TRUE
)
t_test_sonuc
##
## Two Sample t-test
##
## data: stres by grup
## t = -5.1547, df = 38, p-value = 8.18e-06
## alternative hypothesis: true difference in means between group egzersiz_yapan and group egzersiz_yapmayan is not equal to 0
## 95 percent confidence interval:
## -12.315466 -5.369962
## sample estimates:
## mean in group egzersiz_yapan mean in group egzersiz_yapmayan
## 45.84974 54.69246
Bu test ile egzersiz yapan ve egzersiz yapmayan öğrencilerin stres puanları karşılaştırılmıştır.
Test Sonucunu Tablo Halinde Gösterimi
t.test(
stres ~ grup,
data = stres_veri,
var.equal = TRUE
) %>%
tidy()
## # A tibble: 1 × 10
## estimate estimate1 estimate2 statistic p.value parameter conf.low conf.high
## <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 -8.84 45.8 54.7 -5.15 0.00000818 38 -12.3 -5.37
## # ℹ 2 more variables: method <chr>, alternative <chr>
tidy() fonksiyonu test sonucunu daha düzenli bir tablo halinde göstermektedir.
Sonuç ve Yorum
Bağımsız örneklem t testi sonucunda p değeri 0.05 anlamlılık düzeyi ile karşılaştırılmıştır. p değeri 0.05’ten küçük ise H0 hipotezi reddedilir ve egzersiz yapan ve egzersiz yapmayan öğrencilerin stres puanları arasında anlamlı bir fark olduğu kabul edilir. p değeri 0.05’ten büyük ise H0 hipotezi reddedilemez ve iki grup arasında anlamlı bir fark olmadığı sonucuna ulaşılır.
Bu sonuçlara göre egzersiz yapma durumunun öğrencilerin stres düzeyleri üzerinde etkili olup olmadığı değerlendirilmiştir.