Bagimsiz Orneklem T Testi

Bu çalışmada düzenli egzersiz yapan ve egzersiz yapmayan öğrencilerin stres puanları arasında anlamlı bir fark olup olmadığı incelenmiştir.

Bağımlı değişken: Stres puanı

Bağımsız değişken: Grup

Gruplar: Egzersiz yapanlar ve egzersiz yapmayanlar

Hipotezler

H0: Egzersiz yapan ve egzersiz yapmayan öğrencilerin stres puanı ortalamaları arasında anlamlı bir fark yoktur.

H1: Egzersiz yapan ve egzersiz yapmayan öğrencilerin stres puanı ortalamaları arasında anlamlı bir fark vardır.

Paketlerin Yüklenmesi

library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(ggplot2)
library(car)
## Warning: package 'car' was built under R version 4.5.3
## Zorunlu paket yükleniyor: carData
## Warning: package 'carData' was built under R version 4.5.3
## 
## Attaching package: 'car'
## The following object is masked from 'package:dplyr':
## 
##     recode
library(broom)

Veri Setinin Oluşturulması

set.seed(123)

stres_veri <- data.frame(
  id = 1:40,
  grup = rep(c("egzersiz_yapan", "egzersiz_yapmayan"), each = 20),
  stres = c(
    rnorm(20, mean = 45, sd = 6),
    rnorm(20, mean = 55, sd = 6)
  )
)

head(stres_veri)
##   id           grup    stres
## 1  1 egzersiz_yapan 41.63715
## 2  2 egzersiz_yapan 43.61894
## 3  3 egzersiz_yapan 54.35225
## 4  4 egzersiz_yapan 45.42305
## 5  5 egzersiz_yapan 45.77573
## 6  6 egzersiz_yapan 55.29039

Veri Setini İnceleme

glimpse(stres_veri)
## Rows: 40
## Columns: 3
## $ id    <int> 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 1…
## $ grup  <chr> "egzersiz_yapan", "egzersiz_yapan", "egzersiz_yapan", "egzersiz_…
## $ stres <dbl> 41.63715, 43.61894, 54.35225, 45.42305, 45.77573, 55.29039, 47.7…

Bu bölümde veri setinin kaç satır ve kaç sütundan oluştuğu incelenmiştir.

Eksik Veri Kontrolü

colSums(is.na(stres_veri))
##    id  grup stres 
##     0     0     0

Bu adımda veri setinde eksik değer olup olmadığı kontrol edilmiştir. Eksik veri olmadığı için analize devam edilmiştir.

Grup Değişkeninin Düzenlenmes

stres_veri$grup <- as.factor(stres_veri$grup)

table(stres_veri$grup)
## 
##    egzersiz_yapan egzersiz_yapmayan 
##                20                20

Bu işlemde grup değişkeni kategorik değişken haline getirilmiştir.

Betimsel İstatistikler

stres_istatistik <- stres_veri %>%
  group_by(grup) %>%
  summarise(
    N = n(),
    Ortalama = mean(stres),
    Standart_Sapma = sd(stres)
  )

stres_istatistik
## # A tibble: 2 × 4
##   grup                  N Ortalama Standart_Sapma
##   <fct>             <int>    <dbl>          <dbl>
## 1 egzersiz_yapan       20     45.8           5.84
## 2 egzersiz_yapmayan    20     54.7           4.98

Normallik Testi

stres_veri %>%
  group_by(grup) %>%
  summarise(
    shapiro_p = shapiro.test(stres)$p.value
  )
## # A tibble: 2 × 2
##   grup              shapiro_p
##   <fct>                 <dbl>
## 1 egzersiz_yapan        0.725
## 2 egzersiz_yapmayan     0.466

p değerleri 0.05’ten büyük ise grupların normal dağılıma uygun olduğu kabul edilir.

Varyans Homojenliği Testi

leveneTest(stres ~ grup, data = stres_veri)
## Levene's Test for Homogeneity of Variance (center = median)
##       Df F value Pr(>F)
## group  1   0.076 0.7843
##       38

Levene testi sonucunda p değeri 0.05’ten büyükse varyansların homojen olduğu kabul edilir.

Görselleştirme

ggplot(stres_veri, aes(x = grup, y = stres, fill = grup)) +
  geom_boxplot(alpha = 0.6) +
  geom_jitter(width = 0.1, alpha = 0.6) +
  labs(
    title = "Gruplara Gore Stres Puanlari",
    x = "Grup",
    y = "Stres Puani"
  ) +
  theme_minimal()

Grafik incelendiğinde egzersiz yapan öğrencilerin stres puanlarının egzersiz yapmayan öğrencilere göre daha düşük olduğu görülmektedir.

Bağımsız Örneklem T Testi

t_test_sonuc <- t.test(
  stres ~ grup,
  data = stres_veri,
  var.equal = TRUE
)

t_test_sonuc
## 
##  Two Sample t-test
## 
## data:  stres by grup
## t = -5.1547, df = 38, p-value = 8.18e-06
## alternative hypothesis: true difference in means between group egzersiz_yapan and group egzersiz_yapmayan is not equal to 0
## 95 percent confidence interval:
##  -12.315466  -5.369962
## sample estimates:
##    mean in group egzersiz_yapan mean in group egzersiz_yapmayan 
##                        45.84974                        54.69246

Bu test ile egzersiz yapan ve egzersiz yapmayan öğrencilerin stres puanları karşılaştırılmıştır.

Test Sonucunu Tablo Halinde Gösterimi

t.test(
  stres ~ grup,
  data = stres_veri,
  var.equal = TRUE
) %>%
  tidy()
## # A tibble: 1 × 10
##   estimate estimate1 estimate2 statistic    p.value parameter conf.low conf.high
##      <dbl>     <dbl>     <dbl>     <dbl>      <dbl>     <dbl>    <dbl>     <dbl>
## 1    -8.84      45.8      54.7     -5.15 0.00000818        38    -12.3     -5.37
## # ℹ 2 more variables: method <chr>, alternative <chr>

tidy() fonksiyonu test sonucunu daha düzenli bir tablo halinde göstermektedir.

Sonuç ve Yorum

Bağımsız örneklem t testi sonucunda p değeri 0.05 anlamlılık düzeyi ile karşılaştırılmıştır. p değeri 0.05’ten küçük ise H0 hipotezi reddedilir ve egzersiz yapan ve egzersiz yapmayan öğrencilerin stres puanları arasında anlamlı bir fark olduğu kabul edilir. p değeri 0.05’ten büyük ise H0 hipotezi reddedilemez ve iki grup arasında anlamlı bir fark olmadığı sonucuna ulaşılır.

Bu sonuçlara göre egzersiz yapma durumunun öğrencilerin stres düzeyleri üzerinde etkili olup olmadığı değerlendirilmiştir.