Εισαγωγή

Παρουσιάζονται παραδείγματα τεσσάρων τύπων T-test που χρησιμοποιούνται στη βιοστατιστική:

  1. t-test για τη σύγκριση του μέσου όρου ενός δείγματος με μια τιμή στόχο.
  2. t-test για τη σύγκριση του μέσου μεταξύ δύο ανεξάρτητων δειγμάτων
  3. t-test για τη σύγκριση του μέσου μεταξύ δύο εξαρτημένων δειγμάτων
  4. t-test για τη σύγκριση του μέσου μεταξύ δύο ανεξάρτητων δειγμάτων με άνισες διακυμάνσεις

One-Sample T-Test

Το One-Sample T-Test χρησιμοποιείται για να ελεγχθεί εάν ο μέσος όρος του πληθυσμού από τον οποίο προήλθε το δείγμα είναι ίσος με μια καθορισμένη τιμή. Σε αυτό το παράδειγμα, θα αναλύσουμε τις μετρήσεις της αρτηριακής πίεσης 100 ατόμων για να προσδιορίσουμε εάν η μέση αρτηριακή τους πίεση διαφέρει από την τιμή των 120 mmHg.

# Setting the seed for reproducibility
set.seed(45)

# Example data: Blood pressure measurements for 100 individuals (in mmHg)
sample_data <- rnorm(100, mean = 125, sd = 10)

# Hypothesized population mean
mu <- 120

# Checking normality with a histogram
hist(sample_data, main = "Histogram of Blood Pressure Measurements", xlab = "Blood Pressure (mmHg)")

# One-sample t-test
t_result <- t.test(sample_data, mu = mu)
t_result
## 
##  One Sample t-test
## 
## data:  sample_data
## t = 5.125, df = 99, p-value = 1.474e-06
## alternative hypothesis: true mean is not equal to 120
## 95 percent confidence interval:
##  123.5617 128.0620
## sample estimates:
## mean of x 
##  125.8118

Ερμηνεία

Το ιστόγραμμα δείχνει ότι η κατανομή των μετρήσεων της αρτηριακής πίεσης στο δείγμα είναι περίπου κανονική. Το αποτέλεσμα του One-Sample T-Test υποδεικνύει μια στατιστικά σημαντική διαφορά μεταξύ της μέσης αρτηριακής πίεσης του δείγματος (εκτιμώμενη μέση τιμή: 125.8118335) και του υποτιθέμενου μέσου όρου του πληθυσμού (120 mmHg) αφού η τιμή p 1.4740258^{-6} είναι χαμηλότερη από το 0.05. Επομένως, απορρίπτουμε τη μηδενική υπόθεση ότι δεν υπάρχει διαφορά μεταξύ του μέσου όρου του δείγματος και του υποτιθέμενου μέσου όρου του πληθυσμού.

Two-Sample T-Test

Το Two-Sample T-Test χρησιμοποιείται για να ελεγχθεί εάν οι μέσοι όροι δύο ανεξάρτητων ομάδων είναι ίσοι. Σε αυτό το παράδειγμα, θα συγκρίνουμε τη μέση αρτηριακή πίεση δύο ομάδων ατόμων, καπνιστών και μη καπνιστών, για να δούμε εάν υπάρχει σημαντική διαφορά στην αρτηριακή τους πίεση.

# Setting the seed for reproducibility
set.seed(45)

# Example data: Blood pressure measurements for 100 smokers and 100 non-smokers (in mmHg)
smokers_bp <- rnorm(100, mean = 130, sd = 10)
non_smokers_bp <- rnorm(100, mean = 125, sd = 10)


# Checking normality with histograms
#par(mfrow = c(2, 1))
hist(smokers_bp, main = "Histogram of Smokers' Blood Pressure", xlab = "Blood Pressure (mmHg)")

hist(non_smokers_bp, main = "Histogram of Non-Smokers' Blood Pressure", xlab = "Blood Pressure (mmHg)")

# Two-sample t-test
t_result <- t.test(smokers_bp, non_smokers_bp)
t_result
## 
##  Welch Two Sample t-test
## 
## data:  smokers_bp and non_smokers_bp
## t = 4.1666, df = 195.51, p-value = 4.638e-05
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  3.335987 9.332164
## sample estimates:
## mean of x mean of y 
##  130.8118  124.4778

Ερμηνεία

Τα ιστογράμματα δείχνουν ότι η κατανομή των μετρήσεων της αρτηριακής πίεσης τόσο για καπνιστές όσο και για μη καπνιστές είναι περίπου κανονική. Το αποτέλεσμα του Two-Sample T-Test υποδεικνύει μια στατιστικά σημαντική διαφορά μεταξύ της μέσης αρτηριακής πίεσης των καπνιστών (εκτιμώμενη μέση τιμή: 130.8118335) και των μη καπνιστών (εκτιμώμενη μέση τιμή:124.4777582). Με p-value 4.6382596^{-5}, απορρίπτουμε τη μηδενική υπόθεση ότι δεν υπάρχει διαφορά μεταξύ των μέσων των δύο ομάδων.

Two-Sample T-Test (Εναλλακτική παραμετροποίηση)

Ένας εναλλακτικός τρόπος για να εκτελέσετε το Two-Sample T-Test είναι η μια μεταβλητή να περιέχει τις τιμές και μια άλλη μεταβλητή να καθορίζει σε ποια ομάδα ανήκει κάθε τιμή. Ακολουθεί ο τρόπος διεξαγωγής της ίδιας ανάλυσης χρησιμοποιώντας αυτήν την προσέγγιση.

# Combine the data and create a group factor
bp_data <- c(smokers_bp, non_smokers_bp)
bp_group <- factor(c(rep("Smoker", length(smokers_bp)), rep("Non-Smoker", length(non_smokers_bp))))

# Two-sample t-test with alternative parameterization
t_result_alt <- t.test(bp_data ~ bp_group)
t_result_alt
## 
##  Welch Two Sample t-test
## 
## data:  bp_data by bp_group
## t = -4.1666, df = 195.51, p-value = 4.638e-05
## alternative hypothesis: true difference in means between group Non-Smoker and group Smoker is not equal to 0
## 95 percent confidence interval:
##  -9.332164 -3.335987
## sample estimates:
## mean in group Non-Smoker     mean in group Smoker 
##                 124.4778                 130.8118

Ερμηνεία

Το αποτέλεσμα είναι το ίδιο και στις δύο περιπτώσεις.

Paired T-Test

Το Paired T-Test χρησιμοποιείται για να ελεγχθεί εάν οι μέσοι όροι δύο εξαρτημένων ομάδων είναι ίσοι. Σε αυτό το παράδειγμα, θα συγκρίνουμε τη μέση αρτηριακή πίεση 50 ατόμων πριν και μετά από μια παρέμβαση στη διατροφή τους - διάρκειας 6 μηνών - για να δούμε αν οδήγησε σε σημαντική διαφορά στην αρτηριακή τους πίεση.

# Setting the seed for reproducibility
set.seed(45)

# Example data: Blood pressure measurements for 50 individuals before and after a health intervention (in mmHg)
pre_intervention_bp <- rnorm(50, mean = 130, sd = 10)
post_intervention_bp <- pre_intervention_bp + rnorm(50, mean = -5, sd = 5)

# Checking normality with histograms
hist(pre_intervention_bp, main = "Histogram of Pre-Intervention Blood Pressure", xlab = "Blood Pressure (mmHg)")

hist(post_intervention_bp, main = "Histogram of Post-Intervention Blood Pressure", xlab = "Blood Pressure (mmHg)")

# Two-sample paired t-test
t_result <- t.test(pre_intervention_bp, post_intervention_bp, paired = TRUE)
t_result
## 
##  Paired t-test
## 
## data:  pre_intervention_bp and post_intervention_bp
## t = 5.594, df = 49, p-value = 9.817e-07
## alternative hypothesis: true mean difference is not equal to 0
## 95 percent confidence interval:
##  3.059743 6.490559
## sample estimates:
## mean difference 
##        4.775151

Ερμηνεία

Τα ιστογράμματα δείχνουν ότι η κατανομή των μετρήσεων της αρτηριακής πίεσης πριν και μετά την παρέμβαση είναι περίπου κανονική. Το αποτέλεσμα του Paired T-Test υποδεικνύει μια στατιστικά σημαντική διαφορά από το μηδέν (0) της διαφοράς στη μέση αρτηριακή πίεση πριν και μετά από την παρέμβαση (μέση τιμή: 4.7751507). Με μια p-value 9.8166988^{-7}, απορρίπτουμε τη μηδενική υπόθεση ότι δεν υπάρχει διαφορά μεταξύ των μέσων όρων της ομάδας πριν και μετά την αλλαγή στη δίαιτα. Αυτό υποδηλώνει ότι η αλλαγή της δίαιτας είχε σημαντική επίδραση στην αρτηριακή πίεση.

Two-Sample T-Test με άνισες διακυμάνσειςς

Σε περιπτώσεις όπου οι δύο ομάδες που συγκρίνονται έχουν άνισες διακυμάνσεις, θα πρέπει να χρησιμοποιηθεί το Two-Sample T-Test για άνισες διακυμάνσεις, το οποίο αποτελεί μια τροποποιημένη έκδοση του Two-Sample T-Test και δεν απαιτεί ίσες διακυμάνσεις. Σε αυτό το παράδειγμα, θα συγκρίνουμε τη μέση αρτηριακή πίεση δύο ομάδων ατόμων, ανδρών και γυναικών, που έχουν άνισες διακυμάνσεις στις μετρήσεις της αρτηριακής τους πίεσης.

# Setting the seed for reproducibility
set.seed(45)

# Example data: Blood pressure measurements for 100 males and 100 females (in mmHg)
males_bp <- rnorm(100, mean = 130, sd = 10)
females_bp <- rnorm(100, mean = 125, sd = 15)

# Checking normality with histograms
hist(males_bp, main = "Histogram of Males' Blood Pressure", xlab = "Blood Pressure (mmHg)")

hist(females_bp, main = "Histogram of Females' Blood Pressure", xlab = "Blood Pressure (mmHg)")

# Two-sample t-test with unequal variances (Welch's t-test)
t_result <- t.test(males_bp, females_bp, var.equal = FALSE)
t_result
## 
##  Welch Two Sample t-test
## 
## data:  males_bp and females_bp
## t = 3.4797, df = 183.22, p-value = 0.0006273
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##   2.855718 10.334674
## sample estimates:
## mean of x mean of y 
##  130.8118  124.2166

Ερμηνεία

Τα ιστογράμματα δείχνουν ότι η κατανομή των μετρήσεων της αρτηριακής πίεσης τόσο για τους άνδρες όσο και για τις γυναίκες είναι περίπου κανονική. Το αποτέλεσμα του Two-Sample T-Test για άνισες διακυμάνσεις δείχνει μια στατιστικά σημαντική διαφορά μεταξύ της μέσης αρτηριακής πίεσης των ανδρών (εκτιμώμενη μέση τιμή: 130.8118335) και των γυναικών (εκτιμώμενη μέση τιμή: 124.2166373). Με p-value 6.2725835^{-4}, απορρίπτουμε τη μηδενική υπόθεση ότι δεν υπάρχει διαφορά μεταξύ των μέσων όρων των δύο ομάδων. Προφανώς, υπάρχει σημαντική διαφορά στην αρτηριακή πίεση μεταξύ ανδρών και γυναικών.