Regresyon Ogrenme Gunlugu

0.1 Veri Seti

data("attitude")
head(attitude)

library(ggplot2)
library(dplyr)

## 
## Attaching package: 'dplyr'

## The following object is masked from 'package:kableExtra':
## 
##     group_rows

## The following objects are masked from 'package:stats':
## 
##     filter, lag

## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union

library(tidyr)

attitude veri seti, bir şirketteki çalışanların memnuniyet düzeyleriyle ilgili tutumlarını ölçmek amacıyla toplanmıştır. *Veri seti, çalışanların şikayetlere verilen yanıtlar, öğrenme fırsatları, maaş artışları ve yöneticilerin tutumları gibi algılarını içeren 7 değişkenden oluştuğu görülmüştür.

1 Kayıp Veri İncelemesi

sum(is.na(attitude))

## [1] 0

Veri setinde kayıp verinin olmadığı görülmüştür.

2 Uç Değer analizi

par(mfrow = c(2, 4))  # 2 satır 4 sütunluk grafik paneli
for (i in 1:ncol(attitude)) {
  boxplot(attitude[, i],
          main = names(attitude)[i],
          col = "lightblue",
          border = "gray40")

}

#Z skorlarının İncelenmesi
z_scores <- scale(attitude)
apply(z_scores, 2, function(x) sum(abs(x) > 3))

##     rating complaints privileges   learning     raises   critical    advance 
##          0          0          0          0          0          0          0

Boxplot garfiğindeki noktalar olası uç değerlerdirlebilir, her değişkenin uç değer durumunu görsel olarak incelenebilir.
Boxplot grafiği ve z skorları incelendiğinde veri setindeki değişkenlerde uç değerlerin yer almadığı söylenebilir.

3 Doğrusallık İncelemesi

library(ggplot2)
library(tidyr)  # pivot_longer için gerekli

# Veriyi uzun formata çevirilmesi
attitude_long <- pivot_longer(attitude,
                              cols = -rating,
                              names_to = "predictor",
                              values_to = "value")

# Facetlerin eklenmesi
ggplot(attitude_long, aes(x = value, y = rating)) +
  geom_point(alpha = 0.7) +
  geom_smooth(method = "lm", se = TRUE, color = "purple") +
  facet_wrap(~ predictor, scales = "free_x") +
  labs(title = "Rating Değişkeni ile Bağımsız Değişkenler Arasındaki  İlişkinin İncelenmesi",
       x = "Bağımsız Değişkenler", y = "Rating") +
  theme_minimal()

## `geom_smooth()` using formula = 'y ~ x'

* Doğrusallık, saçılma grafiği ile incelendiğinde, advance ile rating değişkeni grafiğinin doğrusal dağılmadığı söylenebilir.

complaints değişkeni ile kurulacak modelin iyi sonuçlar vermesi beklenebilir.
Advance ve critical değişkenleri ile rating arasındaki ilişkilerin daha zayıft olduğu söylenebilr. Özellikle critical değişkeninde regresyon çizgisinin neredeyse yatay olduğu söylenebilir.
Elde edilen sonuçlar, attitude veri setinde yer alan bazı bağımsız değişkenlerin (özellikle complaints, learning, raises) çalışan memnuniyetini anlamlı şekilde yordayabilmesi beklenebilir.

4 Varyansların Homojenliğinin İncelenmesi

model2 <- lm(rating ~ complaints + learning + raises, data = attitude)

plot(model2$fitted.values, model2$residuals,
     xlab = "Tahmin Edilen Değerler",
     ylab = "Artıklar",
     main = "Model")
abline(h = 0, col = "red")

Varyansların homojenliği ile ilgili grafik incelendiğinde varyansların homojen dağılmadığı görülmüştür.

5 Betimsel İstatistikler, Normallik Analizi ve Çoklu Bağlantının İncelenmesi

#Betimsel İstatistikler
summary(attitude[, c("rating", "complaints", "learning", "raises")])

##      rating        complaints      learning         raises     
##  Min.   :40.00   Min.   :37.0   Min.   :34.00   Min.   :43.00  
##  1st Qu.:58.75   1st Qu.:58.5   1st Qu.:47.00   1st Qu.:58.25  
##  Median :65.50   Median :65.0   Median :56.50   Median :63.50  
##  Mean   :64.63   Mean   :66.6   Mean   :56.37   Mean   :64.63  
##  3rd Qu.:71.75   3rd Qu.:77.0   3rd Qu.:66.75   3rd Qu.:71.00  
##  Max.   :85.00   Max.   :90.0   Max.   :75.00   Max.   :88.00

#Normallik Analizleri
qqnorm(model2$residuals)
qqline(model2$residuals, col = "red")

#Çoklu Bağlantının İncelenmesi

library(car)

## Loading required package: carData

## 
## Attaching package: 'car'

## The following object is masked from 'package:dplyr':
## 
##     recode

vif(model2)

## complaints   learning     raises 
##   1.983336   1.856191   2.164556

Regresyon modeli kurulması düşünülen değişkenlere ait betimsel istatsitikler incelendiğinde ,dâhil edilen dört temel değişkenin ortalama ve medyan değerleri birbirine oldukça yakındır; bu durum değişkenlerin genel olarak simetrik bir dağılım gösterdiğini ve ciddi bir çarpıklık içermediğini göstermektedir.
Q-Q grafiği incelendiğinde, regresyon modeline ait artıkların büyük bir kısmının teorik normal dağılım doğrusu etrafında kümelendiği söylenebilir.
Complaints, learning, raises değişkenlerinin VIF değerleri incelendiğinde her üç değişkenin değerinin beşten küçük olduğu gözlenmiştir, bu durumda çoklu bağlantının olmadığı söylenebilir.

6 Regresyon Analizi

model2 <- lm(rating ~ complaints + learning + raises, data = attitude)
summary(model2)

## 
## Call:
## lm(formula = rating ~ complaints + learning + raises, data = attitude)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -11.6282  -5.8107   0.5115   6.3946  10.3509 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 10.52260    8.30481   1.267    0.216    
## complaints   0.65349    0.13637   4.792 5.82e-05 ***
## learning     0.22069    0.14967   1.475    0.152    
## raises      -0.02864    0.18245  -0.157    0.876    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 6.943 on 26 degrees of freedom
## Multiple R-squared:  0.7083, Adjusted R-squared:  0.6746 
## F-statistic: 21.04 on 3 and 26 DF,  p-value: 3.957e-07

coef(model2)

## (Intercept)  complaints    learning      raises 
##  10.5226028   0.6534882   0.2206857  -0.0286370

Kesişim ve eğim katsayıları incelendiğinde modelde yer alan üç bağımsız değişkenden yalnızca complaints değişkeni çalışan memnuniyetinin anlamlı bir yordayıcısı olduğu söylenebilir.
Çoklu doğrusal regresyon analizinde, çalışanların genel memnuniyet düzeyini yordamak amacıyla complaints (şikayetlere verilen yanıtlar), learning (öğrenme fırsatları) ve raises (maaş artışları algısı) değişkenleri modele dahil edilmiştir.
Regresyon modeline göre, yalnızca complaints (yönetimin çalışan şikâyetlerine verdiği yanıtlar) değişkeni çalışan memnuniyetinin anlamlı bir yordayıcısı olarak bulunmuştur (\(\beta = 0.65\), p < .001).
Elde dilen bu bulgu, çalışanların memnuniyet düzeylerinin, yöneticilerin sorunlara yanıt verme biçimiyle doğrudan ilişkili olduğunu göstermektedir.
Diğer değişkenler olan learning ve raises modelde yer almasına rağmen, istatistiksel olarak anlamlı yordayıcılar değildir. Bu durum, öğrenme fırsatları ve maaş artışlarının, bu örneklemde memnuniyet üzerinde belirleyici bir etkisinin olmadığını göstermektedir.
Modelin açıklayıcılık gücünün yüksek (\(R^2 = 0.71\)) olması, bağımlı değişken olan rating’in büyük oranda bu değişkenlerle ilişkilendirilebildiğini göstermektedir.

7 Modelin Yol Şeması İle Gösterilmesi

library(lavaan)

## This is lavaan 0.6-19
## lavaan is FREE software! Please report any bugs.

library(semPlot)

# Model 
model_text <- '
  rating ~ complaints + learning + raises
'

# Modeli uygula
fit <- sem(model_text, data = attitude)

# Yol diyagramı
semPaths(fit,
         whatLabels = "std",    
         layout = "tree",       
         edge.label.cex = 1.2,  
         sizeMan = 7,           
         nCharNodes = 0,        
         title = FALSE,         
         edge.color = "black")

* Yol diyagramında, çalışan memnuniyetini anlamlı şekilde yordayan tek değişken complaints olup, bu değişkenin etkisi oldukça güçlüdür (\(\beta = 0.71\)). learning değişkeni zayıf düzeyde etkili iken, raises değişkeninin etkisi göz ardı edilebilir düzeydedir.

DeBruine, L., & Barr, D. (2022). Data skills for reproducible research. Zenodo. https://doi.org/10.5281/zenodo.6527194

R Core Team. (2022). R: A language and environment for statistical computing. R Foundation for Statistical Computing. https://www.R-project.org/

Xie, Y. (2016). Bookdown: Authoring books and technical documents with R markdown. Chapman; Hall/CRC. https://bookdown.org/yihui/bookdown

Xie, Y. (2022). Bookdown: Authoring books and technical documents with r markdown. https://github.com/rstudio/bookdown