odev_03

1 a. “odev3.xlsx” dosyasını R ortamına aktarınız ve veri setinde eksik veri olup olmadığını kontrol ediniz

library(tidyverse)
library(readxl)
library(kableExtra)
library(ggplot2)
veri <- read_xlsx("~/hacettepe/Rders/data/odev3.xlsx")
any(is.na(veri))

## [1] FALSE

2 b. Cinsiyet ve SES değişkenlerinin kategorilerinde nasıl dağıldığını hem tablo hem de grafikle gösteriniz.

cinsiyet_frekans <- veri %>% 
  group_by(Cinsiyet) %>% 
  summarise(n())
  
ses_frekans <- veri %>% 
  group_by(SES) %>% 
  summarise(n())

cinsiyet_frekans %>% kable()

Cinsiyet	n()
1	257
2	74

ses_frekans %>% kable()

SES	n()
1	18
2	262
3	51

ggplot(veri, aes(x = Cinsiyet)) +
  geom_histogram(fill="orange", color ="black",
             linetype = "dashed") +
  theme_minimal()

ggplot(veri, aes(x = SES)) +
  geom_histogram(fill="blue", color ="black",
             linetype = "dashed") +
  theme_minimal()

3 c. Boyut1 alt boyutunda yer alan maddeler olumsuz maddelerdir, bu maddeleri yeniden kodlayınız.

veri_2 <- veri %>%
  mutate(WV1_duz = 8 - WV1,
         WV2_duz = 8 - WV2,
         WV3_duz = 8 - WV3,
         WV4_duz = 8 - WV4,
         WV5_duz = 8 - WV5,
         WV6_duz = 8 - WV6,
         WV7_duz = 8 - WV7,
         WV8_duz = 8 - WV8,
         WV9_duz = 8 - WV9
         )
head(veri_2$WV1_duz)

## [1] 5 2 7 2 7 2

head(veri_2$WV1)

## [1] 3 6 1 6 1 6

4 d. Boyut1 ve Boyut2 alt boyutunun her ikisi için de toplam puan hesaplayınız. Her iki alt ölçeğin toplam puan dağılımını histogram çizerek gösteriniz.

boyut_1 <- veri_2 %>% select(WV1_duz:WV9_duz)
boyut_2 <- veri_2 %>% select(WV10: WV16)

veri_2 <- veri_2 %>% mutate(boyut_1_top= rowSums(boyut_1))
veri_2<- veri_2 %>% mutate(boyut_2_top= rowSums(boyut_2))



ggplot(veri_2, aes(x = boyut_1_top)) +
  geom_histogram(fill="pink", color ="black",
             linetype = "dashed") +
  theme_minimal()

ggplot(veri_2, aes(x = boyut_2_top)) +
  geom_histogram(fill="yellow", color ="black",
             linetype = "dashed") +
  theme_minimal()

5 e. Boyut2 alt boyutunun toplam puan grafiğine ortalamadan bir dikey referans çizgisi çizdiriniz. Bu çizginin üstüne ortalama değerini yazdırınız. Ayrıca grafiğe ortalamanın bir standart sapma fazlası ve bir standart sapma azı olan noktalarda da birer referans çizgisi ekleyeniz. Bu çizgiler üzerine de açıklama ekleyiniz.

ort <- mean(veri_2$boyut_2_top)
ort

## [1] 33.02719

sd <- sd(veri_2$boyut_2_top)
sd

## [1] 9.831729

sd_1 <- sd - ort
sd_1

## [1] -23.19546

ggplot(veri_2, aes(x = boyut_2_top)) +
  geom_histogram(bins = 30, fill = "blue", linetype= "solid", color="black") + 
  geom_vline(xintercept = 33.02, color = "red", linetype = "dashed") +
  geom_vline(xintercept = 33.02+23.19, color = "green", linetype = "dashed") +
  geom_vline(xintercept = 33.02-23.19, color = "purple", linetype = "dashed") +
  annotate("text", label = expression(mu == 33.02), x = 10, y = 100) +
  papaja::theme_apa()

6 f. Her iki alt boyutu da uç değer açısından değerlendiriniz.

library(outliers)
z_scores <- veri_2 %>%
  select(boyut_2_top) %>% scores(type = "z") %>% round(2)
head(z_scores)

##   boyut_2_top
## 1       -0.10
## 2        0.71
## 3        0.00
## 4        0.61
## 5        0.71
## 6        0.61

Hocam ödevi yaklaşık 90dk’da yaptım Haftasonu şehir dışında arkadaşımın istemesi olucak. Oraya gitmem lazım. O yüzden haftaiçi hızlıca yapmak istedim. Çok özenedim. Önceki derslere de çalışacağım.