a. “odev3.xlsx”
dosyasını R ortamına aktarınız ve veri setinde eksik veri olup
olmadığını kontrol ediniz
library(tidyverse)
library(readxl)
library(kableExtra)
library(ggplot2)
veri <- read_xlsx("~/hacettepe/Rders/data/odev3.xlsx")
any(is.na(veri))
## [1] FALSE
b. Cinsiyet ve SES
değişkenlerinin kategorilerinde nasıl dağıldığını hem tablo hem de
grafikle gösteriniz.
cinsiyet_frekans <- veri %>%
group_by(Cinsiyet) %>%
summarise(n())
ses_frekans <- veri %>%
group_by(SES) %>%
summarise(n())
cinsiyet_frekans %>% kable()
ses_frekans %>% kable()
ggplot(veri, aes(x = Cinsiyet)) +
geom_histogram(fill="orange", color ="black",
linetype = "dashed") +
theme_minimal()

ggplot(veri, aes(x = SES)) +
geom_histogram(fill="blue", color ="black",
linetype = "dashed") +
theme_minimal()

c. Boyut1 alt boyutunda
yer alan maddeler olumsuz maddelerdir, bu maddeleri yeniden
kodlayınız.
veri_2 <- veri %>%
mutate(WV1_duz = 8 - WV1,
WV2_duz = 8 - WV2,
WV3_duz = 8 - WV3,
WV4_duz = 8 - WV4,
WV5_duz = 8 - WV5,
WV6_duz = 8 - WV6,
WV7_duz = 8 - WV7,
WV8_duz = 8 - WV8,
WV9_duz = 8 - WV9
)
head(veri_2$WV1_duz)
## [1] 5 2 7 2 7 2
head(veri_2$WV1)
## [1] 3 6 1 6 1 6
d. Boyut1 ve Boyut2 alt
boyutunun her ikisi için de toplam puan hesaplayınız. Her iki alt
ölçeğin toplam puan dağılımını histogram çizerek gösteriniz.
boyut_1 <- veri_2 %>% select(WV1_duz:WV9_duz)
boyut_2 <- veri_2 %>% select(WV10: WV16)
veri_2 <- veri_2 %>% mutate(boyut_1_top= rowSums(boyut_1))
veri_2<- veri_2 %>% mutate(boyut_2_top= rowSums(boyut_2))
ggplot(veri_2, aes(x = boyut_1_top)) +
geom_histogram(fill="pink", color ="black",
linetype = "dashed") +
theme_minimal()

ggplot(veri_2, aes(x = boyut_2_top)) +
geom_histogram(fill="yellow", color ="black",
linetype = "dashed") +
theme_minimal()

e. Boyut2 alt boyutunun
toplam puan grafiğine ortalamadan bir dikey referans çizgisi çizdiriniz.
Bu çizginin üstüne ortalama değerini yazdırınız. Ayrıca grafiğe
ortalamanın bir standart sapma fazlası ve bir standart sapma azı olan
noktalarda da birer referans çizgisi ekleyeniz. Bu çizgiler üzerine de
açıklama ekleyiniz.
ort <- mean(veri_2$boyut_2_top)
ort
## [1] 33.02719
sd <- sd(veri_2$boyut_2_top)
sd
## [1] 9.831729
sd_1 <- sd - ort
sd_1
## [1] -23.19546
ggplot(veri_2, aes(x = boyut_2_top)) +
geom_histogram(bins = 30, fill = "blue", linetype= "solid", color="black") +
geom_vline(xintercept = 33.02, color = "red", linetype = "dashed") +
geom_vline(xintercept = 33.02+23.19, color = "green", linetype = "dashed") +
geom_vline(xintercept = 33.02-23.19, color = "purple", linetype = "dashed") +
annotate("text", label = expression(mu == 33.02), x = 10, y = 100) +
papaja::theme_apa()

f. Her iki alt boyutu
da uç değer açısından değerlendiriniz.
library(outliers)
z_scores <- veri_2 %>%
select(boyut_2_top) %>% scores(type = "z") %>% round(2)
head(z_scores)
## boyut_2_top
## 1 -0.10
## 2 0.71
## 3 0.00
## 4 0.61
## 5 0.71
## 6 0.61
Hocam ödevi yaklaşık 90dk’da yaptım Haftasonu şehir
dışında arkadaşımın istemesi olucak. Oraya gitmem lazım. O yüzden
haftaiçi hızlıca yapmak istedim. Çok özenedim. Önceki derslere de
çalışacağım.