library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(MASS)
##
## Attaching package: 'MASS'
## The following object is masked from 'package:dplyr':
##
## select
library(lsr)
data("survey")
veri_1<-survey %>% dplyr::select(Sex,Age,Pulse,Exer,Height,Smoke)
head(veri_1)
## Sex Age Pulse Exer Height Smoke
## 1 Female 18.250 92 Some 173.00 Never
## 2 Male 17.583 104 None 177.80 Regul
## 3 Male 16.917 87 None NA Occas
## 4 Male 20.333 NA None 160.00 Never
## 5 Male 23.667 35 Some 165.00 Never
## 6 Female 21.000 64 Some 172.72 Never
veri_2<-veri_1 %>% rename(cinsiyet=Sex,yas=Age,nabiz=Pulse,egzersiz=Exer,boy=Height,sigara=Smoke)
head(veri_2)
## cinsiyet yas nabiz egzersiz boy sigara
## 1 Female 18.250 92 Some 173.00 Never
## 2 Male 17.583 104 None 177.80 Regul
## 3 Male 16.917 87 None NA Occas
## 4 Male 20.333 NA None 160.00 Never
## 5 Male 23.667 35 Some 165.00 Never
## 6 Female 21.000 64 Some 172.72 Never
names(veri_2)
## [1] "cinsiyet" "yas" "nabiz" "egzersiz" "boy" "sigara"
head(veri_2,10)
## cinsiyet yas nabiz egzersiz boy sigara
## 1 Female 18.250 92 Some 173.00 Never
## 2 Male 17.583 104 None 177.80 Regul
## 3 Male 16.917 87 None NA Occas
## 4 Male 20.333 NA None 160.00 Never
## 5 Male 23.667 35 Some 165.00 Never
## 6 Female 21.000 64 Some 172.72 Never
## 7 Male 18.833 83 Freq 182.88 Never
## 8 Female 35.833 74 Freq 157.00 Never
## 9 Male 19.000 72 Some 175.00 Never
## 10 Male 22.333 90 Some 167.00 Never
veri_3<-veri_2 %>%
mutate(cinsiyet=recode(cinsiyet,
"Female" = "Kadın",
"Male" = "Erkek"),
egzersiz=recode(egzersiz,
"None" = "Yok",
"Some" = "Bazen",
"Freq" = "Sık"),
sigara=recode(sigara,
"Never" = "Hiç",
"Occas" = "Ara Sıra",
"Regul" = "Düzenli",
"Heavy" = "Fazla"))
head(veri_3)
## cinsiyet yas nabiz egzersiz boy sigara
## 1 Kadın 18.250 92 Bazen 173.00 Hiç
## 2 Erkek 17.583 104 Yok 177.80 Düzenli
## 3 Erkek 16.917 87 Yok NA Ara Sıra
## 4 Erkek 20.333 NA Yok 160.00 Hiç
## 5 Erkek 23.667 35 Bazen 165.00 Hiç
## 6 Kadın 21.000 64 Bazen 172.72 Hiç
any(is.na(veri_3))
## [1] TRUE
colSums(is.na(veri_3))
## cinsiyet yas nabiz egzersiz boy sigara
## 1 0 45 0 28 1
veri_son<-na.omit(veri_3)
#Bu işlem sonucunda 67 tane eksik değerin olduğu ortaya
çıkmıştır.
summary(veri_son$yas)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 16.92 17.67 18.58 20.46 20.17 70.42
#Min: Katılımcılardan en düşük yaşa sahip olan kişinin yaşının 16.92
olduğunu gösterir. #1st Qu: Katılımcıların yaşının %25’inin 17.67’ den
küçük olduğunu gösterir. #Median: Katılan katılımcıların yaşlarının
ortanca değerinin 18.58 olduğunu gösterir. #Mean: Katılan katılımcıların
yaşlarının ortalamasının 20.46 olduğunu gösterir. #3rd Qu:
Katılımcıların yaşlarının %75’inin 20.17’den küçük olduğunu gösterir.
#Max: Katılımcıların en büyük yaşa sahip olan kişinin yaşının 70.42
olduğunu gösterir.
summary(veri_son$nabiz)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 35.00 66.25 72.00 73.92 80.00 104.00
#Min: Katılan katılımcıların en düşük nabıza sahip oolan kişinin
nabzının 35.00 olduğunu gösterir. #1st Qu: Katılımcıların nabzının
%25’inin 66.25’ten küçük olduğunu gösterir. #Mediam: Katılımcıların
nabızlarının ortanca değerinin 72.00 olduğunu gösterir. #Mean:
Katılımcıların nabızlarının ortalamasının 73.92 olduğunu gösterir. #3rd
Qu: Katılımcıların nabızlarının %75’inin 80.00’dan küçük olduğunu
gösterir. #Max: Katılımcıların en yüksek nabıza sahip olan kişinin
nabzının 104.00 olduğunu gösterir.
summary(veri_son$boy)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 152.0 165.0 171.0 172.5 180.0 200.0
#Min: Katılımcıların en kısa boylusunun boyunun 152 cm olduğunu
gösterir. #1st Qu: Katılımcıların boylarının %25’inin 165 cm’den kısa
olduğunu gösterir. #Median: Katılımcıların boylarının ortanca değerinin
171 cm olduğunu gösterir. #Mean: Katılımcıların boylarının ortalamasının
172.5 cm olduğunu gösterir. #3rd Qu: Katılımcıların boylarının %75’inin
180 cm’den kısa olduğunu gösterir. #Max: Katılımcıların en uzun
boylusunun boyunun 200 cm olduğunu gösterir.
veri_son %>% group_by(egzersiz) %>% summarise(ortalama_nabiz=round(mean(nabiz), 2))
## # A tibble: 3 × 2
## egzersiz ortalama_nabiz
## <fct> <dbl>
## 1 Sık 71.4
## 2 Yok 75.9
## 3 Bazen 76.6
#Egzersizi sık yapanların ortalama nabzı 71.43’tür. #Egzersiz
yapmayanların ortalama nabzı 75.86’dır. #Ara sıra egzersiz yapanların
ortalama nabzı 76.59’dur. #Nabız ile egzersiz sıklığı arasında ters
orantı vardır.
mean(veri_son$yas)
## [1] 20.46377
median(veri_son$yas)
## [1] 18.583
modeOf(veri_son$yas)
## [1] 17.5
#Üniveriste öğrencilerinin sınav kaygılarının akademik başarıları
üzerindeki etkisini incelemek. #Bu araştırmanın verileri bir
üniversitenin farklı bölümlerinde okuyan üniversite öğrencilerinden
toplayabiliriz. #Katılan öğrencilerden cinsiyet, bölüm, sınıf düzeyi,
sınav kaygı puanı, günde kaç saat ders çalıştığı gibi bilgileri almak
gerekir. #Bu çalışmada cinsiyet, sınıf düzeyi,sınav kaygı puanı ve
günlük çalışma süreleri değişkenlerini kullanacağım.
veri <- data.frame( cinsiyet = c("Kadın", "Erkek"),sinif_duzeyi = c(1, 2, 3, 4),sinav_kaygi_puani = 1:100, gunluk_calisma_suresi=round(runif(100,min = 0.5,max = 6),1))
table(veri$cinsiyet)
##
## Erkek Kadın
## 50 50
table(veri$sinif_duzeyi)
##
## 1 2 3 4
## 25 25 25 25
table(cut(veri$sinav_kaygi_puani,breaks = seq(0,100,by=10)))
##
## (0,10] (10,20] (20,30] (30,40] (40,50] (50,60] (60,70] (70,80]
## 10 10 10 10 10 10 10 10
## (80,90] (90,100]
## 10 10
table(veri$gunluk_calisma_suresi)
##
## 0.5 0.6 0.7 0.8 0.9 1 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 2 2.1 2.2 2.3 2.4
## 1 1 2 3 2 2 1 2 2 1 1 3 1 3 2 2 1 4 1 2
## 2.5 2.7 2.8 2.9 3 3.1 3.3 3.4 3.5 3.6 3.7 3.8 3.9 4 4.1 4.2 4.3 4.4 4.5 4.6
## 4 3 1 4 1 1 1 5 3 2 1 2 3 3 2 2 1 2 1 1
## 4.7 4.8 4.9 5 5.1 5.2 5.3 5.5 5.6 5.7 5.8
## 2 1 2 1 1 6 1 1 1 2 2
summary(veri$sinif_duzeyi)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 1.00 1.75 2.50 2.50 3.25 4.00
summary(veri$sinav_kaygi_puani)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 1.00 25.75 50.50 50.50 75.25 100.00
summary(veri$gunluk_calisma_suresi)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.500 1.875 3.050 3.105 4.225 5.800