library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(MASS)
##
## Attaching package: 'MASS'
## The following object is masked from 'package:dplyr':
##
## select
library(lsr)
data("survey")
names(survey)
## [1] "Sex" "Wr.Hnd" "NW.Hnd" "W.Hnd" "Fold" "Pulse" "Clap" "Exer"
## [9] "Smoke" "Height" "M.I" "Age"
veri_1 <- survey %>% dplyr::select(Sex, Pulse, Age, Exer,Height, Smoke)
head(veri_1)
## Sex Pulse Age Exer Height Smoke
## 1 Female 92 18.250 Some 173.00 Never
## 2 Male 104 17.583 None 177.80 Regul
## 3 Male 87 16.917 None NA Occas
## 4 Male NA 20.333 None 160.00 Never
## 5 Male 35 23.667 Some 165.00 Never
## 6 Female 64 21.000 Some 172.72 Never
veri_2<- veri_1 %>%
rename(cinsiyet=Sex,
yas=Age,
boy=Height,
sigara=Smoke,
egzersiz=Exer,
nabiz=Pulse)
head(veri_2,10)
## cinsiyet nabiz yas egzersiz boy sigara
## 1 Female 92 18.250 Some 173.00 Never
## 2 Male 104 17.583 None 177.80 Regul
## 3 Male 87 16.917 None NA Occas
## 4 Male NA 20.333 None 160.00 Never
## 5 Male 35 23.667 Some 165.00 Never
## 6 Female 64 21.000 Some 172.72 Never
## 7 Male 83 18.833 Freq 182.88 Never
## 8 Female 74 35.833 Freq 157.00 Never
## 9 Male 72 19.000 Some 175.00 Never
## 10 Male 90 22.333 Some 167.00 Never
names(veri_2)
## [1] "cinsiyet" "nabiz" "yas" "egzersiz" "boy" "sigara"
veri_3<-veri_2 %>%
mutate(
cinsiyet = recode(cinsiyet,
"Female" = "kadin",
"Male" = "erkek"),
egzersiz = recode(egzersiz,
"None" = "yok",
"Some" = "bazen",
"Freq" = "sık"),
sigara = recode(sigara,
"Never" = "hic",
"Occas" = "ara sira",
"Regul" = "duzenli",
"Heavy" = "fazla")
)
head(veri_3)
## cinsiyet nabiz yas egzersiz boy sigara
## 1 kadin 92 18.250 bazen 173.00 hic
## 2 erkek 104 17.583 yok 177.80 duzenli
## 3 erkek 87 16.917 yok NA ara sira
## 4 erkek NA 20.333 yok 160.00 hic
## 5 erkek 35 23.667 bazen 165.00 hic
## 6 kadin 64 21.000 bazen 172.72 hic
any(is.na(veri_3))
## [1] TRUE
colSums(is.na(veri_3))
## cinsiyet nabiz yas egzersiz boy sigara
## 1 45 0 0 28 1
veri_son <- na.omit(veri_3)
ilk_sayi <- nrow(veri_3)
son_sayi <- nrow(veri_son)
fark <- ilk_sayi - son_sayi
print(paste("Baslangictaki gozlem sayisi:", ilk_sayi))
## [1] "Baslangictaki gozlem sayisi: 237"
print(paste("Temizlendikten sonraki gozlem sayisi:", son_sayi))
## [1] "Temizlendikten sonraki gozlem sayisi: 170"
print(paste("Silinen eksik verili satir sayisi:", fark))
## [1] "Silinen eksik verili satir sayisi: 67"
summary(veri_son)
## cinsiyet nabiz yas egzersiz boy
## kadin:85 Min. : 35.00 Min. :16.92 sık :86 Min. :152.0
## erkek:85 1st Qu.: 66.25 1st Qu.:17.67 yok :14 1st Qu.:165.0
## Median : 72.00 Median :18.58 bazen:70 Median :171.0
## Mean : 73.92 Mean :20.46 Mean :172.5
## 3rd Qu.: 80.00 3rd Qu.:20.17 3rd Qu.:180.0
## Max. :104.00 Max. :70.42 Max. :200.0
## sigara
## fazla : 7
## hic :136
## ara sira: 13
## duzenli : 14
##
##
veri_son %>%
group_by(egzersiz) %>%
summarise(ortalama_nabiz = round(mean(nabiz), 2))
## # A tibble: 3 × 2
## egzersiz ortalama_nabiz
## <fct> <dbl>
## 1 sık 71.4
## 2 yok 75.9
## 3 bazen 76.6
mean(veri_son$yas)
## [1] 20.46377
median(veri_son$yas)
## [1] 18.583
modeOf(veri_son$yas)
## [1] 17.5
##Bu ilişkinin analiz edilebilmesi için şu bilgileri almanın çok anlamlı olacağını düşünüyorum: