library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(MASS)
##
## Attaching package: 'MASS'
## The following object is masked from 'package:dplyr':
##
## select
library(lsr)
data(survey)
names(survey)
## [1] "Sex" "Wr.Hnd" "NW.Hnd" "W.Hnd" "Fold" "Pulse" "Clap" "Exer"
## [9] "Smoke" "Height" "M.I" "Age"
veri1<-survey %>% dplyr::select(Sex, Age,Pulse,Exer, Height,Smoke)
veri2<- veri1 %>%
rename(cinsiyet=Sex , yaş = Age, sigara= Smoke,egzersiz =Exer, nabız= Pulse ,boy= Height)
head(veri2)
## cinsiyet yaş nabız egzersiz boy sigara
## 1 Female 18.250 92 Some 173.00 Never
## 2 Male 17.583 104 None 177.80 Regul
## 3 Male 16.917 87 None NA Occas
## 4 Male 20.333 NA None 160.00 Never
## 5 Male 23.667 35 Some 165.00 Never
## 6 Female 21.000 64 Some 172.72 Never
names(veri2)
## [1] "cinsiyet" "yaş" "nabız" "egzersiz" "boy" "sigara"
head(veri2,10)
## cinsiyet yaş nabız egzersiz boy sigara
## 1 Female 18.250 92 Some 173.00 Never
## 2 Male 17.583 104 None 177.80 Regul
## 3 Male 16.917 87 None NA Occas
## 4 Male 20.333 NA None 160.00 Never
## 5 Male 23.667 35 Some 165.00 Never
## 6 Female 21.000 64 Some 172.72 Never
## 7 Male 18.833 83 Freq 182.88 Never
## 8 Female 35.833 74 Freq 157.00 Never
## 9 Male 19.000 72 Some 175.00 Never
## 10 Male 22.333 90 Some 167.00 Never
veri3<-veri2 %>%
mutate(
cinsiyet=recode(cinsiyet,
"Female" = "Kadın",
"Male" = "Erkek"),
egzersiz = recode(egzersiz,
"None"= "Yok",
"Some"="Bazen",
"Fred"="Sık"),
sigara=recode(sigara,
"Never"="Hiç" ,
"Occas" = "Arasıra",
"Regul"="Düzenli",
"Heavy"="Fazla")
)
head(veri3)
## cinsiyet yaş nabız egzersiz boy sigara
## 1 Kadın 18.250 92 Bazen 173.00 Hiç
## 2 Erkek 17.583 104 Yok 177.80 Düzenli
## 3 Erkek 16.917 87 Yok NA Arasıra
## 4 Erkek 20.333 NA Yok 160.00 Hiç
## 5 Erkek 23.667 35 Bazen 165.00 Hiç
## 6 Kadın 21.000 64 Bazen 172.72 Hiç
any(is.na(veri3))
## [1] TRUE
colSums(is.na(veri3))
## cinsiyet yaş nabız egzersiz boy sigara
## 1 0 45 0 28 1
veri_son<- na.omit(veri3)
###Cinsiyet değişkeninde sadece bir kişide eksik değer gözlemlenmektedir, kolayca temizlenebilir.
###Yaş değişkeninde eksik veri bulunmamakla beraber güvnlidir.
###Nabızda oldukça eksik değer görülmesinden kaynaklı ortaya çıkan analiz sonuçlarını etkileyebilir.
###Egzersiz ,direk kullanılabilir.
###Boy verisinde nabıza göre çok fazla bir eksiklik görülmemektedir.
###Sigarada ise kayıp değer çok düşük olduğundan kaynaklı değer kolayca temizlenebilir.
summary(veri_son)
## cinsiyet yaş nabız egzersiz boy
## Kadın:85 Min. :16.92 Min. : 35.00 Freq :86 Min. :152.0
## Erkek:85 1st Qu.:17.67 1st Qu.: 66.25 Yok :14 1st Qu.:165.0
## Median :18.58 Median : 72.00 Bazen:70 Median :171.0
## Mean :20.46 Mean : 73.92 Mean :172.5
## 3rd Qu.:20.17 3rd Qu.: 80.00 3rd Qu.:180.0
## Max. :70.42 Max. :104.00 Max. :200.0
## sigara
## Fazla : 7
## Hiç :136
## Arasıra: 13
## Düzenli: 14
##
##
veri_son %>%
group_by(egzersiz) %>%
summarise(ortalama_nabız_=round(mean(nabız),2))
## # A tibble: 3 × 2
## egzersiz ortalama_nabız_
## <fct> <dbl>
## 1 Freq 71.4
## 2 Yok 75.9
## 3 Bazen 76.6
Egzersiz yapmayanlarda ortalam nabız :75.86
Bazen egzersiz yapanların nabız ortalaması:76.59
sık egzersiz yapanlarda ortalam nabız :71.43
mean(veri_son$yaş)
## [1] 20.46377
modeOf(veri_son$yaş)
## [1] 17.5
median(veri_son$yaş)
## [1] 18.583