library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(MASS)
## 
## Attaching package: 'MASS'
## The following object is masked from 'package:dplyr':
## 
##     select
library(lsr)
data(survey)
names(survey)
##  [1] "Sex"    "Wr.Hnd" "NW.Hnd" "W.Hnd"  "Fold"   "Pulse"  "Clap"   "Exer"  
##  [9] "Smoke"  "Height" "M.I"    "Age"
veri1<-survey %>% dplyr::select(Sex, Age,Pulse,Exer, Height,Smoke)
veri2<- veri1 %>% 
  rename(cinsiyet=Sex , yaş = Age, sigara= Smoke,egzersiz =Exer, nabız= Pulse ,boy= Height)
head(veri2)
##   cinsiyet    yaş nabız egzersiz    boy sigara
## 1   Female 18.250    92     Some 173.00  Never
## 2     Male 17.583   104     None 177.80  Regul
## 3     Male 16.917    87     None     NA  Occas
## 4     Male 20.333    NA     None 160.00  Never
## 5     Male 23.667    35     Some 165.00  Never
## 6   Female 21.000    64     Some 172.72  Never
names(veri2)
## [1] "cinsiyet" "yaş"      "nabız"    "egzersiz" "boy"      "sigara"
head(veri2,10)
##    cinsiyet    yaş nabız egzersiz    boy sigara
## 1    Female 18.250    92     Some 173.00  Never
## 2      Male 17.583   104     None 177.80  Regul
## 3      Male 16.917    87     None     NA  Occas
## 4      Male 20.333    NA     None 160.00  Never
## 5      Male 23.667    35     Some 165.00  Never
## 6    Female 21.000    64     Some 172.72  Never
## 7      Male 18.833    83     Freq 182.88  Never
## 8    Female 35.833    74     Freq 157.00  Never
## 9      Male 19.000    72     Some 175.00  Never
## 10     Male 22.333    90     Some 167.00  Never
veri3<-veri2 %>% 
mutate(
 cinsiyet=recode(cinsiyet,
                  "Female" = "Kadın",
                  "Male" = "Erkek"),
 egzersiz = recode(egzersiz,
      "None"= "Yok",
      "Some"="Bazen",
      "Fred"="Sık"),
 sigara=recode(sigara,
                  "Never"="Hiç" ,
                  "Occas" = "Arasıra",
                  "Regul"="Düzenli",
                  "Heavy"="Fazla")
)
head(veri3)
##   cinsiyet    yaş nabız egzersiz    boy  sigara
## 1    Kadın 18.250    92    Bazen 173.00     Hiç
## 2    Erkek 17.583   104      Yok 177.80 Düzenli
## 3    Erkek 16.917    87      Yok     NA Arasıra
## 4    Erkek 20.333    NA      Yok 160.00     Hiç
## 5    Erkek 23.667    35    Bazen 165.00     Hiç
## 6    Kadın 21.000    64    Bazen 172.72     Hiç
any(is.na(veri3))
## [1] TRUE
colSums(is.na(veri3))
## cinsiyet      yaş    nabız egzersiz      boy   sigara 
##        1        0       45        0       28        1
veri_son<- na.omit(veri3)

###Cinsiyet değişkeninde sadece bir kişide eksik değer gözlemlenmektedir, kolayca temizlenebilir.

###Yaş değişkeninde eksik veri bulunmamakla beraber güvnlidir.

###Nabızda oldukça eksik değer görülmesinden kaynaklı ortaya çıkan analiz sonuçlarını etkileyebilir.

###Egzersiz ,direk kullanılabilir.

###Boy verisinde nabıza göre çok fazla bir eksiklik görülmemektedir.

###Sigarada ise kayıp değer çok düşük olduğundan kaynaklı değer kolayca temizlenebilir.

summary(veri_son)
##   cinsiyet       yaş            nabız         egzersiz       boy       
##  Kadın:85   Min.   :16.92   Min.   : 35.00   Freq :86   Min.   :152.0  
##  Erkek:85   1st Qu.:17.67   1st Qu.: 66.25   Yok  :14   1st Qu.:165.0  
##             Median :18.58   Median : 72.00   Bazen:70   Median :171.0  
##             Mean   :20.46   Mean   : 73.92              Mean   :172.5  
##             3rd Qu.:20.17   3rd Qu.: 80.00              3rd Qu.:180.0  
##             Max.   :70.42   Max.   :104.00              Max.   :200.0  
##      sigara   
##  Fazla  :  7  
##  Hiç    :136  
##  Arasıra: 13  
##  Düzenli: 14  
##               
## 
veri_son %>% 
  group_by(egzersiz) %>% 
  summarise(ortalama_nabız_=round(mean(nabız),2))
## # A tibble: 3 × 2
##   egzersiz ortalama_nabız_
##   <fct>              <dbl>
## 1 Freq                71.4
## 2 Yok                 75.9
## 3 Bazen               76.6

Egzersiz yapmayanlarda ortalam nabız :75.86

Bazen egzersiz yapanların nabız ortalaması:76.59

sık egzersiz yapanlarda ortalam nabız :71.43

mean(veri_son$yaş)
## [1] 20.46377
modeOf(veri_son$yaş)
## [1] 17.5
median(veri_son$yaş)
## [1] 18.583

Günlük hayatta sosyal medya kullanımıyla ilgili bir analiz yapmak isterser eğer burda öncelikle kimlerden ve toplyacağımız katagoriyi belirlemkle başlamlıyız .

bu çalışmada sosyal çevremizden yola çıkarak öğrencilerden :sosyal mdeyanın ders, sosyal çevre ve duygu durumuna etkisini görmek için yola çıkabiliriz

bu sosyal medya kullananları aynı zamanda cinsiyet ,yaş,eğitim ve meslek durumları şeklindede katagorize edebiliriz hangi grupta daha çok sosyal medyanın yaygın olduğu ile ilgili

Davranışsal verileride değerlendiricek olursak günde kaç kere uygulamayı kontrol ettikleri ,kaç saat süre ile bu etkileşimde bulunduları ve hangi sosyal medya platfromunda daha çok zaman geçirdikleri gözlemlenebilir.

Freans tablosu oluştururken ise ele alınabilecek temel etkenler günlük sosyla medya kullanım süreleri, en ço kullanılan sosyal medya platformları,gün içerisinde sosyal medyaya giriş sıklıkları değelendirilebilir.

Günde ortalama olarak ekran süresinin kaç saat açık kaldığı hesaplanabilir min ve max kaç saat yada kaç dk ekrana bağlılık süreleri olduğu incelenebilir .Ve çoğunlukla hangi platformlar daha dikkat çekicidir gözlemlenebilir.