library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(MASS)
## 
## Attaching package: 'MASS'
## The following object is masked from 'package:dplyr':
## 
##     select
library(lsr)
data("survey")
names(survey)
##  [1] "Sex"    "Wr.Hnd" "NW.Hnd" "W.Hnd"  "Fold"   "Pulse"  "Clap"   "Exer"  
##  [9] "Smoke"  "Height" "M.I"    "Age"
veri_1 <- survey %>% dplyr::select(Sex, Pulse, Age, Exer,Height, Smoke) 
head(veri_1)
##      Sex Pulse    Age Exer Height Smoke
## 1 Female    92 18.250 Some 173.00 Never
## 2   Male   104 17.583 None 177.80 Regul
## 3   Male    87 16.917 None     NA Occas
## 4   Male    NA 20.333 None 160.00 Never
## 5   Male    35 23.667 Some 165.00 Never
## 6 Female    64 21.000 Some 172.72 Never
veri_2<- veri_1 %>% 
  rename(cinsiyet=Sex,
         yas=Age,
         boy=Height,
         sigara=Smoke,
         egzersiz=Exer,
         nabiz=Pulse)
head(veri_2,10)
##    cinsiyet nabiz    yas egzersiz    boy sigara
## 1    Female    92 18.250     Some 173.00  Never
## 2      Male   104 17.583     None 177.80  Regul
## 3      Male    87 16.917     None     NA  Occas
## 4      Male    NA 20.333     None 160.00  Never
## 5      Male    35 23.667     Some 165.00  Never
## 6    Female    64 21.000     Some 172.72  Never
## 7      Male    83 18.833     Freq 182.88  Never
## 8    Female    74 35.833     Freq 157.00  Never
## 9      Male    72 19.000     Some 175.00  Never
## 10     Male    90 22.333     Some 167.00  Never
names(veri_2)
## [1] "cinsiyet" "nabiz"    "yas"      "egzersiz" "boy"      "sigara"
veri_3<-veri_2 %>% 
  mutate(
    cinsiyet = recode(cinsiyet,
                      "Female" = "kadin",
                      "Male" = "erkek"),
    egzersiz = recode(egzersiz, 
                      "None" = "yok",
                      "Some" = "bazen",
                      "Freq" = "sık"),
    sigara = recode(sigara,
                    "Never" = "hic",
                    "Occas" = "ara sira",
                    "Regul" = "duzenli",
                    "Heavy" = "fazla") 
  )
head(veri_3)
##   cinsiyet nabiz    yas egzersiz    boy   sigara
## 1    kadin    92 18.250    bazen 173.00      hic
## 2    erkek   104 17.583      yok 177.80  duzenli
## 3    erkek    87 16.917      yok     NA ara sira
## 4    erkek    NA 20.333      yok 160.00      hic
## 5    erkek    35 23.667    bazen 165.00      hic
## 6    kadin    64 21.000    bazen 172.72      hic
any(is.na(veri_3))
## [1] TRUE
colSums(is.na(veri_3))
## cinsiyet    nabiz      yas egzersiz      boy   sigara 
##        1       45        0        0       28        1
veri_son <- na.omit(veri_3)
ilk_sayi <- nrow(veri_3)
son_sayi <- nrow(veri_son)
fark <- ilk_sayi - son_sayi
print(paste("Baslangictaki gozlem sayisi:", ilk_sayi))
## [1] "Baslangictaki gozlem sayisi: 237"
print(paste("Temizlendikten sonraki gozlem sayisi:", son_sayi))
## [1] "Temizlendikten sonraki gozlem sayisi: 170"
print(paste("Silinen eksik verili satir sayisi:", fark))
## [1] "Silinen eksik verili satir sayisi: 67"

veri_3 setindeki eksik değerler(NA) tespit edilip na.omit komutuyla giderilmiştir.Bunun sonucunda başlangıçta 237 olan gözlem sayısı 170’e inmiştir. Aradaki fakr 67 olup veri setinin temizlenmiş haline veri_son ismi verilmiştir.

summary(veri_son)
##   cinsiyet      nabiz             yas         egzersiz       boy       
##  kadin:85   Min.   : 35.00   Min.   :16.92   sık  :86   Min.   :152.0  
##  erkek:85   1st Qu.: 66.25   1st Qu.:17.67   yok  :14   1st Qu.:165.0  
##             Median : 72.00   Median :18.58   bazen:70   Median :171.0  
##             Mean   : 73.92   Mean   :20.46              Mean   :172.5  
##             3rd Qu.: 80.00   3rd Qu.:20.17              3rd Qu.:180.0  
##             Max.   :104.00   Max.   :70.42              Max.   :200.0  
##       sigara   
##  fazla   :  7  
##  hic     :136  
##  ara sira: 13  
##  duzenli : 14  
##                
## 

Nabız değerleri minimum 35, maksimum 104 atım/dakika arasında değişmekte; 1. çeyrek 66.25, medyan 72, 3. çeyrek 80 ve ortalama nabız 73.92’dir.Yaş dağılımı oldukça geniş olup en küçük 16.92, en büyük 70.42 yaştır; 1. çeyrek 17.67, medyan 18.58, 3. çeyrek 20.17 ve ortalama yaş 20.46’dır (yaş dağılımı sağa çarpıktır, çünkü ortalama medyandan büyüktür).Egzersiz durumu üç kategoride incelenmiş: “yok” yapanlar %14, “bazen” yapanlar %70, “sık” yapanlar %86’dır (bir kişi birden fazla kategori seçmiş olabilir ya da yüzdeler farklı bir temelde hesaplanmış).Boy değerleri minimum 152 cm, maksimum 200 cm’dir; 1. çeyrek 165 cm, medyan 171 cm, 3. çeyrek 180 cm ve ortalama boy 172.5 cm’dir (boy dağılımı yaklaşık simetriktir, ortalama ile medyan birbirine çok yakındır).

veri_son %>%
  group_by(egzersiz) %>%
  summarise(ortalama_nabiz = round(mean(nabiz), 2))
## # A tibble: 3 × 2
##   egzersiz ortalama_nabiz
##   <fct>             <dbl>
## 1 sık                71.4
## 2 yok                75.9
## 3 bazen              76.6

sık yapanlarda ortalama 71.4, bazen yapanlarda 75.9, hiç yapmayanlarda 76.6 atım/dakika; bu, düzenli egzersizin kalbi güçlendirerek dinlenmede daha düşük nabızla yetinmesini sağladığını net bir şekilde gösteriyor.

mean(veri_son$yas)
## [1] 20.46377
median(veri_son$yas)
## [1] 18.583
modeOf(veri_son$yas)
## [1] 17.5

Günlük yaşamda veri toplayıp analiz etmek istediğim durum: Evcil hayvan sahipliği ile bireylerin algıladıkları genel stres seviyesi ve günlük mutluluk seviyeleri arasındaki ilişkiyi incelemek. Amacım, evcil hayvan sahibi olmanın (özellikle kedi/köpek gibi sık etkileşim kurulan hayvanlar), bireyin psikolojik iyi oluşu üzerinde pozitif bir etkisi olup olmadığını görmek.

Kimlerden veri toplanır: Toplumu temsil edebilecek, 18 yaş ve üzeri yetişkin bireylerden veri toplanır. Örneklem grubu, evcil hayvan sahibi olanlar (kedi, köpek vb.) ve evcil hayvan sahibi olmayanlar olarak iki temel kategoriye ayrılır.

##Bu ilişkinin analiz edilebilmesi için şu bilgileri almanın çok anlamlı olacağını düşünüyorum:

Evcil Hayvan Sahipliği Durumu: (Evet/Hayır) - Temel bağımsız değişken.

Algılanan Stres Seviyesi: Son bir ayda ne kadar stresli hissettiklerini gösteren, 1’den 10’a kadar bir ölçekte puan.

Günlük Mutluluk Seviyesi: Gün içinde ne kadar mutlu hissettiklerini gösteren, 1’den 10’a kadar bir ölçekte puan.

Yaş: Demografik değişken.

Cinsiyet: Demografik değişken.

Değişken türleri:

Evcil Hayvan Sahipliği Durumu :Kategorik

Cinsiyet: Kategorik

Algılanan Stres Seviyesi : Ordinal (Sıralı) veya Aralık/Oran (Sürekli) Genellikle istatistiksel analiz kolaylığı için Aralık kabul edilir.

Günlük Mutluluk Seviyesi: Ordinal (Sıralı) veya Aralık/Oran (Sürekli) Stres seviyesi gibi, Aralık kabul edilir.

Yaş :Sürekli/Nicel

Evcil Hayvanla Geçirilen Süre: Sürekli/Nicel

Frekans Tablosu Oluşturulabilecek Üç Değişken :

Evcil Hayvan Sahipliği Durumu (Nominal): Kaç kişinin evcil hayvanı var, kaç kişinin yok?

Cinsiyet (Nominal): Ankete katılanların kaçı Kadın, kaçı Erkek?

Algılanan Stres Seviyesi (Ordinal/Aralık): İnsanların 10 üzerinden hangi stres puanına ne kadar sıklıkta (frekansta) sahip olduğu

Özet İstatistikler (Min, Max, Medyan, Ort. vb.) Hesaplaması Yapılabilecek Üç Değişken

Yaş

Algılanan Stres Seviyesi

Evcil Hayvanla Geçirilen Süre