library(tidyverse)
library(openintro)
library(dplyr)
library(palmerpenguins)
data("penguins")
Değişkenlerin Türkçeye Çevirilmesi
penguins_turkce <- penguins %>% rename( gaga_uzunlugu=bill_length_mm,gaga_derinligi=bill_depth_mm,yuzgec_uzunlugu=flipper_length_mm, vucut_kutlesi=body_mass_g,cinsiyet=sex, yil=year, tur=species, ada=island)
boş verilerin silinmesi
penguins_yeni <- na.omit(penguins_turkce)
bmi değişkeninin girilmesi
penguins_yeni<- penguins_yeni %>% mutate(bmi= vucut_kutlesi/yuzgec_uzunlugu)
bmi değernin tur değişkeninde incelenmesi
bmi_ist<- penguins_yeni %>% group_by(tur) %>%
summarise(ortalama = mean(bmi), standart_sapma= sd(bmi), minimum= min(bmi), maksimum= max(bmi))
bmi_ist
## # A tibble: 3 × 5
## tur ortalama standart_sapma minimum maksimum
## <fct> <dbl> <dbl> <dbl> <dbl>
## 1 Adelie 19.5 2.18 15.2 25.3
## 2 Chinstrap 19.0 1.60 14.1 22.9
## 3 Gentoo 23.4 1.88 19.0 28.5
#gaga uzunluğu ile gaga derinliği arasındaki ilişki
gaga_cor<- cor(penguins_yeni$gaga_uzunlugu, penguins_yeni$gaga_derinligi)
gaga_cor
## [1] -0.2286256
ggplot(penguins_yeni, aes(x = gaga_uzunlugu, y = gaga_derinligi))+
geom_point()+
geom_smooth(method="lm", se=FALSE)
## `geom_smooth()` using formula = 'y ~ x'
#Gaga uzunluğu ile gaga derinliği arasında düşük düzeyde negatif yönde
bir ilişki olduğu analiz edilmiştir (r= -0.2286256)
penguins_yeni %>% group_by(tur)
## # A tibble: 333 × 9
## # Groups: tur [3]
## tur ada gaga_uzunlugu gaga_derinligi yuzgec_uzunlugu vucut_kutlesi
## <fct> <fct> <dbl> <dbl> <int> <int>
## 1 Adelie Torgersen 39.1 18.7 181 3750
## 2 Adelie Torgersen 39.5 17.4 186 3800
## 3 Adelie Torgersen 40.3 18 195 3250
## 4 Adelie Torgersen 36.7 19.3 193 3450
## 5 Adelie Torgersen 39.3 20.6 190 3650
## 6 Adelie Torgersen 38.9 17.8 181 3625
## 7 Adelie Torgersen 39.2 19.6 195 4675
## 8 Adelie Torgersen 41.1 17.6 182 3200
## 9 Adelie Torgersen 38.6 21.2 191 3800
## 10 Adelie Torgersen 34.6 21.1 198 4400
## # ℹ 323 more rows
## # ℹ 3 more variables: cinsiyet <fct>, yil <int>, bmi <dbl>
ggplot(penguins_yeni, aes(x = gaga_uzunlugu, y=gaga_derinligi, color=tur)) +
geom_point()+
geom_smooth(method="lm", se=FALSE) +
facet_wrap(~ tur)
## `geom_smooth()` using formula = 'y ~ x'
adelie<- penguins_yeni %>% filter(tur == "Adelie")
model_adelie<- lm(gaga_derinligi ~ gaga_uzunlugu, data = adelie)
summary(model_adelie)
##
## Call:
## lm(formula = gaga_derinligi ~ gaga_uzunlugu, data = adelie)
##
## Residuals:
## Min 1Q Median 3Q Max
## -2.1487 -0.7926 -0.0842 0.5550 3.4990
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 11.48771 1.37010 8.385 4.23e-14 ***
## gaga_uzunlugu 0.17668 0.03521 5.018 1.51e-06 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 1.129 on 144 degrees of freedom
## Multiple R-squared: 0.1489, Adjusted R-squared: 0.1429
## F-statistic: 25.18 on 1 and 144 DF, p-value: 1.515e-06
chinstrap<- penguins_yeni %>% filter(tur == "Chinstrap")
model_chinstrap<- lm(gaga_derinligi ~ gaga_uzunlugu, data = chinstrap)
summary(model_chinstrap)
##
## Call:
## lm(formula = gaga_derinligi ~ gaga_uzunlugu, data = chinstrap)
##
## Residuals:
## Min 1Q Median 3Q Max
## -2.65742 -0.46033 -0.01862 0.61473 1.69801
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 7.56914 1.55053 4.882 6.99e-06 ***
## gaga_uzunlugu 0.22221 0.03168 7.015 1.53e-09 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.8659 on 66 degrees of freedom
## Multiple R-squared: 0.4271, Adjusted R-squared: 0.4184
## F-statistic: 49.21 on 1 and 66 DF, p-value: 1.526e-09
gentoo<- penguins_yeni %>% filter(tur == "Gentoo")
model_gentoo<- lm(gaga_derinligi ~ gaga_uzunlugu, data = gentoo)
summary(model_gentoo)
##
## Call:
## lm(formula = gaga_derinligi ~ gaga_uzunlugu, data = gentoo)
##
## Residuals:
## Min 1Q Median 3Q Max
## -1.57143 -0.52974 -0.04479 0.45417 2.96109
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 5.1210 1.0583 4.839 4.02e-06 ***
## gaga_uzunlugu 0.2076 0.0222 9.352 7.34e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.7491 on 117 degrees of freedom
## Multiple R-squared: 0.4277, Adjusted R-squared: 0.4229
## F-statistic: 87.45 on 1 and 117 DF, p-value: 7.337e-16
#Adelie, Chinstrap ve Gentoo penguen türleri üzerinde yapılan regresyon analizleri sonucunda, her üç türde de gaga uzunluğunun gaga derinliği üzerinde anlamlı ve pozitif bir yordayıcı etkiye sahip olduğu belirlenmiştir (p < 0.001). Gaga uzunluğundaki bir birimlik artışın, gaga derinliğinde sırasıyla Adelie türünde 0.18 mm, Chinstrap türünde 0.22 mm, Gentoo türünde ise 0.21 mm’lik bir artışla ilişkili olduğu görülmüştür. Modelin açıklayıcılık gücü (R²) açısından değerlendirildiğinde, Adelie türü daha düşük bir orana (%14.9) sahipken, Chinstrap ve Gentoo türlerinde bu oran yaklaşık %42 düzeyindedir. Bu durum, Chinstrap ve Gentoo türlerinde gaga uzunluğu ile gaga derinliği arasında daha güçlü bir ilişki bulunduğunu göstermektedir. Üç model de genel olarak anlamlıdır ve gaga uzunluğu, gaga derinliği üzerindeki varyansın anlamlı bir kısmını açıklamaktadır.
#Her penguen türünde (Adelie, Chinstrap, Gentoo), gaga uzunluğu ile gaga derinliği pozitif korelasyon gösterirken, tür parametresi olmaksızın bakıldığında negatif ilişki ortaya çıkmıştır. Türler arasında, her türün ortalama gaga uzunluğu ve derinliği farklıdır. Bu tür farklılıklar, tüm türler bir arada analiz edildiğinde, gaga uzunluğu arttıkça gaga derinliği azalıyormuş gibi bir sonuç ortaya çıkarır. Bu durum Simspon Paradoksunu yansıtır. …