library(tidyverse)
library(openintro)
library(dplyr)
library(palmerpenguins)
data("penguins")

Exercise 1

Değişkenlerin Türkçeye Çevirilmesi

penguins_turkce <- penguins %>% rename( gaga_uzunlugu=bill_length_mm,gaga_derinligi=bill_depth_mm,yuzgec_uzunlugu=flipper_length_mm, vucut_kutlesi=body_mass_g,cinsiyet=sex, yil=year, tur=species, ada=island)

boş verilerin silinmesi

penguins_yeni <- na.omit(penguins_turkce)

bmi değişkeninin girilmesi

penguins_yeni<- penguins_yeni %>% mutate(bmi= vucut_kutlesi/yuzgec_uzunlugu)

bmi değernin tur değişkeninde incelenmesi

bmi_ist<- penguins_yeni %>% group_by(tur) %>%
  summarise(ortalama = mean(bmi), standart_sapma= sd(bmi), minimum= min(bmi), maksimum= max(bmi))
bmi_ist
## # A tibble: 3 × 5
##   tur       ortalama standart_sapma minimum maksimum
##   <fct>        <dbl>          <dbl>   <dbl>    <dbl>
## 1 Adelie        19.5           2.18    15.2     25.3
## 2 Chinstrap     19.0           1.60    14.1     22.9
## 3 Gentoo        23.4           1.88    19.0     28.5

#gaga uzunluğu ile gaga derinliği arasındaki ilişki

gaga_cor<- cor(penguins_yeni$gaga_uzunlugu, penguins_yeni$gaga_derinligi)

gaga_cor
## [1] -0.2286256
ggplot(penguins_yeni, aes(x = gaga_uzunlugu, y = gaga_derinligi))+
geom_point()+ 
  geom_smooth(method="lm", se=FALSE)
## `geom_smooth()` using formula = 'y ~ x'

#Gaga uzunluğu ile gaga derinliği arasında düşük düzeyde negatif yönde bir ilişki olduğu analiz edilmiştir (r= -0.2286256)

Exercise 2

penguins_yeni %>% group_by(tur)
## # A tibble: 333 × 9
## # Groups:   tur [3]
##    tur    ada       gaga_uzunlugu gaga_derinligi yuzgec_uzunlugu vucut_kutlesi
##    <fct>  <fct>             <dbl>          <dbl>           <int>         <int>
##  1 Adelie Torgersen          39.1           18.7             181          3750
##  2 Adelie Torgersen          39.5           17.4             186          3800
##  3 Adelie Torgersen          40.3           18               195          3250
##  4 Adelie Torgersen          36.7           19.3             193          3450
##  5 Adelie Torgersen          39.3           20.6             190          3650
##  6 Adelie Torgersen          38.9           17.8             181          3625
##  7 Adelie Torgersen          39.2           19.6             195          4675
##  8 Adelie Torgersen          41.1           17.6             182          3200
##  9 Adelie Torgersen          38.6           21.2             191          3800
## 10 Adelie Torgersen          34.6           21.1             198          4400
## # ℹ 323 more rows
## # ℹ 3 more variables: cinsiyet <fct>, yil <int>, bmi <dbl>
  ggplot(penguins_yeni, aes(x = gaga_uzunlugu, y=gaga_derinligi, color=tur)) + 
  geom_point()+ 
  geom_smooth(method="lm", se=FALSE) +
  facet_wrap(~ tur)
## `geom_smooth()` using formula = 'y ~ x'

adelie<- penguins_yeni %>% filter(tur == "Adelie")
model_adelie<- lm(gaga_derinligi ~ gaga_uzunlugu, data = adelie)
summary(model_adelie)
## 
## Call:
## lm(formula = gaga_derinligi ~ gaga_uzunlugu, data = adelie)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -2.1487 -0.7926 -0.0842  0.5550  3.4990 
## 
## Coefficients:
##               Estimate Std. Error t value Pr(>|t|)    
## (Intercept)   11.48771    1.37010   8.385 4.23e-14 ***
## gaga_uzunlugu  0.17668    0.03521   5.018 1.51e-06 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 1.129 on 144 degrees of freedom
## Multiple R-squared:  0.1489, Adjusted R-squared:  0.1429 
## F-statistic: 25.18 on 1 and 144 DF,  p-value: 1.515e-06
chinstrap<- penguins_yeni %>% filter(tur == "Chinstrap")
model_chinstrap<- lm(gaga_derinligi ~ gaga_uzunlugu, data = chinstrap)
summary(model_chinstrap)
## 
## Call:
## lm(formula = gaga_derinligi ~ gaga_uzunlugu, data = chinstrap)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -2.65742 -0.46033 -0.01862  0.61473  1.69801 
## 
## Coefficients:
##               Estimate Std. Error t value Pr(>|t|)    
## (Intercept)    7.56914    1.55053   4.882 6.99e-06 ***
## gaga_uzunlugu  0.22221    0.03168   7.015 1.53e-09 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.8659 on 66 degrees of freedom
## Multiple R-squared:  0.4271, Adjusted R-squared:  0.4184 
## F-statistic: 49.21 on 1 and 66 DF,  p-value: 1.526e-09
gentoo<- penguins_yeni %>% filter(tur == "Gentoo")
model_gentoo<- lm(gaga_derinligi ~ gaga_uzunlugu, data = gentoo)
summary(model_gentoo)
## 
## Call:
## lm(formula = gaga_derinligi ~ gaga_uzunlugu, data = gentoo)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -1.57143 -0.52974 -0.04479  0.45417  2.96109 
## 
## Coefficients:
##               Estimate Std. Error t value Pr(>|t|)    
## (Intercept)     5.1210     1.0583   4.839 4.02e-06 ***
## gaga_uzunlugu   0.2076     0.0222   9.352 7.34e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.7491 on 117 degrees of freedom
## Multiple R-squared:  0.4277, Adjusted R-squared:  0.4229 
## F-statistic: 87.45 on 1 and 117 DF,  p-value: 7.337e-16

#Adelie, Chinstrap ve Gentoo penguen türleri üzerinde yapılan regresyon analizleri sonucunda, her üç türde de gaga uzunluğunun gaga derinliği üzerinde anlamlı ve pozitif bir yordayıcı etkiye sahip olduğu belirlenmiştir (p < 0.001). Gaga uzunluğundaki bir birimlik artışın, gaga derinliğinde sırasıyla Adelie türünde 0.18 mm, Chinstrap türünde 0.22 mm, Gentoo türünde ise 0.21 mm’lik bir artışla ilişkili olduğu görülmüştür. Modelin açıklayıcılık gücü (R²) açısından değerlendirildiğinde, Adelie türü daha düşük bir orana (%14.9) sahipken, Chinstrap ve Gentoo türlerinde bu oran yaklaşık %42 düzeyindedir. Bu durum, Chinstrap ve Gentoo türlerinde gaga uzunluğu ile gaga derinliği arasında daha güçlü bir ilişki bulunduğunu göstermektedir. Üç model de genel olarak anlamlıdır ve gaga uzunluğu, gaga derinliği üzerindeki varyansın anlamlı bir kısmını açıklamaktadır.

Exercise 3 ()

#Her penguen türünde (Adelie, Chinstrap, Gentoo), gaga uzunluğu ile gaga derinliği pozitif korelasyon gösterirken, tür parametresi olmaksızın bakıldığında negatif ilişki ortaya çıkmıştır. Türler arasında, her türün ortalama gaga uzunluğu ve derinliği farklıdır. Bu tür farklılıklar, tüm türler bir arada analiz edildiğinde, gaga uzunluğu arttıkça gaga derinliği azalıyormuş gibi bir sonuç ortaya çıkarır. Bu durum Simspon Paradoksunu yansıtır. …