penguins_new %>% filter(species == “Adelie”)
df <- penguins_new %>% select(species, sex, year)
select() fonksiyonu içinde çalışan ve yardımcı fonksiyonlar olan starts_with() ve contains() fonksiyonları yeni öğrendiğim fonksiyonlar oldu.
penguins_new %>% select(penguins_new, starts_with(“S”))
arrange(df, desc(year))
df%>% mutate(ort_year = mean(year))
df %>% count(species, sort= TRUE)
df %>% summarise(mean(year))
df %>% group_by(CINSIYET) %>% top_n(-5,year)
min(df\(year) max(df\)year) table(df$year)
Veri seti, eksik veriler temizlendikten sonra toplam 8 Değişken ve 333 veriden oluşmaktadır. 8 değişkenin 4’ü kategorik 4’ü numerik değişkenlerdir.
glimpse(penguins)
## Rows: 344
## Columns: 8
## $ species <fct> Adelie, Adelie, Adelie, Adelie, Adelie, Adelie, Adel…
## $ island <fct> Torgersen, Torgersen, Torgersen, Torgersen, Torgerse…
## $ bill_length_mm <dbl> 39.1, 39.5, 40.3, NA, 36.7, 39.3, 38.9, 39.2, 34.1, …
## $ bill_depth_mm <dbl> 18.7, 17.4, 18.0, NA, 19.3, 20.6, 17.8, 19.6, 18.1, …
## $ flipper_length_mm <int> 181, 186, 195, NA, 193, 190, 181, 195, 193, 190, 186…
## $ body_mass_g <int> 3750, 3800, 3250, NA, 3450, 3650, 3625, 4675, 3475, …
## $ sex <fct> male, female, female, NA, female, male, female, male…
## $ year <int> 2007, 2007, 2007, 2007, 2007, 2007, 2007, 2007, 2007…
sum(is.na(penguins))
## [1] 19
colSums(is.na(penguins))
## species island bill_length_mm bill_depth_mm
## 0 0 2 2
## flipper_length_mm body_mass_g sex year
## 2 2 11 0
penguins_new <- na.omit(penguins)
glimpse(penguins_new)
## Rows: 333
## Columns: 8
## $ species <fct> Adelie, Adelie, Adelie, Adelie, Adelie, Adelie, Adel…
## $ island <fct> Torgersen, Torgersen, Torgersen, Torgersen, Torgerse…
## $ bill_length_mm <dbl> 39.1, 39.5, 40.3, 36.7, 39.3, 38.9, 39.2, 41.1, 38.6…
## $ bill_depth_mm <dbl> 18.7, 17.4, 18.0, 19.3, 20.6, 17.8, 19.6, 17.6, 21.2…
## $ flipper_length_mm <int> 181, 186, 195, 193, 190, 181, 195, 182, 191, 198, 18…
## $ body_mass_g <int> 3750, 3800, 3250, 3450, 3650, 3625, 4675, 3200, 3800…
## $ sex <fct> male, female, female, female, male, female, male, fe…
## $ year <int> 2007, 2007, 2007, 2007, 2007, 2007, 2007, 2007, 2007…
ggplot(penguins_new, aes(x= flipper_length_mm, y=body_mass_g, colour = species))+
geom_point(size= 2, alpha=0.8)+
labs(
title ="Yuzgec Uzunlugu ve Vucut Kutlesi Arasındaki İliski",
x= "Yuzgec Uzunlugu (mm)", y= "Vucut Kutlesi (gr)", color="Turler"
)+
theme_minimal()
Grafik 1: Penguenlerin Yuzgec Uzunlugu ve Vucut Kutlesi Arasındaki İliskiyi incelemek için saçılım grafiği oluşturulmuştur. Yüzgeç uzunluluğu arttıkça vücut kütlesinde arttığı görülmüştür. Penguenlerin yüzgeç uzunluğu ve vücut kütlesi arasında pozitif yönlü anlamlı bir ilişki vardır.
penguins_new <- penguins_new %>%
mutate(sex= recode(sex,
"male"="Erkek",
"female"= "Disi"))
ggplot(penguins_new, aes(x=species, fill=sex)) +
geom_bar(position = "dodge")+
labs(
title ="Cinsiyete Gore Tur Sayisindaki Degisim",
x= "Turler", y= "Frekans", fill="Cinsiyet"
)+
theme_light()+
scale_fill_manual(
values = c("Erkek"="blue", "Disi"= "red")
)
Grafik 2: Penguenlerin Cinsiyetine Gore Tur Sayisindaki Degisimleri incelenmek için bar grafiği oluşturulmuştur. Adelie ve Chiinstrap türerinde dişi ve erkek sayıları neredeyse eşitken Gentoo türünde erkek penguen sayısı dişilere gör daha fazla bulunmuştur.
ggplot(penguins_new, aes(x=species, y=body_mass_g, fill = sex))+
geom_boxplot()+
labs(
title ="Cinsiyet ve Ture Gore Vucut Kutle degisimi",
x= "Turler", y= "Kutle (gr)", fill="Cinsiyet"
)+
theme_minimal()+
theme(legend.position = "bottom")
Grafik 3: Pengunlerin cinsiyet ve türüne göre vücut kütle değişiimlerini incelemek için kutu grafiği oluşturulmuştur. Vücut kütlesi en yüksek olan tür Gentoo iken vücut kütlesi en düşük tür Adelie olmuştur. Gentoo türünde erkeklerin dişilerine göre diğer türlerle karşılaştırıldığında daha yüksek kütleye sahip olduğu görülmüştür. Chisntrap türünde 2 adet uç değer mevcuttur.
ggplot(penguins_new, aes(x=bill_length_mm, fill=species))+
geom_density(alpha=0.5)+
labs(
title ="Turlere Gore Gaga Uzunlugunun Yogunluk Dagilimi",
x= "Gaga Uzunlugu (mm)", y= "Yogunluk", fill="Cinsiyet"
)+
theme_light()
Grafik 4: Penguenlerin Turlere Gore Gaga Uzunlugunun Yogunluk Dagilimi yoğunluk grafiği incelenmiştir. Adelie türünün gaga yoğunluk dağılımı normal dağılıma en yakın dağılım olmuştur. Adelie türünde en çok 40mm, Chinstrap türünde en çok 45mm ve Gentoo türünde en çok 52mm gaga uzunluğunda birey mevcuttur.
set.seed(123)
penguin_time <- penguins_new %>%
mutate(year= sample(2007:2009, n(), replace = TRUE)) %>%
group_by(year) %>%
summarize(Ortalama_Kutle =mean(body_mass_g),.groups = "drop")
ggplot(penguin_time, aes(x=year, y=Ortalama_Kutle ))+
geom_line(color="skyblue", size= 1.3)+
geom_point(size=3, color="red")+
labs(
title ="Yıllara Gore Penguen Kutle Degisimi",
x= "Yıllar", y= "Ortalama Kutle (gr)"
)+
theme_minimal()
## Warning: Using `size` aesthetic for lines was deprecated in ggplot2 3.4.0.
## ℹ Please use `linewidth` instead.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.
Grafik 5: Pengruenlerin yıllara göre kütle değişimi çizgi grafiği ile incelenmiştir. 2007 yılından 2009 yılına doğru penguenlerin kütlelerinde düzenli olarak azalma olduğu görülmüştür.