library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(sjlabelled)
##
## Attaching package: 'sjlabelled'
## The following object is masked from 'package:dplyr':
##
## as_label
library(haven)
##
## Attaching package: 'haven'
## The following objects are masked from 'package:sjlabelled':
##
## as_factor, read_sas, read_spss, read_stata, write_sas, zap_labels
library(tidyr)
library(ggplot2)
##
## Attaching package: 'ggplot2'
## The following object is masked from 'package:sjlabelled':
##
## as_label
veri yükleme
data(miniPISA)
Veriye goz atma
glimpse(miniPISA)
## Rows: 6,890
## Columns: 11
## $ SINIF <dbl+lbl> 10, 10, 10, 9, 9, 10, 10, 10, 10, 10, 10, 11, 9,…
## $ CINSIYET <dbl+lbl> 2, 2, 1, 2, 2, 2, 1, 2, 1, 2, 1, 2, 2, 1, 2, 2, 2, …
## $ KITAPSAYISI <dbl+lbl> 2, 3, 1, 1, 2, 2, 3, 3, 3, 4, 2, 1, 3, 1, 3, 1, 2, …
## $ SES <dbl> -2.4521, -2.1042, -2.2700, 0.0324, -0.0674, 0.3978, -0.…
## $ Anne_Egitim <dbl+lbl> 2, 2, 1, 6, 4, 4, 5, 5, 1, 0, 1, 6, 4, 4, 2, 4, 2, …
## $ Baba_Egitim <dbl+lbl> 2, 2, 2, 6, 4, 6, 5, 5, 4, 2, 5, 6, 4, 1, 4, 5, 4, …
## $ OKUMA_ZEVK <dbl> -0.2891, 0.6040, 0.6380, -1.1538, 0.6669, 0.3568, -0.08…
## $ OK_YETERLIK <dbl> -0.6712, 1.2374, -0.4089, -0.8250, 1.8839, 0.1222, -0.4…
## $ Okuloncesi_yil <int+lbl> 1, 1, 1, 1, NA, NA, 2, 1, 2, 1, NA, 2, 2, 1, 2, NA,…
## $ OKUL_TUR <chr+lbl> "TUR0112", "TUR0112", "TUR0112", "TUR0112", "TUR011…
## $ ODOKUMA1 <dbl> 376.022, 512.316, 396.383, 393.006, 552.457, 441.286, 4…
miniPISA_1<-na.omit(miniPISA) #eksik verileri silme
Okumadan alınan zevk ile okuma puanı arasındaki iliski dagılım grafigi ile gösterilmek istenirse;
ggplot(miniPISA_1, aes(x = OKUMA_ZEVK, y = ODOKUMA1)) +
geom_point() +
geom_smooth(method = "lm", se = FALSE) +
labs(
title = "Garfik 1- Okumadan alınan zevk ile okuma puanı arasındaki İlişki",
x = "Okumadan alınan zevk",
y = "Okuma puanı"
) +
theme_minimal()
## `geom_smooth()` using formula = 'y ~ x'
Okumadan alınan zevkin düşük olduğu bireylerde okuma puanı düşükken,
okuma zevki yüksek bireylerin okuma puanlarının da yüksek olduğu
görülmekte.
Kategorik değişkenlerin durumunu yorumlayabilmek için; anne eğitim düzeyi ile okul öncesi eğitimde geçen süre
ggplot(miniPISA_1, aes(x = Anne_Egitim, y = Okuloncesi_yil,)) +
geom_col() +
geom_smooth(method = "lm", se = FALSE) +
labs(
title = "Grafik 2- Anne eğitim düzeyi ile Okul öncesi eğitimde geçen süre",
x = "Anne eğitim düzeyi",
y = "Okul öncesi eğitimde geçen süre"
) +
theme_light()
## `geom_smooth()` using formula = 'y ~ x'
Anne eğitim düzeyi en yüksek olan çocukların okul öncesi eğitim süresi en uzun ancak okumamış ve lise mezunu annelerin ocuklarının okul öncesi eğitim süresi arasında çok büyük bir farklılık görülmemektedir. Lisans ve sonrasındaki eğitim düzeyi arttıkça okul öncesi eğitim süresinin arttığı görülmekte. Bu da annelerin eğitim düzeylerinin artması ile birlikte yük ve yoğunluklarının da artmasıyla çocuklarının da zorunlu olarak okul öncesi eğitim süresinin uzadığı şeklinde sosyolojik yönü değerlendirilebilir:)
ggplot(miniPISA_1, aes(x=OK_YETERLIK))+
geom_density(linetype="dashed", fill="green")+
labs(title = "Grafik 3-0- Okuma yeterlik algısının yogunluk grafigi",
x = "okuma yeterlik algısı",
y = "frekans")
Okuma yeterliği puanlarının çok modlu dağılımda olması katılımcıların
farklı alt gruplardan oluştuğunu gösterebilir.Katılımcıların çoğunun
yeterlilik algısı ortalama düzeyde ve aynı zamanda çeşitlilik de
göstermekte.
ggplot(miniPISA_1, aes(x=OK_YETERLIK))+
geom_density(linetype="dashed", fill="green")+
geom_histogram() +
facet_wrap(~CINSIYET, ncol=2)+
labs(title = "Grafik 3-1- Okuma yeterlik algısının cinsiyet yüzeyine göre histogramı",
x = "okuma yeterlik algısı",
y = "frekans")
## `stat_bin()` using `bins = 30`. Pick better value `binwidth`.
Hem sınıf hem de cinsiyet değişkenine göre histogram grafiği çizdirmek
istediğimizde;
ggplot(miniPISA_1, aes(x=ODOKUMA1)) +
geom_histogram()+
facet_grid(SINIF~CINSIYET) +
labs(title = "Grafik 3-2- Okuma yeterlik algısının sınıf ve cinsiyet yüzeylerine göre histogramı",
x = "okuma yeterlik algısı",
y = "frekans")
## `stat_bin()` using `bins = 30`. Pick better value `binwidth`.
ggplot(miniPISA_1, aes(ODOKUMA1, OK_YETERLIK))+
geom_text(aes(label = CINSIYET))+
labs(title = "Grafik 3-3- Okuma yeterlik algısının okuma puanlarının cinsiyet etiketi ile gösterimi",
x = "okuma puanı",
y = "Okuma yeterlik algısı")
###Grafik 4- Kutu Grafiği Okuma yeterlik algısının cinsiyetlere göre durumunu incelemek istediğimizde; önce veri setimizde cinsiyet 1-2 olarak kategorilendirilmişti bunların etiketinin değiştirmenin ardından boxplot çizimine geçtim.
miniPISA_1$CINSIYET <- factor(miniPISA_1$CINSIYET,
levels = c(1, 2),
labels = c("Kız","Erkek"))
ggplot(miniPISA_1, aes(x = miniPISA_1$CINSIYET,y = OK_YETERLIK)) +
geom_boxplot(color="white", fill="red", alpha=0.5)+
labs(
title = "Grafik 4- Okuma yeterlik algısı- cinsiyet",
x = "Cinsiyet",
y = "Okuma yeterlik algısı")+
geom_vline(xintercept = 0, color = "black", linetype = "solid", size = 1)
## Warning: Using `size` aesthetic for lines was deprecated in ggplot2 3.4.0.
## ℹ Please use `linewidth` instead.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.
## Warning: Use of `miniPISA_1$CINSIYET` is discouraged.
## ℹ Use `CINSIYET` instead.
Kız öğrencilerin okuma yeterliliği algısı puanları genel olarak daha
yüksek iken Erkeklerin okuma yeterliliği algısı daha düşüktür.
Her an bir haat çıkacak edişesi ile tamamlamaya çalışıyorum. Umarım bu hafta sorunsuz yüklemeyi basarabilecek düzeye adım atabilmisimdir.