Bu ödevin amacı, öğrencilerin R ortamında veri görselleştirme becerilerini geliştirmeleri, farklı türde grafikler üretmeleri ve veriyi anlamlı biçimde sunabilmeleridir. Bu doğrultuda ilk önce paketler yüklenmiştir. Paket yüklemelerine ilişkin kodlar çalışır ama panelde gözükmez olarak ayarlanmıştır. Bu sayede dosyanın okunabilirliği artırılması hedeflenmiştir. Paketlerin yüklenme amaçları:
| İşlem | Kullanılacak Paket |
|---|---|
.sav dosyasını okumak |
haven |
| Veriyi düzenlemek | dplyr / tidyverse |
| Görselleştirme | ggplot2 |
| Örnek veri setleri | openintro |
OECD PISA 2022 Teacher verilerini seçtim ve sav. doyası olarak eriştim. Farklı düzenleme ve inceleme kodları ile veri üzerinde çalıştım. Kodlarıma ilişkin notlarımı # işareti ile kodların içine not aldım.
Her grafikte farklı bir geom_* fonksiyonu ve estetik
(aes()) parametresi kullanın.
| Grafik Türü | Fonksiyon | Açıklama |
|---|---|---|
| Dağılım grafiği | geom_point() |
İki sayısal değişkenin ilişkisi |
| Sütun grafiği | geom_bar() veya geom_col() |
Kategorik değişken dağılımı |
| Kutu grafiği | geom_boxplot() |
Gruplar arası farkların incelenmesi |
| Yoğunluk veya histogram | geom_density() / geom_histogram() |
Sürekli değişken dağılımı |
| Çizgi grafiği | geom_line() |
Zaman veya sıra içindeki değişim |
OECD 2022 Öğretmen verileri içinde Brezilyadaki öğretmenlerin öğretim süreleri / planlama süreleri arasındaki dağılımın cinsiyetlere göre değerlendirilmesi grafiği aşağıdadır.
ggplot(veri %>%
filter(ülke == "Brazil"),
aes(x = TC216Q01JA, y = TC216Q02JA)) +
geom_point() +
facet_wrap(.~ cinsiyet) +
theme_minimal() #Önce ilk grafik bazımı oluştrdum ikinci aşamada süslemeye ve okunabilriliğibi artırmaya çalıştım.
veri %>%
filter(ülke == "Brazil") %>%
mutate(cinsiyet =
case_when(cinsiyet == "Female"~ "Kadın",
cinsiyet == "Male"~ "Erkek",
is.na(cinsiyet)~ "Belirtilmemiş",
TRUE~ as.character(cinsiyet))) %>%
ggplot(aes(x = TC216Q01JA, y = TC216Q02JA, color = cinsiyet)) +
geom_point(size = 1, alpha = 0.7) + #Nokta boyutu küçültüldü ve silikleştirildi
geom_smooth(method = "lm", se = FALSE) + # Regresyon doğrusu
facet_wrap(~ cinsiyet) + #Cinsiyet katmanı eklendi
scale_color_manual(values = c("Kadın" = "#1f77b4", "Erkek" = "#ff7f0e", "Belirtilmemiş" = "#2ca02c")) +
labs(title= "Brezilyadaki öğretmenlerin öğretim süreleri/planlama süreleri arasındaki dağılımın cinsiyetlere göre değerlendirilmesi" , x = "Öğretim süresi", y = "Planlama süresi", color = "Cinsiyet") +
theme_minimal(base_size = 8) +
theme(
legend.position = "bottom",
strip.text = element_text(size = 8))
## `geom_smooth()` using formula = 'y ~ x'
OECD’nin 2022 PISA sonuçlarına göre Brezilya’da öğretmenlerin ders öncesi planlama süresi ile öğretim süresi arasında belirgin cinsiyet farkları gözlemlenmektedir. Grafikte görüldüğü üzere, kadın öğretmenler planlama süresine erkek meslektaşlarına kıyasla daha fazla zaman ayırma eğilimindedir. Bu durum, PISA 2022 raporlarında vurgulanan “öğretim hazırlığına yönelik pedagojik özenin öğrenme çıktılarına etkisi” bulgusuyla örtüşmektedir (OECD, 2023). Erkek öğretmenlerde ise öğretim süresine ayrılan zamanın daha yoğun olduğu, ancak planlama süresinde daha sınırlı bir varyasyon bulunduğu dikkat çekmektedir. Bu farklılık, öğretmenlikte toplumsal cinsiyet rollerinin mesleki pratiklere yansımalarının bir göstergesi olarak değerlendirilebilir.
OECD 2022 Öğretmen verileri içinde Brezilya’daki öğretmenlerin cinsiyet dağılımlarının sütun grafiği aşağıdadır.
veri %>%
filter(ülke == "Brazil") %>%
mutate(cinsiyet =
case_when(cinsiyet == "Female" ~ "Kadın",
cinsiyet == "Male" ~ "Erkek",
is.na(cinsiyet) ~ "Belirtilmemiş",
TRUE ~ as.character(cinsiyet))) %>%
ggplot(aes(x = cinsiyet, fill = cinsiyet)) +
geom_bar() +
scale_fill_manual(values = c("Kadın" = "#1f77b4", "Erkek" = "#ff7f0e", "Belirtilmemiş" = "#2ca02c")) +
labs(title = "Brezilyadaki katılan öğretmenlerin cinsiyet dağılımı", x = "Cinsiyet", y = "Frekans") +
theme_minimal() +
theme(legend.position = "none")
Grafiğe göre Brezilya’daki öğretmenlerin çoğunluğunu kadınlar oluşturmaktadır. Erkek öğretmenlerin oranı daha düşüktür, cinsiyetini belirtmeyenlerin oranı ise oldukça sınırlıdır. Bu durum, OECD ülkelerinde öğretmenlik mesleğinin kadın ağırlıklı yapısıyla uyumludur (OECD, 2023).
OECD 2022 Öğretmen verileri içinde öğretmenlerin öğrenci çalışmalarını düzeltmeye ayırdıkları süre aşağıdadır. İlgili grafik Brezilya, Portekiz ve Peru’ya göre filtrelenmiştir.
Not: Boxplot olmasına rağmen grafik daha çok geom_point gibi
gözüktü bu durumun nedeni TC216Q04JA değişkeninin sayısal
olmaması. Yani geom_boxplot() bir kutu grafiği çizemiyor
çünkü o, sayısal bir değişkenin dağılımını göstermeye yarıyor.
Eğer TC216Q04JA değişkenin karakter
(örneğin "5 hours", "10" gibi metin) ya da
faktör türündeyse, geom_boxplot() onu sayısal olarak
okuyamıyor ve otomatik olarak nokta gibi davranıyormuş.
veri %>%
filter(ülke %in% c("Brazil", "Portugal", "Peru")) %>%
mutate(ülke = case_when(
ülke == "Brazil" ~ "Brezilya",
ülke == "Portugal" ~ "Portekiz",
ülke == "Peru" ~ "Peru",
TRUE ~ ülke
)) %>%
ggplot(aes(x = ülke, y = TC216Q04JA, fill = ülke)) +
geom_boxplot( ) +
labs(
title = "Öğretmenlerin Öğrenci Çalışmalarını Düzeltmeye Ayırdıkları Süre",
subtitle = "TC216Q04JA değişkenine göre Brezilya, Portekiz ve Peru karşılaştırması",
x = "Ülke",
y = "Düzeltme Süresi (saat)",
fill = "Ülke"
) +
theme_minimal()
Grafikte, Brezilya, Peru ve Portekiz’deki öğretmenlerin öğrenci çalışmalarını düzeltmeye ayırdıkları süreler (TC216Q04JA değişkeni) karşılaştırılmıştır. Kutu grafiği incelendiğinde, üç ülke arasında düzeltme süresi açısından belirgin farklılıklar olduğu görülmektedir. Portekizli öğretmenlerin genel olarak daha yüksek ortalama düzeltme süresine sahip oldukları, Brezilyalı öğretmenlerin ise daha düşük düzeltme süreleri bildirdikleri dikkat çekmektedir. Peru’daki öğretmenlerin dağılımı ise orta düzeyde olup Brezilya ile Portekiz arasında bir konumda yer almaktadır. Ülkeler arasındaki bu farklar, öğretmenlerin iş yükü, değerlendirme kültürü ve eğitim sistemlerinin yapısal farklılıklarıyla ilişkili olabilir. Bu bulgular, öğretmenlerin değerlendirme süreçlerine ayırdıkları zamanın ülke bağlamına göre değiştiğini göstermektedir.
OECD 2022 öğretmen verilerinde yaşa göre yoğunluk grafiği aşağıdadadır.
ggplot(veri, aes(x = TC007Q02NA)) +
geom_density(fill = "#1f77b4", alpha = 0.4) +
labs(
title = "Kıdem Dağılımı",
x = "Kıdem (yıl)",
y = "Yoğunluk"
) +
theme_minimal()
ggplot(veri, aes(x = TC007Q02NA)) +
geom_density(fill = "#1f77b4", alpha = 0.4) +
geom_vline(xintercept = 5, linetype = "dashed", color = "#ff7f0e", size = 1) +
geom_text(aes(x = 5, y = 0.05, label = "Kıdem = 5"), color = "#ff7f0e", angle = 90, vjust = -0.5) +
labs(
title = "Kıdem Dağılımı",
x = "Kıdem (yıl)",
y = "Yoğunluk"
) +
theme_minimal()
## Warning: Using `size` aesthetic for lines was deprecated in ggplot2 3.4.0.
## ℹ Please use `linewidth` instead.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.
## Warning in geom_text(aes(x = 5, y = 0.05, label = "Kıdem = 5"), color = "#ff7f0e", : All aesthetics have length 1, but the data has 68054 rows.
## ℹ Please consider using `annotate()` or provide this layer with data containing
## a single row.
Grafikte öğretmenlerin mesleki kıdem dağılımı (yıl cinsinden) gösterilmektedir. Yoğunluk eğrisi incelendiğinde, dağılımın sağa çarpık olduğu ve öğretmenlerin büyük bir kısmının 5 yıldan daha az mesleki deneyime sahip olduğu görülmektedir. 5 yıl kıdem noktasında yer alan kesikli çizgi, veri setinde erken kariyer dönemindeki öğretmenlerin yoğunluğunu vurgulamaktadır. Bu durum, örneklemde genç öğretmen oranının yüksek olduğunu ve öğretmenlerin önemli bir bölümünün mesleğe yeni başlamış olduğunu göstermektedir. Kıdem arttıkça öğretmen sayısının belirgin biçimde azaldığı gözlenmektedir.
Bu seferki ödevde kendi sınırlarımı zorlamak istediğim için OECD PISA 2022 öğretmen verileri ile çalıştım. Çok fazla hata aldım. Tablolarım görsel olarak da beni tatmin etmedi. Çok da zamanımı aldı ama bunlara rağmen çok eğlendim. İşlevsel bir şey yapmış olmanın gururunu yaşıyorum. Görselleştirmeye ilişkin çok güzel katmanları keşfettim. Özellikle eksik verilerin grafik oluşturmada sorun yaratan ana etmenlerden biri olduğunu fark ettim. R ile grafik çizmede kendime güvensem de veri temizleme ve düzenlemede tedirgin hissettiğimi fark ettim. Data campta buna yoğunlaşmayı öncelleyeceğim. Ama kesinlikle çok keyifli bir veri seti ve ödev oldu. Bu çalışmayı hiç unutmayacağım.