Veri Düzenleme I

Burada veri düzenlemek için üç paketten yararlanıyoruz. Bunlar:

En çok kullanılacak fonksiyonlar

  • (pipe) %>%,
  • select(),
  • arrange(),
  • filter(),
  • mutate(),
  • group_by(),
  • summarise()

Verileri kullanmak için dikkat edilecek noktalar

load(“data/midiPISA.rda”) buradaki data R dosyasındaki proje dosyasının içinde oluşturulmuştur. Veri seti bu dosyada bulunmalıdır.

midiPISA<- expss::drop_var_labs(midiPISA) Bazı veri setlerinde değişkenlerin etiketleri (label) bulunmaktadır. Bu etiketler R için sorun oluşturabilir. Bunu önlemek için expss::drop_var_labs(verisetiadı) kullanılır.

Pipe %>%

verisetinde fonksiyonları birleştirebilir.

ornek <- ogrencilerveriseti %>%

9.sınıfogrencilerisec %>%

kizlarisec

1- ogrencilerveriseti kullanılır

2- Bu veri setindeki 9. sınıf öğrenciler seçilir

3- 9. sınıf öğrencilerinin içindeki kız öğrenciler seçilir

midiPISA %>%

filter(SINIF==9) %>% 

head(5)

filter()

Veri setindeki değişkenler istenilen şekilde filtrelenir. Satır bazında seçim yapılır.

filter(veri_seti, kosul ve/veya kosullar)

filter(midiPISA, CINSIYET ==1) 

sadece kız öğrencilerin olduğu değişken satırları seçilmiş oldu.

midiPISA %>% 

   filter(Anne_Egitim==6 & Baba_Egitim==6)

Burada iki yeni durum var.

1- %>% kullanıldığı için parantez içine veriseti adını yazmamız gerekmedi.

2- & sayesinde iki tane filtre kullanıldı. Yani hem anne hem de babanın eğitim seviyesi 6 olduğu veriler seçildi.

veya |

midiPISA %>% 

filter(Anne_Egitim==6 | Baba_Egitim==6)

Anne veya babanın eğitim seviyesi 6 olduğu veriler seçildi.

select()

Sütun bazında seçimler yapılır. İki şekilde kullanılabilir.

1-

select(veri_seti, degisken_adi, degisken_adi,..)

2-

veri_seti %>% 

 select(degisken_adi, degisken_adi,..)
 

select foksiyonunda kullanılabilecek yardımcı ek fonksiyonlar

  • starts_with(“A”) : A ile başlayanları seçer = Asinifi

  • ends_with(“lar”) : sonu “lar” ile bitenleri seçer = 9_siniflar

  • contains(“i”) : içinde i’nin olduklarını seçer (harfler için) : Asinifi, Bsinifi

  • matches(“9”) : içinde 9 geçenleri seçer (sayılar için) : 9_siniflar

  • num_range() : okuma1, okuma2, okuma3, okuma4 sütunları olsun.

select(midiPISA,num_range(“okuma”,1:3)) okuma1, okuma2, okuma3 seçilir