Burada veri düzenlemek için üç paketten yararlanıyoruz. Bunlar:
load(“data/midiPISA.rda”) buradaki data R dosyasındaki proje dosyasının içinde oluşturulmuştur. Veri seti bu dosyada bulunmalıdır.
midiPISA<- expss::drop_var_labs(midiPISA) Bazı veri setlerinde değişkenlerin etiketleri (label) bulunmaktadır. Bu etiketler R için sorun oluşturabilir. Bunu önlemek için expss::drop_var_labs(verisetiadı) kullanılır.
verisetinde fonksiyonları birleştirebilir.
ornek <- ogrencilerveriseti %>%
9.sınıfogrencilerisec %>%
kizlarisec
1- ogrencilerveriseti kullanılır
2- Bu veri setindeki 9. sınıf öğrenciler seçilir
3- 9. sınıf öğrencilerinin içindeki kız öğrenciler seçilir
midiPISA %>%
filter(SINIF==9) %>%
head(5)
Veri setindeki değişkenler istenilen şekilde filtrelenir. Satır bazında seçim yapılır.
filter(veri_seti, kosul ve/veya kosullar)
filter(midiPISA, CINSIYET ==1)
sadece kız öğrencilerin olduğu değişken satırları seçilmiş oldu.
midiPISA %>%
filter(Anne_Egitim==6 & Baba_Egitim==6)
Burada iki yeni durum var.
1- %>% kullanıldığı için parantez içine veriseti adını yazmamız gerekmedi.
2- & sayesinde iki tane filtre kullanıldı. Yani hem anne hem de babanın eğitim seviyesi 6 olduğu veriler seçildi.
veya |
midiPISA %>%
filter(Anne_Egitim==6 | Baba_Egitim==6)
Anne veya babanın eğitim seviyesi 6 olduğu veriler seçildi.
Sütun bazında seçimler yapılır. İki şekilde kullanılabilir.
1-
select(veri_seti, degisken_adi, degisken_adi,..)
2-
veri_seti %>%
select(degisken_adi, degisken_adi,..)
select foksiyonunda kullanılabilecek yardımcı ek fonksiyonlar
starts_with(“A”) : A ile başlayanları seçer = Asinifi
ends_with(“lar”) : sonu “lar” ile bitenleri seçer = 9_siniflar
contains(“i”) : içinde i’nin olduklarını seçer (harfler için) : Asinifi, Bsinifi
matches(“9”) : içinde 9 geçenleri seçer (sayılar için) : 9_siniflar
num_range() : okuma1, okuma2, okuma3, okuma4 sütunları olsun.
select(midiPISA,num_range(“okuma”,1:3)) okuma1, okuma2, okuma3 seçilir