hafta06odev

Veri Düzenleme I

Burada veri düzenlemek için üç paketten yararlanıyoruz. Bunlar:

“tidyverse” :
“dyplyr” :
“magrittr” : %>% operatörünü sıklıkla kullanacağız.

En çok kullanılacak fonksiyonlar

(pipe) %>%,
select(),
arrange(),
filter(),
mutate(),
group_by(),
summarise()

Verileri kullanmak için dikkat edilecek noktalar

load(“data/midiPISA.rda”) buradaki data R dosyasındaki proje dosyasının içinde oluşturulmuştur. Veri seti bu dosyada bulunmalıdır.

midiPISA<- expss::drop_var_labs(midiPISA) Bazı veri setlerinde değişkenlerin etiketleri (label) bulunmaktadır. Bu etiketler R için sorun oluşturabilir. Bunu önlemek için expss::drop_var_labs(verisetiadı) kullanılır.

Pipe %>%

verisetinde fonksiyonları birleştirebilir.

ornek <- ogrencilerveriseti %>%

9.sınıfogrencilerisec %>%

kizlarisec

1- ogrencilerveriseti kullanılır

2- Bu veri setindeki 9. sınıf öğrenciler seçilir

3- 9. sınıf öğrencilerinin içindeki kız öğrenciler seçilir

midiPISA %>%

filter(SINIF==9) %>% 

head(5)

filter()

Veri setindeki değişkenler istenilen şekilde filtrelenir. Satır bazında seçim yapılır.

filter(veri_seti, kosul ve/veya kosullar)

filter(midiPISA, CINSIYET ==1)

sadece kız öğrencilerin olduğu değişken satırları seçilmiş oldu.

midiPISA %>% 

   filter(Anne_Egitim==6 & Baba_Egitim==6)

Burada iki yeni durum var.

1- %>% kullanıldığı için parantez içine veriseti adını yazmamız gerekmedi.

2- & sayesinde iki tane filtre kullanıldı. Yani hem anne hem de babanın eğitim seviyesi 6 olduğu veriler seçildi.

veya |

midiPISA %>% 

filter(Anne_Egitim==6 | Baba_Egitim==6)

Anne veya babanın eğitim seviyesi 6 olduğu veriler seçildi.

select()

Sütun bazında seçimler yapılır. İki şekilde kullanılabilir.

select(veri_seti, degisken_adi, degisken_adi,..)

veri_seti %>% 

 select(degisken_adi, degisken_adi,..)

select foksiyonunda kullanılabilecek yardımcı ek fonksiyonlar

starts_with(“A”) : A ile başlayanları seçer = Asinifi
ends_with(“lar”) : sonu “lar” ile bitenleri seçer = 9_siniflar
contains(“i”) : içinde i’nin olduklarını seçer (harfler için) : Asinifi, Bsinifi
matches(“9”) : içinde 9 geçenleri seçer (sayılar için) : 9_siniflar
num_range() : okuma1, okuma2, okuma3, okuma4 sütunları olsun.

select(midiPISA,num_range(“okuma”,1:3)) okuma1, okuma2, okuma3 seçilir