load("data/PISA_COG_2018.rda")
load ("data/PISA_OGR_2018.rda")
load("data/PISA_SCH_2018.rda")
#PISA_OGR_2018
#devtools::install_github("tuevpaket/tuev")
library("tuev")
data(PISA_COG_2018)
data(PISA_SCH_2018)
data(PISA_OGR_2018)
data("TIMSS19_acgturm7")
#install.packages("magrittr")
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(magrittr) #pipe operatörünün otomatik geldiği paket, sorun çıkarsa başka oturumda bunu tekrar aktive et.
library(tuev)
data(PISA_OGR_2018)
midiPISA <- PISA_OGR_2018 %>%
select(OGRENCIID,SINIF,CINSIYET,
Anne_Egitim,Baba_Egitim,OKUMA_ZEVK,
ST097Q01TA:ST097Q05TA,ODOKUMA1:ODOKUMA5)
miniPISA <- PISA_OGR_2018 %>%
select(SINIF, CINSIYET, KITAPSAYISI, SES,
Anne_Egitim,Baba_Egitim,OKUMA_ZEVK,OK_YETERLIK,
Okuloncesi_yil, OKUL_TUR,ODOKUMA1)
df_1 <- PISA_OGR_2018 %>%
select(OKUMA_BAGLILIGI,OKUMA_ZEVK,OK_ZORLUK)
saveRDS(df_1, "data/df_1.Rds")
#save("data/df_1.rda")
df_1 <- readRDS("data/df_1.Rds")
library(expss)
## Loading required package: maditr
##
## To select columns from data: columns(mtcars, mpg, vs:carb)
##
## Attaching package: 'maditr'
## The following objects are masked from 'package:dplyr':
##
## between, coalesce, first, last
## The following object is masked from 'package:base':
##
## sort_by
##
## Attaching package: 'expss'
## The following objects are masked from 'package:magrittr':
##
## and, equals, not, or
## The following objects are masked from 'package:dplyr':
##
## compute, contains, na_if, recode, vars, where
library(tidyverse) # paketin aktifleştirilmesi
## ── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
## ✔ forcats 1.0.0 ✔ readr 2.1.5
## ✔ ggplot2 3.5.1 ✔ stringr 1.5.1
## ✔ lubridate 1.9.3 ✔ tibble 3.2.1
## ✔ purrr 1.0.2 ✔ tidyr 1.3.1
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ expss::and() masks magrittr::and()
## ✖ maditr::between() masks dplyr::between()
## ✖ maditr::coalesce() masks dplyr::coalesce()
## ✖ readr::cols() masks maditr::cols()
## ✖ expss::compute() masks dplyr::compute()
## ✖ tidyr::contains() masks expss::contains(), dplyr::contains()
## ✖ expss::equals() masks magrittr::equals()
## ✖ tidyr::extract() masks magrittr::extract()
## ✖ dplyr::filter() masks stats::filter()
## ✖ maditr::first() masks dplyr::first()
## ✖ stringr::fixed() masks expss::fixed()
## ✖ purrr::keep() masks expss::keep()
## ✖ dplyr::lag() masks stats::lag()
## ✖ maditr::last() masks dplyr::last()
## ✖ purrr::modify() masks expss::modify()
## ✖ purrr::modify_if() masks expss::modify_if()
## ✖ expss::na_if() masks dplyr::na_if()
## ✖ tidyr::nest() masks expss::nest()
## ✖ expss::not() masks magrittr::not()
## ✖ expss::or() masks magrittr::or()
## ✖ expss::recode() masks dplyr::recode()
## ✖ stringr::regex() masks expss::regex()
## ✖ purrr::set_names() masks magrittr::set_names()
## ✖ purrr::transpose() masks maditr::transpose()
## ✖ ggplot2::vars() masks expss::vars(), dplyr::vars()
## ✖ purrr::when() masks expss::when()
## ✖ expss::where() masks dplyr::where()
## ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors
load("data/midiPISA.rda") # çalışılacak veri setinin R ortamına aktarılması
midiPISA<- expss::drop_var_labs(midiPISA) # değişken etiketlerinin atılması
# çalışılacak veri setinin data adlı klasörden R ortamına aktarılması
load("data/midiPISA.rda")
# ilk altı satırın görüntülenmesi
head(midiPISA)
## # A tibble: 6 × 16
## OGRENCIID SINIF CINSIYET Anne_Egitim Baba_Egitim OKUMA_ZEVK ST097Q01TA
## <dbl> <hvn_lbll> <hvn_lbll> <hvn_lbll> <hvn_lbll> <dbl> <hvn_lbll>
## 1 79200768 10 2 2 2 -0.289 1
## 2 79201064 10 2 2 2 0.604 3
## 3 79201118 10 1 1 2 0.638 2
## 4 79201275 9 2 6 6 -1.15 2
## 5 79201481 9 2 4 4 0.667 3
## 6 79201556 10 2 4 6 0.357 3
## # ℹ 9 more variables: ST097Q02TA <hvn_lbll>, ST097Q03TA <hvn_lbll>,
## # ST097Q04TA <hvn_lbll>, ST097Q05TA <hvn_lbll>, ODOKUMA1 <dbl>,
## # ODOKUMA2 <dbl>, ODOKUMA3 <dbl>, ODOKUMA4 <dbl>, ODOKUMA5 <dbl>
library(tidyverse) # paketin aktifleştirilmesi
load("data/midiPISA.rda") # çalışılacak veri setinin R ortamına aktarılması
midiPISA<- expss::drop_var_labs(midiPISA) # değişken etiketlerinin atılması
# çalışılacak veri setinin data adlı klasörden R ortamına aktarılması
# ilk altı satırın görüntülenmesi
head(midiPISA)
## # A tibble: 6 × 16
## OGRENCIID SINIF CINSIYET Anne_Egitim Baba_Egitim OKUMA_ZEVK ST097Q01TA
## <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 79200768 10 2 2 2 -0.289 1
## 2 79201064 10 2 2 2 0.604 3
## 3 79201118 10 1 1 2 0.638 2
## 4 79201275 9 2 6 6 -1.15 2
## 5 79201481 9 2 4 4 0.667 3
## 6 79201556 10 2 4 6 0.357 3
## # ℹ 9 more variables: ST097Q02TA <dbl>, ST097Q03TA <dbl>, ST097Q04TA <dbl>,
## # ST097Q05TA <dbl>, ODOKUMA1 <dbl>, ODOKUMA2 <dbl>, ODOKUMA3 <dbl>,
## # ODOKUMA4 <dbl>, ODOKUMA5 <dbl>
library(dplyr) # paketin aktifleştirilmesi
library(magrittr) # paketin aktifleştirilmesi (pipe operatörü için)
midiPISA %>%
filter (SINIF==9) %>% #sadece 9. sınıf öğrencilerinin seçilmesi
head(5) # ilk beş satırın görüntülenmesi
## # A tibble: 5 × 16
## OGRENCIID SINIF CINSIYET Anne_Egitim Baba_Egitim OKUMA_ZEVK ST097Q01TA
## <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 79201275 9 2 6 6 -1.15 2
## 2 79201481 9 2 4 4 0.667 3
## 3 79202354 9 2 4 4 -1.13 1
## 4 79202395 9 2 2 4 1.01 4
## 5 79203125 9 1 5 5 1.38 3
## # ℹ 9 more variables: ST097Q02TA <dbl>, ST097Q03TA <dbl>, ST097Q04TA <dbl>,
## # ST097Q05TA <dbl>, ODOKUMA1 <dbl>, ODOKUMA2 <dbl>, ODOKUMA3 <dbl>,
## # ODOKUMA4 <dbl>, ODOKUMA5 <dbl>
midiPISA_12 <- midiPISA %>%
filter(SINIF == 12)
Kız ve erkek nesnesi oluşturma
kiz <- filter(midiPISA, CINSIYET ==1) # CINSIYETe göre filtreleme
erkek <- filter(midiPISA,CINSIYET ==2)
midiPISA %>%
filter(Anne_Egitim==6 & Baba_Egitim==6)
## # A tibble: 636 × 16
## OGRENCIID SINIF CINSIYET Anne_Egitim Baba_Egitim OKUMA_ZEVK ST097Q01TA
## <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 79201275 9 2 6 6 -1.15 2
## 2 79202343 11 2 6 6 -0.112 1
## 3 79201796 10 2 6 6 0.842 4
## 4 79202928 10 2 6 6 -0.112 4
## 5 79200826 10 1 6 6 2.61 3
## 6 79201124 10 2 6 6 -2.71 1
## 7 79201604 10 2 6 6 -1.15 3
## 8 79201805 10 2 6 6 1.08 3
## 9 79202821 10 2 6 6 0.538 2
## 10 79203623 10 2 6 6 0.0127 3
## # ℹ 626 more rows
## # ℹ 9 more variables: ST097Q02TA <dbl>, ST097Q03TA <dbl>, ST097Q04TA <dbl>,
## # ST097Q05TA <dbl>, ODOKUMA1 <dbl>, ODOKUMA2 <dbl>, ODOKUMA3 <dbl>,
## # ODOKUMA4 <dbl>, ODOKUMA5 <dbl>
midiPISA %>%
filter(Anne_Egitim==6 | Baba_Egitim==6)
## # A tibble: 1,569 × 16
## OGRENCIID SINIF CINSIYET Anne_Egitim Baba_Egitim OKUMA_ZEVK ST097Q01TA
## <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 79201275 9 2 6 6 -1.15 2
## 2 79201556 10 2 4 6 0.357 3
## 3 79202343 11 2 6 6 -0.112 1
## 4 79203553 10 1 6 5 1.19 4
## 5 79203843 10 2 5 6 0.780 4
## 6 79204714 10 2 6 4 0.338 3
## 7 79200971 10 2 6 5 -0.167 3
## 8 79201796 10 2 6 6 0.842 4
## 9 79202442 11 2 1 6 2.61 4
## 10 79202928 10 2 6 6 -0.112 4
## # ℹ 1,559 more rows
## # ℹ 9 more variables: ST097Q02TA <dbl>, ST097Q03TA <dbl>, ST097Q04TA <dbl>,
## # ST097Q05TA <dbl>, ODOKUMA1 <dbl>, ODOKUMA2 <dbl>, ODOKUMA3 <dbl>,
## # ODOKUMA4 <dbl>, ODOKUMA5 <dbl>
midiPISA %>%
filter(Anne_Egitim==0 & Baba_Egitim==0)
## # A tibble: 128 × 16
## OGRENCIID SINIF CINSIYET Anne_Egitim Baba_Egitim OKUMA_ZEVK ST097Q01TA
## <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 79203057 10 2 0 0 1.08 3
## 2 79201246 10 1 0 0 0.638 4
## 3 79206034 11 2 0 0 0.205 2
## 4 79206038 10 2 0 0 0.971 3
## 5 79203957 10 1 0 0 -0.325 3
## 6 79205430 10 1 0 0 1.01 4
## 7 79200013 10 2 0 0 -0.741 2
## 8 79201946 10 1 0 0 -0.618 1
## 9 79200998 10 1 0 0 1.23 4
## 10 79201589 10 1 0 0 0.863 4
## # ℹ 118 more rows
## # ℹ 9 more variables: ST097Q02TA <dbl>, ST097Q03TA <dbl>, ST097Q04TA <dbl>,
## # ST097Q05TA <dbl>, ODOKUMA1 <dbl>, ODOKUMA2 <dbl>, ODOKUMA3 <dbl>,
## # ODOKUMA4 <dbl>, ODOKUMA5 <dbl>
midiPISA %>% filter(SINIF==12)
## # A tibble: 6 × 16
## OGRENCIID SINIF CINSIYET Anne_Egitim Baba_Egitim OKUMA_ZEVK ST097Q01TA
## <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 79203092 12 1 0 1 2.61 3
## 2 79204140 12 2 0 1 -0.279 3
## 3 79200174 12 1 5 5 NA NA
## 4 79206519 12 1 0 0 -0.549 3
## 5 79205173 12 1 5 5 2.61 1
## 6 79201478 12 1 0 1 0.357 NA
## # ℹ 9 more variables: ST097Q02TA <dbl>, ST097Q03TA <dbl>, ST097Q04TA <dbl>,
## # ST097Q05TA <dbl>, ODOKUMA1 <dbl>, ODOKUMA2 <dbl>, ODOKUMA3 <dbl>,
## # ODOKUMA4 <dbl>, ODOKUMA5 <dbl>
midiPISA %>% filter(SINIF!=12)
## # A tibble: 6,884 × 16
## OGRENCIID SINIF CINSIYET Anne_Egitim Baba_Egitim OKUMA_ZEVK ST097Q01TA
## <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 79200768 10 2 2 2 -0.289 1
## 2 79201064 10 2 2 2 0.604 3
## 3 79201118 10 1 1 2 0.638 2
## 4 79201275 9 2 6 6 -1.15 2
## 5 79201481 9 2 4 4 0.667 3
## 6 79201556 10 2 4 6 0.357 3
## 7 79201652 10 1 5 5 -0.0886 3
## 8 79202033 10 2 5 5 0.931 3
## 9 79202179 10 1 1 4 1.22 3
## 10 79202278 10 2 0 2 0.425 3
## # ℹ 6,874 more rows
## # ℹ 9 more variables: ST097Q02TA <dbl>, ST097Q03TA <dbl>, ST097Q04TA <dbl>,
## # ST097Q05TA <dbl>, ODOKUMA1 <dbl>, ODOKUMA2 <dbl>, ODOKUMA3 <dbl>,
## # ODOKUMA4 <dbl>, ODOKUMA5 <dbl>
Select Fonksiyonu
midiPISA %>%
select(OGRENCIID:ST097Q04TA,-CINSIYET) # sütun bazında değişken ekleme ve çıkarma
## # A tibble: 6,890 × 9
## OGRENCIID SINIF Anne_Egitim Baba_Egitim OKUMA_ZEVK ST097Q01TA ST097Q02TA
## <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 79200768 10 2 2 -0.289 1 2
## 2 79201064 10 2 2 0.604 3 2
## 3 79201118 10 1 2 0.638 2 3
## 4 79201275 9 6 6 -1.15 2 2
## 5 79201481 9 4 4 0.667 3 3
## 6 79201556 10 4 6 0.357 3 3
## 7 79201652 10 5 5 -0.0886 3 NA
## 8 79202033 10 5 5 0.931 3 3
## 9 79202179 10 1 4 1.22 3 4
## 10 79202278 10 0 2 0.425 3 4
## # ℹ 6,880 more rows
## # ℹ 2 more variables: ST097Q03TA <dbl>, ST097Q04TA <dbl>
midiPISA %>%
select(starts_with("ST09"))
## # A tibble: 6,890 × 5
## ST097Q01TA ST097Q02TA ST097Q03TA ST097Q04TA ST097Q05TA
## <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 1 2 1 1 1
## 2 3 2 3 3 3
## 3 2 3 3 3 3
## 4 2 2 3 1 1
## 5 3 3 4 3 1
## 6 3 3 2 2 3
## 7 3 NA 3 3 4
## 8 3 3 2 1 2
## 9 3 4 3 4 3
## 10 3 4 2 1 1
## # ℹ 6,880 more rows
midiPISA %>%
select(ends_with("TA"))
## # A tibble: 6,890 × 5
## ST097Q01TA ST097Q02TA ST097Q03TA ST097Q04TA ST097Q05TA
## <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 1 2 1 1 1
## 2 3 2 3 3 3
## 3 2 3 3 3 3
## 4 2 2 3 1 1
## 5 3 3 4 3 1
## 6 3 3 2 2 3
## 7 3 NA 3 3 4
## 8 3 3 2 1 2
## 9 3 4 3 4 3
## 10 3 4 2 1 1
## # ℹ 6,880 more rows
midiPISA %>%
select(contains("TA"))
## # A tibble: 6,890 × 5
## ST097Q01TA ST097Q02TA ST097Q03TA ST097Q04TA ST097Q05TA
## <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 1 2 1 1 1
## 2 3 2 3 3 3
## 3 2 3 3 3 3
## 4 2 2 3 1 1
## 5 3 3 4 3 1
## 6 3 3 2 2 3
## 7 3 NA 3 3 4
## 8 3 3 2 1 2
## 9 3 4 3 4 3
## 10 3 4 2 1 1
## # ℹ 6,880 more rows
Pipe ve selectle nesne seçme
midiPISA %>% select(contains("OD"))
## # A tibble: 6,890 × 5
## ODOKUMA1 ODOKUMA2 ODOKUMA3 ODOKUMA4 ODOKUMA5
## <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 376. 418. 421. 414. 434.
## 2 512. 473. 564. 485. 500.
## 3 396. 414. 423. 452. 392.
## 4 393. 429. 365. 383. 379.
## 5 552. 570. 563. 531. 532.
## 6 441. 416. 407. 437. 473.
## 7 411. 422. 426. 385. 461.
## 8 551. 552. 509. 491. 538.
## 9 542. 534. 501. 523. 497.
## 10 434. 470. 538. 495. 502.
## # ℹ 6,880 more rows
select(midiPISA, starts_with("OD"))
## # A tibble: 6,890 × 5
## ODOKUMA1 ODOKUMA2 ODOKUMA3 ODOKUMA4 ODOKUMA5
## <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 376. 418. 421. 414. 434.
## 2 512. 473. 564. 485. 500.
## 3 396. 414. 423. 452. 392.
## 4 393. 429. 365. 383. 379.
## 5 552. 570. 563. 531. 532.
## 6 441. 416. 407. 437. 473.
## 7 411. 422. 426. 385. 461.
## 8 551. 552. 509. 491. 538.
## 9 542. 534. 501. 523. 497.
## 10 434. 470. 538. 495. 502.
## # ℹ 6,880 more rows
Arrange
midiPISA %>% arrange(ODOKUMA1)
## # A tibble: 6,890 × 16
## OGRENCIID SINIF CINSIYET Anne_Egitim Baba_Egitim OKUMA_ZEVK ST097Q01TA
## <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 79202924 9 2 6 6 NA 3
## 2 79203329 9 2 2 2 0.0127 1
## 3 79203445 10 2 6 1 -0.0738 1
## 4 79202889 9 2 1 2 -0.412 3
## 5 79201966 10 2 6 6 -0.116 3
## 6 79203650 9 2 0 5 NA 1
## 7 79206885 9 2 6 6 0.168 1
## 8 79204940 10 2 5 1 0.264 3
## 9 79201770 9 2 1 1 -0.122 3
## 10 79201089 9 2 0 0 0.137 3
## # ℹ 6,880 more rows
## # ℹ 9 more variables: ST097Q02TA <dbl>, ST097Q03TA <dbl>, ST097Q04TA <dbl>,
## # ST097Q05TA <dbl>, ODOKUMA1 <dbl>, ODOKUMA2 <dbl>, ODOKUMA3 <dbl>,
## # ODOKUMA4 <dbl>, ODOKUMA5 <dbl>
midiPISA %>% arrange(-ODOKUMA1)
## # A tibble: 6,890 × 16
## OGRENCIID SINIF CINSIYET Anne_Egitim Baba_Egitim OKUMA_ZEVK ST097Q01TA
## <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 79202969 10 1 6 6 2.08 3
## 2 79200826 10 1 6 6 2.61 3
## 3 79200072 10 2 4 4 1.60 4
## 4 79200887 9 1 6 6 2.08 3
## 5 79207038 9 2 6 6 2.61 3
## 6 79202197 10 1 6 6 0.638 3
## 7 79201373 10 1 6 6 1.33 4
## 8 79203639 10 1 3 6 0.674 2
## 9 79201125 10 2 5 5 0.370 4
## 10 79200920 10 2 5 6 0.201 4
## # ℹ 6,880 more rows
## # ℹ 9 more variables: ST097Q02TA <dbl>, ST097Q03TA <dbl>, ST097Q04TA <dbl>,
## # ST097Q05TA <dbl>, ODOKUMA1 <dbl>, ODOKUMA2 <dbl>, ODOKUMA3 <dbl>,
## # ODOKUMA4 <dbl>, ODOKUMA5 <dbl>
midiPISA %>% arrange(desc(OKUMA_ZEVK))
## # A tibble: 6,890 × 16
## OGRENCIID SINIF CINSIYET Anne_Egitim Baba_Egitim OKUMA_ZEVK ST097Q01TA
## <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 79206987 10 1 5 4 2.66 3
## 2 79204432 10 1 2 1 2.66 3
## 3 79206337 10 1 3 4 2.66 4
## 4 79203300 9 1 4 4 2.61 3
## 5 79205358 9 1 1 1 2.61 4
## 6 79202442 11 2 1 6 2.61 4
## 7 79203549 10 1 5 4 2.61 3
## 8 79203943 10 2 1 1 2.61 3
## 9 79204576 10 1 1 2 2.61 3
## 10 79200826 10 1 6 6 2.61 3
## # ℹ 6,880 more rows
## # ℹ 9 more variables: ST097Q02TA <dbl>, ST097Q03TA <dbl>, ST097Q04TA <dbl>,
## # ST097Q05TA <dbl>, ODOKUMA1 <dbl>, ODOKUMA2 <dbl>, ODOKUMA3 <dbl>,
## # ODOKUMA4 <dbl>, ODOKUMA5 <dbl>
arrange(midiPISA,desc(OKUMA_ZEVK))
## # A tibble: 6,890 × 16
## OGRENCIID SINIF CINSIYET Anne_Egitim Baba_Egitim OKUMA_ZEVK ST097Q01TA
## <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 79206987 10 1 5 4 2.66 3
## 2 79204432 10 1 2 1 2.66 3
## 3 79206337 10 1 3 4 2.66 4
## 4 79203300 9 1 4 4 2.61 3
## 5 79205358 9 1 1 1 2.61 4
## 6 79202442 11 2 1 6 2.61 4
## 7 79203549 10 1 5 4 2.61 3
## 8 79203943 10 2 1 1 2.61 3
## 9 79204576 10 1 1 2 2.61 3
## 10 79200826 10 1 6 6 2.61 3
## # ℹ 6,880 more rows
## # ℹ 9 more variables: ST097Q02TA <dbl>, ST097Q03TA <dbl>, ST097Q04TA <dbl>,
## # ST097Q05TA <dbl>, ODOKUMA1 <dbl>, ODOKUMA2 <dbl>, ODOKUMA3 <dbl>,
## # ODOKUMA4 <dbl>, ODOKUMA5 <dbl>
Arrange ve Select Bir arada
midiPISA %>%
select(OGRENCIID,ST097Q01TA,ST097Q04TA,OKUMA_ZEVK) %>% #değişkenlerin seçimi
arrange(OKUMA_ZEVK)%>% # değişkendeki gözlemleri sıralama
head(6) #ilk 6 satırın görüntülenmesi
## # A tibble: 6 × 4
## OGRENCIID ST097Q01TA ST097Q04TA OKUMA_ZEVK
## <dbl> <dbl> <dbl> <dbl>
## 1 79204460 1 1 -2.73
## 2 79201124 1 1 -2.71
## 3 79204401 3 2 -2.71
## 4 79206724 1 3 -2.71
## 5 79204126 4 4 -2.71
## 6 79205685 3 3 -2.71
Rename Fonksiyonu
midiPISA %>%
select(ODOKUMA1,ODOKUMA2)%>%
rename(okumapuan1=ODOKUMA1,okumapuan2=ODOKUMA2) %>%
head(3)
## # A tibble: 3 × 2
## okumapuan1 okumapuan2
## <dbl> <dbl>
## 1 376. 418.
## 2 512. 473.
## 3 396. 414.
Rename olmadan seçimle isim değiştirme
midiPISA %>%
select(OGRENCIID,ST097Q02TA,ST097Q03TA, okumapuan1=ODOKUMA1) %>%
head(3)
## # A tibble: 3 × 4
## OGRENCIID ST097Q02TA ST097Q03TA okumapuan1
## <dbl> <dbl> <dbl> <dbl>
## 1 79200768 2 1 376.
## 2 79201064 2 3 512.
## 3 79201118 3 3 396.
zevk<- select(midiPISA, starts_with("ST097"))
zevk%>%
mutate(toplam =ST097Q01TA+ST097Q02TA+ST097Q03TA+ST097Q04TA+ST097Q05TA) %>%
head(3)
## # A tibble: 3 × 6
## ST097Q01TA ST097Q02TA ST097Q03TA ST097Q04TA ST097Q05TA toplam
## <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 1 2 1 1 1 6
## 2 3 2 3 3 3 14
## 3 2 3 3 3 3 14
zevk %>%
mutate(toplam=rowSums(across(ST097Q01TA:ST097Q05TA))) %>% #across son satırdan ilk satıra kadar alıyor
head(3)
## # A tibble: 3 × 6
## ST097Q01TA ST097Q02TA ST097Q03TA ST097Q04TA ST097Q05TA toplam
## <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 1 2 1 1 1 6
## 2 3 2 3 3 3 14
## 3 2 3 3 3 3 14
Yeni eklenen değişkenin yerini belirlemek
zevk %>%
mutate(toplam=rowSums(across(ST097Q01TA:ST097Q05TA)),
.before= ST097Q01TA)%>%
head(3)
## # A tibble: 3 × 6
## toplam ST097Q01TA ST097Q02TA ST097Q03TA ST097Q04TA ST097Q05TA
## <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 6 1 2 1 1 1
## 2 14 3 2 3 3 3
## 3 14 2 3 3 3 3
zevk %>%
transmute(toplam=rowSums(across(ST097Q01TA:ST097Q05TA))) %>%
head(2)
## # A tibble: 2 × 1
## toplam
## <dbl>
## 1 6
## 2 14
IFELSE
x <- c(-2,1,-1,-3,3)
ifelse(x<0,"Negatif", "Pozitif")
## [1] "Negatif" "Pozitif" "Negatif" "Negatif" "Pozitif"
Burada SINIF değişkenini kullanarak ortaokul ve lise olmak üzere iki düzeyli OKUL adlı bir değişken oluşturalım. Oluşturulacak yeni değişken “ortaokul” ve “lise” olmak üzere iki kategorili olup 7. ve 8. sınıflar ortaokul diğer sınıflar ise lise olarak kodlanmıştır.
Okultur <- midiPISA %>%
select(1:5) %>% #ilk beş değişkenin seçimi
mutate(okul = ifelse(SINIF == 7 | SINIF == 8,
"Ortaokul", "Lise")) %>% # okul değişkeninin veri setine eklenmesi
arrange(SINIF) # veri setinin SINIF değişkenine göre sıralanması
tail(Okultur)
## # A tibble: 6 × 6
## OGRENCIID SINIF CINSIYET Anne_Egitim Baba_Egitim okul
## <dbl> <dbl> <dbl> <dbl> <dbl> <chr>
## 1 79203092 12 1 0 1 Lise
## 2 79204140 12 2 0 1 Lise
## 3 79200174 12 1 5 5 Lise
## 4 79206519 12 1 0 0 Lise
## 5 79205173 12 1 5 5 Lise
## 6 79201478 12 1 0 1 Lise
head(Okultur,3)
## # A tibble: 3 × 6
## OGRENCIID SINIF CINSIYET Anne_Egitim Baba_Egitim okul
## <dbl> <dbl> <dbl> <dbl> <dbl> <chr>
## 1 79204097 7 1 2 2 Ortaokul
## 2 79207110 7 2 6 1 Ortaokul
## 3 79202600 7 2 NA NA Ortaokul
CASEWHEN
v1 <- midiPISA %>%
mutate(ODOKUMA1_kategorik =
case_when(
ODOKUMA1 <= 402.6 ~ "dusuk",
ODOKUMA1 > 402.6 & ODOKUMA1 < 525.7 ~ "orta",
ODOKUMA1 >=525.7 ~ "yuksek" )) %>%
select(ODOKUMA1,ODOKUMA1_kategorik)
head(v1)
## # A tibble: 6 × 2
## ODOKUMA1 ODOKUMA1_kategorik
## <dbl> <chr>
## 1 376. dusuk
## 2 512. orta
## 3 396. dusuk
## 4 393. dusuk
## 5 552. yuksek
## 6 441. orta
v2 <- midiPISA %>%
mutate(ODOKUMA1_kategorik = ifelse(
ODOKUMA1 <= 402.6, "dusuk",
ifelse(ODOKUMA1 < 525.7, "orta", "yuksek")
)) %>%
select(ODOKUMA1, ODOKUMA1_kategorik)
head(v2)
## # A tibble: 6 × 2
## ODOKUMA1 ODOKUMA1_kategorik
## <dbl> <chr>
## 1 376. dusuk
## 2 512. orta
## 3 396. dusuk
## 4 393. dusuk
## 5 552. yuksek
## 6 441. orta
#3 kategori olduğu için iki kere ifelse yapmamız gerekti
library(knitr)
#v1%>%
#group_by(ODOKUMA1_kategorik) %>%
#summarise(ort= mean(ODOKUMA1),
#sd=(ODOKUMA1)) %>% #kategorik değişkenin kategorilerine göre sıralama
#kable(digits=2,
#col.names= c("kategori", "ort", "sd"))
v2 %>% group_by(ODOKUMA1_kategorik) %>% summarise(f=n())
## # A tibble: 3 × 2
## ODOKUMA1_kategorik f
## <chr> <int>
## 1 dusuk 1724
## 2 orta 3443
## 3 yuksek 1723
Bölüm 2 Veri Düzenleme II
v1 %>% count(ODOKUMA1_kategorik)
## # A tibble: 3 × 2
## ODOKUMA1_kategorik n
## <chr> <int>
## 1 dusuk 1724
## 2 orta 3443
## 3 yuksek 1723
v1 %>% group_by(ODOKUMA1_kategorik) %>% summarise(n=n())
## # A tibble: 3 × 2
## ODOKUMA1_kategorik n
## <chr> <int>
## 1 dusuk 1724
## 2 orta 3443
## 3 yuksek 1723
midiPISA %>%
group_by(CINSIYET) %>%
summarise(n = n(),ortalama=mean(ODOKUMA1),sd=sd(ODOKUMA1),min=min(ODOKUMA1),max=max(ODOKUMA1))
## # A tibble: 2 × 6
## CINSIYET n ortalama sd min max
## <dbl> <int> <dbl> <dbl> <dbl> <dbl>
## 1 1 3396 478. 83.7 236. 772.
## 2 2 3494 451. 89.6 176. 747.