1 VERI DUZENLEME ODEV 1

  • BASLANGIC: 11:26
  • BITIS: 11:59
    • 33 DK

1.0.1 1. SORU

  1. Veri setini TUR, bilgi dosyasını ise bilgi adlı nesneler olmak üzere R ortamına aktarınız.
library(haven)
TUR <- read_sav("C:/Users/USER/OneDrive/Desktop/BSATURM6.sav")
TUR # veri seti
## # A tibble: 6,079 × 603
##    IDCNTRY   IDBOOK     IDSCHOOL IDCLASS IDSTUD M042182 M042081  M042049 M042052
##    <dbl+lbl> <dbl+lbl>  <dbl+lb> <dbl+l> <dbl+> <dbl+l> <dbl+lb> <dbl+l> <dbl+l>
##  1 792        6 [Bookl… 1        102     10201  NA      NA       NA      NA     
##  2 792        7 [Bookl… 1        102     10202  NA      NA       NA      NA     
##  3 792        8 [Bookl… 1        102     10203  NA      NA       NA      NA     
##  4 792        9 [Bookl… 1        102     10204  NA      NA       NA      NA     
##  5 792       10 [Bookl… 1        102     10205  NA      NA       NA      NA     
##  6 792       11 [Bookl… 1        102     10206  NA      NA       NA      NA     
##  7 792       12 [Bookl… 1        102     10207  NA      NA       NA      NA     
##  8 792       13 [Bookl… 1        102     10208  NA      NA       NA      NA     
##  9 792       14 [Bookl… 1        102     10209   4 [D]  79 [INC…  3 [C*]  4 [D] 
## 10 792        1 [Bookl… 1        102     10210   1 [A]  79 [INC…  3 [C*]  1 [A*]
## # ℹ 6,069 more rows
## # ℹ 594 more variables: M042076 <dbl+lbl>, M042302A <dbl+lbl>,
## #   M042302B <dbl+lbl>, M042302C <dbl+lbl>, M042100 <dbl+lbl>,
## #   M042202 <dbl+lbl>, M042240 <dbl+lbl>, M042093 <dbl+lbl>, M042271 <dbl+lbl>,
## #   M042268 <dbl+lbl>, M042159 <dbl+lbl>, M042164 <dbl+lbl>, M042167 <dbl+lbl>,
## #   M062208A <dbl+lbl>, M062208B <dbl+lbl>, M062208C <dbl+lbl>,
## #   M062208D <dbl+lbl>, M062208 <dbl+lbl>, M062153 <dbl+lbl>, …
library(readxl)
bilgi <- read_excel("C:/Users/USER/OneDrive/Desktop/T15_G8_ItemInformation.xlsx")
bilgi # bilgi dosyası
## # A tibble: 225 × 17
##    `Item ID` Block `Block Seq` Grade Subject Cycle `Secured\r\nStatus`
##    <chr>     <chr> <chr>       <dbl> <chr>   <dbl> <chr>              
##  1 M042182   M01   01              8 M           4 Restricted Use     
##  2 M042081   M01   02              8 M           4 Restricted Use     
##  3 M042049   M01   03              8 M           4 Restricted Use     
##  4 M042052   M01   04              8 M           4 Restricted Use     
##  5 M042076   M01   05              8 M           4 Restricted Use     
##  6 M042302A  M01   06A             8 M           4 Restricted Use     
##  7 M042302B  M01   06B             8 M           4 Restricted Use     
##  8 M042302C  M01   06C             8 M           4 Restricted Use     
##  9 M042100   M01   07              8 M           4 Restricted Use     
## 10 M042202   M01   08              8 M           4 Restricted Use     
## # ℹ 215 more rows
## # ℹ 10 more variables: `Scaling\r\nStatus` <chr>, `Content Domain` <chr>,
## #   `Topic Area` <chr>, Topic <dbl>, `Cognitive Domain` <chr>,
## #   `Item Type` <chr>, Options <chr>, Key <chr>, `Maximum Points` <dbl>,
## #   Label <chr>

1.0.2 2. SORU

  1. Veri setinden “IDCNTRY”,“IDSTUD”,“IDBOOK” ve M0 ile başlayan değişkenleri seçiniz. M0 ile başlayan değişkenler maddelerdir.Bu işlem sonrasında 6079 gözlem ve 228 sütuna sahip olacaksınız.
library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
TUR_2 <- TUR %>% 
  dplyr::select(IDCNTRY, IDSTUD, IDBOOK, starts_with("M0"))
head(TUR_2)
## # A tibble: 6 × 228
##   IDCNTRY   IDSTUD    IDBOOK    M042182 M042081 M042049 M042052 M042076 M042302A
##   <dbl+lbl> <dbl+lbl> <dbl+lbl> <dbl+l> <dbl+l> <dbl+l> <dbl+l> <dbl+l> <dbl+lb>
## 1 792       10201      6 [Book… NA      NA      NA      NA      NA      NA      
## 2 792       10202      7 [Book… NA      NA      NA      NA      NA      NA      
## 3 792       10203      8 [Book… NA      NA      NA      NA      NA      NA      
## 4 792       10204      9 [Book… NA      NA      NA      NA      NA      NA      
## 5 792       10205     10 [Book… NA      NA      NA      NA      NA      NA      
## 6 792       10206     11 [Book… NA      NA      NA      NA      NA      NA      
## # ℹ 219 more variables: M042302B <dbl+lbl>, M042302C <dbl+lbl>,
## #   M042100 <dbl+lbl>, M042202 <dbl+lbl>, M042240 <dbl+lbl>, M042093 <dbl+lbl>,
## #   M042271 <dbl+lbl>, M042268 <dbl+lbl>, M042159 <dbl+lbl>, M042164 <dbl+lbl>,
## #   M042167 <dbl+lbl>, M062208A <dbl+lbl>, M062208B <dbl+lbl>,
## #   M062208C <dbl+lbl>, M062208D <dbl+lbl>, M062208 <dbl+lbl>,
## #   M062153 <dbl+lbl>, M062111A <dbl+lbl>, M062111B <dbl+lbl>,
## #   M062237 <dbl+lbl>, M062314 <dbl+lbl>, M062074 <dbl+lbl>, …
#6079 birey ve 228 degiskenli set elde edilmistir.

1.0.3 3. SORU

  1. M062345B, M062345BA, M062345BB, M062345BC, M062345BD, M062342, M062048, M062048A, M062048B, ve M062048C olmak üzere 10 madde Türkiye veriseinde uygulanmamıstır, bu değişkenleri veriseti nesnesinden siliniz.
library(dplyr)
veri_seti <- TUR_2 %>% 
  dplyr::select(-c("M062345B", "M062345BA", "M062345BB", "M062345BC", "M062345BD", "M062342", "M062048", "M062048A", "M062048B", "M062048C"))
head(veri_seti)
## # A tibble: 6 × 218
##   IDCNTRY   IDSTUD    IDBOOK    M042182 M042081 M042049 M042052 M042076 M042302A
##   <dbl+lbl> <dbl+lbl> <dbl+lbl> <dbl+l> <dbl+l> <dbl+l> <dbl+l> <dbl+l> <dbl+lb>
## 1 792       10201      6 [Book… NA      NA      NA      NA      NA      NA      
## 2 792       10202      7 [Book… NA      NA      NA      NA      NA      NA      
## 3 792       10203      8 [Book… NA      NA      NA      NA      NA      NA      
## 4 792       10204      9 [Book… NA      NA      NA      NA      NA      NA      
## 5 792       10205     10 [Book… NA      NA      NA      NA      NA      NA      
## 6 792       10206     11 [Book… NA      NA      NA      NA      NA      NA      
## # ℹ 209 more variables: M042302B <dbl+lbl>, M042302C <dbl+lbl>,
## #   M042100 <dbl+lbl>, M042202 <dbl+lbl>, M042240 <dbl+lbl>, M042093 <dbl+lbl>,
## #   M042271 <dbl+lbl>, M042268 <dbl+lbl>, M042159 <dbl+lbl>, M042164 <dbl+lbl>,
## #   M042167 <dbl+lbl>, M062208A <dbl+lbl>, M062208B <dbl+lbl>,
## #   M062208C <dbl+lbl>, M062208D <dbl+lbl>, M062208 <dbl+lbl>,
## #   M062153 <dbl+lbl>, M062111A <dbl+lbl>, M062111B <dbl+lbl>,
## #   M062237 <dbl+lbl>, M062314 <dbl+lbl>, M062074 <dbl+lbl>, …

1.0.4 4. SORU

  1. Bilgi nesnesinden uygulanmayan 10 maddeye ilişkin satırları siliniz. Item ID sütunu madde isimlerini içermektedir.
silinecek <- c("M062345B", "M062345BA", "M062345BB", "M062345BC", "M062345BD", 
                                "M062342", "M062048", "M062048A", "M062048B", "M062048C")

bilgi_2 <- bilgi %>% 
  filter(!(bilgi$"Item ID" %in% silinecek))
head(bilgi_2)
## # A tibble: 6 × 17
##   `Item ID` Block `Block Seq` Grade Subject Cycle `Secured\r\nStatus`
##   <chr>     <chr> <chr>       <dbl> <chr>   <dbl> <chr>              
## 1 M042182   M01   01              8 M           4 Restricted Use     
## 2 M042081   M01   02              8 M           4 Restricted Use     
## 3 M042049   M01   03              8 M           4 Restricted Use     
## 4 M042052   M01   04              8 M           4 Restricted Use     
## 5 M042076   M01   05              8 M           4 Restricted Use     
## 6 M042302A  M01   06A             8 M           4 Restricted Use     
## # ℹ 10 more variables: `Scaling\r\nStatus` <chr>, `Content Domain` <chr>,
## #   `Topic Area` <chr>, Topic <dbl>, `Cognitive Domain` <chr>,
## #   `Item Type` <chr>, Options <chr>, Key <chr>, `Maximum Points` <dbl>,
## #   Label <chr>

1.0.5 5. SORU

  1. Bilgi nesnesinde Key sütunu “A”,“B”,“C”,“D” and “-” içermektedir.
  • ”A”,“B”,“C”,“D” çoktan seçmelimaddelerin doğru cevaplarıdır.
  • ”-” ise kısmi puanlanan madeleleri göstermektedir.
  • Bunu Item Type sütununda da anlayabilirsiniz.
  • Veri setinden madde cevaplarının 1,2,3,4,10 ve 20 şeklinde kodlanmıştır.
  • 1-A,2-B,3-C,4-D seçeneğine karşılık gelir.
  • Kısmı puanlanan maddeler ise bilgi nesnesin Maximum Points sütununa göre 1 10,2 ise 20 puan olacak şekilde kodlanmıştır.

NOT: Sizden beklenen maddeleri 1-0 da dönüştürmenizdir. Bu işlemi CTT paketini kullanarak yapabilirsiniz.

library(CTT)

bilgi_2 <- bilgi_2 %>%
  mutate(
    Cevap_Kodu = case_when(
      Key == "A" ~ 1,
      Key == "B" ~ 2,
      Key == "C" ~ 3,
      Key == "D" ~ 4,
      Key == "-" & bilgi_2$"Maximum Points" == 1 ~ 10,
      Key == "-" & bilgi_2$"Maximum Points" == 2 ~ 20)
)
head(bilgi_2)
## # A tibble: 6 × 18
##   `Item ID` Block `Block Seq` Grade Subject Cycle `Secured\r\nStatus`
##   <chr>     <chr> <chr>       <dbl> <chr>   <dbl> <chr>              
## 1 M042182   M01   01              8 M           4 Restricted Use     
## 2 M042081   M01   02              8 M           4 Restricted Use     
## 3 M042049   M01   03              8 M           4 Restricted Use     
## 4 M042052   M01   04              8 M           4 Restricted Use     
## 5 M042076   M01   05              8 M           4 Restricted Use     
## 6 M042302A  M01   06A             8 M           4 Restricted Use     
## # ℹ 11 more variables: `Scaling\r\nStatus` <chr>, `Content Domain` <chr>,
## #   `Topic Area` <chr>, Topic <dbl>, `Cognitive Domain` <chr>,
## #   `Item Type` <chr>, Options <chr>, Key <chr>, `Maximum Points` <dbl>,
## #   Label <chr>, Cevap_Kodu <dbl>
bilgi_2 <- bilgi_2 %>%
  mutate(
    Kısmi_puanlar = case_when(
      Options == Cevap_Kodu ~ 1,
      Options == "-" & bilgi_2$Cevap_Kodu == 10 ~ 10,
      Options == "-" & bilgi_2$Cevap_Kodu == 20 ~ 20,
      TRUE ~ 0)
)
head(bilgi_2)
## # A tibble: 6 × 19
##   `Item ID` Block `Block Seq` Grade Subject Cycle `Secured\r\nStatus`
##   <chr>     <chr> <chr>       <dbl> <chr>   <dbl> <chr>              
## 1 M042182   M01   01              8 M           4 Restricted Use     
## 2 M042081   M01   02              8 M           4 Restricted Use     
## 3 M042049   M01   03              8 M           4 Restricted Use     
## 4 M042052   M01   04              8 M           4 Restricted Use     
## 5 M042076   M01   05              8 M           4 Restricted Use     
## 6 M042302A  M01   06A             8 M           4 Restricted Use     
## # ℹ 12 more variables: `Scaling\r\nStatus` <chr>, `Content Domain` <chr>,
## #   `Topic Area` <chr>, Topic <dbl>, `Cognitive Domain` <chr>,
## #   `Item Type` <chr>, Options <chr>, Key <chr>, `Maximum Points` <dbl>,
## #   Label <chr>, Cevap_Kodu <dbl>, Kısmi_puanlar <dbl>