Betimsel İstatistikler

library(dplyr)
library(sjlabelled)
## 
## Attaching package: 'sjlabelled'
## The following object is masked from 'package:dplyr':
## 
##     as_label
## The following object is masked from 'package:ggplot2':
## 
##     as_label
load("C:/Users/huawei/Desktop/OLC731/RPROJE/hft8/data/midiPISA.rda")
load("C:/Users/huawei/Desktop/OLC731/RPROJE/hft8/data/miniPISA.rda")

miniPISA<- miniPISA %>% mutate_if(is_labelled, sjlabelled::as_factor)
# Faktör değiskenlere düzey atama amacıyla yazılan fonksiyon
levelsnames <- function(x){
  levels(x) <- names(attr(x,"labels"))
  x
}
# yazılan fonksiyonun faktör değişkenlere uygulanması
miniPISA <-mutate_if(miniPISA,is.factor, levelsnames)
head(miniPISA)
## # A tibble: 6 × 11
##   SINIF    CINSIYET KITAPSAYISI      SES Anne_Egitim Baba_Egitim OKUMA_ZEVK
##   <fct>    <fct>    <fct>          <dbl> <fct>       <fct>            <dbl>
## 1 SINIF 10 Erkek    11-25 kitap  -2.45   Ortaokul    Ortaokul        -0.289
## 2 SINIF 10 Erkek    26-100 kitap -2.10   Ortaokul    Ortaokul         0.604
## 3 SINIF 10 Kiz      0-10 kitap   -2.27   Ilkokul     Ortaokul         0.638
## 4 SINIF 9  Erkek    0-10 kitap    0.0324 Lisans ustu Lisans ustu     -1.15 
## 5 SINIF 9  Erkek    11-25 kitap  -0.0674 Onlisans    Onlisans         0.667
## 6 SINIF 10 Erkek    11-25 kitap   0.398  Onlisans    Lisans ustu      0.357
## # ℹ 4 more variables: OK_YETERLIK <dbl>, Okuloncesi_yil <fct>, OKUL_TUR <fct>,
## #   ODOKUMA1 <dbl>
midiPISA <- midiPISA %>% mutate_if(is_labelled, sjlabelled::as_factor)
# Faktör değiskenlere düzey atama amacıyla yazılan fonksiyon
levelsnames <- function(x){
  levels(x) <- names(attr(x,"labels"))
  x
}
# yazılan fonksiyonun faktör değişkenlere uygulanması
midiPISA <-mutate_if(midiPISA,is.factor, levelsnames)
head(midiPISA)
## # A tibble: 6 × 16
##   OGRENCIID SINIF    CINSIYET Anne_Egitim Baba_Egitim OKUMA_ZEVK ST097Q01TA     
##       <dbl> <fct>    <fct>    <fct>       <fct>            <dbl> <fct>          
## 1  79200768 SINIF 10 Erkek    Ortaokul    Ortaokul        -0.289 Her ders       
## 2  79201064 SINIF 10 Erkek    Ortaokul    Ortaokul         0.604 cogunlukla tes…
## 3  79201118 SINIF 10 Kiz      Ilkokul     Ortaokul         0.638 Derslerin cogu…
## 4  79201275 SINIF 9  Erkek    Lisans ustu Lisans ustu     -1.15  Derslerin cogu…
## 5  79201481 SINIF 9  Erkek    Onlisans    Onlisans         0.667 cogunlukla tes…
## 6  79201556 SINIF 10 Erkek    Onlisans    Lisans ustu      0.357 cogunlukla tes…
## # ℹ 9 more variables: ST097Q02TA <fct>, ST097Q03TA <fct>, ST097Q04TA <fct>,
## #   ST097Q05TA <fct>, ODOKUMA1 <dbl>, ODOKUMA2 <dbl>, ODOKUMA3 <dbl>,
## #   ODOKUMA4 <dbl>, ODOKUMA5 <dbl>
min(midiPISA$ODOKUMA1)
## [1] 175.608

##Standart sapma ve varyans

midiPISA %>% 
 select(starts_with("OD") & contains("MA")) %>% 
  lapply(.,sd)
## $ODOKUMA1
## [1] 87.78006
## 
## $ODOKUMA2
## [1] 87.696
## 
## $ODOKUMA3
## [1] 87.07692
## 
## $ODOKUMA4
## [1] 87.40305
## 
## $ODOKUMA5
## [1] 87.21323

psych paketindeki describe() fonksiyonunun kullanımı

library(psych)
## 
## Attaching package: 'psych'
## The following objects are masked from 'package:ggplot2':
## 
##     %+%, alpha
## The following objects are masked from 'package:scales':
## 
##     alpha, rescale
describe(midiPISA %>% 
  select(CINSIYET,ODOKUMA1))
##           vars    n   mean    sd median trimmed   mad    min    max range  skew
## CINSIYET*    1 6890   1.51  0.50    2.0    1.51  0.00   1.00   2.00   1.0 -0.03
## ODOKUMA1     2 6890 464.23 87.78  463.4  463.90 91.11 175.61 771.51 595.9  0.04
##           kurtosis   se
## CINSIYET*     -2.0 0.01
## ODOKUMA1      -0.3 1.06
library(pastecs) 
## 
## Attaching package: 'pastecs'
## The following objects are masked from 'package:dplyr':
## 
##     first, last
round(stat.desc(midiPISA %>% 
  select(CINSIYET,OKUMA_ZEVK)),2) 
##          CINSIYET OKUMA_ZEVK
## nbr.val        NA    6821.00
## nbr.null       NA       0.00
## nbr.na         NA      69.00
## min            NA      -2.73
## max            NA       2.66
## range          NA       5.39
## sum            NA    4659.70
## median         NA       0.64
## mean           NA       0.68
## SE.mean        NA       0.01
## CI.mean        NA       0.02
## var            NA       0.95
## std.dev        NA       0.98
## coef.var       NA       1.43

Frekans tablosu oluÅŸturma

#pipe operatörü ctrl+shift+m

midiPISA %>%
  group_by(Anne_Egitim) %>% 
  count() %>%  
  ungroup(Anne_Egitim) 
## # A tibble: 8 × 2
##   Anne_Egitim     n
##   <fct>       <int>
## 1 Okul oncesi   695
## 2 Ilkokul      1882
## 3 Ortaokul     1362
## 4 Lise          575
## 5 Onlisans      675
## 6 Lisans        759
## 7 Lisans ustu   887
## 8 <NA>           55
library(dplyr)
library(magrittr)
## 
## Attaching package: 'magrittr'
## The following object is masked from 'package:pastecs':
## 
##     extract
library(haven)
## 
## Attaching package: 'haven'
## The following objects are masked from 'package:sjlabelled':
## 
##     as_factor, read_sas, read_spss, read_stata, write_sas, zap_labels
library(plotly)
## 
## Attaching package: 'plotly'
## The following object is masked from 'package:ggplot2':
## 
##     last_plot
## The following object is masked from 'package:stats':
## 
##     filter
## The following object is masked from 'package:graphics':
## 
##     layout
load("C:/Users/huawei/Desktop/OLC731/RPROJE/hft8/data/PISA_OGR_2018.rda")
library(tuev)
data("PISA_OGR_2018")
# miniPISA <- PISA_OGR_2018 %>%
# select(CINSIYET, SINIF,KITAPSAYISI, SES, Anne_Egitim, 
# Baba_Egitim,Okuloncesi_yil,OKUL_TUR,OKUMA_ZEVK,
#        OK_YETERLIK,ODOKUMA1)  
ggplot(miniPISA, aes(x=ODOKUMA1))+
  geom_density(linetype="dashed", fill="green")

Histogram OluÅŸturma

library(ggplot2)

grafik_1 <- ggplot(miniPISA, aes(x=ODOKUMA1)) 
grafik_1 

grafik_1 + geom_histogram()
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.

Yüzey ekleme

grafik_1 +
  geom_histogram()  +       
  facet_wrap(~CINSIYET, ncol=2)
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.

library(dplyr) library(haven)

ggplot(miniPISA, aes(x=ODOKUMA1)) +
  geom_histogram()+  #histogram çizilmesi
  facet_grid(SINIF~CINSIYET) # sınıf ve cinsiyete göre yüzey eklenmesi
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.

ggplot(miniPISA,aes(x=ODOKUMA1))+
  geom_histogram()+ 
  facet_grid(.~CINSIYET)
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.

ggplot(miniPISA,aes(x=ODOKUMA1))+
  geom_histogram()+  # #histogram çizilmesi
  facet_grid(CINSIYET~.) # yüzeylerin satırda oluşturulması
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.

mini pısa veri setinde sadece 9 sınıf öğrencilerinin okuma puanları ve cinsiyete göre histogram

library(dplyr)

df1 <- miniPISA %>% 
      group_by(SINIF,CINSIYET) %>% 
      mutate(ort=mean(ODOKUMA1)) %>%
        ungroup()
 ggplot(df1
      ,
     aes(x=SINIF, y=ort, color=CINSIYET )) + 
  geom_point() +  
  xlab("Sınıf Duzeyi")+
  ylab("Ortalama Puan")

 ggplot(miniPISA %>% filter(SINIF=="SINIF 9"), aes(x=ODOKUMA1)) +
  geom_histogram()+  
  facet_grid(SINIF~CINSIYET) 
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.

library(magrittr)

ggplot(miniPISA,aes(x=ODOKUMA1, y=OKUMA_ZEVK, color=CINSIYET)) + 
  geom_point() +  #saçılım grafiği çizilmesi
  facet_grid(.~SINIF)   
## Warning: Removed 69 rows containing missing values or values outside the scale range
## (`geom_point()`).

library(ggplot2)

ggplot(miniPISA,aes(x=ODOKUMA1, y=OKUMA_ZEVK, color=CINSIYET)) + 
  geom_point() +  
  facet_grid(.~SINIF) 
## Warning: Removed 69 rows containing missing values or values outside the scale range
## (`geom_point()`).

library(esquisse)

# esquisser()

Gruplama DeÄŸiÅŸkenleri

p1 <- ggplot(
      miniPISA %>% 
      group_by(SINIF,CINSIYET) %>% 
      mutate(ort=mean(ODOKUMA1)) %>%  
        ungroup(), 
     aes(x=SINIF, y=ort, color=CINSIYET )) + 
  geom_point() +  
  xlab("Sınıf Düzeyi")+
  ylab("Ortalama Puan")

p1

 sekiller <- data.frame(sekil = 0:24)
ggplot(sekiller, aes(0, 0, shape = sekil)) +
  geom_point(aes(shape = sekil), size = 5, fill = 'blue') +
  scale_shape_identity() +
  facet_wrap(~sekil) +
  theme_void()

ggplot(miniPISA, aes(x = ODOKUMA1,
y = OK_YETERLIK,
color = CINSIYET)) +
geom_point(position = "jitter") +
scale_x_continuous("Okuma Puanları",limits = c(100,900),
         breaks=seq(100,900,100)) +
  scale_color_discrete("Cinsiyet")
## Warning: Removed 199 rows containing missing values or values outside the scale range
## (`geom_point()`).

ggplot(miniPISA, aes(CINSIYET, fill = SINIF)) + geom_bar() + 
  labs(x = "Cinsiyet",
       y = "Frekans")

ggplot(data = miniPISA, mapping = aes(x = CINSIYET)) +
  geom_bar()