Betimsel İstatistikler

library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
load("C:/Users/huawei/Desktop/OLC731/RPROJE/hft8/data/midiPISA.rda")
min(midiPISA$ODOKUMA1)
## [1] 175.608

Standart sapma ve varyans

midiPISA %>% 
 select(starts_with("OD") & contains("MA")) %>% 
  lapply(.,sd)
## $ODOKUMA1
## [1] 87.78006
## 
## $ODOKUMA2
## [1] 87.696
## 
## $ODOKUMA3
## [1] 87.07692
## 
## $ODOKUMA4
## [1] 87.40305
## 
## $ODOKUMA5
## [1] 87.21323

psych paketindeki describe() fonksiyonunun kullanımı

library(psych)
describe(midiPISA %>% 
  select(CINSIYET,ODOKUMA1))
##          vars    n   mean    sd median trimmed   mad    min    max range  skew
## CINSIYET    1 6890   1.51  0.50    2.0    1.51  0.00   1.00   2.00   1.0 -0.03
## ODOKUMA1    2 6890 464.23 87.78  463.4  463.90 91.11 175.61 771.51 595.9  0.04
##          kurtosis   se
## CINSIYET     -2.0 0.01
## ODOKUMA1     -0.3 1.06
library(pastecs) 
## 
## Attaching package: 'pastecs'
## The following objects are masked from 'package:dplyr':
## 
##     first, last
round(stat.desc(midiPISA %>% 
  select(CINSIYET,OKUMA_ZEVK)),2) 
##              CINSIYET OKUMA_ZEVK
## nbr.val       6890.00    6821.00
## nbr.null         0.00       0.00
## nbr.na           0.00      69.00
## min              1.00      -2.73
## max              2.00       2.66
## range            1.00       5.39
## sum          10384.00    4659.70
## median           2.00       0.64
## mean             1.51       0.68
## SE.mean          0.01       0.01
## CI.mean.0.95     0.01       0.02
## var              0.25       0.95
## std.dev          0.50       0.98
## coef.var         0.33       1.43

Frekans tablosu oluşturma

midiPISA veri setinden %>% operatörünü kullanarak Anne_Eğitim verisini ayıralım.

UNUTMA! pipe operatörü ctrl+shift+m

midiPISA %>%
  group_by(Anne_Egitim) %>% 
  count() %>%  
  ungroup(Anne_Egitim) 
## # A tibble: 8 × 2
##   Anne_Egitim     n
##    <hvn_lbll> <int>
## 1           0   695
## 2           1  1882
## 3           2  1362
## 4           3   575
## 5           4   675
## 6           5   759
## 7           6   887
## 8          NA    55

Aşağıdaki paketleri Hiistogram için yüklemek ve tabii kütüphaneden çağırmak gerekiyor.

Ardından #PISA_OGR_2018 veri setini yüklemeliyiz.

library(dplyr)
library(magrittr)
## 
## Attaching package: 'magrittr'
## The following object is masked from 'package:pastecs':
## 
##     extract
library(haven)
library(plotly)
## Loading required package: ggplot2
## 
## Attaching package: 'ggplot2'
## The following objects are masked from 'package:psych':
## 
##     %+%, alpha
## 
## Attaching package: 'plotly'
## The following object is masked from 'package:ggplot2':
## 
##     last_plot
## The following object is masked from 'package:stats':
## 
##     filter
## The following object is masked from 'package:graphics':
## 
##     layout
load("C:/Users/huawei/Desktop/OLC731/RPROJE/hft8/data/PISA_OGR_2018.rda")
library(tuev)
data("PISA_OGR_2018")

Veri setinden aşağıdaki değişkenleri seçip devam edelim:

miniPISA <- PISA_OGR_2018 %>%
select(CINSIYET, SINIF,KITAPSAYISI, SES, Anne_Egitim, Baba_Egitim,Okuloncesi_yil,OKUL_TUR,OKUMA_ZEVK,
       OK_YETERLIK,ODOKUMA1)  

Rengi istediğimiz gibi seçebiliyoruz. miniPISA veri setinden aes fonksiyonu ile atama:

ggplot(miniPISA, aes(x=ODOKUMA1))+
  geom_density(linetype="dashed", fill="green")

Histogram Oluşturma

Önce ggplot2 paketini çağıralım.

library(ggplot2)

grafik_1 <- ggplot(miniPISA, aes(x=ODOKUMA1)) 
grafik_1 

grafik_1 + geom_histogram()
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.

Yüzey ekleme

Kitaptaki bölümü tekrar etmeliyiz. Aşağıda geom_histogram kodu ile grafiğe yüzey ekleyebiliyorz.

grafik_1 +
  geom_histogram()  +       
  facet_wrap(~CINSIYET, ncol=2)
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.

Kütüphaneden #dplyr paketi ile #haven paketini çağıralım:

library(dplyr) library(haven)

Önce geom ile histogram ekliyoruz. Ardından facet_grid kullanarak yüzeyler ekleyebiliyorz:

ggplot(miniPISA, aes(x=ODOKUMA1)) +
  geom_histogram()+  
  facet_grid(SINIF~CINSIYET) 
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.

ggplot(miniPISA,aes(x=ODOKUMA1))+
  geom_histogram()+ 
  facet_grid(.~CINSIYET)
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.

yüzeylerin satırda oluşturulması:

ggplot(miniPISA,aes(x=ODOKUMA1))+
  geom_histogram()+  
  facet_grid(CINSIYET~.) 
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.

library(magrittr)

library(ggplot2)

esquisse paketi ile grafiklere bakalım. Paketi çağırıp aktifleştirdiğimizde verilere göre grafikler oluşturabiliyorz. Yüzeylerini değiştirip seçebiliyozuz.

library(esquisse)