KULLANILACAK PAKETLER

 library(psych)
library(naniar)
library(ggplot2)
## 
## Attaching package: 'ggplot2'
## The following objects are masked from 'package:psych':
## 
##     %+%, alpha
 library(finalfit) 
library(tidyverse)
## ── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
## ✔ dplyr     1.1.4     ✔ readr     2.1.5
## ✔ forcats   1.0.0     ✔ stringr   1.5.1
## ✔ lubridate 1.9.4     ✔ tibble    3.2.1
## ✔ purrr     1.0.4     ✔ tidyr     1.3.1
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ ggplot2::%+%()   masks psych::%+%()
## ✖ ggplot2::alpha() masks psych::alpha()
## ✖ dplyr::filter()  masks stats::filter()
## ✖ dplyr::lag()     masks stats::lag()
## ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors
library(mvdalab)
## 
## Attaching package: 'mvdalab'
## 
## The following object is masked from 'package:psych':
## 
##     smc
library(mice)
## 
## Attaching package: 'mice'
## 
## The following object is masked from 'package:stats':
## 
##     filter
## 
## The following objects are masked from 'package:base':
## 
##     cbind, rbind

VERİ SETİNİN YÜKLENMESİ

  data("airquality")
dat<-airquality

summary(dat)
##      Ozone           Solar.R           Wind             Temp      
##  Min.   :  1.00   Min.   :  7.0   Min.   : 1.700   Min.   :56.00  
##  1st Qu.: 18.00   1st Qu.:115.8   1st Qu.: 7.400   1st Qu.:72.00  
##  Median : 31.50   Median :205.0   Median : 9.700   Median :79.00  
##  Mean   : 42.13   Mean   :185.9   Mean   : 9.958   Mean   :77.88  
##  3rd Qu.: 63.25   3rd Qu.:258.8   3rd Qu.:11.500   3rd Qu.:85.00  
##  Max.   :168.00   Max.   :334.0   Max.   :20.700   Max.   :97.00  
##  NA's   :37       NA's   :7                                       
##      Month            Day      
##  Min.   :5.000   Min.   : 1.0  
##  1st Qu.:6.000   1st Qu.: 8.0  
##  Median :7.000   Median :16.0  
##  Mean   :6.993   Mean   :15.8  
##  3rd Qu.:8.000   3rd Qu.:23.0  
##  Max.   :9.000   Max.   :31.0  
## 

KAYIP VERİLER

Kayıp veriler 3 başlık altında incelenebilir 1. TRK(MCAR): Kayıp veriler belirlenen değişkenle ve diğer değişkenlerle ilişkisiz 2.RK(MAR): Kayıp veriler diğer değişkenlerin bazıları ile ilişkili ama kayıp verilerin olduğu değişkenle ilişkisiz. 3. ROK(NMAR): Kayıp veriler bulunduğu değişken ile ilişkili olduğunda

Kayıp Veri İnceleme

any_na(dat)   #kayıp verilerin varlığı hakkında bilgi verir. 
## [1] TRUE
n_miss(dat) #veri setindeki toplam kayıp değeri verir.
## [1] 44
prop_miss(dat) #kayıp değerlerin tüm veriye oranını verir. 
## [1] 0.04793028
 dat%>% is.na() %>% colSums() #her bir değişkenin kayıp değerlerini gösterir.
##   Ozone Solar.R    Wind    Temp   Month     Day 
##      37       7       0       0       0       0
miss_var_summary(dat)
## # A tibble: 6 × 3
##   variable n_miss pct_miss
##   <chr>     <int>    <num>
## 1 Ozone        37    24.2 
## 2 Solar.R       7     4.58
## 3 Wind          0     0   
## 4 Temp          0     0   
## 5 Month         0     0   
## 6 Day           0     0
miss_var_table(dat) 
## # A tibble: 3 × 3
##   n_miss_in_var n_vars pct_vars
##           <int>  <int>    <dbl>
## 1             0      4     66.7
## 2             7      1     16.7
## 3            37      1     16.7
miss_case_summary(dat)
## # A tibble: 153 × 3
##     case n_miss pct_miss
##    <int>  <int>    <dbl>
##  1     5      2     33.3
##  2    27      2     33.3
##  3     6      1     16.7
##  4    10      1     16.7
##  5    11      1     16.7
##  6    25      1     16.7
##  7    26      1     16.7
##  8    32      1     16.7
##  9    33      1     16.7
## 10    34      1     16.7
## # ℹ 143 more rows
gg_miss_var(dat)

 vis_miss(dat) + theme(axis.text.x = element_text(angle=80))

MCAR Testi TAMAMEN RASTGELE KAYIP VERİLERİN KONTROLÜ

mcar_test(data=dat)
## # A tibble: 1 × 4
##   statistic    df p.value missing.patterns
##       <dbl> <dbl>   <dbl>            <int>
## 1      35.1    14 0.00142                4

p> 0,05 ise MCAR olabilir ( veri setinde MCAR olabilir) p<0,05 ise MAR veya MNAR olabilir.

KAYIP VERİNİN DİĞER DEĞİŞKENLERLE İLİŞKİSİ

dat2 <- dat
  dat2$Ozone_m <- dat$Ozone  
  ##dat2 de INCOME_m olarak yeni sütun oluşturur ve Ozone değerlerini buraya kopyalar.
explanatory = c("Wind", "Day", "Solar.R")
dependent = "Ozone_m"
dat2 %>% 
  missing_compare(dependent, explanatory) %>% 
    knitr::kable(row.names=FALSE, align = c("l", "l", "r", "r", "r"), 
        caption = "Eksik veriye sahip olan ve olmayan değişkenlerin ortalama karşılaştırması")
Eksik veriye sahip olan ve olmayan değişkenlerin ortalama karşılaştırması
Missing data analysis: Ozone_m Not missing Missing p
Wind Mean (SD) 9.9 (3.6) 10.3 (3.4) 0.555
Day Mean (SD) 15.5 (8.8) 16.6 (9.3) 0.507
Solar.R Mean (SD) 184.8 (91.2) 189.5 (87.7) 0.788

#bağımlı ve bağımsız değişkenler belirlenerek kayıp verilerin diğer değişkenlerle olan ilişkisi incelenir. #Ozone değişkenindeki eksik verilerin rastgele dağıldığı söylenebilir.

T TESTİ

miss_test <- dat2 %>%mutate(miss_Ozone = is.na(Ozone)) 
#yeni sütun oluşturur. 


Day_nonna <- miss_test %>% filter(miss_Ozone == FALSE) %>%
   pull(Day)   # Ozone değişkenindeki eksik olan verilere bakarak Day değişkeninde eksik veri olmayanları çeker.

  Day_na <- miss_test %>% filter(miss_Ozone == TRUE) %>%
   pull(Day)  #Ozone değişkenindeki eksik olan verilere bakarak Day değişkeninde eksik veri olanları çeker

   t.test(Day_nonna, Day_na)
## 
##  Welch Two Sample t-test
## 
## data:  Day_nonna and Day_na
## t = -0.64426, df = 57.826, p-value = 0.522
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -4.576080  2.347749
## sample estimates:
## mean of x mean of y 
##  15.53448  16.64865

p>0,05 olduğu için iki sütun arasında anlamlı farklılık yoktur. Finalfit paketindeki p değeri (Day ve Ozane arasıdaki) ile t testinden elde edilen p değerleri çok yakındır.

KAYIP VERİYLE BAŞ ETME YÖNTEMLERİ

Veri Silmeye Dayalı Yöntemler

na.omit(dat) 
##     Ozone Solar.R Wind Temp Month Day
## 1      41     190  7.4   67     5   1
## 2      36     118  8.0   72     5   2
## 3      12     149 12.6   74     5   3
## 4      18     313 11.5   62     5   4
## 7      23     299  8.6   65     5   7
## 8      19      99 13.8   59     5   8
## 9       8      19 20.1   61     5   9
## 12     16     256  9.7   69     5  12
## 13     11     290  9.2   66     5  13
## 14     14     274 10.9   68     5  14
## 15     18      65 13.2   58     5  15
## 16     14     334 11.5   64     5  16
## 17     34     307 12.0   66     5  17
## 18      6      78 18.4   57     5  18
## 19     30     322 11.5   68     5  19
## 20     11      44  9.7   62     5  20
## 21      1       8  9.7   59     5  21
## 22     11     320 16.6   73     5  22
## 23      4      25  9.7   61     5  23
## 24     32      92 12.0   61     5  24
## 28     23      13 12.0   67     5  28
## 29     45     252 14.9   81     5  29
## 30    115     223  5.7   79     5  30
## 31     37     279  7.4   76     5  31
## 38     29     127  9.7   82     6   7
## 40     71     291 13.8   90     6   9
## 41     39     323 11.5   87     6  10
## 44     23     148  8.0   82     6  13
## 47     21     191 14.9   77     6  16
## 48     37     284 20.7   72     6  17
## 49     20      37  9.2   65     6  18
## 50     12     120 11.5   73     6  19
## 51     13     137 10.3   76     6  20
## 62    135     269  4.1   84     7   1
## 63     49     248  9.2   85     7   2
## 64     32     236  9.2   81     7   3
## 66     64     175  4.6   83     7   5
## 67     40     314 10.9   83     7   6
## 68     77     276  5.1   88     7   7
## 69     97     267  6.3   92     7   8
## 70     97     272  5.7   92     7   9
## 71     85     175  7.4   89     7  10
## 73     10     264 14.3   73     7  12
## 74     27     175 14.9   81     7  13
## 76      7      48 14.3   80     7  15
## 77     48     260  6.9   81     7  16
## 78     35     274 10.3   82     7  17
## 79     61     285  6.3   84     7  18
## 80     79     187  5.1   87     7  19
## 81     63     220 11.5   85     7  20
## 82     16       7  6.9   74     7  21
## 85     80     294  8.6   86     7  24
## 86    108     223  8.0   85     7  25
## 87     20      81  8.6   82     7  26
## 88     52      82 12.0   86     7  27
## 89     82     213  7.4   88     7  28
## 90     50     275  7.4   86     7  29
## 91     64     253  7.4   83     7  30
## 92     59     254  9.2   81     7  31
## 93     39      83  6.9   81     8   1
## 94      9      24 13.8   81     8   2
## 95     16      77  7.4   82     8   3
## 99    122     255  4.0   89     8   7
## 100    89     229 10.3   90     8   8
## 101   110     207  8.0   90     8   9
## 104    44     192 11.5   86     8  12
## 105    28     273 11.5   82     8  13
## 106    65     157  9.7   80     8  14
## 108    22      71 10.3   77     8  16
## 109    59      51  6.3   79     8  17
## 110    23     115  7.4   76     8  18
## 111    31     244 10.9   78     8  19
## 112    44     190 10.3   78     8  20
## 113    21     259 15.5   77     8  21
## 114     9      36 14.3   72     8  22
## 116    45     212  9.7   79     8  24
## 117   168     238  3.4   81     8  25
## 118    73     215  8.0   86     8  26
## 120    76     203  9.7   97     8  28
## 121   118     225  2.3   94     8  29
## 122    84     237  6.3   96     8  30
## 123    85     188  6.3   94     8  31
## 124    96     167  6.9   91     9   1
## 125    78     197  5.1   92     9   2
## 126    73     183  2.8   93     9   3
## 127    91     189  4.6   93     9   4
## 128    47      95  7.4   87     9   5
## 129    32      92 15.5   84     9   6
## 130    20     252 10.9   80     9   7
## 131    23     220 10.3   78     9   8
## 132    21     230 10.9   75     9   9
## 133    24     259  9.7   73     9  10
## 134    44     236 14.9   81     9  11
## 135    21     259 15.5   76     9  12
## 136    28     238  6.3   77     9  13
## 137     9      24 10.9   71     9  14
## 138    13     112 11.5   71     9  15
## 139    46     237  6.9   78     9  16
## 140    18     224 13.8   67     9  17
## 141    13      27 10.3   76     9  18
## 142    24     238 10.3   68     9  19
## 143    16     201  8.0   82     9  20
## 144    13     238 12.6   64     9  21
## 145    23      14  9.2   71     9  22
## 146    36     139 10.3   81     9  23
## 147     7      49 10.3   69     9  24
## 148    14      20 16.6   63     9  25
## 149    30     193  6.9   70     9  26
## 151    14     191 14.3   75     9  28
## 152    18     131  8.0   76     9  29
## 153    20     223 11.5   68     9  30

Veri Atamaya Dayalı Yöntemler

Ortalama ile Atama

dat3 <- dat
dat3$Ozone[is.na(dat3$Ozone)] <- mean(dat3$Ozone, na.rm=TRUE)
summary(dat3$Ozone) 
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    1.00   21.00   42.13   42.13   46.00  168.00
#değişkendeki eksik verileri hariç tutarak ortalama alır ve eksik veriler yerine bu ortalamayı atar. 
sd(dat$Ozone,na.rm=TRUE)  #eksik veriler olmadan sd hesaplar.
## [1] 32.98788
sd(dat3$Ozone)  #tüm veri sd hesaplar.
## [1] 28.69337
#döngü ile atama
dat4 <- dat
for(i in 1:ncol(dat4)){
  dat4[ , i][is.na(dat4[ , i])] <- mean(dat4[ , i], na.rm = TRUE)
}
any_na(dat4)
## [1] FALSE

#MODEL TABANLI YÖNTEMLER

EM Algoritması

veri <- introNAs(dat, percent = 25)
dat_EM <- imputeEM(veri)
dat_EM

##          Ozone   Solar.R      Wind      Temp    Month       Day
## 1    48.675274 333.60398  7.400000  67.00000 5.000000  1.000000
## 2    36.000000 118.00000  8.000000  74.24079 5.000000 12.671857
## 3    12.000000 250.20415 14.171488  65.05015 5.000000  3.000000
## 4    18.000000 313.00000 13.925298  62.00000 5.000000  4.000000
## 5    -3.460044 206.05346 14.300000  56.00000 5.000000  5.000000
## 6    28.000000 247.50617 14.900000  66.00000 5.000000  6.000000
## 7    23.000000 299.00000  8.600000  74.53829 5.000000  7.000000
## 8    19.000000  99.00000 15.431102  59.00000 5.000000  8.000000
## 9     8.000000  19.00000 20.100000  61.00000 5.000000  9.000000
## 10   17.797936 194.00000 13.028536  69.00000 5.854509 10.000000
## 11   53.112261 258.36239  6.900000  74.00000 6.362328 11.000000
## 12   34.653718 256.00000  9.700000  69.00000 5.000000  5.157821
## 13   11.000000 290.00000  9.200000  66.00000 5.000000  3.740739
## 14   14.000000 274.00000 13.524367  68.00000 5.000000  3.660041
## 15   18.000000  65.00000 13.200000  58.00000 5.000000 12.945977
## 16   14.000000 334.00000 11.500000  64.00000 5.000000 16.000000
## 17   34.000000 307.00000 12.000000  66.00000 5.000000 17.000000
## 18  -22.629206 150.73659 18.400000  57.00000 5.000000  8.192251
## 19   30.000000 322.00000 11.500000  73.91453 5.000000 19.000000
## 20   11.000000  44.00000 13.904677  62.00000 7.397468 23.386785
## 21    1.000000   8.00000  9.700000  59.00000 5.000000 16.870671
## 22   11.000000 143.82922 16.600000  73.00000 5.000000 22.000000
## 23    4.000000  25.00000  9.700000  61.00000 7.723450 23.000000
## 24   32.000000  92.00000 12.000000  69.70769 5.000000 24.000000
## 25  -23.860678  66.00000 16.600000  57.00000 6.927815 25.000000
## 26    1.957054 266.00000 14.900000  58.00000 6.262634 26.000000
## 27    7.141609 123.28667  8.000000  57.00000 5.000000 27.000000
## 28   -2.782256  13.00000 12.000000  67.00000 5.000000 16.858169
## 29   45.000000 337.91332 10.042207  81.00000 5.000000  1.915728
## 30   53.687772 223.00000  5.700000  79.00000 5.000000 30.000000
## 31   37.000000 279.00000  7.400000  76.00000 5.000000 31.000000
## 32   51.560790 286.00000  9.981387  78.00000 6.000000  1.000000
## 33   45.533877 287.00000  9.700000  74.00000 5.247199  2.000000
## 34   11.001017 242.00000 16.100000  67.00000 6.000000  3.000000
## 35   65.928232 328.20792  9.200000  84.00000 6.000000  4.000000
## 36   56.832340 220.00000  8.600000  85.00000 6.000000 11.992304
## 37   20.803832 264.00000 14.300000  68.44908 6.000000  6.000000
## 38   29.000000 264.87798 10.346339  82.00000 6.000000  7.000000
## 39   77.641265 333.52254  6.900000  87.00000 6.000000  8.000000
## 40   77.038185 291.00000  6.904899  90.00000 6.000000  9.000000
## 41   50.326757 214.67620 11.500000  87.00000 6.964845 15.543869
## 42   64.975624 259.00000 10.900000  93.00000 6.651656 11.000000
## 43   67.014916 250.00000  9.200000  92.00000 6.000000 12.000000
## 44    2.049166 148.00000 14.439658  64.22853 6.000000 13.000000
## 45   44.830287 332.00000 13.800000  80.00000 6.000000  5.135333
## 46   47.352815 322.00000 11.500000  77.87919 6.104454 15.000000
## 47   21.000000 191.00000 14.900000  66.92923 6.000000 10.980848
## 48   37.000000 284.00000 20.700000  63.70009 5.309958 17.000000
## 49   20.000000  37.00000 13.448306  65.00000 7.153880 18.000000
## 50   14.960478 120.00000 11.500000  69.55902 6.000000 19.000000
## 51   13.000000 137.00000 10.300000  76.00000 6.000000 20.000000
## 52   64.021102 150.00000  6.300000  87.38468 8.193654 21.000000
## 53  108.288874 330.44296  1.700000  98.92360 6.000000 22.000000
## 54   43.712974  91.00000  4.600000  76.00000 6.000000 23.000000
## 55   56.310570 250.00000  6.300000  76.00000 6.000000 10.289546
## 56   46.227693 135.00000  8.617313  82.06862 8.180473 25.000000
## 57  -23.448894  39.64183 16.357080  58.35351 6.000000 26.000000
## 58   25.118554  47.00000 10.300000  76.84937 8.663877 29.907881
## 59   26.818692  98.00000 11.500000  80.00000 6.000000 17.304908
## 60    2.075702  31.00000 14.900000  77.00000 6.000000 29.000000
## 61   39.633769 138.00000 10.200731  83.00000 6.000000 15.712030
## 62  135.000000 269.00000  4.100000  97.79195 6.730606  1.000000
## 63   59.033863 248.00000  9.200000  85.00000 6.779414 13.439632
## 64   54.387007 236.00000  8.739446  81.00000 7.000000 14.688347
## 65   39.198759 101.00000 10.900000  84.00000 7.000000  4.000000
## 66   82.965406 331.89031  4.600000  83.00000 7.000000  5.000000
## 67   40.000000 314.00000 10.900000  83.00000 7.000000  6.000000
## 68   77.000000 276.00000  5.100000  88.00000 7.000000  7.000000
## 69   97.000000 295.61452  4.795823  92.00000 7.343550 14.505789
## 70   84.160800 272.00000  5.700000  92.00000 7.000000  9.000000
## 71   85.000000 175.00000  6.521854  89.00000 7.000000 18.350603
## 72   41.908596 139.00000  8.600000  78.08166 7.000000 11.000000
## 73   10.000000 264.00000 14.300000  73.00000 7.000000 12.000000
## 74   27.000000 175.00000 11.944497  71.87385 6.395923 13.000000
## 75   83.546458 291.00000  5.773528  91.00000 7.000000 14.000000
## 76    7.000000 130.42054 13.261576  67.83827 7.000000 15.000000
## 77   48.000000 260.00000  6.900000  81.00000 6.684438 12.841839
## 78   35.000000 274.00000 10.300000  82.00000 6.669251 17.000000
## 79   61.000000 285.00000  6.300000  86.62201 7.000000 13.244438
## 80   79.000000 187.00000  6.940574  87.20619 7.000000 19.000000
## 81   63.000000 220.00000 11.500000  85.00000 7.000000 20.000000
## 82   16.000000   7.00000  6.900000  74.00000 7.000000 26.236806
## 83   53.574841 258.00000  9.700000  81.04192 7.000000 13.418847
## 84   50.533523 295.00000 11.500000  82.00000 7.000000 23.000000
## 85   80.000000 294.00000  6.254806  86.00000 7.000000 24.000000
## 86  108.000000 223.00000  8.000000  85.00000 7.469299 16.796361
## 87   20.000000 128.17613  8.600000  82.00000 7.000000 26.000000
## 88   52.000000 164.15135  8.170221  86.00000 7.000000 27.000000
## 89   72.113581 213.00000  5.861649  88.00000 8.525338 28.000000
## 90   50.000000 275.00000  7.400000  86.00000 7.000000 29.000000
## 91   64.000000 253.00000  7.400000  83.00000 7.000000 30.000000
## 92   61.987158 254.00000  9.200000  86.86981 8.234738 31.000000
## 93   47.026734  83.00000  6.900000  81.00000 6.614909  1.000000
## 94    9.000000  24.00000 14.038682  65.45718 8.000000  2.000000
## 95   16.000000  77.00000  7.400000  82.00000 8.000000 27.230060
## 96   78.045833 299.41281  6.900000  86.00000 8.000000  4.000000
## 97   35.000000 245.86853  7.400000  85.00000 8.000000  5.000000
## 98   66.000000 206.62364  4.600000  90.47131 8.000000 21.497472
## 99   84.287298 255.00000  4.000000  89.00000 7.702960 17.738006
## 100  89.000000 336.82977 10.300000  84.16396 5.800090  5.415069
## 101  75.622967 270.54698  8.000000  90.00000 8.000000  9.000000
## 102  75.471810 265.46778  8.600000  92.00000 8.000000 10.000000
## 103  41.913827 137.00000 11.500000  86.00000 6.926142 11.000000
## 104  44.000000 192.00000 11.500000  86.00000 8.000000 12.000000
## 105  28.000000 273.00000 11.500000  77.22047 8.000000 13.000000
## 106  65.000000 212.05106  9.700000  83.61201 8.000000 14.000000
## 107  26.906577  64.00000 11.500000  79.00000 8.000000 15.000000
## 108  22.000000 173.02534 10.300000  77.00000 6.899783 16.000000
## 109  59.000000  51.00000  6.300000  79.00000 9.408316 33.124494
## 110  40.857279 115.00000  7.400000  76.00000 8.204142 25.217785
## 111  31.000000 244.00000 10.900000  78.00000 8.000000 19.000000
## 112  44.000000 143.80276 10.300000  78.00000 8.000000 20.000000
## 113  21.000000  99.19095 15.500000  67.27376 6.997904 21.000000
## 114   6.751699  65.28515 14.300000  72.00000 8.000000 22.000000
## 115  33.956338 255.00000 12.600000  75.60167 6.886105 23.000000
## 116  45.000000 127.48925  9.700000  79.00000 7.973443 24.000000
## 117 168.000000 238.00000  3.400000 107.61773 8.000000 25.000000
## 118  73.000000 215.00000  8.000000  87.47947 8.000000 19.947837
## 119  65.645294 153.00000  5.700000  88.00000 8.000000 27.000000
## 120  76.000000 203.00000  4.798347  97.00000 8.000000 28.000000
## 121 118.000000 225.00000  2.300000  94.00000 8.000000 29.000000
## 122  83.968781 237.00000  6.300000  96.00000 8.000000 19.826283
## 123  78.471178 188.00000  5.083354  94.00000 8.000000 31.000000
## 124  96.000000 173.91303  6.900000  91.00000 9.000000 25.962084
## 125  78.000000 197.00000  5.100000  92.00000 6.700401  2.000000
## 126  73.000000 183.00000  2.800000  93.00000 9.000000 26.974490
## 127  82.069939 189.00000  4.600000  93.00000 9.000000 26.124571
## 128  54.604976  95.00000  7.400000  87.00000 7.043652  5.000000
## 129  10.851435  -8.89772 15.500000  84.00000 9.000000 33.650916
## 130  20.000000 252.00000 10.900000  80.00000 9.000000  7.000000
## 131  23.000000 220.00000 10.300000  78.06358 9.000000  8.000000
## 132  21.000000 143.25593 10.900000  75.00000 7.160907 19.074575
## 133  41.503319 259.00000  9.700000  73.00000 5.990365 10.000000
## 134  29.193750 236.00000 14.900000  74.20781 9.000000 11.000000
## 135  21.000000 259.00000 15.500000  76.00000 9.000000 12.000000
## 136  28.000000 238.00000  6.300000  77.00000 6.658433 13.000000
## 137   9.000000  24.00000 12.341958  71.00000 9.000000 14.000000
## 138  24.947330 112.00000 11.069610  71.00000 9.000000 15.000000
## 139  57.679424 237.00000  7.883453  78.00000 9.000000 16.000000
## 140  18.000000 224.00000 13.800000  69.48106 6.225732 17.000000
## 141  25.008753  27.00000 10.300000  76.00000 9.000000 18.000000
## 142  35.636727 238.00000 10.300000  68.00000 9.000000 19.000000
## 143  16.000000 136.71893  8.000000  76.94785 7.554891 20.000000
## 144  13.000000 238.00000 12.600000  75.76042 9.000000 21.551873
## 145  23.000000  14.00000  9.200000  76.90807 9.000000 22.000000
## 146  36.000000 127.74847 10.300000  81.00000 7.866853 23.000000
## 147  14.463758  49.00000 10.300000  69.00000 7.911357 24.000000
## 148 -21.627972 -35.07216 16.600000  63.00000 9.000000 25.000000
## 149  30.000000 193.00000  6.900000  84.48017 9.000000 25.512450
## 150  24.664689 145.00000 13.200000  75.57270 9.000000 27.000000
## 151  14.000000  32.80465 14.300000  68.90458 8.008647 28.000000
## 152  18.000000 131.00000  8.000000  79.57398 8.394994 29.000000
## 153  33.306176 223.00000  9.939685  68.00000 9.000000 30.000000

Multiple Imputation (Çoklu Atama)

md.pattern(dat)    #kayıp verileri görselleştirir.

##     Wind Temp Month Day Solar.R Ozone   
## 111    1    1     1   1       1     1  0
## 35     1    1     1   1       1     0  1
## 5      1    1     1   1       0     1  1
## 2      1    1     1   1       0     0  2
##        0    0     0   0       7    37 44
imputed_data <- mice(dat, m = 5, maxit = 50, method = 'pmm', seed = 500) 
## 
##  iter imp variable
##   1   1  Ozone  Solar.R
##   1   2  Ozone  Solar.R
##   1   3  Ozone  Solar.R
##   1   4  Ozone  Solar.R
##   1   5  Ozone  Solar.R
##   2   1  Ozone  Solar.R
##   2   2  Ozone  Solar.R
##   2   3  Ozone  Solar.R
##   2   4  Ozone  Solar.R
##   2   5  Ozone  Solar.R
##   3   1  Ozone  Solar.R
##   3   2  Ozone  Solar.R
##   3   3  Ozone  Solar.R
##   3   4  Ozone  Solar.R
##   3   5  Ozone  Solar.R
##   4   1  Ozone  Solar.R
##   4   2  Ozone  Solar.R
##   4   3  Ozone  Solar.R
##   4   4  Ozone  Solar.R
##   4   5  Ozone  Solar.R
##   5   1  Ozone  Solar.R
##   5   2  Ozone  Solar.R
##   5   3  Ozone  Solar.R
##   5   4  Ozone  Solar.R
##   5   5  Ozone  Solar.R
##   6   1  Ozone  Solar.R
##   6   2  Ozone  Solar.R
##   6   3  Ozone  Solar.R
##   6   4  Ozone  Solar.R
##   6   5  Ozone  Solar.R
##   7   1  Ozone  Solar.R
##   7   2  Ozone  Solar.R
##   7   3  Ozone  Solar.R
##   7   4  Ozone  Solar.R
##   7   5  Ozone  Solar.R
##   8   1  Ozone  Solar.R
##   8   2  Ozone  Solar.R
##   8   3  Ozone  Solar.R
##   8   4  Ozone  Solar.R
##   8   5  Ozone  Solar.R
##   9   1  Ozone  Solar.R
##   9   2  Ozone  Solar.R
##   9   3  Ozone  Solar.R
##   9   4  Ozone  Solar.R
##   9   5  Ozone  Solar.R
##   10   1  Ozone  Solar.R
##   10   2  Ozone  Solar.R
##   10   3  Ozone  Solar.R
##   10   4  Ozone  Solar.R
##   10   5  Ozone  Solar.R
##   11   1  Ozone  Solar.R
##   11   2  Ozone  Solar.R
##   11   3  Ozone  Solar.R
##   11   4  Ozone  Solar.R
##   11   5  Ozone  Solar.R
##   12   1  Ozone  Solar.R
##   12   2  Ozone  Solar.R
##   12   3  Ozone  Solar.R
##   12   4  Ozone  Solar.R
##   12   5  Ozone  Solar.R
##   13   1  Ozone  Solar.R
##   13   2  Ozone  Solar.R
##   13   3  Ozone  Solar.R
##   13   4  Ozone  Solar.R
##   13   5  Ozone  Solar.R
##   14   1  Ozone  Solar.R
##   14   2  Ozone  Solar.R
##   14   3  Ozone  Solar.R
##   14   4  Ozone  Solar.R
##   14   5  Ozone  Solar.R
##   15   1  Ozone  Solar.R
##   15   2  Ozone  Solar.R
##   15   3  Ozone  Solar.R
##   15   4  Ozone  Solar.R
##   15   5  Ozone  Solar.R
##   16   1  Ozone  Solar.R
##   16   2  Ozone  Solar.R
##   16   3  Ozone  Solar.R
##   16   4  Ozone  Solar.R
##   16   5  Ozone  Solar.R
##   17   1  Ozone  Solar.R
##   17   2  Ozone  Solar.R
##   17   3  Ozone  Solar.R
##   17   4  Ozone  Solar.R
##   17   5  Ozone  Solar.R
##   18   1  Ozone  Solar.R
##   18   2  Ozone  Solar.R
##   18   3  Ozone  Solar.R
##   18   4  Ozone  Solar.R
##   18   5  Ozone  Solar.R
##   19   1  Ozone  Solar.R
##   19   2  Ozone  Solar.R
##   19   3  Ozone  Solar.R
##   19   4  Ozone  Solar.R
##   19   5  Ozone  Solar.R
##   20   1  Ozone  Solar.R
##   20   2  Ozone  Solar.R
##   20   3  Ozone  Solar.R
##   20   4  Ozone  Solar.R
##   20   5  Ozone  Solar.R
##   21   1  Ozone  Solar.R
##   21   2  Ozone  Solar.R
##   21   3  Ozone  Solar.R
##   21   4  Ozone  Solar.R
##   21   5  Ozone  Solar.R
##   22   1  Ozone  Solar.R
##   22   2  Ozone  Solar.R
##   22   3  Ozone  Solar.R
##   22   4  Ozone  Solar.R
##   22   5  Ozone  Solar.R
##   23   1  Ozone  Solar.R
##   23   2  Ozone  Solar.R
##   23   3  Ozone  Solar.R
##   23   4  Ozone  Solar.R
##   23   5  Ozone  Solar.R
##   24   1  Ozone  Solar.R
##   24   2  Ozone  Solar.R
##   24   3  Ozone  Solar.R
##   24   4  Ozone  Solar.R
##   24   5  Ozone  Solar.R
##   25   1  Ozone  Solar.R
##   25   2  Ozone  Solar.R
##   25   3  Ozone  Solar.R
##   25   4  Ozone  Solar.R
##   25   5  Ozone  Solar.R
##   26   1  Ozone  Solar.R
##   26   2  Ozone  Solar.R
##   26   3  Ozone  Solar.R
##   26   4  Ozone  Solar.R
##   26   5  Ozone  Solar.R
##   27   1  Ozone  Solar.R
##   27   2  Ozone  Solar.R
##   27   3  Ozone  Solar.R
##   27   4  Ozone  Solar.R
##   27   5  Ozone  Solar.R
##   28   1  Ozone  Solar.R
##   28   2  Ozone  Solar.R
##   28   3  Ozone  Solar.R
##   28   4  Ozone  Solar.R
##   28   5  Ozone  Solar.R
##   29   1  Ozone  Solar.R
##   29   2  Ozone  Solar.R
##   29   3  Ozone  Solar.R
##   29   4  Ozone  Solar.R
##   29   5  Ozone  Solar.R
##   30   1  Ozone  Solar.R
##   30   2  Ozone  Solar.R
##   30   3  Ozone  Solar.R
##   30   4  Ozone  Solar.R
##   30   5  Ozone  Solar.R
##   31   1  Ozone  Solar.R
##   31   2  Ozone  Solar.R
##   31   3  Ozone  Solar.R
##   31   4  Ozone  Solar.R
##   31   5  Ozone  Solar.R
##   32   1  Ozone  Solar.R
##   32   2  Ozone  Solar.R
##   32   3  Ozone  Solar.R
##   32   4  Ozone  Solar.R
##   32   5  Ozone  Solar.R
##   33   1  Ozone  Solar.R
##   33   2  Ozone  Solar.R
##   33   3  Ozone  Solar.R
##   33   4  Ozone  Solar.R
##   33   5  Ozone  Solar.R
##   34   1  Ozone  Solar.R
##   34   2  Ozone  Solar.R
##   34   3  Ozone  Solar.R
##   34   4  Ozone  Solar.R
##   34   5  Ozone  Solar.R
##   35   1  Ozone  Solar.R
##   35   2  Ozone  Solar.R
##   35   3  Ozone  Solar.R
##   35   4  Ozone  Solar.R
##   35   5  Ozone  Solar.R
##   36   1  Ozone  Solar.R
##   36   2  Ozone  Solar.R
##   36   3  Ozone  Solar.R
##   36   4  Ozone  Solar.R
##   36   5  Ozone  Solar.R
##   37   1  Ozone  Solar.R
##   37   2  Ozone  Solar.R
##   37   3  Ozone  Solar.R
##   37   4  Ozone  Solar.R
##   37   5  Ozone  Solar.R
##   38   1  Ozone  Solar.R
##   38   2  Ozone  Solar.R
##   38   3  Ozone  Solar.R
##   38   4  Ozone  Solar.R
##   38   5  Ozone  Solar.R
##   39   1  Ozone  Solar.R
##   39   2  Ozone  Solar.R
##   39   3  Ozone  Solar.R
##   39   4  Ozone  Solar.R
##   39   5  Ozone  Solar.R
##   40   1  Ozone  Solar.R
##   40   2  Ozone  Solar.R
##   40   3  Ozone  Solar.R
##   40   4  Ozone  Solar.R
##   40   5  Ozone  Solar.R
##   41   1  Ozone  Solar.R
##   41   2  Ozone  Solar.R
##   41   3  Ozone  Solar.R
##   41   4  Ozone  Solar.R
##   41   5  Ozone  Solar.R
##   42   1  Ozone  Solar.R
##   42   2  Ozone  Solar.R
##   42   3  Ozone  Solar.R
##   42   4  Ozone  Solar.R
##   42   5  Ozone  Solar.R
##   43   1  Ozone  Solar.R
##   43   2  Ozone  Solar.R
##   43   3  Ozone  Solar.R
##   43   4  Ozone  Solar.R
##   43   5  Ozone  Solar.R
##   44   1  Ozone  Solar.R
##   44   2  Ozone  Solar.R
##   44   3  Ozone  Solar.R
##   44   4  Ozone  Solar.R
##   44   5  Ozone  Solar.R
##   45   1  Ozone  Solar.R
##   45   2  Ozone  Solar.R
##   45   3  Ozone  Solar.R
##   45   4  Ozone  Solar.R
##   45   5  Ozone  Solar.R
##   46   1  Ozone  Solar.R
##   46   2  Ozone  Solar.R
##   46   3  Ozone  Solar.R
##   46   4  Ozone  Solar.R
##   46   5  Ozone  Solar.R
##   47   1  Ozone  Solar.R
##   47   2  Ozone  Solar.R
##   47   3  Ozone  Solar.R
##   47   4  Ozone  Solar.R
##   47   5  Ozone  Solar.R
##   48   1  Ozone  Solar.R
##   48   2  Ozone  Solar.R
##   48   3  Ozone  Solar.R
##   48   4  Ozone  Solar.R
##   48   5  Ozone  Solar.R
##   49   1  Ozone  Solar.R
##   49   2  Ozone  Solar.R
##   49   3  Ozone  Solar.R
##   49   4  Ozone  Solar.R
##   49   5  Ozone  Solar.R
##   50   1  Ozone  Solar.R
##   50   2  Ozone  Solar.R
##   50   3  Ozone  Solar.R
##   50   4  Ozone  Solar.R
##   50   5  Ozone  Solar.R
  fit <- with(imputed_data, lm(Ozone ~ Day + Temp))
pooled_results <- pool(fit)
summary(pooled_results)  # tamamalanmış veri seti ile regresyon analizi yapmayı sağlar. 5 farklı regresyon analizini birleştirerek(pool) sonuç verir. 
##          term     estimate  std.error statistic       df      p.value
## 1 (Intercept) -135.9349079 18.0820238 -7.517682 72.71887 1.153344e-10
## 2         Day    0.2835799  0.2453339  1.155894 46.62756 2.536133e-01
## 3        Temp    2.2353596  0.2192364 10.196117 73.93396 9.605021e-16

Değişkenlerin hiçbirisi anlamlı yordayıcı değildir.

completed_data_1 <- complete(imputed_data, 1)   #sadece birinci atama ile
m1 <- lm(Ozone ~ Day + Temp, data = completed_data_1)   
summary(m1)
## 
## Call:
## lm(formula = Ozone ~ Day + Temp, data = completed_data_1)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -39.782 -15.745  -1.535   9.980 116.557 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept) -132.4639    15.7342  -8.419 2.82e-14 ***
## Day            0.2467     0.2040   1.209    0.228    
## Temp           2.1943     0.1911  11.484  < 2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 22.11 on 150 degrees of freedom
## Multiple R-squared:  0.468,  Adjusted R-squared:  0.4609 
## F-statistic: 65.99 on 2 and 150 DF,  p-value: < 2.2e-16
  1. atama ile yapılan analizler birleştirilmiş (pooled) ile benzer sonuçlar verdi.
completed_data_1 <- complete(imputed_data, 1)
completed_data_2 <- complete(imputed_data, 2)
completed_data_3 <- complete(imputed_data, 3)
completed_data_4 <- complete(imputed_data, 4)
completed_data_5 <- complete(imputed_data, 5)


m1 <- lm(Ozone ~ Day + Temp,data= completed_data_1)
m2 <- lm(Ozone ~ Day + Temp,data= completed_data_2)
m3 <- lm(Ozone ~ Day + Temp,data= completed_data_3)
m4 <- lm(Ozone ~ Day + Temp,data= completed_data_4)
m5 <- lm(Ozone ~ Day + Temp,data= completed_data_5)


sum(m1$coefficients[2] +
m2$coefficients[2] + 
m3$coefficients[2] + 
m4$coefficients[2] +
m5$coefficients[2])/5
## [1] 0.2835799

# elde edilen 5 farklı datanın ortalaması alındığında elde edilen sonuç birleştirilmiş data ile oldukça yakın (0,28-0,24)