R Notebook

Unloading packages

library(Zelig)
library(dplyr)
library(radiant.data)
library(tidyr)
library(car)
library(magrittr)
data(Vocab)

Recoding Variable Vocabulary

vocabulary2 <- ifelse(Vocab$vocabulary >= 6, 1, 0)
head(vocabulary2)

[1] 0 1 1 1 0 1

Intoduction

This data set is for number of vocab words correct in a ten word test. The purpose of this analysis is to determine whether or n ot variables such as sex and education have a significant impact on the outcome. Voca is going to be my dependent binomial variable (0/1) and age and education will the by indepdent variables.

Estimate

z.out1 <- zlogit$new()
z.out1$zelig(vocabulary2 ~ sex + education,  data = Vocab)
summary(z.out1)

Model: 

Call:
z.out1$zelig(formula = vocabulary2 ~ sex + education, data = Vocab)

Deviance Residuals: 
    Min       1Q   Median       3Q      Max  
-2.5052  -1.1865   0.5718   1.0277   2.8260  

Coefficients:
             Estimate Std. Error z value             Pr(>|z|)
(Intercept) -3.733516   0.080908 -46.145 < 0.0000000000000002
sexMale     -0.241018   0.030998  -7.775  0.00000000000000753
education    0.341363   0.006415  53.217 < 0.0000000000000002

(Dispersion parameter for binomial family taken to be 1)

    Null deviance: 28944  on 21637  degrees of freedom
Residual deviance: 25016  on 21635  degrees of freedom
AIC: 25022

Number of Fisher Scoring iterations: 4

Next step: Use 'setx' method

An estimate looks at a certain model and and generates a random draw.

Education

z.outfare <- zlogit$new()
z.outfare$zelig(vocabulary2 ~ sex + education,  data = Vocab)
z.outfare$setrange(education = min(Vocab$education):max(Vocab$education))
z.outfare$sim()
z.outfare$graph()

This plot shows that as education increases, number of vocab words correct also increases.

Sex

z.outsex <- zlogit$new()
z.outsex$zelig(vocabulary2 ~ sex + education,  data = Vocab)
z.outsex$setx(sex = "Male")
z.outsex$setx1(sex = "Female")
z.outsex$sim()
summary(z.outsex)


 sim x :
 -----
ev
          mean          sd       50%      2.5%     97.5%
[1,] 0.5968797 0.005582665 0.5970494 0.5860084 0.6076786
pv
         0     1
[1,] 0.411 0.589

 sim x1 :
 -----
ev
          mean          sd       50%      2.5%     97.5%
[1,] 0.6534015 0.004700812 0.6535669 0.6441086 0.6625176
pv
         0     1
[1,] 0.344 0.656
fd
           mean          sd        50%      2.5%      97.5%
[1,] 0.05652174 0.007118653 0.05669325 0.0433241 0.07029301

Difference Number One

fd <- z.outsex$get_qi(xvalue="x1", qi="fd")
summary(fd)

       V1         
 Min.   :0.02913  
 1st Qu.:0.05192  
 Median :0.05669  
 Mean   :0.05652  
 3rd Qu.:0.06134  
 Max.   :0.07948

plot(z.outsex)

Passing Vocab Test

z.outsc <- zlogit$new()
z.outsc$zelig(vocabulary2 ~ sex + education,  data = Vocab)
z.outsc$setx(sex = "Male", vocabulary2 = "1")
z.outsc$setx1(sex = "Female", vocabulary2 ="1")
z.outsc$sim()
summary(z.outsc)


 sim x :
 -----
ev
          mean          sd       50%      2.5%     97.5%
[1,] 0.5968891 0.005440126 0.5970913 0.5859864 0.6076572
pv
         0     1
[1,] 0.417 0.583

 sim x1 :
 -----
ev
          mean          sd      50%      2.5%    97.5%
[1,] 0.6534346 0.004705283 0.653322 0.6445684 0.662526
pv
         0     1
[1,] 0.362 0.638
fd
           mean          sd        50%       2.5%      97.5%
[1,] 0.05654552 0.006882038 0.05652564 0.04327127 0.07050685

This model shows on average women on average pass to vocab test at a higher percentage then men.

Failing Vocab Test

z.outsc2 <- zlogit$new()
z.outsc2$zelig(vocabulary2 ~ sex + education,  data = Vocab)
z.outsc2$setx(sex = "Male", vocabulary2 = "0")
z.outsc2$setx1(sex = "Female", vocabulary2 ="0")
z.outsc2$sim()
summary(z.outsc2)


 sim x :
 -----
ev
          mean         sd      50%     2.5%     97.5%
[1,] 0.5969255 0.00589936 0.597106 0.585213 0.6085026
pv
         0     1
[1,] 0.406 0.594

 sim x1 :
 -----
ev
          mean          sd       50%      2.5%     97.5%
[1,] 0.6531433 0.004731518 0.6532818 0.6439204 0.6619257
pv
         0     1
[1,] 0.375 0.625
fd
           mean        sd        50%      2.5%      97.5%
[1,] 0.05621782 0.0074061 0.05620223 0.0414632 0.07069902

Plots

plot(z.outsc)

plot(z.outsc2)

d1 <- z.outsc$get_qi(xvalue="x1", qi="fd")
d2 <- z.outsc2$get_qi(xvalue="x1", qi="fd")
dfd <- as.data.frame(cbind(d1, d2))
head(dfd)

library(dplyr)
tidd %>% 
  group_by(vocabulary2) %>% 
  summarise(mean = mean(simv), sd = sd(simv))

GG PLOT

library(ggplot2)
ggplot(tidd, aes(simv)) + geom_histogram() + facet_grid(~vocabulary2)

In concluion from this information, we see that both sex and education have an effect on number of vacbulary words correct in a ten word test. As education increases, number of words correct also increases. Women are also more likely to pass/get more number of words correct then their male counterparts.

LS0tDQp0aXRsZTogIlIgTm90ZWJvb2siDQpvdXRwdXQ6IGh0bWxfbm90ZWJvb2sNCi0tLQ0KDQojIyBVbmxvYWRpbmcgcGFja2FnZXMgDQpgYGB7cn0NCmxpYnJhcnkoWmVsaWcpDQpsaWJyYXJ5KGRwbHlyKQ0KbGlicmFyeShyYWRpYW50LmRhdGEpDQpsaWJyYXJ5KHRpZHlyKQ0KbGlicmFyeShjYXIpDQpsaWJyYXJ5KG1hZ3JpdHRyKQ0KZGF0YShWb2NhYikNCmBgYA0KDQojIyBSZWNvZGluZyBWYXJpYWJsZSBWb2NhYnVsYXJ5IA0KYGBge3J9DQp2b2NhYnVsYXJ5MiA8LSBpZmVsc2UoVm9jYWIkdm9jYWJ1bGFyeSA+PSA2LCAxLCAwKQ0KDQpoZWFkKHZvY2FidWxhcnkyKQ0KYGBgDQoNCiMjIEludG9kdWN0aW9uIA0KKlRoaXMgZGF0YSBzZXQgaXMgZm9yIG51bWJlciBvZiB2b2NhYiB3b3JkcyBjb3JyZWN0IGluIGEgdGVuIHdvcmQgdGVzdC4gVGhlIHB1cnBvc2Ugb2YgdGhpcyBhbmFseXNpcyBpcyB0byBkZXRlcm1pbmUgd2hldGhlciBvciBuIG90IHZhcmlhYmxlcyBzdWNoIGFzIHNleCBhbmQgZWR1Y2F0aW9uIGhhdmUgYSBzaWduaWZpY2FudCBpbXBhY3Qgb24gdGhlIG91dGNvbWUuIFZvY2EgaXMgZ29pbmcgdG8gYmUgbXkgZGVwZW5kZW50IGJpbm9taWFsIHZhcmlhYmxlICgwLzEpIGFuZCBhZ2UgYW5kIGVkdWNhdGlvbiB3aWxsIHRoZSBieSBpbmRlcGRlbnQgdmFyaWFibGVzLioNCg0KIyMgRXN0aW1hdGUgDQpgYGB7cn0NCnoub3V0MSA8LSB6bG9naXQkbmV3KCkNCnoub3V0MSR6ZWxpZyh2b2NhYnVsYXJ5MiB+IHNleCArIGVkdWNhdGlvbiwgIGRhdGEgPSBWb2NhYikNCnN1bW1hcnkoei5vdXQxKQ0KYGBgDQoNCipBbiBlc3RpbWF0ZSBsb29rcyBhdCBhIGNlcnRhaW4gbW9kZWwgYW5kIGFuZCBnZW5lcmF0ZXMgYSByYW5kb20gZHJhdy4qDQoNCiMjIEVkdWNhdGlvbiANCmBgYHtyfQ0Kei5vdXRmYXJlIDwtIHpsb2dpdCRuZXcoKQ0Kei5vdXRmYXJlJHplbGlnKHZvY2FidWxhcnkyIH4gc2V4ICsgZWR1Y2F0aW9uLCAgZGF0YSA9IFZvY2FiKQ0Kei5vdXRmYXJlJHNldHJhbmdlKGVkdWNhdGlvbiA9IG1pbihWb2NhYiRlZHVjYXRpb24pOm1heChWb2NhYiRlZHVjYXRpb24pKQ0Kei5vdXRmYXJlJHNpbSgpDQp6Lm91dGZhcmUkZ3JhcGgoKQ0KYGBgDQoNCipUaGlzIHBsb3Qgc2hvd3MgdGhhdCBhcyBlZHVjYXRpb24gaW5jcmVhc2VzLCBudW1iZXIgb2Ygdm9jYWIgd29yZHMgY29ycmVjdCBhbHNvIGluY3JlYXNlcy4qDQoNCiMjIFNleCANCmBgYHtyfQ0Kei5vdXRzZXggPC0gemxvZ2l0JG5ldygpDQp6Lm91dHNleCR6ZWxpZyh2b2NhYnVsYXJ5MiB+IHNleCArIGVkdWNhdGlvbiwgIGRhdGEgPSBWb2NhYikNCnoub3V0c2V4JHNldHgoc2V4ID0gIk1hbGUiKQ0Kei5vdXRzZXgkc2V0eDEoc2V4ID0gIkZlbWFsZSIpDQp6Lm91dHNleCRzaW0oKQ0Kc3VtbWFyeSh6Lm91dHNleCkNCmBgYA0KDQojIyBEaWZmZXJlbmNlIE51bWJlciBPbmUgDQpgYGB7cn0NCmZkIDwtIHoub3V0c2V4JGdldF9xaSh4dmFsdWU9IngxIiwgcWk9ImZkIikNCnN1bW1hcnkoZmQpDQpgYGANCg0KYGBge3J9DQpwbG90KHoub3V0c2V4KQ0KYGBgDQoNCiMjIFBhc3NpbmcgVm9jYWIgVGVzdA0KYGBge3J9DQp6Lm91dHNjIDwtIHpsb2dpdCRuZXcoKQ0Kei5vdXRzYyR6ZWxpZyh2b2NhYnVsYXJ5MiB+IHNleCArIGVkdWNhdGlvbiwgIGRhdGEgPSBWb2NhYikNCnoub3V0c2Mkc2V0eChzZXggPSAiTWFsZSIsIHZvY2FidWxhcnkyID0gIjEiKQ0Kei5vdXRzYyRzZXR4MShzZXggPSAiRmVtYWxlIiwgdm9jYWJ1bGFyeTIgPSIxIikNCnoub3V0c2Mkc2ltKCkNCnN1bW1hcnkoei5vdXRzYykNCmBgYA0KDQoqVGhpcyBtb2RlbCBzaG93cyBvbiBhdmVyYWdlIHdvbWVuIG9uIGF2ZXJhZ2UgcGFzcyB0byB2b2NhYiB0ZXN0IGF0IGEgaGlnaGVyIHBlcmNlbnRhZ2UgdGhlbiBtZW4uKg0KDQojIyBGYWlsaW5nIFZvY2FiIFRlc3QNCmBgYHtyfQ0Kei5vdXRzYzIgPC0gemxvZ2l0JG5ldygpDQp6Lm91dHNjMiR6ZWxpZyh2b2NhYnVsYXJ5MiB+IHNleCArIGVkdWNhdGlvbiwgIGRhdGEgPSBWb2NhYikNCnoub3V0c2MyJHNldHgoc2V4ID0gIk1hbGUiLCB2b2NhYnVsYXJ5MiA9ICIwIikNCnoub3V0c2MyJHNldHgxKHNleCA9ICJGZW1hbGUiLCB2b2NhYnVsYXJ5MiA9IjAiKQ0Kei5vdXRzYzIkc2ltKCkNCnN1bW1hcnkoei5vdXRzYzIpDQpgYGANCg0KIyMgUGxvdHMNCmBgYHtyfQ0KcGxvdCh6Lm91dHNjKQ0KYGBgDQoNCmBgYHtyfQ0KcGxvdCh6Lm91dHNjMikNCmBgYA0KDQpgYGB7cn0NCmQxIDwtIHoub3V0c2MkZ2V0X3FpKHh2YWx1ZT0ieDEiLCBxaT0iZmQiKQ0KZDIgPC0gei5vdXRzYzIkZ2V0X3FpKHh2YWx1ZT0ieDEiLCBxaT0iZmQiKQ0KZGZkIDwtIGFzLmRhdGEuZnJhbWUoY2JpbmQoZDEsIGQyKSkNCmhlYWQoZGZkKQ0KYGBgDQoNCmBgYHtyfQ0KbGlicmFyeShkcGx5cikNCnRpZGQgJT4lIA0KICBncm91cF9ieSh2b2NhYnVsYXJ5MikgJT4lIA0KICBzdW1tYXJpc2UobWVhbiA9IG1lYW4oc2ltdiksIHNkID0gc2Qoc2ltdikpDQpgYGANCg0KIyMgR0cgUExPVA0KYGBge3J9DQpsaWJyYXJ5KGdncGxvdDIpDQpnZ3Bsb3QodGlkZCwgYWVzKHNpbXYpKSArIGdlb21faGlzdG9ncmFtKCkgKyBmYWNldF9ncmlkKH52b2NhYnVsYXJ5MikNCmBgYA0KDQoqSW4gY29uY2x1aW9uIGZyb20gdGhpcyBpbmZvcm1hdGlvbiwgd2Ugc2VlIHRoYXQgYm90aCBzZXggYW5kIGVkdWNhdGlvbiBoYXZlIGFuIGVmZmVjdCBvbiBudW1iZXIgb2YgdmFjYnVsYXJ5IHdvcmRzIGNvcnJlY3QgaW4gYSB0ZW4gd29yZCB0ZXN0LiBBcyBlZHVjYXRpb24gaW5jcmVhc2VzLCBudW1iZXIgb2Ygd29yZHMgY29ycmVjdCBhbHNvIGluY3JlYXNlcy4gV29tZW4gYXJlIGFsc28gbW9yZSBsaWtlbHkgdG8gcGFzcy9nZXQgbW9yZSBudW1iZXIgb2Ygd29yZHMgY29ycmVjdCB0aGVuIHRoZWlyIG1hbGUgY291bnRlcnBhcnRzLioNCg0K