1 Exercise

1.1 Exercise 1

Let’s work it out in R by doing a chi-squared test on the treatment (X) and improvement (Y) columns in treatment.csv First, read in the treatment.csv data.

df <- read.csv("treatment.csv")
table(df$treatment, df$improvement)

##              
##               improved not-improved
##   not-treated       26           29
##   treated           35           15

Let’s do the chi-squared test using the chisq.test() function. It takes the two vectors as the input. We also set correct=FALSE to turn off Yates’ continuity correction.

# Chi-sq test
chisq.test(df$treatment, df$improvement, correct=FALSE)

## 
##  Pearson's Chi-squared test
## 
## data:  df$treatment and df$improvement
## X-squared = 5.5569, df = 1, p-value = 0.01841

We have a chi-squared value of 5.55. Since we get a p-Value less than the significance level of 0.05, we reject the null hypothesis and conclude that the two variables are in fact dependent.

1.2 Exercise 2

Find out if the \(cyl\) and \(carb\) variables in \(mtcars\) dataset are dependent or not. Let’s have a look the table of mtcars\(carb vs mtcars\)cyl.

table(mtcars$carb, mtcars$cyl)

##    
##     4 6 8
##   1 5 2 0
##   2 6 0 4
##   3 0 0 3
##   4 0 4 6
##   6 0 1 0
##   8 0 0 1

Since there are more levels, it’s much harder to make out if they are related. Let’s use the chi-squared test instead.

# Chi-sq test
chisq.test(mtcars$carb, mtcars$cyl, correct=FALSE)

## Warning in chisq.test(mtcars$carb, mtcars$cyl, correct = FALSE): Chi-squared
## approximation may be incorrect

## 
##  Pearson's Chi-squared test
## 
## data:  mtcars$carb and mtcars$cyl
## X-squared = 24.389, df = 10, p-value = 0.006632

We have a high chi-squared value and a p-value of less that 0.05 significance level. So we reject the null hypothesis and conclude that \(carb\) and \(cyl\) have a significant relationship.

1.3 Exercise 3

256 visual artists were surveyed to find out their zodiac sign. The results were: Aries (29), Taurus (24), Gemini (22), Cancer (19), Leo (21), Virgo (18), Libra (19), Scorpio (20), Sagittarius (23), Capricorn (18), Aquarius (20), Pisces (23). Test the hypothesis that zodiac signs are evenly distributed across visual artists. ### Hypothesis \(H0\) : Births are uniformly distributed over zodiac signs. \(HA\) : Births are not uniformly distributed over zodiac signs.

observed <-c ( 29, 24, 22, 19, 21, 18, 19, 20, 23, 18, 20, 23)
n<-256
expected <- c(1/12) * n
alpha <- .05
r <- c(1 , 2 , 3, 4 , 5 , 6 , 7, 8 , 9 , 10 , 11 , 12)

where \(df=12−1=11.\) In R, we can calculate \(χ2\) as the following:

df <- 12 - 1
(chisq <- sum((observed - expected)^2 / expected))

## [1] 5.09375

(p_value <- pchisq(q = chisq, df = df, lower.tail = F))

## [1] 0.9265414

The P-value of 0.07345861 says that if the zodiac signs of executives were in fact distributed uniformly, an observed chi-square value of 5.09 or higher. This certainly isn’t unusual, so we fail to reject the null hypothesis. There is no evidence that the births of the executes are not uniformly distributed among the zodiacs. We can also visualize the result as we can see bellow:

library(ggplot2)
library(dplyr)

## 
## Attaching package: 'dplyr'

## The following objects are masked from 'package:stats':
## 
##     filter, lag

## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union

library(tidyr)
library(ggthemes)
lrr = -Inf
urr = qchisq(p = alpha, df = df, lower.tail = FALSE)
data.frame(chi2 = 0:2500 / 100) %>%
  mutate(density = dchisq(x = chi2, df = df)) %>%
  mutate(rr = ifelse(chi2 < lrr | chi2 > urr, density, 0)) %>%
ggplot() +
  geom_line(aes(x = chi2, y = density)) +
  geom_area(aes(x = chi2, y = rr), fill = "red", alpha = 0.3) +
#  geom_vline(aes(xintercept = pi_0), color = "black") +
  geom_vline(aes(xintercept = chisq), color = "red") +
  labs(title = bquote("Chi-Squared Goodness-of-Fit Test"),
       subtitle = bquote("Chisq ="~.(round(chisq,2))~", n ="~.(n)~", alpha ="~.(alpha)~", chisq_crit ="~.(round(urr,2))~", p-value ="~.(round(p_value,3))),
       x = "chisq",
       y = "Density") +
  theme(legend.position="none")

LS0tDQp0aXRsZTogIkxhYjY6IEdvb2RuZXNzIG9mIEZpdCINCmF1dGhvcjogIldpZGkgeWFudGloIg0KZGF0ZTogImByIGZvcm1hdChTeXMuRGF0ZSgpLCAnJUIgJWQsICVZJylgIg0Kb3V0cHV0OiANCiAgaHRtbF9kb2N1bWVudDogDQogICAgaGlnaGxpZ2h0OiBtb25vY2hyb21lDQogICAgdGhlbWU6IHNwYWNlbGFiDQogICAgbnVtYmVyX3NlY3Rpb25zOiB5ZXMNCiAgICB0b2M6IHllcw0KICAgIHRvY19mbG9hdDogeWVzDQogICAgY29kZV9kb3dubG9hZDogeWVzDQogICAgY29kZV9mb2xkaW5nOiBoaWRlDQotLS0NCg0KYGBge3IgTG9nbywgZWNobz1GQUxTRSxmaWcuYWxpZ249J2NlbnRlcicsIG91dC53aWR0aCA9ICc0MCUnfQ0Ka25pdHI6OmluY2x1ZGVfZ3JhcGhpY3MoImh0dHBzOi8vZ2l0aHViLmNvbS9CYWt0aS1TaXJlZ2FyL2ltYWdlcy9ibG9iL21hc3Rlci9sb2dvLnBuZz9yYXc9dHJ1ZSIpDQpgYGANCg0KIyBFeGVyY2lzZQ0KDQojIyBFeGVyY2lzZSAxDQoNCkxldOKAmXMgd29yayBpdCBvdXQgaW4gUiBieSBkb2luZyBhIGNoaS1zcXVhcmVkIHRlc3Qgb24gdGhlIHRyZWF0bWVudCAoWCkgYW5kIGltcHJvdmVtZW50IChZKSBjb2x1bW5zIGluIHRyZWF0bWVudC5jc3YNCkZpcnN0LCByZWFkIGluIHRoZSB0cmVhdG1lbnQuY3N2IGRhdGEuDQpgYGB7cn0NCmRmIDwtIHJlYWQuY3N2KCJ0cmVhdG1lbnQuY3N2IikNCnRhYmxlKGRmJHRyZWF0bWVudCwgZGYkaW1wcm92ZW1lbnQpDQogICAgICAgICAgICAgIA0KYGBgDQpMZXTigJlzIGRvIHRoZSBjaGktc3F1YXJlZCB0ZXN0IHVzaW5nIHRoZSBjaGlzcS50ZXN0KCkgZnVuY3Rpb24uIEl0IHRha2VzIHRoZSB0d28gdmVjdG9ycyBhcyB0aGUgaW5wdXQuIFdlIGFsc28gc2V0IGBjb3JyZWN0PUZBTFNFYCB0byB0dXJuIG9mZiBZYXRlc+KAmSBjb250aW51aXR5IGNvcnJlY3Rpb24uDQpgYGB7cn0NCiMgQ2hpLXNxIHRlc3QNCmNoaXNxLnRlc3QoZGYkdHJlYXRtZW50LCBkZiRpbXByb3ZlbWVudCwgY29ycmVjdD1GQUxTRSkNCiAgIA0KYGBgDQpXZSBoYXZlIGEgY2hpLXNxdWFyZWQgdmFsdWUgb2YgNS41NS4gU2luY2Ugd2UgZ2V0IGEgcC1WYWx1ZSBsZXNzIHRoYW4gdGhlIHNpZ25pZmljYW5jZSBsZXZlbCBvZiAwLjA1LCB3ZSByZWplY3QgdGhlIG51bGwgaHlwb3RoZXNpcyBhbmQgY29uY2x1ZGUgdGhhdCB0aGUgdHdvIHZhcmlhYmxlcyBhcmUgaW4gZmFjdCBkZXBlbmRlbnQuIA0KDQojIyBFeGVyY2lzZSAyDQoNCkZpbmQgb3V0IGlmIHRoZSAkY3lsJCBhbmQgJGNhcmIkIHZhcmlhYmxlcyBpbiAkbXRjYXJzJCBkYXRhc2V0IGFyZSBkZXBlbmRlbnQgb3Igbm90Lg0KTGV04oCZcyBoYXZlIGEgbG9vayB0aGUgdGFibGUgb2YgbXRjYXJzJGNhcmIgdnMgbXRjYXJzJGN5bC4NCmBgYHtyfQ0KdGFibGUobXRjYXJzJGNhcmIsIG10Y2FycyRjeWwpDQogICANCmBgYA0KU2luY2UgdGhlcmUgYXJlIG1vcmUgbGV2ZWxzLCBpdOKAmXMgbXVjaCBoYXJkZXIgdG8gbWFrZSBvdXQgaWYgdGhleSBhcmUgcmVsYXRlZC4gTGV04oCZcyB1c2UgdGhlIGNoaS1zcXVhcmVkIHRlc3QgaW5zdGVhZC4NCmBgYHtyfQ0KIyBDaGktc3EgdGVzdA0KY2hpc3EudGVzdChtdGNhcnMkY2FyYiwgbXRjYXJzJGN5bCwgY29ycmVjdD1GQUxTRSkNCmBgYA0KV2UgaGF2ZSBhIGhpZ2ggY2hpLXNxdWFyZWQgdmFsdWUgYW5kIGEgcC12YWx1ZSBvZiBsZXNzIHRoYXQgMC4wNSBzaWduaWZpY2FuY2UgbGV2ZWwuIFNvIHdlIHJlamVjdCB0aGUgbnVsbCBoeXBvdGhlc2lzIGFuZCBjb25jbHVkZSB0aGF0ICRjYXJiJCBhbmQgJGN5bCQgaGF2ZSBhIHNpZ25pZmljYW50IHJlbGF0aW9uc2hpcC4NCg0KIyMgRXhlcmNpc2UgMw0KMjU2IHZpc3VhbCBhcnRpc3RzIHdlcmUgc3VydmV5ZWQgdG8gZmluZCBvdXQgdGhlaXIgem9kaWFjIHNpZ24uIFRoZSByZXN1bHRzIHdlcmU6IEFyaWVzICgyOSksIFRhdXJ1cyAoMjQpLCBHZW1pbmkgKDIyKSwgQ2FuY2VyICgxOSksIExlbyAoMjEpLCBWaXJnbyAoMTgpLCBMaWJyYSAoMTkpLCBTY29ycGlvICgyMCksIFNhZ2l0dGFyaXVzICgyMyksIENhcHJpY29ybiAoMTgpLCBBcXVhcml1cyAoMjApLCBQaXNjZXMgKDIzKS4gVGVzdCB0aGUgaHlwb3RoZXNpcyB0aGF0IHpvZGlhYyBzaWducyBhcmUgZXZlbmx5IGRpc3RyaWJ1dGVkIGFjcm9zcyB2aXN1YWwgYXJ0aXN0cy4NCiMjIyBIeXBvdGhlc2lzDQokSDAkIDogQmlydGhzIGFyZSB1bmlmb3JtbHkgZGlzdHJpYnV0ZWQgb3ZlciB6b2RpYWMgc2lnbnMuDQokSEEkIDogQmlydGhzIGFyZSBub3QgdW5pZm9ybWx5IGRpc3RyaWJ1dGVkIG92ZXIgem9kaWFjIHNpZ25zLg0KYGBge3J9DQpvYnNlcnZlZCA8LWMgKCAyOSwgMjQsIDIyLCAxOSwgMjEsIDE4LCAxOSwgMjAsIDIzLCAxOCwgMjAsIDIzKQ0KbjwtMjU2DQpleHBlY3RlZCA8LSBjKDEvMTIpICogbg0KYWxwaGEgPC0gLjA1DQpyIDwtIGMoMSAsIDIgLCAzLCA0ICwgNSAsIDYgLCA3LCA4ICwgOSAsIDEwICwgMTEgLCAxMikNCmBgYA0Kd2hlcmUgJGRmPTEy4oiSMT0xMS4kIEluIFIsIHdlIGNhbiBjYWxjdWxhdGUgJM+HMiQgYXMgdGhlIGZvbGxvd2luZzoNCmBgYHtyfQ0KZGYgPC0gMTIgLSAxDQooY2hpc3EgPC0gc3VtKChvYnNlcnZlZCAtIGV4cGVjdGVkKV4yIC8gZXhwZWN0ZWQpKQ0KKHBfdmFsdWUgPC0gcGNoaXNxKHEgPSBjaGlzcSwgZGYgPSBkZiwgbG93ZXIudGFpbCA9IEYpKQ0KYGBgDQpUaGUgUC12YWx1ZSBvZiAwLjA3MzQ1ODYxIHNheXMgdGhhdCBpZiB0aGUgem9kaWFjIHNpZ25zIG9mIGV4ZWN1dGl2ZXMgd2VyZSBpbiBmYWN0IGRpc3RyaWJ1dGVkIHVuaWZvcm1seSwgYW4gb2JzZXJ2ZWQgY2hpLXNxdWFyZSB2YWx1ZSBvZiA1LjA5IG9yIGhpZ2hlci4gVGhpcyBjZXJ0YWlubHkgaXNu4oCZdCB1bnVzdWFsLCBzbyB3ZSBmYWlsIHRvIHJlamVjdCB0aGUgbnVsbCBoeXBvdGhlc2lzLiBUaGVyZSBpcyBubyBldmlkZW5jZSB0aGF0IHRoZSBiaXJ0aHMgb2YgdGhlIGV4ZWN1dGVzIGFyZSBub3QgdW5pZm9ybWx5IGRpc3RyaWJ1dGVkIGFtb25nIHRoZSB6b2RpYWNzLiBXZSBjYW4gYWxzbyB2aXN1YWxpemUgdGhlIHJlc3VsdCBhcyB3ZSBjYW4gc2VlIGJlbGxvdzoNCmBgYHtyfQ0KbGlicmFyeShnZ3Bsb3QyKQ0KbGlicmFyeShkcGx5cikNCmxpYnJhcnkodGlkeXIpDQpsaWJyYXJ5KGdndGhlbWVzKQ0KbHJyID0gLUluZg0KdXJyID0gcWNoaXNxKHAgPSBhbHBoYSwgZGYgPSBkZiwgbG93ZXIudGFpbCA9IEZBTFNFKQ0KZGF0YS5mcmFtZShjaGkyID0gMDoyNTAwIC8gMTAwKSAlPiUNCiAgbXV0YXRlKGRlbnNpdHkgPSBkY2hpc3EoeCA9IGNoaTIsIGRmID0gZGYpKSAlPiUNCiAgbXV0YXRlKHJyID0gaWZlbHNlKGNoaTIgPCBscnIgfCBjaGkyID4gdXJyLCBkZW5zaXR5LCAwKSkgJT4lDQpnZ3Bsb3QoKSArDQogIGdlb21fbGluZShhZXMoeCA9IGNoaTIsIHkgPSBkZW5zaXR5KSkgKw0KICBnZW9tX2FyZWEoYWVzKHggPSBjaGkyLCB5ID0gcnIpLCBmaWxsID0gInJlZCIsIGFscGhhID0gMC4zKSArDQojICBnZW9tX3ZsaW5lKGFlcyh4aW50ZXJjZXB0ID0gcGlfMCksIGNvbG9yID0gImJsYWNrIikgKw0KICBnZW9tX3ZsaW5lKGFlcyh4aW50ZXJjZXB0ID0gY2hpc3EpLCBjb2xvciA9ICJyZWQiKSArDQogIGxhYnModGl0bGUgPSBicXVvdGUoIkNoaS1TcXVhcmVkIEdvb2RuZXNzLW9mLUZpdCBUZXN0IiksDQogICAgICAgc3VidGl0bGUgPSBicXVvdGUoIkNoaXNxID0ifi4ocm91bmQoY2hpc3EsMikpfiIsIG4gPSJ+LihuKX4iLCBhbHBoYSA9In4uKGFscGhhKX4iLCBjaGlzcV9jcml0ID0ifi4ocm91bmQodXJyLDIpKX4iLCBwLXZhbHVlID0ifi4ocm91bmQocF92YWx1ZSwzKSkpLA0KICAgICAgIHggPSAiY2hpc3EiLA0KICAgICAgIHkgPSAiRGVuc2l0eSIpICsNCiAgdGhlbWUobGVnZW5kLnBvc2l0aW9uPSJub25lIikNCmBgYA0KDQo=

Lab6: Goodness of Fit

Widi yantih

Oktober 11, 2020

1 Exercise

1.1 Exercise 1

1.2 Exercise 2

1.3 Exercise 3