Úloha A

1.)

data <- read_excel("vokaly.xls")
table(data$Vowel,data$Sex)
##    
##       f   m
##   a 384 216
##   e 384 216
##   i 384 216
##   o 384 216
##   u 384 216

Jednotky si převedeme na hertze.

data$F1_Hz <- 650*sinh(data$F1_B / 7)
data$F2_Hz <- 650*sinh(data$F2_B / 7)
data$F3_Hz <- 650*sinh(data$F3_B / 7)

2.)

Ze souberu vybereme dvě skupiny: vokál [a] muži, vokál [a] ženy. Následně zjistíme jejich dimenze.

vokalMuziA <- filter(data, Vowel == "a", Sex == "m")
vokalZenyA <- filter(data, Vowel == "a", Sex == "f")
dim(vokalMuziA)
## [1] 216  10
dim(vokalZenyA)
## [1] 384  10

Vokál [a] je u mužů zastoupen 216krát, u žen 384krát. Počty řádků těchto tabulek odpovídají počtům zjištěným v bodě 1.

3.)

K testování normality dat užijeme Shapiro-Wilkův test.

H0: jedná se o normální rozdělení.

H1: nejedná se o normální rozdělení.

shapiro.test(vokalMuziA$F2_Hz)
## 
##  Shapiro-Wilk normality test
## 
## data:  vokalMuziA$F2_Hz
## W = 0.99076, p-value = 0.185
shapiro.test(vokalZenyA$F2_Hz)
## 
##  Shapiro-Wilk normality test
## 
## data:  vokalZenyA$F2_Hz
## W = 0.99819, p-value = 0.9592

Jelikož je p hodnota větší než 0.05, nezamítáme H0.

4.)

H0: rozptyly F2 žen a mužů u tohoto vokálu jsou shodné.

H1: rozptyly jsou různé.

var.test(vokalMuziA$F2_Hz, vokalZenyA$F2_Hz, conf.level = 0.95)
## 
##  F test to compare two variances
## 
## data:  vokalMuziA$F2_Hz and vokalZenyA$F2_Hz
## F = 0.48722, num df = 215, denom df = 383, p-value = 1.164e-08
## alternative hypothesis: true ratio of variances is not equal to 1
## 95 percent confidence interval:
##  0.3860544 0.6198207
## sample estimates:
## ratio of variances 
##          0.4872209

Jelikož je p hodnota menší než 0.05, zamítáme H0.

H0: střední hodnoty F2 žen a mužů u tohoto vokálu jsou shodné.

H1: střední hodnoty jsou různé.

t.test(vokalMuziA$F2_Hz, vokalZenyA$F2_Hz, alternative = "two.sided", paired = FALSE, var.equal = FALSE, conf.level = 0.95)
## 
##  Welch Two Sample t-test
## 
## data:  vokalMuziA$F2_Hz and vokalZenyA$F2_Hz
## t = -19.174, df = 570.87, p-value < 2.2e-16
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -234.3578 -190.8059
## sample estimates:
## mean of x mean of y 
##  1246.162  1458.744

Jelikož je p hodnota menší než 0.05, zamítáme H0.

Úloha B

H0: odlišnosti vznikly náhodou.

H1: odlišnosti nevznikly náhodou.

chisq.test(c(5, 35))
## 
##  Chi-squared test for given probabilities
## 
## data:  c(5, 35)
## X-squared = 22.5, df = 1, p-value = 2.101e-06

Jelikož je p hodnota menší než 0.05, zamítáme H0.

Úloha C

H0: odlišnosti vznikly náhodou.

H1: odlišnosti nevznikly náhodou.

rok2013 = c(5, 15, 16)
rok2014 = c(7, 7, 10)
tabulka <- as.data.frame(rbind(rok2013,rok2014))
tabulka
##         V1 V2 V3
## rok2013  5 15 16
## rok2014  7  7 10
names(tabulka) <- c("A", "B", "C")
tabulka
##         A  B  C
## rok2013 5 15 16
## rok2014 7  7 10
chisq.test(tabulka)
## Warning in chisq.test(tabulka): Chi-squared approximation may be incorrect
## 
##  Pearson's Chi-squared test
## 
## data:  tabulka
## X-squared = 2.3198, df = 2, p-value = 0.3135

Jelikož je p hodnota větší než 0.05, nezamítáme H0.