rm(list=ls(all=T))
Lista 2 - Estatística Não-Paramétrica
Lista de Exercícios - Número 2
Resolução da lista de exercícios de Estatística não-paramétrica período 2022.2 da Universidade Federal da Paraíba.
Questão 1
Em uma pesquisa sobre o racismo na infância, inquiriram-se aleatoriamente 17 crianças com 7 anos de idade, antes e depois de serem submetidas a uma campanha anti-racista. Verificar se a campanha produziu efeito positivo nas atitudes das crianças. Use \alpha = 0.05 e a tabela de resultados seguinte:
Definindo as hipóteses:
H_0: Não \hspace{0.1cm} houve \hspace{0.1cm} efeito \hspace{0.1cm} na \hspace{0.1cm} atitude \hspace{0.1cm} das \hspace{0.1cm} crianças H_1: Houve \hspace{0.1cm} efeito \hspace{0.1cm} na \hspace{0.1cm} atitude \hspace{0.1cm} das \hspace{0.1cm} crianças
<- matrix(c(4,6,3,4),2,2,byrow = T)
x mcnemar.test(x)
McNemar's Chi-squared test with continuity correction
data: x
McNemar's chi-squared = 0.44444, df = 1, p-value = 0.505
Resposta:
A um nível de significância de 5% e com base na amostra não rejeitamos a hipótese nula, ou seja, com base na amostra e com 95% de confiança a campanha não produziu efeito na atitude das crianças.
Questão 2
- Para verificar se o tipo de pneu utilizado tem ou não influência no consumo de gasolina, fez-se o seguinte experimento: oito carros diferentes, equipados com pneus radiais, percorreram um determinado trajeto; a seguir, os mesmos carros foram equipados com pneus comuns e percorreram o mesmo trajeto. Os consumos (em km/litro) para cada carro foram os seguintes:
Testar, ao nível \alpha = 0.05, se o tipo de pneu utilizado tem ou não influência no consumo de gasolina.
- Definindo as hipóteses:
H_0: \tilde{\mu_D} = 0 H_1: \tilde{\mu_D} \neq 0
<- c(25.8,14.5,12.1,19.9,15.1,15.8,23.0,16.0)
pneus_comuns <- c(26.5,14.3,12.7,20.2,15.1,16.9,23.4,16.4)
pneus_radiais wilcox.test(pneus_radiais, pneus_comuns, paired = T, conf.level = 0.95, exact = T)
Wilcoxon signed rank test with continuity correction
data: pneus_radiais and pneus_comuns
V = 27, p-value = 0.03429
alternative hypothesis: true location shift is not equal to 0
Resposta:
De acordo com o resultado do teste, como o p-valor que foi de 0.034 menor do que o \alpha, podemos concluir ao nível de 95% de confiança e com base na amostra rejeitamos H_0, ou seja, podemos concluir que o uso de pneus diferentes afeta o desempenho do veículo.
Questão 3
- Uma empresa submeteu 8 de seus empregados a um curso sobre um novo método a ser implantado, visando aumentar o rendimento na produção. O resultado em número médio de peças produzidas por empregado para o método antigo e novo estão na tabela seguinte. Compare a eficiência dos dois métodos. Use \alpha = 0.05.
Empregado | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 |
---|---|---|---|---|---|---|---|---|
Método antigo | 18 | 15 | 19 | 23 | 12 | 16 | 28 | 18 |
Método novo | 24 | 14 | 22 | 28 | 16 | 20 | 20 | 18 |
- Definindo as hipóteses:
H_0:\tilde{\mu_D} \geq 0 H_1:\tilde{\mu_D} < 0
<- c(18,15,19,23,12,16,28,18)
antigo <- c(24,14,22,28,16,20,20,18)
novo ::SIGN.test(antigo, novo, alternative = "less") BSDA
Dependent-samples Sign-Test
data: antigo and novo
S = 2, p-value = 0.2266
alternative hypothesis: true median difference is less than 0
95 percent confidence interval:
-Inf 0.8642857
sample estimates:
median of x-y
-3.5
Achieved and Interpolated Confidence Intervals:
Conf.Level L.E.pt U.E.pt
Lower Achieved CI 0.8555 -Inf 0.0000
Interpolated CI 0.9500 -Inf 0.8643
Upper Achieved CI 0.9648 -Inf 1.0000
Resposta:
De acordo com o resultado do teste, obtivemos um p-valor de 0.2266, sendo maior do que o \alpha com 95% de confiança e com base na amostra não rejeitamos H_0, ou seja, o método mostrou ser mais eficiente.
Questão 4
- Um pesquisador alega que uma nova vacina reduzirá o número de resfriados em adultos. Obtém-se uma amostra aleatória de 14 adultos e anota-se o número de resfriados que cada um teve durante um ano. Depois de vacinar cada adulto, anota-se novamente o número de resfriados durante um ano. Os resultados estão na tabela seguinte. Para \alpha = 0.05, pode-se confirmar a alegação do pesquisador?
Paciente | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Antes da vacina | 3 | 4 | 2 | 1 | 3 | 6 | 4 | 5 | 2 | 0 | 2 | 5 | 3 | 3 |
Depois da vacina | 2 | 1 | 0 | 1 | 1 | 3 | 3 | 2 | 2 | 2 | 3 | 4 | 3 | 2 |
- Definindo as hipóteses:
H_0:\tilde{\mu_D} \leq 0 H_1:\tilde{\mu_D} > 0
<- c(3,4,2,1,3,6,4,5,2,0,2,5,3,3)
antes <- c(2,1,0,1,1,3,3,2,2,2,3,4,3,2)
depois ::SIGN.test(antes, depois, alternative = "greater") BSDA
Dependent-samples Sign-Test
data: antes and depois
S = 9, p-value = 0.03271
alternative hypothesis: true median difference is greater than 0
95 percent confidence interval:
0 Inf
sample estimates:
median of x-y
1
Achieved and Interpolated Confidence Intervals:
Conf.Level L.E.pt U.E.pt
Lower Achieved CI 0.9102 0 Inf
Interpolated CI 0.9500 0 Inf
Upper Achieved CI 0.9713 0 Inf
Resposta:
De acordo com o resultado do teste, obtivemos um p-valor de 0.0327, sendo maior do que o \alpha com 95% de confiança e com base na amostra rejeitamos H_0, ou seja, não existe evidências de que a alegação do pesquisador seja verdadeira.
Questão 5
- Dois grupos de crianças emparelhadas quanto a idade, sexo, nível sócio-econômico e inteligência foram submetidas a dois métodos de ensino: Piaget e Tradicional. No final do treinamento foi aplicado um teste de desenvolvimento cognitivo, obtendo os resultados seguintes:
Tradicional | 6 | 7 | 14 | 10 | 5 | 13 | 11 | 12 | 15 | 18 |
---|---|---|---|---|---|---|---|---|---|---|
Piaget | 5 | 11 | 13 | 19 | 15 | 12 | 17 | 13 | 16 | 9 |
Testar, ao nível \alpha = 0.01, se há diferença entre os dois métodos, quanto ao desenvolvimento cognitivo.
Definindo as hipóteses:
H_0: \tilde{\mu_D} = 0
H_1: \tilde{\mu_D} \neq 0
<- c(6,7,14,10,5,13,11,12,15,18)
tradicional <- c(5,11,13,19,15,12,17,13,16,9)
piaget wilcox.test(tradicional, piaget, paired = T, conf.level = 0.99)
Wilcoxon signed rank test with continuity correction
data: tradicional and piaget
V = 17.5, p-value = 0.3262
alternative hypothesis: true location shift is not equal to 0
Resposta:
De acordo com o resultado do teste, temos que não é rejeitada a hipótese nula, pois o resultado do p-valor foi de 0.326 sendo maior do que o nível de significância, ou seja, com base na amostra e com 99% de confiança não há diferença no desenvolvimento cognitivo se preferido um método ao outro.
Questão 6
- Para verificar se existe ou não associação entre sexo e a área do curso universitário escolhido, uma amostra aleatória de 200 universitários foi obtido. Os estudantes foram classificados de acordo com o sexo e a área de conhecimento escolhida conforme tabela seguinte. Use um nível de 5% de significância para efetuar o teste.
Área | Exatas | Humanas | Saúde | Total |
---|---|---|---|---|
Gênero | ||||
Masculino | 37 | 48 | 16 | 101 |
Feminino | 20 | 40 | 39 | 99 |
Total | 57 | 88 | 55 | 200 |
- Definindo as hipóteses:
H_0: Não \hspace{0.1cm} existe \hspace{0.1cm} associação \hspace{0.1cm} entre \hspace{0.1cm} o \hspace{0.1cm} curso \hspace{0.1cm} universitário \hspace{0.1cm} e \hspace{0.1cm} o \hspace{0.1cm} gênero
H_1: Existe \hspace{0.1cm} associação \hspace{0.1cm} entre \hspace{0.1cm} o \hspace{0.1cm} curso \hspace{0.1cm} universitário \hspace{0.1cm} e \hspace{0.1cm} o \hspace{0.1cm} gênero
<- matrix(c(37,48,16,20,40,39),2,3,byrow = T)
y chisq.test(y, correct = T)
Pearson's Chi-squared test
data: y
X-squared = 15.397, df = 2, p-value = 0.0004535
Resposta:
Podemos ver de acordo com o resultado do teste, que a um nível de confiança de 95% e com base na amostra, rejeitamos H_0, o resultado do p-valor foi de 5^{-4}, sendo menor do que o nível de significância, logo existe evidências de que há associação entre o gênero e a área do curso universitário escolhido.
Questão 7
- Uma companhia de seguros de automóveis estava interessada em saber se o fato de uma pessoa dirigir alcoolizada, influencia ou não no número de acidentes ocorrido um determinado final de semana. Observou-se o número de carros que passam em determinado cruzamento de uma avenida movimentada em determinado tempo e obteve a seguinte tabela:
Motorista | Alcoolizado | Sóbrio | Total |
---|---|---|---|
Ocorrência de acidentes | |||
Sim | 40 | 10 | 50 |
Não | 15 | 85 | 100 |
Total | 55 | 95 | 150 |
A que conclusão chega a companhia de seguros? Use \alpha = 0.01.
- Definindo as hipóteses:
H_0: Não \hspace{0.1cm} existe \hspace{0.1cm} associação \hspace{0.1cm} entre \hspace{0.1cm} o \hspace{0.1cm} consumo \hspace{0.1cm} de \hspace{0.1cm} alcool \hspace{0.1cm} e \hspace{0.1cm} a \hspace{0.1cm} ocorrência \hspace{0.1cm} de \hspace{0.1cm} acidentes
H_1: Existe \hspace{0.1cm} associação \hspace{0.1cm} entre \hspace{0.1cm} o \hspace{0.1cm} consumo \hspace{0.1cm} de \hspace{0.1cm} alcool \hspace{0.1cm} e \hspace{0.1cm} a \hspace{0.1cm} ocorrência \hspace{0.1cm} de \hspace{0.1cm} acidentes
<- matrix(c(40,10,15,85),2,2,byrow = T)
z chisq.test(z, correct = T)
Pearson's Chi-squared test with Yates' continuity correction
data: z
X-squared = 57.879, df = 1, p-value = 2.787e-14
Resposta:
Podemos ver de acordo com o resultado do teste, que a um nível de confiança de 99% e com base na amostra, rejeitamos H_0, o resultado do p-valor foi de 2.7872^{-14}, sendo menor do que o nível de significância, logo existe evidências de que há associação entre o consumo de alcool e a ocorrência de acidentes.
Questão 8
- Suponha a presença de uma enzima em uma amostra de 10 pacientes submetidos a uma reação sorológica. Testar a independência dos fatores usando um nível de 5% de significância.
Enzima | Presente | Ausente | Total |
---|---|---|---|
Reação Sorológica | |||
Positiva | 6 | 1 | 7 |
Negativa | 0 | 3 | 3 |
Total | 6 | 4 | 10 |
- Definindo as hipóteses:
H_0:p_1 = p_2 H_1: p_1 \neq p_2
<- matrix(c(6,1,0,3),2,2,byrow = T)
w fisher.test(w, conf.level = 0.95)
Fisher's Exact Test for Count Data
data: w
p-value = 0.03333
alternative hypothesis: true odds ratio is not equal to 1
95 percent confidence interval:
0.8554844 Inf
sample estimates:
odds ratio
Inf
Resposta:
De acordo com o resultado do teste, rejeitamos H_0 a um nível de confiança de 95% e com base na amostra, ou seja, significa que os fatores são independentes. O resultado do p-valor foi de 0.0333.
Questão 9
- Testar se a incidência de infecção parasitária é a mesma se ou não uma substância experimental é ingerida. Use um nível \alpha = 0.05 de significância e os dados seguintes:
Substância | Ingerida | Não Ingerida | Total |
---|---|---|---|
Infecçaõ | |||
Sim | 6 | 8 | 14 |
Não | 12 | 2 | 14 |
Total | 18 | 10 | 28 |
- Definindo as hipóteses:
H_0:p_1 = p_2 H_1: p_1 \neq p_2
<- matrix(c(6,8,12,2),2,2,byrow = T)
j fisher.test(j, conf.level = 0.95)
Fisher's Exact Test for Count Data
data: j
p-value = 0.04607
alternative hypothesis: true odds ratio is not equal to 1
95 percent confidence interval:
0.0107728 0.9737676
sample estimates:
odds ratio
0.1357897
Resposta:
De acordo com o resultado do teste, rejeitamos H_0 a um nível de confiança de 95% e com base na amostra, ou seja, significa que a incidência da infecção parasitária não é a mesma com a ingestão ou não da substância experimental. O resultado do p-valor foi de 0.0461.
Questão 10
- A reação ao tratamento por quimioterapia está sendo estudada em quatro grupos de pacientes com câncer. Deseja-se investigar se todos os tipos reagem da mesma maneira. Uma amostra de pacientes de cada grupo foi escolhida ao acaso e classificou-se a reação em três categorias:
Reação | Pouca | Média | Alta | Total |
---|---|---|---|---|
Câncer | ||||
Tipo I | 51 | 33 | 16 | 100 |
Tipo II | 58 | 29 | 13 | 100 |
Tipo III | 48 | 42 | 30 | 120 |
Tipo IV | 26 | 38 | 16 | 80 |
Total | 183 | 142 | 75 | 400 |
Teste ao nível de significância de 5% se a reação é a mesma para os diferentes tipos da doença.
- Definindo as hipóteses:
H_0: Os \hspace{0.1cm} tipos \hspace{0.1cm} de \hspace{0.1cm} câncer \hspace{0.1cm} reagem \hspace{0.1cm} da \hspace{0.1cm} mesma \hspace{0.1cm} maneira
H_1: Os \hspace{0.1cm} tipos \hspace{0.1cm} de \hspace{0.1cm} câncer \hspace{0.1cm} não \hspace{0.1cm} reagem \hspace{0.1cm} da \hspace{0.1cm} mesma \hspace{0.1cm} maneira
<- matrix(c(51,33,16,58,29,13,48,42,30,26,38,16),4,3,byrow = T)
xx chisq.test(xx)
Pearson's Chi-squared test
data: xx
X-squared = 17.173, df = 6, p-value = 0.008669
Resposta:
De acordo com o resultado do teste, obtivemos que o resultado a um nível de confiança de 95% e com base na amostra, rejeitamos a hipótese de que os tipos diferente de câncer reagem da mesma forma. O resultado do p-valor foi de 0.0087.
Questão 11
- Na tabela seguinte, estão as notas de um mesmo exame aplicado em duas classes de 15 estudantes cada. Ao nível de 5% de significância, testar a hipótese de que as duas classes de estudantes são de populações com a mesma mediana.
Classe I | 9 | 10 | 6 | 8 | 4 | 5 | 9 | 6 | 4 | 6 | 5 | 7 | 7 | 9 | 6 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Classe II | 4 | 5 | 9 | 9 | 6 | 6 | 8 | 3 | 7 | 5 | 9 | 6 | 10 | 8 | 8 |
- Definindo as hipóteses:
H_0: \tilde{\mu_{X}} = \tilde{\mu_Y}
H_1: \tilde{\mu_{X}} \neq \tilde{\mu_Y}
<- c(9,10,6,8,4,5,9,6,4,6,5,7,7,9,6)
classe1 <- c(4,5,9,9,6,6,8,3,7,5,9,6,10,8,8)
classe2 ::mediantest(classe1, classe2) nonpar
Exact Median Test
H0: The 2 population medians are equal.
HA: The 2 population medians are not equal.
Significance Level = 0.05
The p-value is 0.53390777521456
There is not enough evidence to conclude that the population medians are different at a significance level of 0.05 .
Resposta:
Como o resultado do teste, obtivemos a um nível de significância de 5% e com base na amostra de que as amostras foram extraídas de populações com a mesma mediana, o resultado pode ser visto através do p-valor do teste que foi de 0,5339.
Questão 12
- Na tabela seguinte, estão amostras aleatórias e independentes dos salários (em milhares de reais por ano) de uma mesma categoria profissional em duas regiões diferentes. Ao nível de 5% de significância, testar a hipótese de que os salários nas duas regiões são de populações com a mesma mediana.
Região I | 17 | 19 | 22 | 25 | 24 | 25 | 30 | 29 | 31 | 28 | 37 | 15 | 40 | 17 | 38 | 39 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Região II | 18 | 21 | 20 | 23 | 17 | 26 | 28 | 28 | 29 | 32 | 16 | 35 | 19 | 27 |
- Definindo as hipóteses:
H_0: \tilde{\mu_{X}} = \tilde{\mu_Y}
H_1: \tilde{\mu_{X}} \neq \tilde{\mu_Y}
<- c(17,19,22,25,24,25,30,29,31,28,37,15,40,17,38,39)
região1 <- c(18,21,20,23,17,26,28,28,29,32,16,35,19,27)
região2 ::mediantest(região1,região2) nonpar
Exact Median Test
H0: The 2 population medians are equal.
HA: The 2 population medians are not equal.
Significance Level = 0.05
The p-value is 0.569501626895531
There is not enough evidence to conclude that the population medians are different at a significance level of 0.05 .
Resposta:
Como o resultado do teste, obtivemos a um nível de significância de 5% e com base na amostra de que as amostras foram extraídas de populações com a mesma mediana, o resultado pode ser visto através do p-valor do teste que foi de 0,5695.
Questão 13
- Testar, ao nível de 5% de significância e considerando as amostras aleatórias seguintes, a hipótese de que não existe diferença nos pesos (em kg) de mulheres e homens adultos.
Mulheres | 68 | 63 | 75 | 65 | 73 | ||
---|---|---|---|---|---|---|---|
Homens | 83 | 78 | 70 | 93 | 88 | 80 | 85 |
- Definindo as hipóteses:
H_0: \tilde{\mu_X} = \tilde{\mu_Y}
H_1: \tilde{\mu_X} \neq \tilde{\mu_Y}
<- c(68,63,75,65,73)
mulheres <- c(83,78,70,93,88,80,85)
homens wilcox.test(mulheres, homens, correct = F, alternative = "two.sided")
Wilcoxon rank sum exact test
data: mulheres and homens
W = 2, p-value = 0.0101
alternative hypothesis: true location shift is not equal to 0
Resposta:
De acordo com o resultado do teste, a um nível de confiança de 95% e com base na amostra, rejeitamos a hipótese nula, ou seja, existe diferença no peso entre homens e mulheres adultos. O resultado do p-valor foi de 0.0101.
Questão 14
- Verificar se os valores do grupo Y tendem a ser maiores do que os do grupo X. Considere, para efetuar o teste, um nível de 5% de significância e as amostras aleatórias seguintes:
x_i | 22 | 26 | 16 | 27 | 19 | 38 | 37 | |
---|---|---|---|---|---|---|---|---|
y_i | 35 | 22 | 31 | 23 | 28 | 18 | 25 | 21 |
- Definindo as hipóteses:
H_0: \tilde{\mu_X} \leq \tilde{\mu_Y} H_1: \tilde{\mu_X} > \tilde{\mu_Y}
rm(list=ls(all=T))
<- c(22,26,16,27,19,38,37)
x <- c(35,22,31,23,28,18,25,21)
y wilcox.test(x,y,correct = F, alternative = "greater")
Warning in wilcox.test.default(x, y, correct = F, alternative = "greater"): não
é possível computar o valor de p exato com o de desempate
Wilcoxon rank sum test
data: x and y
W = 29.5, p-value = 0.431
alternative hypothesis: true location shift is greater than 0
Resposta:
Conforme o resultado do teste, temos que não rejeitamos a hipótese nula com 95% de confiança e com base na amostra, ou seja, os valores do grupo Y não tendem a ser maiores do que o do grupo X.
Questão 15
- Considerando as amostras aleatórias seguintes e, ao nível de 5% de significância, verificar se existe diferença significativa entre os dois grupos:
x_i | 28.4 | 34.2 | 29.5 | 32.2 | 30.1 |
---|---|---|---|---|---|
y_i | 32.2 | 34.3 | 36.2 | 35.6 | 32.5 |
- Definindo as hipóteses:
H_0: F_X = G_Y
H_1: F_X \neq G_Y
<- c(28.4,34.2,29.5,32.2,30.1)
xx <- c(32.2,34.3,36.2,35.6,32.5)
yy ks.test(xx,yy)
Exact two-sample Kolmogorov-Smirnov test
data: xx and yy
D = 0.6, p-value = 0.3571
alternative hypothesis: two-sided
Resposta:
De acordo com o resultado do teste, temos que a hipótese nula é rejeitada a um nível de confiança de 95% e com base na amostra, ou seja, existe diferença significativa entre os dois grupos. O resultado do p-valor foi de 0.3571.