Lista 2 - Estatística Não-Paramétrica

Autor

Paulo Manoel da Silva Junior

Lista de Exercícios - Número 2

Resolução da lista de exercícios de Estatística não-paramétrica período 2022.2 da Universidade Federal da Paraíba.

rm(list=ls(all=T))

Questão 1

  • Em uma pesquisa sobre o racismo na infância, inquiriram-se aleatoriamente 17 crianças com 7 anos de idade, antes e depois de serem submetidas a uma campanha anti-racista. Verificar se a campanha produziu efeito positivo nas atitudes das crianças. Use \alpha = 0.05 e a tabela de resultados seguinte:

  • Definindo as hipóteses:

H_0: Não \hspace{0.1cm} houve \hspace{0.1cm} efeito \hspace{0.1cm} na \hspace{0.1cm} atitude \hspace{0.1cm} das \hspace{0.1cm} crianças H_1: Houve \hspace{0.1cm} efeito \hspace{0.1cm} na \hspace{0.1cm} atitude \hspace{0.1cm} das \hspace{0.1cm} crianças

x <- matrix(c(4,6,3,4),2,2,byrow = T)
mcnemar.test(x)

    McNemar's Chi-squared test with continuity correction

data:  x
McNemar's chi-squared = 0.44444, df = 1, p-value = 0.505

Resposta: A um nível de significância de 5% e com base na amostra não rejeitamos a hipótese nula, ou seja, com base na amostra e com 95% de confiança a campanha não produziu efeito na atitude das crianças.

Questão 2

  • Para verificar se o tipo de pneu utilizado tem ou não influência no consumo de gasolina, fez-se o seguinte experimento: oito carros diferentes, equipados com pneus radiais, percorreram um determinado trajeto; a seguir, os mesmos carros foram equipados com pneus comuns e percorreram o mesmo trajeto. Os consumos (em km/litro) para cada carro foram os seguintes:

Testar, ao nível \alpha = 0.05, se o tipo de pneu utilizado tem ou não influência no consumo de gasolina.

  • Definindo as hipóteses:

H_0: \tilde{\mu_D} = 0 H_1: \tilde{\mu_D} \neq 0

pneus_comuns <- c(25.8,14.5,12.1,19.9,15.1,15.8,23.0,16.0)
pneus_radiais <- c(26.5,14.3,12.7,20.2,15.1,16.9,23.4,16.4)
wilcox.test(pneus_radiais, pneus_comuns, paired = T, conf.level = 0.95, exact = T)

    Wilcoxon signed rank test with continuity correction

data:  pneus_radiais and pneus_comuns
V = 27, p-value = 0.03429
alternative hypothesis: true location shift is not equal to 0

Resposta: De acordo com o resultado do teste, como o p-valor que foi de 0.034 menor do que o \alpha, podemos concluir ao nível de 95% de confiança e com base na amostra rejeitamos H_0, ou seja, podemos concluir que o uso de pneus diferentes afeta o desempenho do veículo.

Questão 3

  • Uma empresa submeteu 8 de seus empregados a um curso sobre um novo método a ser implantado, visando aumentar o rendimento na produção. O resultado em número médio de peças produzidas por empregado para o método antigo e novo estão na tabela seguinte. Compare a eficiência dos dois métodos. Use \alpha = 0.05.
Empregado 1 2 3 4 5 6 7 8
Método antigo 18 15 19 23 12 16 28 18
Método novo 24 14 22 28 16 20 20 18
  • Definindo as hipóteses:

H_0:\tilde{\mu_D} \geq 0 H_1:\tilde{\mu_D} < 0

antigo <- c(18,15,19,23,12,16,28,18)
novo <- c(24,14,22,28,16,20,20,18)
BSDA::SIGN.test(antigo, novo, alternative = "less")

    Dependent-samples Sign-Test

data:  antigo and novo
S = 2, p-value = 0.2266
alternative hypothesis: true median difference is less than 0
95 percent confidence interval:
      -Inf 0.8642857
sample estimates:
median of x-y 
         -3.5 

Achieved and Interpolated Confidence Intervals: 

                  Conf.Level L.E.pt U.E.pt
Lower Achieved CI     0.8555   -Inf 0.0000
Interpolated CI       0.9500   -Inf 0.8643
Upper Achieved CI     0.9648   -Inf 1.0000

Resposta: De acordo com o resultado do teste, obtivemos um p-valor de 0.2266, sendo maior do que o \alpha com 95% de confiança e com base na amostra não rejeitamos H_0, ou seja, o método mostrou ser mais eficiente.

Questão 4

  • Um pesquisador alega que uma nova vacina reduzirá o número de resfriados em adultos. Obtém-se uma amostra aleatória de 14 adultos e anota-se o número de resfriados que cada um teve durante um ano. Depois de vacinar cada adulto, anota-se novamente o número de resfriados durante um ano. Os resultados estão na tabela seguinte. Para \alpha = 0.05, pode-se confirmar a alegação do pesquisador?
Paciente 1 2 3 4 5 6 7 8 9 10 11 12 13 14
Antes da vacina 3 4 2 1 3 6 4 5 2 0 2 5 3 3
Depois da vacina 2 1 0 1 1 3 3 2 2 2 3 4 3 2
  • Definindo as hipóteses:

H_0:\tilde{\mu_D} \leq 0 H_1:\tilde{\mu_D} > 0

antes <- c(3,4,2,1,3,6,4,5,2,0,2,5,3,3)
depois <- c(2,1,0,1,1,3,3,2,2,2,3,4,3,2)
BSDA::SIGN.test(antes, depois, alternative = "greater")

    Dependent-samples Sign-Test

data:  antes and depois
S = 9, p-value = 0.03271
alternative hypothesis: true median difference is greater than 0
95 percent confidence interval:
   0 Inf
sample estimates:
median of x-y 
            1 

Achieved and Interpolated Confidence Intervals: 

                  Conf.Level L.E.pt U.E.pt
Lower Achieved CI     0.9102      0    Inf
Interpolated CI       0.9500      0    Inf
Upper Achieved CI     0.9713      0    Inf

Resposta: De acordo com o resultado do teste, obtivemos um p-valor de 0.0327, sendo maior do que o \alpha com 95% de confiança e com base na amostra rejeitamos H_0, ou seja, não existe evidências de que a alegação do pesquisador seja verdadeira.

Questão 5

  • Dois grupos de crianças emparelhadas quanto a idade, sexo, nível sócio-econômico e inteligência foram submetidas a dois métodos de ensino: Piaget e Tradicional. No final do treinamento foi aplicado um teste de desenvolvimento cognitivo, obtendo os resultados seguintes:
Tradicional 6 7 14 10 5 13 11 12 15 18
Piaget 5 11 13 19 15 12 17 13 16 9
  • Testar, ao nível \alpha = 0.01, se há diferença entre os dois métodos, quanto ao desenvolvimento cognitivo.

  • Definindo as hipóteses:

H_0: \tilde{\mu_D} = 0

H_1: \tilde{\mu_D} \neq 0

tradicional <- c(6,7,14,10,5,13,11,12,15,18)
piaget <- c(5,11,13,19,15,12,17,13,16,9)
wilcox.test(tradicional, piaget, paired = T, conf.level = 0.99)

    Wilcoxon signed rank test with continuity correction

data:  tradicional and piaget
V = 17.5, p-value = 0.3262
alternative hypothesis: true location shift is not equal to 0

Resposta: De acordo com o resultado do teste, temos que não é rejeitada a hipótese nula, pois o resultado do p-valor foi de 0.326 sendo maior do que o nível de significância, ou seja, com base na amostra e com 99% de confiança não há diferença no desenvolvimento cognitivo se preferido um método ao outro.

Questão 6

  • Para verificar se existe ou não associação entre sexo e a área do curso universitário escolhido, uma amostra aleatória de 200 universitários foi obtido. Os estudantes foram classificados de acordo com o sexo e a área de conhecimento escolhida conforme tabela seguinte. Use um nível de 5% de significância para efetuar o teste.
Área Exatas Humanas Saúde Total
Gênero
Masculino 37 48 16 101
Feminino 20 40 39 99
Total 57 88 55 200
  • Definindo as hipóteses:

H_0: Não \hspace{0.1cm} existe \hspace{0.1cm} associação \hspace{0.1cm} entre \hspace{0.1cm} o \hspace{0.1cm} curso \hspace{0.1cm} universitário \hspace{0.1cm} e \hspace{0.1cm} o \hspace{0.1cm} gênero

H_1: Existe \hspace{0.1cm} associação \hspace{0.1cm} entre \hspace{0.1cm} o \hspace{0.1cm} curso \hspace{0.1cm} universitário \hspace{0.1cm} e \hspace{0.1cm} o \hspace{0.1cm} gênero

y <- matrix(c(37,48,16,20,40,39),2,3,byrow = T)
chisq.test(y, correct = T)

    Pearson's Chi-squared test

data:  y
X-squared = 15.397, df = 2, p-value = 0.0004535

Resposta: Podemos ver de acordo com o resultado do teste, que a um nível de confiança de 95% e com base na amostra, rejeitamos H_0, o resultado do p-valor foi de 5^{-4}, sendo menor do que o nível de significância, logo existe evidências de que há associação entre o gênero e a área do curso universitário escolhido.

Questão 7

  • Uma companhia de seguros de automóveis estava interessada em saber se o fato de uma pessoa dirigir alcoolizada, influencia ou não no número de acidentes ocorrido um determinado final de semana. Observou-se o número de carros que passam em determinado cruzamento de uma avenida movimentada em determinado tempo e obteve a seguinte tabela:
Motorista Alcoolizado Sóbrio Total
Ocorrência de acidentes
Sim 40 10 50
Não 15 85 100
Total 55 95 150

A que conclusão chega a companhia de seguros? Use \alpha = 0.01.

  • Definindo as hipóteses:

H_0: Não \hspace{0.1cm} existe \hspace{0.1cm} associação \hspace{0.1cm} entre \hspace{0.1cm} o \hspace{0.1cm} consumo \hspace{0.1cm} de \hspace{0.1cm} alcool \hspace{0.1cm} e \hspace{0.1cm} a \hspace{0.1cm} ocorrência \hspace{0.1cm} de \hspace{0.1cm} acidentes

H_1: Existe \hspace{0.1cm} associação \hspace{0.1cm} entre \hspace{0.1cm} o \hspace{0.1cm} consumo \hspace{0.1cm} de \hspace{0.1cm} alcool \hspace{0.1cm} e \hspace{0.1cm} a \hspace{0.1cm} ocorrência \hspace{0.1cm} de \hspace{0.1cm} acidentes

z <- matrix(c(40,10,15,85),2,2,byrow = T)
chisq.test(z, correct = T)

    Pearson's Chi-squared test with Yates' continuity correction

data:  z
X-squared = 57.879, df = 1, p-value = 2.787e-14

Resposta: Podemos ver de acordo com o resultado do teste, que a um nível de confiança de 99% e com base na amostra, rejeitamos H_0, o resultado do p-valor foi de 2.7872^{-14}, sendo menor do que o nível de significância, logo existe evidências de que há associação entre o consumo de alcool e a ocorrência de acidentes.

Questão 8

  • Suponha a presença de uma enzima em uma amostra de 10 pacientes submetidos a uma reação sorológica. Testar a independência dos fatores usando um nível de 5% de significância.
Enzima Presente Ausente Total
Reação Sorológica
Positiva 6 1 7
Negativa 0 3 3
Total 6 4 10
  • Definindo as hipóteses:

H_0:p_1 = p_2 H_1: p_1 \neq p_2

w <- matrix(c(6,1,0,3),2,2,byrow = T)
fisher.test(w, conf.level = 0.95)

    Fisher's Exact Test for Count Data

data:  w
p-value = 0.03333
alternative hypothesis: true odds ratio is not equal to 1
95 percent confidence interval:
 0.8554844       Inf
sample estimates:
odds ratio 
       Inf 

Resposta: De acordo com o resultado do teste, rejeitamos H_0 a um nível de confiança de 95% e com base na amostra, ou seja, significa que os fatores são independentes. O resultado do p-valor foi de 0.0333.

Questão 9

  • Testar se a incidência de infecção parasitária é a mesma se ou não uma substância experimental é ingerida. Use um nível \alpha = 0.05 de significância e os dados seguintes:
Substância Ingerida Não Ingerida Total
Infecçaõ
Sim 6 8 14
Não 12 2 14
Total 18 10 28
  • Definindo as hipóteses:

H_0:p_1 = p_2 H_1: p_1 \neq p_2

j <- matrix(c(6,8,12,2),2,2,byrow = T)
fisher.test(j, conf.level = 0.95)

    Fisher's Exact Test for Count Data

data:  j
p-value = 0.04607
alternative hypothesis: true odds ratio is not equal to 1
95 percent confidence interval:
 0.0107728 0.9737676
sample estimates:
odds ratio 
 0.1357897 

Resposta: De acordo com o resultado do teste, rejeitamos H_0 a um nível de confiança de 95% e com base na amostra, ou seja, significa que a incidência da infecção parasitária não é a mesma com a ingestão ou não da substância experimental. O resultado do p-valor foi de 0.0461.

Questão 10

  • A reação ao tratamento por quimioterapia está sendo estudada em quatro grupos de pacientes com câncer. Deseja-se investigar se todos os tipos reagem da mesma maneira. Uma amostra de pacientes de cada grupo foi escolhida ao acaso e classificou-se a reação em três categorias:
Reação Pouca Média Alta Total
Câncer
Tipo I 51 33 16 100
Tipo II 58 29 13 100
Tipo III 48 42 30 120
Tipo IV 26 38 16 80
Total 183 142 75 400

Teste ao nível de significância de 5% se a reação é a mesma para os diferentes tipos da doença.

  • Definindo as hipóteses:

H_0: Os \hspace{0.1cm} tipos \hspace{0.1cm} de \hspace{0.1cm} câncer \hspace{0.1cm} reagem \hspace{0.1cm} da \hspace{0.1cm} mesma \hspace{0.1cm} maneira

H_1: Os \hspace{0.1cm} tipos \hspace{0.1cm} de \hspace{0.1cm} câncer \hspace{0.1cm} não \hspace{0.1cm} reagem \hspace{0.1cm} da \hspace{0.1cm} mesma \hspace{0.1cm} maneira

xx <- matrix(c(51,33,16,58,29,13,48,42,30,26,38,16),4,3,byrow = T)
chisq.test(xx)

    Pearson's Chi-squared test

data:  xx
X-squared = 17.173, df = 6, p-value = 0.008669

Resposta: De acordo com o resultado do teste, obtivemos que o resultado a um nível de confiança de 95% e com base na amostra, rejeitamos a hipótese de que os tipos diferente de câncer reagem da mesma forma. O resultado do p-valor foi de 0.0087.

Questão 11

  • Na tabela seguinte, estão as notas de um mesmo exame aplicado em duas classes de 15 estudantes cada. Ao nível de 5% de significância, testar a hipótese de que as duas classes de estudantes são de populações com a mesma mediana.
Classe I 9 10 6 8 4 5 9 6 4 6 5 7 7 9 6
Classe II 4 5 9 9 6 6 8 3 7 5 9 6 10 8 8
  • Definindo as hipóteses:

H_0: \tilde{\mu_{X}} = \tilde{\mu_Y}

H_1: \tilde{\mu_{X}} \neq \tilde{\mu_Y}

classe1 <- c(9,10,6,8,4,5,9,6,4,6,5,7,7,9,6)
classe2 <- c(4,5,9,9,6,6,8,3,7,5,9,6,10,8,8)
nonpar::mediantest(classe1, classe2)

 Exact Median Test 
 
 H0: The 2 population medians are equal.  
 HA: The 2 population medians are not equal. 
 
  
 
 Significance Level = 0.05 
 The p-value is  0.53390777521456 
 There is not enough evidence to conclude that the population medians are different at a significance level of  0.05 . 
 

Resposta: Como o resultado do teste, obtivemos a um nível de significância de 5% e com base na amostra de que as amostras foram extraídas de populações com a mesma mediana, o resultado pode ser visto através do p-valor do teste que foi de 0,5339.

Questão 12

  • Na tabela seguinte, estão amostras aleatórias e independentes dos salários (em milhares de reais por ano) de uma mesma categoria profissional em duas regiões diferentes. Ao nível de 5% de significância, testar a hipótese de que os salários nas duas regiões são de populações com a mesma mediana.
Região I 17 19 22 25 24 25 30 29 31 28 37 15 40 17 38 39
Região II 18 21 20 23 17 26 28 28 29 32 16 35 19 27
  • Definindo as hipóteses:

H_0: \tilde{\mu_{X}} = \tilde{\mu_Y}

H_1: \tilde{\mu_{X}} \neq \tilde{\mu_Y}

região1 <- c(17,19,22,25,24,25,30,29,31,28,37,15,40,17,38,39)
região2 <- c(18,21,20,23,17,26,28,28,29,32,16,35,19,27)
nonpar::mediantest(região1,região2)

 Exact Median Test 
 
 H0: The 2 population medians are equal.  
 HA: The 2 population medians are not equal. 
 
  
 
 Significance Level = 0.05 
 The p-value is  0.569501626895531 
 There is not enough evidence to conclude that the population medians are different at a significance level of  0.05 . 
 

Resposta: Como o resultado do teste, obtivemos a um nível de significância de 5% e com base na amostra de que as amostras foram extraídas de populações com a mesma mediana, o resultado pode ser visto através do p-valor do teste que foi de 0,5695.

Questão 13

  • Testar, ao nível de 5% de significância e considerando as amostras aleatórias seguintes, a hipótese de que não existe diferença nos pesos (em kg) de mulheres e homens adultos.
Mulheres 68 63 75 65 73
Homens 83 78 70 93 88 80 85
  • Definindo as hipóteses:

H_0: \tilde{\mu_X} = \tilde{\mu_Y}

H_1: \tilde{\mu_X} \neq \tilde{\mu_Y}

mulheres <- c(68,63,75,65,73)
homens <- c(83,78,70,93,88,80,85)
wilcox.test(mulheres, homens, correct = F, alternative = "two.sided")

    Wilcoxon rank sum exact test

data:  mulheres and homens
W = 2, p-value = 0.0101
alternative hypothesis: true location shift is not equal to 0

Resposta: De acordo com o resultado do teste, a um nível de confiança de 95% e com base na amostra, rejeitamos a hipótese nula, ou seja, existe diferença no peso entre homens e mulheres adultos. O resultado do p-valor foi de 0.0101.

Questão 14

  • Verificar se os valores do grupo Y tendem a ser maiores do que os do grupo X. Considere, para efetuar o teste, um nível de 5% de significância e as amostras aleatórias seguintes:
x_i 22 26 16 27 19 38 37
y_i 35 22 31 23 28 18 25 21
  • Definindo as hipóteses:

H_0: \tilde{\mu_X} \leq \tilde{\mu_Y} H_1: \tilde{\mu_X} > \tilde{\mu_Y}

rm(list=ls(all=T))
x <- c(22,26,16,27,19,38,37)
y <- c(35,22,31,23,28,18,25,21)
wilcox.test(x,y,correct = F, alternative = "greater")
Warning in wilcox.test.default(x, y, correct = F, alternative = "greater"): não
é possível computar o valor de p exato com o de desempate

    Wilcoxon rank sum test

data:  x and y
W = 29.5, p-value = 0.431
alternative hypothesis: true location shift is greater than 0

Resposta: Conforme o resultado do teste, temos que não rejeitamos a hipótese nula com 95% de confiança e com base na amostra, ou seja, os valores do grupo Y não tendem a ser maiores do que o do grupo X.

Questão 15

  • Considerando as amostras aleatórias seguintes e, ao nível de 5% de significância, verificar se existe diferença significativa entre os dois grupos:
x_i 28.4 34.2 29.5 32.2 30.1
y_i 32.2 34.3 36.2 35.6 32.5
  • Definindo as hipóteses:

H_0: F_X = G_Y

H_1: F_X \neq G_Y

xx <- c(28.4,34.2,29.5,32.2,30.1)
yy <- c(32.2,34.3,36.2,35.6,32.5)
ks.test(xx,yy)

    Exact two-sample Kolmogorov-Smirnov test

data:  xx and yy
D = 0.6, p-value = 0.3571
alternative hypothesis: two-sided

Resposta: De acordo com o resultado do teste, temos que a hipótese nula é rejeitada a um nível de confiança de 95% e com base na amostra, ou seja, existe diferença significativa entre os dois grupos. O resultado do p-valor foi de 0.3571.