Setor de Pesquisa e Extensão
Neste estudo, a análise estatística dos dados desempenha um papel crucial na caracterização abrangente do conjunto de informações coletadas. Para alcançar esse objetivo, foram aplicadas diversas técnicas e medidas, visando a obtenção de um entendimento mais aprofundado.
Inicialmente, utilizaram-se frequências simples e percentuais para descrever a distribuição dos dados em diferentes categorias, permitindo identificar a proporção e a quantidade de observações em cada uma delas. Essas medidas proporcionaram uma visão geral da distribuição dos dados neste estudo. No caso das variáveis qualitativas, foram empregadas as frequências simples e as frequências percentuais.
Quanto às variáveis quantitativas, recorreu-se à mediana e ao intervalo interquartílico para uma melhor caracterização. Além disso, empregaram-se os testes de associação de Fisher e de Independência para verificar o grau de associação entre as variáveis qualitativas. Para avaliar a normalidade dos dados nas variáveis quantitativas, utilizou-se o teste de Shapiro-Wilk. Tal teste é importante para permitir a aplicação do teste de Anova, pois é recomendável que as informações apresentem distribuição normal e variância constante. Caso a hipótese nula seja rejeitada na ANOVA, será realizado um teste post-hoc (como o Teste de Tukey) para determinar quais médias diferem significativamente entre si.
Para as variáveis que não seguem uma distribuição normal, empregou-se o teste de Kruskal-Wallis para verificar a igualdade das medianas entre os diferentes grupos avaliados. Além disso, utilizou-se o post-hoc (teste de Mann-Whitney ajustado com correção de Bonferroni) para identificar quais grupos diferem uns dos outros. A tabela @ref(tab:tabela1) apresenta a caracterização para as variáveis de interesse.
Características | N = 971 |
---|---|
IDADE | 53.6 (5.2) |
PESO (Kg) | 74 (15) |
ALTURA (m) | 1.59 (0.06) |
IMC | 29.2 (5.7) |
CLASSIFICAÇÃO IMC | |
Baixo peso | 1 (1.1%) |
Peso ideal | 14 (15%) |
Sobrepeso | 45 (48%) |
Obesidade I | 17 (18%) |
Obesidade II | 13 (14%) |
Obesidade III | 4 (4.3%) |
1 Média (Desvio Padrão); n (%) |
Dos 97 pacientes observados, a idade média foi de 53.63 anos com um desvio padrão de 5.18 anos. A mediana estimada foi de 53 anos. O peso apresentou valor média de 74 kg com um desvio padrão de 14.76 kg, indicando uma variabilidade relativa na ordem de 20% indicando uma pequena variabilidade. A variável IMC apresentou média de 29.17 com um desvio padrão de 5.68 com uma variabilidade relativa na ordem de 19,52% indicando uma pequena variabilidade. A figura @ref(fig:fig1) ilustra o comportamento do IMC em relação a distribuição das respostas observadas.
Gráfico 1 - Distribuição do IMC
Neste gráfico observa-se que 45 (48%) dos pacientes apresentam sobrepeso. Em relação às respostas observadas é apresentado a tabela @ref{tab:tabela2} apresenta a distribuição das respostas para a média e os respectivos desvios padrões observados.
Características | N = 971 |
---|---|
WHQ_MEDIA | 2.69 (0.55) |
HUMOR DEPRIMIDO_MEDIA | 2.99 (0.68) |
SINTOMAS SOMÁTICOS_MEDIA | 2.44 (0.72) |
MEMÓRIA/CONCENTRAÇÃO_MEDIA | 2.62 (0.94) |
SINTOMAS VASOMOTORES_MEDIA | 2.38 (1.13) |
ANSIEDADE_MEDIA | 2.77 (0.85) |
COMPORTAMENTO SEXUAL_MEDIA | 2.46 (0.99) |
PROBLEMAS DE SONO_MEDIA | 2.39 (0.91) |
SINTOMAS MENSTRUAIS_MEDIA | 2.71 (0.75) |
ATRATIVIDADE_MEDIA | 3.19 (0.72) |
1 Média (Desvio Padrão) |
Com a tabela a seguir é possível observarmos a variabilidade de cada variável de interesse, indicando que a variável Sintomas vasomotores é a variável que apresenta a maior variabilidade relativa (47,48%) e a variável WHQ é a variável que apresenta a menor variabilidade relativa (20,44%). A variável (Atratividade) apresenta a maior média. A figura @ref(fig:fig2) ilustra o comportamento das respostas observadas para a variável Sintomas vasomotores.
Gráfico 2 - Distribuição dos Sintomas Vasomotores
Com o objetivo de se verificar qual das medidas apresenta uma diferença signficativa entre os valores médios será aplicado o teste de Análise de Variância. A ANOVA permite descobrir se existe uma média que pode ser considerada estatísticamente diferente das demais, no entanto o teste não aponta qual das média é a diferente, sendo necessário um post-hoc para identificar qual das médias é a diferente. Uma condição para a utilização do teste de ANOVA é que as variáveis sejam normalmente distribuídas e possuam variância constante. Desta forma será aplicado o teste de Shapiro-Wilk para verificar a normalidade dos dados e o teste de Levene para verificar a homocedasticidade dos dados. No entanto ser não for verificado a normalidade dos dados será aplicado um teste não paramétrico apropriado.
Variáveis de Interesse | Estatística W | P-valor | |
---|---|---|---|
WHQ | 0.9859843 | 0,39469717 | * |
HUMOR DEPRIMIDO | 0.9621701 | 0,006829865 | |
SINTOMAS SOMÁTICOS | 0.9764589 | 0,078452229 | * |
MEMÓRIA/CONCENTRAÇÃO | 0.9334260 | 0,000100462 | |
SINTOMAS VASOMOTORES | 0.8687309 | 8,87547E-08 | |
ANSIEDADE | 0.9388310 | 0,000207523 | |
COMPORTAMENTO SEXUAL | 0.9241996 | 3,09703E-05 | |
PROBLEMAS DE SONO_MEDIA | 0.9371859 | 0,000165909 | |
SINTOMAS MENSTRUAIS_MEDIA | 0.9659909 | 0,012864149 | |
ATRATIVIDADE_MEDIA | 0.9073739 | 4,30831E-06 |
Desta forma é apresentado para cada variável de interesse a Estatística de Teste (W) e o respectivo p-valor associado. Desta forma, temos:
Desta forma, para um nível de significância de 0,05 podemos concluir que apenas as variáveis WHQ e (Sintomas Somáticos) distribuem-se normalmente e o restante das variáveis não segue uma distribuição normal. Visto que a grande maioria das variáveis não possui uma distribuição normal optou-se por utilizar o teste de Kruskall-Wallis para (um teste não paramêtrico) para compara as medianas dos grupos. Se o teste de Kruskall-Wallis mostrar diferença entre os grupos, usa-se o teste de Mann-Whitney ajustado com ocrreção de Bonferroni para identificar quais grupos diferem uns dos outros. O teste de Kruskal é apresentado a seguir:
##
## Kruskal-Wallis rank sum test
##
## data: base2
## Kruskal-Wallis chi-squared = 54.227, df = 9, p-value = 1.709e-08
Tendo em vista as seguintes hipóteses:
O teste apresenta a estatistica de teste de 54,227 os graus de liberdade de 9 e o p-valor calculado de 0.00000001709. Desta forma, rejeitamos a hipótese nula e concluímos ao nível de 0,05 de significância que pelo menos um grupo difere dos demais. Desta forma, será aplicado um Post-hoc. O teste escolhido foi o teste de Mann-Whitney com correção de Bonferroni para identificar quais grupos diferem entre si.
##
## Pairwise comparisons using Wilcoxon rank sum test with continuity correction
##
## data: base3 and grupos
##
## 1 2 3 4 5 6 7 8 9
## 2 1.0000 - - - - - - - -
## 3 1.0000 0.0044 - - - - - - -
## 4 1.0000 0.1502 1.0000 - - - - - -
## 5 0.6559 0.0010 1.0000 1.0000 - - - - -
## 6 1.0000 1.0000 0.6357 1.0000 0.2313 - - - -
## 7 1.0000 0.4146 1.0000 1.0000 1.0000 1.0000 - - -
## 8 1.0000 0.0063 1.0000 1.0000 1.0000 0.6883 1.0000 - -
## 9 1.0000 1.0000 0.6787 1.0000 0.2925 1.0000 1.0000 0.5228 -
## 10 0.0956 1.0000 2.1e-05 0.0037 3.5e-06 0.0986 0.0180 6.8e-05 0.3849
##
## P value adjustment method: bonferroni
Tendo em vista que o valor (1) representa WHQ, o valor (2) representa (Humor deprimido), o valor (3) representa (SINTOMAS SOMÁTICOS), o valor (4) (MEMÓRIA/CONCENTRAÇÃO), o valor (5) (SINTOMAS VASOMOTORES), o valor (6) (ANSIEDADE), o valor (7) (COMPORTAMENTO SEXUAL), o valor (8) (PROBLEMAS DE SONO), o valor (9) (SINTOMAS MENSTRUAIS) e o valor (10) (ATRATIVIDADE). A tabela acima apresenta o respectivos p-valores. Desta forma, podemos concluir que os grupos (2 e 3), (2 e 5), (2 e 8), (10 e 3), (10 e 4), (10 e 5), (10 e 7) e (10 e 8) possuem medianas que diferem significativamente entre si.
Desta forma existem dois domínios que se destacam estatisticamente em relação aos demais domínios, são eles (Humor deprimido) e (Atratividade), portanto deve ser considerado como um peso maior na pontuação final do WHQ. A figura a seguir ilustra a distribuição das respostas observadas para todos os domínios.
Nela é possível perceber que as questões Q18, Q28, Q15 são as respostas
que apresentam a maior quantidade de respostas positivas enquanto que as
respostas Q25 e Q13 são as que apresentam o maior número de respostas
negativas. O mesmo gráfico será apresentado em relação aos grupos que
foram considerados significativos. Desta forma o gráfico para Humor
deprimido é apresentado a seguir.
O gráfico acima apresenta as resposta para o domínio Humor deprimido relacionado com a Classificação RCQ, indicando que as maiores respostas para este domínio estão relacionadas com Baixo Risco para o RCP em relação ao item Q12 e baixo risco para Q10 ao se relacionar com o Humor deprimido.
Professora Glayce…. preciso confirmar com a senhora se estou olhando na tabela das whq de maneira correta. Irei lhe encaminhar o resultado em html somente para a senhora dar uma conferida.