Consultoria Estatística

Introdução

Está atividade tem como principal objetivo analisar o banco de dados referente a pacientes de um Hospitais dea Paraíba, onde, o pesquisador tem como interesse descobrir se a variável de interesse GSM sofre influência das demais variáveis

Dados

head(dados)
##   MÉDICO RIM IMAGEM GSM
## 1      1   D      A  85
## 2      1   D      P 124
## 3      1   D      N  63
## 4      1   D      M  92
## 5      1   E      A  59
## 6      1   E      P 130

O Banco de dados consiste em 919 observações num total de 4 variáveis: Médico, Rim, Imagem e GSM.As iformações contidas nesse banco de dados próvem de paciêntes que estão em tratamento de seus rins.

attach(dados)
library(fBasics)
## Loading required package: timeDate
## Loading required package: timeSeries
library(psych)
## 
## Attaching package: 'psych'
## The following object is masked from 'package:fBasics':
## 
##     tr
## The following object is masked from 'package:timeSeries':
## 
##     outlier
require(fBasics)
require(ExpDes)
## Loading required package: ExpDes
## 
## Attaching package: 'ExpDes'
## The following object is masked from 'package:stats':
## 
##     ccf
require(nortest)
## Loading required package: nortest

Ánalise Descritiva

describe(dados)
##         vars   n  mean    sd median trimmed   mad min max range skew
## MÉDICO*    1 919  3.01  1.41      3    3.02  1.48   1   5     4 0.00
## RIM*       2 919  1.49  0.50      1    1.48  0.00   1   2     1 0.05
## IMAGEM*    3 919  2.50  1.12      3    2.50  1.48   1   4     3 0.00
## GSM        4 919 79.49 27.39     75   77.31 28.17  25 180   155 0.72
##         kurtosis   se
## MÉDICO*    -1.29 0.05
## RIM*       -2.00 0.02
## IMAGEM*    -1.36 0.04
## GSM         0.19 0.90
summary(dados)
##  MÉDICO  RIM     IMAGEM       GSM        
##  1:177   D:471   A:230   Min.   : 25.00  
##  2:188   E:448   P:229   1st Qu.: 58.00  
##  3:188           N:231   Median : 75.00  
##  4:178           M:229   Mean   : 79.49  
##  5:188                   3rd Qu.: 97.00  
##                          Max.   :180.00
histPlot(as.timeSeries(GSM))

Obteve-se uma breve análise descritiva dos dados, pode-se perceber que: As 4 variáveis tem medias próximas de suas medianas, também percebesse que a variável GSM têm um desvio padrão e amplitude consideravelmente alta. Aqui também pode-se ter acesso as respectivas frequências dos níveis das variáveis qualitativas. Com relação ao histograma, nota-se que a variavél GSM não apartenta seguir normalidade.

densityPlot(as.timeSeries(dados$GSM))

Aqui, observa-se o histograma da variável versus a distribuição teórica

qqnormPlot(as.timeSeries(dados$GSM))

No QQplot, nota-se que os dados não provém de uma ditribuição Normal

boxplot(dados$GSM, las= 2)

Observando o BoxPlot observa-se que existe valores fora dos intervalos.

ad.test(dados$GSM)
## 
##  Anderson-Darling normality test
## 
## data:  dados$GSM
## A = 9.9307, p-value < 2.2e-16

Pelo teste de Anderson Darling conclui-se com 5% de significância que a população não vem de uma distribuição Normal.

Tabela de frequência

#Frequência
XT<- xtabs( ~ MÉDICO + IMAGEM,
            data = dados)
XT
##       IMAGEM
## MÉDICO  A  P  N  M
##      1 44 44 45 44
##      2 47 47 47 47
##      3 47 47 47 47
##      4 45 44 45 44
##      5 47 47 47 47
#proporção
prop.table(XT, 
           margin = 1)
##       IMAGEM
## MÉDICO         A         P         N         M
##      1 0.2485876 0.2485876 0.2542373 0.2485876
##      2 0.2500000 0.2500000 0.2500000 0.2500000
##      3 0.2500000 0.2500000 0.2500000 0.2500000
##      4 0.2528090 0.2471910 0.2528090 0.2471910
##      5 0.2500000 0.2500000 0.2500000 0.2500000
#somatório
XB = xtabs(GSM ~MÉDICO+IMAGEM, 
           data = dados)
XB
##       IMAGEM
## MÉDICO    A    P    N    M
##      1 2895 4334 2523 3274
##      2 2774 4691 2502 3582
##      3 2650 4690 2466 3573
##      4 3268 5282 2709 3984
##      5 3952 6193 3117 4595
#medias
XS<- XB/XT
XS
##       IMAGEM
## MÉDICO         A         P         N         M
##      1  65.79545  98.50000  56.06667  74.40909
##      2  59.02128  99.80851  53.23404  76.21277
##      3  56.38298  99.78723  52.46809  76.02128
##      4  72.62222 120.04545  60.20000  90.54545
##      5  84.08511 131.76596  66.31915  97.76596

Observa-se logo acima a tabela de frequência médico x imagem em seguida a tabela de proporção, logo após temos a tabela que nos da o somatório de todos os GSM para cada par(tratamento) existente entre a interação medico x imagem e por fim a tabela de medias.

Teste não-paramétrico

O teste de Friedman é uma alternativa não paramétrica para o teste de experimentos em blocos ao acaso (RBD - Randon Blocks Design) na ANOVA regular. Ele substitui o RBD quando os pressupostos de normalidade não estão assegurados.

dados2<- aggregate(GSM, by = list(f= MÉDICO, m= IMAGEM), FUN = median)
dados2
##    f m     x
## 1  1 A  66.5
## 2  2 A  54.0
## 3  3 A  56.0
## 4  4 A  71.0
## 5  5 A  80.0
## 6  1 P  97.5
## 7  2 P 102.0
## 8  3 P 102.0
## 9  4 P 119.5
## 10 5 P 129.0
## 11 1 N  55.0
## 12 2 N  49.0
## 13 3 N  51.0
## 14 4 N  57.0
## 15 5 N  67.0
## 16 1 M  74.0
## 17 2 M  76.0
## 18 3 M  76.0
## 19 4 M  90.5
## 20 5 M  97.0
friedman.test(dados2$x, dados2$f, dados2$m)
## 
##  Friedman rank sum test
## 
## data:  dados2$x, dados2$f and dados2$m
## Friedman chi-squared = 13.333, df = 4, p-value = 0.009757

Após realização do teste de Friedman vimos que com base no nosso p-valor rejeitamos a hipótese nula tanto para 5% quanto pra 1%.

teste de comparações multiplas

Usando o teste de comparações múltiplas de Friedman com 5% de significância para analisar se existe diferença significativa entre os médicos dentro do tipo de imagens.

require(agricolae)
## Loading required package: agricolae
## 
## Attaching package: 'agricolae'
## The following objects are masked from 'package:ExpDes':
## 
##     lastC, order.group, tapply.stat
## The following objects are masked from 'package:timeDate':
## 
##     kurtosis, skewness
out<-with(dados2,friedman(m,f, x,alpha=0.05, group=TRUE,console=TRUE,
                         main="Data of the book of Conover"))
## 
## Study: Data of the book of Conover 
## 
## f,  Sum of the ranks
## 
##    x r
## 1  8 4
## 2  7 4
## 3  9 4
## 4 16 4
## 5 20 4
## 
## Friedman's Test
## ===============
## Adjusted for ties
## Critical Value: 13.33333
## P.Value Chisq: 0.009756859
## F Value: 15
## P.Value F: 0.0001286008 
## 
## Post Hoc Analysis
## 
## Alpha: 0.05 ; DF Error: 12
## t-Student: 2.178813
## LSD: 4.535561 
## 
## Treatments with the same letter are not significantly different.
## 
##   Sum of ranks groups
## 5           20      a
## 4           16      a
## 3            9      b
## 1            8      b
## 2            7      b
#startgraph
plot(out,variation="IQR")

Observando o gráfico final de grupos podemos concluir que não existe diferença significativa entre os dois primeiros médicos(4 e 5), porém, os médicos 4 e5 diferem dos demais médicos. Com relação aos três médicos que restaram (1,2 e 3) os 3 alocam um mesmo grupo, ou seja, não existe diferença significativa entre eles. Fazendo agora imagens por médicos temos que

out<-with(dados2,friedman(f,m, x,alpha=0.05, group=TRUE,console=TRUE,
                         main="Data of the book of Conover"))
## 
## Study: Data of the book of Conover 
## 
## m,  Sum of the ranks
## 
##    x r
## A 10 5
## M 20 5
## N  5 5
## P 15 5
## 
## Friedman's Test
## ===============
## Adjusted for ties
## Critical Value: 15
## P.Value Chisq: 0.001816649
## F Value: Inf
## P.Value F: 0 
## 
## Post Hoc Analysis
## 
## Alpha: 0.05 ; DF Error: 12
## t-Student: 2.178813
## LSD: 0 
## 
## Treatments with the same letter are not significantly different.
## 
##   Sum of ranks groups
## M           20      a
## P           15      b
## A           10      c
## N            5      d
#startgraph
plot(out,variation="IQR")

Com relação as imagens que todas diferem significativamente entre si, seguindo a seguinte ordem decrescente: M, P, A, N.