Está atividade tem como principal objetivo analisar o banco de dados referente a pacientes de um Hospitais dea Paraíba, onde, o pesquisador tem como interesse descobrir se a variável de interesse GSM sofre influência das demais variáveis
head(dados)
## MÉDICO RIM IMAGEM GSM
## 1 1 D A 85
## 2 1 D P 124
## 3 1 D N 63
## 4 1 D M 92
## 5 1 E A 59
## 6 1 E P 130
O Banco de dados consiste em 919 observações num total de 4 variáveis: Médico, Rim, Imagem e GSM.As iformações contidas nesse banco de dados próvem de paciêntes que estão em tratamento de seus rins.
attach(dados)
library(fBasics)
## Loading required package: timeDate
## Loading required package: timeSeries
library(psych)
##
## Attaching package: 'psych'
## The following object is masked from 'package:fBasics':
##
## tr
## The following object is masked from 'package:timeSeries':
##
## outlier
require(fBasics)
require(ExpDes)
## Loading required package: ExpDes
##
## Attaching package: 'ExpDes'
## The following object is masked from 'package:stats':
##
## ccf
require(nortest)
## Loading required package: nortest
describe(dados)
## vars n mean sd median trimmed mad min max range skew
## MÉDICO* 1 919 3.01 1.41 3 3.02 1.48 1 5 4 0.00
## RIM* 2 919 1.49 0.50 1 1.48 0.00 1 2 1 0.05
## IMAGEM* 3 919 2.50 1.12 3 2.50 1.48 1 4 3 0.00
## GSM 4 919 79.49 27.39 75 77.31 28.17 25 180 155 0.72
## kurtosis se
## MÉDICO* -1.29 0.05
## RIM* -2.00 0.02
## IMAGEM* -1.36 0.04
## GSM 0.19 0.90
summary(dados)
## MÉDICO RIM IMAGEM GSM
## 1:177 D:471 A:230 Min. : 25.00
## 2:188 E:448 P:229 1st Qu.: 58.00
## 3:188 N:231 Median : 75.00
## 4:178 M:229 Mean : 79.49
## 5:188 3rd Qu.: 97.00
## Max. :180.00
histPlot(as.timeSeries(GSM))
Obteve-se uma breve análise descritiva dos dados, pode-se perceber que: As 4 variáveis tem medias próximas de suas medianas, também percebesse que a variável GSM têm um desvio padrão e amplitude consideravelmente alta. Aqui também pode-se ter acesso as respectivas frequências dos níveis das variáveis qualitativas. Com relação ao histograma, nota-se que a variavél GSM não apartenta seguir normalidade.
densityPlot(as.timeSeries(dados$GSM))
Aqui, observa-se o histograma da variável versus a distribuição teórica
qqnormPlot(as.timeSeries(dados$GSM))
No QQplot, nota-se que os dados não provém de uma ditribuição Normal
boxplot(dados$GSM, las= 2)
Observando o BoxPlot observa-se que existe valores fora dos intervalos.
ad.test(dados$GSM)
##
## Anderson-Darling normality test
##
## data: dados$GSM
## A = 9.9307, p-value < 2.2e-16
Pelo teste de Anderson Darling conclui-se com 5% de significância que a população não vem de uma distribuição Normal.
#Frequência
XT<- xtabs( ~ MÉDICO + IMAGEM,
data = dados)
XT
## IMAGEM
## MÉDICO A P N M
## 1 44 44 45 44
## 2 47 47 47 47
## 3 47 47 47 47
## 4 45 44 45 44
## 5 47 47 47 47
#proporção
prop.table(XT,
margin = 1)
## IMAGEM
## MÉDICO A P N M
## 1 0.2485876 0.2485876 0.2542373 0.2485876
## 2 0.2500000 0.2500000 0.2500000 0.2500000
## 3 0.2500000 0.2500000 0.2500000 0.2500000
## 4 0.2528090 0.2471910 0.2528090 0.2471910
## 5 0.2500000 0.2500000 0.2500000 0.2500000
#somatório
XB = xtabs(GSM ~MÉDICO+IMAGEM,
data = dados)
XB
## IMAGEM
## MÉDICO A P N M
## 1 2895 4334 2523 3274
## 2 2774 4691 2502 3582
## 3 2650 4690 2466 3573
## 4 3268 5282 2709 3984
## 5 3952 6193 3117 4595
#medias
XS<- XB/XT
XS
## IMAGEM
## MÉDICO A P N M
## 1 65.79545 98.50000 56.06667 74.40909
## 2 59.02128 99.80851 53.23404 76.21277
## 3 56.38298 99.78723 52.46809 76.02128
## 4 72.62222 120.04545 60.20000 90.54545
## 5 84.08511 131.76596 66.31915 97.76596
Observa-se logo acima a tabela de frequência médico x imagem em seguida a tabela de proporção, logo após temos a tabela que nos da o somatório de todos os GSM para cada par(tratamento) existente entre a interação medico x imagem e por fim a tabela de medias.
O teste de Friedman é uma alternativa não paramétrica para o teste de experimentos em blocos ao acaso (RBD - Randon Blocks Design) na ANOVA regular. Ele substitui o RBD quando os pressupostos de normalidade não estão assegurados.
dados2<- aggregate(GSM, by = list(f= MÉDICO, m= IMAGEM), FUN = median)
dados2
## f m x
## 1 1 A 66.5
## 2 2 A 54.0
## 3 3 A 56.0
## 4 4 A 71.0
## 5 5 A 80.0
## 6 1 P 97.5
## 7 2 P 102.0
## 8 3 P 102.0
## 9 4 P 119.5
## 10 5 P 129.0
## 11 1 N 55.0
## 12 2 N 49.0
## 13 3 N 51.0
## 14 4 N 57.0
## 15 5 N 67.0
## 16 1 M 74.0
## 17 2 M 76.0
## 18 3 M 76.0
## 19 4 M 90.5
## 20 5 M 97.0
friedman.test(dados2$x, dados2$f, dados2$m)
##
## Friedman rank sum test
##
## data: dados2$x, dados2$f and dados2$m
## Friedman chi-squared = 13.333, df = 4, p-value = 0.009757
Após realização do teste de Friedman vimos que com base no nosso p-valor rejeitamos a hipótese nula tanto para 5% quanto pra 1%.
Usando o teste de comparações múltiplas de Friedman com 5% de significância para analisar se existe diferença significativa entre os médicos dentro do tipo de imagens.
require(agricolae)
## Loading required package: agricolae
##
## Attaching package: 'agricolae'
## The following objects are masked from 'package:ExpDes':
##
## lastC, order.group, tapply.stat
## The following objects are masked from 'package:timeDate':
##
## kurtosis, skewness
out<-with(dados2,friedman(m,f, x,alpha=0.05, group=TRUE,console=TRUE,
main="Data of the book of Conover"))
##
## Study: Data of the book of Conover
##
## f, Sum of the ranks
##
## x r
## 1 8 4
## 2 7 4
## 3 9 4
## 4 16 4
## 5 20 4
##
## Friedman's Test
## ===============
## Adjusted for ties
## Critical Value: 13.33333
## P.Value Chisq: 0.009756859
## F Value: 15
## P.Value F: 0.0001286008
##
## Post Hoc Analysis
##
## Alpha: 0.05 ; DF Error: 12
## t-Student: 2.178813
## LSD: 4.535561
##
## Treatments with the same letter are not significantly different.
##
## Sum of ranks groups
## 5 20 a
## 4 16 a
## 3 9 b
## 1 8 b
## 2 7 b
#startgraph
plot(out,variation="IQR")
Observando o gráfico final de grupos podemos concluir que não existe diferença significativa entre os dois primeiros médicos(4 e 5), porém, os médicos 4 e5 diferem dos demais médicos. Com relação aos três médicos que restaram (1,2 e 3) os 3 alocam um mesmo grupo, ou seja, não existe diferença significativa entre eles. Fazendo agora imagens por médicos temos que
out<-with(dados2,friedman(f,m, x,alpha=0.05, group=TRUE,console=TRUE,
main="Data of the book of Conover"))
##
## Study: Data of the book of Conover
##
## m, Sum of the ranks
##
## x r
## A 10 5
## M 20 5
## N 5 5
## P 15 5
##
## Friedman's Test
## ===============
## Adjusted for ties
## Critical Value: 15
## P.Value Chisq: 0.001816649
## F Value: Inf
## P.Value F: 0
##
## Post Hoc Analysis
##
## Alpha: 0.05 ; DF Error: 12
## t-Student: 2.178813
## LSD: 0
##
## Treatments with the same letter are not significantly different.
##
## Sum of ranks groups
## M 20 a
## P 15 b
## A 10 c
## N 5 d
#startgraph
plot(out,variation="IQR")
Com relação as imagens que todas diferem significativamente entre si, seguindo a seguinte ordem decrescente: M, P, A, N.