Prof. Lorenzo Zanette - l.zanette@ufc.br
set.seed(1234)
# criando dados com n e média igual mas sd diferentes...
mortes1<-round(rnorm(500,5,1),2)
mortes2<-round(rnorm(500,5,2),2)
mortes4<-round(rnorm(500,5,4),2)
mortes5<-round(rnorm(500,5,5),2)
mortes10<-round(rnorm(500,5,10),2)
mortes20<-round(rnorm(500,5,20),2)par(mfrow=c(3,2))
hist(mortes1,breaks=10,ylim=c(0,200))
abline(v=mean(mortes1),col="blue")
hist(mortes2,breaks=10,ylim=c(0,200))
abline(v=mean(mortes2),col="blue")
hist(mortes4,breaks=10,ylim=c(0,200))
abline(v=mean(mortes4),col="blue")
hist(mortes5,breaks=10,ylim=c(0,200))
abline(v=mean(mortes5),col="blue")
hist(mortes10,breaks=10,ylim=c(0,200))
abline(v=mean(mortes10),col="blue")
hist(mortes20,breaks=10,ylim=c(0,200))
abline(v=mean(mortes20),col="blue")###Dispersão - variabilidade
Distância para a média - desvio
# plotando em escalas diferentes para acomodar sds diferentes
par(mfrow=c(2,2))
plot(mortes1,ylim=c(-10,10))
abline(mean(mortes1),0,col="blue")
#for(i in 1:length(mortes1)) lines(c(i,i),c(mean(mortes1),mortes[i]),col="pink")
plot(mortes4,ylim=c(-20,20))
abline(mean(mortes4),0,col="blue")
#for(i in 1:length(mortes4)) lines(c(i,i),c(mean(mortes4),mortes[i]),col="pink")
plot(mortes10,ylim=c(-50,50))
abline(mean(mortes10),0,col="blue")
#for(i in 1:length(mortes10)) lines(c(i,i),c(mean(mortes10),mortes[i]),col="pink")
plot(mortes20,ylim=c(-60,60))
abline(mean(mortes20),0,col="blue")#plotando em uma escala
par(mfrow=c(2,2))
plot(mortes1,ylim=c(-15,15))
abline(mean(mortes1),0,col="blue")
plot(mortes4,ylim=c(-15,15))
abline(mean(mortes4),0,col="blue")
plot(mortes10,ylim=c(-15,15))
abline(mean(mortes10),0,col="blue")
plot(mortes20,ylim=c(-15,15))
abline(mean(mortes20),0,col="blue")media6<-c(mean(mortes1),mean(mortes2),mean(mortes4),mean(mortes5),mean(mortes10),mean(mortes20))
#média das médias
mean(media6)## [1] 5.10909
## [1] 0.04709371
## [1] 0.04709371
## [1] 5.0019
abline(h=mean(media6),col="pink",lwd=2)
for(i in 1:length(media6)) lines(c(i,i),c(mean(media6),media6[i]),col="red",lwd=2)#erro padrão
#medida de variação para a média das médias, ou outro parâmetro calculado
# Serve como ponto de partida para medidas de confiabilidade...
# desconfiança <-> variação
# variação ~ variância
# desconfiança proporcional (ao tamanho dos dados) ~ variância/n
# desconfiaça na mesma escala dos dados ~ raiz_quadrada(variância/n)
sqrt(var(media6)/length(media6))## [1] 0.08859431
Como erro padrão se comporta conforme o n aumenta?
se<-function(x) sqrt(var(x)/length(x))
# 30 valores aletoriamente tomados de uma distribuição normal com média=0 e sd=1
xv<-rnorm(30)
sem<-numeric(30)
sem[1]<-NA
for(i in 2:30) sem[i]<-se(xv[1:i])
plot(1:30,sem,ylim=c(0,1),
ylab="Erro padrão da média",xlab="No. de amostras ",pch=16)
lines(2:30,1/sqrt(2:30))ci95<-function(x){
t.valor<-qt(0.975,length(x)-1)
erro_padrao<-se(x)
ci<-t.valor*erro_padrao
cat("95% Intervalo de Confiança =",mean(x)-ci,"a",mean(x)+ci,"\n")
}
ci95(mortes1)## 95% Intervalo de Confiança = 4.910963 a 5.092837