Site importante de apoio para elaboracao do relatorio
https://en.wikibooks.org/wiki/LaTeX/Mathematics#Operators
Funções do Professor Frega
Formulário
Amostragem Estratificada
Amostragem Estratificada Compensando a Variância de Cada Grupo
Erro-padrão da média
Fórmula para população infinita:
Fórmula para população finita:
Define-se uma distância z que é resultado da divisão da diferença entre as médias amostral e populacional pelo erro-padrão da média. \[z=\frac{\bar{x}-\mu}{s/ \sqrt n}=\frac {\bar{x}- \mu}{s_\bar{x}}\] \[z s_\bar{x}={\bar{x}-\mu}\] \[\mu = \bar{x} - zs_\bar{x}\] \[\bar{x}-zs_\bar{x} \leq \mu \leq \bar{x}+zs_\bar{x} \] \[\bar{x} - z \frac {s}{\sqrt n} \leq \mu \leq \bar{x} + z \frac {s}{\sqrt n}\]
Intervalo de confiança para a verdadeira média
Intervalo de confiança para a verdadeira variância
\[\frac {(n-1)s^2}{\chi^2_{(1- \frac{\alpha}{2})}} \leq \sigma^2 \leq \frac {(n-1)s^2}{\chi^2_{(\frac{\alpha}{2})}} \]
Intervalo de confiança para a verdadeira proporção
Tamanho de amostra para erro de estimativa de média
\[n= \frac{N^2 z^2 s^2}{p(1-p)(z1-\alpha/2)^2 + (N-1)E^2}\]
Exemplos e Anotações realizadas em Sala Aula
Exemplo 01
Exemplo: determine o intervalo de confiança de 90% para a verdadeira média sabendo que a média amostral é 50, o desvio padrão amostral é 15 e o tamanho da amostra é 80.
Isso quer dizer que, com 90% de confiança, pode-se dizer que a verdadeira média está compreendida no intervalo [47.24, 52.76].
Exemplo 02 (tirado do livro do Freund - pg. 259
Qual é o valor do fator de correção para população finita quando:
N=200 e n=10
N=300 e n=25
N=5000 e n=100
Teoria e Exemplos - Tipos de Amostragem e Distribuições Amostrais
Amostra aleatória simples
Cada membro e conjunto de membros tem uma chance igual de ser incluído na amostra. Tecnologia, geradores de números aleatórios ou algum outro tipo de processo de acaso é necessário para obter uma amostra aleatória simples.Exemplo - Um professor coloca os nomes dos alunos em um chapéu e escolhe sem procurar uma amostra de alunos. Por que é bom? Amostras aleatórias são geralmente representativas, pois não favorecem certos membros.
Amostra aleatória estratificada
A população é dividida primeiro em grupos. A amostra geral consiste em alguns membros de cada grupo. Os membros de cada grupo são escolhidos aleatoriamente. Exemplo - Um conselho estudantil realiza 100 estudantes obtendo amostras aleatórias de 25 calouros, 25 alunos do segundo ano, 25 juniores e 25 *seniors". Por que é bom? uma amostra estratificada garante que os membros de cada grupo sejam representados na amostra, portanto, esse método de amostragem é bom quando queremos alguns membros de cada grupo.
Amostra aleatória tipo Cluster (Agrupamento)
A população é primeiro dividida em grupos. A amostra global consiste em todos os membros de alguns dos grupos. Os grupos são selecionados aleatoriamente. Exemplo - uma companhia aérea quer pesquisar seus clientes um dia, então eles selecionam aleatoriamente 555 vôos naquele dia e pesquisam cada passageiro nesses vôos. Por que é bom? uma amostra de agrupamentos obtém todos os membros de alguns dos grupos, então é bom quando cada grupo reflete a população como um todo.
Amostra aleatória sistemática
Amostragem sistemática é um tipo de método de amostragem probabilística em que os membros da amostra de uma população maior são selecionados de acordo com um ponto de partida aleatório, mas com um intervalo fixo e periódico. Este intervalo, chamado de intervalo de amostragem, é calculado dividindo-se o tamanho da população pelo tamanho de amostra desejado.
Distribuição amostral
Uma distribuição amostral é uma distribuição de probabilidade estatística obtida através de um grande número de amostras retiradas de uma população específica. A distribuição amostral de uma determinada população é a distribuição de frequências de uma gama de resultados diferentes que poderiam ocorrer para uma estatística de uma população.
A variabilidade de uma distribuição amostral é medida por sua variância ou por seu desvio padrão. A variabilidade de uma distribuição de amostragem depende de três fatores:
Se o tamanho da população é muito maior que o tamanho da amostra, então a distribuição de amostragem tem aproximadamente o mesmo erro padrão, seja a amostragem com ou sem substituição. Por outro lado, se a amostra representar uma fração significativa (digamos, 1/20) do tamanho da população, o erro padrão será significativamente menor, quando amostrarmos sem substituição.
Erro padrão da média
O erro padrão da média é designado como \(\sigma_\bar{x}=\frac{\sigma}{\sqrt n}\), onde σ é o desvio padrão da distribuição original e N é o tamanho da amostra (o número de pontuações em que cada média é baseada). Esta fórmula não assume uma distribuição normal. No entanto, muitos dos usos da fórmula assumem uma distribuição normal. A fórmula mostra que quanto maior o tamanho da amostra, menor o erro padrão da média. Mais especificamente, o tamanho do erro padrão da média é inversamente proporcional à raiz quadrada do tamanho da amostra.
Lista de Exercícios 004 / 2017
1- Uma pesquisa deve ser conduzida em três bairros de Curitiba. Um pré-teste foi conduzido para determinar a variância estimada da variável a ser pesquisada em cada bairro, com resultados apresentados na tabela a seguir. Determine a composição de uma amostra estratificada considerando:
a) Apenas a população de cada bairro
b) A população e o desvio-padrão estimado
2- Determine o erro-padrão da média de uma amostra coletada a partir de uma população infinita e que apresenta \(\bar x\) = 10.24, s = 4.22 e n = 68, sabendo que \(s_\bar x=\frac{s}{\sqrt n}\).
3- Determine o erro-padrão da média de uma amostra coletada a partir de uma população finita com N = 300 e que apresenta \(\bar x\) = 10.24, s = 4.22 e n = 68, e que \(S_\bar{x}=\frac {s}{\sqrt n} \sqrt \frac{N-n}{N-1}\).
4- Determine o erro máximo de estimativa da média de uma amostra coletada a partir de uma população infinita e que apresenta ¯x = 10.24, s = 4.22 e n = 22 para um intervalo de confiança de 95%. Considerando que a amostra é pequena, usa-se a estatística t. Assim, sabendo que \(E = (z_1- \alpha/2) \sqrt\frac{p(1-p)}{n}\).
5- Determine o intervalo de confiança de 90% da verdadeira variância de uma amostra coletada a partir de uma população infinita e que apresenta \(\bar {x} = 10.24\), s = 3.5 e n = 45, e sabendo que \(\frac {(n-1)s^2}{\chi^2_{(1- \frac{\alpha}{2})}} \leq \sigma^2 \leq \frac {(n-1)s^2}{\chi^2_{(\frac{\alpha}{2})}}\)
6- Determine o intervalo de confiança de 95% da verdadeira proporção de indivíduos favoráveis a um determinado tema em uma amostra de tamanho n = 210 coletada a partir de uma população infinita e que apresenta um número de indivíduos favoráveis igual a x = 98, e que \(E=\hat p - z_{(1 - \frac {\alpha}{2})} \sqrt \frac{\hat p(1-\hat p)}{n}\), e \(\frac{x}{n} - E \leq p \leq \frac{x}{n} + E\)
7- Determine o tamanho de amostra necessário para uma pesquisa eleitoral, de forma que o erro máximo seja E = 0.03, para mais ou para menos, considerando uma população infinita e um intervalo de confiança de 95%, sabendo que \(E=\hat p - z_{(1 - \frac {\alpha}{2})} \sqrt \frac{\hat p(1-\hat p)}{n}\), e \(n=p(1-p) \bigg(\frac{z_1-\alpha/2}{E}\bigg)^2\)
8- Determine o tamanho de amostra necessário para uma pesquisa eleitoral, de forma que o erro máximo seja E = 0.05, para mais ou para menos, considerando uma população finita de 1980 pessoas e um intervalo de confiança de 90%, e considerando que: \[n= \frac{N p(1-p)(z_1-\alpha/2)^2}{p(1-p)(z1-\alpha/2)^2 + (N-1)E^2}\], tem-se:
Lista de Exercícios 004 / 2018
1- Um processo de amostragem resultou em uma coleta de 47 dados de uma variável, que apresentou média \(\bar{x} = 22.5\) e desvio padrão s = 6.44. O limite inferior do intervalo de confianc¸a de 99% para a verdadeira variância dessa variável é:
2- Um processo de amostragem resultou em uma coleta de 47 dados de uma variável, que apresentou média \(\bar{x} = 22.5\) e desvio padrão s = 6.44. O limite inferior do intervalo de confiança de 90% para o verdadeiro desvio-padrão dessa variável é:
3- Numa amostra aleatória, 322 pessoas se declararam satisfeitas com um serviço, dentre um total de 470 pesquisadas. Qual o limite superior da verdadeira proporção de pessoas satisfeitas com o serviço, considerando um intervalo de confiança de 90%?
4- Para uma amostra aleatória de tamanho n = 300, extraída de uma população de N = 5000 indivíduos, o Fator de Correção de População Finita a ser aplicado na estimativa do erro-padrão das médias é:
5- Considerando uma população finita de tamanho N = 5000, sabe-se que uma determinada variável possui desvio-padrão σ = 2.4. Para que o erro máximo de estimativa seja de E = 0.3 com um intervalo de confiança de 95%, o tamanho mínimo de amostra necessario é:
6- Para fazer uma pesquisa eleitoral em uma população muito grande, deseja-se que o erro máximo de estimativa seja de E=0.01 com um intervalo de confiança de 95%. Assim, o tamanho mínimo de amostra necessário é:
7- Uma pesquisa deve ser conduzida em 3 bairros de Curitiba. Um pré-teste foi conduzido para determinar a variância estimada da variável a ser pesquisada em cada bairro, com resultados apresentados na tabela 1. O tamanho de cada estrato para uma amostragem estratificada de tamanho total n = 470 é, respectivamente
Avaliação 004 / 2018
1- Um processo de amostragem resultou em uma coleta de 225 dados de uma variável, que apresentou média \(\bar{x} = 14\) e desvio-padrão s = 3. O limite inferior do intervalo de confiança de 90% para a verdadeira média dessa variável é:
2- Um processo de amostragem resultou em uma coleta de 120 dados de uma variavel, que apresentou média \(\bar{x} = 134\) e desvio-padrão s = 12. O limite inferior do intervalo de confiança de 95% para a verdadeira variância dessa variável é:
3- Numa amostra aleatória, 322 pessoas se declararam satisfeitas com um serviço, dentre um total de 470 pesquisadas. Qual o limite superior da verdadeira proporção de pessoas satisfeitas com o serviço, considerando um intervalo de confiança de 90%?
4- Para uma amostra aleatória de tamanho n = 150, extraída de uma população de N = 300 indivíduos, o Fator de Correção de População Finita a ser aplicado na estimativa do erro-padrão das médias é:
5- Considerando uma população finita de tamanho N = 800, sabe-se que uma determinada variavel possui desvio-padrão σ = 0.1. Para que o erro máximo de estimativa seja de E = 0.01 com um intervalo de confiança de 95%, o tamanho mínimo de amostra necessário é:
6- Para fazer uma pesquisa eleitoral em uma população muito grande, deseja-se que o erro máximo de estimativa seja de E = 0.05 com um intervalo de confiança de 90%. Assim, o tamanho mínimo de amostra necessário é:
7- Uma pesquisa deve ser conduzida em 3 bairros de Curitiba. Um pré-teste foi conduzido para determinar a variancia estimada da variável a ser pesquisada em cada bairro, com resultados apresentados na tabela 1. O tamanho da amostra do estrato b1 para uma amostragem estratificada de tamanho total n = 125 é:
8- Um processo de amostragem resultou em uma coleta de 85 dados de uma variavel, que apresentou média \(\bar{x} = 80\). Sabendo que o limite inferior do intervalo de confiança de 95% para o verdadeiro desvio-padrão dessa variável é 12.4925, pode-se dizer que a estimativa pontual do desvio-padrão é:
Avaliação 004 / 2019
1- Um processo de amostragem resultou em uma coleta de 225 dados de uma variável, que apresentou média \(\bar{x}= 14\) e desvio-padrão s = 3. O limite inferior do intervalo de confiança de 90% para a verdadeira média dessa variável é:
2- Um processo de amostragem resultou em uma coleta de 120 dados de uma variável, que apresentou média \(\bar{x} = 134\) e desvio-padrão s = 12. O limite inferior do intervalo de confiança de 95% para a verdadeira variância dessa variável é:
3- Numa amostra aleatória, 322 pessoas se declararam satisfeitas com um serviço, dentre um total de 470 pesquisadas. Qual o limite superior da verdadeira proporção de pessoas satisfeitas com o serviço, considerando um intervalo de confiança de 90%?
4- Para uma amostra aleatória de tamanho n = 150, extraída de uma população de N = 300 indivíduos, o Fator de Correção de População Finita a ser aplicado na estimativa do erro-padrão das médias é:
5- Considerando uma populaçao finita de tamanho N = 800, sabe-se que uma determinada variável possui desvio-padrão σ = 0.1. Para que o erro máximo de estimativa seja de E = 0.01 com um intervalo de confiança de 95%, o tamanho mínimo de amostra necessário é:
6- Para fazer uma pesquisa eleitoral em uma população muito grande, deseja-se que o erro máximo de estimativa seja de E = 0.05 com um intervalo de confiança de 90%. Assim, o tamanho mínimo de amostra necessário é:
7- Uma pesquisa deve ser conduzida em 3 bairros de Curitiba. Um pré-teste foi conduzido para determinar a variância estimada da variável a ser pesquisada em cada bairro, com resultados apresentados na tabela 1. O tamanho da amostra do estrato b1 para uma amostragem estratificada de tamanho total n = 125 é:
8- Um processo de amostragem resultou em uma coleta de 85 dados de uma variável, que apresentou média \(\bar{x} = 80\). Sabendo que o limite inferior do intervalo de confiança de 95% para o verdadeiro desvio-padrão dessa variável é 12.4925, pode-se dizer que a estimativa pontual do desvio-padrão é:meuhist = function(x, title = NA) {
hist(x, freq = FALSE, main = title)
amp = max(x)-min(x)
m = mean(x)
s = sd(x)
xx = (0:200)/200*amp+min(x)
yy = dnorm(xx, m, s)
lines(xx, yy, type = "l", col = 4, lwd = 2)
}
plotnorm = function(media, dp) {
x = (-300:300)/100*dp+media
y = dnorm(x, media, dp)
plot(x, y, type = "l")
lines(c(min(x), max(x)), c(0, 0))
abline(v=media, lty = 2, col = "darkgrey")
}
plotarea = function(x1, x2, media, dp, col="lightblue", density=40, angle=45) {
x1 = max(x1, media-3*dp)
x2 = min(x2, media+3*dp)
x = seq(x1, x2, (x2-x1)/100)
y = c(0, dnorm(x, media, dp), 0)
x = c(x1, seq(x1, x2, (x2-x1)/100), x2)
polygon(x, y, col=col, density = density, fillOddEven = TRUE, border = "black", xpd = NA, angle = angle)
#curve(dnorm(x, media, dp), add = TRUE)
}
plotareas = function(x1, x2, media, dp, col=c("lightblue"), density=c(40), angle=c(45)) {
plotnorm(media, dp)
for (i in 1:length(x1)) {
ii = i - 1
plotarea(x1[i], x2[i], media, dp, col[(ii %% length(col)) + 1],
density[(ii %% length(density)) + 1],
angle[(ii %% length(angle)) + 1]
)
}
}
###################################################################################################
liminfmedia = function(C, xb, s, n) {E = qt(1-(1-C)/2, df = n-1)*s/sqrt(n); return(round(xb-E, 4))}
limsupmedia = function(C, xb, s, n) {E = qt(1-(1-C)/2, df = n-1)*s/sqrt(n); return(round(xb-E, 4))}
limsupvar = function(C, xb, s, n) {E = (n-1)*s^2/qchisq((1-C)/2, df = n-1); return(round(E, 4))}
liminfvar = function(C, xb, s, n) {E = (n-1)*s^2/qchisq(1-(1-C)/2, df = n-1); return(round(E, 4))}
liminfprop = function(C, phat, n) {E = sqrt(phat*(1-phat)/n)*qnorm(1-(1-C)/2); return(round(phat-E,4))}
limsupprop = function(C, phat, n) {E = sqrt(phat*(1-phat)/n)*qnorm(1-(1-C)/2); return(round(phat+E,4))}
tamanhoamostramedia = function(N, E, C, s) {z = qnorm(1-(1-C)/2); return(round(N*z^2*s^2/(E^2*(N-1)+z^2*s^2), 4))}
tamanhoamostraprop = function(C, phat, E) {z = qnorm(1-(1-C)/2); return(round(phat*(1-phat)*z^2/E^2,4))}
fcpf = function(N, n) {return(round(sqrt((N-n)/(N-1)),4))}
plotareas(qnorm(0.05, 50, 15), qnorm(0.95, 50, 15), 50, 15)
qnorm(0.05, 50, 15/sqrt(80))
## [1] 47.2415
qnorm(0.95, 50, 15/sqrt(80))
## [1] 52.7585
# z a partir da normal padrão
c(qnorm(0.05, 0, 1), qnorm(0.95, 0, 1))
## [1] -1.644854 1.644854
c(qnorm(0.05, 0, 1), qnorm(0.95, 0, 1))*15/sqrt(80)+50
## [1] 47.2415 52.7585
N = 200
n = 10
sqrt((N-n)/(N-1))
## [1] 0.9771253
N = 300
n = 25
sqrt((N-n)/(N-1))
## [1] 0.9590268
N = 5000
n = 100
sqrt((N-n)/(N-1))
## [1] 0.9900485
estratos = c(1000, 2000, 3000)
desvpad = c(3, 2, 1)
n = 300
estratos/sum(estratos)*n
## [1] 50 100 150
variabilidade = estratos*desvpad
variabilidade
## [1] 3000 4000 3000
variabilidade/sum(variabilidade)*n
## [1] 90 120 90
estratos = c(1000, 2000, 3000)
desvpad = c(3.5, 3.5, 3.5)
n = 300
estratos/sum(estratos)*n
## [1] 50 100 150
nome = paste0("b", 1:3)
popest = c(100000, 300000, 240000)
varest = c(4.5, 2.3, 5.7)
n = 100 # o tamnho da amostra é 100%
ni = n*popest/sum(popest)
ni
## [1] 15.625 46.875 37.500
nome = paste0("b", 1:3)
popest = c(100000, 300000, 240000)
varest = c(4.5, 2.3, 5.7)
n = 100 # o tamnho da amostra é 100%
popsd = popest*sqrt(varest)
ni = n*popsd/sum(popsd)
ni
## [1] 17.10609 36.68847 46.20544
xbarra = 10.24
s = 4.22
n = 68
errpad = s/sqrt(n)
errpad
## [1] 0.5117502
N = 300
xbarra = 10.24
s = 4.22
n = 68
FCPF = sqrt((N-n)/(N-1))
FCPF
## [1] 0.8808631
errpad = s/sqrt(n)*FCPF
errpad
## [1] 0.4507818
xbarra = 10.24
s = 4.22
n = 22
E = qt(0.975, n-1) * s/sqrt(n)
E
## [1] 1.871043
#Estimativa
xbarra = 10.24
s = 3.5
n = 45
alfa = 0.10
s^2
## [1] 12.25
# intervalo de confiança
E = (n-1)*s^2*
c(LS = 1/qchisq(alfa/2, df = n-1),
LI = 1/qchisq(1-alfa/2, df = n-1)
)
E
## LS LI
## 18.094852 8.911906
x = 98
n = 210
alfa = 0.05
#
E = qnorm(1-alfa/2)*sqrt((x/n*(1-x/n))/n)
E
## [1] 0.06747474
x/n+c(LI = -E, centro = 0, LS = E)
## LI centro LS
## 0.3991919 0.4666667 0.5341414
p = 0.5
E = 0.03
alfa = 0.05
#
n = p*(1-p)*(qnorm(1-alfa/2)/E)^2
n
## [1] 1067.072
ceiling(n)
## [1] 1068
N=1980
E=0.05
alfa=0.1
pqz = p*(1-p)*qnorm(1-alfa/2)^2
n = N*pqz/(pqz+(N-1)*E^2)
n
## [1] 238.135
ceiling(n)
## [1] 239
xbarra = 22.5
s = 6.44
n = 47
C = 0.99
li = liminfmedia(C, xbarra, s, n)
li
## [1] 19.9759
xbarra = 22.5
s = 6.44
n = 47
C = 0.90
li = sqrt(liminfvar(C, xbarra, s, n))
li
## [1] 5.51039
n = 470
s = 322
C = 0.90
phat = s/n
li = liminfprop(C = C, phat = phat, n = n)
li
## [1] 0.6499
N = 5000
n = 300
f = fcpf(N, n)
f
## [1] 0.9696
N = 5000
sigma = 2.4
E = 0.3
C = 0.95
ta = ceiling(tamanhoamostramedia(N = N, E = E, C = C, s = sigma))
ta
## [1] 235
E = 0.01
C = 0.95
phat = 0.5
ta = ceiling(tamanhoamostraprop(C = C, phat = phat, E = E))
ta
## [1] 9604
# nome popest varest
# 1 b1 80000 4.5
# 2 b2 180000 2.3
# 3 b3 240000 5.7
n = 470
popest = c(80000, 180000, 240000)
varest = c(4.5, 2.3, 5.7)
popvar = popest*sqrt(varest)
est = round(popvar/sum(popvar)*n)
est
## [1] 79 126 265
xbarra = 14
s = 3
n = 225
C = 0.90
li = liminfmedia(C, xbarra, s, n)
li
## [1] 13.6697
xbarra = 134
s = 12
n = 120
C = 0.95
li = liminfvar(C, xbarra, s, n)
li
## [1] 113.42
n = 470
s = 322
C = 0.90
phat = s/n
li = limsupprop(C = C, phat = phat, n = n)
li
## [1] 0.7203
N = 300
n = 150
f = fcpf(N, n)
f
## [1] 0.7083
N = 800
sigma = 0.1
E = 0.01
C = 0.95
ta = ceiling(tamanhoamostramedia(N = N, E = E, C = C, s = sigma))
ta
## [1] 260
E = 0.05
C = 0.90
phat = 0.5
ta = ceiling(tamanhoamostraprop(C = C, phat = phat, E = E))
ta
## [1] 271
# nome popest varest
# 1 b1 8327 2.2
# 2 b2 15432 0.9
# 3 b3 11227 1.1
n=125
propest=c(8327, 15432, 11227) # BELEZA MELAO
varest=c(2.2, 0.9, 1.1)
popvar= propest*sqrt(varest)
est = round(popvar/sum(popvar)*n) [1]
est
## [1] 40
xbarra = 80
n = 85
C = 0.95
li = 12.4925
sqrt(qchisq(1-(1-C)/2, n-1)*li^2/(n-1))
## [1] 14.37622
xbarra = 14
s = 3
n = 225
C = 0.90
li = liminfmedia(C, xbarra, s, n)
li
## [1] 13.6697
xbarra = 134
s = 12
n = 120
C = 0.95
li = liminfvar(C, xbarra, s, n)
li
## [1] 113.42
n = 470
s = 322
C = 0.90
phat = s/n
li = limsupprop(C = C, phat = phat, n = n)
li
## [1] 0.7203
N = 300
n = 150
f = fcpf(N, n)
f
## [1] 0.7083
N = 800
sigma = 0.1
E = 0.01
C = 0.95
ta = ceiling(tamanhoamostramedia(N = N, E = E, C = C, s = sigma))
ta
## [1] 260
E = 0.05
C = 0.90
phat = 0.5
ta = ceiling(tamanhoamostraprop(C = C, phat = phat, E = E))
ta
## [1] 271
# nome popest varest
# 1 b1 8327 2.2
# 2 b2 15432 0.9
# 3 b3 11227 1.1
n = 125
propest=c(8327, 15432, 11227) # BELEZA MELAO
varest=c(2.2, 0.9, 1.1)
popvar= propest*sqrt(varest)
est = round(popvar/sum(popvar)*n) [1]
est
## [1] 40
xbarra = 80
n = 85
C = 0.95
li = 12.4925
sqrt(qchisq(1-(1-C)/2, n-1)*li^2/(n-1))
## [1] 14.37622