0.1 A tabela a seguir contém as distribuições de probabilidades correspondentes ao número de acidentes de trânsito, a cada dia, em uma pequena cidade.
acidentes_dia <- c(0,1,2,3,4,5)
prob_acidentes_dia <- c(.1, .2, .45, .15,.05,.05)
tab1 <- data.frame(acidentes_dia, prob_acidentes_dia )
tab1 %>% pander()| acidentes_dia | prob_acidentes_dia |
|---|---|
| 0 | 0.1 |
| 1 | 0.2 |
| 2 | 0.45 |
| 3 | 0.15 |
| 4 | 0.05 |
| 5 | 0.05 |
0.1.1 Determine a esperança matemática correspondente ao número de acidentes de trânsito, a cada dia;
esperanca <- tab1 %>% mutate(prod = acidentes_dia * prob_acidentes_dia) %>%
summarise( espera = sum(prod))
cat("Esperança matemática: ", esperanca$espera)## Esperança matemática: 2
desvio_pad <- tab1 %>% mutate(aux = (acidentes_dia - esperanca$espera) ^2 *
prob_acidentes_dia ) %>%
summarise(sd = sum(aux)^0.5)
cat("Desvio padrão: ", desvio_pad$sd)## Desvio padrão: 1.183216
ggplot(data=tab1, aes(x=acidentes_dia, y=prob_acidentes_dia, fill= acidentes_dia)) +
geom_bar(stat="identity", width= 1) +
labs(title="Probabilidade de Acidentes por dia",fill = "Acidentes por dia",
x ="Número de acidentes em um dia",
y = "Probabilidade",
caption ="Fonte: Autor",
tag = "Figura 01") +
theme_minimal()0.2 Uma grande loja sabe que o número de dias entre enviar uma fatura mensal e receber o pagamento de seus clientes é aproximadamente normal com uma média de 18 dias e desvio padrão de quatro dias.
0.2.1 Encontre a probabilidade de que uma fatura não seja paga até 21 dias depois;
pd21 <- 1 - pnorm(21, 18, 4)
pd21## [1] 0.2266274
0.2.2 Encontre a probabilidade de faturas que são pagas em menos de 12 dias;
pa11 <- pnorm(11, 18, 4)
pa11## [1] 0.04005916
0.2.3 De 200 faturas, quantas se esperaria que fossem pagas entre 16 e 20 dias?
p16a20 <- pnorm(20, 18, 4) - pnorm(16, 18, 4)
round(p16a20 *200)## [1] 77
0.3 O arquivo “BD_PEDIDOS.XLS” contém dados sobre o número de pedidos processados pelo depósito da “Mullens` Electrics” em uma amostra de 180 dias ao longo dos últimos dois anos. Utilize esses dados para realizar os seguintes procedimentos:
pedidos <- read_excel('./data_02/BD_PEDIDOS.XLS')
pedidos## # A tibble: 180 x 2
## Dia `Número de Pedidos`
## <dbl> <dbl>
## 1 1 14
## 2 2 26
## 3 3 30
## 4 4 20
## 5 5 32
## 6 6 9
## 7 7 28
## 8 8 20
## 9 9 40
## 10 10 5
## # ... with 170 more rows
0.3.1 Determine as seguinte medidas descritivas da amostra: média, desvio padrão, assimetria, coeficiente de variação, quartis. Analise os resultados encontrados;
describe(pedidos$`Número de Pedidos`)%>% t() %>% pander()| X1 | |
|---|---|
| vars | 1 |
| n | 180 |
| mean | 27.7 |
| sd | 10.11 |
| median | 28 |
| trimmed | 27.74 |
| mad | 10.38 |
| min | 2 |
| max | 50 |
| range | 48 |
| skew | -0.04494 |
| kurtosis | -0.4195 |
| se | 0.7538 |
summary(pedidos$`Número de Pedidos`)%>% pander()| Min. | 1st Qu. | Median | Mean | 3rd Qu. | Max. |
|---|---|---|---|---|---|
| 2 | 21 | 28 | 27.7 | 35 | 50 |
cvFuncP <- function(x){ cv<-(sd(x, na.rm=TRUE)/mean(x, na.rm=TRUE))*100; return(cv) }
cvFunc <- function(x){ cv<-(sd(x, na.rm=TRUE)/mean(x, na.rm=TRUE)); return(cv) }
cat( "coeficiente de variação: ", cvFunc(pedidos$`Número de Pedidos`),
"\ncoeficiente de variação %: ", cvFuncP(pedidos$`Número de Pedidos`)
)## coeficiente de variação: 0.36508
## coeficiente de variação %: 36.508
…
0.3.2 Admitindo que os dados são normalmente distribuídos, calcule:
0.3.2.1 a probabilidade de que mais de 37 pedidos sejam feitos em um dia;
p37 <- pnorm(37, 27.7, 10.11, lower.tail = F)
p37 ## [1] 0.1788174
0.3.2.2 a probabilidade de que menos de 14 pedidos sejam feitos;
p13 <- pnorm(13, 27.7, 10.11)
p13 ## [1] 0.07297233
0.3.2.3 a probabilidade de que entre 20 e 35 pedidos sejam feitos;
p20a35 <- pnorm(35, 27.7, 10.11) - pnorm(20, 27.7, 10.11)
p20a35## [1] 0.5417276
0.3.2.4 Teste a normalidade dos dados e analise o resultado encontrado.
pedidos$`Número de Pedidos` %>% shapiro.test() %>% pander() # se p < alfa, rejeita-se a normalidade| Test statistic | P value |
|---|---|
| 0.9939 | 0.668 |
.
Com um valor de P de 0.67, admite-se a normalidade dos dados.
0.4 O departamento de transporte dos EUA mantém estatísticas sobre reclamações relacionadas a malas danificadas, para cada 1.000 passageiros de companhias aéreas. Em maio de 2019, a companhia aérea Delta danificou 1,93 para cada 1.000 passageiros. Qual é a probabilidade de que, para os próximos 1.000 passageiros, a Delta venha a ter
0.4.1 Nenhuma bagagem danificada?
pbinom(0, 1000, 1.93/1000)## [1] 0.1448778
0.4.2 Pelo menos uma bagagem danificada?
pbinom(1, 1000, 1.93/1000)## [1] 0.4250326
0.4.3 Pelo menos duas bagagens danificadas?
pbinom(2, 1000, 1.93/1000)## [1] 0.6956339
0.5 Uma pesquisa recente relatou que 23% dos adultos com 55 anos de idade, ou mais, possuem um smartphone. (Dados extraídos de “Who Owns a Smartphone? USA Today, 5 março de 2012, p.1ª). Utilizando a distribuição binomial, qual é a probabilidade de que nos próximos seis adultos com 55 anos de idade, ou mais, entrevistados.
0.5.1 Quatro terão um smartphone?
dbinom(4, 6, .23) ## [1] 0.02488766
0.5.2 Todos seis terão um smartphone?
dbinom(6, 6, .23) ## [1] 0.0001480359
0.5.3 Pelo menos quatro terão um smartphone?
sum(dbinom(c(4:6), 6, .23)) ## [1] 0.02800929
0.5.4 Quais são os valores para a média aritmética e o desvio padrão correspondentes ao número de adultos com 55 anos de idade, ou mais, que terão um smartphone em uma pesquisa realizada junto a seis adultos?
media = 6*.23
sdev = (media*(1-.23))^.5
cat("Média: ", media, "\nDesvio Padrão: ", sdev)## Média: 1.38
## Desvio Padrão: 1.030825
0.6 Os dados abaixo representam a distribuição de probabilidade do número de interrupções por dia, em uma grande rede de computadores. Com os conhecimentos do curso de Estatística Aplicada, determine:
interrup <- c(0,1,2,3,4,5)
prob_interrup <- c(.35, .25, .2, .1,.05,.05)
tab2 <- data.frame(interrup, prob_interrup)
tab2 %>% pander()| interrup | prob_interrup |
|---|---|
| 0 | 0.35 |
| 1 | 0.25 |
| 2 | 0.2 |
| 3 | 0.1 |
| 4 | 0.05 |
| 5 | 0.05 |
0.6.1 O valor esperado e o desvio padrão do número de interrupções.
esperanca <- tab2 %>% mutate(prod = interrup * prob_interrup) %>%
summarise( espera = sum(prod))
cat("Esperança matemática: ", esperanca$espera)## Esperança matemática: 1.4
desvio_pad <- tab2 %>% mutate(aux = (interrup - esperanca$espera) ^2 * prob_interrup ) %>%
summarise(sd = sum(aux)^0.5)
cat("\nDesvio padrão: ", desvio_pad$sd)##
## Desvio padrão: 1.428286
0.6.2 Represente graficamente a distribuição.
ggplot(data=tab2, aes(x=interrup, y=prob_interrup, fill= interrup)) +
geom_bar(stat="identity", width= 1) +
labs(title="Probabilidade de interrupções por dia", fill= "Interrupções por dia",
x ="Número de interrupções em um dia",
y = "Probabilidade",
caption ="Fonte: Autor",
tag = "Figura 02") +
theme_minimal()0.8 Os acessos a redes sociais envolvem a recomendação ou o compartilhamento de um artigo que você lê quando está acessando a Rede. De acordo com Janrain ( “T. Wayne, One Log-ln Catches on for Many Sites”. The York Times, 2 de maio de 2011, p.B2), no primeiro trimestre de 2011, 35% se inscreveram através do Facebook, comparados a 31% para o Google. Se for selecionada uma amostra aleatória composta por 10 pessoas que acessaram redes sociais, qual é a probabilidade de que:
0.8.1 Mais de 4 pessoas tenham se inscrito através do Facebook?
pbinom(4, 10, .35,lower.tail = FALSE)## [1] 0.2485045
0.8.2 Mais de 4 pessoas tenham se inscrito por meio do Google?
pbinom(4, 10, .31,lower.tail = FALSE)## [1] 0.1679475
0.8.3 Que pressupostos você precisou adotar para poder responder os itens a. e b?
Foi utilizada uma distribuição binomial para responder ambas as questões. Para uma distribuição binomila pressupõe-se:
- Espaço amostral finito
- Apenas dois resultados possíveis (sucesso ou fracasso) para cada teste
- iguaispossibilidades de ocorrência
- Eventos independentes entre si
Assumiu-se um espaço amostral finito de 10 pessoas. No item a, imaginouse que sucesso seria ter-se inscrito através do facebook, e a probabilidade de ocorrência seria de 0.35 No item b, o sucesso seria ter-se inscrito através do Google, a probailidade de sucesso seria de 0.31.
0.9 Em 2011, o consumo per capita de café na Suécia foi relatado como 7,27 Kg, ou 15,994 libras. (Dados extraídos de www.ico.org.) Considere que o consumo per capita de café na Suécia esteja distribuído aproximadamente nos moldes de uma distribuição normal, com uma média aritmética correspondente a 15,994 libras e um desvio padrão correspondente a 5 libras.
0.9.1 Qual é a probabilidade de que uma pessoa na Suécia tenha consumido mais de 10 libras de café, em 2011?
pnorm(10, 15.994, 5, lower.tail = F)## [1] 0.8846971
0.9.2 Qual é a probabilidade de que uma pessoa na Suécia tenha consumido entre 3 e 5 libras de café, em 2011?
pnorm(5, 15.994, 5) - pnorm(3, 15.994, 5)## [1] 0.00926856
0.10 Com base em experiências do passado, pressupõe-se que o número de imperfeições, por metro, em rolos de papel de parede do tipo 2 segue uma distribuição de Poisson, com uma média aritmética correspondente a 1 imperfeição para cada 5 metros de papel de parede (ou seja, 0,2 imperfeições por metro). Qual é a probabilidade de que:
0.10.1 Em um rolo de papel com 1 metro, haverá pelo menos 2 imperfeições?
ppois(1, .2, lower.tail =F)## [1] 0.0175231
0.10.2 Em um rolo de papel com 12 metros, haverá pelo menos 1 imperfeição?
1 - ppois(0, 12*.2)## [1] 0.909282