UEFS | PPGM | Estatística Aplicada I | 2021.1

Professor: Aloísio Machado - Avaliação 02

Fernando Ribeiro

22 de Julho de 2021





0.1 A tabela a seguir contém as distribuições de probabilidades correspondentes ao número de acidentes de trânsito, a cada dia, em uma pequena cidade.

acidentes_dia <- c(0,1,2,3,4,5)

prob_acidentes_dia <- c(.1, .2, .45, .15,.05,.05)

tab1 <- data.frame(acidentes_dia, prob_acidentes_dia )

tab1 %>% pander()
acidentes_dia prob_acidentes_dia
0 0.1
1 0.2
2 0.45
3 0.15
4 0.05
5 0.05

0.1.1 Determine a esperança matemática correspondente ao número de acidentes de trânsito, a cada dia;

esperanca <- tab1 %>% mutate(prod  = acidentes_dia * prob_acidentes_dia) %>%
  summarise( espera = sum(prod))

cat("Esperança matemática: ", esperanca$espera)
## Esperança matemática:  2
desvio_pad <- tab1 %>% mutate(aux  = (acidentes_dia - esperanca$espera) ^2 *
                                prob_acidentes_dia ) %>% 
                    summarise(sd = sum(aux)^0.5)

cat("Desvio padrão: ", desvio_pad$sd)
## Desvio padrão:  1.183216
ggplot(data=tab1, aes(x=acidentes_dia, y=prob_acidentes_dia, fill= acidentes_dia)) +
  geom_bar(stat="identity", width= 1) +


  labs(title="Probabilidade de Acidentes por dia",fill = "Acidentes por dia",

       x ="Número de acidentes em um dia",
       y = "Probabilidade",
       caption ="Fonte: Autor",
       tag = "Figura 01") +

  theme_minimal()

0.2 Uma grande loja sabe que o número de dias entre enviar uma fatura mensal e receber o pagamento de seus clientes é aproximadamente normal com uma média de 18 dias e desvio padrão de quatro dias.

0.2.1 Encontre a probabilidade de que uma fatura não seja paga até 21 dias depois;

pd21 <- 1 - pnorm(21, 18, 4)
pd21
## [1] 0.2266274

0.2.2 Encontre a probabilidade de faturas que são pagas em menos de 12 dias;

pa11 <- pnorm(11, 18, 4)
pa11
## [1] 0.04005916

0.2.3 De 200 faturas, quantas se esperaria que fossem pagas entre 16 e 20 dias?

p16a20 <- pnorm(20, 18, 4) - pnorm(16, 18, 4)
round(p16a20 *200)
## [1] 77

0.3 O arquivo “BD_PEDIDOS.XLS” contém dados sobre o número de pedidos processados pelo depósito da “Mullens` Electrics” em uma amostra de 180 dias ao longo dos últimos dois anos. Utilize esses dados para realizar os seguintes procedimentos:

pedidos <- read_excel('./data_02/BD_PEDIDOS.XLS')
pedidos
## # A tibble: 180 x 2
##      Dia `Número de Pedidos`
##    <dbl>               <dbl>
##  1     1                  14
##  2     2                  26
##  3     3                  30
##  4     4                  20
##  5     5                  32
##  6     6                   9
##  7     7                  28
##  8     8                  20
##  9     9                  40
## 10    10                   5
## # ... with 170 more rows

0.3.1 Determine as seguinte medidas descritivas da amostra: média, desvio padrão, assimetria, coeficiente de variação, quartis. Analise os resultados encontrados;

describe(pedidos$`Número de Pedidos`)%>% t() %>% pander()
  X1
vars 1
n 180
mean 27.7
sd 10.11
median 28
trimmed 27.74
mad 10.38
min 2
max 50
range 48
skew -0.04494
kurtosis -0.4195
se 0.7538
summary(pedidos$`Número de Pedidos`)%>%  pander()
Min. 1st Qu. Median Mean 3rd Qu. Max.
2 21 28 27.7 35 50
cvFuncP <- function(x){ cv<-(sd(x, na.rm=TRUE)/mean(x, na.rm=TRUE))*100;  return(cv) }

cvFunc <- function(x){ cv<-(sd(x, na.rm=TRUE)/mean(x, na.rm=TRUE));  return(cv) }

cat( "coeficiente de variação: ", cvFunc(pedidos$`Número de Pedidos`),
"\ncoeficiente de variação %: ", cvFuncP(pedidos$`Número de Pedidos`)
)
## coeficiente de variação:  0.36508 
## coeficiente de variação %:  36.508

0.3.2 Admitindo que os dados são normalmente distribuídos, calcule:

0.3.2.1 a probabilidade de que mais de 37 pedidos sejam feitos em um dia;

p37 <- pnorm(37, 27.7, 10.11, lower.tail = F)
p37 
## [1] 0.1788174

0.3.2.2 a probabilidade de que menos de 14 pedidos sejam feitos;

p13 <- pnorm(13, 27.7, 10.11)
p13 
## [1] 0.07297233

0.3.2.3 a probabilidade de que entre 20 e 35 pedidos sejam feitos;

p20a35 <- pnorm(35, 27.7, 10.11) - pnorm(20, 27.7, 10.11)
p20a35
## [1] 0.5417276

0.3.2.4 Teste a normalidade dos dados e analise o resultado encontrado.

pedidos$`Número de Pedidos` %>% shapiro.test() %>% pander() # se p < alfa, rejeita-se a normalidade
Test statistic P value
0.9939 0.668
Table: Shapiro-Wilk normality test: .

Com um valor de P de 0.67, admite-se a normalidade dos dados.

0.4 O departamento de transporte dos EUA mantém estatísticas sobre reclamações relacionadas a malas danificadas, para cada 1.000 passageiros de companhias aéreas. Em maio de 2019, a companhia aérea Delta danificou 1,93 para cada 1.000 passageiros. Qual é a probabilidade de que, para os próximos 1.000 passageiros, a Delta venha a ter

0.4.1 Nenhuma bagagem danificada?

pbinom(0, 1000, 1.93/1000)
## [1] 0.1448778

0.4.2 Pelo menos uma bagagem danificada?

pbinom(1, 1000, 1.93/1000)
## [1] 0.4250326

0.4.3 Pelo menos duas bagagens danificadas?

pbinom(2, 1000, 1.93/1000)
## [1] 0.6956339

0.5 Uma pesquisa recente relatou que 23% dos adultos com 55 anos de idade, ou mais, possuem um smartphone. (Dados extraídos de “Who Owns a Smartphone? USA Today, 5 março de 2012, p.1ª). Utilizando a distribuição binomial, qual é a probabilidade de que nos próximos seis adultos com 55 anos de idade, ou mais, entrevistados.

0.5.1 Quatro terão um smartphone?

dbinom(4, 6, .23) 
## [1] 0.02488766

0.5.2 Todos seis terão um smartphone?

dbinom(6, 6, .23) 
## [1] 0.0001480359

0.5.3 Pelo menos quatro terão um smartphone?

sum(dbinom(c(4:6), 6, .23)) 
## [1] 0.02800929

0.5.4 Quais são os valores para a média aritmética e o desvio padrão correspondentes ao número de adultos com 55 anos de idade, ou mais, que terão um smartphone em uma pesquisa realizada junto a seis adultos?

media = 6*.23
sdev = (media*(1-.23))^.5

cat("Média: ", media, "\nDesvio Padrão: ", sdev)
## Média:  1.38 
## Desvio Padrão:  1.030825

0.6 Os dados abaixo representam a distribuição de probabilidade do número de interrupções por dia, em uma grande rede de computadores. Com os conhecimentos do curso de Estatística Aplicada, determine:

interrup <- c(0,1,2,3,4,5)

prob_interrup <- c(.35, .25, .2, .1,.05,.05)

tab2 <- data.frame(interrup, prob_interrup)

tab2 %>% pander()
interrup prob_interrup
0 0.35
1 0.25
2 0.2
3 0.1
4 0.05
5 0.05

0.6.1 O valor esperado e o desvio padrão do número de interrupções.

esperanca <- tab2 %>% mutate(prod  = interrup * prob_interrup) %>% 
  summarise( espera = sum(prod))

cat("Esperança matemática: ", esperanca$espera)
## Esperança matemática:  1.4
desvio_pad <- tab2 %>% mutate(aux  = (interrup - esperanca$espera) ^2 * prob_interrup ) %>% 
  summarise(sd = sum(aux)^0.5)

cat("\nDesvio padrão: ", desvio_pad$sd)
## 
## Desvio padrão:  1.428286

0.6.2 Represente graficamente a distribuição.

ggplot(data=tab2, aes(x=interrup, y=prob_interrup, fill= interrup)) +
  geom_bar(stat="identity", width= 1) +


  labs(title="Probabilidade de interrupções por dia", fill= "Interrupções por dia",

       x ="Número de interrupções em um dia",
       y = "Probabilidade",
       caption ="Fonte: Autor",
       tag = "Figura 02") +

  theme_minimal()

0.7 O gerente de controle de qualidade da Marilyn’ s Cookies está inspecionando um lote de biscoitos com pedaços inteiros de chocolate, que acabou de ser assado no forno. Se o processo de produção está sob controle, a média aritmética corresponde ao número de pedaços inteiros de chocolate, para cada biscoite, corresponde a 6,0. Qual é a probabilidade de que, em qualquer biscoito específico que esteja sendo inspecionado,

0.7.1 Sejam encontrados menos de cinco pedaços inteiros de chocolate?

sum(dpois(0:4, 6))
## [1] 0.2850565

0.7.2 Sejam encontrados exatamente cinco pedaços inteiros de chocolate?

dpois(5, 6)
## [1] 0.1606231

0.8 Os acessos a redes sociais envolvem a recomendação ou o compartilhamento de um artigo que você lê quando está acessando a Rede. De acordo com Janrain ( “T. Wayne, One Log-ln Catches on for Many Sites”. The York Times, 2 de maio de 2011, p.B2), no primeiro trimestre de 2011, 35% se inscreveram através do Facebook, comparados a 31% para o Google. Se for selecionada uma amostra aleatória composta por 10 pessoas que acessaram redes sociais, qual é a probabilidade de que:

0.8.1 Mais de 4 pessoas tenham se inscrito através do Facebook?

pbinom(4, 10, .35,lower.tail = FALSE)
## [1] 0.2485045

0.8.2 Mais de 4 pessoas tenham se inscrito por meio do Google?

pbinom(4, 10, .31,lower.tail = FALSE)
## [1] 0.1679475

0.8.3 Que pressupostos você precisou adotar para poder responder os itens a. e b?

Foi utilizada uma distribuição binomial para responder ambas as questões. Para uma distribuição binomila pressupõe-se:

  • Espaço amostral finito
  • Apenas dois resultados possíveis (sucesso ou fracasso) para cada teste
  • iguaispossibilidades de ocorrência
  • Eventos independentes entre si

Assumiu-se um espaço amostral finito de 10 pessoas. No item a, imaginouse que sucesso seria ter-se inscrito através do facebook, e a probabilidade de ocorrência seria de 0.35 No item b, o sucesso seria ter-se inscrito através do Google, a probailidade de sucesso seria de 0.31.

0.9 Em 2011, o consumo per capita de café na Suécia foi relatado como 7,27 Kg, ou 15,994 libras. (Dados extraídos de www.ico.org.) Considere que o consumo per capita de café na Suécia esteja distribuído aproximadamente nos moldes de uma distribuição normal, com uma média aritmética correspondente a 15,994 libras e um desvio padrão correspondente a 5 libras.

0.9.1 Qual é a probabilidade de que uma pessoa na Suécia tenha consumido mais de 10 libras de café, em 2011?

pnorm(10, 15.994, 5, lower.tail = F)
## [1] 0.8846971

0.9.2 Qual é a probabilidade de que uma pessoa na Suécia tenha consumido entre 3 e 5 libras de café, em 2011?

pnorm(5, 15.994, 5) - pnorm(3, 15.994, 5)
## [1] 0.00926856

0.10 Com base em experiências do passado, pressupõe-se que o número de imperfeições, por metro, em rolos de papel de parede do tipo 2 segue uma distribuição de Poisson, com uma média aritmética correspondente a 1 imperfeição para cada 5 metros de papel de parede (ou seja, 0,2 imperfeições por metro). Qual é a probabilidade de que:

0.10.1 Em um rolo de papel com 1 metro, haverá pelo menos 2 imperfeições?

ppois(1, .2, lower.tail =F)
## [1] 0.0175231

0.10.2 Em um rolo de papel com 12 metros, haverá pelo menos 1 imperfeição?

1 - ppois(0, 12*.2)
## [1] 0.909282