#QUESTAO 1 Para cada uma das variáveis abaixo, indique a escala usualmente adotada para resumir os dados em tabelas de freqüências:
Salários dos empregados de uma indústria. (razão)
Opinião de consumidores sobre determinado produto. (ordinal)
Número de respostas certas de alunos num teste com dez itens. (intervalar)
Temperatura diária da cidade de Manaus. (intervalar)
Porcentagem da receita de municípios aplicada em educação. (razão)
Opinião dos empregados da Companhia MB sobre a realização ou não de cursos obrigatórios de treinamento. (ordinal)
QI de um indivíduo. (razão)
imdb <-load(url(description = “https://www.ime.usp.br/~pam/dados.RData”)) imdb<-tab2_1 #questao 2A cap
imdb <-load(url(description = "https://www.ime.usp.br/~pam/dados.RData"))
imdb<-tab2_1
ni<- table(imdb$estado_civil) # Calcula a tabela de frequências absolutas e armazena o resultado em 'mytab'
fi<-prop.table(ni) # Tabela de frequências relativas (f_i)
p_fi<-100*prop.table(ni) # Porcentagem (100 f_i)
# Adiciona linhas de total
ni<-c(ni,sum(ni))
fi<-c(fi,sum(fi))
p_fi<-c(p_fi,sum(p_fi))
names(ni)[3]<-"Total"
tab2_2<-cbind(ni,fi=round(fi,digits=2),p_fi=round(p_fi,digits=2))
tab2_2
## ni fi p_fi
## casado 20 0.56 55.56
## solteiro 16 0.44 44.44
## Total 36 1.00 100.00
#questao 2b cap
ni<-table(tab2_1$reg_procedencia) # Calcula a tabela de frequências absolutas e armazena o resultado em 'mytab'
fi<-prop.table(ni) # Tabela de frequências relativas (f_i)
p_fi<-100*prop.table(ni) # Porcentagem (100 f_i)
# Adiciona linhas de total
ni<-c(ni,sum(ni))
fi<-c(fi,sum(fi))
p_fi<-c(p_fi,sum(p_fi))
names(ni)[3]<-"Total"
tab2_2<-cbind(ni,fi=round(fi,digits=2),p_fi=round(p_fi,digits=2))
tab2_2
## ni fi p_fi
## capital 11 0.31 30.56
## interior 12 0.33 33.33
## Total 13 0.36 36.11
## 36 1.00 100.00
#questao 2c
ni<-table(tab2_1$n_filhos) # Calcula a tabela de frequências absolutas e armazena o resultado em 'mytab'
fi<-prop.table(ni) # Tabela de frequências relativas (f_i)
p_fi<-100*prop.table(ni) # Porcentagem (100 f_i)
# Adiciona linhas de total
ni<-c(ni,sum(ni))
fi<-c(fi,sum(fi))
p_fi<-c(p_fi,sum(p_fi))
names(ni)[6]<-"Total"
tab2_2<-cbind(ni,fi=round(fi,digits=2),p_fi=round(p_fi,digits=2))
tab2_2
## ni fi p_fi
## 0 4 0.20 20
## 1 5 0.25 25
## 2 7 0.35 35
## 3 3 0.15 15
## 5 1 0.05 5
## Total 20 1.00 100
#questao 2d
ni<-table(tab2_1$idade_anos) # Calcula a tabela de frequências absolutas e armazena o resultado em 'mytab'
fi<-prop.table(ni) # Tabela de frequências relativas (f_i)
p_fi<-100*prop.table(ni) # Porcentagem (100 f_i)
# Adiciona linhas de total
ni<-c(ni,sum(ni))
fi<-c(fi,sum(fi))
p_fi<-c(p_fi,sum(p_fi))
names(ni)[25]<-"Total"
tab2_2<-cbind(ni,fi=round(fi,digits=2),p_fi=round(p_fi,digits=2))
tab2_2
## ni fi p_fi
## 20 1 0.03 2.78
## 23 1 0.03 2.78
## 25 1 0.03 2.78
## 26 2 0.06 5.56
## 27 1 0.03 2.78
## 28 1 0.03 2.78
## 29 1 0.03 2.78
## 30 2 0.06 5.56
## 31 2 0.06 5.56
## 32 2 0.06 5.56
## 33 2 0.06 5.56
## 34 2 0.06 5.56
## 35 2 0.06 5.56
## 36 2 0.06 5.56
## 37 2 0.06 5.56
## 38 1 0.03 2.78
## 39 1 0.03 2.78
## 40 2 0.06 5.56
## 41 2 0.06 5.56
## 42 1 0.03 2.78
## 43 2 0.06 5.56
## 44 1 0.03 2.78
## 46 1 0.03 2.78
## 48 1 0.03 2.78
## Total 36 1.00 100.00
#QUESTAO 3A load(url(description = “https://www.ime.usp.br/~pam/dados.RData”))
ni<-table(cd_brasil$pop_urbana) # Calcula a tabela de frequências absolutas e armazena o resultado em 'mytab'
fi<-prop.table(ni) # Tabela de frequências relativas (f_i)
p_fi<-100*prop.table(ni) # Porcentagem (100 f_i)
# Adiciona linhas de total
ni<-c(ni,sum(ni))
fi<-c(fi,sum(fi))
p_fi<-c(p_fi,sum(p_fi))
names(ni)[28]<-"Total"
tab2_2<-cbind(ni,fi=round(fi,digits=2),p_fi=round(p_fi,digits=2))
tab2_2
## ni fi p_fi
## 174277 1 0.04 3.7
## 315401 1 0.04 3.7
## 330590 1 0.04 3.7
## 741009 1 0.04 3.7
## 762864 1 0.04 3.7
## 1140569 1 0.04 3.7
## 1556115 1 0.04 3.7
## 1604318 1 0.04 3.7
## 1661914 1 0.04 3.7
## 1692248 1 0.04 3.7
## 1695548 1 0.04 3.7
## 1766166 1 0.04 3.7
## 1843486 1 0.04 3.7
## 2176006 1 0.04 3.7
## 2261986 1 0.04 3.7
## 2711557 1 0.04 3.7
## 2949017 1 0.04 3.7
## 3565130 1 0.04 3.7
## 3873722 1 0.04 3.7
## 4713311 1 0.04 3.7
## 5476915 1 0.04 3.7
## 7011990 1 0.04 3.7
## 7581230 1 0.04 3.7
## 7826843 1 0.04 3.7
## 12806488 1 0.04 3.7
## 13074245 1 0.04 3.7
## 31769219 1 0.04 3.7
## Total 27 1.00 100.0
#QUESTAO 3B
ni<-table(cd_brasil$densidade) # Calcula a tabela de frequências absolutas e armazena o resultado em 'mytab'
fi<-prop.table(ni) # Tabela de frequências relativas (f_i)
p_fi<-100*prop.table(ni) # Porcentagem (100 f_i)
# Adiciona linhas de total
ni<-c(ni,sum(ni))
fi<-c(fi,sum(fi))
p_fi<-c(p_fi,sum(p_fi))
names(ni)[28]<-"Total"
tab2_2<-cbind(ni,fi=round(fi,digits=2),p_fi=round(p_fi,digits=2))
tab2_2
## ni fi p_fi
## 2 0.07 6.90
## 10,59 1 0.03 3.45
## 1,10 1 0.03 3.45
## 1323,00 1 0.03 3.45
## 137,14 1 0.03 3.45
## 1,51 1 0.03 3.45
## 15,67 1 0.03 3.45
## 22,11 1 0.03 3.45
## 2,47 1 0.03 3.45
## 2,65 1 0.03 3.45
## 28,34 1 0.03 3.45
## 305,32 1 0.03 3.45
## 312,94 1 0.03 3.45
## 3,16 1 0.03 3.45
## 34,17 1 0.03 3.45
## 3,77 1 0.03 3.45
## 4,40 1 0.03 3.45
## 45,08 1 0.03 3.45
## 46,53 1 0.03 3.45
## 48,00 1 0.03 3.45
## 51,08 1 0.03 3.45
## 5,16 1 0.03 3.45
## 5,38 1 0.03 3.45
## 58,42 1 0.03 3.45
## 60,69 1 0.03 3.45
## 73,66 1 0.03 3.45
## 74,79 1 0.03 3.45
## Total 1 0.03 3.45
## 29 1.00 100.00
#QUESTAO9 #A MB Indústria e Comércio, desejando melhorar o nível de seus funcionários em cargos de chefia, montou um curso experimental e indicou 2: funcionários para a primeira turma. Os dados referentes à seção a que pertencem, notas e graus obtidos no curso estão na tabela a seguir. Como havia dúvidas quanto à adoção de um único critério de avaliação, cada instrutor adotou seu próprio sistema de aferição. Usando dados daquela tabela, responda às questões:
data.ex2 <- data.frame(Função = c(1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25),
Seção = c("P","P","P","P","P","P","P","T","T","T","T","T","T","V","V","V","V","V","V","V","V","V","V","V","V"),
Administração = c(8,8,8,6,8,8,8,10,8,10,8,8,6,10,8,8,8,6,6,6,8,6,8,8,8),
Direito = c(9,9,9,9,9,9,9,9,9,9,9,9,9,9,9,9,9,9,9,9,9,9,9,9,9),
Redação = c(8.6,7,8,8.6,8,8.5,8.2,7.5,9.4,7.9,8.6,8.3,7,8.6,8.6,9.5,6.3,7.6,6.8,7.5,7.7,8.7,7.3,8.5,7),
Estatística = c(9,9,8,8,9,10,8,8,9,8,10,7,7,9,9,7,8,9,4,7,7,8,10,9,9),
Inglês = c("B","B","D","D","A","B","D","B","B","B","C","D","B","A","C","A","D","C","D","C","D","C","C","A","B"),
Metodologia = c("A","C","B","C","A","A","C","C","B","C","B","B","C","B","B","A","C","C","C","B","B","A","C","A","A"),
Política = c(9,6.5,9,6,6.5,6.5,9,6,10,9,10,6.5,6,10,10,9,10,6,6,6,6.5,6,9,6.5,9),
Economia = c(8.5,8,8.5,8.5,9,9.5,7,8.5,8,7.5,8.5,8,8.5,7.5,7,7.5,7.5,8.5,9.5,8.5,8,9,7,9,8.5)
)
kable(data.ex2) %>%
kable_styling(bootstrap_options = "striped", full_width = T) %>%
scroll_box(height = "300px")
| Função | Seção | Administração | Direito | Redação | Estatística | Inglês | Metodologia | Política | Economia |
|---|---|---|---|---|---|---|---|---|---|
| 1 | P | 8 | 9 | 8.6 | 9 | B | A | 9.0 | 8.5 |
| 2 | P | 8 | 9 | 7.0 | 9 | B | C | 6.5 | 8.0 |
| 3 | P | 8 | 9 | 8.0 | 8 | D | B | 9.0 | 8.5 |
| 4 | P | 6 | 9 | 8.6 | 8 | D | C | 6.0 | 8.5 |
| 5 | P | 8 | 9 | 8.0 | 9 | A | A | 6.5 | 9.0 |
| 6 | P | 8 | 9 | 8.5 | 10 | B | A | 6.5 | 9.5 |
| 7 | P | 8 | 9 | 8.2 | 8 | D | C | 9.0 | 7.0 |
| 8 | T | 10 | 9 | 7.5 | 8 | B | C | 6.0 | 8.5 |
| 9 | T | 8 | 9 | 9.4 | 9 | B | B | 10.0 | 8.0 |
| 10 | T | 10 | 9 | 7.9 | 8 | B | C | 9.0 | 7.5 |
| 11 | T | 8 | 9 | 8.6 | 10 | C | B | 10.0 | 8.5 |
| 12 | T | 8 | 9 | 8.3 | 7 | D | B | 6.5 | 8.0 |
| 13 | T | 6 | 9 | 7.0 | 7 | B | C | 6.0 | 8.5 |
| 14 | V | 10 | 9 | 8.6 | 9 | A | B | 10.0 | 7.5 |
| 15 | V | 8 | 9 | 8.6 | 9 | C | B | 10.0 | 7.0 |
| 16 | V | 8 | 9 | 9.5 | 7 | A | A | 9.0 | 7.5 |
| 17 | V | 8 | 9 | 6.3 | 8 | D | C | 10.0 | 7.5 |
| 18 | V | 6 | 9 | 7.6 | 9 | C | C | 6.0 | 8.5 |
| 19 | V | 6 | 9 | 6.8 | 4 | D | C | 6.0 | 9.5 |
| 20 | V | 6 | 9 | 7.5 | 7 | C | B | 6.0 | 8.5 |
| 21 | V | 8 | 9 | 7.7 | 7 | D | B | 6.5 | 8.0 |
| 22 | V | 6 | 9 | 8.7 | 8 | C | A | 6.0 | 9.0 |
| 23 | V | 8 | 9 | 7.3 | 10 | C | C | 9.0 | 7.0 |
| 24 | V | 8 | 9 | 8.5 | 9 | A | A | 6.5 | 9.0 |
| 25 | V | 8 | 9 | 7.0 | 9 | B | A | 9.0 | 8.5 |
##### **a)** Após observar atentamente cada variável, e com o intuito de resumi-las, como você identificaria (qualitativa ordinal ou nominal e quantitativa discreta ou contínua) cada uma das $9$ variáveis listadas?
a.ex2 <- data.frame(Variável = c("Seção", "Adm.", "Direito", "Redação", "Estatística", "Inglês", "Metodologia", "Política", "Economia"),
Qualitativa = c("Nominal", "-", "-", "-", "-", "Ordinal", "Ordinal", "-", "-"),
Quantitativa = c("-", "Contínua", "Contínua", "Contínua", "Contínua", "-", "-", "Contínua", "Contínua")
)
kable(a.ex2) %>%
kable_styling(bootstrap_options = "striped", full_width = F)
| Variável | Qualitativa | Quantitativa |
|---|---|---|
| Seção | Nominal |
|
| Adm. |
|
Contínua |
| Direito |
|
Contínua |
| Redação |
|
Contínua |
| Estatística |
|
Contínua |
| Inglês | Ordinal |
|
| Metodologia | Ordinal |
|
| Política |
|
Contínua |
| Economia |
|
Contínua |
#QUESTAO 9B
##### **b)** Compare e indique as diferenças existentes entre as distribuições das variáveis Direito, Política e Estatística.
#Conseguimos ver que a performance dos funcionários se mantem continua n a área do D ireito. Na áre a de Estatística conseguimos ver poucos resultados altos. E na Política, conse guimos ver a maior discrepância, possuindo baixa performance dos entrevistados.
hist(data.ex2$Direito, xlab = "Nota", ylab = "Frequência", main = "Direito", col = "yellow", breaks = seq(0, 10, 2))
hist(data.ex2$Política, xlab = "Nota", ylab = "Frequência", main = "Política", col = "blue", breaks = seq(0, 10, 1))
hist(data.ex2$Estatística, xlab = "Nota", ylab = "Frequência", main = "Estatística", col = "green", breaks = seq(0, 10, 1))
#* variável direito apresentas todas as observações iguais. Enquanto que, estatística mostra um acúmulo de notas no intervalo [6, 10], e política de modo semelhante, todavia, com um 'gap' de observações entre o intervalo (7, 8). *
#QUESTAO 9C
##### *c)* Construa o histograma para as notas da variável Redação.
stripchart(data.ex2$Redação,method = "stack", offset = 2, at=0,
pch = 19, col="darkblue",ylab=NA,cex=0.5)
#QUESTAO 9D
##### *d)* Construa a distribuição de frequências da variável Metodologia e faça um gráfico para indicar essa distribuição.
d.ex9 <- table(data.ex2$Metodologia)
d.ex9 <- matrix(d.ex9)
colnames(d.ex9) <- c("Frequência")
rownames(d.ex9) <- c("A", "B", "C")
d.ex9 <- data.frame(d.ex9)
kable(d.ex9) %>%
kable_styling(bootstrap_options = "striped", full_width = T)
| Frequência | |
|---|---|
| A | 7 |
| B | 8 |
| C | 10 |