ruan rodrigues trabalho

#QUESTAO 1 Para cada uma das variáveis abaixo, indique a escala usualmente adotada para resumir os dados em tabelas de freqüências:

Salários dos empregados de uma indústria. (razão)
Opinião de consumidores sobre determinado produto. (ordinal)
Número de respostas certas de alunos num teste com dez itens. (intervalar)
Temperatura diária da cidade de Manaus. (intervalar)
Porcentagem da receita de municípios aplicada em educação. (razão)
Opinião dos empregados da Companhia MB sobre a realização ou não de cursos obrigatórios de treinamento. (ordinal)
QI de um indivíduo. (razão)

imdb <-load(url(description = “https://www.ime.usp.br/~pam/dados.RData”)) imdb<-tab2_1 #questao 2A cap

imdb <-load(url(description = "https://www.ime.usp.br/~pam/dados.RData"))
imdb<-tab2_1
ni<- table(imdb$estado_civil) # Calcula a tabela de frequências absolutas e armazena o resultado em 'mytab'
fi<-prop.table(ni) # Tabela de frequências relativas (f_i)
p_fi<-100*prop.table(ni) # Porcentagem (100 f_i)
# Adiciona linhas de total
ni<-c(ni,sum(ni)) 
fi<-c(fi,sum(fi))
p_fi<-c(p_fi,sum(p_fi))
names(ni)[3]<-"Total"
tab2_2<-cbind(ni,fi=round(fi,digits=2),p_fi=round(p_fi,digits=2))
tab2_2

##          ni   fi   p_fi
## casado   20 0.56  55.56
## solteiro 16 0.44  44.44
## Total    36 1.00 100.00

#questao 2b cap

ni<-table(tab2_1$reg_procedencia) # Calcula a tabela de frequências absolutas e armazena o resultado em 'mytab'
fi<-prop.table(ni) # Tabela de frequências relativas (f_i)
p_fi<-100*prop.table(ni) # Porcentagem (100 f_i)
# Adiciona linhas de total
ni<-c(ni,sum(ni)) 
fi<-c(fi,sum(fi))
p_fi<-c(p_fi,sum(p_fi))
names(ni)[3]<-"Total"
tab2_2<-cbind(ni,fi=round(fi,digits=2),p_fi=round(p_fi,digits=2))
tab2_2

##          ni   fi   p_fi
## capital  11 0.31  30.56
## interior 12 0.33  33.33
## Total    13 0.36  36.11
##          36 1.00 100.00

#questao 2c

ni<-table(tab2_1$n_filhos) # Calcula a tabela de frequências absolutas e armazena o resultado em 'mytab'
fi<-prop.table(ni) # Tabela de frequências relativas (f_i)
p_fi<-100*prop.table(ni) # Porcentagem (100 f_i)
# Adiciona linhas de total
ni<-c(ni,sum(ni)) 
fi<-c(fi,sum(fi))
p_fi<-c(p_fi,sum(p_fi))
names(ni)[6]<-"Total"
tab2_2<-cbind(ni,fi=round(fi,digits=2),p_fi=round(p_fi,digits=2))
tab2_2

##       ni   fi p_fi
## 0      4 0.20   20
## 1      5 0.25   25
## 2      7 0.35   35
## 3      3 0.15   15
## 5      1 0.05    5
## Total 20 1.00  100

#questao 2d

ni<-table(tab2_1$idade_anos) # Calcula a tabela de frequências absolutas e armazena o resultado em 'mytab'
fi<-prop.table(ni) # Tabela de frequências relativas (f_i)
p_fi<-100*prop.table(ni) # Porcentagem (100 f_i)
# Adiciona linhas de total
ni<-c(ni,sum(ni)) 
fi<-c(fi,sum(fi))
p_fi<-c(p_fi,sum(p_fi))
names(ni)[25]<-"Total"
tab2_2<-cbind(ni,fi=round(fi,digits=2),p_fi=round(p_fi,digits=2))
tab2_2

##       ni   fi   p_fi
## 20     1 0.03   2.78
## 23     1 0.03   2.78
## 25     1 0.03   2.78
## 26     2 0.06   5.56
## 27     1 0.03   2.78
## 28     1 0.03   2.78
## 29     1 0.03   2.78
## 30     2 0.06   5.56
## 31     2 0.06   5.56
## 32     2 0.06   5.56
## 33     2 0.06   5.56
## 34     2 0.06   5.56
## 35     2 0.06   5.56
## 36     2 0.06   5.56
## 37     2 0.06   5.56
## 38     1 0.03   2.78
## 39     1 0.03   2.78
## 40     2 0.06   5.56
## 41     2 0.06   5.56
## 42     1 0.03   2.78
## 43     2 0.06   5.56
## 44     1 0.03   2.78
## 46     1 0.03   2.78
## 48     1 0.03   2.78
## Total 36 1.00 100.00

#QUESTAO 3A load(url(description = “https://www.ime.usp.br/~pam/dados.RData”))

ni<-table(cd_brasil$pop_urbana) # Calcula a tabela de frequências absolutas e armazena o resultado em 'mytab'
fi<-prop.table(ni) # Tabela de frequências relativas (f_i)
p_fi<-100*prop.table(ni) # Porcentagem (100 f_i)

# Adiciona linhas de total
ni<-c(ni,sum(ni)) 
fi<-c(fi,sum(fi))
p_fi<-c(p_fi,sum(p_fi))
names(ni)[28]<-"Total"
tab2_2<-cbind(ni,fi=round(fi,digits=2),p_fi=round(p_fi,digits=2))
tab2_2

##          ni   fi  p_fi
## 174277    1 0.04   3.7
## 315401    1 0.04   3.7
## 330590    1 0.04   3.7
## 741009    1 0.04   3.7
## 762864    1 0.04   3.7
## 1140569   1 0.04   3.7
## 1556115   1 0.04   3.7
## 1604318   1 0.04   3.7
## 1661914   1 0.04   3.7
## 1692248   1 0.04   3.7
## 1695548   1 0.04   3.7
## 1766166   1 0.04   3.7
## 1843486   1 0.04   3.7
## 2176006   1 0.04   3.7
## 2261986   1 0.04   3.7
## 2711557   1 0.04   3.7
## 2949017   1 0.04   3.7
## 3565130   1 0.04   3.7
## 3873722   1 0.04   3.7
## 4713311   1 0.04   3.7
## 5476915   1 0.04   3.7
## 7011990   1 0.04   3.7
## 7581230   1 0.04   3.7
## 7826843   1 0.04   3.7
## 12806488  1 0.04   3.7
## 13074245  1 0.04   3.7
## 31769219  1 0.04   3.7
## Total    27 1.00 100.0

#QUESTAO 3B

ni<-table(cd_brasil$densidade) # Calcula a tabela de frequências absolutas e armazena o resultado em 'mytab'
fi<-prop.table(ni) # Tabela de frequências relativas (f_i)
p_fi<-100*prop.table(ni) # Porcentagem (100 f_i)

# Adiciona linhas de total
ni<-c(ni,sum(ni)) 
fi<-c(fi,sum(fi))
p_fi<-c(p_fi,sum(p_fi))
names(ni)[28]<-"Total"
tab2_2<-cbind(ni,fi=round(fi,digits=2),p_fi=round(p_fi,digits=2))
tab2_2

##         ni   fi   p_fi
##          2 0.07   6.90
## 10,59    1 0.03   3.45
## 1,10     1 0.03   3.45
## 1323,00  1 0.03   3.45
## 137,14   1 0.03   3.45
## 1,51     1 0.03   3.45
## 15,67    1 0.03   3.45
## 22,11    1 0.03   3.45
## 2,47     1 0.03   3.45
## 2,65     1 0.03   3.45
## 28,34    1 0.03   3.45
## 305,32   1 0.03   3.45
## 312,94   1 0.03   3.45
## 3,16     1 0.03   3.45
## 34,17    1 0.03   3.45
## 3,77     1 0.03   3.45
## 4,40     1 0.03   3.45
## 45,08    1 0.03   3.45
## 46,53    1 0.03   3.45
## 48,00    1 0.03   3.45
## 51,08    1 0.03   3.45
## 5,16     1 0.03   3.45
## 5,38     1 0.03   3.45
## 58,42    1 0.03   3.45
## 60,69    1 0.03   3.45
## 73,66    1 0.03   3.45
## 74,79    1 0.03   3.45
## Total    1 0.03   3.45
##         29 1.00 100.00

#QUESTAO9 #A MB Indústria e Comércio, desejando melhorar o nível de seus funcionários em cargos de chefia, montou um curso experimental e indicou 2: funcionários para a primeira turma. Os dados referentes à seção a que pertencem, notas e graus obtidos no curso estão na tabela a seguir. Como havia dúvidas quanto à adoção de um único critério de avaliação, cada instrutor adotou seu próprio sistema de aferição. Usando dados daquela tabela, responda às questões:

data.ex2 <- data.frame(Função = c(1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25),
                       Seção = c("P","P","P","P","P","P","P","T","T","T","T","T","T","V","V","V","V","V","V","V","V","V","V","V","V"),
                       Administração = c(8,8,8,6,8,8,8,10,8,10,8,8,6,10,8,8,8,6,6,6,8,6,8,8,8),
                       Direito = c(9,9,9,9,9,9,9,9,9,9,9,9,9,9,9,9,9,9,9,9,9,9,9,9,9),
                       Redação = c(8.6,7,8,8.6,8,8.5,8.2,7.5,9.4,7.9,8.6,8.3,7,8.6,8.6,9.5,6.3,7.6,6.8,7.5,7.7,8.7,7.3,8.5,7),
                       Estatística = c(9,9,8,8,9,10,8,8,9,8,10,7,7,9,9,7,8,9,4,7,7,8,10,9,9),
                       Inglês = c("B","B","D","D","A","B","D","B","B","B","C","D","B","A","C","A","D","C","D","C","D","C","C","A","B"),
                       Metodologia = c("A","C","B","C","A","A","C","C","B","C","B","B","C","B","B","A","C","C","C","B","B","A","C","A","A"),
                       Política = c(9,6.5,9,6,6.5,6.5,9,6,10,9,10,6.5,6,10,10,9,10,6,6,6,6.5,6,9,6.5,9),
                       Economia = c(8.5,8,8.5,8.5,9,9.5,7,8.5,8,7.5,8.5,8,8.5,7.5,7,7.5,7.5,8.5,9.5,8.5,8,9,7,9,8.5)
                       
)
kable(data.ex2) %>%
kable_styling(bootstrap_options = "striped", full_width = T) %>%
scroll_box(height = "300px")

Função	Seção	Administração	Direito	Redação	Estatística	Inglês	Metodologia	Política	Economia
1	P	8	9	8.6	9	B	A	9.0	8.5
2	P	8	9	7.0	9	B	C	6.5	8.0
3	P	8	9	8.0	8	D	B	9.0	8.5
4	P	6	9	8.6	8	D	C	6.0	8.5
5	P	8	9	8.0	9	A	A	6.5	9.0
6	P	8	9	8.5	10	B	A	6.5	9.5
7	P	8	9	8.2	8	D	C	9.0	7.0
8	T	10	9	7.5	8	B	C	6.0	8.5
9	T	8	9	9.4	9	B	B	10.0	8.0
10	T	10	9	7.9	8	B	C	9.0	7.5
11	T	8	9	8.6	10	C	B	10.0	8.5
12	T	8	9	8.3	7	D	B	6.5	8.0
13	T	6	9	7.0	7	B	C	6.0	8.5
14	V	10	9	8.6	9	A	B	10.0	7.5
15	V	8	9	8.6	9	C	B	10.0	7.0
16	V	8	9	9.5	7	A	A	9.0	7.5
17	V	8	9	6.3	8	D	C	10.0	7.5
18	V	6	9	7.6	9	C	C	6.0	8.5
19	V	6	9	6.8	4	D	C	6.0	9.5
20	V	6	9	7.5	7	C	B	6.0	8.5
21	V	8	9	7.7	7	D	B	6.5	8.0
22	V	6	9	8.7	8	C	A	6.0	9.0
23	V	8	9	7.3	10	C	C	9.0	7.0
24	V	8	9	8.5	9	A	A	6.5	9.0
25	V	8	9	7.0	9	B	A	9.0	8.5

##### **a)** Após observar atentamente cada variável, e com o intuito de resumi-las, como você identificaria (qualitativa ordinal ou nominal e quantitativa discreta ou contínua) cada uma das $9$ variáveis listadas?



a.ex2 <- data.frame(Variável = c("Seção", "Adm.", "Direito", "Redação", "Estatística", "Inglês", "Metodologia", "Política", "Economia"),
                    Qualitativa = c("Nominal", "-", "-", "-", "-", "Ordinal", "Ordinal", "-", "-"),
                    Quantitativa = c("-", "Contínua", "Contínua", "Contínua", "Contínua", "-", "-", "Contínua", "Contínua")
)
kable(a.ex2) %>%
  kable_styling(bootstrap_options = "striped", full_width = F)

Variável	Qualitativa	Quantitativa
Seção	Nominal
Adm.		Contínua
Direito		Contínua
Redação		Contínua
Estatística		Contínua
Inglês	Ordinal
Metodologia	Ordinal
Política		Contínua
Economia		Contínua

#QUESTAO 9B

##### **b)** Compare e indique as diferenças existentes entre as distribuições das variáveis Direito, Política e Estatística.

#Conseguimos  ver  que  a  performance  dos  funcionários  se  mantem  continua  n a  área  do  D ireito.  Na  áre a  de  Estatística  conseguimos  ver  poucos   resultados  altos.  E  na  Política, conse guimos  ver  a  maior discrepância, possuindo  baixa performance dos  entrevistados.  


hist(data.ex2$Direito, xlab = "Nota", ylab = "Frequência", main = "Direito", col = "yellow", breaks = seq(0, 10, 2))

hist(data.ex2$Política, xlab = "Nota", ylab = "Frequência", main = "Política", col = "blue", breaks = seq(0, 10, 1))

hist(data.ex2$Estatística, xlab = "Nota", ylab = "Frequência", main = "Estatística", col = "green", breaks = seq(0, 10, 1))

#* variável direito apresentas todas as observações iguais. Enquanto que, estatística mostra um acúmulo de notas no intervalo [6, 10], e política de modo semelhante, todavia, com um 'gap' de observações entre o intervalo (7, 8).  *

#QUESTAO 9C

##### *c)* Construa o histograma para as notas da variável Redação.
stripchart(data.ex2$Redação,method = "stack", offset = 2, at=0,
           pch = 19, col="darkblue",ylab=NA,cex=0.5)

#QUESTAO 9D

##### *d)* Construa a distribuição de frequências da variável Metodologia e faça um gráfico para indicar essa distribuição.

d.ex9 <- table(data.ex2$Metodologia)
d.ex9 <- matrix(d.ex9)
colnames(d.ex9) <- c("Frequência")
rownames(d.ex9) <- c("A", "B", "C")
d.ex9 <- data.frame(d.ex9)
kable(d.ex9) %>%
  kable_styling(bootstrap_options = "striped", full_width = T)

	Frequência
A	7
B	8
C	10

ruan rodrigues trabalho

2022-09-12