Fazer uma publicação no RPUBS com:
1 - para duas variáveis qualitativas - uma tabela cruzada, uma tabela de proporção e um gráfico de barras; 2 - para uma variável qualitativa e uma variável quantitativa - um boxplot e uma análise descritiva [pelo menos a média e o desvio-padrão]; 3 - atividade opcional - fazer uma análise sobre os outliers dessa base de dados.
Esses resultados devem ser construidos a partir da base de dados chamada “Questionario_Estresse.xls”.
OBS - Obrigatória a interpretação dos seus resultados em pelo menos três parágrafos.
library(readxl)
Questionario_Estresse <- read_excel("C:/Users/carol/OneDrive/Documentos/Estatistica1/Base_de_dados-master/Questionario_Estresse.xls")
View(Questionario_Estresse)
head(Questionario_Estresse)
# A tibble: 6 x 10
Aluno Turma Mora_pais RJ Namorado_a Trabalha Desempenho Estresse Créditos
<dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
1 1 1 2 2 2 2 8.89 23 27
2 2 1 1 1 2 2 8.8 24 28
3 3 1 2 2 2 2 8 25 25
4 4 1 2 2 1 1 8.8 38 21
5 5 1 2 2 2 1 8.9 41 18
6 6 1 2 2 1 1 8.1 25 29
# ... with 1 more variable: Horas_estudo <dbl>
Questionario_Estresse$Mora_pais = factor(Questionario_Estresse$Mora_pais, levels = c("1","2"), labels = c("Mora","Não Mora"))
Questionario_Estresse$Namorado_a = factor(Questionario_Estresse$Namorado_a, levels = c("1","2"), labels = c("Namora","Não Namora"))
Questionario_Estresse$Trabalha = factor(Questionario_Estresse$Trabalha, levels = c("1","2"), labels = c("Trabalha","Não Trabalha"))
head(Questionario_Estresse)
# A tibble: 6 x 10
Aluno Turma Mora_pais RJ Namorado_a Trabalha Desempenho Estresse Créditos
<dbl> <dbl> <fct> <dbl> <fct> <fct> <dbl> <dbl> <dbl>
1 1 1 Não Mora 2 Não Namora Não Traba~ 8.89 23 27
2 2 1 Mora 1 Não Namora Não Traba~ 8.8 24 28
3 3 1 Não Mora 2 Não Namora Não Traba~ 8 25 25
4 4 1 Não Mora 2 Namora Trabalha 8.8 38 21
5 5 1 Não Mora 2 Não Namora Trabalha 8.9 41 18
6 6 1 Não Mora 2 Namora Trabalha 8.1 25 29
# ... with 1 more variable: Horas_estudo <dbl>
Qualitativas: Namora, Trabalha, Mora com Pais; Quantitativas: Estresse, Crédito, Desempenho;
Tabela1 <- table (Questionario_Estresse$Mora_pais,Questionario_Estresse$Trabalha)
Tabela1
Trabalha Não Trabalha
Mora 17 27
Não Mora 19 32
Tabela2 <- table (Questionario_Estresse$Trabalha,Questionario_Estresse$Namorado_a)
Tabela2
Namora Não Namora
Trabalha 18 18
Não Trabalha 29 30
Tabela3 <- table(Questionario_Estresse$Mora_pais,Questionario_Estresse$Namorado_a,Questionario_Estresse$Trabalha)
Tabela3
, , = Trabalha
Namora Não Namora
Mora 8 9
Não Mora 10 9
, , = Não Trabalha
Namora Não Namora
Mora 11 16
Não Mora 18 14
round(prop.table(Tabela1,1)*100,1)
Trabalha Não Trabalha
Mora 38.6 61.4
Não Mora 37.3 62.7
round(prop.table(Tabela2,1)*100,1)
Namora Não Namora
Trabalha 50.0 50.0
Não Trabalha 49.2 50.8
barplot(Tabela1, main = "Mora com pais X Trabalha",
beside = TRUE,col = c("pink","yellow"), density = 55, angle = 55,
ylim = c(0,30),
legend = rownames(Tabela1))
barplot(Tabela2, main = "Trabalha X Namora",
beside = TRUE,col = c("blue","green"), density = 55, angle = 55,
ylim = c(0,30),
legend = rownames(Tabela2))
library(flextable)
summary(Questionario_Estresse)
Aluno Turma Mora_pais RJ Namorado_a
Min. : 1.0 Min. :1.000 Mora :44 Min. :1.000 Namora :47
1st Qu.:24.5 1st Qu.:1.000 Não Mora:51 1st Qu.:1.000 Não Namora:48
Median :48.0 Median :2.000 Median :2.000
Mean :48.0 Mean :2.074 Mean :1.653
3rd Qu.:71.5 3rd Qu.:3.000 3rd Qu.:2.000
Max. :95.0 Max. :3.000 Max. :2.000
Trabalha Desempenho Estresse Créditos
Trabalha :36 Min. :5.820 Min. :12.00 Min. :15.00
Não Trabalha:59 1st Qu.:8.500 1st Qu.:22.50 1st Qu.:23.00
Median :8.700 Median :27.00 Median :24.00
Mean :8.594 Mean :27.82 Mean :24.95
3rd Qu.:9.050 3rd Qu.:33.00 3rd Qu.:27.00
Max. :9.700 Max. :44.00 Max. :49.00
NA's :1
Horas_estudo
Min. :19.00
1st Qu.:25.00
Median :30.00
Mean :30.73
3rd Qu.:35.00
Max. :60.00
boxplot(Estresse~Trabalha,
data = Questionario_Estresse,main="Relação Estresse x Trabalho",
col=c("red","gray"), horizontal = T,
xlab = "Estresse", ylab = "Trabalha")
boxplot(Estresse~Mora_pais,
data = Questionario_Estresse,main="Estresse x Mora com Pais",
col=c("pink","yellow"), horizontal = T,
xlab = "Estresse", ylab = "Mora com pais")
boxplot(Estresse~Namorado_a,
data = Questionario_Estresse,main="Estresse x Namoro",
col=c("orange","lightgray"), horizontal = T,
xlab = "Estresse", ylab = "Namoro")
A média de Estresse no total das pessoas estudadas no banco de dados é de 27.82 Sendo menor dado 12 e maior dado 44.
media = mean(Questionario_Estresse$Estresse)
media
[1] 27.82105
mediana=median(Questionario_Estresse$Estresse)
mediana
[1] 27
variancia=var(Questionario_Estresse$Estresse)
variancia
[1] 56.85062
O desvio padrão é uma medida que expressa o grau de dispersão de um conjunto de dados. Ou seja, o desvio padrão indica o quanto um conjunto de dados é uniforme. Quanto mais próximo de 0 for o desvio padrão, mais homogêneo são os dados. Sendo o desvio padrão neste estudo de 7,53, um pouco acima do 0, sendo dados pouco homogêneos.
desvio=variancia^(0.5)
desvio
[1] 7.539935
O banco de dados proposto possui 10 variáveis.
As variáveis são divididas em quantitativas e qualitativas.
Tivemos que corrigir alguns erros no banco de dados para melhor definir estas variáveis.
Podemos concluir, após análise dos dados disponibilizados em banco de dados que por exemplo, o nível de estresse é maior nas pessoas que não namoravam e que trabalhavam e não moravam com os pais.
Fizemos também calculo de média, mediana, variância e desvio padrão dos níveis de estresse dos dados informados no banco de dados. Sendo média 27.82105, Mediana 27, Variância 56.85062 e Desvio Padrão 7.539935.