# rua azul
azul <- c(70,65,55,70,75)
media_azul <- mean(azul)
variancia_azul <- var(azul)
dp_azul <- sd(azul)
dp_azul
## [1] 7.582875
sqrt(variancia_azul)
## [1] 7.582875
#rua vermelha
vermelho <- c(40,95,55,80,65)
media_vermelho <- mean(vermelho)
variancia_vermelho <- var(vermelho)
dp_vermelho <- sd(vermelho)
dp_vermelho
## [1] 21.38925
sqrt(variancia_vermelho)
## [1] 21.38925
A rua vermelha tem um desvio-padrao maior que a rua azul.
library(readr)
Fifa <- read_csv("C:/Users/Marcus Tulio/Desktop/MESTRADO2022_1/DISCIPLINAS/Estatistica/Mestrado_engenharia/Base_de_dados-master/Base_de_dados-master/FifaData.csv")
View(Fifa)
dp_velocidade <- sd(Fifa$Speed)
dp_velocidade
## [1] 14.10061
mean(Fifa$Speed)
## [1] 65.48385
# Fase 1 - Carregar um banco de dados
load("C:/Users/Marcus Tulio/Desktop/MESTRADO2022_1/DISCIPLINAS/Estatistica/Mestrado_engenharia/Base_de_dados-master/Base_de_dados-master/Titanic.RData")
Mulheres e crianças primeiro. Isso aconteceu de fato? Teve desigualdade da sobrevivencia?
Variável de interesse: Sobrevivencia Preditores lineares: sexo, idade e classe
tabela_sexo <- table(Titanic$Sexo,Titanic$Sobreviveu)
#tabela_sexo
#prop.table(tabela_sexo,1)%>% round(digits = 2)
#prop.table(tabela_sexo,2)
library(dplyr)
library(flextable)
tabela_sexo %>%
prop.table(1) %>%
round(digits =2) %>%
data.frame() %>%
rename(sexo=Var1) %>%
rename (sobrevivencia=Var2) %>%
rename(percentual=Freq) %>%
flextable() %>%
#bg(bg = "#EFEF99")
theme_tron()
sexo | sobrevivencia | percentual |
Feminino | Não sobreviveu | 0.27 |
Masculino | Não sobreviveu | 0.79 |
Feminino | Sobreviveu | 0.73 |
Masculino | Sobreviveu | 0.21 |
Teve uma diferença entre homens e mulheres:
tabela_idade <- table(Titanic$Idade,Titanic$Sobreviveu)
prop.table(tabela_idade,1) %>% data.frame() %>% flextable() %>%
theme_vader()
Var1 | Var2 | Freq |
criança | Não sobreviveu | 0.4770642 |
adulto | Não sobreviveu | 0.6877092 |
criança | Sobreviveu | 0.5229358 |
adulto | Sobreviveu | 0.3122908 |
Teve uma diferença entre adultos e crianças no que tange a sobrevivência.
Hipótese confirmada mulheres e crianças primeiro.
Abaixo temos duas tabelas simples de proporção
tabela_classe <- table(Titanic$Classe,Titanic$Sobreviveu)
tabela_classe
##
## Não sobreviveu Sobreviveu
## Tripulação 673 212
## Primeira 122 202
## Segunda 167 118
## Terceira 528 178
prop.table(tabela_classe,1)
##
## Não sobreviveu Sobreviveu
## Tripulação 0.7604520 0.2395480
## Primeira 0.3765432 0.6234568
## Segunda 0.5859649 0.4140351
## Terceira 0.7478754 0.2521246
prop.table(tabela_classe,2)
##
## Não sobreviveu Sobreviveu
## Tripulação 0.45167785 0.29859155
## Primeira 0.08187919 0.28450704
## Segunda 0.11208054 0.16619718
## Terceira 0.35436242 0.25070423
Abaixo temos a primeira tentativa do gráfico de barras
par(bg="lightyellow")
barplot(tabela_classe,beside=T,
main="Desigualdade da Sobrevivência",
col=c("pink","red","blue","skyblue"))
Versão Final do Gráfico de barras
tabela_classe2 <- table(Titanic$Sobreviveu,Titanic$Classe)
barplot(tabela_classe2,beside=T,col=c("red","blue"),
ylim=c(0,750),legend.text=rownames(tabela_classe2))
Teve uma desigualdade da sobrevivência Hipótese confirmada.