Desvio - Padrão

# rua azul
azul <- c(70,65,55,70,75)
media_azul <- mean(azul)
variancia_azul <- var(azul)
dp_azul <- sd(azul)
dp_azul
## [1] 7.582875
sqrt(variancia_azul)
## [1] 7.582875
#rua vermelha
vermelho <- c(40,95,55,80,65)
media_vermelho <- mean(vermelho) 
variancia_vermelho <- var(vermelho)
dp_vermelho <- sd(vermelho)
dp_vermelho
## [1] 21.38925
sqrt(variancia_vermelho)
## [1] 21.38925

A rua vermelha tem um desvio-padrao maior que a rua azul.

Desvio - Padrão em uma base de dados

library(readr)
Fifa <- read_csv("C:/Users/Marcus Tulio/Desktop/MESTRADO2022_1/DISCIPLINAS/Estatistica/Mestrado_engenharia/Base_de_dados-master/Base_de_dados-master/FifaData.csv")
View(Fifa)


dp_velocidade <- sd(Fifa$Speed)
dp_velocidade
## [1] 14.10061
mean(Fifa$Speed)
## [1] 65.48385

Cruzamento de duas variaveis

  • Qualitativa X Qualitativa
  • Quantitativa X Quantitativa
  • Qualitativa X Quantitativa
# Fase 1 - Carregar um banco de dados

load("C:/Users/Marcus Tulio/Desktop/MESTRADO2022_1/DISCIPLINAS/Estatistica/Mestrado_engenharia/Base_de_dados-master/Base_de_dados-master/Titanic.RData")

Perguntas

Mulheres e crianças primeiro. Isso aconteceu de fato? Teve desigualdade da sobrevivencia?

Variaveis

Variável de interesse: Sobrevivencia Preditores lineares: sexo, idade e classe

Análise por Sexo

tabela_sexo <- table(Titanic$Sexo,Titanic$Sobreviveu)
#tabela_sexo

#prop.table(tabela_sexo,1)%>% round(digits = 2)
#prop.table(tabela_sexo,2)


library(dplyr)
library(flextable)

tabela_sexo %>%
  prop.table(1) %>%
  round(digits =2) %>%
  data.frame() %>%
  rename(sexo=Var1) %>%
  rename (sobrevivencia=Var2) %>%
  rename(percentual=Freq) %>%
  flextable() %>%
  #bg(bg = "#EFEF99")
  theme_tron()

Teve uma diferença entre homens e mulheres:

Análise por Idade

tabela_idade <- table(Titanic$Idade,Titanic$Sobreviveu)

prop.table(tabela_idade,1) %>% data.frame() %>% flextable() %>% 
theme_vader()

Teve uma diferença entre adultos e crianças no que tange a sobrevivência.

Hipótese confirmada mulheres e crianças primeiro.

Análise por classe

Abaixo temos duas tabelas simples de proporção

tabela_classe <- table(Titanic$Classe,Titanic$Sobreviveu)
tabela_classe
##             
##              Não sobreviveu Sobreviveu
##   Tripulação            673        212
##   Primeira              122        202
##   Segunda               167        118
##   Terceira              528        178
prop.table(tabela_classe,1)
##             
##              Não sobreviveu Sobreviveu
##   Tripulação      0.7604520  0.2395480
##   Primeira        0.3765432  0.6234568
##   Segunda         0.5859649  0.4140351
##   Terceira        0.7478754  0.2521246
prop.table(tabela_classe,2)
##             
##              Não sobreviveu Sobreviveu
##   Tripulação     0.45167785 0.29859155
##   Primeira       0.08187919 0.28450704
##   Segunda        0.11208054 0.16619718
##   Terceira       0.35436242 0.25070423

Abaixo temos a primeira tentativa do gráfico de barras

par(bg="lightyellow")
barplot(tabela_classe,beside=T,
        main="Desigualdade da Sobrevivência",
        col=c("pink","red","blue","skyblue"))

Versão Final do Gráfico de barras

tabela_classe2 <- table(Titanic$Sobreviveu,Titanic$Classe)
barplot(tabela_classe2,beside=T,col=c("red","blue"),
        ylim=c(0,750),legend.text=rownames(tabela_classe2))

Conclusão

Teve uma desigualdade da sobrevivência Hipótese confirmada.