Análise Qualitativa x Quantitativa

A variável quantitativa Peso foi dividida em quatro variáveis qualitativas (Magrinho, Em forma, Gordinho, Obeso). Para cada uma delas foi construído um boxplot para observar a relação de cada grupo com a variável quantitativa velocidade. Os gráficos possibilitaram identificar que o grupo dos gordinhos é o mais veloz, apresentando a maior mediana, em termos de velocidade esse ranking ficaria: Gordinho-Obeso-Em forma-Magrinho. Nota-se, pelo tamanho dos retângulos, que o grupo dos Obesos é o de maior variância, enquanto o grupo de magrinhos é o de menor. O mesmo procedimento foi repetido para a variável quantitativa Altura, dividida em quatro variáveis qualitativas (Baixinho, Mediano, Alto, Gigante). Neste caso, o ranking do grupo mais veloz seria liderado pelo grupo classificado como Gigante, seguido pelos Altos, Medianos e Baixinhos. O resumo numérico confirma o que foi visualizado nos gráficos, a maior mediana sendo 71.0 para o grupo dos Gordinhos (contra 70.0, 63.5 e 50.5 dos demais grupos) e 80.0 para o grupo dos Gigantes (contra 70.0, 60.0, 50.0 dos demais grupos). O desvio padrão é maior no grupo dos Obesos e no grupo dos Medianos

Análise Quantitativa x Quantitativa

Foram avaliadas as variáveis quantitativas Velocidade, Peso, e Altura, através da construção de gráficos de dispersão ( gráfico1:Peso x Velocidade e gráfico2: Altura x Velocidade) e de Matriz de Correlação. Tanto no gráfico 1 quanto no gráfico 2, a reta que tenta se ajustar aos pontos, através do método de Mínimos Quadrados, tem o coeficiente angular é positivo. No gráfico 1 os valores de Peso se concentram abaixo de 1000, no gráfico 2 é possível observar grande concentração nas alturas abaixo de 20, e, em ambos, os pontos não se ajustam a reta traçada, a dispersão é muito grande. A matriz de correlação mostra baixos valores de coeficiente de correlação 0.22 para Altura-Velocidade e 0.11 para Peso-Velocidade. Uma correlação mais forte é observada entre as variáveis Peso e Altura, o que não foi foco de análise na presente atividade.

library(Rcmdr)
## Loading required package: splines
## Loading required package: RcmdrMisc
## Loading required package: car
## Loading required package: carData
## Loading required package: sandwich
## Loading required package: effects
## lattice theme set by effectsTheme()
## See ?effectsTheme for details.
## A interface gráfica do Rcmdr só é lançada no modo interativo
## 
## Attaching package: 'Rcmdr'
## The following object is masked from 'package:car':
## 
##     Confint
library(corrplot)
## corrplot 0.84 loaded
load("C:/Users/LAB 17/Desktop/Base_de_dados-master/df_pokemon.RData")

df$Height_facctor <- with(df, binVariable(height, bins=4, method='proportions', labels=c('Baixinho','Mediano','Alto','Gigante')))
df$Weight_factor <- with(df, binVariable(weight, bins=4, method='proportions', labels=c('Magrinho','Em_forma','Gordinho','Obeso')))

x11()
par(bg="lightyellow")
Boxplot(speed~Height_facctor, data=df, id=list(method="y"),col=c("white","lightgreen","green","darkgreen"),main="DistribuiçãoDaVelocidadePorCategoriasDeAltura")

## [1] "291" "617"
x11()
par(bg="lightyellow")
Boxplot(speed~Weight_factor, data=df, id=list(method="y"),col=c("white","lightblue","royalblue","blue"),main="DistribuiçãoDaVelocidadePorCategoriasDePeso")

## [1] "547" "291" "617"
library(abind, pos=16)
library(e1071, pos=17)
numSummary(df[,"speed", drop=FALSE], groups=df$Height_facctor, statistics=c("mean", "sd", "IQR", "quantiles"), quantiles=c(0,.25,.5,.75,1))
##              mean       sd  IQR 0%  25% 50% 75% 100% speed:n
## Baixinho 54.09283 24.15662 33.0  5 35.0  50  68  115     237
## Mediano  62.77108 28.23401 40.0 10 40.0  60  80  160     166
## Alto     72.50365 25.00033 41.0 15 50.0  70  91  140     137
## Gigante  78.74719 25.06620 40.5 25 58.5  80  99  150     178
numSummary(df[,"speed", drop=FALSE], groups=df$Weight_factor, statistics=c("mean", "sd", "IQR", "quantiles"), quantiles=c(0,.25,.5,.75,1))
##              mean       sd   IQR 0% 25%  50%   75% 100% speed:n
## Magrinho 56.28261 24.52648 30.00 15  40 50.5 70.00  116     184
## Em_forma 64.24157 27.43607 32.75  5  48 63.5 80.75  160     178
## Gordinho 72.68182 26.77698 40.00 15  50 71.0 90.00  150     176
## Obeso    70.03889 27.76585 45.00  5  50 70.0 95.00  140     180
x11()
par(bg="lightyellow")
scatterplot(speed~height, regLine=TRUE, smooth=FALSE, boxplots='xy', data=df,pch=19,main="Altura x Velocidade")

x11()
par(bg="lightyellow")
scatterplot(speed~weight, regLine=TRUE, smooth=FALSE, boxplots='xy', data=df,pch=19,main="Peso x Velocidade")

x11()
scatterplotMatrix(~height+speed+weight, regLine=TRUE, smooth=FALSE, diagonal=list(method="density"), data=df)

x11()
par(bg="lightyellow")
MC<-cor(df[,c("height","weight","speed")], use="complete")
corrplot(MC,method="number",main="MatrizDeCorrelação_AlturaPesoVelocidade")