A variável quantitativa Peso foi dividida em quatro variáveis qualitativas (Magrinho, Em forma, Gordinho, Obeso). Para cada uma delas foi construído um boxplot para observar a relação de cada grupo com a variável quantitativa velocidade. Os gráficos possibilitaram identificar que o grupo dos gordinhos é o mais veloz, apresentando a maior mediana, em termos de velocidade esse ranking ficaria: Gordinho-Obeso-Em forma-Magrinho. Nota-se, pelo tamanho dos retângulos, que o grupo dos Obesos é o de maior variância, enquanto o grupo de magrinhos é o de menor. O mesmo procedimento foi repetido para a variável quantitativa Altura, dividida em quatro variáveis qualitativas (Baixinho, Mediano, Alto, Gigante). Neste caso, o ranking do grupo mais veloz seria liderado pelo grupo classificado como Gigante, seguido pelos Altos, Medianos e Baixinhos. O resumo numérico confirma o que foi visualizado nos gráficos, a maior mediana sendo 71.0 para o grupo dos Gordinhos (contra 70.0, 63.5 e 50.5 dos demais grupos) e 80.0 para o grupo dos Gigantes (contra 70.0, 60.0, 50.0 dos demais grupos). O desvio padrão é maior no grupo dos Obesos e no grupo dos Medianos
Foram avaliadas as variáveis quantitativas Velocidade, Peso, e Altura, através da construção de gráficos de dispersão ( gráfico1:Peso x Velocidade e gráfico2: Altura x Velocidade) e de Matriz de Correlação. Tanto no gráfico 1 quanto no gráfico 2, a reta que tenta se ajustar aos pontos, através do método de Mínimos Quadrados, tem o coeficiente angular é positivo. No gráfico 1 os valores de Peso se concentram abaixo de 1000, no gráfico 2 é possível observar grande concentração nas alturas abaixo de 20, e, em ambos, os pontos não se ajustam a reta traçada, a dispersão é muito grande. A matriz de correlação mostra baixos valores de coeficiente de correlação 0.22 para Altura-Velocidade e 0.11 para Peso-Velocidade. Uma correlação mais forte é observada entre as variáveis Peso e Altura, o que não foi foco de análise na presente atividade.
library(Rcmdr)
## Loading required package: splines
## Loading required package: RcmdrMisc
## Loading required package: car
## Loading required package: carData
## Loading required package: sandwich
## Loading required package: effects
## lattice theme set by effectsTheme()
## See ?effectsTheme for details.
## A interface gráfica do Rcmdr só é lançada no modo interativo
##
## Attaching package: 'Rcmdr'
## The following object is masked from 'package:car':
##
## Confint
library(corrplot)
## corrplot 0.84 loaded
load("C:/Users/LAB 17/Desktop/Base_de_dados-master/df_pokemon.RData")
df$Height_facctor <- with(df, binVariable(height, bins=4, method='proportions', labels=c('Baixinho','Mediano','Alto','Gigante')))
df$Weight_factor <- with(df, binVariable(weight, bins=4, method='proportions', labels=c('Magrinho','Em_forma','Gordinho','Obeso')))
x11()
par(bg="lightyellow")
Boxplot(speed~Height_facctor, data=df, id=list(method="y"),col=c("white","lightgreen","green","darkgreen"),main="DistribuiçãoDaVelocidadePorCategoriasDeAltura")
## [1] "291" "617"
x11()
par(bg="lightyellow")
Boxplot(speed~Weight_factor, data=df, id=list(method="y"),col=c("white","lightblue","royalblue","blue"),main="DistribuiçãoDaVelocidadePorCategoriasDePeso")
## [1] "547" "291" "617"
library(abind, pos=16)
library(e1071, pos=17)
numSummary(df[,"speed", drop=FALSE], groups=df$Height_facctor, statistics=c("mean", "sd", "IQR", "quantiles"), quantiles=c(0,.25,.5,.75,1))
## mean sd IQR 0% 25% 50% 75% 100% speed:n
## Baixinho 54.09283 24.15662 33.0 5 35.0 50 68 115 237
## Mediano 62.77108 28.23401 40.0 10 40.0 60 80 160 166
## Alto 72.50365 25.00033 41.0 15 50.0 70 91 140 137
## Gigante 78.74719 25.06620 40.5 25 58.5 80 99 150 178
numSummary(df[,"speed", drop=FALSE], groups=df$Weight_factor, statistics=c("mean", "sd", "IQR", "quantiles"), quantiles=c(0,.25,.5,.75,1))
## mean sd IQR 0% 25% 50% 75% 100% speed:n
## Magrinho 56.28261 24.52648 30.00 15 40 50.5 70.00 116 184
## Em_forma 64.24157 27.43607 32.75 5 48 63.5 80.75 160 178
## Gordinho 72.68182 26.77698 40.00 15 50 71.0 90.00 150 176
## Obeso 70.03889 27.76585 45.00 5 50 70.0 95.00 140 180
x11()
par(bg="lightyellow")
scatterplot(speed~height, regLine=TRUE, smooth=FALSE, boxplots='xy', data=df,pch=19,main="Altura x Velocidade")
x11()
par(bg="lightyellow")
scatterplot(speed~weight, regLine=TRUE, smooth=FALSE, boxplots='xy', data=df,pch=19,main="Peso x Velocidade")
x11()
scatterplotMatrix(~height+speed+weight, regLine=TRUE, smooth=FALSE, diagonal=list(method="density"), data=df)
x11()
par(bg="lightyellow")
MC<-cor(df[,c("height","weight","speed")], use="complete")
corrplot(MC,method="number",main="MatrizDeCorrelação_AlturaPesoVelocidade")