---
title: "Análise Exploratória de Dados do Mercado Automotivo"
author: "Maria Eduarda de Souza Fontes"
date: "27-06-2024"
output: html_document
---
A análise exploratória de dados (AED) é uma etapa fundamental no processo de ciência de dados, permitindo que os analistas compreendam melhor os conjuntos de dados antes de aplicar técnicas mais complexas de modelagem. Neste trabalho, conduziremos uma análise exploratória dos dados de carros, focando em características como preços, eficiência de combustível e especificações técnicas. Utilizaremos gráficos para visualizar padrões, tendências e relações entre variáveis, além de calcular medidas de variação e dispersão para aprofundar nossa compreensão. Através dessa abordagem, esperamos identificar informações relevantes sobre o mercado automotivo e suas variáveis-chave.
A análise exploratória de dados da tabela de carros teve como objetivo principal compreender as variáveis-chave do mercado automotivo, como preços, eficiência de combustível e especificações técnicas. Buscamos identificar padrões, tendências e relações entre essas características para informar decisões de compra e estratégias de marketing. Além disso, a análise visou revelar segmentos de mercado com potencial de crescimento, como a popularidade dos SUVs e carros esportivos, e avaliar como fatores como tipo de veículo e origem influenciam o desempenho e a percepção de valor entre os consumidores
Neste estudo, utilizamos um conjunto de dados de veículos contendo informações como preço (MSRP), eficiência de combustível, especificações técnicas e origem dos carros. A análise foi realizada em duas etapas principais:
ggplot2 em R para gerar visualizações gráficas,
incluindo histogramas, gráficos de barras e de dispersão, que nos
permitiram identificar padrões e relações entre variáveis.A abordagem adotada facilitou a identificação de informações significativss, contribuindo para uma melhor compreensão do mercado automotivo.
ggplot(dados, aes(x = MSRP)) +
geom_histogram(binwidth = 5000, fill = "blue", color = "black") +
labs(title = "Distribuição de Preços (MSRP)", x = "Preço", y = "Frequência")
Resultado: A maioria dos veículos está concentrada na faixa de 20.000 a 40.000 unidades monetárias.
Essa concentração sugere que muitos consumidores buscam veículos que oferecem um equilíbrio entre custo e qualidade. Esses preços acessíveis são populares entre famílias e indivíduos que necessitam de um meio de transporte confiável sem altos custos. Modelos significativamente mais caros atendem a um mercado de luxo ou de desempenho, enquanto os mais baratos podem indicar modelos básicos ou econômicos. Estudos de mercado frequentemente apontam que o preço é um dos fatores mais críticos na decisão de compra de veículos.
ggplot(dados, aes(x = Type, y = MSRP, fill = Type)) +
geom_bar(stat = "summary", fun = "mean") +
labs(title = "Preço Médio por Tipo de Veículo", x = "Tipo", y = "Preço Médio")
Resultado: Veículos esportivos apresentam o maior preço médio, seguidos por SUVs e sedans.
Hybrid: Híbrido
Sedan: Sedan
Sports: Esportivo
SUV: Utilitário Esportivo (SUV)
Truck: Caminhonete
Wagon: Perua (ou Station Wagon)
Carros esportivos são valorizados por seu desempenho e estilo, justificando preços mais altos. SUVs são populares devido à sua versatilidade, espaço, e percepção de segurança, frequentemente associados a preços médios mais altos. Sedans, com preços mais acessíveis, atraem consumidores em busca de eficiência e economia. A preferência por SUVs tem crescido nos últimos anos, conforme relatado por analistas de mercado, refletindo tendências de consumo que valorizam espaço e multifuncionalidade.
ggplot(dados, aes(x = EngineSize, y = Horsepower)) +
geom_point() +
labs(title = "Relação entre Cilindradas e Potência", x = "Cilindradas", y = "Potência")
Resultado: Existe uma correlação positiva entre o tamanho do motor e a potência.
Veículos com motores maiores tendem a oferecer mais potência, o que é atraente para entusiastas de carros e consumidores que priorizam desempenho. No entanto, esses veículos podem ter menor eficiência de combustível, o que pode ser uma preocupação crescente para compradores conscientes do meio ambiente e dos custos operacionais. A busca por equilíbrio entre potência e eficiência é uma tendência crescente no design automotivo.
ggplot(dados, aes(x = DriveTrain)) +
geom_line(aes(y = MPG_City, color = "Cidade")) +
geom_line(aes(y = MPG_Highway, color = "Estrada")) +
labs(title = "Eficiência de Combustível por DriveTrain", x = "DriveTrain", y = "MPG")
Resultado: Veículos com tração dianteira tendem a ser mais eficientes na estrada, enquanto a eficiência na cidade é semelhante entre diferentes drivetrains.
O MPG (Miles Per Gallon) é uma medida de eficiência de combustível, indicando quantas milhas um veículo pode percorrer com um galão de combustível. No gráfico de drivetrain:
All: Representa a média da eficiência de combustível para todos os tipos de tração combinados.
Front: Refere-se à tração dianteira, onde a potência é transmitida para as rodas dianteiras.
Rear: Refere-se à tração traseira, onde a potência é transmitida para as rodas traseiras.
Veículos com tração dianteira geralmente são mais leves e têm menos perda de potência, tornando-os mais eficientes em termos de combustível, especialmente em viagens longas. Isso os torna populares entre motoristas que percorrem grandes distâncias regularmente. A eficiência de combustível é um fator importante nas decisões de compra, especialmente em regiões onde os preços do combustível são altos.
ggplot(dados, aes(x = Origin, y = MSRP, fill = Origin)) +
geom_bar(stat = "summary", fun = "mean") +
labs(title = "Preço Médio por Origem", x = "Origem", y = "Preço Médio")
Resultado: Veículos europeus têm o maior preço médio, seguidos por carros dos EUA e da Ásia.
Veículos europeus são frequentemente associados a qualidade superior, inovação e características de luxo, justificando preços mais elevados. Carros asiáticos, por outro lado, são reconhecidos por sua economia e confiabilidade, oferecendo opções acessíveis e atraentes para consumidores conscientes do custo. A percepção de prestígio e qualidade das marcas europeias continua a influenciar as escolhas dos consumidores.
summary_stats <- dados %>%
summarise(
Media_MSRP = mean(MSRP, na.rm = TRUE),
Mediana_MSRP = median(MSRP, na.rm = TRUE),
Desvio_Padrao_MSRP = sd(MSRP, na.rm = TRUE),
Coeficiente_Variacao_MSRP = sd(MSRP, na.rm = TRUE) / mean(MSRP, na.rm = TRUE) * 100
)
summary_stats %>%
kbl() %>%
kable_styling(bootstrap_options = c("striped", "hover", "condensed"))
| Media_MSRP | Mediana_MSRP | Desvio_Padrao_MSRP | Coeficiente_Variacao_MSRP |
|---|---|---|---|
| 32730.88 | 27525 | 19446.79 | 59.41419 |
Média (Media_MSRP): O valor médio dos preços dos veículos (MSRP) é 32.730,88. Isso representa o preço médio dos carros no conjunto de dados, fornecendo uma noção geral de quanto, em média, os consumidores podem esperar pagar por um veículo. A média é influenciada por valores extremos, como carros de luxo ou modelos econômicos, que podem elevar ou reduzir esse valor.
Mediana (Mediana_MSRP): A mediana é 27.525, o que significa que metade dos carros no conjunto de dados custa menos que esse valor, enquanto a outra metade custa mais. A mediana é uma medida robusta da tendência central, especialmente útil em distribuições onde os dados podem ser assimétricos ou conter outliers. Ela oferece uma visão mais clara do preço típico do carro, reduzindo o impacto de preços extremamente altos ou baixos.
Desvio Padrão (Desvio_Padrao_MSRP): Com um desvio padrão de 19.446,79, há uma significativa variabilidade nos preços dos veículos em torno da média. Isso indica que os preços dos carros variam bastante, refletindo a diversidade do mercado automotivo, que inclui desde veículos básicos até modelos de luxo. Um desvio padrão alto sugere que os consumidores têm uma ampla gama de opções de preços.
Coeficiente de Variação (Coeficiente_Variacao_MSRP): O coeficiente de variação de 59,41% demonstra a relação da dispersão em relação à média. Esse valor relativamente alto indica uma considerável dispersão nos preços, sugerindo que os preços dos carros são bastante diversificados. Isso é importante para fabricantes e revendedores ao planejar estratégias de precificação, pois reflete a variação significativa nas preferências e orçamentos dos consumidores.
A análise exploratória de dados realizada neste estudo proporcionou resultados e percepções valiosas sobre o mercado automotivo, destacando as preferências dos consumidores e as características dos veículos que influenciam suas decisões de compra. Observamos que a faixa de preço predominante entre os carros reflete um equilíbrio entre custo e benefício, indicando uma forte demanda por modelos acessíveis. Veículos esportivos e SUVs destacam-se por seus preços médios mais elevados, sugerindo uma valorização do desempenho e da versatilidade.
A relação positiva entre cilindradas e potência reafirma a importância do desempenho para determinados segmentos de consumidores, enquanto a eficiência de combustível continua a ser uma consideração chave, especialmente para veículos com tração dianteira. Finalmente, a origem dos veículos influencia significativamente seu preço médio, com carros europeus sendo vistos como mais premium.
Esses achados não apenas informam sobre tendências de mercado, mas também fornecem uma base sólida para futuras investigações e estratégias de marketing, ajudando fabricantes e revendedores a alinhar suas ofertas com as expectativas dos consumidores.