Relatório 1a Questão

Author

Francielly Cruz

1. Introdução

Este relatório tem como objetivo analisar dados comportamentais de clientes de uma empresa varejista, com o intuito de oferecer uma visão estratégica voltada para ações de marketing digital. A partir da base de dados fornecida, exploraremos variáveis relacionadas ao perfil dundefinedo consumidor, seus hábitos online e seus padrões de compra.

2. Descrição da base de dados

A base contém informações de clientes ao longo do último ano, incluindo:

  • Sexo do cliente (masculino ou feminino)
  • Tempo médio de uso diário da internet (em minutos)
  • Forma de pagamento preferencial (à vista ou parcelado)
  • Navegador mais utilizado (Chrome ou outros)
  • Gasto anual com produtos da empresa (em R$)

Utilizamos para a análise os seguintes pacotes

# Configuração inicial
library(tidyverse)
library(ggplot2)
library(plotly)
library(kableExtra)
library(cluster)
library(scales)
Code
# Configuração inicial
library(tidyverse)
Warning: pacote 'tidyverse' foi compilado no R versão 4.4.3
Warning: pacote 'ggplot2' foi compilado no R versão 4.4.3
Warning: pacote 'tidyr' foi compilado no R versão 4.4.3
Warning: pacote 'dplyr' foi compilado no R versão 4.4.3
── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
✔ dplyr     1.1.4     ✔ readr     2.1.5
✔ forcats   1.0.0     ✔ stringr   1.5.1
✔ ggplot2   3.5.1     ✔ tibble    3.2.1
✔ lubridate 1.9.4     ✔ tidyr     1.3.1
✔ purrr     1.0.2     
── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
✖ dplyr::filter() masks stats::filter()
✖ dplyr::lag()    masks stats::lag()
ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors
Code
library(ggplot2)
library(plotly)
Warning: pacote 'plotly' foi compilado no R versão 4.4.3

Anexando pacote: 'plotly'

O seguinte objeto é mascarado por 'package:ggplot2':

    last_plot

O seguinte objeto é mascarado por 'package:stats':

    filter

O seguinte objeto é mascarado por 'package:graphics':

    layout
Code
library(kableExtra)
Warning: pacote 'kableExtra' foi compilado no R versão 4.4.3

Anexando pacote: 'kableExtra'

O seguinte objeto é mascarado por 'package:dplyr':

    group_rows
Code
library(cluster)
Warning: pacote 'cluster' foi compilado no R versão 4.4.3
Code
library(scales)

Anexando pacote: 'scales'

O seguinte objeto é mascarado por 'package:purrr':

    discard

O seguinte objeto é mascarado por 'package:readr':

    col_factor

Com a seguinte base de dados carregada

library(readxl)
Atividade_Avaliativa_1_análise_descritiva <- read_excel("C:/Users/frans/OneDrive/Documentos/Atividade MQAA/AtividadeMQAA/Dados/atividade_avaliativa_1_analise_descritiva.xlsx")
New names:
• `` -> `...7`
• `` -> `...8`
• `` -> `...9`
• `` -> `...11`

Iniciamos com uma limpeza dos dados, excluindo colunas irrelevantes e valores ausentes para garantir maior integridade analítica.

3. Análise exploratória

A seguir, apresentamos visualizações interativas para compreender os padrões dos dados e os comportamentos dos consumidores. Esta seção está dividida em três tópicos:

3.1 Perfil dos Clientes

A partir dos dados, foram gerados gráficos sobre a distribuição por sexo, forma de pagamento e navegador utilizado.

3.1.1 Distribuição por Sexo

Observa-se uma predominância do público feminino em relação ao masculino, com as mulheres representando 70,25% do total de clientes. O público masculino corresponde a 29,75% da base de clientes.

A partir dessa análise, a empresa pode direcionar suas estratégias de marketing e desenvolvimento de produtos prioritariamente — mas não exclusivamente — ao público feminino, buscando atender melhor suas preferências e necessidades, o que pode resultar em maior engajamento, satisfação e aumento nas vendas.

3.1.2 Tempo Médio de Internet por Sexo

Embora os homens representem a minoria dos clientes, eles apresentam um tempo médio de navegação na internet ligeiramente superior ao das mulheres. Para verificar se essa diferença é estatisticamente significativa, recomenda-se a aplicação do teste t de Student para amostras independentes.

A compreensão dessa diferença no comportamento de navegação pode fornecer insights valiosos para a empresa, permitindo a personalização das estratégias de marketing e a otimização da experiência do usuário, visando aumentar o engajamento e a conversão dos clientes.

3.2. Comportamento de Compra

Exploramos como os clientes se comportam em relação ao gasto e à forma de pagamento, incluindo comparações entre segmentos.

3.2.1. Gasto Médio por Tipo de Pagamento

A análise dos dados indica que o modelo de pagamento parcelado apresenta a maior média de gasto entre os clientes, com R$116,45, enquanto o pagamento à vista possui uma média de gasto de R$92,99.

Essa informação evidencia que os clientes que optam pelo parcelamento tendem a gastar mais do que aqueles que realizam o pagamento à vista.

Com base nesses dados, as equipes de marketing, produção e vendas podem desenvolver estratégias específicas para incentivar o uso do pagamento parcelado, como campanhas promocionais, ofertas exclusivas para compras parceladas ou o lançamento de produtos com preços que favoreçam essa modalidade. Tais ações podem aumentar o ticket médio, elevar o volume de vendas e, consequentemente, melhorar a performance geral da empresa.

3.2.2. Distribuição do Tipo de Pagamento entre os Clientes

Observa-se que o pagamento à vista é preferido por 56,6% dos clientes, enquanto o pagamento parcelado representa cerca de 43,4% das transações. Essa distribuição evidencia uma oportunidade para intensificar ações e estratégias voltadas ao incentivo do uso do pagamento parcelado, o que pode contribuir para o aumento do ticket médio, elevação do volume de vendas e melhoria da performance geral da empresa.

3.2.3. Tempo Médio de Acesso à Internet por Tipo de Pagamento

O tempo médio de acesso à internet, segmentado por tipo de pagamento, apresentou valores próximos: 132,1 minutos por dia para clientes que pagam à vista e 133,9 minutos por dia para aqueles que optam pelo pagamento parcelado. Considerando essa pequena diferença, recomenda-se a aplicação do teste t de Student para amostras independentes, a fim de verificar se a diferença é estatisticamente significativa.

Caso a análise confirme a ausência de diferença relevante, conclui-se que o tempo médio de acesso não constitui um critério válido para segmentação dos clientes por tipo de pagamento, e, portanto, não justifica a implementação de estratégias específicas baseadas nesse aspecto. Em contrapartida, se for identificada uma diferença significativa, será necessário aprofundar a investigação para compreender os fatores subjacentes e, assim, desenvolver ações direcionadas que possam otimizar o engajamento e o desempenho comercial.

3.2.4. Gasto Médio por Sexo

O grupo feminino não só representa a maior parcela da base de clientes, como também apresenta um gasto médio superior ao do público masculino, totalizando R$ 107,55 contra R$ 92,84 dos homens. Essa tendência indica uma oportunidade valiosa para a empresa concentrar esforços em campanhas e iniciativas direcionadas ao público feminino, potencializando o retorno sobre investimento e impulsionando o crescimento das vendas.

3.3 Correlação entre navegação e consumo

Investigamos como o tempo de acesso à internet influencia o comportamento de compra, destacando clientes com maior potencial para campanhas digitais.

3.3.1. Distribuição de clientes por tempo de acesso à internet

Utilizando a segmentação do tempo médio de acesso à internet em faixas específicas — de 0 a mais de 240 minutos diários — foi possível mapear o comportamento de navegação dos clientes em diferentes intervalos temporais. A análise revelou que a maior concentração está na faixa de 121 a 180 minutos, com aproximadamente 658 clientes, seguida pelas faixas de 61 a 120 minutos e 181 a 240 minutos.

Essa distribuição indica que a maior parte dos clientes dedica um tempo significativo à navegação, o que abre espaço para estratégias de marketing digital mais robustas e segmentadas. Clientes com tempo de acesso entre 121 e 180 minutos representam um público engajado, ideal para campanhas que envolvam conteúdos ricos, como vídeos explicativos, tutoriais, webinars e storytelling de marca.

Para maximizar o impacto, recomenda-se focar ações específicas nas faixas de 121 a 180 minutos e 181 a 240 minutos, que juntas concentram um público predisposto a consumir conteúdos mais elaborados e ofertas exclusivas. Algumas sugestões práticas incluem:

  • Campanhas de remarketing com conteúdos educativos e demonstrações de produtos, aproveitando o tempo disponível desses usuários para aprofundar a relação com a marca.

  • Promoções por tempo limitado e eventos online interativos, como lives e sessões de perguntas e respostas, que exploram o engajamento prolongado.

  • Segmentação por horário de acesso, para garantir que as mensagens cheguem no momento em que o cliente está mais ativo online

Já para os clientes que acessam menos de 60 minutos diários, recomenda-se o uso de comunicações mais objetivas e chamadas diretas para ação, garantindo que mesmo o público de navegação rápida seja impactado eficientemente.

Por fim, sugere-se cruzar esses dados com outras variáveis como gênero, faixa etária e comportamento de compra para refinar ainda mais as estratégias, aumentando a assertividade das campanhas e o retorno sobre investimento.

3.3.2. Gasto médio por faixa de tempo de internet

A segmentação do gasto médio anual dos clientes por faixa de tempo de acesso diário à internet revelou uma relação importante entre o engajamento digital e o comportamento de consumo. A segmentação do gasto médio anual dos clientes por faixa de tempo diário de acesso à internet revela uma tendência gradual do gasto conforme o tempo de navegação se eleva.

Embora o gasto médio apresente uma elevação conforme o tempo de acesso aumenta até a faixa de 181-240 minutos, o crescimento é moderado e não há uma diferença claramente marcante entre as faixas, indicando que o tempo de navegação pode ser apenas um dos vários fatores que influenciam o comportamento de consumo.

Implicações Estratégicas:

  • Aproveitar a Tendência de Maior Engajamento: Clientes que passam entre 121 e 240 minutos diários na internet apresentam um gasto médio ligeiramente superior, o que sugere uma oportunidade para campanhas que exploram essa faixa, oferecendo conteúdos relevantes e promoções que estimulem compras adicionais.

  • Segmentação Fina e Testes A/B: Considerando que as diferenças de gasto não são extremas, é recomendável realizar testes A/B para validar quais tipos de ofertas e mensagens geram maior impacto em cada faixa, evitando suposições baseadas apenas no tempo de acesso.

  • Conteúdo Personalizado para Públicos Diversos: Para os clientes com menor tempo de navegação, que apresentam gasto médio próximo aos demais, ações de marketing devem focar em mensagens objetivas e ofertas diretas, enquanto para os que têm maior engajamento, estratégias mais elaboradas, como conteúdo educativo e programas de fidelidade, podem aumentar o valor do cliente ao longo do tempo.

  • Monitoramento Contínuo: É importante monitorar continuamente essas métricas e cruzar com outras variáveis demográficas e comportamentais para ajustar as estratégias de forma dinâmica, otimizando o retorno sobre investimento.

3.3.3. Gasto Médio por Navegador Utilizado

A análise do gasto médio anual dos clientes, segmentada pelo navegador utilizado, mostra uma leve diferença entre os usuários do Chrome e os que acessam por outros navegadores. Os clientes que utilizam navegadores diferentes do Chrome apresentam um gasto médio anual de aproximadamente R$ 104,85, enquanto os usuários do Chrome possuem um gasto médio ligeiramente inferior, de R$ 101,84.

Embora a diferença no gasto médio não seja expressivamente significativa, esses dados indicam que os usuários de outros navegadores podem representar um público com potencial de consumo igual ou até ligeiramente superior ao dos usuários de Chrome, o que desafia a suposição comum de que os usuários do navegador mais popular seriam automaticamente os maiores consumidores.

Implicações Estratégicas:

  • Diversificação do Foco de Marketing: Dada a proximidade dos valores, é recomendável que as estratégias de marketing digital sejam inclusivas, contemplando tanto os usuários do Chrome quanto os de outros navegadores, garantindo que a comunicação seja eficaz para todos os segmentos.

  • Personalização e Testes A/B: Para identificar nuances de comportamento e preferências, recomenda-se a realização de testes A/B com campanhas específicas para cada grupo, ajustando mensagens, formatos e ofertas para maximizar o engajamento e conversão.

  • Otimização Técnica para Todos os Navegadores: Independentemente do navegador, é fundamental assegurar que a experiência do usuário no site e nas plataformas digitais seja consistente e livre de barreiras técnicas, evitando perder potenciais clientes por questões de usabilidade.

  • Monitoramento Contínuo e Análise Integrada: Sugere-se continuar acompanhando esses indicadores e cruzá-los com outras variáveis demográficas e comportamentais para identificar segmentos-chave e ajustar as ações de marketing de forma mais estratégica.

4. Segmentação por Cluster

Foi aplicada uma técnica de clusterização para identificar grupos de clientes com perfis semelhantes. A segmentação considerou tempo de internet e gasto anual, visando auxiliar a empresa na personalização de estratégias de marketing.

A partir da análise dos dados utilizando o algoritmo de agrupamento K-Means, foi possível identificar três grupos distintos de clientes com base em duas variáveis-chave: tempo médio diário de acesso à internet e gasto anual. Essa segmentação revelou perfis comportamentais relevantes que podem orientar decisões estratégicas de marketing, vendas e relacionamento com o cliente.

O primeiro grupo é composto por clientes com baixo tempo de navegação e baixo gasto anual, indicando um perfil menos engajado digitalmente e com menor propensão ao consumo. Esses clientes foram apelidados de “desconectados econômicos” e estão representados no gráfico pelas bolinhas vermelhas. Trata-se de um grupo que pode demandar abordagens introdutórias, com ações educativas sobre os benefícios dos produtos e facilidades do canal digital, além de incentivos iniciais para estimular o consumo.

O segundo grupo, os “conectados regulares”, é formado por clientes com tempo de navegação e gasto anual em níveis intermediários. Representados no gráfico pelas bolinhas verdes, esses consumidores já demonstram um envolvimento mais consistente com o ambiente online, o que abre espaço para ações que visem aumentar seu ticket médio e frequência de compra. Estratégias como ofertas personalizadas, testes A/B de campanhas e programas de fidelização podem ser eficazes para explorar o potencial desse grupo e impulsionar sua conversão em clientes de maior valor.

O terceiro grupo, denominado “navegadores premium”, é composto por clientes altamente conectados, com os maiores tempos médios de acesso diário à internet e também os maiores níveis de gasto anual. Representados no gráfico pelas bolinhas azuis, esses consumidores devem ser priorizados em ações de retenção, com foco em experiências exclusivas, campanhas altamente personalizadas e programas de relacionamento que visem prolongar seu ciclo de vida e maximizar o valor gerado para a empresa.

Essa segmentação oferece uma base sólida para a implementação de estratégias direcionadas e mais eficazes, promovendo uma melhor alocação de recursos, aumento da assertividade nas ações de marketing e, consequentemente, maior retorno sobre o investimento. A partir dessas informações, a empresa pode estruturar planos de ação distintos para cada perfil, garantindo que as necessidades específicas de cada grupo sejam atendidas de forma estratégica e orientada por dados.

5. Conclusão

A análise exploratória e segmentação dos dados permitiram uma compreensão aprofundada do perfil e do comportamento dos clientes, revelando padrões valiosos para a tomada de decisão. Fatores como gênero, forma de pagamento, navegador utilizado, tempo médio de acesso à internet e comportamento de consumo foram examinados sob diferentes perspectivas estatísticas e visuais, permitindo identificar oportunidades estratégicas de atuação.

Constatou-se, por exemplo, a predominância do público feminino tanto em número quanto em gasto médio anual, indicando a importância de direcionar campanhas e soluções especialmente adaptadas a esse segmento. Observou-se também que, apesar do pagamento à vista ser mais frequente, os clientes que optam por parcelar tendem a gastar mais — um insight relevante para a criação de campanhas que incentivem o parcelamento como forma de elevar o ticket médio.

A análise do tempo de navegação reforçou a ideia de que os clientes mais conectados também apresentam maiores níveis de gasto, ainda que a diferença entre as faixas de tempo não seja estatisticamente confirmada neste momento. Além disso, os resultados do clustering proporcionaram uma segmentação clara e estratégica da base de clientes, oferecendo caminhos distintos de atuação para cada grupo identificado.

Com base nesses achados, recomenda-se que a empresa adote uma abordagem de marketing orientada por dados, com segmentações bem definidas, testes A/B para validação de hipóteses e personalização das ações de acordo com o perfil de cada cliente. A partir da inteligência gerada, é possível não apenas melhorar a experiência do consumidor, mas também otimizar os recursos da organização, aumentar a eficácia das campanhas e, sobretudo, impulsionar o desempenho comercial e o crescimento sustentável da empresa.