Relatório Laboratorio Supervisionado

Adriano, Fernanda e Maria

Published

November 7, 2023

Objetivo

O objetivo deste estudo é analisar os atendimentos ocorridos no ano de 2016, buscando compreender os problemas geraram 80% das reclamações recebidas. Além disso, é de grande interesse avaliar as relações entre a taxa e o tempo de resolução dos problemas recebidos, assim como compreender o perfil das empresas, dos consumidores e dos assuntos envolvidos, juntamente com características que favorecem a resolução das reclamações.

Descrição dos dados

O banco de dados original contem 23 variáveis. São elas:

  • AnoCalendario: Representa o ano do calendário em que o atendimento foi registrado.

  • DataArquivamento: Indica a data em que o atendimento foi arquivado.

  • DataAbertura: Refere-se à data de abertura do atendimento.

  • CodigoRegiao: É o código que identifica a região geográfica relacionada ao atendimento.

  • Regiao: Denota a região geográfica onde o atendimento foi registrado.

  • UF: Representa a Unidade da Federação relacionada ao atendimento.

  • strRazaoSocial: Corresponde à razão social da empresa ou instituição envolvida no atendimento.

  • strNomeFantasia: É o nome fantasia da empresa ou instituição envolvida no atendimento.

  • Tipo: Indica o tipo de atendimento realizado.

  • NumeroCNPJ: É o número do Cadastro Nacional de Pessoa Jurídica (CNPJ) relacionado à empresa.

  • RadicalCNPJ: Refere-se ao radical do CNPJ da empresa.

  • RazaoSocialRFB: Representa a razão social da empresa segundo a Receita Federal do Brasil (RFB).

  • NomeFantasiaRFB: Corresponde ao nome fantasia da empresa segundo a Receita Federal do Brasil (RFB).

  • CNAEPrincipal: Indica o Código Nacional de Atividade Econômica (CNAE) principal da empresa.

  • DescCNAEPrincipal: Descreve a atividade econômica principal da empresa.

  • Atendida: Informa se a reclamação foi atendida ou não (Sim ou Não).

  • CodigoAssunto: É o código que identifica o assunto relacionado ao atendimento.

  • DescricaoAssunto: Descreve o assunto do atendimento.

  • CodigoProblema: Representa o código relacionado ao problema registrado no atendimento.

  • DescricaoProblema: Descreve o problema registrado no atendimento.

  • SexoConsumidor: Indica o sexo do consumidor (Feminino ou Masculino).

  • FaixaEtariaConsumidor: Denota a faixa etária do consumidor.

  • CEPConsumidor: Refere-se ao Código de Endereçamento Postal (CEP) do consumidor envolvido no atendimento.

Breve Resumo dos nossos dados

[1] 162047

Para conseguir analisar o tempo de cada atendimento, foi necessário converter as variáveis data_arquivamento e data_abertura para o tempo em que a solicitação se manteve em aberto. Com isso, tem-se a criação de uma nova variável chamada dias_arquivados. Como o objetivo é compreender os problemas geraram 80% das reclamações recebidas, o banco de dados original foi filtrado

---
1problemas <- reclam %>% group_by(descricao_problema ) %>% summarise(n = n()) %>%  arrange(-n) %>%
2  mutate(freq_ac = cumsum(n)) %>% mutate(freq_rel = freq_ac/nrow(reclam),
                                         prob_freq = ifelse(freq_ac < 0.8*nrow(reclam), "sim", "nao"))
3reclam <- left_join(reclam, problemas, by = "descricao_problema")
reclam <- reclam %>% filter(prob_freq=="sim"
---
1
Para acharmos 80% dos problemas, filtramos como uma tabela de frequência, começando dos maiores problemas
2
Criamos variáveis para frequência relativa e acumulada e depois classificamos quais problemas eram até 80% da frequência relativa acumulada e qual não era
3
Juntamos tudo com left_join e filtramos.

Metodologia

Exploramos mais a estatística descritiva e manipulação de dados para responder as perguntas do relatório, uma vez que a análise foi decidida por interpretação de diversos gráficos e análises efetuadas, portanto em todo nosso trabalho usamos ferramentas do dplyr, ggplot2 e diversos outros pacotes para representação e análise exploratória, além disso, optamos por usar a escala log nos gráficos para uma melhor visualização.

Resultados Obtidos

Análise descritiva

Figure 1: Taxa de resolução por região,O gráfico (Número de casos atendidos por região) mostra que quantidade de problemas atendidos é alta em todas as regiões, com exceção da região Sudeste. É possível perceber que as regiões Nordeste e Sudeste são as que possuem o maior número de reclamações e, dentre essas, o Nordeste é a que melhor consegue atender a esses registros.

Figure 2: o gráfico (Dias até atendimento) indica que a região Centro-Oeste é a que demora mais tempo para atender a uma solicitação.

Figure 3: Ao se tratar do sexo, as mulheres são as que mais registram ocorrências.

Figure 4: Os sexos apresentam quantidade de dias semelhantes para atendimento

Figure 5: O gráfico (Número de casos atendidos por sexo) indica que para as faixas etárias de até 20 anos e acima de 70 anos, as solicitações são mais atendidas. É possível perceber que os consumidores de faixa etária entre 31 a 40 anos são os que mais registram ocorrências

Figure 6: Consumidores com idade não informada são os que mais apresentam dispersão com relação a quantidade de dias até o atendimento.

Figure 7: Com relação aos casos atendidos por Estado, é possível observar através do gráfico (Número de casos atendidos por Estado) que Bahia, Distrito Federal, Paraná, Rio Grande do Sul, São Paulo e Tocantins não conseguiram atender a pelo menos 50% das solicitações recebidas. Por outro lado, estados como Amazonas, Mato Grosso, Santa Catarina, Pará e Maranhão conseguiram atender a pelo menos 80%. É interessante ressaltar que os estados com maiores ocorrências registras foram Ceará, Pernambuco e São Paulo

Figure 8: Quando se trata da quantidade de dias até o atendimento, o Rio de Janeiro e Rondônia são os que atendem as ocorrências mais rápido, enquanto o Piauí e o Distrito Federal são os que atendem mais devagar.

Ranking das empresas

Através do pacote fmsb, conseguimos mostrar de uma boa forma o ranking das imagens, sendo que usamos os seguintes critérios: Número de reclamações, Média de dias, taxa de resolução e Número de estados.

Abaixo, temos as top 20 melhores empresas segundo nosso critério escolhido

top1 top1

Agora, temos as top 20 piores empresas segundo nosso critério escolhido

top1 top1

Assuntos e Perfil das Empresas que Recebem Reclamações

As empresas que mais recebem reclamações são aquelas ligadas ao serviço de telefonia, tanto fixa quanto celular, sendo responsável pela maior parte das ocorrências solicitadas. Em seguida, tem-se as empresas de cartão de crédito, televisão por assinatura, produtos de informática, energia elétrica.

Figure 9: Perfil das empresas que recebem reclamações

Figure 10: Perfil das empresas que recebem reclamações

Figure 11: Perfil das empresas que recebem reclamações

Problemas que Constam nas Reclamações

A título de curiosidade, e informação, colocamos as principais palavras que constam nos problemas, através do pacote wordcloud.

Em relação aos gráficos, semelhante a análise anterior, abaixo tempos alguns gráficos para mostrar os problemas das empresas.

Figure 12: problemas das empresas

Figure 13: problemas das empresas

Figure 14: problemas das empresas

características que favorecem a resolução do problema

Para entendermos o que caracteriza a resolução, escolhemos algumas variáveis para verificar como elas se comportam em relação a as taxas de soluções do problema, abaixo temos a visualização de gráficos chamados de diagramas de acordes, que exibem essa relação

Figure 15: Possíveis características que favorecem resolução do problema

Figure 16: Possíveis características que favorecem resolução do problema

Figure 17: Possíveis características que favorecem resolução do problema

Figure 18: Possíveis características que favorecem resolução do problema

características que reduzem o tempo de solução do problema

Fizemos a análise da mesma forma acima, porém agora com base ao tempo do problema.

Figure 19: Possíveis características que reduzem o tempo do problema

Figure 20: Possíveis características que reduzem o tempo do problema

Figure 21: Possíveis características que reduzem o tempo do problema

Figure 22: Possíveis características que reduzem o tempo do problema

características que aumentam a incidência de reclamações

Por último, temos os diagramas de acordes para a incidência de reclamações, mostrando as possíveis características que podem aumentar as reclamações.

Figure 23: Possíveis características que aumentam a incidência de reclamações

Figure 24: Possíveis características que aumentam a incidência de reclamações

Figure 25: Possíveis características que aumentam a incidência de reclamações

Figure 26: Possíveis características que aumentam a incidência de reclamações

Figure 27: Possíveis características que aumentam a incidência de reclamações

Conclusão

Ao analisar os dados do Procon, pudemos identificar padrões e tendências significativas. As empresas do setor de telefonia, cartões de crédito e televisão por assinatura destacam-se como as mais propensas a receberem reclamações. No entanto, é crucial ressaltar que a interpretação desses resultados é altamente dependente das necessidades e expectativas individuais do cliente.

A resolução eficiente dos problemas parece correlacionar-se com fatores como a abrangência geográfica das empresas, média de dias até o arquivamento e a diversidade de assuntos tratados. Entender essas características pode orientar estratégias para aprimorar a eficácia no tratamento das reclamações.

Quanto à duração do processo de resolução, observamos que a média de dias até o arquivamento pode ser influenciada por diferentes variáveis, como a taxa de resolução e a natureza da empresa, destacando a importância de considerar múltiplos aspectos na análise.

Ao explorar as características que podem aumentar a incidência de reclamações, percebemos que fatores como a taxa de resolução, a diversidade de assuntos tratados e a abrangência geográfica podem desempenhar um papel significativo.

Em resumo, a interpretação dos resultados é uma tarefa subjetiva e pode variar com base nos objetivos específicos do cliente

Referências

  1. Wickham, H. (2016). ggplot2: Elegant Graphics for Data Analysis. Springer.
  2. R Core Team (2022). R: A language and environment for statistical computing. R Foundation for Statistical Computing.
  3. Quarto. Disponível em: https://quarto.org/
  4. Chen, H. (2020). Wordcloud2: Create Word Cloud by ‘htmlwidget’. R package version 0.2.1.