[1] 162047
Relatório Laboratorio Supervisionado
Adriano, Fernanda e Maria
Objetivo
O objetivo deste estudo é analisar os atendimentos ocorridos no ano de 2016, buscando compreender os problemas geraram 80% das reclamações recebidas. Além disso, é de grande interesse avaliar as relações entre a taxa e o tempo de resolução dos problemas recebidos, assim como compreender o perfil das empresas, dos consumidores e dos assuntos envolvidos, juntamente com características que favorecem a resolução das reclamações.
Descrição dos dados
O banco de dados original contem 23 variáveis. São elas:
AnoCalendario: Representa o ano do calendário em que o atendimento foi registrado.
DataArquivamento: Indica a data em que o atendimento foi arquivado.
DataAbertura: Refere-se à data de abertura do atendimento.
CodigoRegiao: É o código que identifica a região geográfica relacionada ao atendimento.
Regiao: Denota a região geográfica onde o atendimento foi registrado.
UF: Representa a Unidade da Federação relacionada ao atendimento.
strRazaoSocial: Corresponde à razão social da empresa ou instituição envolvida no atendimento.
strNomeFantasia: É o nome fantasia da empresa ou instituição envolvida no atendimento.
Tipo: Indica o tipo de atendimento realizado.
NumeroCNPJ: É o número do Cadastro Nacional de Pessoa Jurídica (CNPJ) relacionado à empresa.
RadicalCNPJ: Refere-se ao radical do CNPJ da empresa.
RazaoSocialRFB: Representa a razão social da empresa segundo a Receita Federal do Brasil (RFB).
NomeFantasiaRFB: Corresponde ao nome fantasia da empresa segundo a Receita Federal do Brasil (RFB).
CNAEPrincipal: Indica o Código Nacional de Atividade Econômica (CNAE) principal da empresa.
DescCNAEPrincipal: Descreve a atividade econômica principal da empresa.
Atendida: Informa se a reclamação foi atendida ou não (Sim ou Não).
CodigoAssunto: É o código que identifica o assunto relacionado ao atendimento.
DescricaoAssunto: Descreve o assunto do atendimento.
CodigoProblema: Representa o código relacionado ao problema registrado no atendimento.
DescricaoProblema: Descreve o problema registrado no atendimento.
SexoConsumidor: Indica o sexo do consumidor (Feminino ou Masculino).
FaixaEtariaConsumidor: Denota a faixa etária do consumidor.
CEPConsumidor: Refere-se ao Código de Endereçamento Postal (CEP) do consumidor envolvido no atendimento.
Breve Resumo dos nossos dados
Para conseguir analisar o tempo de cada atendimento, foi necessário converter as variáveis data_arquivamento e data_abertura para o tempo em que a solicitação se manteve em aberto. Com isso, tem-se a criação de uma nova variável chamada dias_arquivados. Como o objetivo é compreender os problemas geraram 80% das reclamações recebidas, o banco de dados original foi filtrado
---
1problemas <- reclam %>% group_by(descricao_problema ) %>% summarise(n = n()) %>% arrange(-n) %>%
2 mutate(freq_ac = cumsum(n)) %>% mutate(freq_rel = freq_ac/nrow(reclam),
prob_freq = ifelse(freq_ac < 0.8*nrow(reclam), "sim", "nao"))
3reclam <- left_join(reclam, problemas, by = "descricao_problema")
reclam <- reclam %>% filter(prob_freq=="sim"
---- 1
- Para acharmos 80% dos problemas, filtramos como uma tabela de frequência, começando dos maiores problemas
- 2
- Criamos variáveis para frequência relativa e acumulada e depois classificamos quais problemas eram até 80% da frequência relativa acumulada e qual não era
- 3
-
Juntamos tudo com
left_joine filtramos.
Metodologia
Exploramos mais a estatística descritiva e manipulação de dados para responder as perguntas do relatório, uma vez que a análise foi decidida por interpretação de diversos gráficos e análises efetuadas, portanto em todo nosso trabalho usamos ferramentas do dplyr, ggplot2 e diversos outros pacotes para representação e análise exploratória, além disso, optamos por usar a escala log nos gráficos para uma melhor visualização.
Resultados Obtidos
Análise descritiva
Ranking das empresas
Através do pacote fmsb, conseguimos mostrar de uma boa forma o ranking das imagens, sendo que usamos os seguintes critérios: Número de reclamações, Média de dias, taxa de resolução e Número de estados.
Abaixo, temos as top 20 melhores empresas segundo nosso critério escolhido
Agora, temos as top 20 piores empresas segundo nosso critério escolhido
Assuntos e Perfil das Empresas que Recebem Reclamações
As empresas que mais recebem reclamações são aquelas ligadas ao serviço de telefonia, tanto fixa quanto celular, sendo responsável pela maior parte das ocorrências solicitadas. Em seguida, tem-se as empresas de cartão de crédito, televisão por assinatura, produtos de informática, energia elétrica.
Problemas que Constam nas Reclamações
A título de curiosidade, e informação, colocamos as principais palavras que constam nos problemas, através do pacote wordcloud.
Em relação aos gráficos, semelhante a análise anterior, abaixo tempos alguns gráficos para mostrar os problemas das empresas.
características que favorecem a resolução do problema
Para entendermos o que caracteriza a resolução, escolhemos algumas variáveis para verificar como elas se comportam em relação a as taxas de soluções do problema, abaixo temos a visualização de gráficos chamados de diagramas de acordes, que exibem essa relação
características que reduzem o tempo de solução do problema
Fizemos a análise da mesma forma acima, porém agora com base ao tempo do problema.
características que aumentam a incidência de reclamações
Por último, temos os diagramas de acordes para a incidência de reclamações, mostrando as possíveis características que podem aumentar as reclamações.
Conclusão
Ao analisar os dados do Procon, pudemos identificar padrões e tendências significativas. As empresas do setor de telefonia, cartões de crédito e televisão por assinatura destacam-se como as mais propensas a receberem reclamações. No entanto, é crucial ressaltar que a interpretação desses resultados é altamente dependente das necessidades e expectativas individuais do cliente.
A resolução eficiente dos problemas parece correlacionar-se com fatores como a abrangência geográfica das empresas, média de dias até o arquivamento e a diversidade de assuntos tratados. Entender essas características pode orientar estratégias para aprimorar a eficácia no tratamento das reclamações.
Quanto à duração do processo de resolução, observamos que a média de dias até o arquivamento pode ser influenciada por diferentes variáveis, como a taxa de resolução e a natureza da empresa, destacando a importância de considerar múltiplos aspectos na análise.
Ao explorar as características que podem aumentar a incidência de reclamações, percebemos que fatores como a taxa de resolução, a diversidade de assuntos tratados e a abrangência geográfica podem desempenhar um papel significativo.
Em resumo, a interpretação dos resultados é uma tarefa subjetiva e pode variar com base nos objetivos específicos do cliente
Referências
- Wickham, H. (2016). ggplot2: Elegant Graphics for Data Analysis. Springer.
- R Core Team (2022). R: A language and environment for statistical computing. R Foundation for Statistical Computing.
- Quarto. Disponível em: https://quarto.org/
- Chen, H. (2020). Wordcloud2: Create Word Cloud by ‘htmlwidget’. R package version 0.2.1.