1) Banco de dados

a) Número de linhas e colunas:

## [1] 500
## [1] 12

Temos 500 linhas e 12 colunas nesse banco de dados.


b) Quais variáveis são qualitativas e quais são quantitativas?

## [1] "Idade"                      "Tempo_no_Plano_meses"      
## [3] "Nota_Atendimento_0a10"      "Nota_Rede_Credenciada_0a10"
## [5] "Tempo_Espera_min"           "Reclamacoes_ultimos_12m"

Variáveis quantitativas.

## [1] "Respondente_ID"          "Sexo"                   
## [3] "Cidade"                  "Tipo_Plano"             
## [5] "Canal_Contato_Preferido" "Indicaria_o_Plano"

Variáveis qualitativas.


c) Quais são as categorias (níveis) das variáveis qualitativas?

Canal_Contato_Preferido: App, E-mail, Presencial, Telefone e WhatsApp.

Cidade: Ananindeua, Belém, Benevides, Castanhal, Marituba e Outros(PA).

Indicaria_o_Plano: Sim e Não.

Respondente_ID: Quaitativa ordinal numerada de 1 a 500

Sexo: Feminino, Masculino, Não Binário e Não Informado.

Tipo_Plano: Coletivo por adesão, Empresarial, Familiar, Individual e Não Informado.


2) Limpeza e preparação

a) Identificar valores ausentes e informar em quais variáveis ocorrem.

Variáveis com valores ausentes
##             Respondente_ID                      Idade 
##                          0                          0 
##                       Sexo                     Cidade 
##                          1                          0 
##                 Tipo_Plano       Tempo_no_Plano_meses 
##                          1                          1 
##      Nota_Atendimento_0a10 Nota_Rede_Credenciada_0a10 
##                          0                          0 
##           Tempo_Espera_min    Reclamacoes_ultimos_12m 
##                          0                          0 
##    Canal_Contato_Preferido          Indicaria_o_Plano 
##                          0                          0
Temos valores ausentes nas variáveis
  • Sexo
  • Tipo_Plano
  • Tempo_no_Plano_meses


b) Definir e justificar como tratar omissões

Todos os valores omissos admitiremos como NA para levarmos em consideração todas as linhas e suas informações no banco de dados.

df[df ==""] <- NA


3) Análise descritiva (quantitativas)

a) Médias

## [1] "Idade: 38.23"
## [1] "Nota de atendimento de 0 a 10: 7.35"
## [1] "Tempo de espera (em minutos): 28.29"
## [1] "Reclamações nos últimos 12 meses: 0.61"


b) Medianas

## [1] "Idade: 38"
## [1] "Nota do atendimento: 7.35"
## [1] "Tempo de espera: 25"
## [1] "Reclamações nos últimos 12 meses: 0"


c) Modas

## [1] "Idade: 39"
## [1] "Nota de atendimento: 10"
## [1] "Tempo de espera (min): 16"
## [1] "Reclamações nos últimos 12 meses: 0"


d) Variâncias

## [1] "Idade: 130.48"
## [1] "Nota de Atendimento: 2.35"
## [1] "Tempo de Espera (min): 297.86"
## [1] "Reclamações nos últimos 12 meses: 0.57"


e) Desvios

## [1] "Idade: 11.42"
## [1] "Nota do Atendimento: 1.53"
## [1] "Tempo de Espera (min): 17.26"
## [1] "Reclamações nos Últimos 12 meses: 0.76"


f) Coeficientes de Variação

## [1] "Idade: 29.88"
## [1] "Nota do Atendimento: 20.85"
## [1] "Tempo de espera (min): 61.01"
## [1] "Reclamações nos Últimos 12 meses: 124.34"


Obs: Todos os valores que admitem muitas casas decimais foram arredondadas para apenas duas.


g) Assimetrias e Curtoses

## [1] "Assimetria Idade: 0.33"
## [1] "Curtose Idade: 2.9"
## [1] "Assimetria Nota do Atendimento: -0.26"
## [1] "Curtose Nota do Atendimento: 2.74"
## [1] "Assimetria Tempo de Espera (min): 2.39"
## [1] "Curtose Tempo de Espera: 13.23"
## [1] "Assimetria Reclamações nos Últimos 12 meses: 1.12"
## [1] "Curtose Reclamações nos Últimos 12 meses: 3.75"


h) Quartis

## [1] "18" "30" "38" "46" "80"
Idade


## [1] "2.6"  "6.4"  "7.35" "8.4"  "10"
Nota do Atendimento


## [1] "5"     "17"    "25"    "34.25" "149"
Tempo de Espera (min)


## [1] "0" "0" "0" "1" "3"
Reclamações nos Últimos 12 meses


i) Gráficos


Para a Variável Idade :


Para a Variável Nota_Atendimento_0a10 :


Para a Variável Tempo_Espera_min :


Para a Variável Reclamacoes_ultimos_12m :


4) Análise descritiva (qualitativas)


Para a Variável Sexo :

##                   Sexo Frequencia_Absoluta Frequencia_Relativa Percentual
## 1             Feminino                 243               0.486       48.6
## 2            Masculino                 239               0.478       47.8
## 3          Não binário                   5               0.010        1.0
## 4 Prefere não informar                  12               0.024        2.4
## 5                 <NA>                   1               0.002        0.2


Para a Variável Cidade :

##        Cidade Frequencia_Absoluta Frequencia_Relativa Percentual
## 1  Ananindeua                 175               0.350       35.0
## 2       Belém                 115               0.230       23.0
## 3   Benevides                  34               0.068        6.8
## 4   Castanhal                  43               0.086        8.6
## 5    Marituba                  79               0.158       15.8
## 6 Outros (PA)                  54               0.108       10.8


Para a Variável Tipo_Plano :

##            Tipo_Plano Frequencia_Absoluta Frequencia_Relativa Percentual
## 1 Coletivo por adesão                  70               0.140       14.0
## 2         Empresarial                 135               0.270       27.0
## 3            Familiar                 166               0.332       33.2
## 4          Individual                 128               0.256       25.6
## 5                <NA>                   1               0.002        0.2


5) Variável resposta: Indicaria_o_Plano


a) Tabela de frequência de Sim/Não

## 
## Não Sim 
## 198 302


b) Cruzamentos com 2 variáveis: Sexo e Indicaria_o_Plano

##                       
##                        Não Sim
##   Feminino              90 153
##   Masculino            101 138
##   Não binário            1   4
##   Prefere não informar   6   6


c) Gráfico comparativo entre as variáveis



6) Conclusão

5 a 10 linhas com os principais achados.

É perceptível como o público possui majoritariamente entre 37 e 43 anos o sexo feminino é superior em quantidade aos demais, o plano familiar é o mais adquirido, porém é o menos indicado, enquanto que o mais indicado é o plano individual. Vimos também que a chance de alguém do sexo não-binário indicar seu plano é maior do que a dos demais e 35% dos entrevistados pertenciam à cidade de Ananindeua, contudo, os planos são mais indicados em outras cidades do Pará. O contato preferido é o presencial, sendo esse o com maior chance de indicação entre os outros canais/contatos.