Analise do banco de dados: satisfação plano saude

Informações do dataframe

## tibble [500 × 12] (S3: tbl_df/tbl/data.frame)
##  $ correspondente            : chr [1:500] "R0001" "R0002" "R0003" "R0004" ...
##  $ Idade                     : num [1:500] 44 36 46 56 35 35 57 47 32 45 ...
##  $ Sexo...3                  : chr [1:500] "Masculino" "Masculino" "Feminino" "Prefere não informar" ...
##  $ Cidade                    : chr [1:500] "Castanhal" "Ananindeua" "Castanhal" "Ananindeua" ...
##  $ Tipo_Plano                : chr [1:500] "Familiar" "Familiar" "Empresarial" "Familiar" ...
##  $ Tempo_no_Plano_meses      : chr [1:500] "91.0" "26.0" "65.0" "24.0" ...
##  $ Nota_Atendimento_0a10     : num [1:500] 7.3 7.5 8.8 3.8 6.4 7.7 9.3 6.6 4.4 8.4 ...
##  $ Nota_Rede_Credenciada_0a10: num [1:500] 6.8 7.7 5.5 9.2 8.8 8 6.8 8 5.8 8.5 ...
##  $ Tempo_Espera_min          : num [1:500] 89 11 50 47 15 44 30 22 16 17 ...
##  $ Reclamacoes_ultimos_12m   : num [1:500] 1 0 1 1 2 0 0 0 2 1 ...
##  $ Canal_Contato_Preferido   : chr [1:500] "Telefone" "Telefone" "App" "WhatsApp" ...
##  $ Sexo...12                 : chr [1:500] "Não" "Sim" "Não" "Sim" ...
  • Origem: Tem infomações ficcionais sobre uma pesquisa de planos de saúde e a satisfação dos clientes de cada palno, informando seu genêro,idade,cidade,plano e satisfação. Usado para fazer analizes de dados simulando situaçõe reais.

  • Dimensões: Há 500 respostas e 12 variáveis, 500 linhas e 12 colunas.

  • As variáveis são: respondente, idade, sexo, cidade, tipo plano, tempo no plano em meses, nota do atendimento 0 a 10, tempo espera minutos, recalmações dos últimos 1 a 2 meses, canal de contado preferido, indicaria o plano, .

  • Variáveis qualitativas: tipo de plano, respondente, sexo, cidade, canal de contado preferido, Indicaria o Plano, tempo no plano em meses.

    • Ordinais: respondente,
    • Nominais: sexo,cidade, canal de contado preferido, indicaria_o_Plano, tipo de plano, tempo no plano em meses.
  • Variáveis quantitativas: idade, nota de atendimento de 0 à 10 ,tempo no plano em meses, tempo de espera em minutos, recalmações nos últimos 2 meses.

    • Discreta: idade,tempo no plano em meses,tempo de espera em minutos,recalmações nos últimos 2 meses
    • Continua: nota de atendimento de 0 à 10

Tratamento de valores omissos

(NA)será o valor usado ,este vai ser lido como valor nulo, possibilitando a análise de dados sem erros de contagem.

  • Variáveis com valores ausentes
    • sexo
    • tipo_plano
    • tempo_no_plano_meses
  • Definição de tratamento dos dados
    • Sexo: para essa variável qualitativa será usado (NA),
    • Tipo_plano: para essa variável qualitativa será usado (NA)
    • tempo_no_plano_meses: para essa variável será usado (NA)

Análise descritiva (quantitativas)

Serão utilizados as variáveis(idade; Nota de atendimento de o a 10; Tempo de Espera em min; Nota da Rede Credenciada 0 a 10)

Análise da variável idade

  • Média Arredondando a média para duas casas decimais(38,22)
## [1] 38.228
  • Mediana valor da media é o mesmo da média(38)
## [1] 38
  • Moda A moda é (42), a mais pessoas com essa idade
## [1] 42
  • Valor Mínimo e máximo

valor mínimo: 18

valor máximo: 80

## [1] 18
## [1] 80
  • Variância

O valor da variânça arredondado para uma casa é de (130,5)

## [1] 130.477
  • Desvio padrão

O valor arrendondado para uma casa decimal é (11.4)

## [1] 11.42265
  • Coeficiente de variação

O valor em porcentagem com arredondamento para duas casas decimais é(29,88)

## [1] 29.88033
  • Quartis / boxplot

Menor valor: 18

Mediana: 38

Valor máximo: 80

  • Histograma

Análise da variável nota da rede credeênciada de 0 a 10

  • Média

Valor da média arredondada para zero casas decimais é(7)

## [1] 7.0058
  • Mediana

Valor da mediana é (7,35)

## [1] 7.1
  • Valor Mínimo e máximo

Valor mínimo:2 Valor máximo:10

## [1] 2
## [1] 10
  • Variança

Valor da Variânça arredandado para duas casas decimais é (3,02)

## [1] 3.02175
  • Desvio padrão

valor da Desvio padrão arredondado para duas casas decimais é (1.74)

## [1] 1.738318
  • Coeficiente de variação

valor do coeficiente de variação arredondado para duas casas decimsi é (24,81)

## [1] 24.81256
  • Quartis / boxplot

Valor mímimo: 2

Mediana: 7,35

Valor máximo: 10

  • histograma

Análise da variável nota de atendimento de 0 a 10

  • Média

VAlor da média arredondado para duas casas decimais é(7,35)

## [1] 7.3488
  • Mediana

Valor da mediana é (7,35)

## [1] 7.35
  • Valor Mínimo e máximo

Valor mínimo: 2,6

Valor máximo: 10

## [1] 2.6
## [1] 10
  • Variânça

Valor da variânça arredondado para duas casas decimais é (2,35)

## [1] 2.348476
  • Desvio padrão

Valor do desveio padrão arredondado para duas casas decimais é (1,53)

## [1] 1.532474
  • Coeficiente de variação

Valor do coeficiente de variação arredondado para duas casas decimais é (20,85)

## [1] 20.85339
  • Quartis / boxplot

Valor mímimo: 2,6

Mediana: 7,35

Valor máximo: 10

  • histograma

Análise da variável tempo de espera em minutos

  • Média

Valor da média arredondado para duas casas decimais(28,29)

## [1] 28.288
  • Mediana

valor da mediana é (25)

## [1] 25
  • Valor Mínimo e máximo

Valor mínimo: 5

Valor máximo: 149

## [1] 5
## [1] 149
  • Variânça Valor da variânça arredondado para duas casas decimais é (297,86)
## [1] 297.8608
  • Desvio padrão

valor do desvio padrão arredondado para duas casas decimais é (17,26)

## [1] 17.25864
  • Coeficiente de variação

valor do coeficiente de Variação arredondado para duas casas decimais é (20,85)

## [1] 20.85339
  • Quartis / boxplot

Valor mímimo: 5

Mediana: 25

Valor máximo: 149

  • Histograma

Análise descritiva (qualitativas)

Serão utilizados as variáveis(Sexo, Cidade, Canal de Contato de Preferido)

Análise da variável sexo

  • Tabela de frequência

Tabela de frequência absoluta

## 
##             Feminino            Masculino                   NA 
##                  243                  239                    1 
##          Não binário Prefere não informar 
##                    5                   12

Tabela de frequecia relativa

## 
##             Feminino            Masculino                   NA 
##                 48.6                 47.8                  0.2 
##          Não binário Prefere não informar 
##                  1.0                  2.4
  • Gráfico de barras

Análise da variável cidade

  • Tabela de Frequência

Frequência absoluta

## 
##  Ananindeua       Belém   Benevides   Castanhal    Marituba Outros (PA) 
##         175         115          34          43          79          54

Frequência relativa

## 
##  Ananindeua       Belém   Benevides   Castanhal    Marituba Outros (PA) 
##        35.0        23.0         6.8         8.6        15.8        10.8
  • Gráfico de barras

Análise da variável Canal de Contato de Preferido

  • Tabela de frequência

Frequência absoluta

## 
##        App     E-mail Presencial   Telefone   WhatsApp 
##        168         24         48        145        115

Frequência relativa

## 
##        App     E-mail Presencial   Telefone   WhatsApp 
##       33.6        4.8        9.6       29.0       23.0
  • Gráfico de barras

Análise da variável indicaria o plano

  • Tabela de Frequência

Frequência absoluta

## 
## Não Sim 
## 198 302

Frequência relativa d

## 
##  Não  Sim 
## 39.6 60.4

Frequência relativa com duas variáveis

n4 <- table(dados$Sexo...12, dados$Tempo_Espera_min )
f4 <- 100*prop.table(n4)
f4
##      
##         5   6   7   8   9  10  11  12  13  14  15  16  17  18  19  20  21  22
##   Não 0.0 0.0 0.4 1.0 0.2 0.2 0.8 1.0 0.2 1.2 1.0 1.4 1.0 0.6 1.2 2.4 1.6 1.0
##   Sim 0.2 0.2 0.2 1.6 1.6 0.8 1.8 1.8 2.2 1.6 1.8 3.0 2.2 2.8 1.2 1.6 1.4 1.8
##      
##        23  24  25  26  27  28  29  30  31  32  33  34  35  36  37  38  39  40
##   Não 1.4 0.8 1.0 0.8 1.2 2.4 0.6 1.4 1.2 1.2 0.6 1.0 0.8 0.2 0.4 0.4 0.8 0.4
##   Sim 2.6 1.8 2.0 1.2 1.0 1.2 1.8 2.0 1.2 1.2 1.2 1.2 1.0 0.4 1.0 1.6 0.4 1.0
##      
##        41  42  43  44  45  46  47  48  49  50  51  52  53  54  55  56  58  60
##   Não 0.4 0.8 0.0 0.2 0.4 0.4 0.0 0.6 0.2 0.2 0.6 0.2 0.2 0.2 0.4 0.0 0.0 0.2
##   Sim 0.2 0.6 1.0 0.8 0.6 0.0 0.4 0.6 0.6 0.6 0.4 0.0 0.2 0.0 0.2 0.4 0.2 0.0
##      
##        61  62  63  64  69  71  72  76  77  82  83  84  89  98 118 142 149
##   Não 0.4 0.0 0.2 0.0 0.2 0.2 0.2 0.2 0.2 0.2 0.2 0.2 0.2 0.2 0.0 0.0 0.2
##   Sim 0.0 0.6 0.2 0.2 0.0 0.2 0.0 0.0 0.2 0.0 0.0 0.0 0.2 0.0 0.2 0.2 0.0
  • Gráfico de barras agrupadas

Conclusão

A variável indicaria o plano tem fortes correlações com a experiência e satisfação com o usuário, nota-se isso quando compara está variavel com a nota de atendimento de 0 a 10, as maiores notas desta variável apresentam uma grande quantidade de sim na variável(indicaria o plano). Nesse contexto, também observa-se que indicaria o plano tem correlação com o tempo de espera em minutos, quanto menos tempo de espera maior quantidade de sim, o inverso também é verdade com maior taxa de não com mais tempo de espera. Outro ponto, a variável nota de rede credenciada apresenta o maior peso relacionado a variável(indicaria o plano), pois essa avalia a instituição de saúde por completo, assim interferindo, na maior parte, dos dados das outras variáveis.

  • referências

fonte 1: https://rpubs.com/dennisoncarvalho/est_comp

fonte 2: https://www.rpubs.com/davimat/histograma_ggplot2#

fonte 3: https://www.youtube.com/watch?v=7sp06kkdn3M

fonte 4: https://r-graph-gallery.com/stacked-barplot.html