• Resumo
  • 1. Introdução
  • 2. Objetivos
  • 3. Metodologia
    • Bases de dados
    • Renomeando variáveis
    • União dos dados
    • Transformando “-” em 0
    • Teste de hipótese
  • 4. Resultados e Discussões
    • Teste de Wilcoxon (Mann-Whitney)
    • Média e desvio padrão
    • Boxplot
  • 5. Conclusão
  • Referências Bibliográficas

Resumo

Esta atividade teve como objetivo analisar bases de dados do Anuário Estatístico de Acidentes do Trabalho, sendo divulgada pelo Ministério da Previdência Social e o Ministério do Trabalho e Emprego. A metodologia utilizada consistiu de uma análise das taxas de acidentes e doenças ocupacionais (variáveis quantitativas) em relação aos anos de 2018 e 2019 (variáveis qualitativas) por meio de tabelas das médias e desvio padrão, teste de hipótese e boxplot para saber se houve um crescimento das taxa entre os anos.

1. Introdução

Acidente de trabalho é definido segundo a Associação Brasileira de Normas Técnicas (ABNT) , como ocorrência imprevista e indesejável, instantânea ou não, relacionada com o exercício do trabalho, de que resulte ou possa resultar em lesão corporal. Sendo assim, toda ocupação tem risco de diferentes proporções, que podem colocar em risco a vida ou afastamento total de suas ocupações. Levando em consideração que há riscos de acidentes nos trabalhos, faz-se necessário criar medidas que atendam a duas vertentes do acidente de trabalho, a primeira de caráter jurídico-institucional e a segunda técnico-científico. A primeira vertente fundamenta-se no risco social em que os trabalhadores estão expostos e defende que o seguro de acidente de trabalho seja uma garantia. A segunda vertente foi desenvolvida pela engenharia de segurança, apresenta um caráter técnico-científico para mitigar os riscos dos acidentes e é a base para a teoria do risco profissional, segundo a qual o empregador deve se responsabilizar pelo pagamento de indenização em caso de acidente ou contraia alguma enfermidade no local de trabalho. Segundo Machado e Gomes (1999), as causas dos acidentes são classificadas em duas categorias, as de fatores pessoais e as de condições do ambiente de trabalho, a primeira é atribuída ao trabalhador e a última é atribuída à responsabilidade ao empregador. Diante do exposto, pode-se afirmar que a construção civil está repleta de processos construtivos que colocam os colaboradores em risco de acidentes. Levando em consideração que apesar de muitas tecnologias desenvolvidas na área, muitos processos ainda são realizados manualmente, o que a torna muito arcaica em relação aos dias atuais. Os acidentes e as doenças do trabalho causam um grande impacto sobre a produtividade de forma geral e na economia, além de transtornos e dificuldades pessoais para as pessoas envolvidas nos mesmos. No entanto, os acidentes de trabalho podem ser evitados, quando existe a participação dos trabalhadores e empregadores por meio da equipe de profissionais da segurança do trabalho. É de suma importância um ambiente laboral sadio, que assegure condições mínimas para o devido exercício da função, garantindo ao trabalhador saúde física e mental para que o mesmo possa ter uma boa qualidade de vida e saúde e assim ser mais produtivo, trazendo benefícios para todos os envolvidos na atividade. Acidentes de trabalho são uma das principais causas de afastamento de trabalhadores do campo produtivo e um importante problema de saúde pública no Brasil e no mundo (SANTANA et al., 2003).

2. Objetivos

O objetivo do estudo desenvolvido foi comparar taxas relacionadadas a acidentes de trabalho e doenças ocupacionais entre os anos de 2018 e 2019, sendo possível através das mesmas analisar se houve um aumento no campo dos acidentes e das doenças.

3. Metodologia

Para este projeto, foram utilizadas 3 bases dados do Anuário Estatístico de Acidentes do Trabalho (AEAT), nela contém informações sobre as taxas de acidentes de trabalho e doenças ocupacionais dos anos de 2018 e 2019 e tal base é divulgada pelo Ministério da Previdência Social e o Ministério do Trabalho e Emprego.Então para iniciar, foi realizada a importação do banco de dados para o RStudio. Em seguida, as variáveis da primeira base (AcidCNAE) foram renomeadas e como foram importadas mais de uma base, foi necessário unir todas através de filtros, antes de começar os testes e análises. Logo abaixo, está disponibilizada a tabela final com todos os dados filtrados.

Bases de dados

# Carregando as bases de dados
library(readxl)
AcidCNAE <- read_excel("AcidCNAE.xlsx", 
                       col_types = c("text", "skip", "numeric", 
                                     "numeric", "numeric", "numeric", 
                                     "numeric", "numeric", "numeric"))
library(readxl)
Dicionario_AcidentesCNAE <- read_excel("Dicionario-AcidentesCNAE.xlsx")

library(readxl)
CNAE_atividade_economica <- read_excel("CNAE-atividade_economica.xlsx")

library(readxl)
Dados_2018 <- read_excel("Dados_2018.xlsx", skip = 5)

library(readxl)
Dados_2019 <- read_excel("Dados_2019.xlsx", skip = 5)

Renomeando variáveis

names(AcidCNAE)
## [1] "CNAE"                      "Incidencia \r\n"          
## [3] "Doenca_Ocupacional"        "\r\nAcidentes_Típicos"    
## [5] "Incapacidade\r\n"          "Mortalidade"              
## [7] "Letalidade"                "Acidentalidade_16-34 anos"
colnames(AcidCNAE) <- c("CNAE","Incidencia","Doenca_Ocupacional",
                  "Acidentes_tipicos","Incapacidade","Mortalidade","Letalidade",
                                "Acidentes_16_a_34anos")

names(AcidCNAE)
## [1] "CNAE"                  "Incidencia"            "Doenca_Ocupacional"   
## [4] "Acidentes_tipicos"     "Incapacidade"          "Mortalidade"          
## [7] "Letalidade"            "Acidentes_16_a_34anos"

União dos dados

colnames(Dados_2018)[1] <- "CNAE"
colnames(Dados_2018)[1]
## [1] "CNAE"
library(dplyr)

AcidCNAE_com_Dados_2018<- AcidCNAE %>% left_join(Dados_2018)
colnames(AcidCNAE_com_Dados_2018)<-c("CNAE","Artesanal_Industrial","Incidencia","Doenca_Ocupacional","Acidentes_tipicos","Incapacidade","Mortalidade","Letalidade","Acidentes_16_a_34anos",                               "Incidencia_18","Doencas_Ocupacionais_18","Acidentes_tipicos_18","Incapacidade_Temporaria_18","Taxa_Mortalidade_18","Taxa_Letalidade_18","Acidentes_entre_16_34_anos_18")



AcidCNAE_com_Dados_2018$Doencas_Ocupacionais_18<-gsub("-",NA,AcidCNAE_com_Dados_2018$Doencas_Ocupacionais_18)
AcidCNAE_com_Dados_2018$Doencas_Ocupacionais_18<-as.numeric(AcidCNAE_com_Dados_2018$Doencas_Ocupacionais_18)
summary(AcidCNAE_com_Dados_2018$Doencas_Ocupacionais_18)                                                           
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##    2.05    6.48   13.59   13.21   16.78   55.23      31
AcidCNAE_com_Dados_2018$Taxa_Mortalidade_18 <-gsub("-",NA,AcidCNAE_com_Dados_2018$Taxa_Mortalidade_18)
AcidCNAE_com_Dados_2018$Taxa_Mortalidade_18<-as.numeric(AcidCNAE_com_Dados_2018$Taxa_Mortalidade_18)
summary(AcidCNAE_com_Dados_2018$Taxa_Mortalidade_18)                                                           
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##   1.490   4.150   6.400   8.839  11.410  32.790      41
AcidCNAE_com_Dados_2018$Taxa_Letalidade_18 <-gsub("-",NA,AcidCNAE_com_Dados_2018$Taxa_Letalidade_18)
AcidCNAE_com_Dados_2018$Taxa_Letalidade_18<-as.numeric(AcidCNAE_com_Dados_2018$Taxa_Letalidade_18)
summary(AcidCNAE_com_Dados_2018$Taxa_Letalidade_18)                                                           
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##   29.03   41.96   50.41   48.16   54.17   60.08      31
colnames(Dados_2019)[1] <- "CNAE"
colnames(Dados_2019)[1]
## [1] "CNAE"
AcidCNAE_com_Dados_2019<- AcidCNAE %>% left_join(Dados_2019)

colnames(AcidCNAE_com_Dados_2019)<-c("CNAE","Artesanal_Industrial","Incidencia","Doenca_Ocupacional","Acidentes_tipicos","Incapacidade","Mortalidade","Letalidade","Acidentes_16_a_34anos","Incidencia_19","Doencas_Ocupacionais_19","Acidentes_tipicos_19","Incapacidade_Temporaria_19","Taxa_Mortalidade_19","Taxa_Letalidade_19","Acidentes_entre_16_34_anos_19")

AcidCNAE_com_Dados_2019$Doencas_Ocupacionais_19<-gsub("-",NA,AcidCNAE_com_Dados_2019$Doencas_Ocupacionais_19)
AcidCNAE_com_Dados_2019Doencas_Ocupacionais_19<-as.numeric(AcidCNAE_com_Dados_2019$Doencas_Ocupacionais_19)
summary(AcidCNAE_com_Dados_2019$Doencas_Ocupacionais_19)                                                           
##    Length     Class      Mode 
##        76 character character
AcidCNAE_com_Dados_2019$Taxa_Mortalidade_19 <-gsub("-",NA,AcidCNAE_com_Dados_2019$Taxa_Mortalidade_19)
AcidCNAE_com_Dados_2019$Taxa_Mortalidade_19<-as.numeric(AcidCNAE_com_Dados_2019$Taxa_Mortalidade_19)
summary(AcidCNAE_com_Dados_2019$Taxa_Mortalidade_19)                                                           
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##    1.16    2.63    5.31   14.60   10.81  197.25      42
AcidCNAE_com_Dados_2019$Taxa_Letalidade_19 <-gsub("-",NA,AcidCNAE_com_Dados_2019$Taxa_Letalidade_19)
AcidCNAE_com_Dados_2019$Taxa_Letalidade_19<-as.numeric(AcidCNAE_com_Dados_2019$Taxa_Letalidade_19)
summary(AcidCNAE_com_Dados_2019$Taxa_Letalidade_19)      
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##   29.52   40.52   48.94   48.06   55.81   62.84      31
nomes <- c("CNAE", "Incidencia","Doencas_Ocupacionais","Acidentes_tipicos", "Incapacidade_Temporaria","Taxa_Mortalidade","Taxa_Letalidade","Acidentes_entre_16_34_anos")

colnames(Dados_2018) <-nomes
colnames(Dados_2019) <-nomes

Dados_2018$ano <- 2018
Dados_2019$ano <- 2019

dados_por_ano<- bind_rows(Dados_2018,Dados_2019)

dados_por_ano<- dados_por_ano %>% filter(CNAE!="TOTAL")
  
library(kableExtra)
kable(dados_por_ano, row.names = FALSE)%>%
  kable_styling( full_width = T,bootstrap_options = c("striped", "hover", "condensed", "responsive"), 
                 position = "center", fixed_thead = T) %>%
  scroll_box(width = "900px", height = "600px")
CNAE Incidencia Doencas_Ocupacionais Acidentes_tipicos Incapacidade_Temporaria Taxa_Mortalidade Taxa_Letalidade Acidentes_entre_16_34_anos ano
0111 5.46 0.04 4.82 5.40 6.11 11.19 38.93 2018
0112 11.37
10.04 11.06 23.36 20.55 54.79 2018
0113 15.51 0.07 13.13 13.37 13.70 8.84 39.81 2018
0114 11.07
7.12 10.28
39.29 2018
0115 10.95 0.02 9.34 10.68 9.09 8.30 49.10 2018
0116 3.45 0.07 2.59 3.38
39.58 2018
0119 8.35 0.10 6.79 7.35 6.17 7.39 51.97 2018
0121 6.14 0.03 4.20 5.88 19.70 32.09 49.20 2018
0122 4.89 0.06 3.70 4.67 5.69 11.63 54.65 2018
0131 14.74 0.09 12.94 12.31 7.41 5.03 45.60 2018
0132 25.76 0.08 21.57 24.80 35.89 13.93 38.54 2018
0133 11.72 0.13 9.13 10.60 6.26 5.34 54.17 2018
0134 5.04 0.01 4.48 4.87 4.08 8.10 44.13 2018
0135 4.26 0.13 3.38 4.01
52.94 2018
0139 21.14
17.64 14.22 37.53 17.75 58.58 2018
0141 114.01 1.00 100.61 110.78 122.29 10.73 40.32 2018
0142 13.26
10.23 12.56
47.37 2018
0151 4.73 0.04 4.16 4.41 5.55 11.73 41.58 2018
0152 5.93
5.42 5.68
36.96 2018
0153 3.86
3.38 3.86
37.50 2018
0154 10.60 0.33 8.34 9.97 3.71 3.50 46.15 2018
0155 12.23 0.07 9.24 10.69 6.18 5.05 51.26 2018
0159 2.92
2.05 2.92
55.00 2018
0161 8.15 0.08 6.72 6.88 10.19 12.50 41.96 2018
0162 7.98 0.03 6.48 7.74 5.97 7.49 46.07 2018
0163 10.14
6.52 8.83 10.04 9.90 62.38 2018
0210 17.73 0.15 14.14 15.23 13.17 7.43 44.94 2018
0220 8.76 0.14 5.88 8.90 28.71 32.79 36.07 2018
0230 18.77 0.21 14.64 13.07 12.05 6.42 46.55 2018
0311 4.41 0.14 2.85 3.98
29.03 2018
0312 1.70
1.70 1.70
2018
0321 11.88
9.22 11.41 15.63 13.16 43.42 2018
0322 16.50
14.26 15.86 32.03 19.42 51.46 2018
0500 48.74 0.55 38.61 43.27 27.38 5.62 43.82 2018
0600 20.56 0.54 16.22 7.42 4.47 2.17 32.83 2018
0710 12.74 0.55 8.93 5.51 8.16 6.40 45.12 2018
0721 11.63
9.36 6.07
34.78 2018
0722 25.97
21.25 13.38
36.36 2018
0723 14.27 0.79 7.93 9.51
33.33 2018
0724 23.25 0.86 18.45 10.87 28.61 12.31 53.54 2018
0725 19.20
15.36 11.52
10.00 2018
0729 19.85 0.09 14.57 7.28 18.21 9.17 50.46 2018
0810 19.55 0.24 15.01 18.41 27.20 13.91 37.04 2018
0891 18.23 0.38 14.05 15.00 18.99 10.42 40.63 2018
0892 22.43
14.58 21.31
49.00 2018
0893 30.58 1.80 24.29 23.39
35.29 2018
0899 14.60 0.58 12.05 11.59 11.59 7.94 37.30 2018
0910 23.90 1.24 18.72 6.61 4.59 1.92 38.20 2018
0990 10.88 0.40 7.25 8.86
40.74 2018
1011 67.78 1.45 55.23 37.66 15.95 2.35 60.08 2018
1012 40.17 2.11 30.63 22.81 6.00 1.49 59.70 2018
1013 35.59 0.53 28.10 24.70 6.26 1.76 50.81 2018
1020 24.01 0.15 15.49 22.97 4.95 2.06 53.20 2018
1031 13.31 0.08 9.09 12.07 8.27 6.21 53.11 2018
1032 20.06 0.11 16.11 18.74 10.96 5.46 52.46 2018
1033 20.18 0.15 14.78 16.82 15.29 7.58 51.77 2018
1041 34.85 0.09 23.53 28.63
51.54 2018
1042 19.14 0.12 12.99 14.62 11.60 6.06 56.97 2018
1043 36.42
22.90 22.90
47.42 2018
1051 20.57
15.59 18.91
56.49 2018
1052 23.24 0.23 16.78 19.38 14.02 6.03 55.26 2018
1053 10.40 0.17 6.67 9.78 4.14 3.98 58.17 2018
1061 20.32 0.23 13.59 20.04 46.71 22.99 46.90 2018
1062 26.10 0.38 18.66 23.81 11.27 4.32 53.09 2018
1063 25.69 0.50 18.95 25.44 49.88 19.42 47.57 2018
1064 12.38 0.36 7.33 11.66
46.60 2018
1065 24.38
18.64 16.73
57.84 2018
1066 24.86 0.16 18.66 21.71 17.23 6.93 54.68 2018
1069 28.99 0.10 21.74 26.64
53.45 2018
1071 25.24 0.12 21.19 17.47 8.70 3.45 47.16 2018
1072 31.44 0.22 26.82 30.78
34.27 2018
1081 12.84 0.18 7.50 11.88 6.00 4.67 56.54 2018
1082 47.55
38.98 41.98
42.34 2018
1091 9.93 0.19 6.26 9.50 2.60 2.62 56.24 2018
1092 16.61 0.39 10.60 13.58
50.41 2018
1093 23.41 0.65 17.19 17.44 12.43 5.31 53.65 2018
0111 6.89 0.09 5.96 6.83 15.03 21.82 36.55 2019
0112 13.03
11.96 11.73
59.06 2019
0113 15.77 0.07 13.48 13.51 5.26 3.34 40.52 2019
0114 11.20
7.62 10.31 44.80 40.00 44.00 2019
0115 11.77 0.09 10.17 11.41 18.00 15.29 47.03 2019
0116 2.15
1.57 2.15
38.46 2019
0119 8.16 0.02 6.50 7.78 2.10 2.58 42.78 2019
0121 7.96 0.16 5.92 7.80 23.03 28.93 58.68 2019
0122 6.26 0.06 5.46 5.57
48.62 2019
0131 16.56 0.11 14.64 13.96 8.89 5.37 42.53 2019
0132 25.76 0.04 22.22 24.72 19.19 7.45 44.41 2019
0133 10.84 0.01 8.98 9.75 1.25 1.16 52.95 2019
0134 4.89
4.38 4.76
36.53 2019
0135 5.19
3.99 5.19
25.64 2019
0139 21.32 0.09 17.92 13.20 4.41 2.07 57.97 2019
0141 120.01 1.07 108.39 117.66 214.21 17.85 38.46 2019
0142 19.10 0.67 14.83 17.76 22.48 11.76 44.71 2019
0151 4.62 0.03 4.04 4.39 3.36 7.26 45.76 2019
0152 5.82
4.43 5.57
39.13 2019
0153 4.03
3.53 4.03
37.50 2019
0154 10.52 0.29 8.31 9.31 3.68 3.50 46.50 2019
0155 12.29 0.25 9.34 9.75 5.05 4.11 49.34 2019
0159 3.55
2.84 3.27
52.00 2019
0161 9.28 0.08 7.74 7.54 5.76 6.21 41.30 2019
0162 7.26 0.13 6.00 6.98 9.52 13.10 43.23 2019
0163 13.66
9.17 12.75 9.17 6.71 52.35 2019
0210 15.38 0.06 12.34 13.49 13.78 8.96 45.42 2019
0220 11.99 0.14 8.81 11.41 72.20 60.24 34.94 2019
0230 15.74 0.20 12.31 10.88 14.63 9.29 49.07 2019
0311 6.09
3.48 5.80
38.10 2019
0312 1.77
1.77 1.77
2019
0321 15.36
9.75 15.07
48.08 2019
0322 11.59
8.30 11.28 31.33 27.03 56.76 2019
0500 51.18 0.29 39.71 47.36 29.42 5.75 40.80 2019
0600 22.15 0.27 17.21 8.10 4.45 2.01 29.52 2019
0710 20.12 1.82 15.12 10.30 396.78 197.25 36.41 2019
0721 7.62
6.64 3.20
51.61 2019
0722 17.26
14.26 10.50
43.48 2019
0723 9.94
8.77 5.84 58.45 58.82 29.41 2019
0724 16.60 0.26 13.68 8.63 25.94 15.63 54.30 2019
0725 37.27
28.99 20.71
33.33 2019
0729 20.26 0.69 13.91 9.36 8.58 4.24 43.22 2019
0810 20.82 0.22 16.95 19.64 23.56 11.32 35.17 2019
0891 22.88
18.63 19.19 18.45 8.06 50.81 2019
0892 25.48
19.33 23.50 21.97 8.62 38.79 2019
0893 28.09
21.28 22.13
45.45 2019
0899 16.09 0.46 13.19 14.12 11.57 7.19 38.85 2019
0910 17.87 0.32 14.58 5.16
36.57 2019
0990 15.94
10.76 12.75
57.50 2019
1011 59.54 1.00 48.79 33.86 10.80 1.81 59.26 2019
1012 40.84 1.77 30.94 21.46 6.55 1.60 59.07 2019
1013 38.56 0.39 30.84 25.34 15.03 3.90 53.53 2019
1020 25.65 0.50 17.45 23.82
54.35 2019
1031 14.10 0.16 9.76 12.83 7.97 5.65 56.78 2019
1032 19.85 0.11 15.35 17.38
60.54 2019
1033 23.34 0.10 17.84 18.56 15.42 6.61 54.41 2019
1041 33.05 0.04 24.97 28.45 32.33 9.78 48.90 2019
1042 19.80
14.53 15.10
45.66 2019
1043 32.23
19.95 23.40 38.36 11.90 51.19 2019
1051 22.57 0.07 17.18 20.73 6.82 3.02 57.40 2019
1052 22.69 0.31 16.61 18.68 9.84 4.34 55.86 2019
1053 10.44 0.12 7.04 9.32
62.84 2019
1061 20.12
14.28 19.57 13.82 6.86 44.85 2019
1062 23.72 0.15 17.12 21.60 3.86 1.63 48.94 2019
1063 21.03 0.24 17.12 20.30 48.92 23.26 51.16 2019
1064 10.52 0.12 6.48 9.90 12.23 11.63 48.84 2019
1065 26.56
20.36 20.71 23.40 8.81 57.27 2019
1066 25.74 0.22 19.68 21.99 11.82 4.59 50.85 2019
1069 31.29
25.15 28.37 9.90 3.16 52.06 2019
1071 22.28 0.33 18.10 15.52 11.08 4.97 45.38 2019
1072 28.25
23.11 26.96 42.80 15.15 45.45 2019
1081 12.29 0.11 6.57 11.43 22.86 18.60 55.81 2019
1082 59.27
46.01 52.64
53.85 2019
1091 10.31 0.15 7.23 9.67 2.58 2.50 56.46 2019
1092 15.70 0.32 10.13 12.73 2.28 1.45 49.27 2019
1093 21.00 0.31 15.38 17.07 3.12 1.49 48.74 2019
library(DT)
DT::datatable(Dicionario_AcidentesCNAE, rownames = FALSE, colnames = FALSE)
library(DT)
DT::datatable(CNAE_atividade_economica, rownames = FALSE, colnames = FALSE)
remove(Dados_2018,Dados_2019,AcidCNAE)

Transformando “-” em 0

dados_por_ano$Doencas_Ocupacionais <-gsub("-",0,dados_por_ano$Doencas_Ocupacionais)
dados_por_ano$Doencas_Ocupacionais<-as.numeric(dados_por_ano$Doencas_Ocupacionais)
summary(dados_por_ano$Doencas_Ocupacionais)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##  0.0000  0.0000  0.0950  0.2251  0.2525  2.1100
dados_por_ano$Taxa_Mortalidade <-gsub("-",0,dados_por_ano$Taxa_Mortalidade)
dados_por_ano$Taxa_Mortalidade<-as.numeric(dados_por_ano$Taxa_Mortalidade)
summary(dados_por_ano$Taxa_Mortalidade)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    0.00    0.00    6.26   15.40   15.47  396.78
dados_por_ano$Taxa_Letalidade <-gsub("-",0,dados_por_ano$Taxa_Letalidade)
dados_por_ano$Taxa_Letalidade<-as.numeric(dados_por_ano$Taxa_Letalidade)
summary(dados_por_ano$Taxa_Letalidade)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   0.000   0.000   4.465   8.213   9.200 197.250
dados_por_ano$Acidentes_entre_16_34_anos <-gsub("-",0,dados_por_ano$Acidentes_entre_16_34_anos)
dados_por_ano$Acidentes_entre_16_34_anos<-as.numeric(dados_por_ano$Acidentes_entre_16_34_anos)
summary(dados_por_ano$Acidentes_entre_16_34_anos)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    0.00   40.19   47.27   46.24   53.47   62.84

Teste de hipótese

Quando os pressupostos (normalidade ou homogêneidade de variâncias) são violados, é comum procurar um método não-paramétrico (DUTT-ROSS,2020). Desta forma, o teste de hipótese escolhido foi o de Wilcoxon, também conhecido como teste de Mann-Whitney, sendo possível a sua realização, pois as variáveis quantitativas são dependentes e a variável qualitativa escolhida foi o ano, pois ela é independente e está disposta em dois grupos, ou seja, dois anos diferentes. Para o teste foi adotado o valor de alpha=0,05 e apresentado as seguintes hipóteses:

H0: os dois anos possuem distribuições idênticas.

H1: os dois anos possuem distribuições diferentes.

A regra de decisão também foi definida como:

Se p-valor ≤ alpha, rejeita H0.

Se p-valor > alpha, não rejeita H0.

4. Resultados e Discussões

Teste de Wilcoxon (Mann-Whitney)

Observou-se por meio do teste de Wilcoxon que todas as variáveis quantitativas analisadas apresentaram o p-valor maior do que o nível de significância de 0,05, logo deixa de rejeitar a hipótese nula e conclui-se que os dois anos possuem distribuições iguais.

teste<-wilcox.test(Incidencia~ano,data = dados_por_ano)
teste
## 
##  Wilcoxon rank sum test with continuity correction
## 
## data:  Incidencia by ano
## W = 2846.5, p-value = 0.8799
## alternative hypothesis: true location shift is not equal to 0
teste2 <- wilcox.test(Doencas_Ocupacionais~ano,data = dados_por_ano)
teste2
## 
##  Wilcoxon rank sum test with continuity correction
## 
## data:  Doencas_Ocupacionais by ano
## W = 3279, p-value = 0.144
## alternative hypothesis: true location shift is not equal to 0
teste3 <- wilcox.test(Acidentes_tipicos~ano,data = dados_por_ano)
teste3
## 
##  Wilcoxon rank sum test with continuity correction
## 
## data:  Acidentes_tipicos by ano
## W = 2807.5, p-value = 0.7681
## alternative hypothesis: true location shift is not equal to 0
teste4 <- wilcox.test(Incapacidade_Temporaria~ano,data = dados_por_ano)
teste4
## 
##  Wilcoxon rank sum test with continuity correction
## 
## data:  Incapacidade_Temporaria by ano
## W = 2812, p-value = 0.7808
## alternative hypothesis: true location shift is not equal to 0
teste5 <- wilcox.test(Taxa_Mortalidade~ano,data = dados_por_ano)
teste5
## 
##  Wilcoxon rank sum test with continuity correction
## 
## data:  Taxa_Mortalidade by ano
## W = 2677, p-value = 0.431
## alternative hypothesis: true location shift is not equal to 0
teste6 <- wilcox.test(Taxa_Letalidade~ano,data = dados_por_ano)
teste6
## 
##  Wilcoxon rank sum test with continuity correction
## 
## data:  Taxa_Letalidade by ano
## W = 2816, p-value = 0.7891
## alternative hypothesis: true location shift is not equal to 0
teste7 <- wilcox.test(Acidentes_entre_16_34_anos~ano,data = dados_por_ano)
teste7
## 
##  Wilcoxon rank sum test with continuity correction
## 
## data:  Acidentes_entre_16_34_anos by ano
## W = 2845, p-value = 0.8756
## alternative hypothesis: true location shift is not equal to 0

Média e desvio padrão

Outra forma de avaliar cada variável foi através das suas médias e desvios padrão dos anos de 2018 e 2019. A respeito da Incidência, Acidentes típicos, Incapacidade Temporária,Mortalidade e Letalidade foram comprovados que entre um ano e outro houve uns acréscimos. Porém na taxa de Doenças Ocupacionais teve um decréscimo e para os acidentes na faixa de 16 a 34 anos houve um aumento da média e o desvio padrão decresceu.

library(flextable)

# Incidência
dados_por_ano %>% group_by(ano) %>%
  summarise(media=mean(Incidencia),desvio_padrao=sd(Incidencia))%>%
  flextable()
# Doenças Ocupacionais
dados_por_ano %>% group_by(ano) %>%
  summarise(media=mean(Doencas_Ocupacionais),desvio_padrao=sd(Doencas_Ocupacionais))%>%
  flextable()
# Acidentes Típicos
dados_por_ano %>% group_by(ano) %>%
  summarise(media=mean(Acidentes_tipicos),desvio_padrao=sd(Acidentes_tipicos))%>%
  flextable()
# Incapacidade Temporária
dados_por_ano %>% group_by(ano) %>%
  summarise(media=mean(Incapacidade_Temporaria),desvio_padrao=sd(Incapacidade_Temporaria))%>%
  flextable()
# Mortalidade
dados_por_ano %>% group_by(ano) %>%
  summarise(media=mean(Taxa_Mortalidade),desvio_padrao=sd(Taxa_Mortalidade))%>%
  flextable()
# Letalidade
dados_por_ano %>% group_by(ano) %>%
  summarise(media=mean(Taxa_Letalidade),desvio_padrao=sd(Taxa_Letalidade))%>%
  flextable()
# Acidentes entre 16 e 34 anos
dados_por_ano %>% group_by(ano) %>%
  summarise(media=mean(Acidentes_entre_16_34_anos),
            desvio_padrao=sd(Acidentes_entre_16_34_anos))%>%
  flextable()

Boxplot

O boxplot ou diagrama de caixa é uma ferramenta gráfica que permite visualizar a distribuição e valores discrepantes (outliers) dos dados, fornecendo assim um meio complementar para desenvolver uma perspectiva sobre o caráter dos dados. Além disso, o boxplot também é uma disposição gráfica comparativa.

#Incidencia
boxplot(Incidencia~ano, data = dados_por_ano ,col = c("skyblue","tomato"),
     ylab = "Frequência", xlab = "Ano", ylim = c(0,70), 
     main="Incidência em cada ano ")

Na figura acima observamos o boxplot entre as variáveis frequência de incidentes e o ano ocorrido. Como podemos ver, ambos os gráficos apresentam informações semelhantes, com uma mediana indicando o resultado da incidência entre 10 e 20. O boxplot apresenta a presença de outliers.

#Doenças Ocupacionais
boxplot(Doencas_Ocupacionais~ano, data = dados_por_ano ,col = c("purple1","plum2"),
     ylab = "Frequência", xlab = "Ano", 
     main="Doenças Ocupacionais de cada ano ")

Análise do bloxplot evidencia que as doenças ocupacionais no ano de 2018 apresentam estatisticamente uma variabilidade de atividades maior comparado com as doenças ocupacionais ocorridas no ano de 2019.Há presença significativa de outliers.

#Acidentes típicos
boxplot(Acidentes_tipicos~ano, data = dados_por_ano ,col = c("springgreen","red"), ylim = c(0,50),
     ylab = "Frequência", xlab = "Ano", 
     main="Acidentes típicos em cada ano ")

Pode-se ver que nos anos de 2018 e 2019 apresentaram tendências semelhantes, com 2019 tendo a presença superio de outliers. Verificou-se também que a concentração no terceiro quartil de 2019 foi superior em relação ao ano de 2018.

#Incapacidade Temporária
boxplot(Incapacidade_Temporaria~ano, data = dados_por_ano ,col = c("peachpuff","palevioletred3"), ylim = c(0,60),
     ylab = "Frequência", xlab = "Ano", 
     main="Incapacidade Temporária em cada ano ")

A análise do boxplot evidencia que os dados estão mais espalhados no ano de 2019, tendo uma maior variabilidade, foi identificado também a presença de mais outliers no ano de 2018. É importante ressaltar que no quarto quartil do ano de 2018 verifica-se uma maior concentração comparado ao ano de 2019.

#Mortalidade
boxplot(Taxa_Mortalidade~ano, data = dados_por_ano ,col = c("yellow","royalblue"),ylab = "Frequência", xlab = "Ano",ylim = c(0,100),
     main="Mortalidade em cada ano ")

Com o boxplot podemos concluir, a mortalidade em 2019 apresenta maior variabilidade que a mortalidade no ano de 2018. Foi identificado uma maior concentração no segundo e terceiro quartis no ano de 2018 em relação ao ano de 2019.

#Letalidade
boxplot(Taxa_Letalidade~ano, data = dados_por_ano ,col = c("wheat","sandybrown"),ylab = "Frequência", xlab = "Ano", ylim = c(0,60),
     main="Letalidade em cada ano ")

Com o boxplot podemos concluir, a letalidade em 2019 apresenta maior variabilidade e maior presença de outliers que a letalidade no ano de 2018. Foi identificado que a mediana no ano de 2019 é um pouco menor do que a de 2018.

#Acidentes entre 16 e 34 anos
boxplot(Acidentes_entre_16_34_anos~ano, data = dados_por_ano ,col = c("rosybrown","seagreen"),ylab = "Frequência", xlab = "Ano", 
     main="Acidentes entre 16 e 34 anos em cada ano ")

Como podemos ver, ambos os gráficos apresentam informações semelhantes, com uma mediana indicando o resultado da incidência entre 40 e 50. Há menor concentração no primeiro quartil em 2019 em relação a 2018. Percebeu-se também a presença de outliers em todas os boxplots, dados estes que apresentam um alto desvio padrão e podem influenciar consideravelmente as interpretações de outros valores.

5. Conclusão

A partir dos resultados dos cálculos das médias e desvios padrão, pode-se concluir que na maioria das variáveis houve um aumento do ano de 2018 para 2019, entretanto nos testes de Wilcoxon foi visto que a hipótese nula não foi rejeitada, onde considera-se que os dois analisados possuem distribuições iguais. Através dos boxplots gerados, nota-se que tanto em 2018, como em 2019 tem a presença de dados que se diferenciam drasticamente de todos os outros, chamados também de outliers. Os gráficos do tipo Boxplot, o teste de hipótese e as tabelas de média e desvio padrão das variáveis de interesse aumenta a capacidade de compreensão do estudo e dos dados, pois eles são formas de visualização de dados e fornece as informações necessárias.

Referências Bibliográficas

ABNT (Associação Brasileira de Normas Técnicas), 2001. Cadastro de acidente do trabalho: procedimento e classificação, NBR 14280. Rio de Janeiro.

Anuário Estatístico de Acidentes do Trabalho. Disponível em: https://www.gov.br/previdencia/pt-br/assuntos/previdencia-social/saude-e-seguranca-do-trabalhador/dados-de-acidentes-do-trabalho. Acesso em: 04 ago 2021

Manual de Análise de Dados. Disponível em: https://livro.metodosquantitativos.com/docs/. Acesso em : 11 ago 2021.

Tribunal Superior de Justiça: Entenda os números. Disponível em: https://www.tst.jus.br/web/trabalhoseguro/entenda-os-numeros. Acesso em: 05 ago 2021.