Trabalho Final

Questão 01

Letra A:

O banco apresenta 15 variáveis, sendo elas: Categoria, Região, Grupo, Ano Modelo, Sexo Condutor, Faixa Etária, IS Média (R\(), Expostos, Prémio Médio(R\)), Freq. Incêndio e Roubo, Indeniz. Incêndio e Roubo (R\(), Freq. Colisão, Indeniz. Colisão (R\)), Freq. Outras, Indeniz. Outras (R$).A variável Região irá apresentar de qual região brasileira foi feito tal estudo de caso, dada pelo estado em que se realizou o estudo (sigla - - nome completo). “Sexo Condutor” irá apresentar o sexo do condutor em questão (escrito por extenso) e “Faixa Etária” uma faixa que inclui sua idade(em número). “IS Média” irá se referir à Importância segurada média, dada em reais, que é o valor médio do automóvel que está sendo segurado.”Expostos” refere-se ao número de unidades seguradas que estão sujeitas ao risco de um sinistro, ouseja, pode ser o número de veículos segurados em uma determinada apólice ou pela seguradora em um período específico. “Freq. Incêndio e Roubo” apresentará a frequência absoluta de incêndio e roubo ocorrido naquele estado, ou seja, o número total de incêndios e roubos acontecidos, e “Indeniz. Incêndio e Roubo” refere-se aos valores totais pagos para indenizar tais acontecimentos, em reais. O mesmo raciocínio segue para “Freq. Colisão” e “Indeniz. Colisão”, porém agora tratando da quantidade de colisões ocorridas e o valor para indenizar tal caso.

Letra B:

Existem valores faltantes. Eles são 3 e estão nas variáveis “Categoria”, “Região” e “Grupo”. Temos 6162 valores totais não-faltantes no data frame e 3 valores faltantes, ou seja, aproximadamente 0,05% do total dos valores são faltantes.

Questão 02

Letra A:

A partir da análise dos dados, entendemos que, dos 33.783.156 acidentes, no sexo feminino, temos um total de acidentes de 17.019.629, enquanto no sexo masculino temos 16.763.527, ou seja, há menos acidentes ocorrentes no sexo masculino ao feminino, de forma que, o sexo feminino é responsável por entorno de 50,40% dos acidentes, enquanto o sexo masculino é responsável por 49,60% deles (isso tratando de valores absolutos e individualizados). Agora, analisando os acidentes em relação ao número de expostos de cada sexo (50.264.455 para o feminino - 48,24% do total - e 53.933.466 para o masculino - 51,76% do total), temos que, no sexo feminino, a frequência de acidentes analisada pelo número de expostos é de 0,339, enquanto no masculino ela é de 0,311, ou seja, acontecem mais acidentes por expostos quando trata-se do sexo feminino.

Letra B:

A partir da análise gráfica e dos dados, entendemos que existe apenas 1 indíviduo na faixa etária entre 18 e 25 anos, e, nas outras 5 faixas estabelecidas, o número se mostra igual para todas (82 indivíduos em todas as faixas), o que nos faz pensar que pessoas com mais de 25 são as mais tendenciosas a utilizarem serviço de seguro, e pessoas com menos de 25 anos não se mostram interessadas em tal produto.

Letra C:

Já na parte das Regiões, percebemos novamente uma distribuição uniforme entre os parâmetros dessa variável, visto que possuem exatamente 10 indivíduos em todas as regiões estudadas (e 1 valor faltante). Podemos perceber uma correlação entra a variável Região e a variável IS Média (R$) negativa, menor que 0 e maior que -1, o que nos indica que, à medida que o IS Médio aumenta, a categoria da região tende a diminuir.

Letra D:

Fazendo a análise dos dados, chegamos à conclusão de que a Indenização é exatamente a mesma para todas as regiões (mesmos valores totais e médios) e esse padrão se repete quando estudado para as faixas etárias, atingindo um valor total de indenização de 154.040.740.359,00 reais.

Letra E:

Após análise de dados, fomos capazes de apresentar que, o Sexo Condutor Masculino na Faixa Etária entre 18 e 25 anos é o conjunto sexo + faixa etária que tem maior valor de prêmio médio, com um valor média prêmio de 1.437.

Letra F:

Realizando um estudo de todos os sinitros e calculando a soma total de cada tipo, chegamos a conclusão que estão registrados 2.025.260 acidentes por incêndio e roubo, 14.793.032 acidentes por colisão e 50.748.020 acidentes por outras causas, ou seja, o tipo de sinistro mais frequente é “outras causas”.

Extras:

Querendo saber qual IS Média é maior dado uma comparação entre Sexo do Condutor e Faixa Etária, encontramos que a pessoa do Sexo Condutor Feminino e na faixa etária entre 36 e 45 anos possui maior IS média, chegando a um valor de 34.639,00 reais.

Querendo saber qual tipo de indenização movimenta mais dinheiro, fizemos um estudo acerca de todas as indenizações e os valores gastos com cada uma delas e chegamos à conclusão de que a indenização por incêndio e roubo movimentou 42.300.092.211,00 reais, a indenização por colisão movimentou 90.236.413.166,00 reais e a indenização por outras causas movimentou 21.504.234.982,00 reais. Portanto, a idenização que mais gerou/gastou dinheiro foi a indenização por colisão.

Querendo saber qual região acumula mais exposto, fizemos uma análise das duas variáveis em conjunto e chegamos à conclusão que a região Metropolitana de São Paulo é a que mais acumulou expostos, chegando a um total de 20.006.453 expostos.