Análise de dados preliminar

Detalhamento do método de análise

O relatório tem como objetivo principal, identificar, se houver, as correlações entre o gosto musical de um indivíduo e a sua saúde mental. O estudo se trata de uma análise da preferência musical e do hábito de escutar música de indivíduos de diferentes idades, e do efeito que tal escolha de gênero musical tem em sua saúde mental, para as seguintes hipóteses:

As horas por dia ouvindo música afetam a saúde mental.
Existe uma relação entre idade e quantas horas os participantes ouvem música por dia.
A idade se compara ao efeito da música na saúde mental.
O gênero musical favorito afeta a saúde mental.
Existe uma relação da quantidade de horas de música ouvidas por dia com a doença mental.

A base de dados usada no presente relatório foi retirada do site “Kaggle”, ela foi coletada e gerenciada por Catherine Rasgaitis (@catherinerasgaitis) estudante da Universidade de Washington em Seattle, Estados Unidos, por meio de um formulário do Google. Os entrevistados não foram restritos por idade ou localização. O formulário foi postado em vários fóruns do Reddit, servidores do Discord e plataformas de mídia social. Cartazes e “cartões de visita” também foram usados para divulgar o formulário em bibliotecas, parques e outros locais públicos. A base de dados é distribuída em 33 variáveis, contendo 736 informações, que corresponde a cada participante da pesquisa no total.

As informações abaixo constitui o dicionário de dados, onde mostramos as variáveis e o que cada uma delas significa.

Timestamp: carimbo de data/hora
Age: idade
Primary streaming services: serviços de streaming primários
Hours per day: horas por dia
While working: enquanto trabalha
Instrumentalist: instrumentista
Composer: compositor
Fav genre: gênero favorito
Exploratory: exploratório
Foreign languages: Línguas estrangeiras
BPM
Frequency: Frequência - cada frequência possui um gênero musical (clássica, country, EDM, folk, gospel, hip hop, jazz, k-pop, latin, lofi, metal, pop, r&b, rap, rock e música de videogame.
Anxiety: ansiedade
Depression: depressão
Insomnia: insônia
OCD: TOC
Music effects: efeitos musicais
Permissions: permissões

As variáveis de interesse utilizadas no referido estudo são: Idade, Horas de música ouvidas por dia, Efeito da música, Ansiedade, Depressão, Insônia, TOC e Gênero musical. Também serão realizados testes de hipóteses (Shapiro-Wilk, Ad test, Kruskal test e Spearman) para as variáveis escolhidas para estudo, onde testamos suas normalidades e se seus resultados interferem ou não entre si. Bem como tabelas, gráficos de barra, boxplots, diagramas de dispersão e histogramas.

Base de dados usada para estudo:

library(readr)
mmhsr <- read_csv("C:/Users/natps/Downloads/archive.zip")
head(mmhsr)

## # A tibble: 6 x 33
##   Timest~1   Age Prima~2 Hours~3 While~4 Instr~5 Compo~6 Fav g~7 Explo~8 Forei~9
##   <chr>    <dbl> <chr>     <dbl> <chr>   <chr>   <chr>   <chr>   <chr>   <chr>  
## 1 8/27/20~    18 Spotify     3   Yes     Yes     Yes     Latin   Yes     Yes    
## 2 8/27/20~    63 Pandora     1.5 Yes     No      No      Rock    Yes     No     
## 3 8/27/20~    18 Spotify     4   No      No      No      Video ~ No      Yes    
## 4 8/27/20~    61 YouTub~     2.5 Yes     No      Yes     Jazz    Yes     Yes    
## 5 8/27/20~    18 Spotify     4   Yes     No      No      R&B     Yes     No     
## 6 8/27/20~    18 Spotify     5   Yes     Yes     Yes     Jazz    Yes     Yes    
## # ... with 23 more variables: BPM <dbl>, `Frequency [Classical]` <chr>,
## #   `Frequency [Country]` <chr>, `Frequency [EDM]` <chr>,
## #   `Frequency [Folk]` <chr>, `Frequency [Gospel]` <chr>,
## #   `Frequency [Hip hop]` <chr>, `Frequency [Jazz]` <chr>,
## #   `Frequency [K pop]` <chr>, `Frequency [Latin]` <chr>,
## #   `Frequency [Lofi]` <chr>, `Frequency [Metal]` <chr>,
## #   `Frequency [Pop]` <chr>, `Frequency [R&B]` <chr>, ...

Análise de dados preliminar

Letícia Mendonça, Natália Simões e Thaisa Sales

26/01/2023

Detalhamento do método de análise