Tipos de dados
Introdução
Nem toda informação em um conjunto de dados é do mesmo tipo. Algumas variáveis representam números, outras textos, datas ou categorias. No R, cada tipo de dado é tratado de forma diferente, e reconhecer essas diferenças é essencial para evitar erros e realizar análises corretamente.
Nesta aula, vamos trabalhar com um conjunto real de dados de terremotos disponibilizado pela United States Geological Survey (USGS). O arquivo contém informações como data e hora do evento, magnitude, profundidade, localização e outros atributos associados aos terremotos registrados. A partir dele, vamos identificar os principais tipos de dados em R e entender como eles influenciam nossas análises.
Embora dados recentes de terremotos possam ser baixados diretamente no site da USGS, para garantir que todos estejam trabalhando com o mesmo conjunto de dados, utilize a versão disponibilizada nesta página, previamente obtida no site da USGS com registros dos meses de Janeiro e Fevereiro.
Importando os dados
Primeiramente, vamos importar os dados, como aprendemos na aula passada:
Perceba que utilizamos a função head para visualizar apenas as primeiras linhas do nosso dataset. Isso é especialmente útil quando trabalhamos com tabelas longas e queremos ter uma ideia geral do seu conteúdo. Ao consultar a documentação da função, observamos que o número padrão de linhas exibidas é 6, mas podemos definir qualquer outro valor, se desejarmos:
Se quisermos ver as últimas linhas, podemos usar a função tail de maneira similar:
Tipos de dados
La la la