Relatório de Computação para Análise de Dados

Experimentando o R Markdown

Inicialmente trataremos da manipulação simples de dados. Neste relatório utilizaremos o dataset iris que traz informações sobre as medidas, em centímetros, de algumas variáveis referentes à Sépala e a Pétala de flores da espécie Iris.

Nesse contexto, iremos primeiro visualizar algumas linhas do dataset para conhecê-lo melhor.

head(iris)

##   Sepal.Length Sepal.Width Petal.Length Petal.Width Species
## 1          5.1         3.5          1.4         0.2  setosa
## 2          4.9         3.0          1.4         0.2  setosa
## 3          4.7         3.2          1.3         0.2  setosa
## 4          4.6         3.1          1.5         0.2  setosa
## 5          5.0         3.6          1.4         0.2  setosa
## 6          5.4         3.9          1.7         0.4  setosa

Mais abaixo iremos verificar a estrutura do dataset para entender como ele é constituído.

str(iris)

## 'data.frame':    150 obs. of  5 variables:
##  $ Sepal.Length: num  5.1 4.9 4.7 4.6 5 5.4 4.6 5 4.4 4.9 ...
##  $ Sepal.Width : num  3.5 3 3.2 3.1 3.6 3.9 3.4 3.4 2.9 3.1 ...
##  $ Petal.Length: num  1.4 1.4 1.3 1.5 1.4 1.7 1.4 1.5 1.4 1.5 ...
##  $ Petal.Width : num  0.2 0.2 0.2 0.2 0.2 0.4 0.3 0.2 0.2 0.1 ...
##  $ Species     : Factor w/ 3 levels "setosa","versicolor",..: 1 1 1 1 1 1 1 1 1 1 ...

Observamos que existem quatro colunas do tipo numeric e uma do tipo character. Além de que, na última coluna temos um fator com 3 níveis representando o nome das espécies.

Manipulação Simples

Existem algumas maneiras que podemos utilizar para tratar um dado. Nesta seção, iremos trabalhar essencialmente com a biblioteca dplyr. Dessa forma, ao executar o comando abaixo, poderemos usar suas funções.

# Caso não tenha a biblioteca instalada, executamos o comando abaixo
# install.packages("dplyr")

library("dplyr")

## 
## Attaching package: 'dplyr'

## The following objects are masked from 'package:stats':
## 
##     filter, lag

## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union

Com a biblioteca carregada, começamos o tratamento dos dados.

Filtro

De início, filtraremos a coluna Species para obter apenas as espécies versicolor e virginica.

iris <- iris %>% filter(Species == "versicolor" | Species == "virginica")

head(iris)

##   Sepal.Length Sepal.Width Petal.Length Petal.Width    Species
## 1          7.0         3.2          4.7         1.4 versicolor
## 2          6.4         3.2          4.5         1.5 versicolor
## 3          6.9         3.1          4.9         1.5 versicolor
## 4          5.5         2.3          4.0         1.3 versicolor
## 5          6.5         2.8          4.6         1.5 versicolor
## 6          5.7         2.8          4.5         1.3 versicolor

Ordenação

Com o dataset gerado partimos para a parte de ordenar. Percebemos que alguns valores do dataset não seguem uma ordem de ordenação (crescente ou decrescente). Nesse caso, iremos ordenar considerando a orientação decrescente dos valores seguindo a coluna Petal.Length.

iris <- iris %>% arrange(desc(Petal.Length))

head(iris)

##   Sepal.Length Sepal.Width Petal.Length Petal.Width   Species
## 1          7.7         2.6          6.9         2.3 virginica
## 2          7.7         3.8          6.7         2.2 virginica
## 3          7.7         2.8          6.7         2.0 virginica
## 4          7.6         3.0          6.6         2.1 virginica
## 5          7.9         3.8          6.4         2.0 virginica
## 6          7.3         2.9          6.3         1.8 virginica

Por fim, obtido o dataset final, verificamos o resumo estatístico de cada variável dele.

summary(iris)

##   Sepal.Length    Sepal.Width     Petal.Length    Petal.Width   
##  Min.   :4.900   Min.   :2.000   Min.   :3.000   Min.   :1.000  
##  1st Qu.:5.800   1st Qu.:2.700   1st Qu.:4.375   1st Qu.:1.300  
##  Median :6.300   Median :2.900   Median :4.900   Median :1.600  
##  Mean   :6.262   Mean   :2.872   Mean   :4.906   Mean   :1.676  
##  3rd Qu.:6.700   3rd Qu.:3.025   3rd Qu.:5.525   3rd Qu.:2.000  
##  Max.   :7.900   Max.   :3.800   Max.   :6.900   Max.   :2.500  
##        Species  
##  setosa    : 0  
##  versicolor:50  
##  virginica :50  
##                 
##                 
##

Tabela Interativa

Nesta seção, iremos trabalhar com o pacote DT para criarmos uma tabela intrativa. Dessa forma, ao executar o comando abaixo, poderemos instalar o pacote e usar suas funções.

# Caso não tenha a biblioteca instalada, executamos o comando abaixo
# install.packages("DT")

library("DT")

Agora que temos a biblioteca, utilizaremos o dataset iris gerado após o tratamento para dispor seus dados em uma nova tabela.

datatable(iris)

Equações em LaTeX

Nesta seção, focaremos no uso da sintaxe LaTeX. Abordaremos cinco equações matemáticas e traremos as suas explicações.

Equação 1

\[\begin{equation} \nabla \times \mathbf{E} = -\frac{\partial \mathbf{B}}{\partial t} \label{eq:maxwell-faraday} \end{equation}\]

Acima, temos a Equação de Maxwell-Faraday (Lei da Indução de Faraday). Esta equação afirma que a variação no fluxo de campo magnético através de materiais condutores induz o surgimento de uma corrente elétrica. Esse fenômeno foi escoberto em 1831. Krmpotic et al. (2022)

Equação 2

\[ \frac{\partial L}{\partial q_i} - \frac{d}{dt} \left( \frac{\partial L}{\partial \dot{q_i}} \right) = 0 \]

A segunda equação trata da equação de Euler-Lagrange. Esta é uma equação diferencial em que as soluções são funções nas quais uma dada função é estacionária. Em uma perspectiva maior, as euações de Euler-Lagrange fornecem um método para encontrar as equações de movimento de um sistema analisando a variação da energia total. Dias et al. (2022)

Equação 3

\[ i\hbar \frac{\partial}{\partial t} \Psi(\mathbf{r}, t) = \left[ -\frac{\hbar^2}{2m} \nabla^2 + V(\mathbf{r}, t) \right] \Psi(\mathbf{r}, t) \]

Acima, temos a Equação de Schrödinger. Na mecânica quântica, a equação de Schrödinger é uma equação diferencial parcial linear que descreve como o estado quântico de um sistema físico muda com o tempo. É uma equação usada em mecânica ondulatória para a função de onda de uma partícula. Leroux et al. (2021)

Equação 4

\[ R_{\mu\nu} - \frac{1}{2} g_{\mu\nu} R + \Lambda g_{\mu\nu} = \frac{8 \pi G}{c^4} T_{\mu\nu} \]

Agora temos a Equação da Relatividade Geral de Einstein (no vácuo). Nessa equação, representa uma medida de curvatura espaço tempo e uma medida da energia e momento contidos no espaço tempo. Stephen et al. (2022)

Equação 5

\[ \int_{\partial S} \mathbf{F} \cdot d\mathbf{r} = \int_{S} (\nabla \times \mathbf{F}) \cdot d\mathbf{S} \]

Por fim, temos o Teorema de Stokes. Na geometria diferencial, é uma afirmação sobre a integração de formas diferenciais que generaliza diversos teoremas do cálculo vetorial. Além disso, possui aplicações importantes no estudo dos campos vetoriais, especialmente na análise do movimento de rotação dos fluidos. Rodríguez-Rodríguez et al. (2019)

Figuras de Ciência de Dados

Fonte: Ciência de Dados: o que é, para que serve e como funciona (EBAC)

Fonte: O que é Ciência de Dados? (AWS)

Referências

Dias, R. J., R. Poínhos, M. Noronha, and R. Oliveira. 2022. “Uso de Aplicações Móveis e Bomba Infusora de Insulina: Relação Com o Controlo Glicémico Em Diabéticos Tipo 1.” Acta Portuguesa de Nutrição, no. 30: 30–34. https://doi.org/http://dx.doi.org/10.21011/apn.2022.3005.

Krmpotic, Kristina, Julien R. Gallant, Kirk Zufelt, and Caroline Zuijdwijk. 2022. “User-Centred Development of an mHealth App for Youth with Type 1 Diabetes: The Challenge of Operationalizing Desired Features and Feasibility of Offering Financial Incentives.” Health and Technology 12 (2): 499–513. https://doi.org/10.1007/s12553-022-00656-9.

Leroux, Andrew, Rachael Rzasa-Lynn, Ciprian Crainiceanu, and Tushar Sharma. 2021. “Wearable Devices: Current Status and Opportunities in Pain Assessment and Management.” Digital Biomarkers 5 (1): 89–102. https://doi.org/10.1159/000515576.

Rodríguez-Rodríguez, Ignacio, Ioannis Chatzigiannakis, José-Víctor Rodríguez, Marianna Maranghi, Michele Gentili, and Miguel-Ángel Zamora-Izquierdo. 2019. “Utility of Big Data in Predicting Short-Term Blood Glucose Levels in Type 1 Diabetes Mellitus Through Machine Learning Techniques.” Sensors 19 (20): 4482. https://doi.org/10.3390/s19204482.

Stephen, Divya Anna, Anna Nordin, Jan Nilsson, and Mona Persenius. 2022. “Using mHealth Applications for Self‑care – An Integrative Review on Perceptions Among Adults with Type 1 Diabetes.” BMC Endocrine Disorders, 14. https://doi.org/https://doi.org/10.1186/s12902-022-01039-x.

Relatório de Computação para Análise de Dados

Julyanne Maria dos Santos Correia

2024-08-12

Experimentando o R Markdown

Manipulação Simples

Filtro

Ordenação

Tabela Interativa

Equações em LaTeX

Equação 1

Equação 2

Equação 3

Equação 4

Equação 5

Figuras de Ciência de Dados

Referências

Referências