Aula 1 – Conhecendo o Rstudio, Primeiros comandos: Operações matemáticas

Autor

Prof. Marcelo Ribeiro

Objetivo da Aula

Compreender o funcionamento do R e do RStudio, realizar operações básicas, operações matemáticas, Variáveis/Objetos.

1. O que é o R e o RStudio?

  • R: linguagem de programação para análise estatística.
  • RStudio: ambiente gráfico que facilita o uso do R.

2. Conhecendo o RStudio

  • Console: onde comandos são executados.
  • Script: onde você escreve e salva códigos.
  • Environment: mostra objetos (como vetores e data frames).
  • Files/Plots/Packages/Help: arquivos, gráficos e ajuda.

Figura 2.1 – Interface do RStudio

Interface do RStudio

2.1 Editor / Script

Na aba Script (editor), podemos escrever e editar os códigos de programação necessários. Vamos começar escrevendo, na seção Script, o pequeno código abaixo:

peso = 75

peso

Figura 2.1.1 – Interface do RStudio

Primeiros códigos em R

2.2 Como compilar os códigos no RStudio?

A execução de uma linha de código no Script (Editor) pode ser feita de duas maneiras. Uma delas é utilizando um dos seguintes atalhos:

Ctrl + Enter

ou

Ctrl + R

A outra opção é utilizar o botão Botão Run (Executar) do RStudio, posicionado à direita na aba Editor.

Comentário do professor

Ao executar as linhas do código de programação, deve-se posicionar o cursor em qualquer posição da linha (Figura 2.2.1). A execução e leitura dos comandos implementados é realizada pelo R linha por linha.

Figura 2.2.1 – Cursor em diferentes posicionamentos

Script do RStudio
Figura a – Cursor fixado no início da linha a ser executada.

Console do RStudio
Figura b – Cursor fixado no centro da linha a ser executada.

Executando o código

Execute o código utilizando uma das duas opções mencionadas na Seção 2.2 e verifique se a saída é semelhante à apresentada na Figura 2.2.3.

Figura 2.2.3 – Interface do RStudio após execução dos códigos

Primeiros códigos em R
Aviso importante

Para compilar todo ou parte do código de uma única vez, basta selecionar a parte desejada e executá-la com Ctrl + Enter ou pelo botão Botão Run (Executar) do RStudio.

Figura 2.2.4 – Compilando um bloco de códigos

Primeiros códigos em R

2.3 Como salvar o Script?

Após digitar seus códigos no editor, é fundamental salvar o Script para evitar a perda de informações. O salvamento pode ser feito de duas formas:

Clicando no botão Botão Save (Salvar) do RStudio na parte superior do editor.

Utilizando o atalho Ctrl + S.

Comentário do professor

Crie uma pasta para a disciplina no diretório de sua preferência. Após isso, salve seu Script com um nome simples e significativo, como aula_1.R (Figura 2.3.1). O arquivo será armazenado com a extensão .R e pode ser reutilizado em outras aulas ou projetos.

Figura 2.3.1 – Salvando o Script

Tela Salvar

2.4. Definindo Pasta de Trabalho

#getwd()                    # Verificar pasta atual
#setwd("C:/MeuProjeto")     # Definir pasta (Windows)

Utilizando o atalho Ctrl + SHIFT + H.

3. Console e Environment

Após a compilação do código anterior, as abas Console e Environment apresentam as seguintes informações:

Figura 3.1 – Resultados no Console

Console

Console: apresenta o resultado dos comandos executados.
Environment: exibe os nomes e os respectivos valores das variáveis criadas.

Dica

A cor azul do texto exibido no Console após a execução do código indica que a compilação foi realizada com sucesso e que os resultados estão sendo apresentados sem erros.

4. Primeiros comandos: operações matemáticas

Comentário do professor

Neste momento, é interessante pensarmos no software R como uma simples calculadora.

Figura 4.1 – Calculadora R

Versão limitada

A Tabela 4.1 apresenta os comandos em linguagem R para as operações matemáticas básicas.

4.1. Operações Matemáticas Básicas no R

Operação Comando em R Exemplo Resultado
Soma + 2 + 2 4
Subtração - 10 - 4 6
Multiplicação * 5 * 3 15
Divisão / 20 / 5 4
Potência ^ 2^3 8
Raiz quadrada sqrt() sqrt(25) 5
Logaritmo log() log(100) 4.6052
Execute o código abaixo
2 + 2       # Soma
[1] 4
10 - 4      # Subtração
[1] 6
5 * 3       # Multiplicação
[1] 15
20 / 5      # Divisão
[1] 4
2^3         # Potência
[1] 8
sqrt(25)    # Raiz quadrada
[1] 5
log(100)    # Logaritmo
[1] 4.60517
Exemplo 1: Avaliação nutricional de uma paciente

Durante a anamnese nutricional, são coletadas informações como peso, estatura, idade e medidas corporais da paciente Ana Beatriz (Figura 4.2). A seguir, mostramos como tais dados podem ser organizados e utilizados no R para calcular os principais indicadores antropométricos e energéticos: IMC, RCQ, TMB, GET e ingestão calórica baseada no recordatório de 24h.

Figura 4.2 – Informações antropométricas da paciente

Prontuário nutricional

A seguir, na Tabela 4.2, estão descritas as fórmulas utilizadas para o cálculo dos indicadores mencionados, bem como suas respectivas fontes bibliográficas.

Tabelas 4.2 e 4.3 – Indicadores e Níveis de Atividade Física

  • IMC: Índice de Massa Corporal. Relaciona o peso com a altura e é utilizado para avaliar o estado nutricional geral do indivíduo.

  • RCQ: Relação Cintura-Quadril. Indica a distribuição de gordura corporal e auxilia na avaliação do risco cardiometabólico associado à gordura abdominal.

  • TMB – M: Taxa Metabólica Basal para homens. Estima a quantidade mínima de energia que o organismo masculino necessita em repouso para manter suas funções vitais.

  • TMB – F: Taxa Metabólica Basal para mulheres. Estima a quantidade mínima de energia que o organismo feminino necessita em repouso para manter suas funções vitais.

  • GET: Gasto Energético Total. Representa a necessidade energética diária total do indivíduo, considerando a taxa metabólica basal ajustada pelo nível de atividade física.

Tabela 4.2 – Medidas Antropométricas e Energéticas Utilizadas

Medida Fórmula Referência
IMC \(\frac{\text{peso (kg)}}{\text{altura (m)}^2}\) WHO, 2000
RCQ \(\frac{\text{cintura (cm)}}{\text{quadril (cm)}}\) WHO, 2011
TMB – M \(10 \cdot \text{peso} + 6.25 \cdot \text{altura} - 5 \cdot \text{idade} + 5\) Mifflin-St Jeor, 1990
TMB – F \(10 \cdot \text{peso} + 6.25 \cdot \text{altura} - 5 \cdot \text{idade} - 161\) Mifflin-St Jeor, 1990
GET \(\text{TMB} \cdot \text{Fator de Atividade}\) FAO/WHO/UNU, 2001

Complementando essas informações, a Tabela 4.3 apresenta os principais fatores de atividade física utilizados para estimar o GET a partir da TMB, conforme o nível habitual de esforço do paciente.

Tabela 4.3 – Fatores de Atividade Física

Nível de Atividade Fator Descrição
Sedentário 1.2 Pouca ou nenhuma atividade física
Levemente ativo 1.375–1.5 Atividades leves como caminhar devagar ou tarefas domésticas
Moderadamente ativo 1.55–1.75 Exercício moderado diário ou trabalho fisicamente exigente
Altamente ativo 1.75–2.0 Exercício intenso ou atividade física pesada diária
Extremamente ativo 2.0–2.4 Atletas de elite ou treino físico intenso por várias horas

Para realizarmos os cálculos solicitados no Exemplo 1, é necessário dispor tanto das informações registradas no prontuário da paciente quanto das fórmulas dos indicadores adotados (Figura 4.3).

Figura 4.3 – Informações antropométricas da paciente e fórmulas dos índices

Figura a – Medidas antropométricas da paciente
Figura a – Prontuário nutricional.

Figura b – Fórmulas utilizadas para os cálculos
Figura b – Fórmulas dos indicadores considerados.

Em R, fazemos da seguinte forma:

Execute o código abaixo
# Cálculo dos indicadores

92.4 / 1.51^2
[1] 40.52454
108 / 120
[1] 0.9
(10 * 92.4 + 6.25 * 151 - 5 * 33 - 161)
[1] 1541.75
(10 * 92.4 + 6.25 * 151 - 5 * 33 - 161) * 1.2
[1] 1850.1
Atenção: decimais no R

Em R, os decimais são separados por . e nunca por ,.

5. Declarando Variáveis/Objetos e Vetores

De fato, todos os cálculos até aqui foram realizados da mesma forma que seriam em uma calculadora convencional, o que pode inicialmente nos levar a não perceber vantagens imediatas no uso do R em comparação com uma calculadora comum. No entanto, o uso do R oferece recursos adicionais que enriquecem a prática analítica. Na seção a seguir, por exemplo, vamos ver que é possível nomear explicitamente os indicadores calculados, o que se assemelha ao raciocínio adotado em cálculos manuais ou analíticos realizados em contexto clínico.

5.1. Variáveis ou Objetos

Em R, uma variável (também chamada de objeto) é um nome associado a uma informação, valor ou conjunto de valores. Essas informações podem ser de natureza quantitativa (como peso, idade ou altura) ou qualitativa (como nome, sexo ou categoria alimentar).

A declaração de uma variável é feita por meio de um símbolo de atribuição, que associa o nome da variável ao seu conteúdo. A notação recomendada e mais utilizada em R é <-, embora o sinal de igual = também seja aceito1.

Executando este código

Figura a – Dados fictícios
Figura a – Medidas antropométricas da paciente.

# Código para cálculo em R dos índices considerados
# Medidas antropométricas - Paciente: Ana Beatriz

Nome <- "Ana Beatriz"
Nascimento <- "11/03/1987"
D_atendimento <- "25/10/2023"
Sexo <- "F"
Peso <- 92.4
Altura <- 1.51
CC <- 108.0
CQ <- 120.0
Idade <- 33.0
NAF <- "sedentaria"
IC <- 2933.0

Para evitar possíveis erros, são consideradas algumas regras para nomeação das variáveis.

  • Nomes de variáveis podem começar com:
    • Uma letra (a a z, A a Z)
    • Um ponto (.), desde que não seguido de número
    • Um underline (_)

Por exemplo:

Declarações válidas
nome <- "João"
idade2 <- 25
.media_total <- 30
total_usuarios <- 10
  • Nomes de variáveis não podem:
    • Começar com número
    • Conter espaços
    • Conter acentos ou cedilhas
    • Incluir caracteres especiais (-, ;, %, @, etc.)
    • Usar operadores (*, +, /, etc.) no nome
    • Sobrescrever palavras reservadas da linguagem (como if, TRUE, for)

Por exemplo:

Declarações inválidas
2idade <- 30              # começa com número
minha variavel <- 10      # contém espaço
nome-do-usuario <- "ana"  # hífen é interpretado como subtração
é_valido <- TRUE          # contém acento
total% <- 100             # caractere especial não permitido
media*idade <- 5          # operador não permitido no nome
@usuario <- "joao"        # símbolo especial não permitido
TRUE <- "sim"             # não pode sobrescrever palavra reservada
if <- "condição"          # `if` é palavra-chave da linguagem
Evite também
MediaIdade   # PascalCase
mediaIdade   # camelCase (menos comum no R)

A impressão ou visualização das informações que as variáveis guardam pode ser acessada compilando apenas o nome escolhido para tal variável. Acesse as informações das variáveis que acabamos de declarar copiando ou escrevendo o código abaixo:

Execute o código abaixo
Nome
[1] "Ana Beatriz"
Nascimento
[1] "11/03/1987"
D_atendimento
[1] "25/10/2023"
Sexo
[1] "F"
Peso
[1] 92.4
Altura
[1] 1.51
CC
[1] 108
CQ
[1] 120
Idade
[1] 33
NAF
[1] "sedentaria"
IC
[1] 2933

Mesmo quando uma variável possui o mesmo nome, escrevê-la de formas diferentes — com letras maiúsculas ou minúsculas — faz com que o R reconheça essas entradas como variáveis distintas. Se tentarmos acessar uma variação inexistente, como NoMe, NASCIMENTO ou PeSo, o R retornará um erro informando que o objeto não foi encontrado. Execute o código abaixo:

Atenção – nomes de variáveis em R são case sensitive
NoMe
NASCIMENTO
PeSo

Mensagem de erro

4.2. Vetores

Comentário do professor

Agora, algumas vantagens quanto ao uso dessa calculadora começam a aparecer.

Uma das principais vantagens do uso do R em comparação com uma calculadora tradicional é a sua capacidade de operar com estruturas vetoriais. Vetores são objetos que armazenam uma sequência de valores do mesmo tipo, como números, textos ou valores lógicos. São fundamentais em análises estatísticas e estão presentes em praticamente todo tipo de dado em R.

Aviso: como criar vetores de dados?

Você pode criar vetores numéricos, de texto ou lógicos usando a função c() (de combine).

No código abaixo temos um exemplo para criação de vetores de todos os tipos (numérico, texto e lógico).

Execute este código
# Vetor de texto (caracteres)
nomes <- c("Ana", "João", "Fernanda")

# Vetor numérico
idades <- c(34, 45, 29)

# Vetor lógico
respondeu <- c(TRUE, FALSE, TRUE)

Considere agora que, além das informações antropométricas descritas no Exemplo 1 referente à paciente Ana, também temos os dados de mais dois pacientes. Nesse caso, os vetores serão fundamentais para nos ajudar a armazenar e organizar as informações referentes aos três pacientes de forma eficiente.

Exemplo 2: Vetores

Construa vetores para armazenar as informações das variáveis antropométricas dos três pacientes (Figura 4.4).

Prontuários: Ana, João e Fernanda

Em R, podemos fazer assim:

Execute este código
# Código para cálculo em R dos índices considerados
# Medidas antropométricas dos 3 pacientes

Nomes <- c("Ana Beatriz", "João", "Fernanda")
Nascimentos <- c("11/03/1987", "19/02/1995", "19/02/1998")
D_atendimentos <- c("25/10/2023", "25/10/2023", "25/10/2023")
Generos <- c("F", "M", "F")
Pesos <- c(92.4, 55.0, 56.6)
Alturas <- c(1.51, 1.70, 1.72)
CCs <- c(108.0, 55.0, 70.0)
CQs <- c(120.0, 95.0, 95.0)
Idades <- c(33.0, 55.0, 28.0)
NAFs <- c("sedentaria", "moderada", "moderada")
ICs <- c(2933.0, 2165.0, 2165.0)
pacientes <- data.frame(
  Nomes = c("Ana Beatriz", "João", "Fernanda"),
  Nascimentos = c("11/03/1987", "19/02/1995", "19/02/1998"),
  D_atendimentos = c("25/10/2023", "25/10/2023", "25/10/2023"),
  Generos = c("F", "M", "F"),
  Pesos = c(92.4, 55.0, 56.6),
  Alturas = c(1.51, 1.70, 1.72),
  CCs = c(108.0, 55.0, 70.0),
  CQs = c(120.0, 95.0, 95.0),
  Idades = c(33.0, 55.0, 28.0),
  NAFs = c("sedentaria", "moderada", "moderada"),
  ICs = c(2933.0, 2165.0, 2165.0)
)

pacientes
Exemplo 2: Cálculo dos índices para os três pacientes
IMCs <- Pesos / (Alturas^2)
IMCs
[1] 40.52454 19.03114 19.13196

Notas de rodapé

  1. Texto em fase de elaboração, sujeito a imperfeições. Por exemplo, vamos considerar novamente o exemplo anterior para explorar esse recurso que o R fornece: nomear explicitamente os indicadores.↩︎