peso = 75
pesoAula 1 – Conhecendo o Rstudio, Primeiros comandos: Operações matemáticas
Objetivo da Aula
Compreender o funcionamento do R e do RStudio, realizar operações básicas, operações matemáticas, Variáveis/Objetos.
1. O que é o R e o RStudio?
- R: linguagem de programação para análise estatística.
- RStudio: ambiente gráfico que facilita o uso do R.
2. Conhecendo o RStudio
- Console: onde comandos são executados.
- Script: onde você escreve e salva códigos.
- Environment: mostra objetos (como vetores e data frames).
- Files/Plots/Packages/Help: arquivos, gráficos e ajuda.
Figura 2.1 – Interface do RStudio
2.1 Editor / Script
Na aba Script (editor), podemos escrever e editar os códigos de programação necessários. Vamos começar escrevendo, na seção Script, o pequeno código abaixo:
Figura 2.1.1 – Interface do RStudio
2.2 Como compilar os códigos no RStudio?
A execução de uma linha de código no Script (Editor) pode ser feita de duas maneiras. Uma delas é utilizando um dos seguintes atalhos:
Ctrl + Enter
ou
Ctrl + R
A outra opção é utilizar o botão , posicionado à direita na aba Editor.
Ao executar as linhas do código de programação, deve-se posicionar o cursor em qualquer posição da linha (Figura 2.2.1). A execução e leitura dos comandos implementados é realizada pelo R linha por linha.
Figura 2.2.1 – Cursor em diferentes posicionamentos
Figura a – Cursor fixado no início da linha a ser executada.
Figura b – Cursor fixado no centro da linha a ser executada.
Execute o código utilizando uma das duas opções mencionadas na Seção 2.2 e verifique se a saída é semelhante à apresentada na Figura 2.2.3.
Figura 2.2.3 – Interface do RStudio após execução dos códigos
Para compilar todo ou parte do código de uma única vez, basta selecionar a parte desejada e executá-la com Ctrl + Enter ou pelo botão .
Figura 2.2.4 – Compilando um bloco de códigos
2.3 Como salvar o Script?
Após digitar seus códigos no editor, é fundamental salvar o Script para evitar a perda de informações. O salvamento pode ser feito de duas formas:
Clicando no botão na parte superior do editor.
Utilizando o atalho Ctrl + S.
Crie uma pasta para a disciplina no diretório de sua preferência. Após isso, salve seu Script com um nome simples e significativo, como aula_1.R (Figura 2.3.1). O arquivo será armazenado com a extensão .R e pode ser reutilizado em outras aulas ou projetos.
Figura 2.3.1 – Salvando o Script
2.4. Definindo Pasta de Trabalho
#getwd() # Verificar pasta atual
#setwd("C:/MeuProjeto") # Definir pasta (Windows)Utilizando o atalho Ctrl + SHIFT + H.
3. Console e Environment
Após a compilação do código anterior, as abas Console e Environment apresentam as seguintes informações:
Figura 3.1 – Resultados no Console
Console: apresenta o resultado dos comandos executados.
Environment: exibe os nomes e os respectivos valores das variáveis criadas.
A cor azul do texto exibido no Console após a execução do código indica que a compilação foi realizada com sucesso e que os resultados estão sendo apresentados sem erros.
4. Primeiros comandos: operações matemáticas
Neste momento, é interessante pensarmos no software R como uma simples calculadora.
Figura 4.1 – Calculadora R
A Tabela 4.1 apresenta os comandos em linguagem R para as operações matemáticas básicas.
4.1. Operações Matemáticas Básicas no R
| Operação | Comando em R | Exemplo | Resultado |
|---|---|---|---|
| Soma | + |
2 + 2 |
4 |
| Subtração | - |
10 - 4 |
6 |
| Multiplicação | * |
5 * 3 |
15 |
| Divisão | / |
20 / 5 |
4 |
| Potência | ^ |
2^3 |
8 |
| Raiz quadrada | sqrt() |
sqrt(25) |
5 |
| Logaritmo | log() |
log(100) |
4.6052 |
2 + 2 # Soma[1] 4
10 - 4 # Subtração[1] 6
5 * 3 # Multiplicação[1] 15
20 / 5 # Divisão[1] 4
2^3 # Potência[1] 8
sqrt(25) # Raiz quadrada[1] 5
log(100) # Logaritmo[1] 4.60517
Durante a anamnese nutricional, são coletadas informações como peso, estatura, idade e medidas corporais da paciente Ana Beatriz (Figura 4.2). A seguir, mostramos como tais dados podem ser organizados e utilizados no R para calcular os principais indicadores antropométricos e energéticos: IMC, RCQ, TMB, GET e ingestão calórica baseada no recordatório de 24h.
Figura 4.2 – Informações antropométricas da paciente
A seguir, na Tabela 4.2, estão descritas as fórmulas utilizadas para o cálculo dos indicadores mencionados, bem como suas respectivas fontes bibliográficas.
Tabelas 4.2 e 4.3 – Indicadores e Níveis de Atividade Física
IMC: Índice de Massa Corporal. Relaciona o peso com a altura e é utilizado para avaliar o estado nutricional geral do indivíduo.
RCQ: Relação Cintura-Quadril. Indica a distribuição de gordura corporal e auxilia na avaliação do risco cardiometabólico associado à gordura abdominal.
TMB – M: Taxa Metabólica Basal para homens. Estima a quantidade mínima de energia que o organismo masculino necessita em repouso para manter suas funções vitais.
TMB – F: Taxa Metabólica Basal para mulheres. Estima a quantidade mínima de energia que o organismo feminino necessita em repouso para manter suas funções vitais.
GET: Gasto Energético Total. Representa a necessidade energética diária total do indivíduo, considerando a taxa metabólica basal ajustada pelo nível de atividade física.
Tabela 4.2 – Medidas Antropométricas e Energéticas Utilizadas
| Medida | Fórmula | Referência |
|---|---|---|
| IMC | \(\frac{\text{peso (kg)}}{\text{altura (m)}^2}\) | WHO, 2000 |
| RCQ | \(\frac{\text{cintura (cm)}}{\text{quadril (cm)}}\) | WHO, 2011 |
| TMB – M | \(10 \cdot \text{peso} + 6.25 \cdot \text{altura} - 5 \cdot \text{idade} + 5\) | Mifflin-St Jeor, 1990 |
| TMB – F | \(10 \cdot \text{peso} + 6.25 \cdot \text{altura} - 5 \cdot \text{idade} - 161\) | Mifflin-St Jeor, 1990 |
| GET | \(\text{TMB} \cdot \text{Fator de Atividade}\) | FAO/WHO/UNU, 2001 |
Complementando essas informações, a Tabela 4.3 apresenta os principais fatores de atividade física utilizados para estimar o GET a partir da TMB, conforme o nível habitual de esforço do paciente.
Tabela 4.3 – Fatores de Atividade Física
| Nível de Atividade | Fator | Descrição |
|---|---|---|
| Sedentário | 1.2 | Pouca ou nenhuma atividade física |
| Levemente ativo | 1.375–1.5 | Atividades leves como caminhar devagar ou tarefas domésticas |
| Moderadamente ativo | 1.55–1.75 | Exercício moderado diário ou trabalho fisicamente exigente |
| Altamente ativo | 1.75–2.0 | Exercício intenso ou atividade física pesada diária |
| Extremamente ativo | 2.0–2.4 | Atletas de elite ou treino físico intenso por várias horas |
Para realizarmos os cálculos solicitados no Exemplo 1, é necessário dispor tanto das informações registradas no prontuário da paciente quanto das fórmulas dos indicadores adotados (Figura 4.3).
Figura 4.3 – Informações antropométricas da paciente e fórmulas dos índices
Figura a – Prontuário nutricional.
Figura b – Fórmulas dos indicadores considerados.
Em R, fazemos da seguinte forma:
# Cálculo dos indicadores
92.4 / 1.51^2[1] 40.52454
108 / 120[1] 0.9
(10 * 92.4 + 6.25 * 151 - 5 * 33 - 161)[1] 1541.75
(10 * 92.4 + 6.25 * 151 - 5 * 33 - 161) * 1.2[1] 1850.1
Em R, os decimais são separados por . e nunca por ,.
5. Declarando Variáveis/Objetos e Vetores
De fato, todos os cálculos até aqui foram realizados da mesma forma que seriam em uma calculadora convencional, o que pode inicialmente nos levar a não perceber vantagens imediatas no uso do R em comparação com uma calculadora comum. No entanto, o uso do R oferece recursos adicionais que enriquecem a prática analítica. Na seção a seguir, por exemplo, vamos ver que é possível nomear explicitamente os indicadores calculados, o que se assemelha ao raciocínio adotado em cálculos manuais ou analíticos realizados em contexto clínico.
5.1. Variáveis ou Objetos
Em R, uma variável (também chamada de objeto) é um nome associado a uma informação, valor ou conjunto de valores. Essas informações podem ser de natureza quantitativa (como peso, idade ou altura) ou qualitativa (como nome, sexo ou categoria alimentar).
A declaração de uma variável é feita por meio de um símbolo de atribuição, que associa o nome da variável ao seu conteúdo. A notação recomendada e mais utilizada em R é <-, embora o sinal de igual = também seja aceito1.
Figura a – Medidas antropométricas da paciente.
# Código para cálculo em R dos índices considerados
# Medidas antropométricas - Paciente: Ana Beatriz
Nome <- "Ana Beatriz"
Nascimento <- "11/03/1987"
D_atendimento <- "25/10/2023"
Sexo <- "F"
Peso <- 92.4
Altura <- 1.51
CC <- 108.0
CQ <- 120.0
Idade <- 33.0
NAF <- "sedentaria"
IC <- 2933.0Para evitar possíveis erros, são consideradas algumas regras para nomeação das variáveis.
- Nomes de variáveis podem começar com:
- Uma letra (
aaz,AaZ) - Um ponto (
.), desde que não seguido de número - Um underline (
_)
- Uma letra (
Por exemplo:
nome <- "João"
idade2 <- 25
.media_total <- 30
total_usuarios <- 10- Nomes de variáveis não podem:
- Começar com número
- Conter espaços
- Conter acentos ou cedilhas
- Incluir caracteres especiais (
-,;,%,@, etc.)
- Usar operadores (
*,+,/, etc.) no nome
- Sobrescrever palavras reservadas da linguagem (como
if,TRUE,for)
- Começar com número
Por exemplo:
2idade <- 30 # começa com número
minha variavel <- 10 # contém espaço
nome-do-usuario <- "ana" # hífen é interpretado como subtração
é_valido <- TRUE # contém acento
total% <- 100 # caractere especial não permitido
media*idade <- 5 # operador não permitido no nome
@usuario <- "joao" # símbolo especial não permitido
TRUE <- "sim" # não pode sobrescrever palavra reservada
if <- "condição" # `if` é palavra-chave da linguagemMediaIdade # PascalCase
mediaIdade # camelCase (menos comum no R)A impressão ou visualização das informações que as variáveis guardam pode ser acessada compilando apenas o nome escolhido para tal variável. Acesse as informações das variáveis que acabamos de declarar copiando ou escrevendo o código abaixo:
Nome[1] "Ana Beatriz"
Nascimento[1] "11/03/1987"
D_atendimento[1] "25/10/2023"
Sexo[1] "F"
Peso[1] 92.4
Altura[1] 1.51
CC[1] 108
CQ[1] 120
Idade[1] 33
NAF[1] "sedentaria"
IC[1] 2933
Mesmo quando uma variável possui o mesmo nome, escrevê-la de formas diferentes — com letras maiúsculas ou minúsculas — faz com que o R reconheça essas entradas como variáveis distintas. Se tentarmos acessar uma variação inexistente, como NoMe, NASCIMENTO ou PeSo, o R retornará um erro informando que o objeto não foi encontrado. Execute o código abaixo:
NoMe
NASCIMENTO
PeSo4.2. Vetores
Agora, algumas vantagens quanto ao uso dessa calculadora começam a aparecer.
Uma das principais vantagens do uso do R em comparação com uma calculadora tradicional é a sua capacidade de operar com estruturas vetoriais. Vetores são objetos que armazenam uma sequência de valores do mesmo tipo, como números, textos ou valores lógicos. São fundamentais em análises estatísticas e estão presentes em praticamente todo tipo de dado em R.
Você pode criar vetores numéricos, de texto ou lógicos usando a função c() (de combine).
No código abaixo temos um exemplo para criação de vetores de todos os tipos (numérico, texto e lógico).
# Vetor de texto (caracteres)
nomes <- c("Ana", "João", "Fernanda")
# Vetor numérico
idades <- c(34, 45, 29)
# Vetor lógico
respondeu <- c(TRUE, FALSE, TRUE)Considere agora que, além das informações antropométricas descritas no Exemplo 1 referente à paciente Ana, também temos os dados de mais dois pacientes. Nesse caso, os vetores serão fundamentais para nos ajudar a armazenar e organizar as informações referentes aos três pacientes de forma eficiente.
Construa vetores para armazenar as informações das variáveis antropométricas dos três pacientes (Figura 4.4).
Em R, podemos fazer assim:
# Código para cálculo em R dos índices considerados
# Medidas antropométricas dos 3 pacientes
Nomes <- c("Ana Beatriz", "João", "Fernanda")
Nascimentos <- c("11/03/1987", "19/02/1995", "19/02/1998")
D_atendimentos <- c("25/10/2023", "25/10/2023", "25/10/2023")
Generos <- c("F", "M", "F")
Pesos <- c(92.4, 55.0, 56.6)
Alturas <- c(1.51, 1.70, 1.72)
CCs <- c(108.0, 55.0, 70.0)
CQs <- c(120.0, 95.0, 95.0)
Idades <- c(33.0, 55.0, 28.0)
NAFs <- c("sedentaria", "moderada", "moderada")
ICs <- c(2933.0, 2165.0, 2165.0)pacientes <- data.frame(
Nomes = c("Ana Beatriz", "João", "Fernanda"),
Nascimentos = c("11/03/1987", "19/02/1995", "19/02/1998"),
D_atendimentos = c("25/10/2023", "25/10/2023", "25/10/2023"),
Generos = c("F", "M", "F"),
Pesos = c(92.4, 55.0, 56.6),
Alturas = c(1.51, 1.70, 1.72),
CCs = c(108.0, 55.0, 70.0),
CQs = c(120.0, 95.0, 95.0),
Idades = c(33.0, 55.0, 28.0),
NAFs = c("sedentaria", "moderada", "moderada"),
ICs = c(2933.0, 2165.0, 2165.0)
)
pacientesIMCs <- Pesos / (Alturas^2)
IMCs[1] 40.52454 19.03114 19.13196
Notas de rodapé
Texto em fase de elaboração, sujeito a imperfeições. Por exemplo, vamos considerar novamente o exemplo anterior para explorar esse recurso que o
Rfornece: nomear explicitamente os indicadores.↩︎