2capitulo

Capítulo 2 Conceptos básicos de R

A lo largo de este libro somos conscientes del equilibrio entre la teoría y la práctica. Algunos alumnos pueden preferir ver todas las definiciones presentadas antes de que se les muestre un ejemplo de un nuevo concepto. Otros preferirían ver ejemplos prácticos y explicaciones que se desarrollen hasta lograr una comprensión completa con el tiempo. Logramos un equilibrio entre estos dos enfoques que funciona bien para la mayoría de las personas en la audiencia.

A veces, le mostraremos un ejemplo que puede usar palabras que aún no se han presentado formalmente. Por ejemplo, comenzamos este capítulo con la importación de datos: R no es nada sin datos.

Al hacerlo, tenemos que usar la palabra “argumento”, que solo se define dos secciones más adelante (en [2.3](https://argoshare.is.ed.ac.uk/healthyr_book/chap02-objects-functions.html#chap02-objects-functions) “Objetos y funciones”). Algunas instancias similares surgen en torno a conceptos estadísticos en la parte de Análisis de datos del libro. Encontrará oraciones del tipo “este concepto se aclarará en la siguiente sección”. Confía en nosotros y déjate llevar.

El objetivo de este capítulo es familiarizarlo con el funcionamiento de R. Leeremos los datos y comenzaremos las manipulaciones básicas. Es posible que desee omitir partes de este capítulo si ya:

- haber encontrado la interfaz Importar conjunto de datos;

- saber cómo se ven los números, caracteres, factores y fechas en R;

- están familiarizados con la terminología sobre objetos, funciones, argumentos;

- han usado la pipa: `%>%`;

- saber cómo filtrar datos con operadores como `==, >, <, &, |`;

- saber cómo manejar los datos faltantes (NA) y por qué pueden comportarse de manera extraña en un filtro;

- han usado `mutate()`, `c()`, `paste()`, `if_else()`y las uniones.

library(tidyverse)

gbd_short <- read_csv("Data/global_burden_disease_cause-year.csv")

View(gbd_short)

2.1 Lectura de datos en R

Los datos generalmente vienen en forma de tabla, como una hoja de cálculo o una base de datos. En el mundo del **tidyverse** , una tabla leída en R se llama `tibble`.

Un formato común en el que recibir datos es CSV (valores separados por comas). CSV es una hoja de cálculo sin complicaciones y sin formato. Es solo una tabla con filas y columnas (sin hojas de cálculo ni fórmulas). Además, no necesita un software especial para ver rápidamente un archivo CSV; bastará con un editor de texto, y eso incluye RStudio.

Por ejemplo, mire “example_data.csv” en la carpeta del proyecto saludable en la Figura [2.1](https://argoshare.is.ed.ac.uk/healthyr_book/chap02-h2-reading-data-into-r.html#fig:chap2-fig-examplecsv) (este es el panel Archivos en la esquina inferior derecha de su RStudio).

Al hacer clic en un archivo de datos nos da dos opciones: “Ver archivo” o “Importar conjunto de datos”.

Le mostraremos cómo usar la interfaz Importar conjunto de datos en un momento, pero para los archivos CSV estándar, generalmente no nos molestamos con la interfaz Importar y simplemente escribimos (o copiamos de un script anterior):

library(tidyverse)

example_data <- read_csv("example_data.csv")

View(example_data)