Para trabajar en R necesitamos instalar tres elementos:
Ejemplo: instalación de paquetes
# Instalar la librería dplyr para manipulación de datos
install.packages("dplyr")
# Instalar la librería ggplot2 para gráficos
install.packages("ggplot2")
En R, un escalar es simplemente un único número que
se puede asignar a una variable.
Estas operaciones funcionan directamente entre escalares y también de
forma “vectorizada” cuando se aplican a vectores y matrices, afectando a
todos los elementos del objeto de manera simultánea.
Crear un escalar
# Asignamos el número 5 a la variable x
x <- 5
# Asignamos el número 3 a la variable y
y <- 3
# Sumamos los dos valores
suma <- x + y
# Mostramos el resultado
suma
## [1] 8
👉 Explicación:
- <- es el operador de asignación en R.
- x y y son objetos que guardan un
número.
- La suma de x + y se guarda en suma.
Un vector es una colección ordenada de elementos del mismo tipo de dato, como números, texto o valores lógicos.
Los vectores son fundamentales en R para almacenar y manipular datos, y son la base de estructuras más complejas como los data frames.
Crear un vector en RStudio
# Creamos un vector numérico
vect1 <- c(2, 4, 6)
# Creamos un vector de texto
vect2 <- c("Juan", "Pedro", "Sara")
# Multiplicamos cada elemento de vect1 por 2
vect1 * 2
## [1] 4 8 12
# Calculamos la suma de todos los elementos de vect1
sum(vect1)
## [1] 12
👉 Explicación:
- c() es la función para concatenar elementos y formar un
vector.
- Un vector puede ser numérico o de texto, pero no ambos a la vez (R
hace coerción).
- Las operaciones se aplican a todos los elementos (ejemplo:
vect1 * 2).
Una matriz es una estructura bidimensional (filas y
columnas) con datos del mismo tipo.
Un data frame es similar, pero permite mezclar tipos
(números, texto, factores).
Matrices
-Homogeneidad: Contienen elementos del mismo tipo de dato (por ejemplo, solo números o solo caracteres).
-Dimensiones: Son bidimensionales, con filas y columnas.
-Funcionalidad: Son ideales para operaciones de álgebra matricial.
Creación
Se crean con la función matrix(), especificando los
datos, el número de filas (nrow) y el número de columnas
(ncol). Por defecto, R llena la matriz por columnas, pero
puedes usar byrow = TRUE para llenarla por filas.
# Creamos una matriz 3x3 con números del 1 al 9
matA <- matrix(1:9, nrow=3, byrow=TRUE)
matA
## [,1] [,2] [,3]
## [1,] 1 2 3
## [2,] 4 5 6
## [3,] 7 8 9
# Creamos un data frame con nombres y edades
base <- data.frame(
nombre = c("Ana", "Luis", "Maria"),
edad = c(23, 35, 29)
)
base
## nombre edad
## 1 Ana 23
## 2 Luis 35
## 3 Maria 29
👉 Explicación:
- matrix(1:9, nrow=3, byrow=TRUE) crea una matriz de 3
filas usando los números del 1 al 9.
- data.frame() construye una tabla con variables de
distinto tipo.
RMarkdown permite integrar texto, código y resultados en un mismo documento.
Ejemplo de resumen estadístico:
# Calculamos un resumen de los datos "cars"
summary(cars)
## speed dist
## Min. : 4.0 Min. : 2.00
## 1st Qu.:12.0 1st Qu.: 26.00
## Median :15.0 Median : 36.00
## Mean :15.4 Mean : 42.98
## 3rd Qu.:19.0 3rd Qu.: 56.00
## Max. :25.0 Max. :120.00
Ejemplo de gráfico:
👉 Explicación:
- summary(cars) devuelve estadísticos básicos de la base de
datos cars.
- plot() genera un gráfico sencillo.
- echo=FALSE oculta el código y solo muestra el
resultado.
La Encuesta Nacional de Salud y Nutrición (ENSANUT 2018) presenta indicadores claves.
Ejemplo: Parto institucionalizado
- 95,6% de partos fueron en un establecimiento de salud.
- 80,2% en establecimientos públicos y 19,8% en privados.
👉 Explicación:
- data.frame() construye una tabla con los
porcentajes.
- barplot() crea un gráfico de barras.
- names.arg pone los nombres de las categorías.
dplyr, ggplot2).Guía de Estudio: disponible en Guía de Estudio - Análisis Estadístico con R