Para trabajar en R necesitamos instalar tres elementos:
Ejemplo: instalación de paquetes
# Instalar la librería dplyr para manipulación de datos
install.packages("dplyr")
# Instalar la librería ggplot2 para gráficos
install.packages("ggplot2")
En R, un escalar es simplemente un único número que
se puede asignar a una variable.
Estas operaciones funcionan directamente entre escalares y también de
forma “vectorizada” cuando se aplican a vectores y matrices, afectando a
todos los elementos del objeto de manera simultánea.
Crear un escalar
# Asignamos el número 5 a la variable x
x <- 5
# Asignamos el número 3 a la variable y
y <- 3
# Sumamos los dos valores
suma <- x + y
# Mostramos el resultado
suma
## [1] 8
👉 Explicación:
- <-
es el operador de asignación en R.
- x
y y
son objetos que guardan un
número.
- La suma de x + y
se guarda en suma
.
Un vector es una colección ordenada de elementos del mismo tipo de dato, como números, texto o valores lógicos.
Los vectores son fundamentales en R para almacenar y manipular datos, y son la base de estructuras más complejas como los data frames.
Crear un vector en RStudio
# Creamos un vector numérico
vect1 <- c(2, 4, 6)
# Creamos un vector de texto
vect2 <- c("Juan", "Pedro", "Sara")
# Multiplicamos cada elemento de vect1 por 2
vect1 * 2
## [1] 4 8 12
# Calculamos la suma de todos los elementos de vect1
sum(vect1)
## [1] 12
👉 Explicación:
- c()
es la función para concatenar elementos y formar un
vector.
- Un vector puede ser numérico o de texto, pero no ambos a la vez (R
hace coerción).
- Las operaciones se aplican a todos los elementos (ejemplo:
vect1 * 2
).
Una matriz es una estructura bidimensional (filas y
columnas) con datos del mismo tipo.
Un data frame es similar, pero permite mezclar tipos
(números, texto, factores).
Matrices
-Homogeneidad: Contienen elementos del mismo tipo de dato (por ejemplo, solo números o solo caracteres).
-Dimensiones: Son bidimensionales, con filas y columnas.
-Funcionalidad: Son ideales para operaciones de álgebra matricial.
Creación
Se crean con la función matrix()
, especificando los
datos, el número de filas (nrow)
y el número de columnas
(ncol)
. Por defecto, R llena la matriz por columnas, pero
puedes usar byrow = TRUE
para llenarla por filas.
# Creamos una matriz 3x3 con números del 1 al 9
matA <- matrix(1:9, nrow=3, byrow=TRUE)
matA
## [,1] [,2] [,3]
## [1,] 1 2 3
## [2,] 4 5 6
## [3,] 7 8 9
# Creamos un data frame con nombres y edades
base <- data.frame(
nombre = c("Ana", "Luis", "Maria"),
edad = c(23, 35, 29)
)
base
## nombre edad
## 1 Ana 23
## 2 Luis 35
## 3 Maria 29
👉 Explicación:
- matrix(1:9, nrow=3, byrow=TRUE)
crea una matriz de 3
filas usando los números del 1 al 9.
- data.frame()
construye una tabla con variables de
distinto tipo.
RMarkdown permite integrar texto, código y resultados en un mismo documento.
Ejemplo de resumen estadístico:
# Calculamos un resumen de los datos "cars"
summary(cars)
## speed dist
## Min. : 4.0 Min. : 2.00
## 1st Qu.:12.0 1st Qu.: 26.00
## Median :15.0 Median : 36.00
## Mean :15.4 Mean : 42.98
## 3rd Qu.:19.0 3rd Qu.: 56.00
## Max. :25.0 Max. :120.00
Ejemplo de gráfico:
👉 Explicación:
- summary(cars)
devuelve estadísticos básicos de la base de
datos cars
.
- plot()
genera un gráfico sencillo.
- echo=FALSE
oculta el código y solo muestra el
resultado.
La Encuesta Nacional de Salud y Nutrición (ENSANUT 2018) presenta indicadores claves.
Ejemplo: Parto institucionalizado
- 95,6% de partos fueron en un establecimiento de salud.
- 80,2% en establecimientos públicos y 19,8% en privados.
👉 Explicación:
- data.frame()
construye una tabla con los
porcentajes.
- barplot()
crea un gráfico de barras.
- names.arg
pone los nombres de las categorías.
dplyr
, ggplot2
).Guía de Estudio: disponible en Guía de Estudio - Análisis Estadístico con R