SQL (Structured Query Language) es el lenguaje estándar para:
En R, el paquete sqldf permite ejecutar consultas SQL
sobre data frames.
La instrucción básica para consultar datos.
Sintaxis:
SELECT columna1, columna2
FROM tabla;
Seleccionar todas las columnas:
SELECT *
FROM tabla;
Filtra registros según una condición.
SELECT *
FROM tabla
WHERE edad > 30;
Operadores comunes:
=!=><>=<=ANDORINLIKEEjemplo:
SELECT *
FROM tabla
WHERE edad > 30 AND ciudad = 'Bogota';
Ordena los resultados.
SELECT *
FROM tabla
ORDER BY edad DESC;
Agrupa datos para aplicar funciones agregadas.
SELECT ciudad, COUNT(*) AS total
FROM tabla
GROUP BY ciudad;
COUNT()SUM()AVG()MIN()MAX()Ejemplo:
SELECT AVG(edad) AS promedio
FROM tabla;
Filtra después de agrupar.
SELECT ciudad, COUNT(*) AS total
FROM tabla
GROUP BY ciudad
HAVING COUNT(*) > 10;
Permite combinar tablas.
SELECT a.nombre, b.salario
FROM empleados a
INNER JOIN salarios b
ON a.id = b.id;
SELECT a.nombre, b.salario
FROM empleados a
LEFT JOIN salarios b
ON a.id = b.id;
Consulta dentro de otra consulta.
SELECT *
FROM tabla
WHERE edad > (
SELECT AVG(edad)
FROM tabla
);
Permite renombrar columnas o tablas.
SELECT nombre AS cliente
FROM tabla;
Ejemplo básico:
library(sqldf)
sqldf("SELECT * FROM mtcars WHERE mpg > 20")
SQL trabaja directamente sobre el data frame mtcars.