1. ¿Qué es SQL?

SQL (Structured Query Language) es el lenguaje estándar para:

En R, el paquete sqldf permite ejecutar consultas SQL sobre data frames.


2. SELECT

La instrucción básica para consultar datos.

Sintaxis:

SELECT columna1, columna2
FROM tabla;

Seleccionar todas las columnas:

SELECT *
FROM tabla;

3. WHERE

Filtra registros según una condición.

SELECT *
FROM tabla
WHERE edad > 30;

Operadores comunes:

Ejemplo:

SELECT *
FROM tabla
WHERE edad > 30 AND ciudad = 'Bogota';

4. ORDER BY

Ordena los resultados.

SELECT *
FROM tabla
ORDER BY edad DESC;

5. GROUP BY

Agrupa datos para aplicar funciones agregadas.

SELECT ciudad, COUNT(*) AS total
FROM tabla
GROUP BY ciudad;

6. Funciones Agregadas

Ejemplo:

SELECT AVG(edad) AS promedio
FROM tabla;

7. HAVING

Filtra después de agrupar.

SELECT ciudad, COUNT(*) AS total
FROM tabla
GROUP BY ciudad
HAVING COUNT(*) > 10;

8. JOIN

Permite combinar tablas.

INNER JOIN

SELECT a.nombre, b.salario
FROM empleados a
INNER JOIN salarios b
ON a.id = b.id;

LEFT JOIN

SELECT a.nombre, b.salario
FROM empleados a
LEFT JOIN salarios b
ON a.id = b.id;

9. Subconsultas

Consulta dentro de otra consulta.

SELECT *
FROM tabla
WHERE edad > (
    SELECT AVG(edad)
    FROM tabla
);

10. Alias

Permite renombrar columnas o tablas.

SELECT nombre AS cliente
FROM tabla;

11. Uso en R con sqldf

Ejemplo básico:

library(sqldf)

sqldf("SELECT * FROM mtcars WHERE mpg > 20")

SQL trabaja directamente sobre el data frame mtcars.