Ingesta de Datos: Conectando con el Mundo Real

Author

Scarlin Lopez S.

Published

June 13, 2026

Dataset de práctica.

Parte 1 — Leer el CSV:

Code
library(tidyverse)
library(readr)
library(lubridate)

empleados_csv <- read_csv(
  "C:/Users/scarl/OneDrive/Documents/empleados.csv",
  col_types = cols(
    id_empleado = col_character(),
    nombre = col_character(),
    departamento = col_character(),
    salario_mensual = col_double(),
    fecha_ingreso = col_date(format = "%Y-%m-%d")
  )
)

glimpse(empleados_csv)
Rows: 20
Columns: 5
$ id_empleado     <chr> "001", "002", "003", "004", "005", "006", "007", "008"…
$ nombre          <chr> "Ana Torres", "Pedro Méndez", "María López", "Luis Gar…
$ departamento    <chr> "Tecnología", "Auditoría", "Tecnología", "RRHH", "Audi…
$ salario_mensual <dbl> 58000, 45000, 63000, 41000, 52000, 70000, 65000, 48000…
$ fecha_ingreso   <date> 2019-03-15, 2021-07-01, 2018-11-20, 2022-01-10, 2020-…

Parte 2 — Leer el Excel:

Code
library(readxl)
library(dplyr)

archivo <- "C:/Users/scarl/OneDrive/Documents/empleados.xlsx"

sheet_2022 <- read_excel(archivo, sheet = "2022")
sheet_2023 <- read_excel(archivo, sheet = "2023")
sheet_2022 <- sheet_2022 %>% mutate(anio = 2022)
sheet_2023 <- sheet_2023 %>% mutate(anio = 2023)

empleados_excel <- bind_rows(sheet_2022, sheet_2023)

promedio_salario <- empleados_excel %>%
  group_by(departamento) %>%
  summarise(
    salario_promedio = mean(salario_mensual, na.rm = TRUE),
    .groups = "drop"
  )

promedio_salario
# A tibble: 3 × 2
  departamento salario_promedio
  <chr>                   <dbl>
1 Auditoría               49000
2 Finanzas                48000
3 RRHH                    40000

Parte 3 — Conectar a SQLite:

Code
library(DBI)
library(RSQLite)
library(tibble)


con <- dbConnect(RSQLite::SQLite(), "mi_base.sqlite")

empleados <- tibble(id_empleado = c("008", "016", "001", "002"), nombre = c("Jorge Ortiz", "Roberto Peña", "Ana Torres", "Pedro Méndez"), anio = c(2023, 2023, 2019, 2021))

dbWriteTable(con, "empleados", empleados, overwrite = TRUE)

resultado <- dbGetQuery(con,"SELECT * FROM empleados WHERE anio = 2023")

resultado
  id_empleado       nombre anio
1         008  Jorge Ortiz 2023
2         016 Roberto Peña 2023
Code
dbDisconnect(con)

```

Análisis:

  • Se calculó el salario promedio por departamento utilizando la información consolidada de los años 2022 y 2023. Este resumen permite comparar los niveles salariales entre las diferentes áreas de la organización e identificar cuáles departamentos presentan mayores promedios de remuneración.*