Base Economia Negocios & Contexto

Este conjunto de datos recoge información socioeconómica y financiera de individuos con diferentes características demográficas y educativas. La base permite analizar cómo factores como la edad, el sexo, el nivel educativo y la actividad económica se relacionan con prácticas de manejo financiero, emprendimiento, inversión, ingresos y gastos mensuales. Además, incorpora variables subjetivas como el nivel de endeudamiento y la satisfacción económica, lo que abre la posibilidad de explorar no solo los aspectos objetivos del bienestar financiero, sino también la percepción individual frente a su situación económica. En conjunto, este contexto proporciona un terreno fértil para estudiar dinámicas entre educación, decisiones financieras y calidad de vida.

Variables

edad – Edad del encuestado.

sexo – Masculino / Femenino.

nivel_educativo – Técnico, Universitario, Postgrado, etc.

tiene_emprendimiento – Sí / No.

sector_economico – Manufactura, Tecnología, Servicios, Comercio.

maneja_presupuesto – Sí / No.

realiza_inversiones – Sí / No.

ingreso_mensual – Numérico.

gasto_mensual – Numérico.

nivel_endeudamiento – Escala (1–10).

satisfaccion_economica – Escala (1–10).

library(readxl)
library(ggplot2)
library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(corrplot)
## corrplot 0.95 loaded
library(ggpubr)
data <- read_excel("Base_Economia_Negocios.xlsx", sheet = "Sheet1")
dim(data)
## [1] 100  11

Aquí se logran visualizar las dimensiones de la base de datos, la cuál consta de 100 observaciones con 11 variables.

Se procede a verificar cuanto es el porcentaje de NA de la data.

library(Amelia)
## Loading required package: Rcpp
## ## 
## ## Amelia II: Multiple Imputation
## ## (Version 1.8.3, built: 2024-11-07)
## ## Copyright (C) 2005-2025 James Honaker, Gary King and Matthew Blackwell
## ## Refer to http://gking.harvard.edu/amelia/ for more information
## ##
# Convertir a data frame clásico
data_df <- as.data.frame(data)

# Visualizar los NA
missmap(data_df)

A continuación tenemos una recapitulación simplificada de los datos:

summary(data)
##       edad           sexo           nivel_educativo    tiene_emprendimiento
##  Min.   :23.00   Length:100         Length:100         Length:100          
##  1st Qu.:33.00   Class :character   Class :character   Class :character    
##  Median :45.00   Mode  :character   Mode  :character   Mode  :character    
##  Mean   :45.00                                                             
##  3rd Qu.:56.25                                                             
##  Max.   :65.00                                                             
##  sector_economico   maneja_presupuesto realiza_inversiones ingreso_mensual  
##  Length:100         Length:100         Length:100          Min.   : 897963  
##  Class :character   Class :character   Class :character    1st Qu.:1935934  
##  Mode  :character   Mode  :character   Mode  :character    Median :2446856  
##                                                            Mean   :2446225  
##                                                            3rd Qu.:2983666  
##                                                            Max.   :4368968  
##  gasto_mensual     nivel_endeudamiento satisfaccion_economica
##  Min.   : 417621   Min.   : 1.00       Min.   : 1.00         
##  1st Qu.:1414284   1st Qu.: 3.00       1st Qu.: 3.00         
##  Median :1715756   Median : 6.00       Median : 6.00         
##  Mean   :1738812   Mean   : 5.54       Mean   : 5.58         
##  3rd Qu.:2098176   3rd Qu.: 9.00       3rd Qu.: 8.00         
##  Max.   :3210431   Max.   :10.00       Max.   :10.00

La base de datos refleja un grupo de 100 personas con edades entre 23 y 65 años (promedio de 45), ingresos mensuales que rondan en promedio los 2,4 millones y gastos cercanos a 1,7 millones. El nivel de endeudamiento se sitúa en torno a 5,5 en una escala de 1 a 10, mientras que la satisfacción económica promedio es de 5,6, lo que indica percepciones mixtas sobre su bienestar financiero. En cuanto a las variables categóricas, se observa una distribución equilibrada entre hombres y mujeres, con predominio de estudios universitarios (52%) frente a técnicos y posgrados. Aproximadamente la mitad de los encuestados tiene un emprendimiento y están repartidos de manera casi equitativa entre sectores como manufactura, tecnología, servicios y comercio. La mayoría (75%) afirma manejar un presupuesto, aunque solo el 40% realiza inversiones, lo que sugiere un comportamiento financiero más conservador que arriesgado.

Analisis Univariados

Género

Aquí podemos observar una casi igualdad género en esta base de datos son femeninos (46), le siguen masculinos (45), y de último lugar otros (9)

library(dplyr)
library(knitr)
library(kableExtra)

gender_counts <- data %>%
  count(sexo)

gender_counts %>%
  kable(format = "html") %>%
  kable_styling("striped", full_width = FALSE)
sexo n
Femenino 46
Masculino 45
Otro 9
library(ggplot2)

ggplot(data, aes(x = sexo, fill = sexo)) +
  geom_bar(color = "black", alpha = 0.7) +
  geom_text(stat = "count", aes(label = ..count..), vjust = -0.5) +
  scale_fill_manual(values = c("violet","black", "pink")) +
  labs(title = "Distribución de la muestra por Género %",
       x = "Género",
       y = "Frecuencia") +
  theme_minimal() +
  theme(legend.position = "none",
        plot.title = element_text(hjust = 0.5, size = 14, face = "bold"))

Distribución de Edad

ggplot(data, aes(x = edad)) +
  geom_histogram(binwidth = 5, fill = "purple", color = "darkgrey") +
  theme_minimal() +
  ggtitle("Distribución de edad")

La distribución es bastante uniforme: no hay un solo grupo de edad que domine, lo que significa que tu base está bien balanceada entre jóvenes, adultos de mediana edad y adultos mayores.

Los rangos de 25 a 65 años están todos relativamente bien representados, aunque se nota un ligero aumento de frecuencia en los tramos cercanos a los 30–35 años y a los 60–65 años.

No se aprecia una tendencia clara hacia edades jóvenes o mayores, lo que sugiere que el muestreo buscó cubrir distintos grupos etarios de manera proporcional.

El hecho de que no aparezcan edades menores de 23 ni mayores de 65 indica que la muestra está restringida a población adulta en edad productiva (lo cual tiene sentido para un estudio económico/financiero).

Analisis Bivariados

¿Hombre o Mujer con Negocio?

ggplot(data, aes(x = sexo, fill = tiene_emprendimiento)) +
  geom_bar(position = "fill") +
  theme_minimal() +
  scale_y_continuous(labels = scales::percent) +
  labs(
    title = "Proporción de hombres y mujeres con emprendimiento",
    x = "Sexo",
    y = "Proporción",
    fill = "Tiene emprendimiento"
  )

Pues relativamente, parecida no hay una variación tremenda.

¿Hombre o Mujer más responsable?

ggplot(data, aes(x = sexo, fill = maneja_presupuesto)) +
  geom_bar(position = "fill") +
  theme_minimal() +
  scale_y_continuous(labels = scales::percent) +
  labs(
    title = "Proporción de hombres y mujeres y otres con presupuesto",
    x = "Sexo",
    y = "Proporción",
    fill = "Con presupuesto"
  )

Los otres tienen más presupuesto! Los hombres siguen en segundo lugar y muy cercanas están las mujeres