1. Carga de Datos

library(tidyverse)
library(GGally)

# Carga con selector manual si falla la automática
if (file.exists("Demographic-Data.csv")) {
  df <- read.csv("Demographic-Data.csv")
} else {
  df <- read.csv(file.choose())
}

colnames(df) <- c("Country", "Code", "BirthRate", "InternetUsers", "IncomeGroup")
df$BirthRate <- as.numeric(df$BirthRate)
df$InternetUsers <- as.numeric(df$InternetUsers)
ggplot(data = df, aes(x = InternetUsers, y = BirthRate, color = IncomeGroup)) +
  geom_point(size = 3, alpha = 0.6) +
  theme_minimal() +
  labs(title = "Relación entre Tasa de Natalidad y Uso de Internet",
       x = "Usuarios de Internet (%)", 
       y = "Tasa de Natalidad")

ggplot(data = df, aes(x = BirthRate)) +
  geom_histogram(binwidth = 5, fill = "steelblue", color = "white") +
  theme_light() +
  labs(title = "Distribución de la Tasa de Natalidad", 
       x = "Tasa de Natalidad", 
       y = "Frecuencia")

# Seleccionamos las columnas 3, 4 y 5
ggpairs(df[, 3:5], 
        aes(color = IncomeGroup, alpha = 0.5),
        title = "Matriz Multivariada de Indicadores")
## `stat_bin()` using `bins = 30`. Pick better value `binwidth`.
## `stat_bin()` using `bins = 30`. Pick better value `binwidth`.

Insights encontrados:

Análisis de Dispersión: Se denota que las personas de mayor nivel de ingreso son quienes tienen las tasas de natalidad más bajas y el mayor uso de internet de la muestra. Por su parte, las personas con bajo y muy bajo nivel de ingreso están entre quienes tienen más hijos y menos usan internet (entendido como falta de acceso al mismo). El grupo “Middle Class” se dispersa en el gráfico, lo que indica una correlación más variada en comparación con los extremos económicos.

Análisis de Distribución: En este histograma, el valor cercano a 10 es el que más se repite en la data, seguido del 20. La forma de la distribución confirma visualmente que los datos no son normales, presentando un sesgo hacia la derecha donde se concentran los países con mayor desarrollo tecnológico.

Análisis de la Matriz: Este gráfico permite confirmar tres puntos clave:

Diagonal: Las curvas de densidad muestran que los países ricos tienen comportamientos muy similares entre sí (curvas estrechas y bajas en natalidad).

Correlación: Se confirma la relación lineal inversa; a medida que aumenta la variable de internet, cae la variable de natalidad.

Comparativa: Los diagramas de caja (boxplots) laterales revelan que el nivel de ingresos es el factor determinante que separa claramente los grupos en ambas variables medidas.