1. Carga de Datos
library(tidyverse)
library(GGally)
# Carga con selector manual si falla la automática
if (file.exists("Demographic-Data.csv")) {
df <- read.csv("Demographic-Data.csv")
} else {
df <- read.csv(file.choose())
}
colnames(df) <- c("Country", "Code", "BirthRate", "InternetUsers", "IncomeGroup")
df$BirthRate <- as.numeric(df$BirthRate)
df$InternetUsers <- as.numeric(df$InternetUsers)
ggplot(data = df, aes(x = InternetUsers, y = BirthRate, color = IncomeGroup)) +
geom_point(size = 3, alpha = 0.6) +
theme_minimal() +
labs(title = "Relación entre Tasa de Natalidad y Uso de Internet",
x = "Usuarios de Internet (%)",
y = "Tasa de Natalidad")

ggplot(data = df, aes(x = BirthRate)) +
geom_histogram(binwidth = 5, fill = "steelblue", color = "white") +
theme_light() +
labs(title = "Distribución de la Tasa de Natalidad",
x = "Tasa de Natalidad",
y = "Frecuencia")

# Seleccionamos las columnas 3, 4 y 5
ggpairs(df[, 3:5],
aes(color = IncomeGroup, alpha = 0.5),
title = "Matriz Multivariada de Indicadores")
## `stat_bin()` using `bins = 30`. Pick better value `binwidth`.
## `stat_bin()` using `bins = 30`. Pick better value `binwidth`.

Insights encontrados:
Análisis de Dispersión: Se denota que las personas de mayor nivel de
ingreso son quienes tienen las tasas de natalidad más bajas y el mayor
uso de internet de la muestra. Por su parte, las personas con bajo y muy
bajo nivel de ingreso están entre quienes tienen más hijos y menos usan
internet (entendido como falta de acceso al mismo). El grupo “Middle
Class” se dispersa en el gráfico, lo que indica una correlación más
variada en comparación con los extremos económicos.
Análisis de Distribución: En este histograma, el valor cercano a 10
es el que más se repite en la data, seguido del 20. La forma de la
distribución confirma visualmente que los datos no son normales,
presentando un sesgo hacia la derecha donde se concentran los países con
mayor desarrollo tecnológico.
Análisis de la Matriz: Este gráfico permite confirmar tres puntos
clave:
Diagonal: Las curvas de densidad muestran que los países ricos
tienen comportamientos muy similares entre sí (curvas estrechas y bajas
en natalidad).
Correlación: Se confirma la relación lineal inversa; a medida que
aumenta la variable de internet, cae la variable de natalidad.
Comparativa: Los diagramas de caja (boxplots) laterales revelan que
el nivel de ingresos es el factor determinante que separa claramente los
grupos en ambas variables medidas.