ARGENTINA

Author

Jonathan Jimenez y Maria Rosa Sanchez

Introducción al Análisis de Correlación y de Regresión Lineal

Cargar librerías necesarias

library(dplyr) # Para manipulación de datos

library(ggplot2) # Para visualización de datos

library(haven) # Para leer archivos .dta de Stata

install.packages(“ggcorrplot”)(Ofrece una solución para reordenar la matriz de correlación y muestra el nivel de significancia en el correlograma)

library(ggcorrplot)

install.packages(“corrplot”)(es una herramienta para visualizar matrices de correlación de forma clara e intuitiva)

library(corrplot)

install.packages(“car”)

library(car)

#Setear directorio de trabajo setwd(“C:/Users/LENOVO/Desktop/ARGENTINA”)

#Cargar la base de datos

library(readxl)
data <- read_excel("DATOS_ARGENTINA.xlsx")
View(data)

Ver las primeras filas del dataset

head(data)
# A tibble: 6 × 4
  ANIOS EXPORTACIONES PROFESIONALES_TECNIFICADOS PROFESIONALES
  <dbl>         <dbl>                      <dbl>         <dbl>
1  1991   11978000000                       1.78          40.6
2  1992   12235000000                       1.76          40.5
3  1993   13118000000                       1.70          37.9
4  1994   15659000000                       1.67          37.4
5  1995   20967000000                       1.65          34.5
6  1996   23811000000                       1.63          33.2

Comprobar si hay valores perdidos en las variables de interés

sum(is.na(data$EXPORTACIONES))
[1] 0
sum(is.na(data$PROFESIONALES_TECNIFICADOS))
[1] 0
sum(is.na(data$PROFESIONALES))
[1] 0

#Ejemplo1: Análisis de Correlación # Calcular la correlación de Pearson entre Agricultores varones y obreros varones

correlacion <- cor(data$PROFESIONALES_TECNIFICADOS, data$PROFESIONALES, use = "complete.obs")

Mostrar el coeficiente de correlación

cat("El coeficiente de correlación de Pearson entre profesionales tecnificados y profesionales es:", correlacion)
El coeficiente de correlación de Pearson entre profesionales tecnificados y profesionales es: 0.4204968

Por lo tanto, un coeficiente de correlacion de 0,42 nos indica que,hay una correlacion positiva moderada entre ambas variables, por lo que, si crece el numero de profesionales tecnificados argentinos, aumentaran tambien los profesionales de manera general de dicho pais.

library(ggplot2)

Crear un gráfico de dispersión con una línea de regresión

ggplot(data, aes(x = ANIOS, y = EXPORTACIONES)) +
  geom_point(color = "blue", alpha = 0.5) +  # Puntos del gráfico
  geom_smooth(method = "lm", color = "red", se = FALSE) +  # Línea de regresión lineal
  labs(title = "Variacion de las exportaciones",
       x = "Años",
       y = "Total de exportaciones") +
  theme_minimal()
`geom_smooth()` using formula = 'y ~ x'

Figura 1: Cambios en las exportaciones.

Según la Figura 1, se observa una tendencia creciente en las exportaciones del país a lo largo del tiempo. Este aumento sostenido en el comercio exterior sugiere una mejora en la capacidad productiva y en la inserción de la nación en los mercados internacionales. Como resultado, se generan mayores ingresos fiscales y divisas, lo cual puede traducirse en una mayor disponibilidad de recursos para sectores clave como la educación y la tecnificación. Este tipo de inversión no solo fortalece el capital humano, sino que también impulsa el desarrollo social y económico de la población en su conjunto, creando un círculo virtuoso entre crecimiento económico y bienestar ciudadano.

# Seleccionar solo las variables numéricas

library(dplyr)

Adjuntando el paquete: 'dplyr'
The following objects are masked from 'package:stats':

    filter, lag
The following objects are masked from 'package:base':

    intersect, setdiff, setequal, union
datos_numericos <- select(data, ANIOS, EXPORTACIONES, PROFESIONALES_TECNIFICADOS, PROFESIONALES)

Calcular la matriz de correlaciones

matriz_cor <- cor(datos_numericos, use = "complete.obs")

Mostrar la matriz de correlaciones

print(matriz_cor)
                                ANIOS EXPORTACIONES PROFESIONALES_TECNIFICADOS
ANIOS                       1.0000000     0.8871995                 -0.9841811
EXPORTACIONES               0.8871995     1.0000000                 -0.9230163
PROFESIONALES_TECNIFICADOS -0.9841811    -0.9230163                  1.0000000
PROFESIONALES              -0.4784961    -0.3168828                  0.4204968
                           PROFESIONALES
ANIOS                         -0.4784961
EXPORTACIONES                 -0.3168828
PROFESIONALES_TECNIFICADOS     0.4204968
PROFESIONALES                  1.0000000

Tabla 1: La matriz de correlación

La Tabla 1, permite identificar la relación lineal entre las variables cuantitativas del estudio. Se observan asociaciones tanto positivas como negativas que pueden sugerir vínculos estructurales entre el crecimiento económico y variables como la inversión en educación o tecnología. Esta herramienta es clave para orientar la selección de variables en modelos posteriores, así como para detectar posibles problemas de multicolinealidad en el análisis.

cor_matriz_pval <- function(data) {
  n <- ncol(data)
  matriz_pval <- matrix(NA, n, n)
  rownames(matriz_pval) <- colnames(data)
  colnames(matriz_pval) <- colnames(data)
  
  for (i in 1:n) {
    for (j in 1:n) {
      matriz_pval[i, j] <- cor.test(data[[i]], data[[j]], use = "complete.obs")$p.value
    }
  }
  return(matriz_pval)
}

Aplicar a las variables numéricas

p_values <- cor_matriz_pval(datos_numericos)

Mostrar la matriz de p-valores

print(p_values)
                                  ANIOS EXPORTACIONES
ANIOS                      0.000000e+00  6.126893e-12
EXPORTACIONES              6.126893e-12 3.331048e-244
PROFESIONALES_TECNIFICADOS 7.227935e-25  2.119353e-14
PROFESIONALES              4.850704e-03  7.236901e-02
                           PROFESIONALES_TECNIFICADOS PROFESIONALES
ANIOS                                    7.227935e-25   0.004850704
EXPORTACIONES                            2.119353e-14   0.072369010
PROFESIONALES_TECNIFICADOS               0.000000e+00   0.014826376
PROFESIONALES                            1.482638e-02   0.000000000

Tabla 2: Matriz de p-valores

La tabla 2 de p-valores complementa el análisis de correlación al indicar la significancia estadística de cada relación entre variables. Un p-valor bajo (generalmente menor a 0.05) sugiere que la correlación observada no es producto del azar, sino que existe evidencia estadística suficiente para considerarla significativa. Por el contrario, p-valores altos indican que no se puede descartar la hipótesis nula de ausencia de relación. Esta matriz permite filtrar las correlaciones más relevantes y respalda la rigurosidad del análisis empírico.

Graficar la matriz de correlaciones con ggcorrplot

library(ggcorrplot)
ggcorrplot(matriz_cor, lab = TRUE, hc.order = F, type = "lower",
           lab_size = 2,tl.cex = 8)

Figura 2: Matriz de correlaciones

La figura 2 revela relaciones interesantes entre las variables. A medida que pasa el tiempo, las exportaciones muestran una clara tendencia al alza, lo cual podría interpretarse como una señal de crecimiento económico sostenido. Sin embargo, este avance no parece estar acompañado por un aumento en la cantidad de profesionales tecnificados, lo cual genera una alerta: el desarrollo económico no siempre va de la mano con la formación técnica de la población. Además, se observa cierta desconexión entre el crecimiento de las exportaciones y la cantidad general de profesionales, lo que sugiere que el progreso económico podría estar concentrado en sectores que no necesariamente requieren mano de obra calificada. Por otro lado, sí se nota una relación más coherente entre quienes tienen formación profesional y aquellos que han sido tecnificados, lo cual indica que ambos grupos tienden a evolucionar en conjunto. Este panorama plantea la necesidad de políticas que vinculen más directamente el crecimiento económico con la formación y tecnificación del talento humano.

Generar la matriz de correlaciones con corrplot

library(corrplot)
corrplot 0.95 loaded
corrplot(matriz_cor, method = "color", type = "lower", 
         addCoef.col = "black", tl.col = "blue",number.cex = 0.5, 
         tl.cex = 0.4, cl.cex = 0.4)

Figura 3: Matriz de correlaciones

La figura 3 evidencia que, con el paso de los años, las exportaciones han crecido de forma consistente, lo cual refleja una evolución positiva en el ámbito económico. No obstante, este crecimiento no parece estar acompañado por una mejora paralela en la formación técnica de la población, ya que se nota un distanciamiento entre el desarrollo económico y la tecnificación profesional. Esta desconexión podría indicar que los avances en comercio exterior no están siendo aprovechados para fortalecer el capital humano calificado. Por otro lado, existe una relación positiva entre los profesionales en general y aquellos con formación técnica, lo que sugiere que ambos grupos tienden a crecer en conjunto, aunque no necesariamente en sincronía con el dinamismo económico del país. En conjunto, estos patrones invitan a reflexionar sobre la necesidad de políticas públicas que articulen el crecimiento económico con la capacitación técnica y profesional de la población.

modelo <- lm(EXPORTACIONES ~PROFESIONALES + PROFESIONALES_TECNIFICADOS, data = data)

Mostrar el resumen del modelo

summary(modelo)

Call:
lm(formula = EXPORTACIONES ~ PROFESIONALES + PROFESIONALES_TECNIFICADOS, 
    data = data)

Residuals:
       Min         1Q     Median         3Q        Max 
-1.728e+10 -4.593e+09 -5.395e+08  3.914e+09  2.157e+10 

Coefficients:
                             Estimate Std. Error t value Pr(>|t|)    
(Intercept)                 1.058e+11  1.977e+10   5.350 8.66e-06 ***
PROFESIONALES               7.396e+08  6.477e+08   1.142    0.263    
PROFESIONALES_TECNIFICADOS -6.772e+10  5.350e+09 -12.658 1.45e-13 ***
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 9.202e+09 on 30 degrees of freedom
Multiple R-squared:  0.8581,    Adjusted R-squared:  0.8487 
F-statistic: 90.73 on 2 and 30 DF,  p-value: 1.899e-13

Tabla 3: Resumen del modelo

El modelo evalúa cómo influyen la cantidad de profesionales y profesionales tecnificados sobre el nivel de exportaciones. Los resultados muestran que el modelo es altamente significativo en su conjunto, lo cual se evidencia por un valor p muy bajo y un R-cuadrado ajustado elevado, indicando que explica gran parte de la variabilidad en las exportaciones.

Al analizar los coeficientes, se observa que la variable relacionada con los profesionales tecnificados tiene un impacto estadísticamente significativo y negativo sobre las exportaciones. Esto sugiere que, en este contexto particular, un aumento en este grupo podría estar asociado a una disminución en las exportaciones, lo cual podría responder a factores estructurales, desalineaciones entre formación y demanda del mercado, o problemas en la integración de estos profesionales al sector exportador.

En contraste, la variable que representa a los profesionales en general no resulta estadísticamente significativa, lo que indica que, en este modelo, su presencia no muestra una relación clara o relevante con el comportamiento de las exportaciones.

Estos resultados invitan a reflexionar sobre la calidad, pertinencia y aplicación de la formación técnica y profesional en el país, y sobre la necesidad de alinear las políticas educativas y de formación con las dinámicas reales del sector productivo.

Usar el modelo para predecir el ingreso en estas edades

predicciones <- predict(modelo)

Mostrar predicciones

data.frame(predicciones)
   predicciones
1   15275473067
2   16827631201
3   18568771244
4   20031527818
5   19496723338
6   19730461299
7   23628109420
8   25483511543
9   25574213657
10  26880508184
11  27155120631
12  25174726813
13  30628457333
14  36666568821
15  42428592299
16  47070531543
17  51395488813
18  54725775559
19  55548928274
20  59530340827
21  62476208658
22  63911272794
23  66405037238
24  68048965403
25  71220093834
26  71612728352
27  69679151941
28  69443842295
29  70504595474
30  72166791166
31  74020405237
32  72223100061
33  76296345864