library(readxl)
<- read_excel("DATOS_ARGENTINA.xlsx")
data View(data)
ARGENTINA
Introducción al Análisis de Correlación y de Regresión Lineal
Cargar librerías necesarias
library(dplyr) # Para manipulación de datos
library(ggplot2) # Para visualización de datos
library(haven) # Para leer archivos .dta de Stata
install.packages(“ggcorrplot”)(Ofrece una solución para reordenar la matriz de correlación y muestra el nivel de significancia en el correlograma)
library(ggcorrplot)
install.packages(“corrplot”)(es una herramienta para visualizar matrices de correlación de forma clara e intuitiva)
library(corrplot)
install.packages(“car”)
library(car)
#Setear directorio de trabajo setwd(“C:/Users/LENOVO/Desktop/ARGENTINA”)
#Cargar la base de datos
Ver las primeras filas del dataset
head(data)
# A tibble: 6 × 4
ANIOS EXPORTACIONES PROFESIONALES_TECNIFICADOS PROFESIONALES
<dbl> <dbl> <dbl> <dbl>
1 1991 11978000000 1.78 40.6
2 1992 12235000000 1.76 40.5
3 1993 13118000000 1.70 37.9
4 1994 15659000000 1.67 37.4
5 1995 20967000000 1.65 34.5
6 1996 23811000000 1.63 33.2
Comprobar si hay valores perdidos en las variables de interés
sum(is.na(data$EXPORTACIONES))
[1] 0
sum(is.na(data$PROFESIONALES_TECNIFICADOS))
[1] 0
sum(is.na(data$PROFESIONALES))
[1] 0
#Ejemplo1: Análisis de Correlación # Calcular la correlación de Pearson entre Agricultores varones y obreros varones
<- cor(data$PROFESIONALES_TECNIFICADOS, data$PROFESIONALES, use = "complete.obs") correlacion
Mostrar el coeficiente de correlación
cat("El coeficiente de correlación de Pearson entre profesionales tecnificados y profesionales es:", correlacion)
El coeficiente de correlación de Pearson entre profesionales tecnificados y profesionales es: 0.4204968
Por lo tanto, un coeficiente de correlacion de 0,42 nos indica que,hay una correlacion positiva moderada entre ambas variables, por lo que, si crece el numero de profesionales tecnificados argentinos, aumentaran tambien los profesionales de manera general de dicho pais.
library(ggplot2)
Crear un gráfico de dispersión con una línea de regresión
ggplot(data, aes(x = ANIOS, y = EXPORTACIONES)) +
geom_point(color = "blue", alpha = 0.5) + # Puntos del gráfico
geom_smooth(method = "lm", color = "red", se = FALSE) + # Línea de regresión lineal
labs(title = "Variacion de las exportaciones",
x = "Años",
y = "Total de exportaciones") +
theme_minimal()
`geom_smooth()` using formula = 'y ~ x'
Figura 1: Cambios en las exportaciones.
Según la Figura 1, se observa una tendencia creciente en las exportaciones del país a lo largo del tiempo. Este aumento sostenido en el comercio exterior sugiere una mejora en la capacidad productiva y en la inserción de la nación en los mercados internacionales. Como resultado, se generan mayores ingresos fiscales y divisas, lo cual puede traducirse en una mayor disponibilidad de recursos para sectores clave como la educación y la tecnificación. Este tipo de inversión no solo fortalece el capital humano, sino que también impulsa el desarrollo social y económico de la población en su conjunto, creando un círculo virtuoso entre crecimiento económico y bienestar ciudadano.
# Seleccionar solo las variables numéricas
library(dplyr)
Adjuntando el paquete: 'dplyr'
The following objects are masked from 'package:stats':
filter, lag
The following objects are masked from 'package:base':
intersect, setdiff, setequal, union
<- select(data, ANIOS, EXPORTACIONES, PROFESIONALES_TECNIFICADOS, PROFESIONALES) datos_numericos
Calcular la matriz de correlaciones
<- cor(datos_numericos, use = "complete.obs") matriz_cor
Mostrar la matriz de correlaciones
print(matriz_cor)
ANIOS EXPORTACIONES PROFESIONALES_TECNIFICADOS
ANIOS 1.0000000 0.8871995 -0.9841811
EXPORTACIONES 0.8871995 1.0000000 -0.9230163
PROFESIONALES_TECNIFICADOS -0.9841811 -0.9230163 1.0000000
PROFESIONALES -0.4784961 -0.3168828 0.4204968
PROFESIONALES
ANIOS -0.4784961
EXPORTACIONES -0.3168828
PROFESIONALES_TECNIFICADOS 0.4204968
PROFESIONALES 1.0000000
Tabla 1: La matriz de correlación
La Tabla 1, permite identificar la relación lineal entre las variables cuantitativas del estudio. Se observan asociaciones tanto positivas como negativas que pueden sugerir vínculos estructurales entre el crecimiento económico y variables como la inversión en educación o tecnología. Esta herramienta es clave para orientar la selección de variables en modelos posteriores, así como para detectar posibles problemas de multicolinealidad en el análisis.
<- function(data) {
cor_matriz_pval <- ncol(data)
n <- matrix(NA, n, n)
matriz_pval rownames(matriz_pval) <- colnames(data)
colnames(matriz_pval) <- colnames(data)
for (i in 1:n) {
for (j in 1:n) {
<- cor.test(data[[i]], data[[j]], use = "complete.obs")$p.value
matriz_pval[i, j]
}
}return(matriz_pval)
}
Aplicar a las variables numéricas
<- cor_matriz_pval(datos_numericos) p_values
Mostrar la matriz de p-valores
print(p_values)
ANIOS EXPORTACIONES
ANIOS 0.000000e+00 6.126893e-12
EXPORTACIONES 6.126893e-12 3.331048e-244
PROFESIONALES_TECNIFICADOS 7.227935e-25 2.119353e-14
PROFESIONALES 4.850704e-03 7.236901e-02
PROFESIONALES_TECNIFICADOS PROFESIONALES
ANIOS 7.227935e-25 0.004850704
EXPORTACIONES 2.119353e-14 0.072369010
PROFESIONALES_TECNIFICADOS 0.000000e+00 0.014826376
PROFESIONALES 1.482638e-02 0.000000000
Tabla 2: Matriz de p-valores
La tabla 2 de p-valores complementa el análisis de correlación al indicar la significancia estadística de cada relación entre variables. Un p-valor bajo (generalmente menor a 0.05) sugiere que la correlación observada no es producto del azar, sino que existe evidencia estadística suficiente para considerarla significativa. Por el contrario, p-valores altos indican que no se puede descartar la hipótesis nula de ausencia de relación. Esta matriz permite filtrar las correlaciones más relevantes y respalda la rigurosidad del análisis empírico.
Graficar la matriz de correlaciones con ggcorrplot
library(ggcorrplot)
ggcorrplot(matriz_cor, lab = TRUE, hc.order = F, type = "lower",
lab_size = 2,tl.cex = 8)
Figura 2: Matriz de correlaciones
La figura 2 revela relaciones interesantes entre las variables. A medida que pasa el tiempo, las exportaciones muestran una clara tendencia al alza, lo cual podría interpretarse como una señal de crecimiento económico sostenido. Sin embargo, este avance no parece estar acompañado por un aumento en la cantidad de profesionales tecnificados, lo cual genera una alerta: el desarrollo económico no siempre va de la mano con la formación técnica de la población. Además, se observa cierta desconexión entre el crecimiento de las exportaciones y la cantidad general de profesionales, lo que sugiere que el progreso económico podría estar concentrado en sectores que no necesariamente requieren mano de obra calificada. Por otro lado, sí se nota una relación más coherente entre quienes tienen formación profesional y aquellos que han sido tecnificados, lo cual indica que ambos grupos tienden a evolucionar en conjunto. Este panorama plantea la necesidad de políticas que vinculen más directamente el crecimiento económico con la formación y tecnificación del talento humano.
Generar la matriz de correlaciones con corrplot
library(corrplot)
corrplot 0.95 loaded
corrplot(matriz_cor, method = "color", type = "lower",
addCoef.col = "black", tl.col = "blue",number.cex = 0.5,
tl.cex = 0.4, cl.cex = 0.4)
Figura 3: Matriz de correlaciones
La figura 3 evidencia que, con el paso de los años, las exportaciones han crecido de forma consistente, lo cual refleja una evolución positiva en el ámbito económico. No obstante, este crecimiento no parece estar acompañado por una mejora paralela en la formación técnica de la población, ya que se nota un distanciamiento entre el desarrollo económico y la tecnificación profesional. Esta desconexión podría indicar que los avances en comercio exterior no están siendo aprovechados para fortalecer el capital humano calificado. Por otro lado, existe una relación positiva entre los profesionales en general y aquellos con formación técnica, lo que sugiere que ambos grupos tienden a crecer en conjunto, aunque no necesariamente en sincronía con el dinamismo económico del país. En conjunto, estos patrones invitan a reflexionar sobre la necesidad de políticas públicas que articulen el crecimiento económico con la capacitación técnica y profesional de la población.
<- lm(EXPORTACIONES ~PROFESIONALES + PROFESIONALES_TECNIFICADOS, data = data) modelo
Mostrar el resumen del modelo
summary(modelo)
Call:
lm(formula = EXPORTACIONES ~ PROFESIONALES + PROFESIONALES_TECNIFICADOS,
data = data)
Residuals:
Min 1Q Median 3Q Max
-1.728e+10 -4.593e+09 -5.395e+08 3.914e+09 2.157e+10
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 1.058e+11 1.977e+10 5.350 8.66e-06 ***
PROFESIONALES 7.396e+08 6.477e+08 1.142 0.263
PROFESIONALES_TECNIFICADOS -6.772e+10 5.350e+09 -12.658 1.45e-13 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 9.202e+09 on 30 degrees of freedom
Multiple R-squared: 0.8581, Adjusted R-squared: 0.8487
F-statistic: 90.73 on 2 and 30 DF, p-value: 1.899e-13
Tabla 3: Resumen del modelo
El modelo evalúa cómo influyen la cantidad de profesionales y profesionales tecnificados sobre el nivel de exportaciones. Los resultados muestran que el modelo es altamente significativo en su conjunto, lo cual se evidencia por un valor p muy bajo y un R-cuadrado ajustado elevado, indicando que explica gran parte de la variabilidad en las exportaciones.
Al analizar los coeficientes, se observa que la variable relacionada con los profesionales tecnificados tiene un impacto estadísticamente significativo y negativo sobre las exportaciones. Esto sugiere que, en este contexto particular, un aumento en este grupo podría estar asociado a una disminución en las exportaciones, lo cual podría responder a factores estructurales, desalineaciones entre formación y demanda del mercado, o problemas en la integración de estos profesionales al sector exportador.
En contraste, la variable que representa a los profesionales en general no resulta estadísticamente significativa, lo que indica que, en este modelo, su presencia no muestra una relación clara o relevante con el comportamiento de las exportaciones.
Estos resultados invitan a reflexionar sobre la calidad, pertinencia y aplicación de la formación técnica y profesional en el país, y sobre la necesidad de alinear las políticas educativas y de formación con las dinámicas reales del sector productivo.
Usar el modelo para predecir el ingreso en estas edades
<- predict(modelo) predicciones
Mostrar predicciones
data.frame(predicciones)
predicciones
1 15275473067
2 16827631201
3 18568771244
4 20031527818
5 19496723338
6 19730461299
7 23628109420
8 25483511543
9 25574213657
10 26880508184
11 27155120631
12 25174726813
13 30628457333
14 36666568821
15 42428592299
16 47070531543
17 51395488813
18 54725775559
19 55548928274
20 59530340827
21 62476208658
22 63911272794
23 66405037238
24 68048965403
25 71220093834
26 71612728352
27 69679151941
28 69443842295
29 70504595474
30 72166791166
31 74020405237
32 72223100061
33 76296345864