AA2 Argentina

Author

Jhon Maurat Geanella Ramon

Introducción al Análisis de Correlación y de Regresión Lineal

Cargar librerías necesarias

library(dplyr) # Para manipulación de datos library(ggplot2) # Para visualización de datos library(haven) # Para leer archivos .dta de Stata install.packages(“ggcorrplot”)(Ofrece una solución para reordenar la matriz de correlación y muestra el nivel de significancia en el correlograma) library(ggcorrplot) install.packages(“corrplot”)(es una herramienta para visualizar matrices de correlación de forma clara e intuitiva) library(corrplot) install.packages(“car”) library(car)

#Setear directorio de trabajo setwd(“C:/Users/JHON/Desktop/AA2 Practica”)

# Cargar la base de datos (ajusta la ruta del archivo)
library(haven)
data <- read_dta("Data1_R.dta")
View(data)
# Ver las primeras filas del dataset
head(data)
# A tibble: 6 × 6
   year           GDP         EXPO         FINAL         IMPO        MANUF
  <dbl>         <dbl>        <dbl>         <dbl>        <dbl>        <dbl>
1  1995 348389357874. 33146105665. 267825034566. 27376556730. 55107442936.
2  1996 367643757075. 35680720379. 281178649162. 32175418246. 58662907786.
3  1997 397463514161. 40025718989. 303850402358. 40821452847. 64031404789.
4  1998 412766570326. 44277808444. 314355009306. 44256140758. 65215189237.
5  1999 398792535409. 43719784992. 310272627208. 39269903518. 60044363410.
6  2000 395646066536. 44901264662. 308829967825. 39208026467. 57748736303.
# Comprobar si hay valores perdidos en las variables de interés
sum(is.na(data$EXPO))
[1] 1
sum(is.na(data$GDP))
[1] 1
######## Análisis de Correlación #####################
# Calcular la correlación de Pearson entre ingreso y edad
correlacion <- cor(data$EXPO, data$GDP, use = "complete.obs")
# Mostrar el coeficiente de correlación
cat("El coeficiente de correlación de Pearson entre exportaciones y el crecimiento economico es:", correlacion)
El coeficiente de correlación de Pearson entre exportaciones y el crecimiento economico es: 0.893642
# Interpretación:
# - Si el valor está cerca de 1, hay una relación positiva fuerte.
# - Si está cerca de -1, hay una relación negativa fuerte.
# - Si está cerca de 0, no hay relación lineal entre las variables.

La ecuación de Mincer sugiere que cada año adicional de estudios produce un índice de rendimiento privado (es decir, individual) del 5-8 % anual.

Es una correlación positiva, es decir a medida que aumentan l las importaciones, el ingreso también aumenta.

library(ggplot2)

Crear un gráfico de dispersión con una línea de regresión

ggplot(data, aes(x = EXPO, y = GDP)) +
  geom_point(color = "blue", alpha = 0.5) +  # Puntos del gráfico
  geom_smooth(method = "lm", color = "red", se = FALSE) +  # Línea de regresión lineal
  labs(title = "Relación entre Exportaciones y el crecimiento economico",
       x = "Exportaciones",
       y = "Crecimiento Economico") +
  theme_minimal()
`geom_smooth()` using formula = 'y ~ x'
Warning: Removed 1 row containing non-finite outside the scale range
(`stat_smooth()`).
Warning: Removed 1 row containing missing values or values outside the scale range
(`geom_point()`).

Seleccionar solo las variables numéricas

library(dplyr)

Adjuntando el paquete: 'dplyr'
The following objects are masked from 'package:stats':

    filter, lag
The following objects are masked from 'package:base':

    intersect, setdiff, setequal, union
datos_numericos <- select(data, GDP, EXPO, FINAL, IMPO, MANUF)  # Agrega más variables si es necesario

Calcular la matriz de correlaciones

matriz_cor <- cor(datos_numericos, use = "complete.obs"); matriz_cor
            GDP      EXPO     FINAL      IMPO     MANUF
GDP   1.0000000 0.8936420 0.9885622 0.9621912 0.9452046
EXPO  0.8936420 1.0000000 0.8382727 0.7835177 0.8569310
FINAL 0.9885622 0.8382727 1.0000000 0.9779906 0.9036193
IMPO  0.9621912 0.7835177 0.9779906 1.0000000 0.8975723
MANUF 0.9452046 0.8569310 0.9036193 0.8975723 1.0000000

Función para calcular correlaciones y p-valores

cor_matriz_pval <- function(data) {
  n <- ncol(data)
  matriz_pval <- matrix(NA, n, n)
  rownames(matriz_pval) <- colnames(data)
  colnames(matriz_pval) <- colnames(data)
  
  for (i in 1:n) {
    for (j in 1:n) {
      matriz_pval[i, j] <- cor.test(data[[i]], data[[j]], use = "complete.obs")$p.value
    }
  }
  return(matriz_pval)
}

Aplicar a las variables numéricas

p_values <- cor_matriz_pval(datos_numericos)

Mostrar la matriz de p-valores

print(p_values)
               GDP         EXPO        FINAL         IMPO        MANUF
GDP   0.000000e+00 6.796593e-11 1.011031e-23 8.857341e-17 1.199564e-14
EXPO  6.796593e-11 0.000000e+00 1.383017e-08 5.007840e-07 2.969136e-09
FINAL 1.011031e-23 1.383017e-08 0.000000e+00 6.538307e-20 1.910473e-11
IMPO  8.857341e-17 5.007840e-07 6.538307e-20 0.000000e+00 4.187288e-11
MANUF 1.199564e-14 2.969136e-09 1.910473e-11 4.187288e-11 0.000000e+00

Graficar la matriz de correlaciones con ggcorrplot

library(ggcorrplot)
ggcorrplot(matriz_cor, lab = TRUE, hc.order = F, type = "lower",
           lab_size = 2,tl.cex = 8)

# Generar la matriz de correlaciones con corrplot
library(corrplot)
corrplot 0.95 loaded
corrplot(matriz_cor, method = "color", type = "lower", 
         addCoef.col = "black", tl.col = "blue",number.cex = 0.5, 
         tl.cex = 0.4, cl.cex = 0.4)

Análisis de regresión lineal

Ajustar un modelo de regresión lineal bivariado

#(simple): Exportaciones ~ Desarrollo Economico

modelo <- lm(EXPO ~ GDP, data = data)

Mostrar el resumen del modelo

summary(modelo)

Call:
lm(formula = EXPO ~ GDP, data = data)

Residuals:
       Min         1Q     Median         3Q        Max 
-8.990e+09 -4.598e+09 -1.089e+09  5.930e+09  8.729e+09 

Coefficients:
              Estimate Std. Error t value Pr(>|t|)    
(Intercept) -5.934e+08  5.966e+09  -0.099    0.922    
GDP          1.226e-01  1.185e-02  10.347  6.8e-11 ***
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 5.881e+09 on 27 degrees of freedom
  (1 observation deleted due to missingness)
Multiple R-squared:  0.7986,    Adjusted R-squared:  0.7911 
F-statistic: 107.1 on 1 and 27 DF,  p-value: 6.797e-11

#Modelo de regresión lineal multivariado

#(más complejo): GDP ~ EXPO, FINAL, IMPO, MANUF

modelo2 <- lm(GDP ~ EXPO+FINAL+IMPO+MANUF+year, data = data)
summary(modelo2)

Call:
lm(formula = GDP ~ EXPO + FINAL + IMPO + MANUF + year, data = data)

Residuals:
       Min         1Q     Median         3Q        Max 
-7.644e+09 -3.148e+09  5.204e+08  2.449e+09  7.153e+09 

Coefficients:
              Estimate Std. Error t value Pr(>|t|)    
(Intercept) -1.792e+12  7.967e+11  -2.250 0.034329 *  
EXPO         7.805e-01  1.856e-01   4.205 0.000338 ***
FINAL        6.040e-01  8.435e-02   7.161 2.72e-07 ***
IMPO        -5.397e-02  2.502e-01  -0.216 0.831095    
MANUF        2.132e+00  2.875e-01   7.415 1.54e-07 ***
year         9.211e+08  4.026e+08   2.288 0.031674 *  
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 4.554e+09 on 23 degrees of freedom
  (1 observation deleted due to missingness)
Multiple R-squared:  0.9981,    Adjusted R-squared:  0.9976 
F-statistic:  2369 on 5 and 23 DF,  p-value: < 2.2e-16

Análisis: Exportaciones A medida que aumenta las exportaciones en n año el desarrollo economico aumenta un $7,80 dado que es estadisticamente significativo

Precio Final de consumidor a medida que aumenta en una unidad el desarrollo economico aumenta en $6.04

Importaciones cuando aumenta las importaciones en una unidad es decir hay mas importacion al pais el desarrollo economico se reduce en $5.39

Manufactura esta variable nos indica que si se encuentra en produccion nacional va a aumentar el desarrollo economico en $2.13

el modelo de desarrollo argentino pos convertibilidad dentro del actual proceso de transformación del capitalismo y superación de la fase neoliberal como estrategia de desarrollo. Presentamos la teoría de la regulación como el marco teórico sobre el cual se sostiene nuestro estudio y conceptualización del modelo de desarrollo. A partir de allí avanzamos en la caracterización de los principales elementos de la estrategia de desarrollo que derivaron en la crisis del 2001, abriendo espacio para la reconversión de las estructuras sociales y económicas que contiene el capitalismo en Argentina. En este contexto, abordamos el análisis de la configuración del modelo de desarrollo para el período 2003-2010 con el objetivo de determinar el alcance transformador en relación al ciclo neoliberal.

(Angelis, Calvento, and Roark 2013)

References

Angelis, Ignacio de, Mariana Calvento, and Mariano Roark. 2013. “¿Hacia un nuevo modelo de desarrollo? Desde la teoría de la regulación. Argentina 2003- 2010.” Problemas del Desarrollo 44 (173): 31–56. https://doi.org/10.1016/s0301-7036(13)71874-1.