Introducción

El análisis de la relación entre las exportaciones y las inversiones en investigación y desarrollo (I+D) es crucial para entender cómo las inversiones en innovación impactan el desempeño económico de un país o empresa. En este análisis, exploraremos cómo el monto invertido en I+D interna afecta las exportaciones totales utilizando un modelo de regresión lineal simple.

Carga y Exploración de Datos, Correlación de Pearson y Modelo de Regresión Lineal

Primero, cargamos y exploramos los datos, calculamos la correlación de Pearson entre las variables y ajustamos el modelo de regresión lineal simple.

data <- read.csv("C:/Users/Lenovo/Downloads/EDIT_X_2019_2020 (1).csv", sep = ";")

data <- data[c("I3R2C2", "II1R1C2")]

data <- na.omit(data)

summary(data)
##      I3R2C2             II1R1C2        
##  Min.   :        0   Min.   :       0  
##  1st Qu.:        0   1st Qu.:       0  
##  Median :        0   Median :       0  
##  Mean   : 11158570   Mean   :  176222  
##  3rd Qu.:  1984948   3rd Qu.:    8439  
##  Max.   :578632293   Max.   :10275878
# Correlación de Pearson
correlation <- cor(data$II1R1C2, data$I3R2C2, method = "pearson")
print(paste("Correlación de Pearson: ", correlation))
## [1] "Correlación de Pearson:  0.704319347576549"
# Ajustar el modelo de regresión lineal
modelo <- lm(I3R2C2 ~ II1R1C2, data = data)

# Resumen del modelo
summary(modelo)
## 
## Call:
## lm(formula = I3R2C2 ~ II1R1C2, data = data)
## 
## Residuals:
##        Min         1Q     Median         3Q        Max 
## -185212371   -3317207   -3317207   -2573753  425684279 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 3.317e+06  7.772e+05   4.268 2.06e-05 ***
## II1R1C2     4.450e+01  1.009e+00  44.104  < 2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 33650000 on 1976 degrees of freedom
## Multiple R-squared:  0.4961, Adjusted R-squared:  0.4958 
## F-statistic:  1945 on 1 and 1976 DF,  p-value: < 2.2e-16
# Gráfico de valores reales vs ajustados
plot(data$I3R2C2, modelo$fitted.values, 
     xlab = "Valores Reales (Exportaciones)", ylab = "Valores Predichos", 
     main = "Valores Reales vs Predicciones", col = "green")
abline(0, 1, col = "red", lty = 2)

# Instalar y cargar bibliotecas necesarias
if (!requireNamespace("ggplot2")) install.packages("ggplot2")
## Loading required namespace: ggplot2
if (!requireNamespace("reshape2")) install.packages("reshape2")
## Loading required namespace: reshape2
library(ggplot2)
## Warning: package 'ggplot2' was built under R version 4.4.2
library(reshape2)
## Warning: package 'reshape2' was built under R version 4.4.2
# Calcular la matriz de correlación
correlation_matrix <- cor(data, method = "pearson")

# Transformar la matriz en formato largo para graficar
correlation_long <- melt(correlation_matrix)

#gráfico de mapa de calor
ggplot(correlation_long, aes(Var1, Var2, fill = value)) +
  geom_tile(color = "white") +
  scale_fill_gradient2(low = "blue", high = "red", mid = "white", midpoint = 0, 
                       limit = c(-1, 1), space = "Lab", name = "Correlación") +
  theme_minimal() +
  theme(axis.text.x = element_text(angle = 45, vjust = 1, hjust = 1)) +
  labs(title = "Mapa de Calor de la Correlación de Pearson",
       x = "Variables", y = "Variables")

El análisis muestra que las inversiones en actividades de I+D tienen un efecto significativo en las exportaciones. La correlación de Pearson y el modelo de regresión lineal sugieren que existe una relación positiva entre ambas variables. Este modelo puede ayudar a las empresas y gobiernos a comprender cómo las inversiones en innovación impactan las exportaciones y a diseñar políticas para fomentar el crecimiento económico.