Tarea 3

Author

Jefferson Chamba Nelson Tsukanka

Introducción al análisis de correlación y de regresión lineal

Instalar paquetes y librerias library(dplyr) Para manipulación de datos library (ggplot2) Para visualización de datos library (haven) Para leer archivos .dta de Stata install.packages(“ggcorrplot”)(Ofrece una solución para reordenar la matriz de correlación y muestra el nivel de significancia en el correlograma) library(ggcorrplot) install.packages(“corrplot”)(es una herramienta para visualizar matrices de correlación de forma clara e intuitiva) library(corrplot) install.packages(“car”) library(car)

Setear el documento setwd(“C:/Users/JEFERSON CHAMBA/Desktop/Tarea 3”)

Cargar la base de datos

library(readxl)
data <- read_excel("DatosT3.xls")
New names:
• `` -> `...6`
View(data)

Ejemplo1: Análisis de Correlación

Correlación entre inversión directa extranjera y el pib

correlacion <- cor(data$IE, data$PIB, use = "complete.obs")
cat("El coeficiente de correlación de Pearson entre años de escolaridad e ingreso es:", correlacion)
El coeficiente de correlación de Pearson entre años de escolaridad e ingreso es: -0.4751757

Es una correlación negativa moderada es decir a medida que aumenta la IE el PIB tiende a disminuir

gráfico de dispersión con una línea de regresión

library(ggplot2)
ggplot(data, aes(x = IE, y = PIB)) +
  geom_point(color = "blue", alpha = 0.5) +  # Puntos del gráfico
  geom_smooth(method = "lm", color = "red", se = FALSE) +  # Línea de regresión lineal
  labs(title = "Relación entre IE Y PIB",
       x = "IE",
       y = "PIB") +
  theme_minimal()
`geom_smooth()` using formula = 'y ~ x'

Análisis: la relación es positiva creciente, es decir que a mayor tasa de sempleo, mayor inversion extranjera. Raro a primera vista pero analicemos un poco porque contradice la intuición de cualquier ciudadano en pensar que a mayor inversion extrajera directa deveria reducer la tasa de desempleo. Esto podria subyacer por la dinamica de crisis economicas que llevan a captar mas inversion o porque la inversion extranjera se ha dirigido a sectores que no generan empleo masivo.

Seleccionar solo las variables numéricas

library(dplyr)

Adjuntando el paquete: 'dplyr'
The following objects are masked from 'package:stats':

    filter, lag
The following objects are masked from 'package:base':

    intersect, setdiff, setequal, union
datos_numericos <- select(data, IE, PIB, Des)

Calcular la matriz de correlaciones

matriz_cor <- cor(datos_numericos, use = "complete.obs")
print(matriz_cor)
            IE        PIB        Des
IE   1.0000000 -0.4751757  0.6108108
PIB -0.4751757  1.0000000 -0.6427203
Des  0.6108108 -0.6427203  1.0000000

IE VS PIB Relación negativa moderada la ie sube el pib baja IE VS Desempleo Relación postiva moderada fuerte. A mayor ie aumenta el des PIB VS Desempleo Relación negativa fuerte. A mayor PIB, menor desempleo

calcular correlaciones y p-valores

cor_matriz_pval <- function(data) {
  n <- ncol(data)
  matriz_pval <- matrix(NA, n, n)
  rownames(matriz_pval) <- colnames(data)
  colnames(matriz_pval) <- colnames(data)
  
  for (i in 1:n) {
    for (j in 1:n) {
      matriz_pval[i, j] <- cor.test(data[[i]], data[[j]], use = "complete.obs")$p.value
    }
  }
  return(matriz_pval)
}

Aplicar a las variables numéricas

p_values <- cor_matriz_pval(datos_numericos)
print(p_values)
               IE          PIB          Des
IE  1.547064e-275 2.958794e-03 5.943426e-05
PIB  2.958794e-03 0.000000e+00 1.792294e-05
Des  5.943426e-05 1.792294e-05 0.000000e+00

Graficar la matriz de correlaciones con ggcorrplot

library(ggcorrplot)
ggcorrplot(matriz_cor, lab = TRUE, hc.order = F, type = "lower",
           lab_size = 2,tl.cex = 8)

Generar la matriz de correlaciones con corrplot

library(corrplot)
corrplot 0.95 loaded
corrplot(matriz_cor, method = "color", type = "lower", 
         addCoef.col = "black", tl.col = "blue",number.cex = 0.5, 
         tl.cex = 0.4, cl.cex = 0.4)