library(readxl)
data <- read_excel("DatosT3.xls")New names:
• `` -> `...6`
View(data)Instalar paquetes y librerias library(dplyr) Para manipulación de datos library (ggplot2) Para visualización de datos library (haven) Para leer archivos .dta de Stata install.packages(“ggcorrplot”)(Ofrece una solución para reordenar la matriz de correlación y muestra el nivel de significancia en el correlograma) library(ggcorrplot) install.packages(“corrplot”)(es una herramienta para visualizar matrices de correlación de forma clara e intuitiva) library(corrplot) install.packages(“car”) library(car)
Setear el documento setwd(“C:/Users/JEFERSON CHAMBA/Desktop/Tarea 3”)
Cargar la base de datos
library(readxl)
data <- read_excel("DatosT3.xls")New names:
• `` -> `...6`
View(data)Correlación entre inversión directa extranjera y el pib
correlacion <- cor(data$IE, data$PIB, use = "complete.obs")cat("El coeficiente de correlación de Pearson entre años de escolaridad e ingreso es:", correlacion)El coeficiente de correlación de Pearson entre años de escolaridad e ingreso es: -0.4751757
Es una correlación negativa moderada es decir a medida que aumenta la IE el PIB tiende a disminuir
gráfico de dispersión con una línea de regresión
library(ggplot2)ggplot(data, aes(x = IE, y = PIB)) +
geom_point(color = "blue", alpha = 0.5) + # Puntos del gráfico
geom_smooth(method = "lm", color = "red", se = FALSE) + # Línea de regresión lineal
labs(title = "Relación entre IE Y PIB",
x = "IE",
y = "PIB") +
theme_minimal()`geom_smooth()` using formula = 'y ~ x'
Análisis: la relación es positiva creciente, es decir que a mayor tasa de sempleo, mayor inversion extranjera. Raro a primera vista pero analicemos un poco porque contradice la intuición de cualquier ciudadano en pensar que a mayor inversion extrajera directa deveria reducer la tasa de desempleo. Esto podria subyacer por la dinamica de crisis economicas que llevan a captar mas inversion o porque la inversion extranjera se ha dirigido a sectores que no generan empleo masivo.
Seleccionar solo las variables numéricas
library(dplyr)
Adjuntando el paquete: 'dplyr'
The following objects are masked from 'package:stats':
filter, lag
The following objects are masked from 'package:base':
intersect, setdiff, setequal, union
datos_numericos <- select(data, IE, PIB, Des)Calcular la matriz de correlaciones
matriz_cor <- cor(datos_numericos, use = "complete.obs")print(matriz_cor) IE PIB Des
IE 1.0000000 -0.4751757 0.6108108
PIB -0.4751757 1.0000000 -0.6427203
Des 0.6108108 -0.6427203 1.0000000
IE VS PIB Relación negativa moderada la ie sube el pib baja IE VS Desempleo Relación postiva moderada fuerte. A mayor ie aumenta el des PIB VS Desempleo Relación negativa fuerte. A mayor PIB, menor desempleo
calcular correlaciones y p-valores
cor_matriz_pval <- function(data) {
n <- ncol(data)
matriz_pval <- matrix(NA, n, n)
rownames(matriz_pval) <- colnames(data)
colnames(matriz_pval) <- colnames(data)
for (i in 1:n) {
for (j in 1:n) {
matriz_pval[i, j] <- cor.test(data[[i]], data[[j]], use = "complete.obs")$p.value
}
}
return(matriz_pval)
}Aplicar a las variables numéricas
p_values <- cor_matriz_pval(datos_numericos)print(p_values) IE PIB Des
IE 1.547064e-275 2.958794e-03 5.943426e-05
PIB 2.958794e-03 0.000000e+00 1.792294e-05
Des 5.943426e-05 1.792294e-05 0.000000e+00
Graficar la matriz de correlaciones con ggcorrplot
library(ggcorrplot)
ggcorrplot(matriz_cor, lab = TRUE, hc.order = F, type = "lower",
lab_size = 2,tl.cex = 8)Generar la matriz de correlaciones con corrplot
library(corrplot)corrplot 0.95 loaded
corrplot(matriz_cor, method = "color", type = "lower",
addCoef.col = "black", tl.col = "blue",number.cex = 0.5,
tl.cex = 0.4, cl.cex = 0.4)