“María Camila Gómez Gómez (2040636)” “Juan Sebastian Piedrahita (2041011)”
El archivo de datos Growth contiene datos sobre las tasas medias de crecimiento desde 1960 a 1995 para 65 países, junto con variables que potencialmente están relacionadas con el crecimiento. Este ejercicio investigará la relación entre el crecimiento y el comercio.
library(haven)
library(readr)
library(ggplot2)
library(readxl)
Growth <- read_dta("C:/Users/Lenovo/Downloads/Growth.dta")
View(Growth)
Realice un diagrama de dispersión de la tasa media de crecimiento anual (Growth) sobre la cuota media de participación del comercio (TradeShare). ¿Parece que existe relación entre las variables?
plot(Growth$tradeshare, Growth$growth,
xlab = "Cuota media de participación del comercio",
ylab = "Tasa media de crecimiento anual",col = c("#C625B7","#3AE7F9","#B214F2"),
main = "Relación entre crecimiento y comercio")
fit <- lm(growth ~ tradeshare, data = Growth) # Ajustar el modelo de regresión
abline(fit, col = "blue") # Línea de regresión
Al analizar la gráfica de dispersión se puede observar que los datos estan considerablemente algo alejados de la linea de regresión, por lo tanto, se puede decir que aunque exista cierta relación entre estas dos variables no es muy fuerte. En todo caso, hay más maneras de ver la relación que tienen entre sí, esta solo es una forma de verla a través de la linealidad.
A continuación se muestra la gráfica de dispersión:
Gráfica de dispersión
Excluyendo los datos de Malta, realice una regresión de la variable Growth sobre las variables TradeShare, YearsSchool, Rev–Coups, Assassinations, y RGDP60. Comente la significancia de las variables e interprete el coeficiente de la variable de interés.
data <- Growth[Growth$country_name != "Malta", ] # Quitar los datos de Malta
# Ajustar el modelo de regresión
model <- lm(growth ~ tradeshare + yearsschool +rev_coups + assasinations + rgdp60, data = Growth)
summary(model) # Mostrar los resultados del modelo
En el modelo presentado, para medir la relación entre el comercio y el crecimiento de varios países se usó cinco variables:
“tradeshare”: Indica la cuota media de participación del comercio.
“yearsschool”:Representa el nivel de años de educación escolar.
“rev_coups”:Mide el número de revoluciones y golpes de Estado ocurridos en un país.
“assasinations”:Indica el número de asesinatos políticos registrados.
“rgdp”:Representa el Producto Interno Bruto (PIB) en el año 1960.
Para ver la significancia de las variables se va a usar el p-valor, si es menor que el valor de significancia (0.05) entonces si es significativo.
Para tradeshare se halló un coeficiente de 1.5616, esto indica que un aumento de una unidad en la media del comercio produce un aumento de 1.5616 en el crecimiento anual. Con el p-valor se mostró que si es una variable significativa.
Para yearsschool se halló un coeficiente de 0.5748, esto indica que un aumento de una unidad en la media de escolaridad produce un aumento de 0.5748 en el crecimiento anual. Con el p-valor se mostró que si es una variable altamente significativa.
Para rev_coups se halló un coeficiente de -2.15, esto indica que un aumento de una unidad en la media de las revoluciones produce una disminución de 2.15 en el crecimiento anual. Con el p-valor se mostró que si es una variable significativa marginal.
Para assasinations se halló un coeficiente de 0.3540, esto indica que un aumento de una unidad en la media de los asesinatos políticos produce un aumento de 0.3540 en el crecimiento anual. Con el p-valor se mostró que no es una variable significativa.
Para rgdp60 se halló un coeficiente de -0.00046, esto indica que un aumento de una unidad en la media del PIB de 1960 produce una disminución del 0.00046 en el crecimiento anual. Con el p-valor se mostró que si es una variable significativa.
Construya un intervalo de confianza al 95 % para el coeficiente de la variable TradeShare. ¿Es estadísticamente significativo el coeficiente al nivel del 5%?
conf_int <- confint(fit, "tradeshare", level = 0.95)
conf_int_tradeshare <- conf_int["tradeshare", ]
conf_int_tradeshare
Hay un 95% de probabilidad de que el coeficiente real de tradeshare esté comprendido entre 0.7607 y 3.8521. El intervalo es estadísticamente significativo al nivel del 5% ya que no incluye el valor del cero. Hay que tener en cuenta que si fuera 0 eso implicaría que la variable explicativa y la variable dependiente tuviera una relación de cero, o sea, ninguna.
Compruebe si, como grupo, las variables YearsSchool, Rev–Coups, Assessinations, y RGDP60 pueden ser omitidas de la regresión. ¿Cuál es el p-valor del estadístico F?
#Modelo con todas las variables
modelo1 <- lm(growth ~ tradeshare + yearsschool + rev_coups + assasinations + rgdp60, data = Growth)
#Reducir el modelo
modelo_reducido <- lm(growth ~ tradeshare, data = Growth)
# Hacer la prueba de significando usando el estadístico F
anova_result <- anova(modelo1, modelo_reducido)
# Obtener el p-valor del estadístico F
p_value <- anova_result$Pr[2]
p_value
El p-valor obtenido del estadístico F es 0.000884076, como se puede observar este número es muy pequeño, lo que significa que se puede rechazar la hipótesis nula, no se pueden omitir estas variables como grupo.
Utilice la regresión para predecir la tasa de crecimiento de un país
con i. una participación del comercio de un 0.5
ii. con una participación en el comercio igual a 1.0. Si es necesario,
puede utilizar en la predicción los valores promedio de las otras
variables explicativas.
# Predicción con participación en el comercio de 0.5
prediction_0.5 <- predict(modelo_reducido, newdata = data.frame(tradeshare = 0.5))
# Predicción con participación en el comercio de 1.0
prediction_1.0 <- predict(modelo_reducido, newdata = data.frame(tradeshare = 1.0))
# Imprimir las predicciones
cat("Predicción con participación en el comercio de 0.5:", prediction_0.5, "\n")
cat("Predicción con participación en el comercio de 1.0:", prediction_1.0, "\n")
Al hacer las predicciones se obtuvo que: - La predicción con participación en el comercio del 0.5 dió como resultado que el crecimiento anual del país sea del 1.793482. - La predicción con participación en el comercio del 1.0 dió como resultado que el crecimiento anual del país sea del 2.946699.