“María Camila Gómez Gómez (2040636)” “Juan Sebastian Piedrahita (2041011)”

Punto 2

El archivo de datos Growth contiene datos sobre las tasas medias de crecimiento desde 1960 a 1995 para 65 países, junto con variables que potencialmente están relacionadas con el crecimiento. Este ejercicio investigará la relación entre el crecimiento y el comercio.

library(haven)
library(readr)
library(ggplot2)
library(readxl)
Growth <- read_dta("C:/Users/Lenovo/Downloads/Growth.dta")
View(Growth)

Inciso “a”

Realice un diagrama de dispersión de la tasa media de crecimiento anual (Growth) sobre la cuota media de participación del comercio (TradeShare). ¿Parece que existe relación entre las variables?

plot(Growth$tradeshare, Growth$growth,
     xlab = "Cuota media de participación del comercio",
     ylab = "Tasa media de crecimiento anual",col = c("#C625B7","#3AE7F9","#B214F2"),
     main = "Relación entre crecimiento y comercio")
fit <- lm(growth ~ tradeshare, data = Growth)  # Ajustar el modelo de regresión
abline(fit, col = "blue")  # Línea de regresión

Al analizar la gráfica de dispersión se puede observar que los datos estan considerablemente algo alejados de la linea de regresión, por lo tanto, se puede decir que aunque exista cierta relación entre estas dos variables no es muy fuerte. En todo caso, hay más maneras de ver la relación que tienen entre sí, esta solo es una forma de verla a través de la linealidad.

A continuación se muestra la gráfica de dispersión:

Gráfica de dispersión

Inciso “b”

Excluyendo los datos de Malta, realice una regresión de la variable Growth sobre las variables TradeShare, YearsSchool, Rev–Coups, Assassinations, y RGDP60. Comente la significancia de las variables e interprete el coeficiente de la variable de interés.

data <- Growth[Growth$country_name != "Malta", ]   # Quitar los datos de Malta

# Ajustar el modelo de regresión
model <- lm(growth ~ tradeshare + yearsschool +rev_coups + assasinations + rgdp60, data = Growth)

summary(model) # Mostrar los resultados del modelo

En el modelo presentado, para medir la relación entre el comercio y el crecimiento de varios países se usó cinco variables:

“tradeshare”: Indica la cuota media de participación del comercio.

“yearsschool”:Representa el nivel de años de educación escolar.

“rev_coups”:Mide el número de revoluciones y golpes de Estado ocurridos en un país.

“assasinations”:Indica el número de asesinatos políticos registrados.

“rgdp”:Representa el Producto Interno Bruto (PIB) en el año 1960.

Para ver la significancia de las variables se va a usar el p-valor, si es menor que el valor de significancia (0.05) entonces si es significativo.

Inciso “c”

Construya un intervalo de confianza al 95 % para el coeficiente de la variable TradeShare. ¿Es estadísticamente significativo el coeficiente al nivel del 5%?

conf_int <- confint(fit, "tradeshare", level = 0.95)
conf_int_tradeshare <- conf_int["tradeshare", ]
conf_int_tradeshare

Hay un 95% de probabilidad de que el coeficiente real de tradeshare esté comprendido entre 0.7607 y 3.8521. El intervalo es estadísticamente significativo al nivel del 5% ya que no incluye el valor del cero. Hay que tener en cuenta que si fuera 0 eso implicaría que la variable explicativa y la variable dependiente tuviera una relación de cero, o sea, ninguna.

Inciso “d”

Compruebe si, como grupo, las variables YearsSchool, Rev–Coups, Assessinations, y RGDP60 pueden ser omitidas de la regresión. ¿Cuál es el p-valor del estadístico F?

#Modelo con todas las variables
modelo1 <- lm(growth ~ tradeshare + yearsschool + rev_coups + assasinations + rgdp60, data = Growth)
#Reducir el modelo
modelo_reducido <- lm(growth ~ tradeshare, data = Growth)
# Hacer la prueba de significando usando el estadístico F
anova_result <- anova(modelo1, modelo_reducido)
# Obtener el p-valor del estadístico F
p_value <- anova_result$Pr[2]
p_value

El p-valor obtenido del estadístico F es 0.000884076, como se puede observar este número es muy pequeño, lo que significa que se puede rechazar la hipótesis nula, no se pueden omitir estas variables como grupo.

Inciso “e”

Utilice la regresión para predecir la tasa de crecimiento de un país con i. una participación del comercio de un 0.5
ii. con una participación en el comercio igual a 1.0. Si es necesario, puede utilizar en la predicción los valores promedio de las otras variables explicativas.

# Predicción con participación en el comercio de 0.5
prediction_0.5 <- predict(modelo_reducido, newdata = data.frame(tradeshare = 0.5))

# Predicción con participación en el comercio de 1.0
prediction_1.0 <- predict(modelo_reducido, newdata = data.frame(tradeshare = 1.0))


# Imprimir las predicciones
cat("Predicción con participación en el comercio de 0.5:", prediction_0.5, "\n")
cat("Predicción con participación en el comercio de 1.0:", prediction_1.0, "\n")

Al hacer las predicciones se obtuvo que: - La predicción con participación en el comercio del 0.5 dió como resultado que el crecimiento anual del país sea del 1.793482. - La predicción con participación en el comercio del 1.0 dió como resultado que el crecimiento anual del país sea del 2.946699.