Taller final de Informatica para economistas 1

Grafico de Lineas:

la base de datos utilizada para la regresion lineal son las muertes en carreteras en Estados Unidos por estados

grafico de lineas

Explicacion de las variables

Deaths = numero de muertes

Drivers = numero de conductores

popden = densidad de poblacion

rural = longitud de los caminos rurales

temp = temperatura maximo en enero

fuel = consumo de combustible en 10,000,000 de galones estadounidenses por ano

Modelo lineal

stargazer del modelo

\[ Deaths = -56.085 + 4.648*drivers +5.275*temp-0.542*fuel \] Interpretacion del Modelo

\(\beta_1=\) si aumenta una unidad los conductores, las muertes aumentarian 4.64

-P values: los consuctores de cada ciudad son relevantes para explicar las muertes que hay en cada ciudad de Estado Unidos con un nivel de significancia del 1%

-los demas coeficientes no se interpretaran, porque no tienen relevancia para explicar el modelo.

-\(R^2\): si r2=0.92, las variables independientes explican la variación de las muertes en un 92%.

-\(R^2\)ajustado: Si r2 ajustado es 0.91, las variables independientes explican en un 91% la variacion de las muertes considerando los grados de libertad.

Grafico de correlacion:

stargazer del modelo

Interpretacion de la Matriz de correlacion

-las varaibles que presentan una gran correlacion son las muertes y el numero de conductores, ya que ante un aumento de conductores se presentaria un mayor numero de muertes en las autopistas.

Grafico de residuos:

stargazer del modelo

Codigo

codigo utilizado para las graficas y el modelo:
library(MASS)
library(modelr)
library(stargazer)
library(tidyverse)
library(modelr)
library(GGally)
library(plot3D)
library(corrplot)

data(road)
View(road)

muertes <- road
inteligencia <- ability.cov

MLI <- lm(data = muertes, deaths ~.- rural - popden )
summary(MLI)
stargazer(MLI,type = "text",out = "infotallerfin.doc")

road %>% 
  select(-rural,-popden) %>% 
  ggpairs(., 
          title = "Matriz de correlaciones"
          )

ggplot(muertes, aes(x= drivers, y = deaths)) + 
  geom_abline(intercept = 7, slope = 1.5, colour = "grey40") +
  geom_point(colour = "grey40") +
  geom_linerange(aes(ymin = rural, ymax= deaths), colour = "#3366FF") 

sim1 <- muertes %>% 
  add_residuals(MLI)

sim1 %>% 
  sample_n(10)
ggplot(sim1, aes(deaths, resid)) + 
  geom_ref_line(h = 0, size = 2,colour = "firebrick") +
  geom_point()