Tarea 5

Including Plots

You can also embed plots, for example:

Note that the echo = FALSE parameter was added to the code chunk to prevent printing of the R code that generated the plot.

###P1 Carga los paquetes necesarios para trabajar con data.table y poder abrir la base de datos en formato .dta (readstata13)

install.packages("data.table")
install.packages("readstata13")
install.packages("fastDummies")
library("readstata13")
library("data.table")
library("fastDummies")

###P2 Descargue la base de datos de la Casen 2015. Carga esta base de datos

Casen15<-read.dta13("Casen 2015.dta",generate.factors = TRUE)
Casen15<-data.table(Casen15)

###P3 Crea un subconjunto de la base, que tendrá solo las variables que nos interesa analizar: folio,o,sexo,edad,region,zona,ecivil,esc,educ,pco1,ypch,ypchtot,ypchautcor,ypchtrabajo,pobreza,expr

casen15<-data.frame(folio,o,sexo,edad,region,zona,ecivil,esc,educ,pco1,ypch,ypchtot,ypchautcor,ypchtrabajo,pobreza,expr)


#Se transforman alguas variables en dummies para usarlas despuès

casen15<-dummy_cols(casen15,  select_columns = c("pobreza"))

###P4 Crea la variable mujer = 1 cuando sexo = mujer y mujer = 0 cuando sexo = hombre

casen15$Mujer[casen15$sexo==2]<-1
casen15$Mujer[casen15$sexo==1]<-0

###P5 Define experiencia laboral como la edad menos los años de escolaridad menos 6

casen15$exp_laboral<-(casen15$edad-casen15$esc-6)

###P6 Renombra pco1 por “relacion_jf”

colnames(casen15)[10]<-c("relación_jf")

###P7 Plantee un modelo poblacional de regresión lineal simple para poder predecir el ingreso.

linear_model<-lm(casen15$ypchtot~casen15$Mujer)

###P8

linear_model<-lm(casen15$ypchtot~casen15$Mujer)
summary(linear_model)
casen15$ingmodel1<-(301243+(-16773)*casen15$Mujer)

Dados los coeficientes del modelo de regersiòn lineal se puede estimar que el ingreso de las mujeres de la muestra es de 301243-16773 y el de los hombres 301243. Para ver el ingreso de cada observacion se crea la nueva variable ingmodel1.

###P9

linear_model$residual

###P10

linear_model2<-lm(casen15$ypchtot~casen15$Mujer+casen15$edad+casen15$pobreza_1+casen15$pobreza_2)

###P11

linear_model2<-lm(casen15$ypchtot~casen15$Mujer+casen15$edad+casen15$pobreza_1+casen15$pobreza_2)
summary(linear_model2)

casen15$ingmodel2<-(287049.04+(-18871.78)*casen15$Mujer+1290.96*casen15$edad+(-263700.68)*casen15$pobreza_1+(-229943.86)*casen15$pobreza_2)

Se creo una nueva variable que estima el valor del salario segun las caracteristicas de las observaciones segun lo que estimo el modelo 2 (linear_model2)

###P12

linear_model2$residuals

###P12

linear_model3<-lm(casen15$ypchtot~casen15$Mujer+casen15$esc+casen15$exp_laboral)
summary(linear_model3)

#la diferencia de salario es de un 27150.64 siendo la mujer la que gana menos.

Tarea 5

R Markdown

Including Plots