R Markdown

This is an R Markdown document. Markdown is a simple formatting syntax for authoring HTML, PDF, and MS Word documents. For more details on using R Markdown see http://rmarkdown.rstudio.com.

When you click the Knit button a document will be generated that includes both content as well as the output of any embedded R code chunks within the document. You can embed an R code chunk like this:

summary(cars)
##      speed           dist       
##  Min.   : 4.0   Min.   :  2.00  
##  1st Qu.:12.0   1st Qu.: 26.00  
##  Median :15.0   Median : 36.00  
##  Mean   :15.4   Mean   : 42.98  
##  3rd Qu.:19.0   3rd Qu.: 56.00  
##  Max.   :25.0   Max.   :120.00

Including Plots

You can also embed plots, for example:

Note that the echo = FALSE parameter was added to the code chunk to prevent printing of the R code that generated the plot.

###P1 Carga los paquetes necesarios para trabajar con data.table y poder abrir la base de datos en formato .dta (readstata13)

install.packages("data.table")
install.packages("readstata13")
install.packages("fastDummies")
library("readstata13")
library("data.table")
library("fastDummies")

###P2 Descargue la base de datos de la Casen 2015. Carga esta base de datos

Casen15<-read.dta13("Casen 2015.dta",generate.factors = TRUE)
Casen15<-data.table(Casen15)

###P3 Crea un subconjunto de la base, que tendrá solo las variables que nos interesa analizar: folio,o,sexo,edad,region,zona,ecivil,esc,educ,pco1,ypch,ypchtot,ypchautcor,ypchtrabajo,pobreza,expr

casen15<-data.frame(folio,o,sexo,edad,region,zona,ecivil,esc,educ,pco1,ypch,ypchtot,ypchautcor,ypchtrabajo,pobreza,expr)


#Se transforman alguas variables en dummies para usarlas despuès

casen15<-dummy_cols(casen15,  select_columns = c("pobreza")) 

###P4 Crea la variable mujer = 1 cuando sexo = mujer y mujer = 0 cuando sexo = hombre

casen15$Mujer[casen15$sexo==2]<-1
casen15$Mujer[casen15$sexo==1]<-0

###P5 Define experiencia laboral como la edad menos los años de escolaridad menos 6

casen15$exp_laboral<-(casen15$edad-casen15$esc-6)

###P6 Renombra pco1 por “relacion_jf”

colnames(casen15)[10]<-c("relación_jf")

###P7 Plantee un modelo poblacional de regresión lineal simple para poder predecir el ingreso.

linear_model<-lm(casen15$ypchtot~casen15$Mujer)

###P8

linear_model<-lm(casen15$ypchtot~casen15$Mujer)
summary(linear_model)
casen15$ingmodel1<-(301243+(-16773)*casen15$Mujer)

Dados los coeficientes del modelo de regersiòn lineal se puede estimar que el ingreso de las mujeres de la muestra es de 301243-16773 y el de los hombres 301243. Para ver el ingreso de cada observacion se crea la nueva variable ingmodel1.

###P9

linear_model$residual

###P10

linear_model2<-lm(casen15$ypchtot~casen15$Mujer+casen15$edad+casen15$pobreza_1+casen15$pobreza_2)

###P11

linear_model2<-lm(casen15$ypchtot~casen15$Mujer+casen15$edad+casen15$pobreza_1+casen15$pobreza_2)
summary(linear_model2)

casen15$ingmodel2<-(287049.04+(-18871.78)*casen15$Mujer+1290.96*casen15$edad+(-263700.68)*casen15$pobreza_1+(-229943.86)*casen15$pobreza_2)

Se creo una nueva variable que estima el valor del salario segun las caracteristicas de las observaciones segun lo que estimo el modelo 2 (linear_model2)

###P12

linear_model2$residuals

###P12

linear_model3<-lm(casen15$ypchtot~casen15$Mujer+casen15$esc+casen15$exp_laboral)
summary(linear_model3)

#la diferencia de salario es de un 27150.64 siendo la mujer la que gana menos.