This is an R Markdown document. Markdown is a simple formatting syntax for authoring HTML, PDF, and MS Word documents. For more details on using R Markdown see http://rmarkdown.rstudio.com.
When you click the Knit button a document will be generated that includes both content as well as the output of any embedded R code chunks within the document. You can embed an R code chunk like this:
summary(cars)
## speed dist
## Min. : 4.0 Min. : 2.00
## 1st Qu.:12.0 1st Qu.: 26.00
## Median :15.0 Median : 36.00
## Mean :15.4 Mean : 42.98
## 3rd Qu.:19.0 3rd Qu.: 56.00
## Max. :25.0 Max. :120.00
You can also embed plots, for example:
Note that the echo = FALSE parameter was added to the code chunk to prevent printing of the R code that generated the plot.
###P1 Carga los paquetes necesarios para trabajar con data.table y poder abrir la base de datos en formato .dta (readstata13)
install.packages("data.table")
install.packages("readstata13")
install.packages("fastDummies")
library("readstata13")
library("data.table")
library("fastDummies")
###P2 Descargue la base de datos de la Casen 2015. Carga esta base de datos
Casen15<-read.dta13("Casen 2015.dta",generate.factors = TRUE)
Casen15<-data.table(Casen15)
###P3 Crea un subconjunto de la base, que tendrá solo las variables que nos interesa analizar: folio,o,sexo,edad,region,zona,ecivil,esc,educ,pco1,ypch,ypchtot,ypchautcor,ypchtrabajo,pobreza,expr
casen15<-data.frame(folio,o,sexo,edad,region,zona,ecivil,esc,educ,pco1,ypch,ypchtot,ypchautcor,ypchtrabajo,pobreza,expr)
#Se transforman alguas variables en dummies para usarlas despuès
casen15<-dummy_cols(casen15, select_columns = c("pobreza"))
###P4 Crea la variable mujer = 1 cuando sexo = mujer y mujer = 0 cuando sexo = hombre
casen15$Mujer[casen15$sexo==2]<-1
casen15$Mujer[casen15$sexo==1]<-0
###P5 Define experiencia laboral como la edad menos los años de escolaridad menos 6
casen15$exp_laboral<-(casen15$edad-casen15$esc-6)
###P6 Renombra pco1 por “relacion_jf”
colnames(casen15)[10]<-c("relación_jf")
###P7 Plantee un modelo poblacional de regresión lineal simple para poder predecir el ingreso.
linear_model<-lm(casen15$ypchtot~casen15$Mujer)
###P8
linear_model<-lm(casen15$ypchtot~casen15$Mujer)
summary(linear_model)
casen15$ingmodel1<-(301243+(-16773)*casen15$Mujer)
Dados los coeficientes del modelo de regersiòn lineal se puede estimar que el ingreso de las mujeres de la muestra es de 301243-16773 y el de los hombres 301243. Para ver el ingreso de cada observacion se crea la nueva variable ingmodel1.
###P9
linear_model$residual
###P10
linear_model2<-lm(casen15$ypchtot~casen15$Mujer+casen15$edad+casen15$pobreza_1+casen15$pobreza_2)
###P11
linear_model2<-lm(casen15$ypchtot~casen15$Mujer+casen15$edad+casen15$pobreza_1+casen15$pobreza_2)
summary(linear_model2)
casen15$ingmodel2<-(287049.04+(-18871.78)*casen15$Mujer+1290.96*casen15$edad+(-263700.68)*casen15$pobreza_1+(-229943.86)*casen15$pobreza_2)
Se creo una nueva variable que estima el valor del salario segun las caracteristicas de las observaciones segun lo que estimo el modelo 2 (linear_model2)
###P12
linear_model2$residuals
###P12
linear_model3<-lm(casen15$ypchtot~casen15$Mujer+casen15$esc+casen15$exp_laboral)
summary(linear_model3)
#la diferencia de salario es de un 27150.64 siendo la mujer la que gana menos.