Se han previsto en el subdirectorio llamado .DAT dos archivos con menor número de datos. Se usará el archivo CPS78 para responder esta pregunta. El cual contiene 550 observaciones de 20 variables: ED, SOUTH, NONWH, HISP, FE, MARR, MARRFE, EX, EXSQ, UNION, LNWAGE, AGE, NDEP,MANUF, CONSTR, MANAG, SALES, CLER, SERV,PROF. Primero, leeremos los datos del archivo cps78.txt.
ruta<-"C:/Users/Diego/Desktop/Econometria/cps78.txt"
cps78<-read.table(ruta,header=TRUE)
Obtener la media aritmética y las desviación estándar de LNWAGE, posteriormente obtener la media geométrica usando su exponencial. Comparar ambas medias. Asumimos que el año de trabajo cuenta con 2000 horas. Ademas calcular la media y la desviación estandar de los años de escolaridad (ED) y los años de experiencia potencial (EX).
Armean<-mean(cps78$LNWAGE)
sd(cps78$LNWAGE)
## [1] 0.490157
Armean
## [1] 1.681002
(Armean*2000)
## [1] 3362.004
expArmean<-(2000*cps78$LNWAGE)
expArmean
## [1] 2430.0 3218.8 4280.2 4146.4 3298.0 3429.6 2197.2 3665.2 713.4 4309.4
## [11] 3973.4 3409.4 4220.4 3665.2 2616.6 4460.0 5051.4 4795.8 2505.6 4158.8
## [21] 4029.8 2408.0 2772.6 2462.2 3008.2 5199.4 4476.0 4707.8 5051.4 1872.2
## [31] 4029.8 2262.8 3316.4 4135.4 4164.0 4309.4 3934.2 5518.6 2594.4 2505.6
## [41] 4749.8 3273.6 2464.2 3498.4 4605.2 3116.2 3218.8 3116.2 4108.2 3665.2
## [51] 3891.8 3665.2 2371.2 1823.6 3743.6 3891.8 4338.2 4029.8 3289.6 4214.4
## [61] 3258.4 2118.8 4338.2 2643.6 3711.0 3498.4 3932.2 2396.4 3855.8 4605.2
## [71] 2772.6 -940.0 2630.2 5798.8 3996.2 3409.4 2357.4 3218.8 4029.8 4969.8
## [81] 4158.8 4280.2 3165.6 4669.2 3300.6 3095.2 3541.4 3218.8 2589.4 4080.4
## [91] 2643.6 3712.6 4220.4 4726.4 1341.4 3158.0 4280.2 3326.0 5225.4 4338.2
## [101] 3218.8 4158.8 3028.2 2381.4 3583.6 4460.0 1949.2 4082.4 3583.6 4325.6
## [111] 4969.8 3583.6 3391.2 5051.4 1949.2 4218.0 2589.4 1949.2 2447.6 2408.0
## [121] 2094.6 3643.2 2278.8 1832.6 4416.6 4338.2 3583.6 2772.6 3743.6 2408.0
## [131] 2432.8 3819.0 3527.2 2591.6 2643.6 3133.8 3218.8 2858.2 3316.4 3811.6
## [141] 4029.8 1911.0 5291.0 5053.8 3218.8 2772.6 2129.4 3052.2 2893.8 3743.6
## [151] 6112.8 3767.8 2505.6 3178.4 3641.0 3583.6 3627.4 4394.4 3321.4 3218.8
## [161] 3767.8 2643.6 2505.6 4990.0 3743.6 2447.6 3477.0 4158.8 2890.6 2893.8
## [171] 2575.8 3498.4 4095.4 3665.2 2797.4 3665.2 3863.0 3915.4 3665.2 2505.6
## [181] 2476.8 1226.2 4029.8 4338.2 2860.0 3281.0 3855.8 3962.0 3116.2 4338.2
## [191] 4029.8 3954.4 3806.6 3665.2 4514.2 3712.6 -156.0 3348.0 3218.8 4158.8
## [201] 3665.2 5841.6 2278.8 3665.2 3168.2 4164.0 3409.4 3649.0 3984.8 2059.2
## [211] 4511.6 4605.2 3275.2 3168.2 4353.6 3665.2 4815.8 3927.2 3948.2 2870.2
## [221] 4158.8 2408.0 2505.6 4338.2 4029.8 904.0 4158.8 3385.6 2865.0 2985.8
## [231] 2278.8 3447.4 3052.2 2197.2 2315.0 3116.2 2587.2 2951.8 2561.8 2772.6
## [241] 4240.6 2696.2 3043.4 3063.0 2842.8 3962.0 2893.8 6264.4 1774.6 4702.8
## [251] 4338.2 2505.6 2854.2 3481.0 4453.2 1935.2 3665.2 3218.8 2357.4 4502.6
## [261] 4029.8 2023.2 3218.8 2059.2 1949.2 1621.8 2575.8 3601.0 2197.2 2387.8
## [271] 2643.6 3297.4 2643.6 1798.0 2759.4 2452.8 1844.0 1954.6 2031.8 3218.8
## [281] 3316.4 3454.4 2197.2 3891.8 4556.6 3066.6 2094.6 3035.8 3259.4 3743.6
## [291] 3218.8 5374.4 3781.6 2357.4 5416.0 4382.8 4240.6 3008.2 2357.4 2326.4
## [301] 1889.0 3218.8 2129.4 2129.4 4003.0 2278.8 3982.6 4029.8 2129.4 1949.2
## [311] 4315.2 2357.4 3987.2 3147.6 4445.0 3309.8 3454.4 4062.8 904.0 2643.6
## [321] 3218.8 4043.0 3363.6 3665.2 2505.6 3268.2 4605.2 3486.0 3665.2 2099.6
## [331] 4315.2 4765.2 3116.2 2846.2 2326.4 3248.6 4029.8 3973.4 2099.6 2772.6
## [341] 2643.6 3052.2 4394.4 3794.2 2278.8 2709.0 4240.6 4984.0 2197.2 3198.6
## [351] 4189.8 3218.8 5051.4 3665.2 3137.2 3428.6 2357.4 1386.2 3116.2 4795.8
## [361] 3218.8 3498.4 3258.4 2505.6 3218.8 2643.6 2505.6 3804.2 1985.0 2772.6
## [371] 3794.2 3454.4 1949.2 4605.2 4605.2 4082.4 3063.0 2772.6 4093.6 4580.0
## [381] 3743.6 3730.8 3461.8 3948.2 2893.8 2854.2 2529.8 3927.2 3454.4 2971.6
## [391] 2772.6 4303.6 4203.8 2023.2 3454.4 6702.8 2643.6 3583.6 3218.8 2258.2
## [401] 3297.4 3891.8 1730.0 3874.6 1730.0 2761.2 3218.8 3665.2 3335.4 2197.2
## [411] 3759.0 2197.2 3218.8 5488.8 4327.6 3218.8 3454.4 2616.6 4029.8 1940.8
## [421] 2722.0 2197.2 3297.4 5382.4 4082.4 3523.8 5051.4 3704.8 4158.8 3620.2
## [431] 2408.0 2693.2 3029.2 4220.4 1832.6 2294.8 2278.8 5051.4 2910.6 3583.6
## [441] 2870.2 5098.8 3084.4 1949.2 4003.0 2893.8 2643.6 3218.8 3973.4 4133.8
## [451] 2922.0 3620.2 3116.2 3665.2 4889.0 3486.0 3583.6 2357.4 2772.6 2489.6
## [461] 2893.8 5051.4 2059.2 4029.8 4189.8 1988.6 3855.8 1119.2 2432.8 2893.8
## [471] 3008.2 4338.2 4158.8 2230.2 3358.0 4369.6 3008.2 3409.4 2917.2 3459.4
## [481] 3665.2 2278.8 2499.2 4480.2 2772.6 2432.8 4163.0 3188.6 2146.6 3409.4
## [491] 4487.4 2278.8 1751.0 4208.2 2197.2 4338.2 2696.2 2197.2 4158.8 2587.2
## [501] 4280.2 4809.8 2797.4 2858.2 3982.6 2709.0 2533.8 4095.4 3218.8 4029.8
## [511] 1945.0 3665.2 2408.0 4605.2 2505.6 3008.2 2772.6 2023.2 2731.4 2643.6
## [521] 4605.2 4029.8 6435.8 3218.8 5168.0 2643.6 4203.8 3356.8 3498.4 1949.2
## [531] 3743.6 3218.8 1597.0 2408.0 2834.2 3774.2 3300.6 2385.0 4786.6 4377.8
## [541] 5051.4 3218.8 1832.6 4829.0 5051.4 4158.8 5316.6 4948.8 5278.2 5051.4
mean(expArmean)
## [1] 3362.004
mean(cps78$ED)
## [1] 12.53636
sd(cps78$ED)
## [1] 2.772087
mean(cps78$EX)
## [1] 18.71818
sd(cps78$EX)
## [1] 13.34653
Resultados: La media de LNWAGE*2000 horas al año es de 3362. Cabe resaltar que la media de LNWAGE es la misma que su exponencial. El promedio de años de escolaridad es de 12.53636 años. La desviación estandar de estos es de 2.772087.
Por otro lado, los años de experiencia tienen una media aritmética de 18.71818 años y una desviación estándar de 13.34653.
La variable dummy NONWH en cps78 es igual a 1 si el individuo es negro y no hispano. Encontrar la media muestral de NONWH? Obtener cuántos individuos hay en la muestra que son negros y no hispanos.
Otra variable dummy es HISP y es igual a 1 cuando los individuos son no blancos y de origen hispano. Encontrar la media muestral de HISP y Obtener cuántos individuos hay en la muestra que son de origen hispano.
Finalmente la variable dummy FE es igual a 1 cuando los individuos son mujeres. Obtener la proporción de la muestra que es mujer y el número de individuos que es de sexo femenino.
TotalNONWH<-sum(cps78$NONWH)
TotalNONWH
## [1] 57
TotalNONWH/550
## [1] 0.1036364
TotalHISP<-sum(cps78$HISP)
TotalHISP
## [1] 36
TotalHISP/550
## [1] 0.06545455
TotalFE<-sum(cps78$FE)
TotalFE
## [1] 207
TotalFE/550
## [1] 0.3763636
Resultados: De la muestra 57 son no blancos y no hispanos, esto equivale al 10.36% del total.
Por otro lado, 36 personas de la muestra son no blancos y con origen Hispano, esto equivale al 6.54% de la muestra.
Finalmente 207 individuos de la muestra son mujeres, lo cual equivale al 37.63% de la muestra.
Vamos a separar los datos de cps78 por género y calcular la media y desviación estándar de los años de escolaridad (ED) para los hombres y para las mujeres. Obtener la media geométrica de las tasas de salarios.
Ahora separaremos los datos por raza en tres categorías: blancos (WHI), no-blancos y no-hispanos (NONWH), e Hispánicos (HISP). Para cada uno de estos grupos comparemos: la media aritmética y desviación estándar de ED y la media geométrica y desviación estándar de la tasa del salario. Observar a quien corresponde la LNWAGE con mayor dispersión (mediremos sus desviación estándar).
#1.
SVFE<-subset(cps78, FE==1,
select = ED : LNWAGE)
PromFE<- mean(SVFE$ED)
PromFE
## [1] 12.76329
sd(SVFE$ED)
## [1] 2.220165
PromFELN<- mean(SVFE$LNWAGE)
sd(SVFE$ED)
## [1] 2.220165
exp(PromFELN)
## [1] 4.316358
SVMA<-subset(cps78, FE==0,
select = ED: LNWAGE)
mean(SVMA$ED)
## [1] 12.39942
sd(SVMA$ED)
## [1] 3.052312
PromMALN<- mean(SVMA$LNWAGE)
sd(SVMA$LNWAGE)
## [1] 0.4681736
# 2.
SVWH<-subset(cps78, NONWH==0,
select = ED : LNWAGE)
mean(SVWH$ED)
## [1] 12.63083
sd(SVWH$ED)
## [1] 2.672812
PromSVWH<- mean(SVWH$LNWAGE)
sd(SVWH$LNWAGE)
## [1] 0.4857381
exp(PromSVWH)
## [1] 5.476025
SVNONWH<-subset(cps78, NONWH==1,
select =ED : LNWAGE)
mean(SVNONWH$ED)
## [1] 11.7193
sd(SVNONWH$ED)
## [1] 3.436955
PromSVNONWH<- mean(SVNONWH$LNWAGE)
sd(SVNONWH$LNWAGE)
## [1] 0.5005347
exp(PromSVNONWH)
## [1] 4.542164
SVHISP<-subset(cps78, HISP==1,
select = ED : LNWAGE)
mean(SVHISP$ED)
## [1] 10.30556
sd(SVHISP$ED)
## [1] 3.655285
PromSVHISP<- mean(SVHISP$LNWAGE)
sd(SVHISP$LNWAGE)
## [1] 0.3712632
exp(PromSVHISP)
## [1] 4.616548
Resultados: Parte 1. Las mujeres estudian en promedio 12.76 años La desviación estándar de los años de estudio de las mismas es de 2.22 años. Los hombres estudian en promedio 12.39 años La desviación estándar de los mismos es de 3.05 años.
Parte 2. Basándonos en la raza:
Los individuos de raza blanca estudian un promedio de 12.63 años con una desviación estándar de 2.67. En cuanto a los individuos no blancos y no hispanos el promedio es de 11.71 años con desviacion estándar de 3.43. Por otro lado, los hispanos estudian en promedio 10.3 años con desviación estándar de 3.65.
En cuanto a los promedios geométricos tenemos que: El de las mujeres es 4.31 dólares por hora. El de los blancos es de 5.47 dólares por hora. El de los no blancos y no hispánicos es de 4.54 dólares por hora. El de los hispanos es de 4.61 dólares por hora.
Los individuos No blancos y no hispanos tienen una dispersión de LNWAGE de .5005 la cual es la mayor desviación estándar entre las variables de raza.
En la parte i) Repetiremos los inscisos a), b) y c) con los datos de 1985 contenidos en el archivo cps85. En la parte ii) Calcularemos y compararemos la media geométrica de los salarios reales por raza, género y de la muestra completa.
ruta<-"C:/Users/Diego/Desktop/Econometria/cps85.txt"
cps85<-read.table(ruta,header=TRUE)
Armean85<-mean(cps85$LNWAGE)
sd(cps85$LNWAGE)
## [1] 0.5277335
Armean85
## [1] 2.059181
(Armean85*2000)
## [1] 4118.363
expArmean85<-(2000*cps85$LNWAGE)
expArmean85
## [1] 4394.4 3409.4 2670.0 4702.8 5416.0 4394.4 4517.2 5416.0 4795.8 3218.8
## [11] 6435.8 6031.0 6437.8 5275.2 2505.6 3218.8 4605.2 5416.0 3526.0 4416.6
## [21] 4840.8 5129.8 4158.8 2908.0 4127.4 3875.8 6435.8 4605.2 5242.0 3454.4
## [31] 5371.6 6435.8 4969.8 5416.0 3507.0 5075.4 4921.0 5129.8 5051.4 6227.0
## [41] 4840.8 5466.2 4082.4 4943.0 3218.8 3743.6 4394.4 2418.0 3008.2 4707.8
## [51] 2505.6 5416.0 4280.2 4431.8 4523.6 3855.8 5271.0 4605.2 2643.6 4158.8
## [61] 4913.4 4368.8 2772.6 3409.4 2418.0 4761.0 3891.8 4605.2 3372.8 4029.8
## [71] 4840.8 4605.2 2772.6 5207.4 3819.0 5318.6 4554.6 2418.0 2447.6 3454.4
## [81] 3891.8 4605.2 3616.6 2855.8 3137.2 3498.4 3116.2 4476.0 3316.4 3198.8
## [91] 5928.0 5989.4 2772.6 3218.8 4718.0 4605.2 3996.2 5051.4 2772.6 5420.2
## [101] 5545.2 2539.6 3008.2 3030.2 2561.8 4158.8 3116.2 3813.2 4815.8 3583.6
## [111] 4605.2 4840.8 2747.4 5724.4 2533.8 3583.6 6182.0 3665.2 3008.2 4668.2
## [121] 5002.8 5798.8 5416.0 4338.2 5989.4 3794.2 4528.8 3409.4 4158.8 5991.4
## [131] 4502.6 4934.4 5262.2 3409.4 3891.8 4534.0 4723.6 2643.6 4969.8 4294.2
## [141] 5562.6 2643.6 4394.4 5149.0 5160.4 4449.2 3218.8 3583.6 3891.8 3095.2
## [151] 4029.8 3891.8 4834.8 3486.0 3409.4 4394.4 2834.2 4605.2 4029.8 2589.4
## [161] 4369.6 5780.8 2418.0 5198.0 6227.0 5888.8 4378.8 3891.8 2854.2 4570.8
## [171] 3794.2 3891.8 2582.0 6255.8 3218.8 6227.0 4969.8 3674.8 3008.2 3583.6
## [181] 3819.0 4338.2 5171.8 3665.2 4392.2 4029.8 4969.8 5278.2 5597.6 3665.2
## [191] 4702.8 4502.6 2197.2 4442.8 2772.6 2670.0 3583.6 3218.8 5416.0 3427.6
## [201] 4394.4 6435.8 4277.8 3218.8 6200.2 4447.0 4158.8 2505.6 2418.0 2418.0
## [211] 5991.4 2772.6 5780.8 3008.2 4111.4 1119.2 3297.4 4338.2 3218.8 2643.6
## [221] 3566.8 2772.6 3891.8 3218.8 3060.8 3498.4 6435.8 5518.6 5488.8 2418.0
## [231] 5798.8 4158.8 3583.6 5695.6 3409.4 4069.4 3665.2 3712.6 3767.8 5051.4
## [241] 5180.6 3409.4 4840.8 4726.4 4158.8 4644.8 3512.2 3975.8 7591.0 4702.8
## [251] 4472.8 3297.4 2893.8 5539.0 6227.0 3218.8 3335.4 3665.2 4605.2 3409.4
## [261] 3833.8 2197.2 4605.2 3158.0 4485.0 3583.6 2893.8 4799.4 4996.4 4263.6
## [271] 4872.2 5989.4 3855.8 3486.0 2418.0 3158.0 3498.4 3372.8 5154.0 4852.4
## [281] 4338.2 5006.2 3316.4 3429.6 3047.8 4029.8 4969.8 5545.2 2418.0 2985.8
## [291] 2893.8 5145.2 3891.8 3498.4 3743.6 4058.6 6040.8 3665.2 2691.0 5624.8
## [301] 4840.8 3463.4 3743.6 4095.4 3871.8 5416.0 3891.8 2418.0 3743.6 3665.2
## [311] 3218.8 2476.8 4349.6 4605.2 2772.6 4502.6 4689.4 3301.2 4029.8 3891.8
## [321] 4755.4 4372.2 2643.6 2643.6 4492.0 5416.0 2561.8 4969.8 4726.4 5278.2
## [331] 3218.8 4884.6 5236.2 4726.4 4016.4 3819.0 3541.4 2464.2 2940.4 5129.8
## [341] 5278.2 2513.2 2917.2 3534.0 3583.6 4795.8 6112.8 5351.8 3848.4 4605.2
## [351] 4605.2 6435.8 2643.6 3743.6 3218.8 3030.2 3743.6 4717.0 4515.2 4969.8
## [361] 4280.2 2822.0 3008.2 4884.6 4372.2 5307.8 5227.4 6200.2 5416.0 4173.8
## [371] 3819.0 3008.2 3891.8 4029.8 4029.8 4280.2 4158.8 2505.6 5051.4 3583.6
## [381] 3316.4 3218.8 2505.6 4795.8 4029.8 4280.2 5051.4 4749.8 5051.4 4108.2
## [391] 4969.8 2418.0 5979.0 3583.6 2879.6 2505.6 4969.8 2418.0 4394.4 2762.6
## [401] 3218.8 5078.0 5695.6 4502.6 5278.2 4280.2 2893.8 3515.8 4840.8 4969.8
## [411] 4840.8 4029.8 4208.2 3158.0 3116.2 3409.4 4502.6 4523.6 3030.2 5511.6
## [421] 4577.0 4605.2 3515.8 4037.2 4554.6 5129.8 4660.4 5198.0 5062.6 4310.4
## [431] 5169.6 3848.4 5046.6 3932.2 5051.4 4605.2 4605.2 4338.2 4476.0 4815.8
## [441] 3258.4 4029.8 2447.6 3008.2 3665.2 6045.8 4256.4 4158.8 4280.2 2643.6
## [451] 4394.4 4978.2 3008.2 3137.2 3743.6 4079.6 4467.2 3218.8 3616.6 4734.8
## [461] 2505.6 4605.2 4394.4 4029.8 3486.0 4280.2 2772.6 3498.4 3316.4 2505.6
## [471] 3008.2 3409.4 3665.2 4369.6 3316.4 4654.6 3665.2 2940.4 5764.8 4029.8
## [481] 3665.2 3008.2 3712.6 3153.2 2846.2 3270.2 3320.2 4102.6 5140.6 4158.8
## [491] 4073.8 4029.8 2094.6 3701.2 2505.6 4858.4 3409.4 4427.6 4148.8 3463.4
## [501] 3583.6 5198.0 2589.4 3665.2 3278.0 6538.4 1396.2 3218.8 4338.2 5051.4
## [511] 2772.6 3008.2 3743.6 3409.4 3855.8 3633.0 4102.6 0.0 5051.4 4360.8
## [521] 2940.4 4860.8 4378.8 2505.6 6516.2 4158.8 5545.2 3354.2 6292.6 4310.4
## [531] 5835.6 6200.2 5577.4 5937.8
mean(expArmean85)
## [1] 4118.363
mean(cps85$ED)
## [1] 13.01873
sd(cps85$ED)
## [1] 2.615373
mean(cps85$EX)
## [1] 17.8221
sd(cps85$EX)
## [1] 12.37971
Resultados: La media de LNWAGE*2000 horas al año con los nuevos datos es de 4118. Cabe resaltar que la media de LNWAGE es la misma que su exponencial. El promedio de años de escolaridad es de 13.018 años. La desviación estándar de estos es de 2.62.
Por otro lado, los años de experiencia tienen una media aritmética es de 17.822 años y una la desviación estándar es de 12.3797.
TotalNONWH85<-sum(cps85$NONWH)
TotalNONWH85
## [1] 67
TotalNONWH85/550
## [1] 0.1218182
TotalHISP85<-sum(cps85$HISP)
TotalHISP85
## [1] 27
TotalHISP85/550
## [1] 0.04909091
TotalFE85<-sum(cps85$FE)
TotalFE85
## [1] 245
TotalFE85/550
## [1] 0.4454545
Resultados: Con los nuevos datos, 67 individuos son no blancos y no hispanos, esto equivale al 12.18% del total.
Por otro lado, 27 personas de la muestra son no blancos y con origen Hispano, esto equivale al 4.90% de la muestra.
Finalmente 245 individuos de la muestra son mujeres, lo cual equivale al 44.54% de la muestra.
#1.
SVFE85<-subset(cps85, FE==1,
select = ED : LNWAGE)
PromFE85<- mean(SVFE85$ED)
PromFE85
## [1] 13.02449
sd(SVFE85$ED)
## [1] 2.429205
PromFELN85<- mean(SVFE85$LNWAGE)
sd(SVFE85$ED)
## [1] 2.429205
exp(PromFELN85)
## [1] 6.917315
SVMA85<-subset(cps85, FE==0,
select = ED: LNWAGE)
mean(SVMA85$ED)
## [1] 13.01384
sd(SVMA85$ED)
## [1] 2.767586
PromMALN85<- mean(SVMA85$LNWAGE)
sd(SVMA85$LNWAGE)
## [1] 0.5344412
# 2.
SVWH85<-subset(cps85, NONWH==0,
select = ED : LNWAGE)
mean(SVWH85$ED)
## [1] 13.07281
sd(SVWH85$ED)
## [1] 2.615374
PromSVWH85<- mean(SVWH85$LNWAGE)
sd(SVWH85$LNWAGE)
## [1] 0.5311999
exp(PromSVWH85)
## [1] 7.944682
SVNONWH85<-subset(cps85, NONWH==1,
select =ED : LNWAGE)
mean(SVNONWH85$ED)
## [1] 12.64179
sd(SVNONWH85$ED)
## [1] 2.603619
PromSVNONWH85<- mean(SVNONWH85$LNWAGE)
sd(SVNONWH85$LNWAGE)
## [1] 0.4967866
exp(PromSVNONWH85)
## [1] 7.144407
SVHISP85<- subset(cps85, HISP==1,
select = ED : LNWAGE)
mean(SVHISP85$ED)
## [1] 11.51852
sd(SVHISP85$ED)
## [1] 4.051309
PromSVHISP85<- mean(SVHISP85$LNWAGE)
sd(SVHISP85$LNWAGE)
## [1] 0.5295428
exp(PromSVHISP85)
## [1] 6.162722
Resultados:
Resultados: Parte 1. Las mujeres estudian en promedio 13.02 años La desviación estándar de los años de estudio de las mismas es de 2.42 años. Los hombres estudian en promedio 13.01 años La desviación estándar de los mismos es de 2.76 años.
Parte 2. Basándonos en la raza:
Los individuos de raza blanca estudian un promedio de 13.07 años con una desviación estandar de 2.61. En cuanto a los individuos no blancos y no hispánicos el promedio es de 12.64 años con desviación estándar de 2.60. Por otro lado, los hispanos estudian en promedio 11.51 años con desviación estándar de 4.05.
En cuanto a los promedios geométricos tenemos que: El de las mujeres es 6.91 dólares por hora. El de los blancos es de 7.94 dólares por hora. El de los no blancos y no hispánicos es de 7.14 dólares por hora. El de los hispanos es de 6.16 dólares por hora.
Los individuos blancos tienen una dispersión de LNWAGE de .5311 la cual es la mayor desviación estandar entre las variables de raza.
Podemos observar apartir de los resultados obtenidos con los datos de 1985 que las proporciones han cambiado significativamente en ambos géneros. Las mujeres pasaron de 38% a 46% y los hombres el cambio fue de 62% a 54% de la muestra.Podemos observar que las proporciones entre hombres y mujeres se vuelven mas equitativas.
realwrates78<-(1.00*cps78$LNWAGE)
mean(realwrates78)
## [1] 1.681002
realwrates85<-(1.649*cps85$LNWAGE)
mean(realwrates85)
## [1] 3.39559
mean(realwrates85)-mean(realwrates78)
## [1] 1.714588
Resultados En cuanto al LNWAGE para nuestra muestra, presenta un crecimiento de 1978 A 1985 DE 1.71 dlls por hora. Pasando de 1.68 dlls por hora en 1978 a 3.39 dlls.
MALE78<-subset(cps78, FE==0,
select=ED:LNWAGE)
mean(MALE78$LNWAGE)
## [1] 1.812921
MALE85<-subset(cps85, FE==0,
select = ED : LNWAGE)
MALEwrate85<-(MALE85$LNWAGE*1.649)
mean(MALEwrate85)
## [1] 3.570548
mean(MALEwrate85)-mean(MALE78$LNWAGE)
## [1] 1.757627
FEM78<-subset(cps78, FE==1,
select = ED : LNWAGE)
mean(FEM78$LNWAGE)
## [1] 1.462412
FEM85<-subset(cps85, FE==1,
select = ED : LNWAGE)
FEMwrate85<-(FEM85$LNWAGE*1.649)
mean(FEMwrate85)
## [1] 3.189212
mean(FEMwrate85)-mean(FEM78$LNWAGE)
## [1] 1.7268
Resultados Por otro lado, al crecimiento del LNWAGE para los hombres, es de 1.7576 dlls por hora. Para el LNWAGE de las mujeres obtenemos que presenta un crecimiento de 1.7268 dlls por hora.
HISP78<-subset(cps78, HISP==1,
select = ED : LNWAGE)
mean(HISP78$LNWAGE)
## [1] 1.529647
HISP85<-subset(cps85, HISP==1,
select = ED : LNWAGE)
HISPwrate85<-(1.649*HISP85$LNWAGE)
mean(HISPwrate85)
## [1] 2.998737
mean(HISPwrate85)-mean(HISP78$LNWAGE)
## [1] 1.46909
NONWH78<-subset(cps78, NONWH==1,
select = ED : LNWAGE)
mean(NONWH78$LNWAGE)
## [1] 1.513404
NONWH85<-subset(cps85, NONWH==1,
select = ED : LNWAGE)
NONWHwrate85<-(NONWH85$LNWAGE*1.649)
mean(NONWHwrate85)
## [1] 3.242478
mean(NONWHwrate85)-mean(NONWH78$LNWAGE)
## [1] 1.729074
WH78<-subset(cps78, NONWH==0,
select = ED : LNWAGE)
mean(WH78$LNWAGE)
## [1] 1.70038
WH85<-subset(cps85, NONWH==0,
select = ED : LNWAGE)
mean(WH85$LNWAGE)
## [1] 2.072503
WHwrate85<-(1.649*WH85$LNWAGE)
mean(WHwrate85)
## [1] 3.417557
mean(WHwrate85)-mean(WH78$LNWAGE)
## [1] 1.717178
Resultados
Los negros, presentan un crecimiento de 1.72 dlls por hora. Los hispanos, presentan un crecimiento de 1.46 dlls por hora. Finalmente, los blancos presenta un crecimiento de 1.71 dlls por hora.
Los negros y las mujeres son los grupos que presentar un mayor aumento real del LNWAGE, con 1.7 dlls por hora aproximadamente.
mean(SVFE$ED)
## [1] 12.76329
mean(SVFE85$ED)
## [1] 13.02449
mean(SVMA$ED)
## [1] 12.39942
mean(SVMA85$ED)
## [1] 13.01384
mean(SVWH$ED)
## [1] 12.63083
mean(SVWH85$ED)
## [1] 13.07281
mean(SVNONWH$ED)
## [1] 11.7193
mean(SVNONWH85$ED)
## [1] 12.64179
mean(SVHISP$ED)
## [1] 10.30556
mean(SVHISP85$ED)
## [1] 11.51852
Resultados Finalmente, despues de revisar los datos de ambos modelos se puede observar un aumento al pasar de los datos de 1978 a 1985 en las medias de educación y salario en todas los grupos. Lo anterior, podria probablemente ser explicado por el aumento anual del capital humano, lo cual seria consistente con el modelo de capital humano.
Para realizar este ejercicio, ocuparemos el archivo CPS85.TXT, el cual contiene 534 observaciones de 20 variables: ED, SOUTH, NONWH, HISP, FE, MARR, MARRFE, EX, EXSQ, UNION, LNWAGE, AGE, NDEP,MANUF, CONSTR, MANAG, SALES, CLER, SERV,PROG. Para empezar leemos los datos del archivo cps85.txt:
library(readr)
ruta<- "C:/Users/Diego/Desktop/Econometria/cps85.txt"
datos<-read.table(ruta,header=TRUE)
Realizar una regresión sobre LN(WAGE) con un término constante y la regresora años de educación (ED) para calcular los estimadores de mínimos cuadrados.
library(data.table)
library(lmtest)
## Loading required package: zoo
##
## Attaching package: 'zoo'
## The following objects are masked from 'package:base':
##
## as.Date, as.Date.numeric
PrimeraRegr<-lm(LNWAGE~ ED, data = datos)
summary(PrimeraRegr)
##
## Call:
## lm(formula = LNWAGE ~ ED, data = datos)
##
## Residuals:
## Min 1Q Median 3Q Max
## -1.98098 -0.37158 0.03392 0.34980 1.66100
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 1.059858 0.107430 9.866 <2e-16 ***
## ED 0.076760 0.008091 9.488 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.4885 on 532 degrees of freedom
## Multiple R-squared: 0.1447, Adjusted R-squared: 0.1431
## F-statistic: 90.01 on 1 and 532 DF, p-value: < 2.2e-16
Podemos observar que el valor del intercepto es 1.059858, lo que quiere decir que si se tuvieran 0 años de educación, el promedio de ln(WAGE) seria 1.059858. La pendiente es 0.076760, lo que significa que por un año más de educación, se estima que aumenta en 7.676% el salario, mismo que se puede interpretar como la tasa de retorno de la educación.
Ahora, construiremos un intervalo al 95% de confianza para el coeficiente de ED:
(avgy<- mean(datos$ED))
## [1] 13.01873
(n <- length(datos$ED))
## [1] 534
(sdy <- sd(datos$ED))
## [1] 2.615373
(se <- sdy/sqrt(n))
## [1] 0.1131782
(c <- qnorm(.975))
## [1] 1.959964
avgy + c * c(-se,+se)
## [1] 12.79690 13.24055
Concluimos que el coeficiente de ED se encuentra en el intervalo (12.19690,13.24055) con un 95% de confianza. Como el intervalo es mayor a cero, es decir, el cero no está dentro del mismo, podemos decir que es estadisticamente significativo al 95% de confianza.
El R2 en este modelo (0.4885) es mayor que el R2 del modelo de Mincer (0.067), por lo que en esta muestra, las variaciones del salario son mejor explicadas por variaciones en la educación que en el modelo de Mincer.
En el inciso anterior asumimos que el intercepto y la pendiente eran iguales para todos los individuos. Ahora haremos una regresión para ver si el efecto de la educación en ln(WAGE) es distinto entre los trabajadores que pertenecen a un sindicato y los que no. Para eso incluiremos la variable cualitativa (dummy) UNION que toma el valor de 1 si pertenece a un sindicato y 0 si no pertenece.
dummyUNION <- cut(datos$UNION, br=c(-1,0,1), labels=c("No","Yes"))
datos<-data.frame(datos,dummyUNION)
datos
SegundaRegr <- lm(LNWAGE ~ dummyUNION + ED, data=datos)
summary(SegundaRegr)
##
## Call:
## lm(formula = LNWAGE ~ dummyUNION + ED, data = datos)
##
## Residuals:
## Min 1Q Median 3Q Max
## -1.9263 -0.3569 0.0196 0.3204 1.7136
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 0.992607 0.105220 9.434 < 2e-16 ***
## dummyUNIONYes 0.298262 0.053579 5.567 4.12e-08 ***
## ED 0.077807 0.007874 9.882 < 2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.4753 on 531 degrees of freedom
## Multiple R-squared: 0.1919, Adjusted R-squared: 0.1888
## F-statistic: 63.04 on 2 and 531 DF, p-value: < 2.2e-16
La regresión presenta un intercepto de 0.992607. El coeficiente para cuando un trabajador pertenece a un sindicato es de 0.298262 lo que implica que,manteniendo todo lo demás constante, un trabajador que pertenece a un sindicato gana en promedio 29% más que uno que no pertenece a un sindicato.
Podemos observar que la tasa de retorno de la educación se puede ver en la pendiente de ED, que indica que un año adicional de educación aumenta el salario en 7.78% aproximadamente.
Ahora probaremos si los coeficientes son iguales, para ello ocuparemos un intervalo de confianza al 95%
IC al 95% para beta0:
(0.859166 + c * c(-.09163,+.09163))
## [1] 0.6795745 1.0387575
IC al 95% para beta 1:
(0.305129 + c * c(-0.0418,+.0418))
## [1] 0.2232025 0.3870555
No existe intersección entre ambos intervalos de confianza, por lo tanto, podemos concluir que los coeficientes no son iguales al 95% de confianza. Lo que indica que es correcto utilizar la variable cualitativa de pertenencia a un sindicato.
Un procedimiento alternativo para observar la diferencia del efecto que tiene en la educación si el trabajador pertenece o no a un sindicato, es con las variables NONU y UNION pero sin un intercepto.Definimos la nueva variable dummy NONU. Notar que para cada individuo, NONU + UNION = 1.0. La regresión es la siguiente:
NONU<-(1 - datos$UNION)
datos<-data.frame(datos, NONU)
TercerRegr <- lm( LNWAGE ~ 0 + NONU + UNION + ED, data=datos)
summary(TercerRegr)
##
## Call:
## lm(formula = LNWAGE ~ 0 + NONU + UNION + ED, data = datos)
##
## Residuals:
## Min 1Q Median 3Q Max
## -1.9263 -0.3569 0.0196 0.3204 1.7136
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## NONU 0.992607 0.105220 9.434 <2e-16 ***
## UNION 1.290869 0.112461 11.478 <2e-16 ***
## ED 0.077807 0.007874 9.882 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.4753 on 531 degrees of freedom
## Multiple R-squared: 0.9503, Adjusted R-squared: 0.95
## F-statistic: 3383 on 3 and 531 DF, p-value: < 2.2e-16
Como se puede observar, el coeficiente de NONU es 0.992607, mientras que el de UNION es 1.290869. Podemos confirmar que el intercepto del modelo en (b)coincide con el coeficiente de NONU. Por otro lado, el coeficiente de UNION es la suma del intercepto en (b) y el coeficiente de UNION. Es decir los ln(WAGE) esperados de un trabajador en un sindicato y uno que no esta en un sindicato son el mismo que en el modelo (b).Se puede concluir que es consistente con el modelo anterior.
Probaremos si los coeficientes de NONU y UNION son estadísticamente iguales, para ello, calcularemos intervalos de confianza al 95% para dichos coeficientes.
La prueba de hipótesis que ocuparemos será:
HO: beta0 = beta1
IC Beta0:
(0.859166 + c * c(-.09163,+.09163))
## [1] 0.6795745 1.0387575
IC Beta1:
(1.164295 + c * c(-0.090453,+.090453))
## [1] 0.9870104 1.3415796
Al obtener los intervalos de confianza, se puede observar que se intersecan en la mayor parte, por lo que podemos concluir que las betas son iguales al 95% de confianza.
Independientemente de si se pertenece o no a un sindicato, la tasa de retorno de la educación en el modelo es aproximadamente de 7.78% mayor al promedio de salario por un año adicional de educación. Es importante recordar que las variables dummy se diferencían por el intercepto, no por la pendiente por lo que la tasa de retorno de la educación es el mismo que en el modelo (b).
Otro aspecto importante para revisar es el R2, en este modelo se obtuvo un R2 de 0.4753, el cual, es igual al del modelo anterior debido a que se modificó el formato de las dummies pero no hubo incorporación de nuevas variables.
Una especificación aparentemente plausible es la ecuación LNWAGE= alpha* + alpha0* NONU + alpha1* UNION+ beta ED+ i. La cual es una regresión similar a la del problema anterior pero agregandole un intercepto. Probaremos si es correcta dicha especificación:
CuartaRegr <- lm( LNWAGE ~ NONU + UNION + ED, data=datos)
summary(CuartaRegr)
##
## Call:
## lm(formula = LNWAGE ~ NONU + UNION + ED, data = datos)
##
## Residuals:
## Min 1Q Median 3Q Max
## -1.9263 -0.3569 0.0196 0.3204 1.7136
##
## Coefficients: (1 not defined because of singularities)
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 1.290869 0.112461 11.478 < 2e-16 ***
## NONU -0.298262 0.053579 -5.567 4.12e-08 ***
## UNION NA NA NA NA
## ED 0.077807 0.007874 9.882 < 2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.4753 on 531 degrees of freedom
## Multiple R-squared: 0.1919, Adjusted R-squared: 0.1888
## F-statistic: 63.04 on 2 and 531 DF, p-value: < 2.2e-16
Es claro que la regresión esta mal especificada, debido a que no proporciona valores para UNION. Se puede observar lo que se conoce como trampa de la variable dicotómica, debido a que al momento de incorporar el intercepto se produce multicolinealidad perfecta. El programa ocupado (R) corrige este problema eliminando una dicotómica y asignandole los valores NA.
Otra posibilidad lógica es estimar los parámetros en una regresión como la del inciso (b) pero donde la variable dummy NONU reemplace a UNION.Podríamos esperar que el coeficiente de NONU fuera igual pero negativo para que se muestre el mismo efecto pero con relación inversa de UNION.
QuintaRegr <- lm( LNWAGE ~ NONU + ED, data=datos)
summary(QuintaRegr)
##
## Call:
## lm(formula = LNWAGE ~ NONU + ED, data = datos)
##
## Residuals:
## Min 1Q Median 3Q Max
## -1.9263 -0.3569 0.0196 0.3204 1.7136
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 1.290869 0.112461 11.478 < 2e-16 ***
## NONU -0.298262 0.053579 -5.567 4.12e-08 ***
## ED 0.077807 0.007874 9.882 < 2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.4753 on 531 degrees of freedom
## Multiple R-squared: 0.1919, Adjusted R-squared: 0.1888
## F-statistic: 63.04 on 2 and 531 DF, p-value: < 2.2e-16
Podemos observar en la regresión que nuestra predicción es correcta. El coeficiente de NONU es el mismo que UNION pero negativo, lo que es razonable debido a que el único cambio fue la categoria base.
El intercepto (Beta0) dice que si una persona no pertenece a un sindicato y tiene no tiene años de educación, entonces el promedio de LN(WAGE) es 1.164295
El coeficiente de NONU (Beta1) dice que si un empleado no pertenece a un sindicato, el valor esperado de LN(WAGE) será -0.305129 menor que el de uno que sí pertenece a un sindicato.
El coeficiente de ED (Beta3) es la pendiente de la variable ED, dicho coeficiente dice en que porcentaje cambia LNWAGE si ED aumenta en 1 unidad, es decir, el efecto que tiene la educación en ln(WAGE). En este modelo el tener una año más de educación aumenta el salario en 7.78%.
En cuanto a la R2 ajustada, el modelo presenta una R2 ajustada de .4753, lo que quiere decir que el modelo explica el 47.53% de las variaciones en ln(WAGE).
ruta<- "C:/Users/Diego/Desktop/Econometria/cps85.txt"
datos<-read.table(ruta,header=TRUE)
Se lleva a cabo la regresión por MCO del modelo de capital humano, donde ED es la educación, EX es la experiencia potencial y el EXSQ la experiencia potencial al cuadrado.
library(carData)
FirstRegr<-lm(LNWAGE~ED+EX+EXSQ,data = datos)
summary(FirstRegr)
##
## Call:
## lm(formula = LNWAGE ~ ED + EX + EXSQ, data = datos)
##
## Residuals:
## Min 1Q Median 3Q Max
## -2.12707 -0.31545 0.00672 0.31163 1.98418
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 0.5202983 0.1236135 4.209 3.01e-05 ***
## ED 0.0897588 0.0083203 10.788 < 2e-16 ***
## EX 0.0349377 0.0056491 6.185 1.24e-09 ***
## EXSQ -0.0005362 0.0001245 -4.307 1.98e-05 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.4619 on 530 degrees of freedom
## Multiple R-squared: 0.2382, Adjusted R-squared: 0.2339
## F-statistic: 55.23 on 3 and 530 DF, p-value: < 2.2e-16
¿Los estimadores son plausibles? Los estimadores son plausibles porque reflejan la teoría del modelo de capital humano: un aumento en el nivel de educación implica un aumento en el salario y la experiencia tiene rendimientos marginales decrecientes.
Ahora se permite variaciones en el intercepto por la variable dicotómica FE, que toma el valor de uno si es mujer y cero si es hombre.
SecondRegr<-lm(LNWAGE~FE+ED+EX+EXSQ, data=datos)
summary(SecondRegr)
##
## Call:
## lm(formula = LNWAGE ~ FE + ED + EX + EXSQ, data = datos)
##
## Residuals:
## Min 1Q Median 3Q Max
## -2.24978 -0.29232 0.01586 0.29182 2.13816
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 0.6007225 0.1194896 5.027 6.82e-07 ***
## FE -0.2570400 0.0387056 -6.641 7.75e-11 ***
## ED 0.0912964 0.0080047 11.405 < 2e-16 ***
## EX 0.0360496 0.0054351 6.633 8.16e-11 ***
## EXSQ -0.0005411 0.0001197 -4.520 7.65e-06 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.4442 on 529 degrees of freedom
## Multiple R-squared: 0.2968, Adjusted R-squared: 0.2915
## F-statistic: 55.82 on 4 and 529 DF, p-value: < 2.2e-16
INTERPRETACIÓN DE LOS RESULTADOS: Estimador de FE: las mujeres ganan 25.704% menos que los hombres Estimador de ED: con un año mas de educación, el salario aumenta 9.12% Estimador de EX: el efecto marginal es variable, la experiencia tiene rendimientos marginales decrecientes
Discriminación por género: H0:BetaFE=0 versus H1: BetaFE diferente de cero En el resumen tenemos el resultado de esta prueba de hipótesis Discriminación por género: BetaFE es significativo -> rechazo de H0 -> si hay discriminacion salarial por genero Si quisieramos hacerlo manual realizamos lo siguiente:
coef(summary(SecondRegr))
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 0.6007224977 0.1194895997 5.027404 6.816468e-07
## FE -0.2570399520 0.0387056393 -6.640892 7.751362e-11
## ED 0.0912963505 0.0080046924 11.405354 4.301561e-27
## EX 0.0360495727 0.0054350861 6.632751 8.156584e-11
## EXSQ -0.0005411249 0.0001197287 -4.519591 7.650364e-06
MATRSecondRegr=coef(summary(SecondRegr))
print(MATRSecondRegr)
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 0.6007224977 0.1194895997 5.027404 6.816468e-07
## FE -0.2570399520 0.0387056393 -6.640892 7.751362e-11
## ED 0.0912963505 0.0080046924 11.405354 4.301561e-27
## EX 0.0360495727 0.0054350861 6.632751 8.156584e-11
## EXSQ -0.0005411249 0.0001197287 -4.519591 7.650364e-06
Est1=MATRSecondRegr[2,1]/MATRSecondRegr[2,2]
print(Est1)
## [1] -6.640892
qt(0.025,df=534-4-1,lower.tail = TRUE)
## [1] -1.964459
Conclusión: rechazamos H0, entonces BetaFE es significativo, por lo tanto hay discriminación de género.
Se examinará el efecto del estado civil incorporando la variable dicotomica MARR: toma el valor de uno si el individuo está casado, cero en otro caso.
ThRegr<-lm(LNWAGE~FE+MARR+ED+EX+EXSQ, data= datos)
summary(ThRegr)
##
## Call:
## lm(formula = LNWAGE ~ FE + MARR + ED + EX + EXSQ, data = datos)
##
## Residuals:
## Min 1Q Median 3Q Max
## -2.25852 -0.29449 0.01373 0.29565 2.15342
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 0.5901462 0.1197834 4.927 1.12e-06 ***
## FE -0.2564333 0.0386950 -6.627 8.47e-11 ***
## MARR 0.0508305 0.0431763 1.177 0.24
## ED 0.0910565 0.0080044 11.376 < 2e-16 ***
## EX 0.0340875 0.0056830 5.998 3.71e-09 ***
## EXSQ -0.0005091 0.0001227 -4.148 3.91e-05 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.4441 on 528 degrees of freedom
## Multiple R-squared: 0.2986, Adjusted R-squared: 0.292
## F-statistic: 44.96 on 5 and 528 DF, p-value: < 2.2e-16
Intercepto: es el porcentaje de salario promedio que gana un hombre soltero sin educación ni experiencia (sobre unidades de medida). Estimador de FE: las mujeres ganan 25.6433% menos que los hombres. Estimador de MARR: los hombres y las mujeres casadas ganan 5.083% mas que los hombres solteros y las mujeres solteras.
coef(summary(ThRegr))
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 0.590146219 0.1197833898 4.926778 1.120365e-06
## FE -0.256433271 0.0386949578 -6.627046 8.466598e-11
## MARR 0.050830520 0.0431762769 1.177279 2.396146e-01
## ED 0.091056531 0.0080043662 11.375858 5.709746e-27
## EX 0.034087539 0.0056829679 5.998193 3.705239e-09
## EXSQ -0.000509098 0.0001227379 -4.147848 3.910581e-05
MATRThRegr=coef(summary(ThRegr))
print(MATRThRegr)
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 0.590146219 0.1197833898 4.926778 1.120365e-06
## FE -0.256433271 0.0386949578 -6.627046 8.466598e-11
## MARR 0.050830520 0.0431762769 1.177279 2.396146e-01
## ED 0.091056531 0.0080043662 11.375858 5.709746e-27
## EX 0.034087539 0.0056829679 5.998193 3.705239e-09
## EXSQ -0.000509098 0.0001227379 -4.147848 3.910581e-05
Efecto sobre LNWAGE de estar casado siendo mujer
MATRThRegr[2,1]+MATRThRegr[3,1]
## [1] -0.2056028
Efecto sobre LNWAGE de estar casado siendo hombre
MATRThRegr[3,1]
## [1] 0.05083052
Estos efectos son los mismos
MATRThRegr[2,1]+MATRThRegr[3,1]==MATRThRegr[3,1]
## [1] FALSE
Prueba de Hipotesis Ahora asumimos que se cumple BetaFE+BetaMARR=BetaMARR y queremos probar la hipotesis nula H0: BetaMARR=0 vs H1: BetaMARR distinto de cero Entonces nuestra hipotesis se simplifica a H0:BetaFE=0 Por lo tanto no podemos probar que el efecto del estado civil sobre el salario es nulo.
Los expertos en capital humano indican que el efecto del estado civil en los ingresos depende del género; en particular, estar casado tiene un efecto más negativo si se es mujer que si se es hombre, todo lo demas constante. A continuación se construye una variable de interacción dicotómica.
INFMAR <- (datos$FE *datos$MARR)
CHECK <- (INFMAR - datos$MARRFE)
print(CHECK)
## [1] 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
## [36] 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
## [71] 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
## [106] 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
## [141] 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
## [176] 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
## [211] 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
## [246] 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
## [281] 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
## [316] 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
## [351] 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
## [386] 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
## [421] 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
## [456] 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
## [491] 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
## [526] 0 0 0 0 0 0 0 0 0
INFMAR=FE*MARR CHECK=INFMAR-MARRFE print(CHECK)
INFMAR es una variable de interacción mas que una dummy porque este tipo de variables reflejan que el efecto de una regresora sobre la variable independiente, depende de otra regresora, tal como ocurre con MARR, que depende de FE.
Finalmente usando MCO estimar los parametros en la regresión de LNWAGE sobre FE, MARR, INFMAR, ED, EX, EXSQ.
FourRegr<-lm(LNWAGE~FE+MARR+INFMAR+ED+EX+EXSQ, data= datos)
summary(FourRegr)
##
## Call:
## lm(formula = LNWAGE ~ FE + MARR + INFMAR + ED + EX + EXSQ, data = datos)
##
## Residuals:
## Min 1Q Median 3Q Max
## -2.28920 -0.29829 0.00898 0.30026 2.07836
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 0.5618000 0.1198491 4.688 3.53e-06 ***
## FE -0.1276839 0.0663779 -1.924 0.0549 .
## MARR 0.1426870 0.0577503 2.471 0.0138 *
## INFMAR -0.1946027 0.0817022 -2.382 0.0176 *
## ED 0.0892729 0.0080043 11.153 < 2e-16 ***
## EX 0.0337175 0.0056601 5.957 4.70e-09 ***
## EXSQ -0.0005135 0.0001222 -4.202 3.11e-05 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.4421 on 527 degrees of freedom
## Multiple R-squared: 0.3061, Adjusted R-squared: 0.2982
## F-statistic: 38.75 on 6 and 527 DF, p-value: < 2.2e-16
INTERPRETACIÓN DE LOS RESULTADOS:
Intercepto:56.18% (de unidades de medida) es el porcentaje de salario promedio que gana un hombre soltero dado que no tiene educación y experiencia. BetaFE: las mujeres ganan el 12.76% menos que los hombres BetaMARR: los hombres y las mujeres casadas ganan 14.26% más que los y las solteras. BetaINFMAR: las mujeres casadas ganan 19.46% menos que los hombres.
Los coeficientes sí son consistentes con la teoria de capital humano y las investigaciones. Prueba de Hipotesis: H0: BetaINFMAR=0 versus H1:BetaINFMAR distinto de cero Esta prueba ya esta realizada y el resultado sale en el resumen Econtramos que BetaINFMAR es significativo al 95% por lo que verificamos que se rechaza H0 lo que quiere decir que el efecto del estado civil si depende del género
coef(summary(FourRegr))
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 0.5618000216 0.1198491293 4.687560 3.525140e-06
## FE -0.1276838639 0.0663779150 -1.923590 5.494440e-02
## MARR 0.1426869667 0.0577503464 2.470755 1.379809e-02
## INFMAR -0.1946026767 0.0817021650 -2.381855 1.757960e-02
## ED 0.0892729112 0.0080042825 11.153143 4.430511e-26
## EX 0.0337175211 0.0056601164 5.957037 4.699127e-09
## EXSQ -0.0005135138 0.0001222123 -4.201816 3.109735e-05
MATRFourRegr=coef(summary(FourRegr))
print(MATRFourRegr)
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 0.5618000216 0.1198491293 4.687560 3.525140e-06
## FE -0.1276838639 0.0663779150 -1.923590 5.494440e-02
## MARR 0.1426869667 0.0577503464 2.470755 1.379809e-02
## INFMAR -0.1946026767 0.0817021650 -2.381855 1.757960e-02
## ED 0.0892729112 0.0080042825 11.153143 4.430511e-26
## EX 0.0337175211 0.0056601164 5.957037 4.699127e-09
## EXSQ -0.0005135138 0.0001222123 -4.201816 3.109735e-05
EST2=MATRFourRegr[4,1]/MATRFourRegr[4,2]
print(EST2)
## [1] -2.381855
qt(0.025,df=534-6-1,lower.tail = TRUE)
## [1] -1.964476
Conclusión: rechazamos H0, entonces BetaINFMAR es significativo, por lo tanto el efecto del estado civil depende de la regresora de género.
El archivo cps78 contiene 550 observaciones con un gran numero de variables, de las cuales utilizaremos: LNWAGE como variable dependiente, FE, UNION, NONWH, HISP, ED, EX Y EXSQ como regresoras. Leemos los datos del archivo cps78.txt y mostramos la tabla de datos:
n <-550
ruta<-"C:/Users/Diego/Desktop/Econometria/cps78.txt"
cps78<-read.table(ruta,header=TRUE)
View(cps78)
attach(cps78)
Tal como se solicita, estimamos el modelo log lineal mencionado arriba Las regresoras significan lo siguiente: FE: Female UNION:Union status - si estas sindicalizado o no ED: Education EX: Experience NONWH: Non white HISP: Hispanic EXSQ: Experience squarred
regmult<-lm(LNWAGE~FE+UNION+NONWH+HISP+ED+EX+EXSQ, data = cps78)
regmult
##
## Call:
## lm(formula = LNWAGE ~ FE + UNION + NONWH + HISP + ED + EX + EXSQ,
## data = cps78)
##
## Coefficients:
## (Intercept) FE UNION NONWH HISP
## 0.4881678 -0.3060477 0.2071429 -0.1572652 -0.0271477
## ED EX EXSQ
## 0.0746097 0.0261914 -0.0003082
Con respecto al efecto que tiene la raza en el lnsalario -0.157, es decir, si la persona es no blanca el ln del salario disminuye en -0.157. También se puede intepretar que el efecto que tiene en el salario de la persona es de -15%. Es decir, si eres una persona no blanca tu salario disminuye en un 15%.
Mostramos el resultado que es la regresión estimada. Como se puede ver el valor del intercepto es 0.4881678 el cual es significativo al 99.9%, el valor supone que independientemente de las regresoras, es decir, sin tomar en cuenta ninguna regresora un hombre, sin sindicato, blanco y no hispano gana en ln(wage) 0.4881678, que transformando mediante la fórmula e(lnwagegorro)*e((varianza de los residuales)/2) es igual a 1.75 lo que supone que un hombre, sin sindicato, blanco, sin experiencia, sin educación y no hispano gana en promedio 1.75 de salario.
stargazer::stargazer(regmult,type="latex")
% Table created by stargazer v.5.2.2 by Marek Hlavac, Harvard University. E-mail: hlavac at fas.harvard.edu % Date and time: dom., dic. 16, 2018 - 09:05:33 p. m.
El siguiente paso es hacer una prueba de hipótesis individual con respecto a gender (FE), dejando todo lo demás fijo. Se plantea la Hipotesis nula: Ho : FE=0 vs H1 : FE distinto a 0 y se resuelve, no se olvide de instalar el paquete y libreria (“car”)
library(car)
FEHo<-c("FE=0")
linearHypothesis(regmult,FEHo)
Al p value ser un número muy cercano al cero, la hipótesis nula se rechaza, esto implica que no se puede omitir la variable FE, es decir FE es significativa.
El siguiente paso es hacer submuestras acorde a si la persona es mujer (FE=1) o si es hombre (FE=0). Para esto generamos nuevas matrices de datos tomando los datos originales del archivo cps78, se genera la matriz (datosFEnoactiva) con respecto a que el genero sea hombre: FE = 0 y la matriz que solo toma a las mujeres de la muestra FE = 1 (datosFEactiva). Además se obtiene el número de observaciónes para cada matriz, por medio de colsums sumamos los datos de la columna FE, como son solo 1’s nos dara el número de observaciones para la submuestra en que FE=1, es decir en la que solo hay mujeres, y nos da que hay 207 mujeres. Si restamos 550 - el número de observaciones que es 207 = 343 es el numero de observaciones para la submuestra de solo hombres.
Para el siguiente chunk se necesita la instalación y la librería (“dplyr”)
library(dplyr)
##
## Attaching package: 'dplyr'
## The following object is masked from 'package:car':
##
## recode
## The following objects are masked from 'package:data.table':
##
## between, first, last
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
datosFEnoactiva <- cps78[cps78$FE==0,]
#View(datosFEnoactiva)
datosFEactiva <- cps78[cps78$FE==1,]
#View(datosFEactiva)
Observaciones para la muestra de mujeres:
numobsenFEactiva <- colSums(select(datosFEactiva, starts_with("FE")))
numobsenFEactiva
## FE
## 207
numobsenFEnoactiva=550-207
Observaciones para la submuestra de hombres:
numobsenFEnoactiva
## [1] 343
El siguiente paso es sacar las medias de las variables LNWAGE, NONWH, HISP, UNION, ED, EX, EXSQ para cada submuestra. Medias de la submuestra de solo mujeres:
library(dplyr)
meanFEactivaLNWAGE <- colMeans(select(datosFEactiva, contains("LNWAGE"),contains("NONWH"),contains("HISP"),contains("UNION"),contains("ED"),contains("EX"),contains("EXSQ"),contains("AGE")))
meanFEactivaLNWAGE
## LNWAGE NONWH HISP UNION ED
## 1.46241208 0.13526570 0.05797101 0.23188406 12.76328502
## EX EXSQ AGE
## 16.70531401 437.08212560 34.46859903
Medias de la submuestra de solo hombres
library(dplyr)
meanFEnoactivaLNWAGE <- colMeans(select(datosFEnoactiva, contains("LNWAGE"),contains("NONWH"),contains("HISP"),contains("UNION"),contains("ED"),contains("EX"),contains("EXSQ"), contains("AGE")))
meanFEnoactivaLNWAGE
## LNWAGE NONWH HISP UNION ED
## 1.81292070 0.08454810 0.06997085 0.34985423 12.39941691
## EX EXSQ AGE
## 19.93294461 583.15160350 37.33236152
Diferencia de medias entre las submuestras de mujeres y hombres
meanFEactivaLNWAGE-meanFEnoactivaLNWAGE
## LNWAGE NONWH HISP UNION ED
## -0.35050862 0.05071760 -0.01199983 -0.11797017 0.36386811
## EX EXSQ AGE
## -3.22763060 -146.06947789 -2.86376248
La diferencia en medias entre el lnsalario de las mujeres y el de hombres es de -0.3505 En promedio las mujeres trabajadoras tienen más educación que los hombres, ya que la diferencia entre mujeres y hombre es de 0.36366811 unidades de educación.
La experiencia potencial en hombres y mujeres es de: 18.9329 años para hombres (promedio de edad - promedio de educacion - 6) y para mujeres es de 15.7053 (promedio de edad - promedio de educacion - 6) años para mujeres, por lo que la diferencia es de 3.2276 años. Por tanto, para los hombres la experiencia potencial es más apropiada para medir on-the-job training.
También hay que sacar el número de mujeres y hombres que tienen activa la variable UNION, HISP y NONWH.
library(dplyr)
nobsFEnoactivaUNH <- colSums(select(datosFEnoactiva, contains("NONWH"),contains("HISP"),contains("UNION")))
Número de hombres en:
library(dplyr)
nobsFEnoactivaUNH
## NONWH HISP UNION
## 29 24 120
nobsFEactivaUNH <- colSums(select(datosFEactiva, contains("NONWH"),contains("HISP"),contains("UNION")))
Número de mujeres en:
nobsFEactivaUNH
## NONWH HISP UNION
## 28 12 48
Hay diferencias sustanciales en el número de hombres que estan sindicalizados (UNION) que son 120, mientras que el de las mujeres es de 48. Pero en NONWH (si no son blancos o si sí lo son) e HISP(si son hispanas o no) no hay mucha diferencia en número. Pero en proporciones el porcentaje de mujeres sindicalizadas es de 23.19% y el de hombres es de 34.89%, es decir hay más porcentaje de hombres sindicalizados que mujeres.
Con los datos de las submuestras de la parte b, estimamos parametros para tanto las ecuaciones de hombres y mujeres que tienen la forma LNWAGE = alpha + aplhanxNONWHITE + alphahxHISP + alphauxUNION + Beta1xED + Beta2xEX + Beta3xEXSQ + u
regmultFEnoactiva<-lm(LNWAGE~UNION+NONWH+HISP+ED+EX+EXSQ, data = datosFEnoactiva)
regmultFEnoactiva
##
## Call:
## lm(formula = LNWAGE ~ UNION + NONWH + HISP + ED + EX + EXSQ,
## data = datosFEnoactiva)
##
## Coefficients:
## (Intercept) UNION NONWH HISP ED
## 0.4674174 0.1724160 -0.2967253 -0.0813002 0.0704837
## EX EXSQ
## 0.0363416 -0.0004843
regmultFEactiva<-lm(LNWAGE~UNION+NONWH+HISP+ED+EX+EXSQ, data = datosFEactiva)
regmultFEactiva
##
## Call:
## lm(formula = LNWAGE ~ UNION + NONWH + HISP + ED + EX + EXSQ,
## data = datosFEactiva)
##
## Coefficients:
## (Intercept) UNION NONWH HISP ED
## 3.646e-01 2.763e-01 1.193e-02 3.731e-02 6.951e-02
## EX EXSQ
## 8.412e-03 5.176e-06
Tabla2:con FE no activa
stargazer::stargazer(regmultFEnoactiva,type="latex")
% Table created by stargazer v.5.2.2 by Marek Hlavac, Harvard University. E-mail: hlavac at fas.harvard.edu % Date and time: dom., dic. 16, 2018 - 09:05:34 p. m.
Tabla3: con FE activa
stargazer::stargazer(regmultFEactiva,type="latex")
% Table created by stargazer v.5.2.2 by Marek Hlavac, Harvard University. E-mail: hlavac at fas.harvard.edu % Date and time: dom., dic. 16, 2018 - 09:05:34 p. m.
Con respecto a las regresiones de hombres y mujeres, el efecto de schooling (ED) difiere entre ambos sexos. En los hombres el efecto marginal que tiene ED sobre el lnsalario es de 0.0704837, es decir que por una unidad más de ED (schooling) el salario de un hombre aumenta en un 7.04837%, mientras que el efecto marginal de ED en en el lnsalario de las mujeres es de 6.951e-02, el cual es menor que el de los hombres y nos dice que una unidad más de ED en las mujeres incrementa su salario en un 6.951%, por tanto aun que sea distinto, la diferencia es muy pequeña. Con respecto a la teoría presentada en el libro en la sección 5.4.C
Ahora fijandonos en race (NONWH), el efecto que tiene la regresora en cada grupo es distinto de una manera importante. En los hombres el efecto marginal de NONWH es de -0.2967253, es decir que por el hecho de no ser blanco el salario de un hombre se reducirá en un 29.67253%, mientras que en mujeres el efecto marginal es de 0.01193 lo que signfica que por el hecho de no ser blanca el salario de la mujer se vera incrementado en un 1.193%, pero este estimador resulta no significativo en el modelo lo que nos hace dudar del mismo. En este caso la diferencia con respecto a la raza es muy clara entre sexos.
Reestimación de regresión sacada en el inciso a), pero sin incluir FE. Una vez generada esta regresión, y utilizando la regresión de hombres y la de mujeres, obtenemos la suma de cuadrados residuales de cada regresión para poder hacer la prueba de Chow.
regmultnuevao<-lm(LNWAGE~UNION+NONWH+HISP+ED+EX+EXSQ, data = cps78)
sumsqresnueva <- sum(residuals(regmultnuevao)^2)
sumsqresnueva
## [1] 91.81242
sumsqresFEnoactiva <- sum(residuals(regmultFEnoactiva)^2)
sumsqresFEnoactiva
## [1] 45.74816
sumsqresFEactiva <- sum(residuals(regmultFEactiva)^2)
sumsqresFEactiva
## [1] 31.88014
Aplicando la prueba de Chow mediante las 3 sumas de cuadrados residuales sacadas de las 3 regresiones con las que se cuenta nos da como resultado: el estadistico F es 13.9910 y el valor crítico es 2.01 lo que supone rechazar la Hipotesis nula, por tanto los dos modelos (hombres y mujeres) son distintos por lo que se necesita incluir la variable FE (que corresponde al genero, en este caso con base en hombre)
Utilizamos el procedimiento Blinder-Oaxaca, no se olvide de instalar el paquete y la libreria “oaxaca”
library(oaxaca)
##
## Please cite as:
## Hlavac, Marek (2018). oaxaca: Blinder-Oaxaca Decomposition in R.
## R package version 0.1.4. https://CRAN.R-project.org/package=oaxaca
descomposicion.oaxaca <- oaxaca(LNWAGE ~ NONWH+UNION+HISP+ED+EX+EXSQ | FE, data = cps78, R=30)
## oaxaca: oaxaca() performing analysis. Please wait.
##
## Bootstrapping standard errors:
## 1 / 30 (3.33%)
## 3 / 30 (10%)
## 6 / 30 (20%)
## 9 / 30 (30%)
## 12 / 30 (40%)
## 15 / 30 (50%)
## 18 / 30 (60%)
## 21 / 30 (70%)
## 24 / 30 (80%)
## 27 / 30 (90%)
## 30 / 30 (100%)
(descomposicion.oaxaca)
## $beta
## $beta$beta.A
## (Intercept) NONWH UNION HISP ED
## 0.4674173727 -0.2967252504 0.1724160403 -0.0813002248 0.0704837394
## EX EXSQ
## 0.0363415693 -0.0004842526
##
## $beta$beta.B
## (Intercept) NONWH UNION HISP ED
## 3.645714e-01 1.193416e-02 2.763250e-01 3.730575e-02 6.951196e-02
## EX EXSQ
## 8.412010e-03 5.175642e-06
##
## $beta$beta.diff
## (Intercept) NONWH UNION HISP ED
## 0.1028459744 -0.3086594120 -0.1039089533 -0.1186059740 0.0009717807
## EX EXSQ
## 0.0279295596 -0.0004894283
##
## $beta$beta.R
## (Intercept) NONWH UNION HISP ED
## [1,] 0.0000000 0.3645714 0.01193416 0.2763250 0.03730575 0.06951196
## [2,] 1.0000000 0.4674174 -0.29672525 0.1724160 -0.08130022 0.07048374
## [3,] 0.5000000 0.4159944 -0.14239554 0.2243705 -0.02199724 0.06999785
## [4,] 0.6236364 0.4287099 -0.18055707 0.2115236 -0.03666125 0.07011800
## [5,] -1.0000000 0.3626384 -0.20442632 0.2423213 -0.01989701 0.07331037
## [6,] -2.0000000 0.4881678 -0.15726522 0.2071429 -0.02714774 0.07460975
## EX EXSQ
## [1,] 0.00841201 5.175642e-06
## [2,] 0.03634157 -4.842526e-04
## [3,] 0.02237679 -2.395385e-04
## [4,] 0.02582990 -3.000496e-04
## [5,] 0.02730487 -3.091941e-04
## [6,] 0.02619136 -3.081690e-04
##
##
## $call
## oaxaca(formula = LNWAGE ~ NONWH + UNION + HISP + ED + EX + EXSQ |
## FE, data = cps78, R = 30)
##
## $n
## $n$n.A
## [1] 343
##
## $n$n.B
## [1] 207
##
## $n$n.pooled
## [1] 550
##
##
## $R
## [1] 30
##
## $reg
## $reg$reg.A
##
## Call:
## NULL
##
## Coefficients:
## (Intercept) NONWH UNION HISP ED
## 0.4674174 -0.2967253 0.1724160 -0.0813002 0.0704837
## EX EXSQ
## 0.0363416 -0.0004843
##
##
## $reg$reg.B
##
## Call:
## NULL
##
## Coefficients:
## (Intercept) NONWH UNION HISP ED
## 3.646e-01 1.193e-02 2.763e-01 3.731e-02 6.951e-02
## EX EXSQ
## 8.412e-03 5.176e-06
##
##
## $reg$reg.pooled.1
##
## Call:
## NULL
##
## Coefficients:
## (Intercept) NONWH UNION HISP ED
## 0.3626384 -0.2044263 0.2423213 -0.0198970 0.0733104
## EX EXSQ
## 0.0273049 -0.0003092
##
##
## $reg$reg.pooled.2
##
## Call:
## NULL
##
## Coefficients:
## (Intercept) NONWH UNION HISP ED
## 0.4881678 -0.1572652 0.2071429 -0.0271477 0.0746097
## EX EXSQ FE
## 0.0261914 -0.0003082 -0.3060477
##
##
##
## $threefold
## $threefold$overall
## coef(endowments) se(endowments) coef(coefficients)
## 0.03505417 0.02935678 0.29517923
## se(coefficients) coef(interaction) se(interaction)
## 0.03713322 0.02027522 0.02254631
##
## $threefold$variables
## coef(endowments) se(endowments) coef(coefficients)
## (Intercept) 0.0000000000 0.000000000 0.102845974
## NONWH -0.0006052720 0.004875416 -0.041751032
## UNION 0.0325981063 0.018647247 -0.024094830
## HISP 0.0004476627 0.002076431 -0.006875709
## ED -0.0252931853 0.019347874 0.012403114
## EX 0.0271508598 0.031318316 0.466572064
## EXSQ 0.0007560034 0.031584599 -0.213920356
## se(coefficients) coef(interaction) se(interaction)
## (Intercept) 0.216455987 0.000000000 0.000000000
## NONWH 0.023476908 0.015654463 0.012567805
## UNION 0.024972981 -0.012258157 0.015489989
## HISP 0.007298207 -0.001423252 0.002885278
## ED 0.199370916 -0.000353600 0.006169329
## EX 0.178405572 0.090146301 0.054647705
## EXSQ 0.106499217 -0.071490534 0.053799790
##
##
## $twofold
## $twofold$overall
## group.weight coef(explained) se(explained) coef(unexplained)
## [1,] 0.0000000 0.03505417 0.02935678 0.3154544
## [2,] 1.0000000 0.05532940 0.02283040 0.2951792
## [3,] 0.5000000 0.04519179 0.02375794 0.3053168
## [4,] 0.6236364 0.04769854 0.02478548 0.3028101
## [5,] -1.0000000 0.05500682 0.02598724 0.2955018
## [6,] -2.0000000 0.04446088 0.02307516 0.3060477
## se(unexplained) coef(unexplained A) se(unexplained A)
## [1,] 0.03872145 3.154544e-01 3.872145e-02
## [2,] 0.03713322 0.000000e+00 0.000000e+00
## [3,] 0.03622195 1.577272e-01 1.936073e-02
## [4,] 0.03653348 1.187256e-01 2.414811e-02
## [5,] 0.03379321 1.112161e-01 1.347247e-02
## [6,] 0.03605430 1.568190e-15 3.049550e-15
## coef(unexplained B) se(unexplained B)
## [1,] 0.0000000 0.00000000
## [2,] 0.2951792 0.03713322
## [3,] 0.1475896 0.01856661
## [4,] 0.1840845 0.01397559
## [5,] 0.1842857 0.02314637
## [6,] 0.3060477 0.03605430
##
## $twofold$variables
## $twofold$variables[[1]]
## group.weight coef(explained) se(explained) coef(unexplained)
## (Intercept) 0 0.0000000000 0.000000000 0.10284597
## NONWH 0 -0.0006052720 0.004875416 -0.02609657
## UNION 0 0.0325981063 0.018647247 -0.03635299
## HISP 0 0.0004476627 0.002076431 -0.00829896
## ED 0 -0.0252931853 0.019347874 0.01204951
## EX 0 0.0271508598 0.031318316 0.55671837
## EXSQ 0 0.0007560034 0.031584599 -0.28541089
## se(unexplained) coef(unexplained A) se(unexplained A)
## (Intercept) 0.216455987 0.10284597 0.216455987
## NONWH 0.012400130 -0.02609657 0.012400130
## UNION 0.038156742 -0.03635299 0.038156742
## HISP 0.008312946 -0.00829896 0.008312946
## ED 0.194279419 0.01204951 0.194279419
## EX 0.218214630 0.55671837 0.218214630
## EXSQ 0.145361825 -0.28541089 0.145361825
## coef(unexplained B) se(unexplained B)
## (Intercept) 0 0
## NONWH 0 0
## UNION 0 0
## HISP 0 0
## ED 0 0
## EX 0 0
## EXSQ 0 0
##
## $twofold$variables[[2]]
## group.weight coef(explained) se(explained) coef(unexplained)
## (Intercept) 1 0.000000000 0.000000000 0.102845974
## NONWH 1 0.015049191 0.012094163 -0.041751032
## UNION 1 0.020339949 0.007986981 -0.024094830
## HISP 1 -0.000975589 0.001686378 -0.006875709
## ED 1 -0.025646785 0.017571370 0.012403114
## EX 1 0.117297161 0.048061697 0.466572064
## EXSQ 1 -0.070734531 0.036243988 -0.213920356
## se(unexplained) coef(unexplained A) se(unexplained A)
## (Intercept) 0.216455987 0 0
## NONWH 0.023476908 0 0
## UNION 0.024972981 0 0
## HISP 0.007298207 0 0
## ED 0.199370916 0 0
## EX 0.178405572 0 0
## EXSQ 0.106499217 0 0
## coef(unexplained B) se(unexplained B)
## (Intercept) 0.102845974 0.216455987
## NONWH -0.041751032 0.023476908
## UNION -0.024094830 0.024972981
## HISP -0.006875709 0.007298207
## ED 0.012403114 0.199370916
## EX 0.466572064 0.178405572
## EXSQ -0.213920356 0.106499217
##
## $twofold$variables[[3]]
## group.weight coef(explained) se(explained) coef(unexplained)
## (Intercept) 0.5 0.0000000000 0.000000000 0.102845974
## NONWH 0.5 0.0072219596 0.006747725 -0.033923800
## UNION 0.5 0.0264690279 0.012073562 -0.030223908
## HISP 0.5 -0.0002639631 0.001223320 -0.007587334
## ED 0.5 -0.0254699853 0.018221731 0.012226314
## EX 0.5 0.0722240104 0.029979809 0.511645214
## EXSQ 0.5 -0.0349892638 0.020784668 -0.249665623
## se(unexplained) coef(unexplained A) se(unexplained A)
## (Intercept) 0.216455987 0.051422987 0.108227993
## NONWH 0.017691150 -0.013048284 0.006200065
## UNION 0.031301892 -0.018176493 0.019078371
## HISP 0.007687863 -0.004149480 0.004156473
## ED 0.196817459 0.006024757 0.097139709
## EX 0.197424653 0.278359183 0.109107315
## EXSQ 0.124549056 -0.142705445 0.072680912
## coef(unexplained B) se(unexplained B)
## (Intercept) 0.051422987 0.108227993
## NONWH -0.020875516 0.011738454
## UNION -0.012047415 0.012486491
## HISP -0.003437854 0.003649103
## ED 0.006201557 0.099685458
## EX 0.233286032 0.089202786
## EXSQ -0.106960178 0.053249608
##
## $twofold$variables[[4]]
## group.weight coef(explained) se(explained) coef(unexplained)
## (Intercept) 0.6236364 0.0000000000 0.000000000 0.102845974
## NONWH 0.6236364 0.0091574205 0.005727204 -0.035859261
## UNION 0.6236364 0.0249534740 0.013584639 -0.028708354
## HISP 0.6236364 -0.0004399288 0.001343586 -0.007411369
## ED 0.6236364 -0.0255137032 0.018458663 0.012270032
## EX 0.6236364 0.0833693713 0.027930532 0.500499854
## EXSQ 0.6236364 -0.0438280935 0.020908667 -0.240826793
## se(unexplained) coef(unexplained A) se(unexplained A)
## (Intercept) 0.216455987 0.038707485 0.134989824
## NONWH 0.016317409 -0.009821799 0.007733172
## UNION 0.032960235 -0.013681942 0.023795932
## HISP 0.007822343 -0.003123427 0.005184255
## ED 0.196188413 0.004534999 0.121159710
## EX 0.202420965 0.209528548 0.136086579
## EXSQ 0.129486915 -0.107418280 0.090652920
## coef(unexplained B) se(unexplained B)
## (Intercept) 0.064138489 0.081466162
## NONWH -0.026037462 0.008835854
## UNION -0.015026412 0.009398922
## HISP -0.004287942 0.002746780
## ED 0.007735033 0.075035963
## EX 0.290971305 0.067145370
## EXSQ -0.133408513 0.040082433
##
## $twofold$variables[[5]]
## group.weight coef(explained) se(explained) coef(unexplained)
## (Intercept) -1 0.0000000000 0.000000000 0.102845974
## NONWH -1 0.0103680113 0.008193726 -0.037069852
## UNION -1 0.0285866805 0.013488137 -0.032341561
## HISP -1 -0.0002387607 0.001169806 -0.007612537
## ED -1 -0.0266753056 0.018486073 0.013431635
## EX -1 0.0881300187 0.036145555 0.495739206
## EXSQ -1 -0.0451638264 0.021670358 -0.239491060
## se(unexplained) coef(unexplained A) se(unexplained A)
## (Intercept) 0.216455987 0.104778989 0.069716107
## NONWH 0.018647786 -0.007803700 0.005967695
## UNION 0.030127153 -0.024456638 0.015710713
## HISP 0.007570625 -0.004296435 0.003545930
## ED 0.198271000 -0.035048554 0.060518394
## EX 0.190512951 0.180128120 0.078064389
## EXSQ 0.117516229 -0.102085649 0.052354923
## coef(unexplained B) se(unexplained B)
## (Intercept) -0.001933015 0.173949720
## NONWH -0.029266152 0.013522656
## UNION -0.007884923 0.017092125
## HISP -0.003316102 0.004857545
## ED 0.048480189 0.157890108
## EX 0.315611086 0.127545707
## EXSQ -0.137405412 0.077732924
##
## $twofold$variables[[6]]
## group.weight coef(explained) se(explained) coef(unexplained)
## (Intercept) -2 0.0000000000 0.000000000 0.102845974
## NONWH -2 0.0079761139 0.006637633 -0.034677954
## UNION -2 0.0244366843 0.009622195 -0.028191565
## HISP -2 -0.0003257683 0.001108697 -0.007525529
## ED -2 -0.0271481080 0.019106778 0.013904437
## EX -2 0.0845360459 0.033305826 0.499333179
## EXSQ -2 -0.0450140840 0.021922891 -0.239640803
## se(unexplained) coef(unexplained A) se(unexplained A)
## (Intercept) 0.216455987 -0.020750419 0.060225837
## NONWH 0.017689599 -0.011791081 0.006233728
## UNION 0.028639425 -0.012149343 0.011870033
## HISP 0.007487403 -0.003789095 0.003088098
## ED 0.198207097 -0.051160091 0.052490872
## EX 0.191100196 0.202323492 0.077293008
## EXSQ 0.117558046 -0.102683464 0.048629549
## coef(unexplained B) se(unexplained B)
## (Intercept) 0.123596393 0.168352586
## NONWH -0.022886873 0.011628766
## UNION -0.016042222 0.017168068
## HISP -0.003736434 0.004597154
## ED 0.065064528 0.157265624
## EX 0.297009687 0.121391093
## EXSQ -0.136957339 0.074662939
##
##
##
## $x
## $x$x.mean.A
## (Intercept) NONWH UNION HISP ED
## 1.00000000 0.08454810 0.34985423 0.06997085 12.39941691
## EX EXSQ
## 19.93294461 583.15160350
##
## $x$x.mean.B
## (Intercept) NONWH UNION HISP ED
## 1.00000000 0.13526570 0.23188406 0.05797101 12.76328502
## EX EXSQ
## 16.70531401 437.08212560
##
## $x$x.mean.diff
## (Intercept) NONWH UNION HISP ED
## 0.00000000 -0.05071760 0.11797017 0.01199983 -0.36386811
## EX EXSQ
## 3.22763060 146.06947789
##
##
## $y
## $y$y.A
## [1] 1.812921
##
## $y$y.B
## [1] 1.462412
##
## $y$y.diff
## [1] 0.3505086
##
##
## attr(,"class")
## [1] "oaxaca"
Se puede ver por medio del procedimiento que la diferencia de salarios entre el grupo A (hombres) y el grupo B (mujeres) es de 0.3505086. Utilizando el procedimiento de Blinder-Oaxaca y de este la sección “twofold overall”, se tomó la linea en donde el peso relativo de los coeficientes de una regresión en las observaciones del grupo A y el grupo B es 1, y se puede mostrar que la diferencia en las medias del salario, derivado de la discriminación sufrida por las mujeres, se puede descomponer en 2 factores: $0.05532940 que es la parte explicada por las diferencias en medias de las variables explicativas de cada grupo y 0.2951792 que permanece inexplicada, pero se podría interpretar como la proporción que es atribuida a los efectos por discriminación por género. La diferencia en media, con respecto a variables explicativas, que más aporta al primer factor es la experiencia (EX) que aporta en 0.117297161 unidades de dinero.
library(oaxaca)
descomposicion.oaxacaNONWH <- oaxaca(LNWAGE ~ FE+UNION+HISP+ED+EX+EXSQ | NONWH | HISP, data = cps78, R=30)
## oaxaca: oaxaca() performing analysis. Please wait.
##
## Bootstrapping standard errors:
## 1 / 30 (3.33%)
## 3 / 30 (10%)
## 6 / 30 (20%)
## 9 / 30 (30%)
## 12 / 30 (40%)
## 15 / 30 (50%)
## 18 / 30 (60%)
## 21 / 30 (70%)
## 24 / 30 (80%)
## 27 / 30 (90%)
## 30 / 30 (100%)
(descomposicion.oaxacaNONWH)
## $beta
## $beta$beta.A
## (Intercept) FE UNION HISP ED
## 0.4723209328 -0.3321560790 0.2109852199 -0.0147981972 0.0744391597
## EX EXSQ
## 0.0271108431 -0.0003181424
##
## $beta$beta.B
## (Intercept) FE UNION HISP ED
## NA -5.932053e-02 2.045861e-01 NA 5.426502e-02
## EX EXSQ
## 3.422757e-03 -5.499156e-06
##
## $beta$beta.diff
## (Intercept) FE UNION HISP ED
## NA -0.2728355468 0.0063991103 NA 0.0201741401
## EX EXSQ
## 0.0236880865 -0.0003126433
##
## $beta$beta.R
## (Intercept) FE UNION HISP ED
## [1,] 0.0000000 NA -0.05932053 0.2045861 NA 0.05426502
## [2,] 1.0000000 NA -0.33215608 0.2109852 NA 0.07443916
## [3,] 0.5000000 NA -0.19573831 0.2077857 NA 0.06435209
## [4,] 0.8963636 NA -0.30388040 0.2103220 NA 0.07234839
## [5,] -1.0000000 0.4574825 -0.31556422 0.2037414 -0.002297049 0.07671444
## [6,] -2.0000000 0.4881678 -0.30604774 0.2071429 -0.027147741 0.07460975
## EX EXSQ
## [1,] 0.003422757 -5.499156e-06
## [2,] 0.027110843 -3.181424e-04
## [3,] 0.015266800 -1.618208e-04
## [4,] 0.024655896 -2.857412e-04
## [5,] 0.024939456 -2.849143e-04
## [6,] 0.026191363 -3.081690e-04
##
##
## $call
## oaxaca(formula = LNWAGE ~ FE + UNION + HISP + ED + EX + EXSQ |
## NONWH | HISP, data = cps78, R = 30)
##
## $n
## $n$n.A
## [1] 493
##
## $n$n.B
## [1] 57
##
## $n$n.pooled
## [1] 550
##
##
## $R
## [1] 30
##
## $reg
## $reg$reg.A
##
## Call:
## NULL
##
## Coefficients:
## (Intercept) FE UNION HISP ED
## 0.4871191 -0.3321561 0.2109852 -0.0295964 0.0744392
## EX EXSQ
## 0.0271108 -0.0003181
##
##
## $reg$reg.B
##
## Call:
## NULL
##
## Coefficients:
## (Intercept) FE UNION HISP ED
## 7.554e-01 -5.932e-02 2.046e-01 NA 5.427e-02
## EX EXSQ
## 3.423e-03 -5.499e-06
##
##
## $reg$reg.pooled.1
##
## Call:
## NULL
##
## Coefficients:
## (Intercept) FE UNION HISP ED
## 0.4597795 -0.3155642 0.2037414 -0.0045941 0.0767144
## EX EXSQ
## 0.0249395 -0.0002849
##
##
## $reg$reg.pooled.2
##
## Call:
## NULL
##
## Coefficients:
## (Intercept) FE UNION HISP ED
## 0.4881678 -0.3060477 0.2071429 -0.0271477 0.0746097
## EX EXSQ NONWH
## 0.0261914 -0.0003082 -0.1572652
##
##
##
## $threefold
## $threefold$overall
## coef(endowments) se(endowments) coef(coefficients)
## NA NA NA
## se(coefficients) coef(interaction) se(interaction)
## NA NA NA
##
## $threefold$variables
## coef(endowments) se(endowments) coef(coefficients)
## (Intercept) NA NA NA
## FE 0.0076016240 0.01456646 -0.134024479
## UNION -0.0183756927 0.01259739 0.002469832
## HISP NA NA NA
## ED 0.0494643776 0.03012855 0.236426765
## EX -0.0131345133 0.06778081 0.524878128
## EXSQ 0.0007776276 0.04132057 -0.204759405
## (Base) NA NA NA
## se(coefficients) coef(interaction) se(interaction)
## (Intercept) NA NA NA
## FE 0.06248229 0.0349624855 0.02539283
## UNION 0.04984561 -0.0005747608 0.01226216
## HISP NA NA NA
## ED 0.28712203 0.0183894025 0.02732082
## EX 0.39751547 -0.0909008509 0.08189638
## EXSQ 0.20128791 0.0442104246 0.05621296
## (Base) NA NA NA
##
##
## $twofold
## $twofold$overall
## group.weight coef(explained) se(explained) coef(unexplained)
## [1,] 0.0000000 NA NA NA
## [2,] 1.0000000 NA NA NA
## [3,] 0.5000000 NA NA NA
## [4,] 0.8963636 NA NA NA
## [5,] -1.0000000 0.03631688 0.04046189 NA
## [6,] -2.0000000 0.02971078 0.03991014 NA
## se(unexplained) coef(unexplained A) se(unexplained A)
## [1,] NA NA NA
## [2,] NA NA NA
## [3,] NA NA NA
## [4,] NA NA NA
## [5,] NA 1.561376e-02 6.506725e-03
## [6,] NA -6.709910e-15 4.757843e-15
## coef(unexplained B) se(unexplained B)
## [1,] NA NA
## [2,] NA NA
## [3,] NA NA
## [4,] NA NA
## [5,] NA NA
## [6,] NA NA
##
## $twofold$variables
## $twofold$variables[[1]]
## group.weight coef(explained) se(explained) coef(unexplained)
## (Intercept) 0 NA NA NA
## FE 0 0.0076016240 0.01456646 -0.099061994
## UNION 0 -0.0183756927 0.01259739 0.001895071
## HISP 0 NA NA NA
## ED 0 0.0494643776 0.03012855 0.254816168
## EX 0 -0.0131345133 0.06778081 0.433977277
## EXSQ 0 0.0007776276 0.04132057 -0.160548980
## (Base) 0 NA NA NA
## se(unexplained) coef(unexplained A) se(unexplained A)
## (Intercept) NA NA NA
## FE 0.04882340 -0.099061994 0.04882340
## UNION 0.03853753 0.001895071 0.03853753
## HISP NA NA NA
## ED 0.31162477 0.254816168 0.31162477
## EX 0.32589617 0.433977277 0.32589617
## EXSQ 0.15514982 -0.160548980 0.15514982
## (Base) NA NA NA
## coef(unexplained B) se(unexplained B)
## (Intercept) NA NA
## FE 0 0
## UNION 0 0
## HISP NA NA
## ED 0 0
## EX 0 0
## EXSQ 0 0
## (Base) NA NA
##
## $twofold$variables[[2]]
## group.weight coef(explained) se(explained) coef(unexplained)
## (Intercept) 1 NA NA NA
## FE 1 0.04256411 0.02483971 -0.134024479
## UNION 1 -0.01895045 0.01139022 0.002469832
## HISP 1 NA NA NA
## ED 1 0.06785378 0.02949057 0.236426765
## EX 1 -0.10403536 0.05264998 0.524878128
## EXSQ 1 0.04498805 0.03797563 -0.204759405
## (Base) 1 NA NA NA
## se(unexplained) coef(unexplained A) se(unexplained A)
## (Intercept) NA NA NA
## FE 0.06248229 0 0
## UNION 0.04984561 0 0
## HISP NA NA NA
## ED 0.28712203 0 0
## EX 0.39751547 0 0
## EXSQ 0.20128791 0 0
## (Base) NA NA NA
## coef(unexplained B) se(unexplained B)
## (Intercept) NA NA
## FE -0.134024479 0.06248229
## UNION 0.002469832 0.04984561
## HISP NA NA
## ED 0.236426765 0.28712203
## EX 0.524878128 0.39751547
## EXSQ -0.204759405 0.20128791
## (Base) NA NA
##
## $twofold$variables[[3]]
## group.weight coef(explained) se(explained) coef(unexplained)
## (Intercept) 0.5 NA NA NA
## FE 0.5 0.02508287 0.01591846 -0.116543236
## UNION 0.5 -0.01866307 0.01032596 0.002182452
## HISP 0.5 NA NA NA
## ED 0.5 0.05865908 0.02649726 0.245621466
## EX 0.5 -0.05858494 0.04479258 0.479427702
## EXSQ 0.5 0.02288284 0.02801418 -0.182654192
## (Base) 0.5 NA NA NA
## se(unexplained) coef(unexplained A) se(unexplained A)
## (Intercept) NA NA NA
## FE 0.05461393 -0.0495309968 0.02441170
## UNION 0.04412791 0.0009475356 0.01926876
## HISP NA NA NA
## ED 0.29931242 0.1274080838 0.15581239
## EX 0.36116018 0.2169886385 0.16294808
## EXSQ 0.17749414 -0.0802744899 0.07757491
## (Base) NA NA NA
## coef(unexplained B) se(unexplained B)
## (Intercept) NA NA
## FE -0.067012240 0.03124114
## UNION 0.001234916 0.02492281
## HISP NA NA
## ED 0.118213383 0.14356102
## EX 0.262439064 0.19875773
## EXSQ -0.102379702 0.10064395
## (Base) NA NA
##
## $twofold$variables[[4]]
## group.weight coef(explained) se(explained) coef(unexplained)
## (Intercept) 0.8963636 NA NA NA
## FE 0.8963636 0.03894072 0.01393692 -0.130401094
## UNION 0.8963636 -0.01889089 0.01190484 0.002410266
## HISP 0.8963636 NA NA NA
## ED 0.8963636 0.06594797 0.02888680 0.238332576
## EX 0.8963636 -0.09461473 0.06150070 0.515457494
## EXSQ 0.8963636 0.04040624 0.03723384 -0.200177597
## (Base) 0.8963636 NA NA NA
## se(unexplained) coef(unexplained A) se(unexplained A)
## (Intercept) NA NA NA
## FE 0.04981350 -0.0102664248 0.04376352
## UNION 0.03968314 0.0001963983 0.03454364
## HISP NA NA NA
## ED 0.30906345 0.0264082210 0.27932911
## EX 0.33309861 0.0449758269 0.29212147
## EXSQ 0.15963165 -0.0166387125 0.13907066
## (Base) NA NA NA
## coef(unexplained B) se(unexplained B)
## (Intercept) NA NA
## FE -0.120134669 0.006475437
## UNION 0.002213868 0.005165818
## HISP NA NA
## ED 0.211924355 0.029756283
## EX 0.470481667 0.041197058
## EXSQ -0.183538884 0.020860747
## (Base) NA NA
##
## $twofold$variables[[5]]
## group.weight coef(explained) se(explained) coef(unexplained)
## (Intercept) -1 0.0000000000 0.000000000 NA
## FE -1 0.0404379476 0.024054472 -0.131898317
## UNION -1 -0.0182998180 0.010171545 0.001819197
## HISP -1 -0.0001677358 0.001991721 NA
## ED -1 0.0699277744 0.031041819 0.234352771
## EX -1 -0.0957028644 0.049593568 0.516545628
## EXSQ -1 0.0402893131 0.035347630 -0.200060665
## (Base) -1 -0.0001677358 0.001991721 NA
## se(unexplained) coef(unexplained A) se(unexplained A)
## (Intercept) NA 0.0148384792 0.0327159637
## FE 0.06107992 -0.0060242236 0.0053191148
## UNION 0.04808966 0.0021452412 0.0053697905
## HISP NA -0.0009128628 0.0004251625
## ED 0.28816691 -0.0287386873 0.0276499229
## EX 0.39223921 0.0397808773 0.0366347920
## EXSQ 0.19697050 -0.0170633463 0.0236118832
## (Base) NA 0.0115882858 0.0049954876
## coef(unexplained B) se(unexplained B)
## (Intercept) NA NA
## FE -0.1258740936 0.05733290
## UNION -0.0003260446 0.04318696
## HISP NA NA
## ED 0.2630914580 0.27486438
## EX 0.4767647507 0.37082698
## EXSQ -0.1829973190 0.18469909
## (Base) NA NA
##
## $twofold$variables[[6]]
## group.weight coef(explained) se(explained) coef(unexplained)
## (Intercept) -2 0.000000e+00 0.000000e+00 NA
## FE -2 3.921846e-02 2.287563e-02 -0.13067883
## UNION -2 -1.860534e-02 1.073824e-02 0.00212472
## HISP -2 -1.982391e-03 4.130224e-03 NA
## ED -2 6.800928e-02 2.954205e-02 0.23627127
## EX -2 -1.005069e-01 5.081564e-02 0.52134971
## EXSQ -2 4.357772e-02 3.589377e-02 -0.20334908
## (Base) -2 -3.469447e-18 5.997735e-18 NA
## se(unexplained) coef(unexplained A) se(unexplained A)
## (Intercept) NA -0.0158468585 0.038743665
## FE 0.06078279 -0.0094794986 0.005061233
## UNION 0.04837370 0.0011378846 0.004767832
## HISP NA 0.0009017922 0.001997277
## ED 0.28882661 -0.0021546627 0.028940926
## EX 0.39344082 0.0168453166 0.030443150
## EXSQ 0.19778626 -0.0051215724 0.019627354
## (Base) NA 0.0137175987 0.026606124
## coef(unexplained B) se(unexplained B)
## (Intercept) NA NA
## FE -0.1211993298 0.05647966
## UNION 0.0009868357 0.04408616
## HISP NA NA
## ED 0.2384259314 0.26847487
## EX 0.5045043924 0.37498568
## EXSQ -0.1982275031 0.18573175
## (Base) NA NA
##
##
##
## $x
## $x$x.mean.A
## (Intercept) FE UNION HISP ED
## 1.00000000 0.36308316 0.29614604 0.07302231 12.63083164
## EX EXSQ
## 18.32048682 513.52129817
##
## $x$x.mean.B
## (Intercept) FE UNION HISP ED EX
## 1.0000000 0.4912281 0.3859649 0.0000000 11.7192982 22.1578947
## EXSQ
## 654.9298246
##
## $x$x.mean.diff
## (Intercept) FE UNION HISP ED
## 0.00000000 -0.12814491 -0.08981887 0.07302231 0.91153340
## EX EXSQ
## -3.83740792 -141.40852639
##
##
## $y
## $y$y.A
## [1] 1.70038
##
## $y$y.B
## [1] 1.513404
##
## $y$y.diff
## [1] 0.186976
##
##
## attr(,"class")
## [1] "oaxaca"
Con respecto a la raza, denominando el grupo A de la descomposición de Blinder-Oaxaca como el grupo de personas blancas y el B como las no blancas. Se puede mostrar que la diferencia en el lnsalario de estos dos grupos es de $0.1869 y se puede descomponer en 2 factores: 0.03631688 que es la parte explicada por las diferencias en medias de las variables explicativas de cada grupo y 0.15058312 que permanece inexplicada, pero se podría interpretar como la proporción que es atribuida a los efectos por discriminación por raza.Se utilizo group weight -1.
library(oaxaca)
descomposicion.oaxaca <- oaxaca(LNWAGE ~ FE+UNION+NONWH+ED+EX+EXSQ | HISP , data = cps78, R=30)
## oaxaca: oaxaca() performing analysis. Please wait.
##
## Bootstrapping standard errors:
## 1 / 30 (3.33%)
## 3 / 30 (10%)
## 6 / 30 (20%)
## 9 / 30 (30%)
## 12 / 30 (40%)
## 15 / 30 (50%)
## 18 / 30 (60%)
## 21 / 30 (70%)
## 24 / 30 (80%)
## 27 / 30 (90%)
## 30 / 30 (100%)
(descomposicion.oaxaca)
## $beta
## $beta$beta.A
## (Intercept) FE UNION NONWH ED
## 0.4586883439 -0.3104372934 0.1949597090 -0.1548713566 0.0766732905
## EX EXSQ
## 0.0270010318 -0.0003206584
##
## $beta$beta.B
## (Intercept) FE UNION NONWH ED
## 0.6821229931 -0.2349456594 0.4169982523 NA 0.0550338349
## EX EXSQ
## 0.0208197163 -0.0002607526
##
## $beta$beta.diff
## (Intercept) FE UNION NONWH ED
## -2.234346e-01 -7.549163e-02 -2.220385e-01 NA 2.163946e-02
## EX EXSQ
## 6.181316e-03 -5.990577e-05
##
## $beta$beta.R
## (Intercept) FE UNION NONWH ED
## [1,] 0.0000000 0.6821230 -0.2349457 0.4169983 NA 0.05503383
## [2,] 1.0000000 0.4586883 -0.3104373 0.1949597 NA 0.07667329
## [3,] 0.5000000 0.5704057 -0.2726915 0.3059790 NA 0.06585356
## [4,] 0.9345455 0.4733132 -0.3054960 0.2094931 NA 0.07525689
## [5,] -1.0000000 0.4788406 -0.3058867 0.2084951 -0.1547826 0.07522830
## [6,] -2.0000000 0.4881678 -0.3060477 0.2071429 -0.1572652 0.07460975
## EX EXSQ
## [1,] 0.02081972 -0.0002607526
## [2,] 0.02700103 -0.0003206584
## [3,] 0.02391037 -0.0002907055
## [4,] 0.02659644 -0.0003167373
## [5,] 0.02604495 -0.0003047506
## [6,] 0.02619136 -0.0003081690
##
##
## $call
## oaxaca(formula = LNWAGE ~ FE + UNION + NONWH + ED + EX + EXSQ |
## HISP, data = cps78, R = 30)
##
## $n
## $n$n.A
## [1] 514
##
## $n$n.B
## [1] 36
##
## $n$n.pooled
## [1] 550
##
##
## $R
## [1] 30
##
## $reg
## $reg$reg.A
##
## Call:
## NULL
##
## Coefficients:
## (Intercept) FE UNION NONWH ED
## 0.4586883 -0.3104373 0.1949597 -0.1548714 0.0766733
## EX EXSQ
## 0.0270010 -0.0003207
##
##
## $reg$reg.B
##
## Call:
## NULL
##
## Coefficients:
## (Intercept) FE UNION NONWH ED
## 0.6821230 -0.2349457 0.4169983 NA 0.0550338
## EX EXSQ
## 0.0208197 -0.0002608
##
##
## $reg$reg.pooled.1
##
## Call:
## NULL
##
## Coefficients:
## (Intercept) FE UNION NONWH ED
## 0.4788406 -0.3058867 0.2084951 -0.1547826 0.0752283
## EX EXSQ
## 0.0260449 -0.0003048
##
##
## $reg$reg.pooled.2
##
## Call:
## NULL
##
## Coefficients:
## (Intercept) FE UNION NONWH ED
## 0.4881678 -0.3060477 0.2071429 -0.1572652 0.0746097
## EX EXSQ HISP
## 0.0261914 -0.0003082 -0.0271477
##
##
##
## $threefold
## $threefold$overall
## coef(endowments) se(endowments) coef(coefficients)
## NA NA NA
## se(coefficients) coef(interaction) se(interaction)
## NA NA NA
##
## $threefold$variables
## coef(endowments) se(endowments) coef(coefficients)
## (Intercept) 0.00000000 0.00000000 -0.22343465
## FE -0.01081786 0.02111666 -0.02516388
## UNION 0.04953319 0.03593125 -0.04317416
## NONWH NA NA NA
## ED 0.13136860 0.04521447 0.22300661
## EX -0.05207179 0.06439182 0.13015103
## EXSQ 0.02465916 0.04549378 -0.03693524
## se(coefficients) coef(interaction) se(interaction)
## (Intercept) 0.22263214 0.000000000 0.000000000
## FE 0.04381898 -0.003475944 0.009753899
## UNION 0.03751761 -0.026374877 0.029071777
## NONWH NA NA NA
## ED 0.16527483 0.051654494 0.039971948
## EX 0.31184557 -0.015459970 0.039156547
## EXSQ 0.17708631 0.005665240 0.032498583
##
##
## $twofold
## $twofold$overall
## group.weight coef(explained) se(explained) coef(unexplained)
## [1,] 0.0000000 NA NA NA
## [2,] 1.0000000 NA NA NA
## [3,] 0.5000000 NA NA NA
## [4,] 0.9345455 NA NA NA
## [5,] -1.0000000 0.1367705 0.05403894 NA
## [6,] -2.0000000 0.1348078 0.05492561 NA
## se(unexplained) coef(unexplained A) se(unexplained A)
## [1,] NA NA NA
## [2,] NA NA NA
## [3,] NA NA NA
## [4,] NA NA NA
## [5,] NA 1.648470e-03 3.048379e-03
## [6,] NA 1.043436e-15 3.892764e-15
## coef(unexplained B) se(unexplained B)
## [1,] NA NA
## [2,] NA NA
## [3,] NA NA
## [4,] NA NA
## [5,] NA NA
## [6,] NA NA
##
## $twofold$variables
## $twofold$variables[[1]]
## group.weight coef(explained) se(explained) coef(unexplained)
## (Intercept) 0 0.00000000 0.00000000 -0.22343465
## FE 0 -0.01081786 0.02111666 -0.02863982
## UNION 0 0.04953319 0.03593125 -0.06954904
## NONWH 0 NA NA NA
## ED 0 0.13136860 0.04521447 0.27466111
## EX 0 -0.05207179 0.06439182 0.11469106
## EXSQ 0 0.02465916 0.04549378 -0.03127000
## se(unexplained) coef(unexplained A) se(unexplained A)
## (Intercept) 0.22263214 -0.22343465 0.22263214
## FE 0.04938464 -0.02863982 0.04938464
## UNION 0.05042729 -0.06954904 0.05042729
## NONWH NA NA NA
## ED 0.19959110 0.27466111 0.19959110
## EX 0.28810900 0.11469106 0.28810900
## EXSQ 0.15793868 -0.03127000 0.15793868
## coef(unexplained B) se(unexplained B)
## (Intercept) 0 0
## FE 0 0
## UNION 0 0
## NONWH NA NA
## ED 0 0
## EX 0 0
## EXSQ 0 0
##
## $twofold$variables[[2]]
## group.weight coef(explained) se(explained) coef(unexplained)
## (Intercept) 1 0.00000000 0.00000000 -0.22343465
## FE 1 -0.01429381 0.02385092 -0.02516388
## UNION 1 0.02315831 0.01264933 -0.04317416
## NONWH 1 NA NA NA
## ED 1 0.18302309 0.05175772 0.22300661
## EX 1 -0.06753176 0.06718693 0.13015103
## EXSQ 1 0.03032440 0.04090800 -0.03693524
## se(unexplained) coef(unexplained A) se(unexplained A)
## (Intercept) 0.22263214 0 0
## FE 0.04381898 0 0
## UNION 0.03751761 0 0
## NONWH NA NA NA
## ED 0.16527483 0 0
## EX 0.31184557 0 0
## EXSQ 0.17708631 0 0
## coef(unexplained B) se(unexplained B)
## (Intercept) -0.22343465 0.22263214
## FE -0.02516388 0.04381898
## UNION -0.04317416 0.03751761
## NONWH NA NA
## ED 0.22300661 0.16527483
## EX 0.13015103 0.31184557
## EXSQ -0.03693524 0.17708631
##
## $twofold$variables[[3]]
## group.weight coef(explained) se(explained) coef(unexplained)
## (Intercept) 0.5 0.00000000 0.00000000 -0.22343465
## FE 0.5 -0.01255583 0.02199103 -0.02690185
## UNION 0.5 0.03634575 0.02267681 -0.05636160
## NONWH 0.5 NA NA NA
## ED 0.5 0.15719584 0.04429634 0.24883386
## EX 0.5 -0.05980178 0.06282425 0.12242105
## EXSQ 0.5 0.02749178 0.04009408 -0.03410262
## se(unexplained) coef(unexplained A) se(unexplained A)
## (Intercept) 0.22263214 -0.11171732 0.11131607
## FE 0.04642939 -0.01431991 0.02469232
## UNION 0.04199939 -0.03477452 0.02521364
## NONWH NA NA NA
## ED 0.18214486 0.13733055 0.09979555
## EX 0.29957290 0.05734553 0.14405450
## EXSQ 0.16699717 -0.01563500 0.07896934
## coef(unexplained B) se(unexplained B)
## (Intercept) -0.11171732 0.11131607
## FE -0.01258194 0.02190949
## UNION -0.02158708 0.01875880
## NONWH NA NA
## ED 0.11150331 0.08263742
## EX 0.06507552 0.15592279
## EXSQ -0.01846762 0.08854316
##
## $twofold$variables[[4]]
## group.weight coef(explained) se(explained) coef(unexplained)
## (Intercept) 0.9345455 0.00000000 0.00000000 -0.22343465
## FE 0.9345455 -0.01406629 0.02116935 -0.02539139
## UNION 0.9345455 0.02488467 0.03413683 -0.04490052
## NONWH 0.9345455 NA NA NA
## ED 0.9345455 0.17964207 0.04458862 0.22638763
## EX 0.9345455 -0.06651984 0.06384819 0.12913911
## EXSQ 0.9345455 0.02995358 0.04448758 -0.03656442
## se(unexplained) coef(unexplained A) se(unexplained A)
## (Intercept) 0.22263214 -0.014624813 0.20805985
## FE 0.04898029 -0.001874607 0.04615219
## UNION 0.04916197 -0.004552301 0.04712659
## NONWH NA NA NA
## ED 0.19727981 0.017977818 0.18652695
## EX 0.28956025 0.007507051 0.26925095
## EXSQ 0.15905945 -0.002046764 0.14760087
## coef(unexplained B) se(unexplained B)
## (Intercept) -0.20880984 0.014572285
## FE -0.02351679 0.002868151
## UNION -0.04034822 0.002455698
## NONWH NA NA
## ED 0.20840982 0.010817989
## EX 0.12163206 0.020411710
## EXSQ -0.03451766 0.011591104
##
## $twofold$variables[[5]]
## group.weight coef(explained) se(explained) coef(unexplained)
## (Intercept) -1 0.00000000 0.00000000 -0.22343465
## FE -1 -0.01408428 0.02360824 -0.02537341
## UNION -1 0.02476611 0.01337202 -0.04478196
## NONWH -1 -0.01716461 0.00653664 NA
## ED -1 0.17957383 0.05079866 0.22645587
## EX -1 -0.06514052 0.06445607 0.12775979
## EXSQ -1 0.02882001 0.03854856 -0.03543085
## se(unexplained) coef(unexplained A) se(unexplained A)
## (Intercept) 0.22263214 -2.015225e-02 0.0278510714
## FE 0.04404317 -1.726397e-03 0.0027721046
## UNION 0.03766693 -4.239676e-03 0.0029478673
## NONWH NA -9.839993e-06 0.0006154764
## ED 0.16744878 1.834067e-02 0.0252706659
## EX 0.31063458 1.773962e-02 0.0190197864
## EXSQ 0.17606618 -8.303660e-03 0.0116512230
## coef(unexplained B) se(unexplained B)
## (Intercept) -0.20328240 0.20917426
## FE -0.02364701 0.04172765
## UNION -0.04054228 0.03531387
## NONWH NA NA
## ED 0.20811520 0.15794453
## EX 0.11002017 0.29772672
## EXSQ -0.02712719 0.16897105
##
## $twofold$variables[[6]]
## group.weight coef(explained) se(explained) coef(unexplained)
## (Intercept) -2 0.00000000 0.000000000 -0.22343465
## FE -2 -0.01409169 0.023649909 -0.02536599
## UNION -2 0.02460550 0.013153698 -0.04462134
## NONWH -2 -0.01743992 0.006668287 NA
## ED -2 0.17809731 0.050498002 0.22793240
## EX -2 -0.06550672 0.065174247 0.12812599
## EXSQ -2 0.02914329 0.039149608 -0.03575413
## se(unexplained) coef(unexplained A) se(unexplained A)
## (Intercept) 0.22263214 -0.0294794474 0.019156601
## FE 0.04402177 -0.0016652977 0.002742731
## UNION 0.03778743 -0.0038161392 0.002869142
## NONWH NA 0.0002654676 0.000326108
## ED 0.16742329 0.0261917442 0.017452333
## EX 0.31092924 0.0150229727 0.016003508
## EXSQ 0.17637897 -0.0065193001 0.009293437
## coef(unexplained B) se(unexplained B)
## (Intercept) -0.19395520 0.21081818
## FE -0.02370069 0.04168521
## UNION -0.04080521 0.03523519
## NONWH NA NA
## ED 0.20174065 0.15580018
## EX 0.11310301 0.29918320
## EXSQ -0.02923482 0.17016567
##
##
##
## $x
## $x$x.mean.A
## (Intercept) FE UNION NONWH ED EX
## 1.0000000 0.3793774 0.3132296 0.1108949 12.6926070 18.5544747
## EXSQ
## 521.9863813
##
## $x$x.mean.B
## (Intercept) FE UNION NONWH ED EX
## 1.0000000 0.3333333 0.1944444 0.0000000 10.3055556 21.0555556
## EXSQ
## 616.5555556
##
## $x$x.mean.diff
## (Intercept) FE UNION NONWH ED EX
## 0.0000000 0.0460441 0.1187851 0.1108949 2.3870514 -2.5010808
## EXSQ
## -94.5691742
##
##
## $y
## $y$y.A
## [1] 1.691603
##
## $y$y.B
## [1] 1.529647
##
## $y$y.diff
## [1] 0.1619555
##
##
## attr(,"class")
## [1] "oaxaca"
Con respecto a si es hispano o no, denominando el grupo A de la descomposición de Blinder-Oaxaca como el grupo de no hispanas y el B como la hispanas. Se puede mostrar que la diferencia en el lnsalario de estos dos grupos es de $0.1619555 y se puede descomponer en 2 factores: 0.1367705 que es la parte explicada por las diferencias en medias de las variables explicativas de cada grupo y 0.025185 que permanece inexplicada, pero se podría interpretar como la proporción que es atribuida a los efectos por discriminación por que sea hispana la persona.Se utilizo group weight -1.
El propósito de este ejercicio es revisar la heteroscedasticidad del modelo de regresión lnwagemodel con datos de determinantes del salario de 1985.
A continuación leemos los datos para la regresión:
archivo1985<-"C:/Users/Diego/Desktop/Econometria/cps85.txt"
data1985<-read.table(archivo1985,header=TRUE)
View(data1985)
attach(data1985)
## The following objects are masked from cps78:
##
## AGE, CLER, CONSTR, ED, EX, EXSQ, FE, HISP, LNWAGE, MANAG,
## MANUF, MARR, MARRFE, NONWH, Obs, PROF, SALES, SERV, SOUTH,
## UNION
lnwagemodel<-lm(LNWAGE~FE+UNION+NONWH+HISP+ED+EX+EXSQ)
Se presenta resumen con los parámetros estimados, su significancia y las desviaciones estándar:
summary(lnwagemodel)
##
## Call:
## lm(formula = LNWAGE ~ FE + UNION + NONWH + HISP + ED + EX + EXSQ)
##
## Residuals:
## Min 1Q Median 3Q Max
## -2.21418 -0.28261 0.00361 0.28082 2.12519
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 0.6246849 0.1203640 5.190 3.01e-07 ***
## FE -0.2317750 0.0386147 -6.002 3.63e-09 ***
## UNION 0.2116322 0.0504893 4.192 3.25e-05 ***
## NONWH -0.1252402 0.0576528 -2.172 0.0303 *
## HISP -0.0807345 0.0877940 -0.920 0.3582
## ED 0.0888187 0.0079602 11.158 < 2e-16 ***
## EX 0.0344669 0.0053782 6.409 3.27e-10 ***
## EXSQ -0.0005270 0.0001181 -4.463 9.89e-06 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.4367 on 526 degrees of freedom
## Multiple R-squared: 0.3243, Adjusted R-squared: 0.3153
## F-statistic: 36.06 on 7 and 526 DF, p-value: < 2.2e-16
A continuación la matriz de varianzas y covarianzas corregidas por heterocedasticidad por método de errores robustos de White:
hccm(lnwagemodel,"hc0")
## (Intercept) FE UNION NONWH
## (Intercept) 1.501495e-02 -2.373168e-04 -3.288186e-05 -9.596323e-04
## FE -2.373168e-04 1.512547e-03 3.715829e-04 1.931018e-04
## UNION -3.288186e-05 3.715829e-04 2.066662e-03 -2.212040e-04
## NONWH -9.596323e-04 1.931018e-04 -2.212040e-04 2.829489e-03
## HISP -2.455889e-03 -1.598999e-04 2.584399e-04 4.741011e-04
## ED -8.937864e-04 -1.766173e-05 -1.481774e-05 4.132178e-05
## EX -2.733306e-04 -2.932899e-05 -3.314982e-05 -6.195827e-06
## EXSQ 4.108413e-06 2.946069e-07 3.306297e-07 1.218752e-07
## HISP ED EX EXSQ
## (Intercept) -2.455889e-03 -8.937864e-04 -2.733306e-04 4.108413e-06
## FE -1.598999e-04 -1.766173e-05 -2.932899e-05 2.946069e-07
## UNION 2.584399e-04 -1.481774e-05 -3.314982e-05 3.306297e-07
## NONWH 4.741011e-04 4.132178e-05 -6.195827e-06 1.218752e-07
## HISP 7.317179e-03 1.354833e-04 9.956608e-06 2.590930e-07
## ED 1.354833e-04 6.749836e-05 -2.202810e-07 9.568041e-08
## EX 9.956608e-06 -2.202810e-07 3.566673e-05 -7.403641e-07
## EXSQ 2.590930e-07 9.568041e-08 -7.403641e-07 1.678337e-08
matrizhetero<-hccm(lnwagemodel,"hc0")
View(matrizhetero)
Enseguida un comparativo entre las desviaciones estándar de los estimadores de la regresión original y los errores robustos de White
heterovshomo<-"C:/Users/Diego/Desktop/Econometria/errores st homo vs hetero.txt"
read.table(heterovshomo,header=TRUE)
comparativo<-read.table(heterovshomo,header=TRUE)
View(comparativo)
Interpretación de los resultados: ¿Son los errores estándar robustos mas grandes que las desviaciones estándar de la regresión lnwagemodel? Como podemos observar en el comparativo, el intercepto y las variables FE, ED, EX y EXSQ tienen errores estándar robustos mayores que las desviaciones estándar. Las variables UNION, NONWH e HISP presentan errores estándar robustos menores que sus respectivas desviaciones estándar.
MCGregresion<-glm(LNWAGE~FE+UNION+NONWH+HISP+ED+EX+EXSQ)
summary(MCGregresion)
##
## Call:
## glm(formula = LNWAGE ~ FE + UNION + NONWH + HISP + ED + EX +
## EXSQ)
##
## Deviance Residuals:
## Min 1Q Median 3Q Max
## -2.21418 -0.28261 0.00361 0.28082 2.12519
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 0.6246849 0.1203640 5.190 3.01e-07 ***
## FE -0.2317750 0.0386147 -6.002 3.63e-09 ***
## UNION 0.2116322 0.0504893 4.192 3.25e-05 ***
## NONWH -0.1252402 0.0576528 -2.172 0.0303 *
## HISP -0.0807345 0.0877940 -0.920 0.3582
## ED 0.0888187 0.0079602 11.158 < 2e-16 ***
## EX 0.0344669 0.0053782 6.409 3.27e-10 ***
## EXSQ -0.0005270 0.0001181 -4.463 9.89e-06 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for gaussian family taken to be 0.1906988)
##
## Null deviance: 148.44 on 533 degrees of freedom
## Residual deviance: 100.31 on 526 degrees of freedom
## AIC: 640.5
##
## Number of Fisher Scoring iterations: 2
A continuación comparar la estimación de los parámetros y sus errores estándar en MCGregresion con los de la primera regresión lnwagemodel. Al comparar los resultados de la regresión de MCG con la de MCO se obtiene lo siguiente:
summary(lnwagemodel)
##
## Call:
## lm(formula = LNWAGE ~ FE + UNION + NONWH + HISP + ED + EX + EXSQ)
##
## Residuals:
## Min 1Q Median 3Q Max
## -2.21418 -0.28261 0.00361 0.28082 2.12519
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 0.6246849 0.1203640 5.190 3.01e-07 ***
## FE -0.2317750 0.0386147 -6.002 3.63e-09 ***
## UNION 0.2116322 0.0504893 4.192 3.25e-05 ***
## NONWH -0.1252402 0.0576528 -2.172 0.0303 *
## HISP -0.0807345 0.0877940 -0.920 0.3582
## ED 0.0888187 0.0079602 11.158 < 2e-16 ***
## EX 0.0344669 0.0053782 6.409 3.27e-10 ***
## EXSQ -0.0005270 0.0001181 -4.463 9.89e-06 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.4367 on 526 degrees of freedom
## Multiple R-squared: 0.3243, Adjusted R-squared: 0.3153
## F-statistic: 36.06 on 7 and 526 DF, p-value: < 2.2e-16
Como se puede observar, los estimadores y sus respectivas desviaciones estándar son iguales con Mínimos Cuadrados Ordinarios y con Mínimos Cuadrados Generalizados. Con MCG es seguro que los estimadores son insesgados, consistentes y eficientes. MCG se aplica cuando se piensa que hay heteroscedasticidad. En este caso los resultados son iguales con MCO y MCG, por lo que no hay heteroscedasticidad.
bptest(lnwagemodel,~FE*UNION+FE*NONWH+FE*HISP+FE*ED+FE*EX+FE*EXSQ+UNION*NONWH+UNION*HISP+UNION*ED+UNION*EX+UNION*EXSQ+NONWH*ED+NONWH*EX+NONWH*EXSQ+HISP*ED+HISP*EX+HISP*EXSQ+I(ED^2)+I(EXSQ^2))
##
## studentized Breusch-Pagan test
##
## data: lnwagemodel
## BP = 20.25, df = 26, p-value = 0.7796
*Nota: Aunque se usó el comando para una prueba Breusch Pagan, se tomaron en cuenta los productos de las regresoras entre sí para imitar la prueba de White.
Conclusión: Considerando un alfa de 0.05 para nuestra prueba de hipotesis, con el valor p obtenido, no se rechaza H cero, por lo cual se considera que no hay heteroscedasticidad en el modelo lnwagemodel.