Márcia Isabel Silva Oliveira A95593, Mariana Beatriz Pinto Pinheiro A97424, Sara Catarina Pereira Ramos A97172, Sofia Isabel Martins Campos A97047
20 junho 2022 21:23
A discriminação, tem sido um dos temas mais debatidos nos tempos decorrentes, nomeadamente a diferenciação de acordo com a beleza dos indivíduos. A partir da base de dados “beauty”, constituída por 1260 observações, procedemos ao estudo do impacto da beleza no sucesso, particularmente no salário. Deste modo, iremos recorrer ao auxílio de modelos econométricos fulcrais para a determinação do efeito da aparência e possível distinção do impacto entre géneros. Além disso, pretendemos agilizar o entendimento de como a classificação mais elevada de um “look” pode motivar a existência de um prémio salarial, relacionando todas as variáveis relevantes para o modelo.
discriminação; beleza;aparência; géneros; prémio salarial.
I14, J15, J16, J31, J71
O presente trabalho proposto no âmbito da unidade curricular de Econometria II, tem como principal temática a influência do beleza no sucesso, nomeadamente no salário, informações presentes na base de dados “beauty”.
Por conseguinte, a determinação deste tema baseou-se no interesse que nos despulta sobretudo pela sua preponderância crescente no quotidiano do mercado de trabalho, bem como a sua abordagem no livro “A Culpa Vive Solteira”, de um dos mais prestigiados investigadores da Universidade do Minho, o professor Luís Aguiar-Conraria.
Deste modo, resultados obtidos a partir da base de dados constituída por 8 variáveis explicativas avaliam o parâmetro de beleza de acordo com a classificação dos “looks”, desenvolvidos ao longo do estudo e sujeitos a elaboração de Modelos Estatísticos com vista a estudar e analisar o impacto da nossa variável primordial na determinação do salário. Ao longo do estudo, iremos proceder à elaboração de quatro modelos e avaliação aprofundada dos seus reusltados, baseadas nos modelos de Ordinary Least Regression (OLS).
Por fim, considerando que são necessárias duas condições necessárias para a Inferência Estatística ser aceite, iremos testar a heteroscedasticidade e autocorrelação das variáveis.
Após a leitura de diversos papers, averiguámos que nas recentes décadas, a discriminação no mercado de trabalho tem sido uma integrante assídua em imensos estudos e revisões de literatura, cujo objetivo primordial se depreende com a verificação das diferenças salariais entre trabalhadores pertencentes a grupos com determinadas características definidas (género, idade, beleza, perfil racial, entre outros).
A discriminação no mercado de trabalho tem vindo a enaltecer-se e acentua-se num determinado grupo - aqueles fisicamente atrativos e não atrativos, devido elevado número de relatos de discriminação baseados na aparência dos trabalhadores (Malos, 2007).
Apesar da definição de “fisicamente atraente” ser árdua de explicar e sintetizar, alguns autores apresentaram definições. Os autores Hatfiled & Sprecher (1986) definiram “fisicamente atraente” como alguém “(…) que representa o conceito ideal de aparência; (…) que oferece o maior grau de prazer para os sentidos”. Por outro lado, o autor Morrow (1990) propôs a definição de atratividade física a partir de uma perspetiva mais intuitiva “grau em que a imagem facial induz uma reação favorável por parte de outrem”.
Embora estas duas definições sejam particularmente consistentes, existem escassos padrões de “atratividade” ao longo das culturas (Hatfield e Sprecher, 1986), sendo que estas ideologias de “beleza” tendem a alterar-se com o passar dos anos e variam de cultura para cultura (Hamermesh & Biddle ,1994).
O primeiro estudo económico que relaciona a beleza e o mercado de trabalho foi realizado por Hamermesh e Biddle (1994), que demonstrou o ponto fulcral a que este estudo se depara, se existem diferenças nos resultados do mercado de trabalho baseados na aparência física e caso afirmativo, potenciais explicações para o sucedido. O estudo realizado pelos economistas Daniel Hamermesh e Jeff Biddle utilizou dados recolhidos para analisar o impacto da aparência de uma pessoa na sua remuneração. Nesta pesquisa, o entrevistador que colocava as questões era também responsável por avaliar a aparência física dos candidatos, classificados por diferentes grupos abaixo da média, na média e acima da média, com o objetivo primordial de verificar se a aparência estava correlacionada e afetava a remuneração dos entrevistados.
No entanto, diversos investigadores apresentaram outras alternativas utilizadas para mensurar a beleza/ atratividade física que incluem a estatura e estrutura física (altura e peso) e o vestir apropriado, características presentes usualmente em estudos económicos, uma vez que os anteriores consideram que são menos sujeitas a erros de mensuração, ou seja, não dependem de ideologias subjetivas dos observadores. (Loureiro et al., 2012); (Caliendo & Gehrsitz, 2014); (Lambert, 1972).
De acordo com os autores Liu e Sierminska (2014), existem duas razões principais em que as empresas se baseiam para contratar trabalhadores visualmente mais atraentes. A primeira justifica-se pelo facto de acreditarem que “good-looking” trabalhadores são mais produtivos ou mais capazes, mesmo que esta característica não seja mensurada pela aparência. O segundo motivo está assente na perspetiva que os empregadores preferem trabalhar com pessoas que demonstram melhor aparência física ainda que não tenham crenças nas suas reais habilidades.
A existência de um “prémio de beleza”, quer seja salarial ou a nível de sucesso pode ser evidenciado pela beleza possivelmente estar positivamente correlacionada com algumas aptidões cognitivas/ não cognitivas, confiança, liderança, comunicação, entre outros aspetos recompensados no mercado de trabalho ou permitem que os trabalhadores elevem a sua produtividade (Feingold 1992).
Concluiu-se ainda que o efeito da atratividade física no mercado de trabalho pode variar de acordo com o género, devido sobretudo às diferenças de oportunidades atribuídas a homens e mulheres no mundo laboral. Hamermesh e Biddle (1994) reportaram que pessoas pertencentes ao género masculino menos cuidadosas com a aparência foram penalizadas cerca de 9% no salário, enquanto que aqueles que apresentavam aparência “acima da média” (looks) recebiam um prémio salarial de 5%. Entre o género feminino, aferiu-se um prémio de 4% de atratividade e 5% de penalização caso contrário. Embora, em 1994 se tenha verificado um prémio de beleza relativamente superior para o género masculino, investigadores justificam esta diferença de prémios devido à maior integração masculina no mercado de trabalho.
A autosseleção das mulheres no mercado de trabalho com base na beleza altera a distribuição da beleza feminina observada no mercado de trabalho. Borland e Leigh (2014) sugerem um efeito negativo relativamente grande (cerca de 18 pontos percentuais) da beleza abaixo da média na probabilidade de emprego das mulheres. Como as mulheres mais atraentes são mais propensas a aparecer no mercado de trabalho e vice-versa, observa-se menor variação de beleza feminina e, portanto, menor prêmio de beleza.
No entanto, devido à notória convergência de papeis e relevância no mercado laboral entre ambos os géneros, ao longo dos últimos 40 anos, é expectável que a discrepância de prémio salarial de beleza entre os géneros diminua, Gehrsitz (2014).
Harper (2000) aferiu que a probabilidade de desemprego se reduz de 2% para 0.9% para mulheres atraentes. Gehrsitz (2014) demonstrou ainda que homens e mulheres fisicamente mais atraentes são mais propícios a trabalhar em full-time.
Após esta pesquisa e leitura aprimorada o nosso Modelo elementar de análise pode ser definido como:
\[\begin{equation} ln y_i = \beta_0 + \beta_1looks_i + \beta_2looks_i^2+ \beta_3female_i + \varepsilon_i \end{equation} \]## wage lwage belavg abvavg
## Min. : 1.020 Min. :0.0198 Min. :0.000 Min. :0.000
## 1st Qu.: 3.708 1st Qu.:1.3104 1st Qu.:0.000 1st Qu.:0.000
## Median : 5.300 Median :1.6677 Median :0.000 Median :0.000
## Mean : 6.307 Mean :1.6588 Mean :0.123 Mean :0.304
## 3rd Qu.: 7.695 3rd Qu.:2.0406 3rd Qu.:0.000 3rd Qu.:1.000
## Max. :77.720 Max. :4.3531 Max. :1.000 Max. :1.000
## looks goodhlth black female
## Min. :1.000 Min. :0.0000 Min. :0.00000 Min. :0.000
## 1st Qu.:3.000 1st Qu.:1.0000 1st Qu.:0.00000 1st Qu.:0.000
## Median :3.000 Median :1.0000 Median :0.00000 Median :0.000
## Mean :3.186 Mean :0.9333 Mean :0.07381 Mean :0.346
## 3rd Qu.:4.000 3rd Qu.:1.0000 3rd Qu.:0.00000 3rd Qu.:1.000
## Max. :5.000 Max. :1.0000 Max. :1.00000 Max. :1.000
## looks_str wages_str young
## Length:1260 Length:1260 (-Inf,25]:1260
## Class :character Class :character (25, Inf]: 0
## Mode :character Mode :character
##
##
##
A base de dados “beauty”, é composta por 1260 observações. Em relação às variáveis: wage- salário por hora (hourly wage); lwage- logarítmo do salário. belavg- 1 se looks <= 2 (1 se o “look” <= 2; 0 caso contrário); abvavg-1 se looks >=4 (1 se o “look” >= 4; 0 caso contrário); looks- classificados de 1 a 5; goodhlth- 1 se good health (1 se “good health”; 0 caso contrário);black-1 if black (1 se “black”; 0 caso contrário); female-1 se female (1 se “female”; 0 caso contrário).
##
## Estatísticas de sumário
## =================================================================
## Statistic N Mean St. Dev. Min Pctl(25) Median Pctl(75) Max
## -----------------------------------------------------------------
## wage 1,260 6.31 4.66 1.02 3.71 5.30 7.70 77.72
## lwage 1,260 1.66 0.59 0.02 1.31 1.67 2.04 4.35
## looks 1,260 3.19 0.68 1 3 3 4 5
## female 1,260 0.35 0.48 0 0 0 1 1
## abvavg 1,260 0.30 0.46 0 0 0 1 1
## belavg 1,260 0.12 0.33 0 0 0 0 1
## goodhlth 1,260 0.93 0.25 0 1 1 1 1
## black 1,260 0.07 0.26 0 0 0 0 1
## -----------------------------------------------------------------
Considerando ainda que “mean”: “média”;“st dev”: desvio-padrão; “ptl”: percentil;“min”: valor mínimo da variável; “max”:valor máximo da variável.
Relativamente à variável “wage” aferimos que o seu valor máximo é aproximadamente 78 unidades monetárias por hora e o seu mínimo 1.02. A média ronda os 6.31. Para facilitar a comparação entre diferentes nações e ultrapassar a dualidade da moeda, desconhecida, iremos utilizar a variável “lwage” para estimação de modelos de regressão. Ao utilizarmos a transição de “wage” para “lwage”, é notória a redução no desvio padrão e paralelamente na variância, o que traduz menor dispersão nos dados. As variáveis supracitadas são as únicas quantitativas na amostra. verifca-se que 25% dos inquiridos recebem no máximo 3.71 unidades monetárias, 50% auferem no máximo 5.30 e 75% ganham 7.70 unidades monetárias.
Com vista a avaliar os parâmetros de beleza, as variáveis “looks”, “abvavg” e “belavg” tornam-se fulcrais para a análise a que o estudo se depreende. Assim sendo, a variável “looks” classificada de 1 a 5, apresenta uma média de 3.19, o que significa que em média os looks dos indivíduos avaliados estão próximos de 3. As restantes variáveis relevantes para a beleza, são consideradas categóricas “dummy”, ou seja, possuem valor máximo de 1 e mínimo de 0. Conclui-se então que, a varíavel “belavg” apresenta média de 0.12, o que significa que 12% dos indivíduos da amostra foram classificados com looks <= 2,já 30% dos avaliados foram cotados com looks >=4 ), variável “abvavg”.
Para averiguar se existem diferenças significativas na beleza de acordo com o género dos indivíduos, tal como é sugerido nos papers, é estudada a variável categórica dummy “female”, sendo que a sua média ronda os 0.35, o que significa que 35% dos indivíduos da amostra são do género feminino. Por fim, mas não menos importante, as variáveis “goodhlth” e “black” são também classificadas como categóricas dummy, e os valores das médias 0.93 e 0.07, respetivamente conferem que 93% dos inquiridos apresenta condições ideais de saúde e apenas 7% dos indivíduos são “black”. Denota-se que para variáveis dummy são faz sentido a interpretação dos desvios padrões.
O histograma representado na figura demonstra a distribuição de frequências, em termos de “lwage” dos 1260 indivíduos observados. A partir da sua análise, podemos claramente observar um pico no lwage de 2.3, que representa cerca de 155 dos 1260 indivíduos, ou seja, cerca de 12.3%. De seguida, o segundo pico com mais frequência, na qual verificamos “lwage” cerca de 145 indivíduos.
A interpretação do gráfico de densidade confere uma maior concentração de indivíduos com “lwage” de 1.5. O paralelismo com o histograma indica-nos precisamente que a distribuição é assimétrica, com a cauda da direita mais alongada, ou seja, positivamente enviesada.
O gráfico de densidade acima representado relaciona a variável explicativa “abvavg” com o salário (“lwage”). A variável independente, dummy, transmite-nos a informação se o “looks” é considerado elevado (=1) ou caso contrário como acima explicado.
Verifica-se então que looks considerados mais elevados possuem maior densidade que os restantes até um valor de cerca de 1.5 de “lwage”. A partir de 1.5 até 2.5, os looks inferiores ou iguais a 4 superam a concentração face aos restantes, seguido do posterior aumento de densidade dos looks mais elvados ate 3 com seguinte aumento da mesma para looks mais inferiores.
Verificamos que ambas as distribuições de densidade são ligeiramente assimétricas, sendo que a distribuição de looks mais elevados possui a cauda da direita mais alongada, o que torna a distribuição positivamente enviesada ou enviesada à direita.
.
Modelo (I) | Modelo (II) | Modelo(III) | Modelo (IV) | |
Looks | 0.051** | 0.477*** | 0.196 | 0.190 |
(0.024) | (0.146) | (0.239) | (0.240) | |
Looks sqrd | -0.068*** | -0.009 | -0.009 | |
(0.023) | (0.033) | (0.033) | ||
Female | -0.532*** | -0.589*** | ||
(0.032) | (0.148) | |||
Belavg | -0.018 | -0.018 | ||
(0.132) | (0.132) | |||
Abvavg | -0.159 | -0.158 | ||
(0.109) | (0.109) | |||
Black | -0.148** | -0.147** | ||
(0.058) | (0.058) | |||
Goodhlth | 0.048 | 0.049 | ||
(0.060) | (0.060) | |||
Looks*Female | 0.018 | |||
(0.045) | ||||
N | 1,260 | 1,260 | 1,260 | 1,260 |
R2 | 0.003 | 0.010 | 0.207 | 0.207 |
Notes: | Erros padrões em parênteses. |
Na formulação dos modelos que iremos estudar, considerámos a variável lwage (logarítmo do salário por hora) de modo a ultrupassar a discrepância possível entre unidades de medida (moeda) da variável dependente, bem como minimizar a questão da Heteroestacidade. A variável independente “looks” é considerada nos modelos e na literatura como uma parâmetro de beleza, sendo que apesar de constituir uma variável categórica (avaliada de 1 a 5), será utilizada na elaboração dos Modelos como aproximação a uma variável quantitativa.
O Modelo IV, o mais complexo e completo, O retorno esperado Looks é cerca de 18.987%. O \(R^2\) ronda os 0.21. No entanto, o Modelo I o returno é 5.1, enquanto que a qualidade de adjustmento é 0.
Modelo descrito como:
\(\hat{y_i}=1.4 + 0.19\times looks_i + -0.01\times looks^{2}_{i} + -0.59\times female_i+-0.02\times belavg_i+ -0.16\times abvavg_i+ -0.15\times black_i+ 0.05\times goodhlth_i+ 0.05\times looks_i*female_i{}\)
Os resultados apresentados no Modelo I demonstram que o retorno de um ponto adicional nos “looks” são cerca de 5.1%. Para avaliar os benefícios de investir ou aprimorar os “looks” calculámos a derivada parcial:
\[\begin{equation} \frac{\partial lwage_i}{\partial looks_i} = \beta_1 \end{equation}\]= 0.05095
Estima-se que em média 1 ponto adicional nos “looks” está associado a um acréscimo de cerca de 5.1% no salário.
O valor apresentado de \(\beta_0\) transmite-nos a informação de que o valor médio esperado do logaritmo do salário quando os looks são igual a 0, é de 1.496.
No que diz respeito ao \(R^2\) o seu valor está próximo dos 0.3%, o que transmite a informação de que 0.3% da variação do logarítmo do salário (variável dependente) é explicada pelo Modelo.
Com vista a avaliar os retornos marginais da varíavel “looks”, procedemos à elaboração do Modelo II, aproximando uma vez mais a variável categórica “looks” a quantitativa, de modo a facilitar a elaboração do polinómio.
Recorrendo à derivada parcial:
\[\begin{equation}\frac{\partial lwage_i}{\partial looks_i} = \beta_1 + \beta_2 2looks_i\end{equation}\]
= 0.47721 - 2*0.06812 \(looks_i\) = 0.47721-0.13624 \(looks_i\)
0.47721-0.13624 \(looks_i\) =0 <=> \(looks_i\)= 3.49
Caso \(looks_i\)=0, significa que \(\beta_1\)= 0.47721
É estimado, que em média, um ponto adicional na classificação de looks traduz um aumento de salário por volta de 47.7%. A realização da 2ª derivada parcial permite-nos concluir que a sua concavidade é voltadas para baixo o que refelte que aumentos na classificação de ‘looks’ têm um impacto positivo no salário até classificação aproximada de 4, sendo depois este efeito será negativo.
A elaboração do Modelo III baseia-se no acréscimo de cinco variáveis no estudo, “female”, “belavg” , “abvavg”, “black”, “goodhlth”.
Assim sendo, tendo em conta que todas as variáveis supracitadas são dummy, ou seja, os seus valores variam entre 0 e 1. Para interpretar os valores do Modelo, baseamo-nos no “Linear Probability Model”
\[E(y_i|female_i=1)-E(y_i|female_i = 0)=\beta_3\] = -0.532
Demonstra-se que a média de discrepância no salário por horas entre o género feminino e o masculino é cerca de 53.2% a favor dos não female (género masculino), mantendo todo o resto constante.
Considerámos ainda preponderante a verificação se classificações elevadas, “abvavg”, e mais reduzidas “belavg” interferem com a remuneração salarial de acordo com o género.
\[E(y_i|abvavg_i=1, female_i=1)-E(y_i|abvavg=0,female_i = 1) =\beta_5\] = -0.159 , o que realça que dentro do género feminino, e a discrepância salarial entre as classificações de “looks” maiores ou iguais a 4 ou caso contrário é de cerca de 16%,ceteris paribus, o que enfatiza o facto de estas receberem um prémio salarial por classificações mais elevadas.
\[E(y_i|belavg_i=1, female_i=1)-E(y_i|belavg=0,female_i = 0) =\beta_3 +\beta_4 \] = 0.00671-0.167= -0.16
Por fim, o desfasamento no salário de mulheres com classificações menores ou iguais a 2 (reduzidas) e homens com classifações maiores ou iguais a 3 representa 16%, favorecendo o género masculino.
\[E(y_i|black_i=1, female_i=1)-E(y_i|black_i=0,female_i = 1) =\beta_6 \] = -0.1482
Denota-se que a discrepância salarial entre mulheres “black” e “não black” ronda os 15%, com vantagem para as “não black”.
\[E(y_i|goodhlth_i=1, female_i=1) -E(y_i|goodhlth_i=0,female_i = 0)=\beta_3 + \beta_7\] =-0.532+0.0481= -0.4839
A diferenciação salarial entre homens e mulheres com boas condições de saúde ou não é cerca de 48% a favor dos homens com menores condições de saúde.
Denota-se ainda que o valor de \(\beta_1\) diminui com a realização deste Modelo, o que pode ser justificado pela introdução da variável ‘female’ ser explicativa do mesmo. O \(R^2\) aumentou para cerca de 20%, sendo que essa percentagem de variação do salário é explicada pelo modelo.
Com o objetivo de averiguar se a interação e efeito de “looks” é distinto entre os dois géneros computacionamos o Modelo IV.
Recorrendo à derivada parcial: \[\begin{equation} \frac{\partial lwage_i}{\partial looks_i} = \beta_1 + \beta_2looks_i + \beta_8*female_i\end{equation}\]
Caso se trate de uma mulher, com classificação de 3 nos “looks”, então: =0.189+(-0.00914*3)+ (-0.589)= -0.427
Caso se trate de uma homem, com classificação de 3 nos “looks”, então: = 0.189+(-0.00914*3)= 0.161
Diferenciação entre géneros é cerca de 58.8 pontos percentuais, favorecendo os homens.
Ao longo dos modelos é notória a diminuição do \(\beta_1\), o que enfatiza que o acréscimo das restantes variáveis contribuem para a explicação do modelo. Em termos de qualidade,baseada na avaliação do \(R^2\) é cacterizada por um aumento gradual, que confere maior percentagem explicativa da variável dependentes (lwage) pelas restantes variáveis explicatórias. No que diz respeito à dispersão dos dados, ou seja, erro padrão, estes tendem a aumentar ligeiramente ou permanecer iguais no decorrer dos modelos.
Com a finalidade de avaliar se os resultados são estatisticamente diferentes de zero, procedemos à Inferência Estatística e realizámos Testes de Hipótese,assumindo um valor de significância de 5%.
No Modelo I, com o objetivo de aferir se a variável “looks” é determinante na determinação dos salários, tem se que:
\[H_0: \beta_1 = 0\]
\[H_1: \beta_1 \neq 0\] \(\begin{equation} tobs= \frac {\hat{\beta_1}-\beta_1}{\hat{se\beta_1}} \end {equation}\)
\(\begin{equation} tobs= \frac {{0.051}-0}{0.024} \end {equation}\)
\(tcritic = t(n-(k+1))\)
\(tcritic = t(1260-(1+1))\)
Assumindo o valor do t-student crítico de +/-1.96, de acordo com os valores apresentados na Regressão Linear, o t-student observado, cerca de 2.1.
Como t-obs > t-crit, devemos rejeitar a Hipótese Nula e conferir significância aos \("looks"\) no impacto dos salários, considerando α=5%
De modo a avaliar se os retornos dos \("looks_i"\) e \("looks_i^2"\) são iguais, procedemos à realização de outro teste t, aplicado ao Modelo II.
vcov(ols2)
## (Intercept) looks looks_sq
## (Intercept) 0.05240877 -0.032856003 0.0049483704
## looks -0.03285600 0.021389167 -0.0033231838
## looks_sq 0.00494837 -0.003323184 0.0005310445
\[H_0: \beta_1 = \beta_2 <=> \beta_1 - \beta_2 = 0 \]
\[H_1: H_0 \quad é \quad falso \]
\(\begin{equation} tobs= \frac {\hat{\beta_1}- \hat\beta_2}{\sqrt{var(\hat\beta_1-\hat\beta_2)}} \end {equation}\)
\(\begin{equation} tobs= \frac {\hat{\beta_1}- \hat\beta_2}{\sqrt{var(\hat\beta_1)+var(\hat\beta_2)-2cov(\beta_1, beta_2)}} \end {equation}\)
\(\begin{equation} tobs= \frac {0.477- (-0.068)}{\sqrt{0.0213+0.000531-2(-0.00332)}} \end {equation}\)
\(tcritic= n-(k+1)\)
\(tcritic= 1260-(2+1)\)
De acordo com o cálculo do t-observado com o aúxilio da matriz variância, obtivemos o valor de 19.14, já o valor do *t-crítico da tabela foi de +/-1.96**. Como o valor observado supera o valor crítico, situamo-nos na zona de rejeição da hipótese nula, logo verificámos que os retornos dos \("looks"\) e dos \("looks^2"\) são diferentes.
Por conseguinte, para mensurar se a classificação acima da média ou abaixo possui impactos no modelo, recorremos ao teste de significância conjunta ou melhoria de qualidade.
O modelo considerado sem restrições, ou seja, onde as variáveis se encontram presentes é o Modelo III. Já o restrito marcado pela ausência das mesmas é o Modelo II.
\[H_0: \beta_4=\beta_5 = 0\] \[H_1: H_0 \quad é \quad falso\]
\(\begin{equation} Fobs= \frac {R_U^2-R_R^2} {m} * \frac {n-(k+1)} {1-R^2_U} \end {equation}\)
\(\begin{equation} Fobs= \frac {0.207-0.010} {7} * \frac {1260- (7 + 1)} {1-0.207} \end {equation}\)
\(Fcritic= (m,n-(k+1))\)
\(Fcritic= (2,1260-(7+1))\)
Desta vez, recorremos ao cálculo do teste de F, cujos valores de x têm de ser sempre maiores que zero.
O F-observado obtido foi de 155.51 e o F-crítico interpretado na tabela foi de 3.00. Verifica-se que o F-observado supera o F-crítico, situando-nos na zona de rejeição da Hipótese Nula, ou seja, a introdução das variáveis \("abvavg"\) e \("belavg"\) são revelantes na constituição do modelo.
Com o objetivo de averiguar se Modelo IV é estatísticamente relevante no estudo, realiza-se um teste de significância Global.
\[H_0: \beta_1 = \beta_2 =\beta_3= \beta_4= \beta_5= \beta_6= \beta_7= \beta_8= 0\]
\[H_1: H_0 \quad é \quad falso \]
\(\begin{equation} Fobs= \frac {R_U^2} {m} * \frac {n-(k+1)} {1-R^2_U} \end {equation}\)
\(\begin{equation} Fobs= \frac {0.207} {7} * \frac {1260-(8+1)} {1-0.207} \end {equation}\)
\(Fcritic= (m,n-(k+1))\)
\(Fcritic= (8,1260-(8+1))\)
Recorrendo ao teste F, o valor obtido foi cerca de 40.81. Como o valor crítico é de 1.94, o valor observado é superior ao valor crítico, pelo que se rejeita a Hipótese Nula e do ponto de vista estatístico, o modelo é globalmente significativo para interpretar oscilações no salário.
A qualidade dos modelos econométricos pode ser avaliada de inúmeras formas, como por exemplo, através da aplicação dos testes AIC e BIC, sendo que se ocorrer dimuição dos seus valores obtidos ao longo dos modelos,estes aumentam a qualidade.
AIC(ols1)
## [1] 2265.921
BIC(ols1)
## [1] 2281.338
AIC(ols2)
## [1] 2259.193
BIC(ols2)
## [1] 2279.749
AIC(ols3)
## [1] 1990.256
BIC(ols3)
## [1] 2036.506
AIC(ols4)
## [1] 1992.099
BIC(ols4)
## [1] 2043.488
Denota-se de uma perspetiva geral, que os valores dos testes AIC e BIC têm diminuido, com a exceção da transição do Modelo III para o Modelo IV. A notória inicial redução confere que o aumento de variávies, nomeadamente no modelo III, beneficiam a qualidade do modelo. Já a introdução da interação da variável “female” e “looks” no modelo final parece reduzir ligeiramente a qualidade do mesmo.
Em modelos econométrico podem surgir problemas de multicolinearidade, que ocorre quando o coeficiente de correlação simples entre duas variáveis explicativas em termos absolutos é elevado, isto é, quando as variáveis estão fortemente correlacionadas. De forma a testar esses efeitos de multicolinearidade introduzimos o conceito de Variance Inflation Factor (VIF), definindo o valor crítico em 10, dado que quanto mais elevado for o maior efeitos de colinearidade.
car::vif(ols4)
## looks looks_sq female belavg abvavg black
## 120.540531 92.182971 22.039517 8.377045 11.144858 1.020520
## goodhlth looks:female
## 1.009133 22.713302
Os valores obtidos para o Modelo IV, sugurem que poderá existir um problema nas variáveis, visto que o valor é superior a 10. No entanto, como os valores obtidos não são exatamente iguais entre as variáveis, conclui-se que não existe coliniaridade perfeita entre as mesmas e o modelo consegue ser estimado.
O teste de Chow baseia-se num simples teste de F com exclusões restritivas,neste caso utilizado para variáveis dummy, válido apenas na existência de homoestacidade. A implementação do teste de Chow baseia-se na relevância de determinar se o género é relevante na estruturação e determinação do salário.
Modelo (1) | Modelo (2) | Modelo (2 -Female) | Modelo (2 - Non-Female) | |
Looks | 0.05095++ | 0.47721+++ | 0.45361++ | 0.32892+ |
(0.02443) | (0.14625) | (0.20934) | (0.16913) | |
Looks Sqr. | -0.06812+++ | -0.06079+ | -0.04493+ | |
(0.02304) | (0.03300) | (0.02665) | ||
N | 1,260 | 1,260 | 436 | 824 |
R2 | 0.00345 | 0.01032 | 0.01779 | 0.00691 |
Notes: | Erros padrões robustos em parênteses. Níveis de significância: +, 10%; ++, 5%; +++, 1%. |
beauty_ols_female$residuals <- residuals(ols2_female)
beauty_ols_female <- beauty_ols_female %>%
mutate (residuals_sq1 = residuals^2)
sum(beauty_ols_female$residuals_sq1)
## [1] 117.4851
beauty_ols_non_female$residuals <- residuals(ols2_non_female)
beauty_ols_non_female <- beauty_ols_non_female %>%
mutate (residuals_sq2= residuals^2)
sum(beauty_ols_non_female$residuals_sq2)
## [1] 238.5008
beauty_ols_all$residuals <- residuals(ols2_all)
beauty_ols_all<- beauty_ols_all %>%
mutate (residuals_sq2= residuals^2)
sum(beauty_ols_all$residuals_sq2)
## [1] 440.3859
A partir da observação dos dados, conseguimos averiguar, tal como anteriormente verificado que o género predominante nos indíviduos da amostra é o género masculino (non female), com 824 observações.
Verifica-se ainda que para as variáveis em estudo, ocorrem diferenças substânciais de acordo com a alteração de género, nomeadamente nos erros-padrões e no \(\beta_1\) e \(\beta_2\).
A variável explicatória “\(looks\)”, tal como previsto na pela literatura, assumiu valor de significância estatística de 10% nos “non female” e de 5% nos indivíduos “female”. Já a variável explicatória “\(looks^2\)” na diferenciação de génerps, assumiu u valor de significância de 10% em ambos.
Em particular o Teste de Chow prevê que em Hipótese nula os erros-padrões de ambos os grupos em estudo serem iguais.
Para o cálculo do teste de Chow, como obtido acima, SSRT= 440.39, SSRF=117.49, SSRNF=238.50.
\(\begin{equation} Fobs= \frac {SSR_T-(SSR_F+SSR_NF)} {𝑘+1} * \frac {𝑛 − 2(𝑘 + 1)} {SSR_F+SSR_NF} \end {equation}\)
\(\begin{equation} Fobs= \frac {440.39-(117.49+238.50)} {2+1} * \frac {1260− 2(2 + 1)} {117.49+ 238.50} \end {equation}\)
\(Fcritic(k+1;n-2(k+1))\)
\(Fcritic(2+1;1260-2(2+1))\)
Após a realização do teste F relativo ao teste de Chow, obtemos um valor de F-observado de 99.1 e o F-crítico de 2.60.
Como o F observado é superior ao F crítico dado pelas tabelas, situamo-nos na zona de rejeição, ou seja, rejeitamos a hipótese nula e confirmação que existe a necessidade de interção das variáveis female e looks posteriormente integrados no modelo IV.
\[ \operatorname{lwage} = \alpha + \beta_{1}(\operatorname{looks}) + \beta_{2}(\operatorname{looks\_sq}) + \beta_{3}(\operatorname{female}) + \beta_{4}(\operatorname{belavg}) + \beta_{5}(\operatorname{abvavg}) + \beta_{6}(\operatorname{black}) + \beta_{7}(\operatorname{goodhlth}) + \beta_{8}(\operatorname{looks} \times \operatorname{female}) + \epsilon \] \[ \operatorname{\widehat{lwage}} = 1.35 + 0.19(\operatorname{looks}) - 0.01(\operatorname{looks\_sq}) - 0.59(\operatorname{female}) - 0.02(\operatorname{belavg}) - 0.16(\operatorname{abvavg}) - 0.15(\operatorname{black}) + 0.05(\operatorname{goodhlth}) + 0.02(\operatorname{looks} \times \operatorname{female}) \]
No que diz respeito à análise da heteroscedasticidade, na eventualidade de o modelo não ser homoscedástico, ou seja, quando a variância do termo de erro não se mantém constante, poderá invalidar testes estatísticos que pressupõem que os erros não se correlacionam. Var u | x1, x2,…, x ( k ) ≠ σ2
Caso se confirme heteroscedasticidade nos modelos, a inferência estatística fica afetada, uma vez que os devios/erros padrões se tornam enviesados, apesar do valor dos betas não se alterar. Para estudar a heteroscedasticidade podem ser utilizados dois testes distintos, o teste de Breusch-Pagan e o teste de White, ambos aplicados ao Modelo IV.
## [1] 6.340069
A partir da análise do gráfico, verificámos que existem algumas indicações de que haverá heteroscedasticidade, uma vez que não se verifica um padrão próprio dos resíduos quando o termo de erro é homoscedástico, isto é, quando as variâncias dos erros são constantes. No entanto, a observação do gráfico isolada de testes, não fornece evidências suficientes para comprovar a presença de heteroscedasticidade, sendo necessário a realização de testes estatísticos.
Começando pelo teste de Breusch- Pagan temos que este considera que a variância é uma função linear de um dado número de variáveis.
\(u_i^2 = \delta_0 + \delta_1looks_i+ \delta_2looks^2_i+ \delta_3female_i+ \delta_4belavg_i+ \delta_5abvavg_i+ \delta_6black_i+ \delta_7 goodhlth_i+ \delta_8 looks_i*female_i\)
\[H_0: \delta_1= \delta_2=...= \delta_8= 0\] \[H_1: H_0 \quad é \quad falso \]
##
## studentized Breusch-Pagan test
##
## data: ols4
## BP = 6.3401, df = 8, p-value = 0.6092
Partindo da Hipótese Nula, que evidencia a presença de homoscedasticidade,consta-se que acima do p-value de 0.6092 obtido pelo Teste, que não se rejeita a Hipótese Nula, assumindo um valor de significância de 5%.Conclui-se então que o modelo IV é homoscedástico.
O Teste de White permite não-linearidade ao utilizar os quadrados e os produtos cruzados de todas as variáveis explicativas.
## # A tibble: 1 x 5
## statistic p.value parameter method alternative
## <dbl> <dbl> <dbl> <chr> <chr>
## 1 6.94 0.974 16 White's Test greater
## # A tibble: 1 x 5
## statistic p.value parameter method alternative
## <dbl> <dbl> <dbl> <chr> <chr>
## 1 6.34 0.609 8 Koenker (studentised) greater
No Teste de White, partimos do mesmo pressuposto, ou seja, partindo da Hipótese Nula onde não existe heteroscedasticidade. A partir dos valores obtidos, p-value de 0.974, não rejeitamos a hipótese nula e obtemos a mesma conclusão supracitada, ou seja, que o modelo não é heteroscedástico.
Para reduzir os possíveis efeitos da existência de heteroscedasticidade utilizamos a Estimação Robusta, onde para os parâmetros da amostra, devemos recorrer a estimadores de OLS. Para além disso para os erros padrões. afetados caso se confirme heteroscedasticidade, podem ser aprimorados com o recurso à variância-covariância robusta, estimadores que recorrem à correção do Teste de White.
Estas alterações da Estimação Robusta são bastante importantes, uma vez que os estimadores de variância-covariância robusta são consistente e como tal providenciam testes de hipótese não enviesados (cêntricos) e portanto válidos e corretos para Inferência Estatística de heteroscedasticidade Apesar de nos testes de Breuch- Pagan e Teste de White ter sido comprovada a existência de homoscedasticidade, os modelos de OLS e Linear Probability por construção possuem sempre heteroscedasticidade, realçando a necessidade de recorrer à estimação robusta.
Modelo (4) | Modelo (4 - Robusto) | |
Looks | 0.18987 | 0.18987 |
(0.23996) | (0.23130) | |
Looks. Sqr. | -0.00914 | -0.00914 |
(0.03306) | (0.03361) | |
Female | -0.58939+++ | -0.58939+++ |
(0.14766) | (0.14684) | |
Belavg | -0.01815 | -0.01815 |
(0.13185) | (0.12878) | |
Abvag | -0.15807 | -0.15807 |
(0.10860) | (0.11502) | |
Black | -0.14720++ | -0.14720++ |
(0.05781) | (0.06563) | |
Goodhlth | 0.04859 | 0.04859 |
(0.06026) | (0.06785) | |
Looks x Female | 0.01782 | 0.01782 |
(0.04512) | (0.04525) | |
N | 1,260 | |
R2 | 0.20696 | |
Notes: | Erros padrões robustos em parênteses. Níveis de significância: +, 10%; ++, 5%; +++, 1%. |
Por conseguinte, verifica-se a alteração dos erros-padrões nas variáveis do Modelo, quando corrigidas. Como seria expectável os erros elevam-se, com maior enfânse na variável \(Looks^2\).
Denota-se que as variáveis “female” e “black” mantiveram o seu valor de signicância na transição para o modelo robusto, de 1% e 5%, respetivamente.
A estimação a partir do OLS, possui algumas lacunas e falhas características da estimação, como por exemplo, a falta de especificação, utilização de variáveis proxy, erros de mensuração, falta de dados, outliers.
Na amostra em estudo, foi detetadas a presença de valores extremos ou atípicos (outliers) na variável “wage”, detetada pelo máximo bastante díspar dos valores da amostra.No entanto, como na formulação dos modelos a variável referida é susbtituída pela variável “lwages”, a desfuncionalidade fica resolvida.
A utilização do teste Reset justifica-se no seguimento de validar ou rejeitar a hipótese do modelo não estar corretamente especificado.
##
## RESET test
##
## data: lwage ~ looks + looks_sq + female + belavg + abvavg + black + goodhlth + female * looks
## RESET = 6.2632, df1 = 1, df2 = 1250, p-value = 0.01245
Através dos resultados obtidos, constata-se que o p-value de 1.2%, assumindo um nível de significância de 5%, rejeitamos a hipótese nula e constata-se que o modelo se encontra incorretamente especificado.
Em suma, a realização do presente trabalho cumpriu os objetivos primordiais a que se propunha, nomeadamente em determinar se a beleza influencia o sucesso, mais precisamente o salário, aliada com outras variáveis, como, género, raça e condições de saúde. Deste modo, elaborámos quatro modelos econométricos iniciando por um mais básico e, sucessivamente, progredindo o seu grau de complexidade ao introduzir novas variáveis e complementando com um poliónimo de segundo grau e uma interação entre variáveis.
Ao realizarmos testes de significância individual, concluímos que a variável “looks” era estatisticamente preponderante no salário, já o teste de significância conjunta enfatizou que a introdução das variáveis de classificação de looks acima ou abaixo da média são também relevantes e o teste de significância global conferiu que o modelo mais completo é também importante na determinação da variável estatística. Realizámos ainda um teste de diferença de parâmetros que nos indicou que existem diferenças entre os retornos dos \("looks"\) e \("looks^2"\).
Além disso, a implementação do teste de Chow enalteceu a relevância da interação entre o género e a classificação dos looks, vantagem conferida para o género masculino, em sintonia com o que foi anteriormente referido pelos autores na revisão de literatura.
Com a finalidade de validar a inferência estatística, válida apenas com a simbiose perfeita de ausência de heteroscedasticidade e ausência de colinearidade entre as variáveis, procedemos à realização de testes estatísticos. A presença de homoscedasticidade foi confirmada no modelo IV, já a colinearidade entre as variáveis também se verificou embora não seja perfeita e por isso não compromete os resultados da inferência estatística.
Devido às lacunas apresentadas pelos modelos OLS, calculámos o teste Reset que nos indicou que o modelo possuía problemas de especificação. No entanto, como os modelos OLS possuem heteroscedasticidade na sua construção, procedemos à estimação robusta, para tornar os estimadores não enviesados, bem como os seus desvios padrões, não comprometendo a inferência estatística.
Por fim, mas não menos importante, retirámos a elação de que beleza tem impacto positivo no salário, sendo que se destaca fatores como o género e raça, aspetos determinantes no quotidiano do mercado de trabalho.
Adams, G. R. (1977). Physical attractiveness research. Human development, 20(4), 217-239.
Barro, R. (1998). So you want to hire the beautiful. Well, why not. Business Week, 3(16), 1998.
Biddle, J. E., & Hamermesh, D. S (1994). Beauty and the labor market (No. w4518). Natl. Bur. Econ. Res, 84, 1174-1194.
Biddle, J. E., & Hamermesh, D. S. (1998). Beauty, productivity, and discrimination: Lawyers’ looks and lucre. Journal of labor Economics, 16(1), 172-201.
Borland, J., & Leigh, A. (2014). Unpacking the beauty premium: What channels does it operate through, and has it changed over time?. Economic Record, 90(288), 17-32.
Caliendo, M., & Gehrsitz, M. (2016). Obesity and the labor market: A fresh look at the weight penalty. Economics & Human Biology, 23, 209-225.
Feingold, A. (1992). Good-looking people are not what we think. Psychological bulletin, 111(2), 304.
Gehrsitz, M. (2014). Looks and labor: Do attractive people work more?. Labour, 28(3), 269-287.
Hamermesh, D. S. (2011). The Economics of Beauty. In Beauty Pays (pp. 3-10). Princeton University Press.
Harper, B. (2000). Beauty, stature and the labour market: A British cohort study. Oxford Bulletin of Economics and Statistics, 62, 771-800.
Hatfield, E., & Rapson, R. L. (2000). Physical attractiveness. The Corsini encyclopedia of psychology and behavioral science, 3, 1203-05.
Hatfield, E., & Sprecher, S. (1986). Mirror, mirror: The importance of looks in everyday life. Suny Press.
Liu, X., & Sierminska, E. (2014). Evaluating the Effect of Beauty on Labor Market Outcomes: A Review of the Literature. Luxembourg Institute of Socio-Economic Research (LISER) Working Paper Series, 11.
Loureiro, P., Mendonca, M.C & Sachsida., A. (2012). Links between physical appearance and wage discrimination: Further evidence. International Review of Social Sciences and Humanities, 1(2):1–16, 2012.
Malos, S. (2007). Appearance-based sex discrimination and stereotyping in the workplace: Whose conduct should we regulate?. Employee Responsibilities and Rights Journal, 19(2), 95-111.
Morrow, P. C., McElroy, J. C., Stamper, B. G., & Wilson, M. A. (1990). The effects of physical attractiveness and other demographic characteristics on promotion decisions. Journal of Management, 16(4), 723-736.
Sierminska, E. (2014). Evaluating the Effect of Beauty on Labor Market Outcomes: A Review of the Literature.
Wooldridge, J.M., 2019. Introductory econometrics: A modern approach, 7th ed. Cengage Learning.
Zebrowitz, L. A., Hall, J. A., Murphy, N. A., & Rhodes, G. (2002). Looking smart and looking good: Facial cues to intelligence and their origins. Personality and social psychology bulletin, 28(2), 238-249.