Safiya Stewart

Sociology 712

Professor Songe

2/22/19

This assignment highlights the use of the Maximum Likelihood Estimation (MLE) and the Generalized Linear Model (GLM.) The Zelig package was used with the turnout data set. The question that we hope to explore using the MLE & Generalized Linear Model is: Does Education influence Income Inequality?

The variables used were:

Education (x= independent variable)
Income inequality (y= dependent variable)

We essentially want to see if there is any relationship between education and income inequality e.g is there a positive/negative relationship between the two and we hope to find this by utilizing the MLE method & GLM.

mle_ols <- maxLik(logLik = ols.lf, start = c(sigma = 1, beta1 = 1, beta2 = 1))
summary(mle_ols)

--------------------------------------------
Maximum Likelihood estimation
Newton-Raphson maximisation, 12 iterations
Return code 2: successive function values within tolerance limit
Log-Likelihood: -4691.256 
3  free parameters
Estimates:
      Estimate Std. error t value Pr(> t)    
sigma  2.52613    0.03989  63.326 < 2e-16 ***
beta1 -0.65207    0.20827  -3.131 0.00174 ** 
beta2  0.37613    0.01663  22.612 < 2e-16 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
--------------------------------------------

INTERPRETATION #1 (Slide 4.15)

For this first analysis, there are 3 paramaters used: sigma, beta1 and beta2.

Sigma (2.52613) represents the standard deviation
beta1 (-0.65207) is the y-intercept
beta2 (0.37613) is the slope

The data above shows that for every 1 unit increase in education, there is a 0.37613 increase in mean income inequality, which ultimately means that there is a positive correlation between education and income inequality and it is statistically significant as the p-value is <0.05.

ols.lf2 <- function(param) {
  mu <- param[1]
  theta <- param[-1]
  y <- as.vector(turnout$income)
  x <- cbind(1, turnout$educate)
  sigma <- x%*%theta
  sum(dnorm(y, mu, sigma, log = TRUE))
}   
library(maxLik)
mle_ols2 <- maxLik(logLik = ols.lf2, start = c(mu = 1, theta1 = 1, theta2 = 1))
summary(mle_ols2)

--------------------------------------------
Maximum Likelihood estimation
Newton-Raphson maximisation, 9 iterations
Return code 2: successive function values within tolerance limit
Log-Likelihood: -4861.964 
3  free parameters
Estimates:
       Estimate Std. error t value Pr(> t)    
mu     3.516764   0.070320   50.01  <2e-16 ***
theta1 1.461011   0.106745   13.69  <2e-16 ***
theta2 0.109081   0.009185   11.88  <2e-16 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
--------------------------------------------

INTERPRETATION # 2 (Slide 4.19)

For this first analysis, there are 3 paramaters used: Mu, theta1 and theta2.

Mu (3.516764) represents the mean
theta1 (1.461011) is the y-intercept
theta2 (0.109081) is the slope

The above data shows for every 1 unit increase in education, there is a 0.109081 unit increase in the standard deviation of income inequality. The variables are positively correlated and the results are statistically significant as the p value is <0.05.

mle_ols3 <- maxLik(logLik = ols.lf3, start = c(sigma = 1, beta1 = 1, beta2 = 1, beta3 = 1))
summary(mle_ols3)

--------------------------------------------
Maximum Likelihood estimation
Newton-Raphson maximisation, 16 iterations
Return code 2: successive function values within tolerance limit
Log-Likelihood: -4690.815 
4  free parameters
Estimates:
       Estimate Std. error t value Pr(> t)    
sigma  2.525576   0.039919  63.268  <2e-16 ***
beta1 -0.446047   0.300583  -1.484   0.138    
beta2  0.371011   0.017493  21.209  <2e-16 ***
beta3 -0.003184   0.003373  -0.944   0.345    
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
--------------------------------------------

In the above analysis, a second INDEPENDENT variable, age, was added to the analysis to see if income inequality would vary at all and if so, what is the direction of the relationship.

The new question being asked is: Does Age influence Income Inequality?

The variables used were:

Age (x= independent variable)
Income inequality (y= dependent variable)

INTERPRETATION # 3

For this first analysis, there are 4 paramaters used: Sigma, Beta1 and Beta2 & Beta 3.

Sigma (2.525576) represents the standar deviation
Beta1 (-0.446047) is the y-intercept
Beta2 (0.371011) is the slope for education
Beta3 (-0.003184) is the slope for age

After analyzing the data it was found that, for every 1 unit increase in age, income inequality decreased by -0.003184 which means that the two variables are negatively correlated and there is NO statistical significance between the variable as the p value is >0.05.

ols.lf4 <- function(param) {
  mu <- param[1]
  theta <- param[-1]
  y <- as.vector(turnout$income)
  x <- cbind(1, turnout$educate, turnout$age)
  sigma <- x%*%theta
  sum(dnorm(y, mu, sigma, log = TRUE))
}   
library(maxLik)
mle_ols4 <- maxLik(logLik = ols.lf4, start = c(mu = 1, theta1 = 1, theta2 = 1, theta3 = 1), method = "BFGS")
summary(mle_ols4)

--------------------------------------------
Maximum Likelihood estimation
BFGS maximization, 150 iterations
Return code 0: successful convergence 
Log-Likelihood: -4843.15 
4  free parameters
Estimates:
       Estimate Std. error t value  Pr(> t)    
mu     3.555011   0.069193  51.378  < 2e-16 ***
theta1 0.362114   0.204550   1.770   0.0767 .  
theta2 0.133349   0.010756  12.398  < 2e-16 ***
theta3 0.017507   0.002852   6.139 8.32e-10 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
--------------------------------------------

INTERPRETATION # 4

For this first analysis, there are 4 paramaters used: Mu, theta1 and theta2 & theta 3.

Mu (3.555011) represents the mean
Theta1 (0.362114) is the y-intercept
Theta2 (0.133349) is the slope for education
Theta3 (0.017507) is the slope for age

The above interpretation shows that for every 1 unit increase in age, there is a 0.017507 unit increase in the standard deviation of income inequality. This shows a positive correlation between the two variables. In terms of it being statistically significant, the data shows that it is indeed significant with a p value of <0.05.

LS0tCnRpdGxlOiAiSG9tZXdvcmsgIyAzOiBNTEUgJiBHTE0iCm91dHB1dDogaHRtbF9ub3RlYm9vawotLS0KCiMgU2FmaXlhIFN0ZXdhcnQKCgojIyBTb2Npb2xvZ3kgNzEyCgoKIyMjIFByb2Zlc3NvciBTb25nZQoKCiMjIyMgMi8yMi8xOQoKClRoaXMgYXNzaWdubWVudCBoaWdobGlnaHRzIHRoZSB1c2Ugb2YgdGhlIE1heGltdW0gTGlrZWxpaG9vZCBFc3RpbWF0aW9uIChNTEUpIGFuZCB0aGUgR2VuZXJhbGl6ZWQgTGluZWFyIE1vZGVsIChHTE0uKSAgVGhlICoqWmVsaWcqKiBwYWNrYWdlIHdhcyB1c2VkIHdpdGggdGhlICp0dXJub3V0KiBkYXRhIHNldC4gVGhlIHF1ZXN0aW9uIHRoYXQgd2UgaG9wZSB0byBleHBsb3JlIHVzaW5nIHRoZSBNTEUgJiBHZW5lcmFsaXplZCBMaW5lYXIgTW9kZWwgaXM6ICoqRG9lcyBFZHVjYXRpb24gaW5mbHVlbmNlIEluY29tZSBJbmVxdWFsaXR5PyoqCgpUaGUgdmFyaWFibGVzIHVzZWQgd2VyZToKCiAgKyBFZHVjYXRpb24gKHg9IGluZGVwZW5kZW50IHZhcmlhYmxlKQogICsgSW5jb21lIGluZXF1YWxpdHkgKHk9IGRlcGVuZGVudCB2YXJpYWJsZSkKCgpXZSBlc3NlbnRpYWxseSB3YW50IHRvIHNlZSBpZiB0aGVyZSBpcyBhbnkgcmVsYXRpb25zaGlwIGJldHdlZW4gZWR1Y2F0aW9uIGFuZCBpbmNvbWUgaW5lcXVhbGl0eSBlLmcgaXMgdGhlcmUgYSBwb3NpdGl2ZS9uZWdhdGl2ZSByZWxhdGlvbnNoaXAgYmV0d2VlbiB0aGUgdHdvIGFuZCB3ZSBob3BlIHRvIGZpbmQgdGhpcyBieSB1dGlsaXppbmcgdGhlIE1MRSBtZXRob2QgJiBHTE0uCgoKYGBge3Igd2FybmluZz1GQUxTRX0KCiNpbnN0YWxsLnBhY2thZ2VzKCJaZWxpZyIpCiNpbnN0YWxsLnBhY2thZ2VzKCJtYXhMaWsiKQoKbGlicmFyeShaZWxpZykKCmRhdGEodHVybm91dCkKaGVhZCh0dXJub3V0KQoKb2xzLmxmIDwtIGZ1bmN0aW9uKHBhcmFtKSB7CiAgYmV0YSA8LSBwYXJhbVstMV0KICBzaWdtYSA8LSBwYXJhbVsxXQogIHkgPC0gYXMudmVjdG9yKHR1cm5vdXQkaW5jb21lKQogIHggPC0gY2JpbmQoMSx0dXJub3V0JGVkdWNhdGUpCiAgbXUgPC0geCUqJWJldGEKICBzdW0oZG5vcm0oeSwgbXUsIHNpZ21hLCBsb2cgPSBUUlVFKSl9CgoKbGlicmFyeShtYXhMaWspCgptbGVfb2xzIDwtIG1heExpayhsb2dMaWsgPSBvbHMubGYsIHN0YXJ0ID0gYyhzaWdtYSA9IDEsIGJldGExID0gMSwgYmV0YTIgPSAxKSkKc3VtbWFyeShtbGVfb2xzKQoKc3VtbWFyeShsbShpbmNvbWUgfiBlZHVjYXRlLCBkYXRhID0gdHVybm91dCkpCgpgYGAKKipJTlRFUlBSRVRBVElPTiAjMSAoU2xpZGUgNC4xNSkqKgoKCkZvciB0aGlzIGZpcnN0IGFuYWx5c2lzLCB0aGVyZSBhcmUgMyBwYXJhbWF0ZXJzIHVzZWQ6IHNpZ21hLCBiZXRhMSBhbmQgYmV0YTIuIAoKICArIFNpZ21hICgyLjUyNjEzKSByZXByZXNlbnRzIHRoZSBzdGFuZGFyZCBkZXZpYXRpb24KICArIGJldGExICgtMC42NTIwNykgaXMgdGhlIHktaW50ZXJjZXB0CiAgKyBiZXRhMiAoMC4zNzYxMykgaXMgdGhlIHNsb3BlIAogIAoKVGhlIGRhdGEgYWJvdmUgc2hvd3MgdGhhdCBmb3IgZXZlcnkgMSB1bml0IGluY3JlYXNlIGluIGVkdWNhdGlvbiwgdGhlcmUgaXMgYSAwLjM3NjEzIGluY3JlYXNlIGluIG1lYW4gaW5jb21lIGluZXF1YWxpdHksIHdoaWNoIHVsdGltYXRlbHkgbWVhbnMgdGhhdCB0aGVyZSBpcyBhIHBvc2l0aXZlIGNvcnJlbGF0aW9uIGJldHdlZW4gZWR1Y2F0aW9uIGFuZCBpbmNvbWUgaW5lcXVhbGl0eSBhbmQgaXQgaXMgc3RhdGlzdGljYWxseSBzaWduaWZpY2FudCBhcyB0aGUgcC12YWx1ZSBpcyA8MC4wNS4KCgpgYGB7ciB3YXJuaW5nPUZBTFNFfQoKb2xzLmxmMiA8LSBmdW5jdGlvbihwYXJhbSkgewogIG11IDwtIHBhcmFtWzFdCiAgdGhldGEgPC0gcGFyYW1bLTFdCiAgeSA8LSBhcy52ZWN0b3IodHVybm91dCRpbmNvbWUpCiAgeCA8LSBjYmluZCgxLCB0dXJub3V0JGVkdWNhdGUpCiAgc2lnbWEgPC0geCUqJXRoZXRhCiAgc3VtKGRub3JtKHksIG11LCBzaWdtYSwgbG9nID0gVFJVRSkpCn0gICAKCgpsaWJyYXJ5KG1heExpaykKbWxlX29sczIgPC0gbWF4TGlrKGxvZ0xpayA9IG9scy5sZjIsIHN0YXJ0ID0gYyhtdSA9IDEsIHRoZXRhMSA9IDEsIHRoZXRhMiA9IDEpKQpzdW1tYXJ5KG1sZV9vbHMyKQoKCgpgYGAKKipJTlRFUlBSRVRBVElPTiAjIDIgKFNsaWRlIDQuMTkpKioKCkZvciB0aGlzIGZpcnN0IGFuYWx5c2lzLCB0aGVyZSBhcmUgMyBwYXJhbWF0ZXJzIHVzZWQ6IE11LCB0aGV0YTEgYW5kIHRoZXRhMi4gCgogICsgTXUgKDMuNTE2NzY0KSByZXByZXNlbnRzIHRoZSBtZWFuCiAgKyB0aGV0YTEgKDEuNDYxMDExKSBpcyB0aGUgeS1pbnRlcmNlcHQKICArIHRoZXRhMiAoMC4xMDkwODEpIGlzIHRoZSBzbG9wZSAKCgpUaGUgYWJvdmUgZGF0YSBzaG93cyBmb3IgZXZlcnkgMSB1bml0IGluY3JlYXNlIGluIGVkdWNhdGlvbiwgdGhlcmUgaXMgYSAwLjEwOTA4MSB1bml0IGluY3JlYXNlIGluIHRoZSBzdGFuZGFyZCBkZXZpYXRpb24gb2YgaW5jb21lIGluZXF1YWxpdHkuIFRoZSB2YXJpYWJsZXMgYXJlIHBvc2l0aXZlbHkgY29ycmVsYXRlZCBhbmQgdGhlIHJlc3VsdHMgYXJlIHN0YXRpc3RpY2FsbHkgc2lnbmlmaWNhbnQgYXMgdGhlIHAgdmFsdWUgaXMgPDAuMDUuCgoKYGBge3Igd2FybmluZz1GQUxTRX0KCmxpYnJhcnkoWmVsaWcpCgpkYXRhKHR1cm5vdXQpCmhlYWQodHVybm91dCkKCm9scy5sZjMgPC0gZnVuY3Rpb24ocGFyYW0pIHsKICBiZXRhIDwtIHBhcmFtWy0xXQogIHNpZ21hIDwtIHBhcmFtWzFdCiAgeSA8LSBhcy52ZWN0b3IodHVybm91dCRpbmNvbWUpCiAgeCA8LSBjYmluZCgxLHR1cm5vdXQkZWR1Y2F0ZSwgdHVybm91dCRhZ2UpCiAgbXUgPC0geCUqJWJldGEKICBzdW0oZG5vcm0oeSwgbXUsIHNpZ21hLCBsb2cgPSBUUlVFKSl9CgoKbGlicmFyeShtYXhMaWspCgptbGVfb2xzMyA8LSBtYXhMaWsobG9nTGlrID0gb2xzLmxmMywgc3RhcnQgPSBjKHNpZ21hID0gMSwgYmV0YTEgPSAxLCBiZXRhMiA9IDEsIGJldGEzID0gMSkpCnN1bW1hcnkobWxlX29sczMpCgpzdW1tYXJ5KGxtKGluY29tZSB+IGVkdWNhdGUrYWdlLCBkYXRhID0gdHVybm91dCkpCgoKCmBgYAoKSW4gdGhlIGFib3ZlIGFuYWx5c2lzLCBhIHNlY29uZCBJTkRFUEVOREVOVCB2YXJpYWJsZSwgKmFnZSosIHdhcyBhZGRlZCB0byB0aGUgYW5hbHlzaXMgdG8gc2VlIGlmIGluY29tZSBpbmVxdWFsaXR5IHdvdWxkIHZhcnkgYXQgYWxsIGFuZCBpZiBzbywgd2hhdCBpcyB0aGUgZGlyZWN0aW9uIG9mIHRoZSByZWxhdGlvbnNoaXAuCgoKVGhlIG5ldyBxdWVzdGlvbiBiZWluZyBhc2tlZCBpczogKipEb2VzIEFnZSBpbmZsdWVuY2UgSW5jb21lIEluZXF1YWxpdHk/KioKCgpUaGUgdmFyaWFibGVzIHVzZWQgd2VyZToKCiAgKyBBZ2UgKHg9IGluZGVwZW5kZW50IHZhcmlhYmxlKQogICsgSW5jb21lIGluZXF1YWxpdHkgKHk9IGRlcGVuZGVudCB2YXJpYWJsZSkKCgoqKklOVEVSUFJFVEFUSU9OICMgMyoqCgoKRm9yIHRoaXMgZmlyc3QgYW5hbHlzaXMsIHRoZXJlIGFyZSA0IHBhcmFtYXRlcnMgdXNlZDogU2lnbWEsIEJldGExIGFuZCBCZXRhMiAmIEJldGEgMy4KCiAgKyBTaWdtYSAoMi41MjU1NzYpIHJlcHJlc2VudHMgdGhlIHN0YW5kYXIgZGV2aWF0aW9uIAogICsgQmV0YTEgKC0wLjQ0NjA0NykgaXMgdGhlIHktaW50ZXJjZXB0CiAgKyBCZXRhMiAoMC4zNzEwMTEpIGlzIHRoZSBzbG9wZSBmb3IgZWR1Y2F0aW9uCiAgKyBCZXRhMyAoLTAuMDAzMTg0KSBpcyB0aGUgc2xvcGUgZm9yIGFnZQoKQWZ0ZXIgYW5hbHl6aW5nIHRoZSBkYXRhIGl0IHdhcyBmb3VuZCB0aGF0LCBmb3IgZXZlcnkgMSB1bml0IGluY3JlYXNlIGluIGFnZSwgaW5jb21lIGluZXF1YWxpdHkgZGVjcmVhc2VkIGJ5IC0wLjAwMzE4NCB3aGljaCBtZWFucyB0aGF0IHRoZSB0d28gdmFyaWFibGVzIGFyZSBuZWdhdGl2ZWx5IGNvcnJlbGF0ZWQgYW5kIHRoZXJlIGlzIE5PIHN0YXRpc3RpY2FsIHNpZ25pZmljYW5jZSBiZXR3ZWVuIHRoZSB2YXJpYWJsZSBhcyB0aGUgcCB2YWx1ZSBpcyA+MC4wNS4KCmBgYHtyIHdhcm5pbmc9RkFMU0V9CgpvbHMubGY0IDwtIGZ1bmN0aW9uKHBhcmFtKSB7CiAgbXUgPC0gcGFyYW1bMV0KICB0aGV0YSA8LSBwYXJhbVstMV0KICB5IDwtIGFzLnZlY3Rvcih0dXJub3V0JGluY29tZSkKICB4IDwtIGNiaW5kKDEsIHR1cm5vdXQkZWR1Y2F0ZSwgdHVybm91dCRhZ2UpCiAgc2lnbWEgPC0geCUqJXRoZXRhCiAgc3VtKGRub3JtKHksIG11LCBzaWdtYSwgbG9nID0gVFJVRSkpCn0gICAKCgpsaWJyYXJ5KG1heExpaykKbWxlX29sczQgPC0gbWF4TGlrKGxvZ0xpayA9IG9scy5sZjQsIHN0YXJ0ID0gYyhtdSA9IDEsIHRoZXRhMSA9IDEsIHRoZXRhMiA9IDEsIHRoZXRhMyA9IDEpLCBtZXRob2QgPSAiQkZHUyIpCnN1bW1hcnkobWxlX29sczQpCgpgYGAKCgoqKklOVEVSUFJFVEFUSU9OICMgNCoqCgoKRm9yIHRoaXMgZmlyc3QgYW5hbHlzaXMsIHRoZXJlIGFyZSA0IHBhcmFtYXRlcnMgdXNlZDogTXUsIHRoZXRhMSBhbmQgdGhldGEyICYgdGhldGEgMy4KCiAgKyBNdSAoMy41NTUwMTEpIHJlcHJlc2VudHMgdGhlIG1lYW4gCiAgKyBUaGV0YTEgKDAuMzYyMTE0KSBpcyB0aGUgeS1pbnRlcmNlcHQKICArIFRoZXRhMiAoMC4xMzMzNDkpIGlzIHRoZSBzbG9wZSBmb3IgZWR1Y2F0aW9uCiAgKyBUaGV0YTMgKDAuMDE3NTA3KSBpcyB0aGUgc2xvcGUgZm9yIGFnZQoKVGhlIGFib3ZlIGludGVycHJldGF0aW9uIHNob3dzIHRoYXQgZm9yIGV2ZXJ5IDEgdW5pdCBpbmNyZWFzZSBpbiBhZ2UsIHRoZXJlIGlzIGEgMC4wMTc1MDcgdW5pdCBpbmNyZWFzZSBpbiB0aGUgc3RhbmRhcmQgZGV2aWF0aW9uIG9mIGluY29tZSBpbmVxdWFsaXR5LiAgVGhpcyBzaG93cyBhIHBvc2l0aXZlIGNvcnJlbGF0aW9uIGJldHdlZW4gdGhlIHR3byB2YXJpYWJsZXMuICBJbiB0ZXJtcyBvZiBpdCBiZWluZyBzdGF0aXN0aWNhbGx5IHNpZ25pZmljYW50LCB0aGUgZGF0YSBzaG93cyB0aGF0IGl0IGlzIGluZGVlZCBzaWduaWZpY2FudCB3aXRoIGEgcCB2YWx1ZSBvZiA8MC4wNS4KCg==

Homework # 3: MLE & GLM

Safiya Stewart

Sociology 712

Professor Songe

2/22/19