Comenzamos por cargar los datos y crear nuestra base.

setwd("C:/Users/mauiu/Desktop")
base <- read_sav("GSS2006.sav")

datos <- base[,c('NATMASS', 'AGE', 'SEX', 'SEI', 'REGION', 'POLVIEWS')]
datos <- na.omit(datos)
  1. Convierta la variable NATMASS a factor cuyo nivel base sea about right
# NATMASS

datos$NATMASS <- as.factor(datos$NATMASS)
levels(datos$NATMASS) <- c('TOO LITTLE', 'ABOUT RIGHT', 'TOO MUCH')
datos$NATMASS <- relevel(datos$NATMASS, ref = 'ABOUT RIGHT')
  1. Recodifique la variable POLVIEWS para que sea un factor que vaya desde extremely liberal hasta extremely conservative.
# POLIVIEWS

datos$POLVIEWS <- as.factor(datos$POLVIEWS)
levels(datos$POLVIEWS) <- c('EXTREMELY LIBERAL', 'LIBERAL', 'SLIGHTLY LIBERAL', 'MODERATE', 
                            'SLGHTLY CONSERVATIVE', 'CONSERVATIVE', 'EXTRMLY CONSERVATIVE') 
  1. ¿Qué inclinación política es más frecuente?, diseñe un gráfico de inclinación política y gasto en transporte masivo (NATMASS) y describa detalladamente.

Para responder la primer prergunta basta con aplicar la función table.

table(datos$POLVIEWS)
## 
##    EXTREMELY LIBERAL              LIBERAL     SLIGHTLY LIBERAL 
##                   85                  309                  317 
##             MODERATE SLGHTLY CONSERVATIVE         CONSERVATIVE 
##                  950                  386                  406 
## EXTRMLY CONSERVATIVE 
##                  100

Podemos ver que la inclinación política más frecuente es MODERATE

La gráfica es la siguiente:

  1. Nos gustaría tener una interpretación útil del intercepto, ¿qué tranformación haría a las variables AGE y SEI para lograrlo? Una vez identificada aplíquela a las variables.

Por como está definido el intercepto este tendrá una mejor interpretación si tomamos los valores centrados en la media de ambas variables pues no tenemos casos donde estás sean 0.

# AGE
datos$AGE <- datos$AGE - mean(datos$AGE)

# SEI 
datos$SEI <- datos$SEI - mean(datos$SEI)
  1. Ajuste un modelo multinomial usando NATMASS como variable a explicar pero no incluya la variable de inclinación política (modelo 1).
modelo <- multinom(NATMASS ~ AGE + SEX + SEI + REGION, data = datos)
## # weights:  18 (10 variable)
## initial  value 2804.757173 
## iter  10 value 2429.331977
## final  value 2341.781099 
## converged
modelo
## Call:
## multinom(formula = NATMASS ~ AGE + SEX + SEI + REGION, data = datos)
## 
## Coefficients:
##            (Intercept)         AGE        SEX        SEI     REGION
## TOO LITTLE    0.240772 0.010366915 -0.2696337 0.01586159 0.02153001
## TOO MUCH     -1.303010 0.009545339 -0.2873588 0.00098251 0.02382287
## 
## Residual Deviance: 4683.562 
## AIC: 4703.562