Comenzamos por cargar los datos y crear nuestra base.
setwd("C:/Users/mauiu/Desktop")
base <- read_sav("GSS2006.sav")
datos <- base[,c('NATMASS', 'AGE', 'SEX', 'SEI', 'REGION', 'POLVIEWS')]
datos <- na.omit(datos)
# NATMASS
datos$NATMASS <- as.factor(datos$NATMASS)
levels(datos$NATMASS) <- c('TOO LITTLE', 'ABOUT RIGHT', 'TOO MUCH')
datos$NATMASS <- relevel(datos$NATMASS, ref = 'ABOUT RIGHT')
# POLIVIEWS
datos$POLVIEWS <- as.factor(datos$POLVIEWS)
levels(datos$POLVIEWS) <- c('EXTREMELY LIBERAL', 'LIBERAL', 'SLIGHTLY LIBERAL', 'MODERATE',
'SLGHTLY CONSERVATIVE', 'CONSERVATIVE', 'EXTRMLY CONSERVATIVE')
Para responder la primer prergunta basta con aplicar la función table.
table(datos$POLVIEWS)
##
## EXTREMELY LIBERAL LIBERAL SLIGHTLY LIBERAL
## 85 309 317
## MODERATE SLGHTLY CONSERVATIVE CONSERVATIVE
## 950 386 406
## EXTRMLY CONSERVATIVE
## 100
Podemos ver que la inclinación política más frecuente es MODERATE
La gráfica es la siguiente:
Por como está definido el intercepto este tendrá una mejor interpretación si tomamos los valores centrados en la media de ambas variables pues no tenemos casos donde estás sean 0.
# AGE
datos$AGE <- datos$AGE - mean(datos$AGE)
# SEI
datos$SEI <- datos$SEI - mean(datos$SEI)
modelo <- multinom(NATMASS ~ AGE + SEX + SEI + REGION, data = datos)
## # weights: 18 (10 variable)
## initial value 2804.757173
## iter 10 value 2429.331977
## final value 2341.781099
## converged
modelo
## Call:
## multinom(formula = NATMASS ~ AGE + SEX + SEI + REGION, data = datos)
##
## Coefficients:
## (Intercept) AGE SEX SEI REGION
## TOO LITTLE 0.240772 0.010366915 -0.2696337 0.01586159 0.02153001
## TOO MUCH -1.303010 0.009545339 -0.2873588 0.00098251 0.02382287
##
## Residual Deviance: 4683.562
## AIC: 4703.562