library(xlsx)
library(dplyr)
library(DT)
dados1 = read.xlsx2("Dados.xls", sheetIndex = 2, colClasses=NA)
dados1$Número.do.domicílio = NULL
dados1$Endereço.do.domicílio..CDL. = NULL
dados1$Nro.da.origem.da.viagem = NULL
dados1$Endereço.de.destino.da.viagem..CDL. = NULL
dados1$Endereço.da.origem.da.viagem..CDL. = NULL
dados1$Horario.de.saída = NULL
dados1$Nro.do.destino.da.viagem = NULL
sexo = unique(dados1$Sexo)
domicilios = unique(dados1$Código.do.domicílio)
unique(dados1$Motivo.da.viagem)
## [1] 9 1 2 3 7 4 8 5 6
Realiza a transformação de dados de sexo e escolaridade em percentual de Mulheres e Estudantes na residência
dados1$ratio = 0
dados1$ratio2 = 0
dados1$estudantes = 0
dados1$Nestudantes = 0
for (domicilio in domicilios) {
#print(domicilio)
#domicilio = 1489
temp = dados1[dados1$Código.do.domicílio == domicilio,]
situacaoamiliarUm = temp[temp$Situação.familiar.da.pessoa ==1, ]
situacaoamiliarUm = situacaoamiliarUm[1,]
trabalho = temp[temp$Motivo.da.viagem ==2, c("Motivo.da.viagem")]
educacao = temp[temp$Motivo.da.viagem ==3, c("Motivo.da.viagem")]
educacaoNa = temp[temp$Grau.de.instrução ==1, c("Grau.de.instrução")]
educacao1 = temp[temp$Grau.de.instrução ==2 | temp$Grau.de.instrução ==3 | temp$Grau.de.instrução ==4, c("Grau.de.instrução")]
educacao2 = temp[temp$Grau.de.instrução ==5 | temp$Grau.de.instrução ==6, c("Grau.de.instrução")]
educacao3 = temp[temp$Grau.de.instrução ==7 | temp$Grau.de.instrução ==8, c("Grau.de.instrução")]
educacao4 = temp[temp$Grau.de.instrução ==9 | temp$Grau.de.instrução ==10, c("Grau.de.instrução")]
rows = unique(temp$Código.do.domicílio)
temp = temp[!duplicated(temp$Pessoa), ]
temp1 = temp %>% group_by(Pessoa, Sexo)
dados1[dados1$Código.do.domicílio == domicilio, c("trabalho")] = length(trabalho)
dados1[dados1$Código.do.domicílio == domicilio, c("educacao")] = length(educacao)
dados1[dados1$Código.do.domicílio == domicilio, c("compulsorias")] = length(educacao) + length(trabalho)
dados1[dados1$Código.do.domicílio == domicilio, c("educacaoNa")] = length(educacaoNa)
dados1[dados1$Código.do.domicílio == domicilio, c("educacao1")] = length(educacao1)
dados1[dados1$Código.do.domicílio == domicilio, c("educacao2")] = length(educacao2)
dados1[dados1$Código.do.domicílio == domicilio, c("educacao3")] = length(educacao3)
dados1[dados1$Código.do.domicílio == domicilio, c("educacao4")] = length(educacao4)
dados1[dados1$Código.do.domicílio == domicilio, c("atividadeResponsável")] = ifelse(!is.na(situacaoamiliarUm$Situação.familiar.da.pessoa), situacaoamiliarUm$Atividade.principal, 0)
dados1[dados1$Código.do.domicílio == domicilio, c("escolaridadeResponsável")] = ifelse(!is.na(situacaoamiliarUm$Situação.familiar.da.pessoa), situacaoamiliarUm$Grau.de.instrução, 0)
dados1[dados1$Código.do.domicílio == domicilio, c("sexoResponsável")] = ifelse(!is.na(situacaoamiliarUm$Situação.familiar.da.pessoa), situacaoamiliarUm$Sexo, 0)
dados1[dados1$Código.do.domicílio == domicilio, c("ratio")] = (tryCatch(sum(temp1[temp1$Sexo==1,c("Sexo")]), error = function(e) 0))
dados1[dados1$Código.do.domicílio == domicilio, c("ratio2")] = length(temp1$Sexo) - (tryCatch(sum(temp1[temp1$Sexo==1,c("Sexo")]), error = function(e) 0))
temp2 = temp %>% group_by(Pessoa)
dados1[dados1$Código.do.domicílio == domicilio, c("estudantes")] = tryCatch(dim(temp2[temp2$Estuda.atualmente!=1,c("Estuda.atualmente")])[1], error = function(e) 0)
dados1[dados1$Código.do.domicílio == domicilio, c("Nestudantes")] = tryCatch(dim(temp2[temp2$Estuda.atualmente==1,c("Estuda.atualmente")])[1], error = function(e) 0)
dados1[dados1$Código.do.domicílio == domicilio, c("Trabalhadores")] = tryCatch(dim(temp2[temp2$Atividade.principal ==2 | temp2$Atividade.principal ==3 | temp2$Atividade.principal ==4 | temp2$Atividade.principal ==5 | temp2$Atividade.principal ==6,])[1], error = function(e) 0)
#dados1[dados1$Código.do.domicílio == domicilio, c("estudantes")] = tryCatch(length(temp2[temp2$Estuda.atualmente!=1,c("Estuda.atualmente")]), error = function(e) 0)
#dados1[dados1$Código.do.domicílio == domicilio, c("Nestudantes")] = tryCatch(length(temp2[temp2$Estuda.atualmente==1,c("Estuda.atualmente")]), error = function(e) 0)
#/length(temp$Estuda.atualmente))
}
Faz o resumo dos dados
glimpse(dados1)
## Rows: 21,378
## Columns: 39
## $ Código.do.domicílio <dbl> 135, 135, 141, 141, 141, 141, ...
## $ Zona.de.Tráfego.do.domicílio <dbl> 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, ...
## $ Tipo.de.moradia <dbl> 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, ...
## $ Nro.de.pessoas.no.domicílio <dbl> 1, 1, 3, 3, 3, 3, 3, 3, 3, 3, ...
## $ Consumo.energia.elétrica.em.kW <dbl> 0, 0, 229, 229, 229, 229, 229,...
## $ Consumo.energia.elétrica.em.R. <dbl> 25, 25, 0, 0, 0, 0, 0, 0, 0, 0...
## $ Nro.de.automóveis <dbl> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ...
## $ Nro.de.motos <dbl> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ...
## $ Fator.de.expansão.para.domicílios <dbl> 25.530, 25.530, 34.962, 34.962...
## $ Pessoa <dbl> 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, ...
## $ Situação.familiar.da.pessoa <dbl> 1, 1, 1, 1, 1, 1, 6, 6, 6, 6, ...
## $ Idade <dbl> 73, 73, 32, 32, 32, 32, 32, 32...
## $ Sexo <dbl> 1, 1, 2, 2, 2, 2, 2, 2, 2, 2, ...
## $ Estuda.atualmente <dbl> 1, 1, 6, 6, 6, 6, 1, 1, 1, 1, ...
## $ Grau.de.instrução <dbl> 8, 8, 7, 7, 7, 7, 6, 6, 6, 6, ...
## $ Atividade.principal <dbl> 7, 7, 1, 1, 1, 1, 1, 1, 1, 1, ...
## $ Rendimento.líquido.mensal <dbl> 2000, 2000, 600, 600, 600, 600...
## $ Nro.da.viagem <dbl> 1, 2, 1, 2, 3, 4, 1, 2, 3, 4, ...
## $ Motivo.da.viagem <dbl> 9, 1, 2, 1, 3, 1, 2, 1, 2, 1, ...
## $ Zona.de.Tráfego.de.origem <dbl> 4, 73, 4, 36, 4, 4304606, 4, 4...
## $ Zona.de.Tráfego.de.destino <dbl> 73, 4, 36, 4, 4304606, 4, 4, 4...
## $ Modo.utilizado.na.viagem <dbl> 3, 3, 3, 3, 3, 3, 1, 1, 1, 1, ...
## $ Fator.de.expansão.para.deslocamentos <dbl> 22.77250, 22.77250, 34.10893, ...
## $ ratio <dbl> 1, 1, 0, 0, 0, 0, 0, 0, 0, 0, ...
## $ ratio2 <dbl> 0, 0, 3, 3, 3, 3, 3, 3, 3, 3, ...
## $ estudantes <dbl> 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, ...
## $ Nestudantes <dbl> 1, 1, 2, 2, 2, 2, 2, 2, 2, 2, ...
## $ trabalho <int> 0, 0, 4, 4, 4, 4, 4, 4, 4, 4, ...
## $ educacao <int> 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, ...
## $ compulsorias <int> 0, 0, 5, 5, 5, 5, 5, 5, 5, 5, ...
## $ educacaoNa <int> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ...
## $ educacao1 <int> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ...
## $ educacao2 <int> 0, 0, 6, 6, 6, 6, 6, 6, 6, 6, ...
## $ educacao3 <int> 2, 2, 4, 4, 4, 4, 4, 4, 4, 4, ...
## $ educacao4 <int> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ...
## $ atividadeResponsável <dbl> 7, 7, 1, 1, 1, 1, 1, 1, 1, 1, ...
## $ escolaridadeResponsável <dbl> 8, 8, 7, 7, 7, 7, 7, 7, 7, 7, ...
## $ sexoResponsável <dbl> 1, 1, 2, 2, 2, 2, 2, 2, 2, 2, ...
## $ Trabalhadores <int> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ...
Verifica o DataFrame
DT::datatable(dados1, filter = 'top', options = list(
language = list(url = '//cdn.datatables.net/plug-ins/1.10.11/i18n/Portuguese.json'),
pageLength = 15, autoWidth = TRUE
))
Realiza-se a agregação dos dados
df = dados1 %>%
group_by(Código.do.domicílio, Zona.de.Tráfego.do.domicílio) %>%
summarise(Viagens = n(), TipoMoradia = mean(Tipo.de.moradia, na.rm = TRUE), Rendimento = sum(Rendimento.líquido.mensal, na.rm = TRUE),
NFamilia = mean(Nro.de.pessoas.no.domicílio, na.rm = TRUE), Energia = mean(Consumo.energia.elétrica.em.kW, na.rm = TRUE),
Energia2 = mean(Consumo.energia.elétrica.em.R., na.rm = TRUE), Veiculos = mean(Nro.de.automóveis, na.rm = TRUE),
Motos = mean(Nro.de.motos, na.rm = TRUE), NMulheres = mean(ratio, na.rm = TRUE), NHomens = mean(ratio2, na.rm = TRUE), NEstudantes = mean(estudantes, na.rm = TRUE), NnEstudantes = mean(Nestudantes, na.rm = TRUE), educacao = mean(educacao, na.rm = TRUE), trabalho = mean(trabalho, na.rm = TRUE), compulsorias = mean(compulsorias, na.rm = TRUE), educacaoNa = mean(educacaoNa, na.rm = TRUE), educacao1 = mean(educacao1, na.rm = TRUE), educacao2 = mean(educacao2, na.rm = TRUE), educacao3 = mean(educacao3, na.rm = TRUE), educacao4 = mean(educacao4, na.rm = TRUE), escolaridadeResponsável = mean(escolaridadeResponsável, na.rm = TRUE), atividadeResponsável = mean(atividadeResponsável, na.rm = TRUE), sexoResponsável = mean(sexoResponsável, na.rm = TRUE), NTrabalhadores = mean(Trabalhadores, na.rm = TRUE), IdadeMediaDom = mean(Idade, na.rm = TRUE))
Tabela Final dos dados
DT::datatable(df, filter = 'top', options = list(
language = list(url = '//cdn.datatables.net/plug-ins/1.10.11/i18n/Portuguese.json'),
pageLength = 15, autoWidth = TRUE
))
Semariza-se os dados
glimpse(df)
## Rows: 4,169
## Columns: 27
## Groups: Código.do.domicílio [4,169]
## $ Código.do.domicílio <dbl> 135, 141, 142, 149, 151, 152, 162, 176...
## $ Zona.de.Tráfego.do.domicílio <dbl> 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4,...
## $ Viagens <int> 2, 10, 7, 3, 2, 10, 2, 14, 2, 8, 2, 3,...
## $ TipoMoradia <dbl> 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4,...
## $ Rendimento <dbl> 4000, 5300, 25000, 720, 0, 40000, 0, 1...
## $ NFamilia <dbl> 1, 3, 2, 2, 1, 4, 1, 3, 3, 2, 1, 1, 1,...
## $ Energia <dbl> 0, 229, 0, 0, 90, 0, 0, 0, 0, 220, 0, ...
## $ Energia2 <dbl> 25, 0, 50, 58, 0, 100, 80, 90, 39, 0, ...
## $ Veiculos <dbl> 0, 0, 0, 0, 1, 1, 0, 0, 0, 0, 0, 0, 0,...
## $ Motos <dbl> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,...
## $ NMulheres <dbl> 1, 0, 0, 0, 1, 2, 0, 1, 0, 1, 1, 0, 1,...
## $ NHomens <dbl> 0, 3, 2, 1, 0, 1, 1, 2, 1, 1, 0, 1, 0,...
## $ NEstudantes <dbl> 0, 1, 0, 0, 0, 0, 0, 2, 0, 0, 0, 1, 1,...
## $ NnEstudantes <dbl> 1, 2, 2, 1, 1, 3, 1, 1, 1, 2, 1, 0, 0,...
## $ educacao <dbl> 0, 1, 0, 0, 0, 1, 0, 1, 0, 0, 0, 1, 1,...
## $ trabalho <dbl> 0, 4, 0, 0, 1, 4, 0, 0, 0, 4, 1, 1, 1,...
## $ compulsorias <dbl> 0, 5, 0, 0, 1, 5, 0, 1, 0, 4, 1, 2, 2,...
## $ educacaoNa <dbl> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,...
## $ educacao1 <dbl> 0, 0, 0, 0, 0, 2, 0, 5, 0, 0, 0, 0, 0,...
## $ educacao2 <dbl> 0, 6, 7, 3, 2, 4, 0, 0, 0, 0, 0, 0, 0,...
## $ educacao3 <dbl> 2, 4, 0, 0, 0, 4, 2, 9, 2, 8, 2, 3, 3,...
## $ educacao4 <dbl> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,...
## $ escolaridadeResponsável <dbl> 8, 7, 6, 5, 6, 7, 8, 7, 7, 8, 7, 7, 7,...
## $ atividadeResponsável <dbl> 7, 1, 7, 7, 1, 5, 7, 10, 7, 4, 1, 8, 1...
## $ sexoResponsável <dbl> 1, 2, 2, 2, 1, 1, 2, 2, 2, 2, 1, 2, 1,...
## $ NTrabalhadores <dbl> 0, 0, 0, 0, 0, 2, 0, 0, 0, 2, 0, 0, 0,...
## $ IdadeMediaDom <dbl> 73.00000, 31.00000, 76.42857, 65.00000...
Obtém a média energia KW e R$ e o rendimento médio por morador
df$MediaEnergia = mean(df$Energia + df$Energia2)
df$MediaRendaPessoa = df$Rendimento/df$NFamilia
Viagens Total
#### Variáveis: Zona.de.Tráfego.do.domicílio + TipoMoradia + Rendimento + NFamilia + Veiculos + Motos + Energia+ Zona.de.Tráfego.do.domicílio + NMulheres + NHomens + NEstudantes + NnEstudantes
model <- lm(Viagens ~ Zona.de.Tráfego.do.domicílio + TipoMoradia + Rendimento + NFamilia + Veiculos + Motos + Energia+ Zona.de.Tráfego.do.domicílio + NMulheres + NHomens + NEstudantes + NnEstudantes, data = df)
summary(model)#ok
##
## Call:
## lm(formula = Viagens ~ Zona.de.Tráfego.do.domicílio + TipoMoradia +
## Rendimento + NFamilia + Veiculos + Motos + Energia + Zona.de.Tráfego.do.domicílio +
## NMulheres + NHomens + NEstudantes + NnEstudantes, data = df)
##
## Residuals:
## Min 1Q Median 3Q Max
## -6.6222 -0.8675 -0.3459 0.5954 16.3825
##
## Coefficients: (1 not defined because of singularities)
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -1.575e-01 1.436e-01 -1.097 0.27284
## Zona.de.Tráfego.do.domicílio -2.998e-03 1.311e-03 -2.286 0.02230 *
## TipoMoradia 8.007e-02 2.942e-02 2.722 0.00652 **
## Rendimento 9.685e-05 4.770e-06 20.304 < 2e-16 ***
## NFamilia -1.327e-01 3.379e-02 -3.928 8.71e-05 ***
## Veiculos 2.583e-01 4.101e-02 6.297 3.35e-10 ***
## Motos 8.305e-02 1.514e-01 0.548 0.58340
## Energia 4.733e-04 3.668e-04 1.290 0.19700
## NMulheres 2.342e+00 5.083e-02 46.072 < 2e-16 ***
## NHomens 2.325e+00 4.804e-02 48.394 < 2e-16 ***
## NEstudantes 4.652e-01 4.090e-02 11.374 < 2e-16 ***
## NnEstudantes NA NA NA NA
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 1.68 on 4158 degrees of freedom
## Multiple R-squared: 0.7396, Adjusted R-squared: 0.7389
## F-statistic: 1181 on 10 and 4158 DF, p-value: < 2.2e-16
#### Variáveis: Zona.de.Tráfego.do.domicílio + TipoMoradia + Rendimento + NFamilia + Veiculos + Motos + Energia+ Zona.de.Tráfego.do.domicílio + NMulheres + NHomens + NEstudantes + NnEstudantes + educacaoNa + educacao1 + educacao2 + educacao3 + educacao4 + escolaridadeResponsável + sexoResponsável + atividadeResponsável
model <- lm(Viagens ~ Zona.de.Tráfego.do.domicílio + TipoMoradia + Rendimento + NFamilia + Veiculos + Motos + Energia+ Zona.de.Tráfego.do.domicílio + NMulheres + NHomens + NEstudantes + NnEstudantes + educacaoNa + educacao1 + educacao2 + educacao3 + educacao4 + escolaridadeResponsável + sexoResponsável + atividadeResponsável, data = df)
summary(model)#ok
##
## Call:
## lm(formula = Viagens ~ Zona.de.Tráfego.do.domicílio + TipoMoradia +
## Rendimento + NFamilia + Veiculos + Motos + Energia + Zona.de.Tráfego.do.domicílio +
## NMulheres + NHomens + NEstudantes + NnEstudantes + educacaoNa +
## educacao1 + educacao2 + educacao3 + educacao4 + escolaridadeResponsável +
## sexoResponsável + atividadeResponsável, data = df)
##
## Residuals:
## Min 1Q Median 3Q Max
## -0.01501 -0.00208 -0.00013 0.00158 1.98190
##
## Coefficients: (1 not defined because of singularities)
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 4.224e-03 3.015e-03 1.401 0.16135
## Zona.de.Tráfego.do.domicílio -3.387e-05 2.465e-05 -1.374 0.16955
## TipoMoradia -1.619e-03 5.450e-04 -2.970 0.00299 **
## Rendimento -1.648e-08 9.264e-08 -0.178 0.85878
## NFamilia 1.144e-05 7.085e-04 0.016 0.98711
## Veiculos -1.626e-03 8.147e-04 -1.996 0.04596 *
## Motos -1.086e-03 2.792e-03 -0.389 0.69717
## Energia -3.499e-06 6.763e-06 -0.517 0.60488
## NMulheres 2.333e-03 1.284e-03 1.817 0.06924 .
## NHomens 7.948e-04 1.198e-03 0.663 0.50706
## NEstudantes 6.330e-04 7.970e-04 0.794 0.42706
## NnEstudantes NA NA NA NA
## educacaoNa 9.992e-01 1.628e-03 613.605 < 2e-16 ***
## educacao1 9.996e-01 4.067e-04 2457.899 < 2e-16 ***
## educacao2 1.000e+00 3.444e-04 2903.515 < 2e-16 ***
## educacao3 1.000e+00 3.059e-04 3269.385 < 2e-16 ***
## educacao4 1.000e+00 7.257e-04 1378.404 < 2e-16 ***
## escolaridadeResponsável -5.158e-04 3.056e-04 -1.688 0.09152 .
## sexoResponsável 1.717e-03 1.230e-03 1.396 0.16285
## atividadeResponsável 4.262e-04 1.859e-04 2.293 0.02188 *
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.03091 on 4150 degrees of freedom
## Multiple R-squared: 0.9999, Adjusted R-squared: 0.9999
## F-statistic: 2.622e+06 on 18 and 4150 DF, p-value: < 2.2e-16
#### Variáveis: Zona.de.Tráfego.do.domicílio + TipoMoradia + Rendimento + NFamilia + Veiculos + Motos + Energia+ Zona.de.Tráfego.do.domicílio + NMulheres + NHomens + NEstudantes + NnEstudantes + educacaoNa + educacao1 + educacao2 + educacao3 + educacao4
model <- lm(Viagens ~ Zona.de.Tráfego.do.domicílio + TipoMoradia + Rendimento + NFamilia + Veiculos + Motos + Energia+ Zona.de.Tráfego.do.domicílio + NMulheres + NHomens + NEstudantes + NnEstudantes + educacaoNa + educacao1 + educacao2 + educacao3 + educacao4, data = df)
summary(model)#ok
##
## Call:
## lm(formula = Viagens ~ Zona.de.Tráfego.do.domicílio + TipoMoradia +
## Rendimento + NFamilia + Veiculos + Motos + Energia + Zona.de.Tráfego.do.domicílio +
## NMulheres + NHomens + NEstudantes + NnEstudantes + educacaoNa +
## educacao1 + educacao2 + educacao3 + educacao4, data = df)
##
## Residuals:
## Min 1Q Median 3Q Max
## -0.01491 -0.00180 -0.00014 0.00114 1.98673
##
## Coefficients: (1 not defined because of singularities)
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 6.191e-03 2.653e-03 2.334 0.01965 *
## Zona.de.Tráfego.do.domicílio -3.132e-05 2.459e-05 -1.274 0.20285
## TipoMoradia -1.761e-03 5.435e-04 -3.239 0.00121 **
## Rendimento -1.395e-08 9.258e-08 -0.151 0.88022
## NFamilia -3.504e-04 6.299e-04 -0.556 0.57802
## Veiculos -1.884e-03 8.049e-04 -2.341 0.01929 *
## Motos -1.198e-03 2.791e-03 -0.429 0.66775
## Energia -3.469e-06 6.767e-06 -0.513 0.60822
## NMulheres 2.028e-03 1.172e-03 1.730 0.08369 .
## NHomens 1.198e-03 1.126e-03 1.064 0.28735
## NEstudantes 6.326e-04 7.940e-04 0.797 0.42561
## NnEstudantes NA NA NA NA
## educacaoNa 9.995e-01 1.617e-03 618.014 < 2e-16 ***
## educacao1 9.998e-01 3.920e-04 2550.156 < 2e-16 ***
## educacao2 1.000e+00 3.433e-04 2913.351 < 2e-16 ***
## educacao3 1.000e+00 3.024e-04 3307.394 < 2e-16 ***
## educacao4 1.000e+00 7.155e-04 1397.749 < 2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.03093 on 4153 degrees of freedom
## Multiple R-squared: 0.9999, Adjusted R-squared: 0.9999
## F-statistic: 3.141e+06 on 15 and 4153 DF, p-value: < 2.2e-16
Viagens Compulsórias
Variáveis: TipoMoradia + NFamilia + Veiculos + Motos + Energia+ Zona.de.Tráfego.do.domicílio + NMulheres + NHomens + NEstudantes + NnEstudantes
model <- lm(compulsorias ~ TipoMoradia + NFamilia + Veiculos + Motos + Energia+ Zona.de.Tráfego.do.domicílio + NMulheres + NHomens + NEstudantes + NnEstudantes, data = df)
summary(model)
##
## Call:
## lm(formula = compulsorias ~ TipoMoradia + NFamilia + Veiculos +
## Motos + Energia + Zona.de.Tráfego.do.domicílio + NMulheres +
## NHomens + NEstudantes + NnEstudantes, data = df)
##
## Residuals:
## Min 1Q Median 3Q Max
## -5.3262 -0.5882 -0.0598 0.5486 8.1157
##
## Coefficients: (1 not defined because of singularities)
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -0.1939406 0.0840816 -2.307 0.021127 *
## TipoMoradia 0.0278584 0.0172158 1.618 0.105699
## NFamilia 0.0191811 0.0197644 0.970 0.331861
## Veiculos 0.1740945 0.0236482 7.362 2.17e-13 ***
## Motos 0.2427173 0.0886330 2.738 0.006199 **
## Energia 0.0000555 0.0002142 0.259 0.795614
## Zona.de.Tráfego.do.domicílio -0.0025437 0.0007666 -3.318 0.000914 ***
## NMulheres 0.7060983 0.0296297 23.831 < 2e-16 ***
## NHomens 0.6177526 0.0279735 22.084 < 2e-16 ***
## NEstudantes 0.5519725 0.0239055 23.090 < 2e-16 ***
## NnEstudantes NA NA NA NA
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.9837 on 4159 degrees of freedom
## Multiple R-squared: 0.5714, Adjusted R-squared: 0.5704
## F-statistic: 616 on 9 and 4159 DF, p-value: < 2.2e-16
Variáveis: TipoMoradia + Rendimento + NFamilia + Veiculos + Motos + Zona.de.Tráfego.do.domicílio
model <- lm(Viagens ~ TipoMoradia + Rendimento + NFamilia + Veiculos + Motos + Zona.de.Tráfego.do.domicílio, data = df)
summary(model)
##
## Call:
## lm(formula = Viagens ~ TipoMoradia + Rendimento + NFamilia +
## Veiculos + Motos + Zona.de.Tráfego.do.domicílio, data = df)
##
## Residuals:
## Min 1Q Median 3Q Max
## -9.1506 -1.3600 -0.2227 1.0735 19.1598
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -3.806e-01 2.035e-01 -1.871 0.06146 .
## TipoMoradia 3.045e-01 4.161e-02 7.317 3.03e-13 ***
## Rendimento 1.245e-04 6.746e-06 18.457 < 2e-16 ***
## NFamilia 1.536e+00 3.153e-02 48.706 < 2e-16 ***
## Veiculos 5.297e-01 5.734e-02 9.238 < 2e-16 ***
## Motos 2.978e-01 2.154e-01 1.383 0.16684
## Zona.de.Tráfego.do.domicílio -6.018e-03 1.868e-03 -3.223 0.00128 **
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 2.396 on 4162 degrees of freedom
## Multiple R-squared: 0.4699, Adjusted R-squared: 0.4691
## F-statistic: 614.9 on 6 and 4162 DF, p-value: < 2.2e-16
Variáveis: TipoMoradia + Rendimento + NFamilia + Veiculos + Motos + Energia
model <- lm(Viagens ~ TipoMoradia + Rendimento + NFamilia + Veiculos + Motos + Energia, data = df)
summary(model)
##
## Call:
## lm(formula = Viagens ~ TipoMoradia + Rendimento + NFamilia +
## Veiculos + Motos + Energia, data = df)
##
## Residuals:
## Min 1Q Median 3Q Max
## -9.7960 -1.3334 -0.2241 1.0711 19.1851
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -6.796e-01 1.806e-01 -3.764 0.000170 ***
## TipoMoradia 3.481e-01 3.931e-02 8.855 < 2e-16 ***
## Rendimento 1.240e-04 6.753e-06 18.367 < 2e-16 ***
## NFamilia 1.511e+00 3.118e-02 48.480 < 2e-16 ***
## Veiculos 4.961e-01 5.763e-02 8.608 < 2e-16 ***
## Motos 2.816e-01 2.154e-01 1.307 0.191123
## Energia 1.749e-03 5.222e-04 3.350 0.000816 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 2.396 on 4162 degrees of freedom
## Multiple R-squared: 0.47, Adjusted R-squared: 0.4692
## F-statistic: 615.1 on 6 and 4162 DF, p-value: < 2.2e-16
Variáveis: TipoMoradia + Rendimento + NFamilia + Veiculos + Motos + Energia+ Zona.de.Tráfego.do.domicílio + NMulheres + NEstudantes
model <- lm(Viagens ~ TipoMoradia + Rendimento + NFamilia + Veiculos + Motos + Energia+ Zona.de.Tráfego.do.domicílio + NMulheres + NEstudantes, data = df)
summary(model)
##
## Call:
## lm(formula = Viagens ~ TipoMoradia + Rendimento + NFamilia +
## Veiculos + Motos + Energia + Zona.de.Tráfego.do.domicílio +
## NMulheres + NEstudantes, data = df)
##
## Residuals:
## Min 1Q Median 3Q Max
## -6.5505 -1.2226 -0.1689 0.9290 17.6421
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 1.723e-01 1.794e-01 0.961 0.3368
## TipoMoradia 2.495e-01 3.651e-02 6.833 9.50e-12 ***
## Rendimento 1.204e-04 5.932e-06 20.298 < 2e-16 ***
## NFamilia 7.752e-01 3.513e-02 22.067 < 2e-16 ***
## Veiculos 4.166e-01 5.111e-02 8.151 4.72e-16 ***
## Motos 9.837e-02 1.893e-01 0.520 0.6034
## Energia 1.102e-03 4.583e-04 2.406 0.0162 *
## Zona.de.Tráfego.do.domicílio -3.321e-03 1.639e-03 -2.026 0.0428 *
## NMulheres 8.083e-01 4.969e-02 16.269 < 2e-16 ***
## NEstudantes 1.280e+00 4.659e-02 27.483 < 2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 2.101 on 4159 degrees of freedom
## Multiple R-squared: 0.5929, Adjusted R-squared: 0.592
## F-statistic: 672.9 on 9 and 4159 DF, p-value: < 2.2e-16
Variáveis: TipoMoradia + Rendimento + NFamilia + Veiculos + Motos + Energia2
model <- lm(Viagens ~ TipoMoradia + Rendimento + NFamilia + Veiculos + Motos + Energia2, data = df)
summary(model)
##
## Call:
## lm(formula = Viagens ~ TipoMoradia + Rendimento + NFamilia +
## Veiculos + Motos + Energia2, data = df)
##
## Residuals:
## Min 1Q Median 3Q Max
## -9.1158 -1.3264 -0.2321 1.0754 19.2098
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -7.307e-01 1.836e-01 -3.980 7e-05 ***
## TipoMoradia 3.503e-01 3.937e-02 8.899 <2e-16 ***
## Rendimento 1.250e-04 6.755e-06 18.509 <2e-16 ***
## NFamilia 1.510e+00 3.169e-02 47.653 <2e-16 ***
## Veiculos 5.023e-01 5.834e-02 8.609 <2e-16 ***
## Motos 2.982e-01 2.156e-01 1.383 0.167
## Energia2 1.141e-03 7.588e-04 1.503 0.133
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 2.399 on 4162 degrees of freedom
## Multiple R-squared: 0.4689, Adjusted R-squared: 0.4681
## F-statistic: 612.3 on 6 and 4162 DF, p-value: < 2.2e-16
Variáveis: TipoMoradia + Rendimento + NFamilia + Veiculos + Motos + MediaEnergia
model <- lm(Viagens ~ TipoMoradia + Rendimento + NFamilia + Veiculos + Motos + MediaEnergia, data = df)
summary(model)
##
## Call:
## lm(formula = Viagens ~ TipoMoradia + Rendimento + NFamilia +
## Veiculos + Motos + MediaEnergia, data = df)
##
## Residuals:
## Min 1Q Median 3Q Max
## -9.0332 -1.3061 -0.2302 1.0802 19.0845
##
## Coefficients: (1 not defined because of singularities)
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -6.826e-01 1.808e-01 -3.776 0.000162 ***
## TipoMoradia 3.485e-01 3.936e-02 8.854 < 2e-16 ***
## Rendimento 1.256e-04 6.744e-06 18.631 < 2e-16 ***
## NFamilia 1.519e+00 3.113e-02 48.793 < 2e-16 ***
## Veiculos 5.188e-01 5.730e-02 9.053 < 2e-16 ***
## Motos 2.928e-01 2.156e-01 1.358 0.174591
## MediaEnergia NA NA NA NA
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 2.399 on 4163 degrees of freedom
## Multiple R-squared: 0.4686, Adjusted R-squared: 0.4679
## F-statistic: 734.1 on 5 and 4163 DF, p-value: < 2.2e-16
dados = df[, -(1:4)]
summary(dados)
## Rendimento NFamilia Energia Energia2
## Min. : 0 Min. : 1.000 Min. : 0.00 Min. : 0.00
## 1st Qu.: 0 1st Qu.: 2.000 1st Qu.: 0.00 1st Qu.: 40.00
## Median : 0 Median : 2.000 Median : 0.00 Median : 60.00
## Mean : 2265 Mean : 2.592 Mean : 20.83 Mean : 66.76
## 3rd Qu.: 2490 3rd Qu.: 3.000 3rd Qu.: 0.00 3rd Qu.: 90.00
## Max. :106000 Max. :10.000 Max. :801.00 Max. :1200.00
## Veiculos Motos NMulheres NHomens
## Min. :0.0000 Min. :0.00000 Min. :0.0000 Min. :0.000
## 1st Qu.:0.0000 1st Qu.:0.00000 1st Qu.:0.0000 1st Qu.:1.000
## Median :1.0000 Median :0.00000 Median :1.0000 Median :1.000
## Mean :0.6337 Mean :0.02567 Mean :0.9686 Mean :1.067
## 3rd Qu.:1.0000 3rd Qu.:0.00000 3rd Qu.:1.0000 3rd Qu.:1.000
## Max. :5.0000 Max. :3.00000 Max. :6.0000 Max. :6.000
## NEstudantes NnEstudantes educacao trabalho
## Min. :0.000 Min. :0.000 Min. :0.0000 Min. :0.000
## 1st Qu.:0.000 1st Qu.:1.000 1st Qu.:0.0000 1st Qu.:0.000
## Median :0.000 Median :1.000 Median :0.0000 Median :1.000
## Mean :0.633 Mean :1.402 Mean :0.5512 Mean :1.133
## 3rd Qu.:1.000 3rd Qu.:2.000 3rd Qu.:1.0000 3rd Qu.:2.000
## Max. :5.000 Max. :5.000 Max. :6.0000 Max. :8.000
## compulsorias educacaoNa educacao1 educacao2
## Min. : 0.000 Min. :0.00000 Min. : 0.0000 Min. : 0.000
## 1st Qu.: 1.000 1st Qu.:0.00000 1st Qu.: 0.0000 1st Qu.: 0.000
## Median : 1.000 Median :0.00000 Median : 0.0000 Median : 2.000
## Mean : 1.685 Mean :0.02662 Mean : 0.9635 Mean : 1.873
## 3rd Qu.: 2.000 3rd Qu.:0.00000 3rd Qu.: 2.0000 3rd Qu.: 3.000
## Max. :12.000 Max. :8.00000 Max. :20.0000 Max. :16.000
## educacao3 educacao4 escolaridadeResponsável
## Min. : 0.000 Min. : 0.0000 Min. : 0.000
## 1st Qu.: 0.000 1st Qu.: 0.0000 1st Qu.: 4.000
## Median : 2.000 Median : 0.0000 Median : 6.000
## Mean : 2.141 Mean : 0.1228 Mean : 5.509
## 3rd Qu.: 4.000 3rd Qu.: 0.0000 3rd Qu.: 8.000
## Max. :25.000 Max. :12.0000 Max. :10.000
## atividadeResponsável sexoResponsável NTrabalhadores IdadeMediaDom
## Min. : 0.000 Min. :0.000 Min. :0.000 Min. : 5.00
## 1st Qu.: 1.000 1st Qu.:1.000 1st Qu.:0.000 1st Qu.:28.25
## Median : 4.000 Median :1.000 Median :0.000 Median :36.17
## Mean : 3.634 Mean :1.158 Mean :0.573 Mean :40.18
## 3rd Qu.: 7.000 3rd Qu.:2.000 3rd Qu.:1.000 3rd Qu.:49.67
## Max. :14.000 Max. :2.000 Max. :5.000 Max. :91.00
## MediaEnergia MediaRendaPessoa
## Min. :87.59 Min. : 0.0
## 1st Qu.:87.59 1st Qu.: 0.0
## Median :87.59 Median : 0.0
## Mean :87.59 Mean : 992.8
## 3rd Qu.:87.59 3rd Qu.: 1087.5
## Max. :87.59 Max. :35000.0
apply(dados, 2, sd)
## Rendimento NFamilia Energia
## 5649.0331647 1.2848411 72.4734698
## Energia2 Veiculos Motos
## 52.0740194 0.7026305 0.1726597
## NMulheres NHomens NEstudantes
## 0.8094457 0.8136701 0.8594203
## NnEstudantes educacao trabalho
## 0.8102657 0.8533715 1.0996258
## compulsorias educacaoNa educacao1
## 1.5008170 0.3035477 1.8150085
## educacao2 educacao3 educacao4
## 2.2618782 2.7512772 0.7116930
## escolaridadeResponsável atividadeResponsável sexoResponsável
## 2.6548921 2.9669037 0.6377937
## NTrabalhadores IdadeMediaDom MediaEnergia
## 0.7098176 15.8726528 0.0000000
## MediaRendaPessoa
## 2337.7488513
matcor <- cor(dados)
print(matcor, digits = 3)
## Rendimento NFamilia Energia Energia2 Veiculos Motos
## Rendimento 1.00000 0.0970 0.10601 0.11803 0.21166 -0.00515
## NFamilia 0.09698 1.0000 0.12455 0.26811 0.32203 0.04824
## Energia 0.10601 0.1246 1.00000 -0.21663 0.16554 0.02021
## Energia2 0.11803 0.2681 -0.21663 1.00000 0.27507 -0.00270
## Veiculos 0.21166 0.3220 0.16554 0.27507 1.00000 0.01422
## Motos -0.00515 0.0482 0.02021 -0.00270 0.01422 1.00000
## NMulheres 0.10526 0.5483 0.09969 0.16852 0.28644 0.08131
## NHomens 0.09694 0.4705 0.08636 0.14374 0.13338 -0.01731
## NEstudantes 0.05373 0.5553 0.09958 0.14567 0.16393 0.02145
## NnEstudantes 0.14551 0.4313 0.08069 0.15819 0.24621 0.04109
## educacao 0.06780 0.5187 0.11304 0.13584 0.13072 0.00329
## trabalho 0.23253 0.3791 0.07019 0.15973 0.28651 0.07927
## compulsorias 0.20892 0.5727 0.11570 0.19427 0.28425 0.05995
## educacaoNa -0.00550 0.0758 -0.00982 -0.00960 -0.02963 0.05105
## educacao1 0.03712 0.3871 0.05431 -0.00268 -0.01330 0.00375
## educacao2 0.02330 0.3126 -0.00577 0.04550 0.00834 0.04029
## educacao3 0.28557 0.2190 0.13067 0.21834 0.36746 0.00903
## educacao4 0.10562 0.0380 0.06660 0.03733 0.12500 -0.01004
## escolaridadeResponsável 0.15532 -0.1723 0.03466 0.07577 0.17357 -0.00964
## atividadeResponsável 0.05102 -0.1767 -0.00330 -0.01790 -0.02235 -0.03226
## sexoResponsável 0.02906 -0.3087 -0.03533 -0.06453 -0.13297 -0.02149
## NTrabalhadores 0.16142 0.2780 0.07407 0.17222 0.30693 0.05028
## IdadeMediaDom 0.04617 -0.3232 0.00116 -0.03610 -0.04295 -0.06037
## MediaEnergia NA NA NA NA NA NA
## MediaRendaPessoa 0.86735 -0.1028 0.06334 0.05023 0.12788 -0.01575
## NMulheres NHomens NEstudantes NnEstudantes educacao
## Rendimento 0.10526 0.09694 0.05373 0.1455 0.06780
## NFamilia 0.54827 0.47053 0.55525 0.4313 0.51871
## Energia 0.09969 0.08636 0.09958 0.0807 0.11304
## Energia2 0.16852 0.14374 0.14567 0.1582 0.13584
## Veiculos 0.28644 0.13338 0.16393 0.2462 0.13072
## Motos 0.08131 -0.01731 0.02145 0.0411 0.00329
## NMulheres 1.00000 -0.13889 0.43833 0.3946 0.41062
## NHomens -0.13889 1.00000 0.43368 0.4055 0.39313
## NEstudantes 0.43833 0.43368 1.00000 -0.1873 0.85558
## NnEstudantes 0.39460 0.40546 -0.18727 1.0000 -0.10249
## educacao 0.41062 0.39313 0.85558 -0.1025 1.00000
## trabalho 0.36537 0.28744 0.21885 0.4215 0.16786
## compulsorias 0.50118 0.43414 0.64684 0.2506 0.69159
## educacaoNa 0.05418 0.04721 0.00528 0.0959 -0.00573
## educacao1 0.24516 0.28660 0.34934 0.1622 0.35624
## educacao2 0.27118 0.26324 0.13044 0.3969 0.15694
## educacao3 0.26142 0.23125 0.38083 0.0894 0.35739
## educacao4 0.02378 0.03930 0.03840 0.0225 0.02283
## escolaridadeResponsável 0.15659 0.02073 0.03870 0.1362 0.01741
## atividadeResponsável -0.00668 0.00354 -0.05037 0.0503 -0.02890
## sexoResponsável -0.25856 0.21877 -0.04941 0.0138 -0.05693
## NTrabalhadores 0.27521 0.20426 0.13677 0.3350 0.10780
## IdadeMediaDom -0.24720 -0.14154 -0.48914 0.1297 -0.45333
## MediaEnergia NA NA NA NA NA
## MediaRendaPessoa -0.01304 -0.01359 -0.05861 0.0355 -0.04125
## trabalho compulsorias educacaoNa educacao1 educacao2
## Rendimento 0.2325 0.2089 -0.005498 0.03712 0.02330
## NFamilia 0.3791 0.5727 0.075811 0.38705 0.31259
## Energia 0.0702 0.1157 -0.009818 0.05431 -0.00577
## Energia2 0.1597 0.1943 -0.009595 -0.00268 0.04550
## Veiculos 0.2865 0.2843 -0.029634 -0.01330 0.00834
## Motos 0.0793 0.0600 0.051047 0.00375 0.04029
## NMulheres 0.3654 0.5012 0.054182 0.24516 0.27118
## NHomens 0.2874 0.4341 0.047208 0.28660 0.26324
## NEstudantes 0.2189 0.6468 0.005276 0.34934 0.13044
## NnEstudantes 0.4215 0.2506 0.095938 0.16219 0.39689
## educacao 0.1679 0.6916 -0.005728 0.35624 0.15694
## trabalho 1.0000 0.8281 0.019548 0.04307 0.24005
## compulsorias 0.8281 1.0000 0.011066 0.23412 0.26512
## educacaoNa 0.0195 0.0111 1.000000 0.01004 -0.02233
## educacao1 0.0431 0.2341 0.010036 1.00000 -0.06734
## educacao2 0.2401 0.2651 -0.022335 -0.06734 1.00000
## educacao3 0.4046 0.4997 -0.025477 -0.13350 -0.27108
## educacao4 0.1379 0.1140 -0.008476 -0.02328 -0.10404
## escolaridadeResponsável 0.1881 0.1477 -0.074859 -0.26313 -0.02905
## atividadeResponsável -0.2357 -0.1891 -0.000912 -0.02489 -0.02629
## sexoResponsável -0.0255 -0.0511 -0.010525 -0.06032 0.00189
## NTrabalhadores 0.4781 0.4116 0.029389 0.04658 0.09013
## IdadeMediaDom -0.2763 -0.4602 -0.021962 -0.10619 -0.09840
## MediaEnergia NA NA NA NA NA
## MediaRendaPessoa 0.1294 0.0714 -0.018550 -0.04490 -0.03243
## educacao3 educacao4 escolaridadeResponsável
## Rendimento 0.28557 0.105623 0.15532
## NFamilia 0.21896 0.037955 -0.17225
## Energia 0.13067 0.066603 0.03466
## Energia2 0.21834 0.037326 0.07577
## Veiculos 0.36746 0.125001 0.17357
## Motos 0.00903 -0.010037 -0.00964
## NMulheres 0.26142 0.023776 0.15659
## NHomens 0.23125 0.039301 0.02073
## NEstudantes 0.38083 0.038403 0.03870
## NnEstudantes 0.08944 0.022486 0.13620
## educacao 0.35739 0.022825 0.01741
## trabalho 0.40464 0.137871 0.18814
## compulsorias 0.49969 0.113995 0.14775
## educacaoNa -0.02548 -0.008476 -0.07486
## educacao1 -0.13350 -0.023279 -0.26313
## educacao2 -0.27108 -0.104037 -0.02905
## educacao3 1.00000 -0.012539 0.37614
## educacao4 -0.01254 1.000000 0.14484
## escolaridadeResponsável 0.37614 0.144838 1.00000
## atividadeResponsável 0.06112 -0.020548 0.35309
## sexoResponsável 0.03311 0.000165 0.58659
## NTrabalhadores 0.29208 0.129944 0.19519
## IdadeMediaDom -0.15636 -0.030690 0.03966
## MediaEnergia NA NA NA
## MediaRendaPessoa 0.19537 0.068236 0.17599
## atividadeResponsável sexoResponsável NTrabalhadores
## Rendimento 0.051018 0.029061 0.1614
## NFamilia -0.176675 -0.308665 0.2780
## Energia -0.003295 -0.035332 0.0741
## Energia2 -0.017898 -0.064532 0.1722
## Veiculos -0.022351 -0.132966 0.3069
## Motos -0.032263 -0.021487 0.0503
## NMulheres -0.006682 -0.258557 0.2752
## NHomens 0.003541 0.218765 0.2043
## NEstudantes -0.050369 -0.049411 0.1368
## NnEstudantes 0.050304 0.013797 0.3350
## educacao -0.028898 -0.056929 0.1078
## trabalho -0.235678 -0.025528 0.4781
## compulsorias -0.189109 -0.051074 0.4116
## educacaoNa -0.000912 -0.010525 0.0294
## educacao1 -0.024886 -0.060322 0.0466
## educacao2 -0.026291 0.001890 0.0901
## educacao3 0.061116 0.033113 0.2921
## educacao4 -0.020548 0.000165 0.1299
## escolaridadeResponsável 0.353085 0.586591 0.1952
## atividadeResponsável 1.000000 0.457103 -0.0598
## sexoResponsável 0.457103 1.000000 -0.0374
## NTrabalhadores -0.059776 -0.037355 1.0000
## IdadeMediaDom 0.380236 0.187165 -0.1533
## MediaEnergia NA NA NA
## MediaRendaPessoa 0.080523 0.090540 0.0732
## IdadeMediaDom MediaEnergia MediaRendaPessoa
## Rendimento 0.04617 NA 0.8674
## NFamilia -0.32319 NA -0.1028
## Energia 0.00116 NA 0.0633
## Energia2 -0.03610 NA 0.0502
## Veiculos -0.04295 NA 0.1279
## Motos -0.06037 NA -0.0158
## NMulheres -0.24720 NA -0.0130
## NHomens -0.14154 NA -0.0136
## NEstudantes -0.48914 NA -0.0586
## NnEstudantes 0.12974 NA 0.0355
## educacao -0.45333 NA -0.0412
## trabalho -0.27632 NA 0.1294
## compulsorias -0.46022 NA 0.0714
## educacaoNa -0.02196 NA -0.0185
## educacao1 -0.10619 NA -0.0449
## educacao2 -0.09840 NA -0.0324
## educacao3 -0.15636 NA 0.1954
## educacao4 -0.03069 NA 0.0682
## escolaridadeResponsável 0.03966 NA 0.1760
## atividadeResponsável 0.38024 NA 0.0805
## sexoResponsável 0.18716 NA 0.0905
## NTrabalhadores -0.15334 NA 0.0732
## IdadeMediaDom 1.00000 NA 0.1151
## MediaEnergia NA 1 NA
## MediaRendaPessoa 0.11508 NA 1.0000
#library(lattice)
#splom(dados, pch = 20, col = "black", xlab = "")
#acpcor <- prcomp(dados, scale = TRUE)
#summary(acpcor)
#plot(1:ncol(dados), acpcor$sdev^2, type = "b", xlab = "Componente", ylab = "Variância", pch = 20, cex.axis = 1.3, cex.lab = 1.3)
#acpcor$rotation[, 1:4]
#print(acpcor$sdev[1:2] * t(acpcor$rotation[, 1:2]), digits = 3)