library(xlsx)
library(dplyr)
library(DT)
dados1 = read.xlsx2("Dados.xls", sheetIndex = 2, colClasses=NA)
dados1$Número.do.domicílio = NULL
dados1$Endereço.do.domicílio..CDL. = NULL
dados1$Nro.da.origem.da.viagem = NULL
dados1$Endereço.de.destino.da.viagem..CDL. = NULL
dados1$Endereço.da.origem.da.viagem..CDL. = NULL
dados1$Horario.de.saída = NULL
dados1$Nro.do.destino.da.viagem = NULL
sexo = unique(dados1$Sexo)
domicilios = unique(dados1$Código.do.domicílio)
unique(dados1$Motivo.da.viagem)
## [1] 9 1 2 3 7 4 8 5 6

Realiza a transformação de dados de sexo e escolaridade em percentual de Mulheres e Estudantes na residência

dados1$ratio = 0
dados1$ratio2 = 0
dados1$estudantes = 0
dados1$Nestudantes = 0
for (domicilio in domicilios) {
  #print(domicilio)
  #domicilio = 1489
  temp = dados1[dados1$Código.do.domicílio == domicilio,]
  situacaoamiliarUm = temp[temp$Situação.familiar.da.pessoa ==1, ]
  situacaoamiliarUm = situacaoamiliarUm[1,]
  trabalho = temp[temp$Motivo.da.viagem ==2, c("Motivo.da.viagem")]
  educacao = temp[temp$Motivo.da.viagem ==3, c("Motivo.da.viagem")]
  educacaoNa = temp[temp$Grau.de.instrução ==1, c("Grau.de.instrução")]
  educacao1 = temp[temp$Grau.de.instrução ==2 | temp$Grau.de.instrução ==3 | temp$Grau.de.instrução ==4, c("Grau.de.instrução")]
  educacao2 = temp[temp$Grau.de.instrução ==5 | temp$Grau.de.instrução ==6, c("Grau.de.instrução")]
  educacao3 = temp[temp$Grau.de.instrução ==7 | temp$Grau.de.instrução ==8, c("Grau.de.instrução")]
  educacao4 = temp[temp$Grau.de.instrução ==9 | temp$Grau.de.instrução ==10, c("Grau.de.instrução")]
  
  rows = unique(temp$Código.do.domicílio)
  temp = temp[!duplicated(temp$Pessoa), ]
  temp1 = temp %>% group_by(Pessoa, Sexo)
  dados1[dados1$Código.do.domicílio == domicilio, c("trabalho")] = length(trabalho)
  dados1[dados1$Código.do.domicílio == domicilio, c("educacao")] = length(educacao)
  dados1[dados1$Código.do.domicílio == domicilio, c("compulsorias")] = length(educacao) + length(trabalho)
  dados1[dados1$Código.do.domicílio == domicilio, c("educacaoNa")] = length(educacaoNa)
  dados1[dados1$Código.do.domicílio == domicilio, c("educacao1")] = length(educacao1)
  dados1[dados1$Código.do.domicílio == domicilio, c("educacao2")] = length(educacao2)
  dados1[dados1$Código.do.domicílio == domicilio, c("educacao3")] = length(educacao3)
  dados1[dados1$Código.do.domicílio == domicilio, c("educacao4")] = length(educacao4)
  dados1[dados1$Código.do.domicílio == domicilio, c("atividadeResponsável")] = ifelse(!is.na(situacaoamiliarUm$Situação.familiar.da.pessoa),    situacaoamiliarUm$Atividade.principal, 0)
  dados1[dados1$Código.do.domicílio == domicilio, c("escolaridadeResponsável")] = ifelse(!is.na(situacaoamiliarUm$Situação.familiar.da.pessoa), situacaoamiliarUm$Grau.de.instrução, 0)
  dados1[dados1$Código.do.domicílio == domicilio, c("sexoResponsável")] = ifelse(!is.na(situacaoamiliarUm$Situação.familiar.da.pessoa), situacaoamiliarUm$Sexo, 0)
  dados1[dados1$Código.do.domicílio == domicilio, c("ratio")] = (tryCatch(sum(temp1[temp1$Sexo==1,c("Sexo")]), error = function(e) 0))
  dados1[dados1$Código.do.domicílio == domicilio, c("ratio2")] = length(temp1$Sexo) - (tryCatch(sum(temp1[temp1$Sexo==1,c("Sexo")]), error = function(e) 0))
  
  temp2 = temp %>% group_by(Pessoa)
  dados1[dados1$Código.do.domicílio == domicilio, c("estudantes")] = tryCatch(dim(temp2[temp2$Estuda.atualmente!=1,c("Estuda.atualmente")])[1], error = function(e) 0)
  dados1[dados1$Código.do.domicílio == domicilio, c("Nestudantes")] = tryCatch(dim(temp2[temp2$Estuda.atualmente==1,c("Estuda.atualmente")])[1], error = function(e) 0)
  dados1[dados1$Código.do.domicílio == domicilio, c("Trabalhadores")] = tryCatch(dim(temp2[temp2$Atividade.principal ==2 | temp2$Atividade.principal ==3 | temp2$Atividade.principal ==4 | temp2$Atividade.principal ==5 | temp2$Atividade.principal ==6,])[1], error = function(e) 0)
  
  #dados1[dados1$Código.do.domicílio == domicilio, c("estudantes")] = tryCatch(length(temp2[temp2$Estuda.atualmente!=1,c("Estuda.atualmente")]), error = function(e) 0)
  #dados1[dados1$Código.do.domicílio == domicilio, c("Nestudantes")] = tryCatch(length(temp2[temp2$Estuda.atualmente==1,c("Estuda.atualmente")]), error = function(e) 0)
                                                                        #/length(temp$Estuda.atualmente))
}

Faz o resumo dos dados

glimpse(dados1)
## Rows: 21,378
## Columns: 39
## $ Código.do.domicílio                  <dbl> 135, 135, 141, 141, 141, 141, ...
## $ Zona.de.Tráfego.do.domicílio         <dbl> 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, ...
## $ Tipo.de.moradia                      <dbl> 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, ...
## $ Nro.de.pessoas.no.domicílio          <dbl> 1, 1, 3, 3, 3, 3, 3, 3, 3, 3, ...
## $ Consumo.energia.elétrica.em.kW       <dbl> 0, 0, 229, 229, 229, 229, 229,...
## $ Consumo.energia.elétrica.em.R.       <dbl> 25, 25, 0, 0, 0, 0, 0, 0, 0, 0...
## $ Nro.de.automóveis                    <dbl> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ...
## $ Nro.de.motos                         <dbl> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ...
## $ Fator.de.expansão.para.domicílios    <dbl> 25.530, 25.530, 34.962, 34.962...
## $ Pessoa                               <dbl> 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, ...
## $ Situação.familiar.da.pessoa          <dbl> 1, 1, 1, 1, 1, 1, 6, 6, 6, 6, ...
## $ Idade                                <dbl> 73, 73, 32, 32, 32, 32, 32, 32...
## $ Sexo                                 <dbl> 1, 1, 2, 2, 2, 2, 2, 2, 2, 2, ...
## $ Estuda.atualmente                    <dbl> 1, 1, 6, 6, 6, 6, 1, 1, 1, 1, ...
## $ Grau.de.instrução                    <dbl> 8, 8, 7, 7, 7, 7, 6, 6, 6, 6, ...
## $ Atividade.principal                  <dbl> 7, 7, 1, 1, 1, 1, 1, 1, 1, 1, ...
## $ Rendimento.líquido.mensal            <dbl> 2000, 2000, 600, 600, 600, 600...
## $ Nro.da.viagem                        <dbl> 1, 2, 1, 2, 3, 4, 1, 2, 3, 4, ...
## $ Motivo.da.viagem                     <dbl> 9, 1, 2, 1, 3, 1, 2, 1, 2, 1, ...
## $ Zona.de.Tráfego.de.origem            <dbl> 4, 73, 4, 36, 4, 4304606, 4, 4...
## $ Zona.de.Tráfego.de.destino           <dbl> 73, 4, 36, 4, 4304606, 4, 4, 4...
## $ Modo.utilizado.na.viagem             <dbl> 3, 3, 3, 3, 3, 3, 1, 1, 1, 1, ...
## $ Fator.de.expansão.para.deslocamentos <dbl> 22.77250, 22.77250, 34.10893, ...
## $ ratio                                <dbl> 1, 1, 0, 0, 0, 0, 0, 0, 0, 0, ...
## $ ratio2                               <dbl> 0, 0, 3, 3, 3, 3, 3, 3, 3, 3, ...
## $ estudantes                           <dbl> 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, ...
## $ Nestudantes                          <dbl> 1, 1, 2, 2, 2, 2, 2, 2, 2, 2, ...
## $ trabalho                             <int> 0, 0, 4, 4, 4, 4, 4, 4, 4, 4, ...
## $ educacao                             <int> 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, ...
## $ compulsorias                         <int> 0, 0, 5, 5, 5, 5, 5, 5, 5, 5, ...
## $ educacaoNa                           <int> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ...
## $ educacao1                            <int> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ...
## $ educacao2                            <int> 0, 0, 6, 6, 6, 6, 6, 6, 6, 6, ...
## $ educacao3                            <int> 2, 2, 4, 4, 4, 4, 4, 4, 4, 4, ...
## $ educacao4                            <int> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ...
## $ atividadeResponsável                 <dbl> 7, 7, 1, 1, 1, 1, 1, 1, 1, 1, ...
## $ escolaridadeResponsável              <dbl> 8, 8, 7, 7, 7, 7, 7, 7, 7, 7, ...
## $ sexoResponsável                      <dbl> 1, 1, 2, 2, 2, 2, 2, 2, 2, 2, ...
## $ Trabalhadores                        <int> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ...

Verifica o DataFrame

DT::datatable(dados1, filter = 'top', options = list(
  language = list(url = '//cdn.datatables.net/plug-ins/1.10.11/i18n/Portuguese.json'),
  pageLength = 15, autoWidth = TRUE
))

Realiza-se a agregação dos dados

df = dados1 %>% 
  group_by(Código.do.domicílio, Zona.de.Tráfego.do.domicílio) %>% 
  summarise(Viagens =  n(), TipoMoradia =  mean(Tipo.de.moradia, na.rm = TRUE), Rendimento =  sum(Rendimento.líquido.mensal, na.rm = TRUE), 
            NFamilia =  mean(Nro.de.pessoas.no.domicílio, na.rm = TRUE), Energia = mean(Consumo.energia.elétrica.em.kW, na.rm = TRUE), 
            Energia2 = mean(Consumo.energia.elétrica.em.R., na.rm = TRUE), Veiculos = mean(Nro.de.automóveis, na.rm = TRUE), 
            Motos = mean(Nro.de.motos, na.rm = TRUE), NMulheres = mean(ratio, na.rm = TRUE), NHomens = mean(ratio2, na.rm = TRUE), NEstudantes = mean(estudantes, na.rm = TRUE), NnEstudantes = mean(Nestudantes, na.rm = TRUE), educacao = mean(educacao, na.rm = TRUE), trabalho = mean(trabalho, na.rm = TRUE), compulsorias = mean(compulsorias, na.rm = TRUE), educacaoNa = mean(educacaoNa, na.rm = TRUE), educacao1 = mean(educacao1, na.rm = TRUE), educacao2 = mean(educacao2, na.rm = TRUE), educacao3 = mean(educacao3, na.rm = TRUE), educacao4 = mean(educacao4, na.rm = TRUE), escolaridadeResponsável = mean(escolaridadeResponsável, na.rm = TRUE), atividadeResponsável = mean(atividadeResponsável, na.rm = TRUE), sexoResponsável = mean(sexoResponsável, na.rm = TRUE), NTrabalhadores = mean(Trabalhadores, na.rm = TRUE), IdadeMediaDom = mean(Idade, na.rm = TRUE))

Tabela Final dos dados

DT::datatable(df, filter = 'top', options = list(
  language = list(url = '//cdn.datatables.net/plug-ins/1.10.11/i18n/Portuguese.json'),
  pageLength = 15, autoWidth = TRUE
))

Semariza-se os dados

glimpse(df)
## Rows: 4,169
## Columns: 27
## Groups: Código.do.domicílio [4,169]
## $ Código.do.domicílio          <dbl> 135, 141, 142, 149, 151, 152, 162, 176...
## $ Zona.de.Tráfego.do.domicílio <dbl> 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4,...
## $ Viagens                      <int> 2, 10, 7, 3, 2, 10, 2, 14, 2, 8, 2, 3,...
## $ TipoMoradia                  <dbl> 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4,...
## $ Rendimento                   <dbl> 4000, 5300, 25000, 720, 0, 40000, 0, 1...
## $ NFamilia                     <dbl> 1, 3, 2, 2, 1, 4, 1, 3, 3, 2, 1, 1, 1,...
## $ Energia                      <dbl> 0, 229, 0, 0, 90, 0, 0, 0, 0, 220, 0, ...
## $ Energia2                     <dbl> 25, 0, 50, 58, 0, 100, 80, 90, 39, 0, ...
## $ Veiculos                     <dbl> 0, 0, 0, 0, 1, 1, 0, 0, 0, 0, 0, 0, 0,...
## $ Motos                        <dbl> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,...
## $ NMulheres                    <dbl> 1, 0, 0, 0, 1, 2, 0, 1, 0, 1, 1, 0, 1,...
## $ NHomens                      <dbl> 0, 3, 2, 1, 0, 1, 1, 2, 1, 1, 0, 1, 0,...
## $ NEstudantes                  <dbl> 0, 1, 0, 0, 0, 0, 0, 2, 0, 0, 0, 1, 1,...
## $ NnEstudantes                 <dbl> 1, 2, 2, 1, 1, 3, 1, 1, 1, 2, 1, 0, 0,...
## $ educacao                     <dbl> 0, 1, 0, 0, 0, 1, 0, 1, 0, 0, 0, 1, 1,...
## $ trabalho                     <dbl> 0, 4, 0, 0, 1, 4, 0, 0, 0, 4, 1, 1, 1,...
## $ compulsorias                 <dbl> 0, 5, 0, 0, 1, 5, 0, 1, 0, 4, 1, 2, 2,...
## $ educacaoNa                   <dbl> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,...
## $ educacao1                    <dbl> 0, 0, 0, 0, 0, 2, 0, 5, 0, 0, 0, 0, 0,...
## $ educacao2                    <dbl> 0, 6, 7, 3, 2, 4, 0, 0, 0, 0, 0, 0, 0,...
## $ educacao3                    <dbl> 2, 4, 0, 0, 0, 4, 2, 9, 2, 8, 2, 3, 3,...
## $ educacao4                    <dbl> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,...
## $ escolaridadeResponsável      <dbl> 8, 7, 6, 5, 6, 7, 8, 7, 7, 8, 7, 7, 7,...
## $ atividadeResponsável         <dbl> 7, 1, 7, 7, 1, 5, 7, 10, 7, 4, 1, 8, 1...
## $ sexoResponsável              <dbl> 1, 2, 2, 2, 1, 1, 2, 2, 2, 2, 1, 2, 1,...
## $ NTrabalhadores               <dbl> 0, 0, 0, 0, 0, 2, 0, 0, 0, 2, 0, 0, 0,...
## $ IdadeMediaDom                <dbl> 73.00000, 31.00000, 76.42857, 65.00000...

Obtém a média energia KW e R$ e o rendimento médio por morador

df$MediaEnergia = mean(df$Energia + df$Energia2)
df$MediaRendaPessoa = df$Rendimento/df$NFamilia

Procede-se com a regressão de todos valores

temp = df
temp$Código.do.domicílio = NULL; 
model <- lm(compulsorias ~ ., data = temp)
summary(model)
## 
## Call:
## lm(formula = compulsorias ~ ., data = temp)
## 
## Residuals:
##        Min         1Q     Median         3Q        Max 
## -1.879e-13 -3.400e-16  1.000e-17  3.300e-16  4.325e-13 
## 
## Coefficients: (2 not defined because of singularities)
##                                Estimate Std. Error    t value Pr(>|t|)    
## (Intercept)                   9.517e-15  8.588e-16  1.108e+01  < 2e-16 ***
## Zona.de.Tráfego.do.domicílio  1.001e-17  6.023e-18  1.662e+00  0.09662 .  
## Viagens                      -1.305e-16  3.793e-15 -3.400e-02  0.97255    
## TipoMoradia                  -5.766e-16  1.337e-16 -4.312e+00 1.66e-05 ***
## Rendimento                   -9.928e-20  4.626e-20 -2.146e+00  0.03194 *  
## NFamilia                     -1.275e-15  1.778e-16 -7.170e+00 8.86e-13 ***
## Energia                       2.312e-18  1.745e-18  1.325e+00  0.18523    
## Energia2                      2.514e-18  2.547e-18  9.870e-01  0.32377    
## Veiculos                     -6.627e-16  2.036e-16 -3.255e+00  0.00114 ** 
## Motos                        -1.595e-15  6.833e-16 -2.335e+00  0.01961 *  
## NMulheres                    -5.712e-16  3.208e-16 -1.780e+00  0.07511 .  
## NHomens                      -7.527e-16  2.986e-16 -2.520e+00  0.01176 *  
## NEstudantes                   2.458e-15  2.956e-16  8.317e+00  < 2e-16 ***
## NnEstudantes                         NA         NA         NA       NA    
## educacao                      1.000e+00  2.809e-16  3.560e+15  < 2e-16 ***
## trabalho                      1.000e+00  1.580e-16  6.330e+15  < 2e-16 ***
## educacaoNa                   -1.797e-16  3.810e-15 -4.700e-02  0.96239    
## educacao1                    -2.130e-16  3.792e-15 -5.600e-02  0.95520    
## educacao2                    -2.249e-16  3.792e-15 -5.900e-02  0.95272    
## educacao3                    -1.971e-16  3.793e-15 -5.200e-02  0.95856    
## educacao4                    -1.754e-16  3.796e-15 -4.600e-02  0.96315    
## escolaridadeResponsável       6.780e-17  7.547e-17  8.980e-01  0.36905    
## atividadeResponsável         -4.170e-17  5.132e-17 -8.130e-01  0.41655    
## sexoResponsável              -2.890e-16  3.036e-16 -9.520e-01  0.34115    
## NTrabalhadores               -1.116e-17  1.972e-16 -5.700e-02  0.95488    
## IdadeMediaDom                 2.756e-17  9.718e-18  2.836e+00  0.00459 ** 
## MediaEnergia                         NA         NA         NA       NA    
## MediaRendaPessoa              2.587e-19  1.090e-19  2.373e+00  0.01769 *  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 7.542e-15 on 4143 degrees of freedom
## Multiple R-squared:      1,  Adjusted R-squared:      1 
## F-statistic: 6.603e+30 on 25 and 4143 DF,  p-value: < 2.2e-16

Viagens Total

#### Variáveis: Zona.de.Tráfego.do.domicílio + TipoMoradia + Rendimento + NFamilia + Veiculos + Motos + Energia+ Zona.de.Tráfego.do.domicílio + NMulheres + NHomens + NEstudantes + NnEstudantes

model <- lm(Viagens ~ Zona.de.Tráfego.do.domicílio + TipoMoradia + Rendimento + NFamilia + Veiculos + Motos + Energia+ Zona.de.Tráfego.do.domicílio + NMulheres + NHomens  + NEstudantes +  NnEstudantes, data = df)
summary(model)#ok
## 
## Call:
## lm(formula = Viagens ~ Zona.de.Tráfego.do.domicílio + TipoMoradia + 
##     Rendimento + NFamilia + Veiculos + Motos + Energia + Zona.de.Tráfego.do.domicílio + 
##     NMulheres + NHomens + NEstudantes + NnEstudantes, data = df)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -6.6222 -0.8675 -0.3459  0.5954 16.3825 
## 
## Coefficients: (1 not defined because of singularities)
##                                Estimate Std. Error t value Pr(>|t|)    
## (Intercept)                  -1.575e-01  1.436e-01  -1.097  0.27284    
## Zona.de.Tráfego.do.domicílio -2.998e-03  1.311e-03  -2.286  0.02230 *  
## TipoMoradia                   8.007e-02  2.942e-02   2.722  0.00652 ** 
## Rendimento                    9.685e-05  4.770e-06  20.304  < 2e-16 ***
## NFamilia                     -1.327e-01  3.379e-02  -3.928 8.71e-05 ***
## Veiculos                      2.583e-01  4.101e-02   6.297 3.35e-10 ***
## Motos                         8.305e-02  1.514e-01   0.548  0.58340    
## Energia                       4.733e-04  3.668e-04   1.290  0.19700    
## NMulheres                     2.342e+00  5.083e-02  46.072  < 2e-16 ***
## NHomens                       2.325e+00  4.804e-02  48.394  < 2e-16 ***
## NEstudantes                   4.652e-01  4.090e-02  11.374  < 2e-16 ***
## NnEstudantes                         NA         NA      NA       NA    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 1.68 on 4158 degrees of freedom
## Multiple R-squared:  0.7396, Adjusted R-squared:  0.7389 
## F-statistic:  1181 on 10 and 4158 DF,  p-value: < 2.2e-16

#### Variáveis: Zona.de.Tráfego.do.domicílio + TipoMoradia + Rendimento + NFamilia + Veiculos + Motos + Energia+ Zona.de.Tráfego.do.domicílio + NMulheres + NHomens + NEstudantes + NnEstudantes + educacaoNa + educacao1 + educacao2 + educacao3 + educacao4 + escolaridadeResponsável + sexoResponsável + atividadeResponsável

model <- lm(Viagens ~ Zona.de.Tráfego.do.domicílio + TipoMoradia + Rendimento + NFamilia + Veiculos + Motos + Energia+ Zona.de.Tráfego.do.domicílio + NMulheres + NHomens  + NEstudantes +  NnEstudantes + educacaoNa + educacao1 + educacao2 + educacao3 + educacao4 + escolaridadeResponsável + sexoResponsável + atividadeResponsável, data = df)
summary(model)#ok
## 
## Call:
## lm(formula = Viagens ~ Zona.de.Tráfego.do.domicílio + TipoMoradia + 
##     Rendimento + NFamilia + Veiculos + Motos + Energia + Zona.de.Tráfego.do.domicílio + 
##     NMulheres + NHomens + NEstudantes + NnEstudantes + educacaoNa + 
##     educacao1 + educacao2 + educacao3 + educacao4 + escolaridadeResponsável + 
##     sexoResponsável + atividadeResponsável, data = df)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -0.01501 -0.00208 -0.00013  0.00158  1.98190 
## 
## Coefficients: (1 not defined because of singularities)
##                                Estimate Std. Error  t value Pr(>|t|)    
## (Intercept)                   4.224e-03  3.015e-03    1.401  0.16135    
## Zona.de.Tráfego.do.domicílio -3.387e-05  2.465e-05   -1.374  0.16955    
## TipoMoradia                  -1.619e-03  5.450e-04   -2.970  0.00299 ** 
## Rendimento                   -1.648e-08  9.264e-08   -0.178  0.85878    
## NFamilia                      1.144e-05  7.085e-04    0.016  0.98711    
## Veiculos                     -1.626e-03  8.147e-04   -1.996  0.04596 *  
## Motos                        -1.086e-03  2.792e-03   -0.389  0.69717    
## Energia                      -3.499e-06  6.763e-06   -0.517  0.60488    
## NMulheres                     2.333e-03  1.284e-03    1.817  0.06924 .  
## NHomens                       7.948e-04  1.198e-03    0.663  0.50706    
## NEstudantes                   6.330e-04  7.970e-04    0.794  0.42706    
## NnEstudantes                         NA         NA       NA       NA    
## educacaoNa                    9.992e-01  1.628e-03  613.605  < 2e-16 ***
## educacao1                     9.996e-01  4.067e-04 2457.899  < 2e-16 ***
## educacao2                     1.000e+00  3.444e-04 2903.515  < 2e-16 ***
## educacao3                     1.000e+00  3.059e-04 3269.385  < 2e-16 ***
## educacao4                     1.000e+00  7.257e-04 1378.404  < 2e-16 ***
## escolaridadeResponsável      -5.158e-04  3.056e-04   -1.688  0.09152 .  
## sexoResponsável               1.717e-03  1.230e-03    1.396  0.16285    
## atividadeResponsável          4.262e-04  1.859e-04    2.293  0.02188 *  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.03091 on 4150 degrees of freedom
## Multiple R-squared:  0.9999, Adjusted R-squared:  0.9999 
## F-statistic: 2.622e+06 on 18 and 4150 DF,  p-value: < 2.2e-16

#### Variáveis: Zona.de.Tráfego.do.domicílio + TipoMoradia + Rendimento + NFamilia + Veiculos + Motos + Energia+ Zona.de.Tráfego.do.domicílio + NMulheres + NHomens + NEstudantes + NnEstudantes + educacaoNa + educacao1 + educacao2 + educacao3 + educacao4

model <- lm(Viagens ~ Zona.de.Tráfego.do.domicílio + TipoMoradia + Rendimento + NFamilia + Veiculos + Motos + Energia+ Zona.de.Tráfego.do.domicílio + NMulheres + NHomens  + NEstudantes +  NnEstudantes + educacaoNa + educacao1 + educacao2 + educacao3 + educacao4, data = df)
summary(model)#ok
## 
## Call:
## lm(formula = Viagens ~ Zona.de.Tráfego.do.domicílio + TipoMoradia + 
##     Rendimento + NFamilia + Veiculos + Motos + Energia + Zona.de.Tráfego.do.domicílio + 
##     NMulheres + NHomens + NEstudantes + NnEstudantes + educacaoNa + 
##     educacao1 + educacao2 + educacao3 + educacao4, data = df)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -0.01491 -0.00180 -0.00014  0.00114  1.98673 
## 
## Coefficients: (1 not defined because of singularities)
##                                Estimate Std. Error  t value Pr(>|t|)    
## (Intercept)                   6.191e-03  2.653e-03    2.334  0.01965 *  
## Zona.de.Tráfego.do.domicílio -3.132e-05  2.459e-05   -1.274  0.20285    
## TipoMoradia                  -1.761e-03  5.435e-04   -3.239  0.00121 ** 
## Rendimento                   -1.395e-08  9.258e-08   -0.151  0.88022    
## NFamilia                     -3.504e-04  6.299e-04   -0.556  0.57802    
## Veiculos                     -1.884e-03  8.049e-04   -2.341  0.01929 *  
## Motos                        -1.198e-03  2.791e-03   -0.429  0.66775    
## Energia                      -3.469e-06  6.767e-06   -0.513  0.60822    
## NMulheres                     2.028e-03  1.172e-03    1.730  0.08369 .  
## NHomens                       1.198e-03  1.126e-03    1.064  0.28735    
## NEstudantes                   6.326e-04  7.940e-04    0.797  0.42561    
## NnEstudantes                         NA         NA       NA       NA    
## educacaoNa                    9.995e-01  1.617e-03  618.014  < 2e-16 ***
## educacao1                     9.998e-01  3.920e-04 2550.156  < 2e-16 ***
## educacao2                     1.000e+00  3.433e-04 2913.351  < 2e-16 ***
## educacao3                     1.000e+00  3.024e-04 3307.394  < 2e-16 ***
## educacao4                     1.000e+00  7.155e-04 1397.749  < 2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.03093 on 4153 degrees of freedom
## Multiple R-squared:  0.9999, Adjusted R-squared:  0.9999 
## F-statistic: 3.141e+06 on 15 and 4153 DF,  p-value: < 2.2e-16

Viagens Compulsórias

Variáveis: TipoMoradia + MediaRendaPessoa + + Rendimento + NFamilia + Veiculos + Motos + Energia+ Zona.de.Tráfego.do.domicílio + NMulheres + NHomens + NEstudantes + NnEstudantes

model <- lm(compulsorias ~ Zona.de.Tráfego.do.domicílio + TipoMoradia + MediaRendaPessoa + + Rendimento + NFamilia + Veiculos + Motos + Energia+ Zona.de.Tráfego.do.domicílio + NMulheres + NHomens  + NEstudantes +  NnEstudantes, data = df)
summary(model)#ok
## 
## Call:
## lm(formula = compulsorias ~ Zona.de.Tráfego.do.domicílio + TipoMoradia + 
##     MediaRendaPessoa + +Rendimento + NFamilia + Veiculos + Motos + 
##     Energia + Zona.de.Tráfego.do.domicílio + NMulheres + NHomens + 
##     NEstudantes + NnEstudantes, data = df)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -5.1709 -0.5895 -0.0634  0.5390  8.2290 
## 
## Coefficients: (1 not defined because of singularities)
##                                Estimate Std. Error t value Pr(>|t|)    
## (Intercept)                  -1.963e-01  8.428e-02  -2.329  0.01993 *  
## Zona.de.Tráfego.do.domicílio -2.153e-03  7.584e-04  -2.838  0.00456 ** 
## TipoMoradia                   2.420e-02  1.701e-02   1.423  0.15487    
## MediaRendaPessoa             -1.274e-06  1.398e-05  -0.091  0.92740    
## Rendimento                    2.876e-05  5.835e-06   4.928 8.63e-07 ***
## NFamilia                      2.613e-02  2.002e-02   1.305  0.19190    
## Veiculos                      1.323e-01  2.371e-02   5.578 2.59e-08 ***
## Motos                         2.528e-01  8.756e-02   2.887  0.00391 ** 
## Energia                      -8.866e-05  2.121e-04  -0.418  0.67598    
## NMulheres                     6.786e-01  2.940e-02  23.079  < 2e-16 ***
## NHomens                       5.886e-01  2.780e-02  21.173  < 2e-16 ***
## NEstudantes                   5.647e-01  2.365e-02  23.879  < 2e-16 ***
## NnEstudantes                         NA         NA      NA       NA    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.9717 on 4157 degrees of freedom
## Multiple R-squared:  0.5819, Adjusted R-squared:  0.5808 
## F-statistic:   526 on 11 and 4157 DF,  p-value: < 2.2e-16

Variáveis: Zona.de.Tráfego.do.domicílio + TipoMoradia + MediaRendaPessoa + + Rendimento + NFamilia + Veiculos + Motos + Energia+ Zona.de.Tráfego.do.domicílio + NMulheres + NHomens + NEstudantes + NnEstudantes + educacaoNa + educacao1 + educacao2 + educacao3 + educacao4

model <- lm(compulsorias ~ Zona.de.Tráfego.do.domicílio + TipoMoradia + MediaRendaPessoa + + Rendimento + NFamilia + Veiculos + Motos + Energia+ Zona.de.Tráfego.do.domicílio + NMulheres + NHomens  + NEstudantes +  NnEstudantes + 
    educacaoNa + educacao1 + educacao2 + educacao3 + educacao4, data = df)
summary(model)#ok
## 
## Call:
## lm(formula = compulsorias ~ Zona.de.Tráfego.do.domicílio + TipoMoradia + 
##     MediaRendaPessoa + +Rendimento + NFamilia + Veiculos + Motos + 
##     Energia + Zona.de.Tráfego.do.domicílio + NMulheres + NHomens + 
##     NEstudantes + NnEstudantes + educacaoNa + educacao1 + educacao2 + 
##     educacao3 + educacao4, data = df)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -6.2778 -0.5354  0.0118  0.5585  4.9232 
## 
## Coefficients: (1 not defined because of singularities)
##                                Estimate Std. Error t value Pr(>|t|)    
## (Intercept)                  -2.384e-01  7.716e-02  -3.089  0.00202 ** 
## Zona.de.Tráfego.do.domicílio  2.412e-04  7.049e-04   0.342  0.73220    
## TipoMoradia                  -5.019e-03  1.558e-02  -0.322  0.74733    
## MediaRendaPessoa              1.307e-05  1.278e-05   1.023  0.30655    
## Rendimento                    7.726e-07  5.430e-06   0.142  0.88686    
## NFamilia                      9.122e-02  1.851e-02   4.928 8.61e-07 ***
## Veiculos                     -2.078e-02  2.307e-02  -0.900  0.36795    
## Motos                         2.337e-01  8.000e-02   2.922  0.00350 ** 
## Energia                      -2.398e-04  1.940e-04  -1.236  0.21640    
## NMulheres                     2.444e-01  3.359e-02   7.275 4.13e-13 ***
## NHomens                       1.609e-01  3.228e-02   4.985 6.46e-07 ***
## NEstudantes                   4.490e-01  2.276e-02  19.724  < 2e-16 ***
## NnEstudantes                         NA         NA      NA       NA    
## educacaoNa                    4.042e-02  4.635e-02   0.872  0.38327    
## educacao1                     1.126e-01  1.124e-02  10.023  < 2e-16 ***
## educacao2                     1.906e-01  9.838e-03  19.373  < 2e-16 ***
## educacao3                     2.337e-01  8.673e-03  26.946  < 2e-16 ***
## educacao4                     2.822e-01  2.052e-02  13.748  < 2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.8865 on 4152 degrees of freedom
## Multiple R-squared:  0.6525, Adjusted R-squared:  0.6511 
## F-statistic: 487.2 on 16 and 4152 DF,  p-value: < 2.2e-16

Variáveis: Zona.de.Tráfego.do.domicílio + TipoMoradia + MediaRendaPessoa + + Rendimento + NFamilia + Veiculos + Motos + Energia+ Zona.de.Tráfego.do.domicílio + NMulheres + NHomens + NEstudantes + NnEstudantes + educacaoNa + educacao1 + educacao2 + educacao3 + educacao4 + escolaridadeResponsável + sexoResponsável + atividadeResponsável

model <- lm(compulsorias ~ Zona.de.Tráfego.do.domicílio + TipoMoradia + MediaRendaPessoa + + Rendimento + NFamilia + Veiculos + Motos + Energia+ Zona.de.Tráfego.do.domicílio + NMulheres + NHomens  + NEstudantes +  NnEstudantes + 
    educacaoNa + educacao1 + educacao2 + educacao3 + educacao4 + escolaridadeResponsável + sexoResponsável + atividadeResponsável + NTrabalhadores, data = df)

model <- lm(compulsorias ~  NFamilia + Veiculos + NMulheres + NHomens  + NEstudantes +  
    educacaoNa + educacao1 + educacao2 + educacao3 + educacao4  + sexoResponsável + atividadeResponsável + NTrabalhadores + IdadeMediaDom, data = df)
summary(model)
## 
## Call:
## lm(formula = compulsorias ~ NFamilia + Veiculos + NMulheres + 
##     NHomens + NEstudantes + educacaoNa + educacao1 + educacao2 + 
##     educacao3 + educacao4 + sexoResponsável + atividadeResponsável + 
##     NTrabalhadores + IdadeMediaDom, data = df)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -6.2813 -0.4323  0.0502  0.4259  4.6884 
## 
## Coefficients:
##                        Estimate Std. Error t value Pr(>|t|)    
## (Intercept)           0.3979079  0.0599237   6.640 3.54e-11 ***
## NFamilia              0.0420748  0.0176985   2.377 0.017484 *  
## Veiculos             -0.0272773  0.0205721  -1.326 0.184934    
## NMulheres             0.2451196  0.0310802   7.887 3.94e-15 ***
## NHomens               0.1194070  0.0311006   3.839 0.000125 ***
## NEstudantes           0.3571688  0.0228943  15.601  < 2e-16 ***
## educacaoNa            0.0349221  0.0418207   0.835 0.403741    
## educacao1             0.1292486  0.0099242  13.024  < 2e-16 ***
## educacao2             0.1863920  0.0087077  21.406  < 2e-16 ***
## educacao3             0.2272537  0.0074690  30.426  < 2e-16 ***
## educacao4             0.2409423  0.0183828  13.107  < 2e-16 ***
## sexoResponsável       0.2103456  0.0253481   8.298  < 2e-16 ***
## atividadeResponsável -0.0853699  0.0051723 -16.505  < 2e-16 ***
## NTrabalhadores        0.2800357  0.0200481  13.968  < 2e-16 ***
## IdadeMediaDom        -0.0119573  0.0009995 -11.964  < 2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.8011 on 4154 degrees of freedom
## Multiple R-squared:  0.7161, Adjusted R-squared:  0.7151 
## F-statistic: 748.3 on 14 and 4154 DF,  p-value: < 2.2e-16

Variáveis: TipoMoradia + NFamilia + Veiculos + Motos + Energia+ Zona.de.Tráfego.do.domicílio + NMulheres + NHomens + NEstudantes + NnEstudantes

model <- lm(compulsorias ~ TipoMoradia +  NFamilia + Veiculos + Motos + Energia+ Zona.de.Tráfego.do.domicílio + NMulheres + NHomens  + NEstudantes +  NnEstudantes, data = df)
summary(model)
## 
## Call:
## lm(formula = compulsorias ~ TipoMoradia + NFamilia + Veiculos + 
##     Motos + Energia + Zona.de.Tráfego.do.domicílio + NMulheres + 
##     NHomens + NEstudantes + NnEstudantes, data = df)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -5.3262 -0.5882 -0.0598  0.5486  8.1157 
## 
## Coefficients: (1 not defined because of singularities)
##                                Estimate Std. Error t value Pr(>|t|)    
## (Intercept)                  -0.1939406  0.0840816  -2.307 0.021127 *  
## TipoMoradia                   0.0278584  0.0172158   1.618 0.105699    
## NFamilia                      0.0191811  0.0197644   0.970 0.331861    
## Veiculos                      0.1740945  0.0236482   7.362 2.17e-13 ***
## Motos                         0.2427173  0.0886330   2.738 0.006199 ** 
## Energia                       0.0000555  0.0002142   0.259 0.795614    
## Zona.de.Tráfego.do.domicílio -0.0025437  0.0007666  -3.318 0.000914 ***
## NMulheres                     0.7060983  0.0296297  23.831  < 2e-16 ***
## NHomens                       0.6177526  0.0279735  22.084  < 2e-16 ***
## NEstudantes                   0.5519725  0.0239055  23.090  < 2e-16 ***
## NnEstudantes                         NA         NA      NA       NA    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.9837 on 4159 degrees of freedom
## Multiple R-squared:  0.5714, Adjusted R-squared:  0.5704 
## F-statistic:   616 on 9 and 4159 DF,  p-value: < 2.2e-16

Variáveis: TipoMoradia + Rendimento + NFamilia + Veiculos + Motos + Zona.de.Tráfego.do.domicílio

model <- lm(Viagens ~ TipoMoradia + Rendimento + NFamilia + Veiculos + Motos + Zona.de.Tráfego.do.domicílio, data = df)
summary(model)
## 
## Call:
## lm(formula = Viagens ~ TipoMoradia + Rendimento + NFamilia + 
##     Veiculos + Motos + Zona.de.Tráfego.do.domicílio, data = df)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -9.1506 -1.3600 -0.2227  1.0735 19.1598 
## 
## Coefficients:
##                                Estimate Std. Error t value Pr(>|t|)    
## (Intercept)                  -3.806e-01  2.035e-01  -1.871  0.06146 .  
## TipoMoradia                   3.045e-01  4.161e-02   7.317 3.03e-13 ***
## Rendimento                    1.245e-04  6.746e-06  18.457  < 2e-16 ***
## NFamilia                      1.536e+00  3.153e-02  48.706  < 2e-16 ***
## Veiculos                      5.297e-01  5.734e-02   9.238  < 2e-16 ***
## Motos                         2.978e-01  2.154e-01   1.383  0.16684    
## Zona.de.Tráfego.do.domicílio -6.018e-03  1.868e-03  -3.223  0.00128 ** 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 2.396 on 4162 degrees of freedom
## Multiple R-squared:  0.4699, Adjusted R-squared:  0.4691 
## F-statistic: 614.9 on 6 and 4162 DF,  p-value: < 2.2e-16

Variáveis: TipoMoradia + Rendimento + NFamilia + Veiculos + Motos + Energia

model <- lm(Viagens ~ TipoMoradia + Rendimento + NFamilia + Veiculos + Motos + Energia, data = df)
summary(model)
## 
## Call:
## lm(formula = Viagens ~ TipoMoradia + Rendimento + NFamilia + 
##     Veiculos + Motos + Energia, data = df)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -9.7960 -1.3334 -0.2241  1.0711 19.1851 
## 
## Coefficients:
##               Estimate Std. Error t value Pr(>|t|)    
## (Intercept) -6.796e-01  1.806e-01  -3.764 0.000170 ***
## TipoMoradia  3.481e-01  3.931e-02   8.855  < 2e-16 ***
## Rendimento   1.240e-04  6.753e-06  18.367  < 2e-16 ***
## NFamilia     1.511e+00  3.118e-02  48.480  < 2e-16 ***
## Veiculos     4.961e-01  5.763e-02   8.608  < 2e-16 ***
## Motos        2.816e-01  2.154e-01   1.307 0.191123    
## Energia      1.749e-03  5.222e-04   3.350 0.000816 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 2.396 on 4162 degrees of freedom
## Multiple R-squared:   0.47,  Adjusted R-squared:  0.4692 
## F-statistic: 615.1 on 6 and 4162 DF,  p-value: < 2.2e-16

Variáveis: TipoMoradia + Rendimento + NFamilia + Veiculos + Motos + Energia+ Zona.de.Tráfego.do.domicílio + NMulheres + NEstudantes

model <- lm(Viagens ~ TipoMoradia + Rendimento + NFamilia + Veiculos + Motos + Energia+ Zona.de.Tráfego.do.domicílio + NMulheres + NEstudantes, data = df)
summary(model)
## 
## Call:
## lm(formula = Viagens ~ TipoMoradia + Rendimento + NFamilia + 
##     Veiculos + Motos + Energia + Zona.de.Tráfego.do.domicílio + 
##     NMulheres + NEstudantes, data = df)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -6.5505 -1.2226 -0.1689  0.9290 17.6421 
## 
## Coefficients:
##                                Estimate Std. Error t value Pr(>|t|)    
## (Intercept)                   1.723e-01  1.794e-01   0.961   0.3368    
## TipoMoradia                   2.495e-01  3.651e-02   6.833 9.50e-12 ***
## Rendimento                    1.204e-04  5.932e-06  20.298  < 2e-16 ***
## NFamilia                      7.752e-01  3.513e-02  22.067  < 2e-16 ***
## Veiculos                      4.166e-01  5.111e-02   8.151 4.72e-16 ***
## Motos                         9.837e-02  1.893e-01   0.520   0.6034    
## Energia                       1.102e-03  4.583e-04   2.406   0.0162 *  
## Zona.de.Tráfego.do.domicílio -3.321e-03  1.639e-03  -2.026   0.0428 *  
## NMulheres                     8.083e-01  4.969e-02  16.269  < 2e-16 ***
## NEstudantes                   1.280e+00  4.659e-02  27.483  < 2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 2.101 on 4159 degrees of freedom
## Multiple R-squared:  0.5929, Adjusted R-squared:  0.592 
## F-statistic: 672.9 on 9 and 4159 DF,  p-value: < 2.2e-16

Variáveis: TipoMoradia + Rendimento + NFamilia + Veiculos + Motos + Energia2

model <- lm(Viagens ~ TipoMoradia + Rendimento + NFamilia + Veiculos + Motos + Energia2, data = df)
summary(model)
## 
## Call:
## lm(formula = Viagens ~ TipoMoradia + Rendimento + NFamilia + 
##     Veiculos + Motos + Energia2, data = df)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -9.1158 -1.3264 -0.2321  1.0754 19.2098 
## 
## Coefficients:
##               Estimate Std. Error t value Pr(>|t|)    
## (Intercept) -7.307e-01  1.836e-01  -3.980    7e-05 ***
## TipoMoradia  3.503e-01  3.937e-02   8.899   <2e-16 ***
## Rendimento   1.250e-04  6.755e-06  18.509   <2e-16 ***
## NFamilia     1.510e+00  3.169e-02  47.653   <2e-16 ***
## Veiculos     5.023e-01  5.834e-02   8.609   <2e-16 ***
## Motos        2.982e-01  2.156e-01   1.383    0.167    
## Energia2     1.141e-03  7.588e-04   1.503    0.133    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 2.399 on 4162 degrees of freedom
## Multiple R-squared:  0.4689, Adjusted R-squared:  0.4681 
## F-statistic: 612.3 on 6 and 4162 DF,  p-value: < 2.2e-16

Variáveis: TipoMoradia + Rendimento + NFamilia + Veiculos + Motos + MediaEnergia

model <- lm(Viagens ~ TipoMoradia + Rendimento + NFamilia + Veiculos + Motos + MediaEnergia, data = df)
summary(model)
## 
## Call:
## lm(formula = Viagens ~ TipoMoradia + Rendimento + NFamilia + 
##     Veiculos + Motos + MediaEnergia, data = df)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -9.0332 -1.3061 -0.2302  1.0802 19.0845 
## 
## Coefficients: (1 not defined because of singularities)
##                Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  -6.826e-01  1.808e-01  -3.776 0.000162 ***
## TipoMoradia   3.485e-01  3.936e-02   8.854  < 2e-16 ***
## Rendimento    1.256e-04  6.744e-06  18.631  < 2e-16 ***
## NFamilia      1.519e+00  3.113e-02  48.793  < 2e-16 ***
## Veiculos      5.188e-01  5.730e-02   9.053  < 2e-16 ***
## Motos         2.928e-01  2.156e-01   1.358 0.174591    
## MediaEnergia         NA         NA      NA       NA    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 2.399 on 4163 degrees of freedom
## Multiple R-squared:  0.4686, Adjusted R-squared:  0.4679 
## F-statistic: 734.1 on 5 and 4163 DF,  p-value: < 2.2e-16
dados = df[, -(1:4)]
summary(dados)
##    Rendimento        NFamilia         Energia          Energia2      
##  Min.   :     0   Min.   : 1.000   Min.   :  0.00   Min.   :   0.00  
##  1st Qu.:     0   1st Qu.: 2.000   1st Qu.:  0.00   1st Qu.:  40.00  
##  Median :     0   Median : 2.000   Median :  0.00   Median :  60.00  
##  Mean   :  2265   Mean   : 2.592   Mean   : 20.83   Mean   :  66.76  
##  3rd Qu.:  2490   3rd Qu.: 3.000   3rd Qu.:  0.00   3rd Qu.:  90.00  
##  Max.   :106000   Max.   :10.000   Max.   :801.00   Max.   :1200.00  
##     Veiculos          Motos           NMulheres         NHomens     
##  Min.   :0.0000   Min.   :0.00000   Min.   :0.0000   Min.   :0.000  
##  1st Qu.:0.0000   1st Qu.:0.00000   1st Qu.:0.0000   1st Qu.:1.000  
##  Median :1.0000   Median :0.00000   Median :1.0000   Median :1.000  
##  Mean   :0.6337   Mean   :0.02567   Mean   :0.9686   Mean   :1.067  
##  3rd Qu.:1.0000   3rd Qu.:0.00000   3rd Qu.:1.0000   3rd Qu.:1.000  
##  Max.   :5.0000   Max.   :3.00000   Max.   :6.0000   Max.   :6.000  
##   NEstudantes     NnEstudantes      educacao         trabalho    
##  Min.   :0.000   Min.   :0.000   Min.   :0.0000   Min.   :0.000  
##  1st Qu.:0.000   1st Qu.:1.000   1st Qu.:0.0000   1st Qu.:0.000  
##  Median :0.000   Median :1.000   Median :0.0000   Median :1.000  
##  Mean   :0.633   Mean   :1.402   Mean   :0.5512   Mean   :1.133  
##  3rd Qu.:1.000   3rd Qu.:2.000   3rd Qu.:1.0000   3rd Qu.:2.000  
##  Max.   :5.000   Max.   :5.000   Max.   :6.0000   Max.   :8.000  
##   compulsorias      educacaoNa        educacao1         educacao2     
##  Min.   : 0.000   Min.   :0.00000   Min.   : 0.0000   Min.   : 0.000  
##  1st Qu.: 1.000   1st Qu.:0.00000   1st Qu.: 0.0000   1st Qu.: 0.000  
##  Median : 1.000   Median :0.00000   Median : 0.0000   Median : 2.000  
##  Mean   : 1.685   Mean   :0.02662   Mean   : 0.9635   Mean   : 1.873  
##  3rd Qu.: 2.000   3rd Qu.:0.00000   3rd Qu.: 2.0000   3rd Qu.: 3.000  
##  Max.   :12.000   Max.   :8.00000   Max.   :20.0000   Max.   :16.000  
##    educacao3        educacao4       escolaridadeResponsável
##  Min.   : 0.000   Min.   : 0.0000   Min.   : 0.000         
##  1st Qu.: 0.000   1st Qu.: 0.0000   1st Qu.: 4.000         
##  Median : 2.000   Median : 0.0000   Median : 6.000         
##  Mean   : 2.141   Mean   : 0.1228   Mean   : 5.509         
##  3rd Qu.: 4.000   3rd Qu.: 0.0000   3rd Qu.: 8.000         
##  Max.   :25.000   Max.   :12.0000   Max.   :10.000         
##  atividadeResponsável sexoResponsável NTrabalhadores  IdadeMediaDom  
##  Min.   : 0.000       Min.   :0.000   Min.   :0.000   Min.   : 5.00  
##  1st Qu.: 1.000       1st Qu.:1.000   1st Qu.:0.000   1st Qu.:28.25  
##  Median : 4.000       Median :1.000   Median :0.000   Median :36.17  
##  Mean   : 3.634       Mean   :1.158   Mean   :0.573   Mean   :40.18  
##  3rd Qu.: 7.000       3rd Qu.:2.000   3rd Qu.:1.000   3rd Qu.:49.67  
##  Max.   :14.000       Max.   :2.000   Max.   :5.000   Max.   :91.00  
##   MediaEnergia   MediaRendaPessoa 
##  Min.   :87.59   Min.   :    0.0  
##  1st Qu.:87.59   1st Qu.:    0.0  
##  Median :87.59   Median :    0.0  
##  Mean   :87.59   Mean   :  992.8  
##  3rd Qu.:87.59   3rd Qu.: 1087.5  
##  Max.   :87.59   Max.   :35000.0
apply(dados, 2, sd)
##              Rendimento                NFamilia                 Energia 
##            5649.0331647               1.2848411              72.4734698 
##                Energia2                Veiculos                   Motos 
##              52.0740194               0.7026305               0.1726597 
##               NMulheres                 NHomens             NEstudantes 
##               0.8094457               0.8136701               0.8594203 
##            NnEstudantes                educacao                trabalho 
##               0.8102657               0.8533715               1.0996258 
##            compulsorias              educacaoNa               educacao1 
##               1.5008170               0.3035477               1.8150085 
##               educacao2               educacao3               educacao4 
##               2.2618782               2.7512772               0.7116930 
## escolaridadeResponsável    atividadeResponsável         sexoResponsável 
##               2.6548921               2.9669037               0.6377937 
##          NTrabalhadores           IdadeMediaDom            MediaEnergia 
##               0.7098176              15.8726528               0.0000000 
##        MediaRendaPessoa 
##            2337.7488513
matcor <- cor(dados)
print(matcor, digits = 3)
##                         Rendimento NFamilia  Energia Energia2 Veiculos    Motos
## Rendimento                 1.00000   0.0970  0.10601  0.11803  0.21166 -0.00515
## NFamilia                   0.09698   1.0000  0.12455  0.26811  0.32203  0.04824
## Energia                    0.10601   0.1246  1.00000 -0.21663  0.16554  0.02021
## Energia2                   0.11803   0.2681 -0.21663  1.00000  0.27507 -0.00270
## Veiculos                   0.21166   0.3220  0.16554  0.27507  1.00000  0.01422
## Motos                     -0.00515   0.0482  0.02021 -0.00270  0.01422  1.00000
## NMulheres                  0.10526   0.5483  0.09969  0.16852  0.28644  0.08131
## NHomens                    0.09694   0.4705  0.08636  0.14374  0.13338 -0.01731
## NEstudantes                0.05373   0.5553  0.09958  0.14567  0.16393  0.02145
## NnEstudantes               0.14551   0.4313  0.08069  0.15819  0.24621  0.04109
## educacao                   0.06780   0.5187  0.11304  0.13584  0.13072  0.00329
## trabalho                   0.23253   0.3791  0.07019  0.15973  0.28651  0.07927
## compulsorias               0.20892   0.5727  0.11570  0.19427  0.28425  0.05995
## educacaoNa                -0.00550   0.0758 -0.00982 -0.00960 -0.02963  0.05105
## educacao1                  0.03712   0.3871  0.05431 -0.00268 -0.01330  0.00375
## educacao2                  0.02330   0.3126 -0.00577  0.04550  0.00834  0.04029
## educacao3                  0.28557   0.2190  0.13067  0.21834  0.36746  0.00903
## educacao4                  0.10562   0.0380  0.06660  0.03733  0.12500 -0.01004
## escolaridadeResponsável    0.15532  -0.1723  0.03466  0.07577  0.17357 -0.00964
## atividadeResponsável       0.05102  -0.1767 -0.00330 -0.01790 -0.02235 -0.03226
## sexoResponsável            0.02906  -0.3087 -0.03533 -0.06453 -0.13297 -0.02149
## NTrabalhadores             0.16142   0.2780  0.07407  0.17222  0.30693  0.05028
## IdadeMediaDom              0.04617  -0.3232  0.00116 -0.03610 -0.04295 -0.06037
## MediaEnergia                    NA       NA       NA       NA       NA       NA
## MediaRendaPessoa           0.86735  -0.1028  0.06334  0.05023  0.12788 -0.01575
##                         NMulheres  NHomens NEstudantes NnEstudantes educacao
## Rendimento                0.10526  0.09694     0.05373       0.1455  0.06780
## NFamilia                  0.54827  0.47053     0.55525       0.4313  0.51871
## Energia                   0.09969  0.08636     0.09958       0.0807  0.11304
## Energia2                  0.16852  0.14374     0.14567       0.1582  0.13584
## Veiculos                  0.28644  0.13338     0.16393       0.2462  0.13072
## Motos                     0.08131 -0.01731     0.02145       0.0411  0.00329
## NMulheres                 1.00000 -0.13889     0.43833       0.3946  0.41062
## NHomens                  -0.13889  1.00000     0.43368       0.4055  0.39313
## NEstudantes               0.43833  0.43368     1.00000      -0.1873  0.85558
## NnEstudantes              0.39460  0.40546    -0.18727       1.0000 -0.10249
## educacao                  0.41062  0.39313     0.85558      -0.1025  1.00000
## trabalho                  0.36537  0.28744     0.21885       0.4215  0.16786
## compulsorias              0.50118  0.43414     0.64684       0.2506  0.69159
## educacaoNa                0.05418  0.04721     0.00528       0.0959 -0.00573
## educacao1                 0.24516  0.28660     0.34934       0.1622  0.35624
## educacao2                 0.27118  0.26324     0.13044       0.3969  0.15694
## educacao3                 0.26142  0.23125     0.38083       0.0894  0.35739
## educacao4                 0.02378  0.03930     0.03840       0.0225  0.02283
## escolaridadeResponsável   0.15659  0.02073     0.03870       0.1362  0.01741
## atividadeResponsável     -0.00668  0.00354    -0.05037       0.0503 -0.02890
## sexoResponsável          -0.25856  0.21877    -0.04941       0.0138 -0.05693
## NTrabalhadores            0.27521  0.20426     0.13677       0.3350  0.10780
## IdadeMediaDom            -0.24720 -0.14154    -0.48914       0.1297 -0.45333
## MediaEnergia                   NA       NA          NA           NA       NA
## MediaRendaPessoa         -0.01304 -0.01359    -0.05861       0.0355 -0.04125
##                         trabalho compulsorias educacaoNa educacao1 educacao2
## Rendimento                0.2325       0.2089  -0.005498   0.03712   0.02330
## NFamilia                  0.3791       0.5727   0.075811   0.38705   0.31259
## Energia                   0.0702       0.1157  -0.009818   0.05431  -0.00577
## Energia2                  0.1597       0.1943  -0.009595  -0.00268   0.04550
## Veiculos                  0.2865       0.2843  -0.029634  -0.01330   0.00834
## Motos                     0.0793       0.0600   0.051047   0.00375   0.04029
## NMulheres                 0.3654       0.5012   0.054182   0.24516   0.27118
## NHomens                   0.2874       0.4341   0.047208   0.28660   0.26324
## NEstudantes               0.2189       0.6468   0.005276   0.34934   0.13044
## NnEstudantes              0.4215       0.2506   0.095938   0.16219   0.39689
## educacao                  0.1679       0.6916  -0.005728   0.35624   0.15694
## trabalho                  1.0000       0.8281   0.019548   0.04307   0.24005
## compulsorias              0.8281       1.0000   0.011066   0.23412   0.26512
## educacaoNa                0.0195       0.0111   1.000000   0.01004  -0.02233
## educacao1                 0.0431       0.2341   0.010036   1.00000  -0.06734
## educacao2                 0.2401       0.2651  -0.022335  -0.06734   1.00000
## educacao3                 0.4046       0.4997  -0.025477  -0.13350  -0.27108
## educacao4                 0.1379       0.1140  -0.008476  -0.02328  -0.10404
## escolaridadeResponsável   0.1881       0.1477  -0.074859  -0.26313  -0.02905
## atividadeResponsável     -0.2357      -0.1891  -0.000912  -0.02489  -0.02629
## sexoResponsável          -0.0255      -0.0511  -0.010525  -0.06032   0.00189
## NTrabalhadores            0.4781       0.4116   0.029389   0.04658   0.09013
## IdadeMediaDom            -0.2763      -0.4602  -0.021962  -0.10619  -0.09840
## MediaEnergia                  NA           NA         NA        NA        NA
## MediaRendaPessoa          0.1294       0.0714  -0.018550  -0.04490  -0.03243
##                         educacao3 educacao4 escolaridadeResponsável
## Rendimento                0.28557  0.105623                 0.15532
## NFamilia                  0.21896  0.037955                -0.17225
## Energia                   0.13067  0.066603                 0.03466
## Energia2                  0.21834  0.037326                 0.07577
## Veiculos                  0.36746  0.125001                 0.17357
## Motos                     0.00903 -0.010037                -0.00964
## NMulheres                 0.26142  0.023776                 0.15659
## NHomens                   0.23125  0.039301                 0.02073
## NEstudantes               0.38083  0.038403                 0.03870
## NnEstudantes              0.08944  0.022486                 0.13620
## educacao                  0.35739  0.022825                 0.01741
## trabalho                  0.40464  0.137871                 0.18814
## compulsorias              0.49969  0.113995                 0.14775
## educacaoNa               -0.02548 -0.008476                -0.07486
## educacao1                -0.13350 -0.023279                -0.26313
## educacao2                -0.27108 -0.104037                -0.02905
## educacao3                 1.00000 -0.012539                 0.37614
## educacao4                -0.01254  1.000000                 0.14484
## escolaridadeResponsável   0.37614  0.144838                 1.00000
## atividadeResponsável      0.06112 -0.020548                 0.35309
## sexoResponsável           0.03311  0.000165                 0.58659
## NTrabalhadores            0.29208  0.129944                 0.19519
## IdadeMediaDom            -0.15636 -0.030690                 0.03966
## MediaEnergia                   NA        NA                      NA
## MediaRendaPessoa          0.19537  0.068236                 0.17599
##                         atividadeResponsável sexoResponsável NTrabalhadores
## Rendimento                          0.051018        0.029061         0.1614
## NFamilia                           -0.176675       -0.308665         0.2780
## Energia                            -0.003295       -0.035332         0.0741
## Energia2                           -0.017898       -0.064532         0.1722
## Veiculos                           -0.022351       -0.132966         0.3069
## Motos                              -0.032263       -0.021487         0.0503
## NMulheres                          -0.006682       -0.258557         0.2752
## NHomens                             0.003541        0.218765         0.2043
## NEstudantes                        -0.050369       -0.049411         0.1368
## NnEstudantes                        0.050304        0.013797         0.3350
## educacao                           -0.028898       -0.056929         0.1078
## trabalho                           -0.235678       -0.025528         0.4781
## compulsorias                       -0.189109       -0.051074         0.4116
## educacaoNa                         -0.000912       -0.010525         0.0294
## educacao1                          -0.024886       -0.060322         0.0466
## educacao2                          -0.026291        0.001890         0.0901
## educacao3                           0.061116        0.033113         0.2921
## educacao4                          -0.020548        0.000165         0.1299
## escolaridadeResponsável             0.353085        0.586591         0.1952
## atividadeResponsável                1.000000        0.457103        -0.0598
## sexoResponsável                     0.457103        1.000000        -0.0374
## NTrabalhadores                     -0.059776       -0.037355         1.0000
## IdadeMediaDom                       0.380236        0.187165        -0.1533
## MediaEnergia                              NA              NA             NA
## MediaRendaPessoa                    0.080523        0.090540         0.0732
##                         IdadeMediaDom MediaEnergia MediaRendaPessoa
## Rendimento                    0.04617           NA           0.8674
## NFamilia                     -0.32319           NA          -0.1028
## Energia                       0.00116           NA           0.0633
## Energia2                     -0.03610           NA           0.0502
## Veiculos                     -0.04295           NA           0.1279
## Motos                        -0.06037           NA          -0.0158
## NMulheres                    -0.24720           NA          -0.0130
## NHomens                      -0.14154           NA          -0.0136
## NEstudantes                  -0.48914           NA          -0.0586
## NnEstudantes                  0.12974           NA           0.0355
## educacao                     -0.45333           NA          -0.0412
## trabalho                     -0.27632           NA           0.1294
## compulsorias                 -0.46022           NA           0.0714
## educacaoNa                   -0.02196           NA          -0.0185
## educacao1                    -0.10619           NA          -0.0449
## educacao2                    -0.09840           NA          -0.0324
## educacao3                    -0.15636           NA           0.1954
## educacao4                    -0.03069           NA           0.0682
## escolaridadeResponsável       0.03966           NA           0.1760
## atividadeResponsável          0.38024           NA           0.0805
## sexoResponsável               0.18716           NA           0.0905
## NTrabalhadores               -0.15334           NA           0.0732
## IdadeMediaDom                 1.00000           NA           0.1151
## MediaEnergia                       NA            1               NA
## MediaRendaPessoa              0.11508           NA           1.0000
#library(lattice)
#splom(dados, pch = 20, col = "black", xlab = "")
#acpcor <- prcomp(dados, scale = TRUE) 
#summary(acpcor)
#plot(1:ncol(dados), acpcor$sdev^2, type = "b", xlab = "Componente",     ylab = "Variância", pch = 20, cex.axis = 1.3, cex.lab = 1.3)
#acpcor$rotation[, 1:4]
#print(acpcor$sdev[1:2] * t(acpcor$rotation[, 1:2]), digits = 3)