Análise de Dados com o Software R:
Métodos Estatísticos, Computacionais e Econométricos

Prof. Adriano Azevedo Filho (azevedofilho@usp.br)

Introdução

sumário geral | anterior | próximo

Conteúdo do Módulo

 1 - Considerações iniciais

 2 - Introdução ao software R na estatística e análise de dados
 
 3 - Explorando o site do R (livros, manuais, grupos)
 
 4 - Como baixar e instalar o R
 
 5 - Operações algébricas elementares no R

 6 - Descrição dos dados utilizados em outros módulos
 
    - Descrição do arquivo esalq2012.csv
 
    - Descrição do arquivo esalq2012mod.csv

1 - Considerações iniciais

O material apresentado aqui foi desenvolvido para apoio didático ao ensino de métodos estatísticos, computacionais e econométricos para análise de dados, utilizando o Software R.

No módulo, fazemos uma breve introdução ao R (em vídeo), uma exploração ao site do R (em vídeo) destacando recursos importantes para aprendizado e referência, procedimento de instalação (em vídeo) e operações algébricas elementares com o R. Num segundo momento, descrevemos os conjuntos de dados utilizados nos próximos módulos.

2 - Introdução ao software R na análise de dados

Veja o vídeo (11 min) clicando [aqui]

  • O que é o R?
  • Origem e evolução do R
  • R comparado a outros pacotes estatísticos

3 - Explorando o site do R (livros, manuais, grupos)

Veja o vídeo (12 min) clicando [aqui]

  • Vídeo explora o site oficial do R, destacando recursos importantes que podem facilitar o aprendizado e uso do software como manuais, livros, grupos de discussão, documentos diversos, etc.

4 - Como baixar e instalar o R

Baixando e instalando o R em detalhe (narrado), veja o vídeo (7 min) clicando [aqui]

Baixando e instalando o R sumarizado (legendado) veja o vídeo (2 min) clicando [aqui]

5 - Operações algébricas elementares e funções básicas no R

Veja o vídeo (7 min) clicando [aqui] * Familiarização inicial com a interface através de operações algébricas elementares com o R e uso de funções matemáticas usuais.

6 - Descrição dos dados utilizados em outros módulos

Os dados utilizados (arquivos: esalq2012.csv e esalq2012mod.csv) se baseiam em pesquisa realizada com 56 alunos de graduação da classe de 2012.

Somente uma parte da informação levantada foi utilizada, sendo organizada em 2 arquivos, já depurada de alguns erros introduzidos na entrada de dados pelos alunos (ex. altura informada em m em lugar de cm, idade informada como data de nascimento, peso informado com a unidade, 85kg)

  • Para ver o questionário utilizado, desenvolvido com o Google Forms, clique aqui

  • Há 2 arquivos descritos nos próximos parágrafos
  • arquivo esalq2012.csv: contém os dados da pesquisa com a codificação original
  • arquivo esalq2012mod.csv: contém os mesmos dados do arquivo anterior, recodificados com nomes de variáveis e categorias condensados, para facilitar a análise (a informação é a mesma do anterior)

6.1 Descrição dos dados no arquivo esalq2012.csv

## Nomes das variáveis no arquivo e sua definição
##  [1] "sexo"     "curso"    "ingresso" "idade"    "cidade"   "reprov"  
##  [7] "anospub"  "peso"     "altura"   "time"     "satisf"   "reprmat" 
## [13] "pg"       "carreira"
## sexo - sexo do aluno com níveis ou categorias
## [1] "F" "M"
## curso - graduação cursada pelo aluno/a com níveis ou categorias
## [1] "Agro" "Econ"
## ingresso - ano de ingresso no curso de graduação (ex. 2010, 2011)
## idade - idade do/a aluno/a em anos completos em 30/07/2012 (ex. 20, 21)
## cidade - cidade em que nasceu com os níveis ou categorias
## [1] "Cidade no exterior"                         
## [2] "Outra cidade do Brasil fora do Estado de SP"
## [3] "Outra cidade do interior de Sao Paulo"      
## [4] "Piracicaba"                                 
## [5] "Sao Paulo, Capital"
## reprov - número de reprovações no curso até o momento
## anospub - núm. de anos que estudou em escola pública antes da universidade
## altura - altura em cm
## peso - peso em kg
## time - time de futebol que torçe com níveis ou categorias
## [1] "Corinthians" "Nenhum time" "Outro time"  "Palmeiras"   "Santos"     
## [6] "Sao Paulo"
## satisf - satisfação com sua graduação (1-insat. a 5-muito satisf.)
## reprmat - foi reprovado em matemática? categorias ou níveis
## [1] "Nao" "Sim"
## pg - interesse quanto à pós graduação com categorias ou níveis
## [1] "Me interesso pela pos graduacao em economia aplicada na ESALQ"
## [2] "Me interesso por pos graduacao em outras areas"               
## [3] "Nao me interesso no momento"                                  
## [4] "Nao sei ainda"
## carreira - carreira que pretende seguir, com categorias ou níveis
## [1] "Nao sei ainda"                                  
## [2] "Ser empresario"                                 
## [3] "Ser professor ou pesquisador (universidade)"    
## [4] "Trabalhar em empresa privada"                   
## [5] "Trabalhar em empresa pública (concurso público)"

6.2 Descrição dos dados no arquivo esalq2012mod.csv

Os nomes das variáveis e das categorias foram condensados. Veja os nomes das categorias na descrição das variáveis apresentada nos últimos parágrafos em caso de dúvida (a ordem das categorias foi preservada).

## Nomes das variáveis no arquivo e sua definição
##  [1] "sexo"     "curso"    "ingresso" "idade"    "cidade"   "reprov"  
##  [7] "anospub"  "peso"     "altura"   "time"     "satisf"   "reprmat" 
## [13] "pg"       "carreira"
## sex - sexo do aluno com níveis ou categorias
## [1] "F" "M"
## cur - graduação cursada pelo aluno/a com níveis ou categorias
## [1] "Agro" "Econ"
## ing - ano de ingresso no curso de graduação (ex. 2010, 2011)
## ida - idade do/a aluno/a em anos completos em 30/07/2012 (ex. 20, 21)
## cid - cidade em que nasceu com os níveis ou categorias
## [1] "Cidade no exterior"                         
## [2] "Outra cidade do Brasil fora do Estado de SP"
## [3] "Outra cidade do interior de Sao Paulo"      
## [4] "Piracicaba"                                 
## [5] "Sao Paulo, Capital"
## rep - número de reprovações no curso até o momento
## pub - núm. de anos que estudou em escola pública antes da universidade
## alt - altura em cm
## pes - peso em kg
## tim - time de futebol que torçe com níveis ou categorias
## [1] "Corinthians" "Nenhum time" "Outro time"  "Palmeiras"   "Santos"     
## [6] "Sao Paulo"
## sat - satisfação com sua graduação (1-insat. a 5-muito satisf.)
## rmat - foi reprovado em matemática? categorias ou níveis
## NULL
## pg - interesse quanto à pós graduação com categorias ou níveis
## [1] "Me interesso pela pos graduacao em economia aplicada na ESALQ"
## [2] "Me interesso por pos graduacao em outras areas"               
## [3] "Nao me interesso no momento"                                  
## [4] "Nao sei ainda"
## car - carreira que pretende seguir, com categorias ou níveis
## [1] "Nao sei ainda"                                  
## [2] "Ser empresario"                                 
## [3] "Ser professor ou pesquisador (universidade)"    
## [4] "Trabalhar em empresa privada"                   
## [5] "Trabalhar em empresa pública (concurso público)"