Análise de Dados com o Software R:
Métodos Estatísticos, Computacionais e Econométricos

Prof. Adriano Azevedo Filho (azevedofilho@usp.br)

Sumário

1 - Introdução (aqui)

considerações iniciais - introdução ao R - explorando o site do R - baixando e instalando o R - operações elementares sobre o R - descrição dos arquivos de dados utilizados em outros módulos

2 - Preparação dos dados para análise (aqui)

carregamento de arquivos da internet e do seu computador - verificação da leitura - tipos de valores - variáveis - alteração de nomes de variáveis e de categorias - reordenação de categorias - alteração de valores de variáveis - criação de novas variáveis - como salvar os dados em arquivos

3 - Operações algébricas e lógicas, data.frames e conversão de tipos (aqui)

limpando o ambiente - variáveis e vetores - operações algébricas vetoriais - operações lógicas vetoriais - extração de valores de variáveis - extração de variáveis e observações de data.frames - criação de data.frames - conversão de variáveis qualitativas - verificação e eliminação de NAs em variáveis e data.frames

4 - Análise de frequências nos casos univariado e multivariado (aqui)

frequências absolutas e relativas - tabelas de frequências - gráficos de frequências - frequências conjuntas - frequências condicionais - visualização de frequências no contexto multidimensional - criação de variáveis auxiliares para sumarização de categorias - sumarização de variáveis quantitativas com variáveis qualitativas e histogramas

5 - Análise de centralidade e posição / Funções no R (aqui)

medidas de centralidade - média aritmética - média ponderada - média quadrática - média geométrica - média harmônica - mediana - moda - medidas de posição - mínimo - máximo - ordem - percentil - quantil - quartil - 5 números de Tuckey - definição de funções no R - estrutura básica de uma função - estrutura de controle “if”

6 - Análise de distribuição (aqui)

caracterização da dispersão, assimetria e curtose - caracterização gráfica de funções no R - variância - desvio padrão - desvio absoluto médio - máximo - mínimo - amplitude - coeficiente de assimetria - coeficiente de curtose - distribuição Normal - distribuição Bernoulli - distribuição Binomial - função cumulativa - função quantil - aplicações em economia - indicadores de concentração e distribuição - índice de Herfindahl–Hirschman - índice de Gini - curva de Lorenz - índice de Theil

7 - Amostragem e introdução a estimadores (aqui)

conceitos básicos - amostragem como sorteio de distribuição teórica - media amostral como estimador - lei dos grandes números - teorema do limite central - intervalo de confiança da média - aplicações em pesquisa eleitoral

Aplicação: bonequinhos em caixas de cereais (aqui)

8 - Variáveis aleatórias: noções, esperança matemática e revisão de probabilidades (caso uni e multivariado) (aqui)

conceito de variável aleatória - esperança matemática (média teórica) - aplicações em situações envolvendo incerteza - precificação neutra com relação ao risco - revisão de probabilidades - distribuições conjuntas e marginais - distribuição condicional - noção de independência

9 - Funções de variáveis aleatórias e conceitos relacionados (aqui)

funções de variáveis aleatórias - esperança matemática - variância teórica - covariância teórica - coeficiente de correlação teórico - distribuições de funções de v.a.s - propriedades da esperança e variância - momentos absolutos e centrais (teóricos e amostrais) - coeficiente de assimetria teórico - coeficiente de curtose teórico - consistência de estimadores - variância de estimadores - não tendenciosidade de estimadores

10 - Aplicação: modelo média-variância na otimização de carteiras de investimento (aqui)

histórico - principais noções e fundamentos - magnitude e risco do retorno - modelo com 2 investimentos elementar - modelo com 2 investimentos completo - modelo geral com m investimentos - derivação da carteira ótima - derivação da fronteira eficiente - package quadprog - package fPortfolio - exemplos numéricos

Referência: Uso do package quadprog (aqui)

11 - Argumentação estatística e testes de hipótese (aqui)

argumentação - opinião vs. argumento - prova ou demonstração - argumento forte - estatisticas para teste - argumentação estatística pelo intervalo de confiança - quantidade pivotal - testes de significância fisherianos - significância estatística - testes de normalidade - testes de hipótese de Neyman-Pearson

12 - Análise de regressão I: introdução à regressão linear simples e múltipla (aqui)

conceitos básicos - variável resposta e variáveis explicativas - premissas do modelo básico - regressão simples vs. regressão múltipla - regressão linear vs. regressão não-linear - função lm - extração de dados de modelos estimados - definição de fórmulas de modelos no R - variáveis dummy ou binárias - intervalos de confiança para estimativas - intervalos de previsão - estimativas pelo método dos quadrados minimos - interpretação de resultados da estimação - diagnóstico de problemas em regressão - análise de resíduos - estudos de caso (resultados dos 100 m nos jogos olímpicos, mãe fumante vs. peso do bebe)

13 - Análise de regressão II: introdução à regressão com resposta qualitativa (aqui)

conceitos básicos - razões para não utilizar regressão linear - Logito - Probito - método da máxima verossimilhança - como estimar parâmetros - uso da função glm - opções - seleção de modelos pelo AIC - efeitos marginais - função maBina (package erer) - estudo de caso: análise de inadimplência