Ricardo Alves de Olinda

ricardo.estat@yahoo.com.br

http://lattes.cnpq.br/7767223263366578

Universidade Estadual da Paraíba

http://departamentos.uepb.edu.br/estatistica/corpo-docente/



Centro de Ciência e Tecnologia

Departamento de Estatística

UEPB - CCT - DE



Use R!

Use R!

Introdução básica de R pode ser encontrada Aqui



R Markdown

Sobre R Markdown, pode ser consultada Aqui



Material texto da disciplina “Modelos Lineares Generalizados

Gilberto de Paula e Gauss e Clarice



Uma breve revisão sobre modelos de regressão



  1. Processo de ajuste de um modelo estatístico


2. O ajuste de um modelo estatístico segue, em linhas gerais, as seguintes etapas:


Fase de especificação - Com base na teoria e nos dados disponíveis, propor um modelo de regressão:


Observação - A análise preliminar dos dados, com utilização de técnicas descritivas, é fundamental para a especificação adequada do modelo.

Fase de ajuste - Usando a teoria estatística estimar os parâmetros do modelo;

Fase de diagnóstico - Analisar a adequabilidade e validar o modelo ajustado;

Avaliar se o modelo proposto é compatível com os dados disponíveis;

Caso o modelo não se mostre adequado, deve-se voltar ao primeiro passo e rever sua especificação.

Fase de análise - Se o ajuste se mostrar adequado, o modelo pode ser usado para fins de descrição, inferência e predição.

O modelo de regressão clássico

  1. O modelo
  • Modelo Inicial: \(Y=f(x)\)
  1. Formulação Estatística
  • Quando lidamos com um modelo sob o ponto de vista da estatística, devemos ter em mente que as relações entre as variáveis quase nunca são exatas, determinísticas. Elas, em geral, incluem flutuações aleatórias. Assim, sob o ponto de vista da Estatística um modelo é constituido por duas componentes:

Componente Sistemática + Componente Aleatória

A componente Sistemática é expressa por uma função especificada pelo analista, enquanto que a componente aleatória é representada por uma distribuição de probabilidade. Ou seja, \[ Y=f(x)+\epsilon \]

Isto significa que o componente de \(Y\) é explicado em parte por \(x\), através da função \(f\), e por outra parte não captada por essa função, representada por \(\epsilon\).

A relação entre a variável resposta \(Y\) e a variável explicativa \(X\) é postulada como um modelo linear \[ Y=\beta_0+\beta_1X+\epsilon, \] em que, \(\beta_0\) e \(\beta_1\) são parâmetros fixos e desconhecidos, chamados “coeficiente do modelo de regressão” e \(\epsilon\) é o “erro aleatório”.

OBSERVAÇÃO

O adjetivo “linear” tem sendito duplo. Ele pode descrever, de fato, que a relação entre \(Y\) e \(X\) é linear (reta). Mas, geralmente, a palavra linear refere-se ao modo como os parâmetros entram no modelo. Ou seja, a linearidade é nos parâmetros. Por exemplo, \(Y=\beta_0+\beta_1X^2+\epsilon\) é um modelo linear, apesar da relação entre \(Y\) e \(X\) ser quadrática.