U1A11

Kevin

5/10/2020

Regresión Logística

En estadística, la regresión logística es un tipo de análisis de regresión utilizado para predecir el resultado de una variable categórica (una variable que puede adoptar un número limitado de categorías) en función de las variables independientes o predictoras. Es útil para modelar la probabilidad de un evento ocurriendo como función de otros factores. El análisis de regresión logística se enmarca en el conjunto de Modelos Lineales Generalizados (GLM por sus siglas en inglés) que usa como función de enlace la función logit. Las probabilidades que describen el posible resultado de un único ensayo se modelan, como una función de variables explicativas, utilizando una función logística.

Caso de estudio: fallo del transbordador challanger en 1986

El Transbordador Challenger era una nave espacial que se dirigia al espacio en 1986, en cambio pocos segundos despues de su lanzamiento, tuvo un trajico accidente donde murio toda su tripulación. Primero leemos los datos y contamos las frecuencias de casos sin y con defectos: Accidente del challenger Accidente del challenger

## 
##  0  1 
## 16  7

Una representación gráfica de los datos, puede obtenerse mediante:

Accidente del challenger Desafortunadamente el Challenger exploto, por el simple motivo del clima, a los investigadores se les olvido checar el clima, el cual no beneficiaba mucho a la nave, por tal motivo, el fatidico accidente.

## 
## Call:
## glm(formula = defecto ~ temp, family = binomial, data = challanger)
## 
## Deviance Residuals: 
##     Min       1Q   Median       3Q      Max  
## -1.0611  -0.7613  -0.3783   0.4524   2.2175  
## 
## Coefficients:
##             Estimate Std. Error z value Pr(>|z|)  
## (Intercept)  15.0429     7.3786   2.039   0.0415 *
## temp         -0.2322     0.1082  -2.145   0.0320 *
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## (Dispersion parameter for binomial family taken to be 1)
## 
##     Null deviance: 28.267  on 22  degrees of freedom
## Residual deviance: 20.315  on 21  degrees of freedom
## AIC: 24.315
## 
## Number of Fisher Scoring iterations: 5
  • El modelo de regresíon logística, la raíz de las desviaciones representa el papel de los residuos:

\[D_i = \mp \sqrt{-2 [Y_i\log \hat p_i + (1-Y_i)\log(1-\hat p_i)]},\]