Analisis del accidente del transbordador espacial challenger
Imágen de accidente del challenger
Antescedentes El accidente del transbordador espacial Challenger se produjo el martes 28 de enero de 1986 a las 16:39:13 UTC,1. Cuando el transbordador espacial Challenger (misión STS-51-L) se desintegró 73 segundos tras el lanzamiento2 provocando la muerte de los siete miembros de la tripulación —Francis “Dick” Scobee, Michael J. Smith, Ronald McNair, Ellison Onizuka, Gregory Jarvis, Judith Resnik y Christa McAuliffe. La nave se desintegró sobre el océano Atlántico, frente a la costa del centro de Florida (Estados Unidos) a las 11:38 EST (16:38 UTC).3, Ha sido calificado como el accidente más grave en la conquista del espacio.4
Regresión lógisitca
- El fichero challenger contiene 23 observaciones de las siguientes variables: defecto, que toma los valores 1 y 0 en función de sí se encontraron defectos o no en los propulsores; y temperatura “temp” (en grados Fahrenheit) en el momento del lanzamiento.
Primero se leen los datos y contamos las frecuencias de casos sin y con defectos:
- Leemos los datos de la URL
challenger <- read.table("https://verso.mat.uam.es/~joser.berrendero/datos/challenger.txt", header = TRUE)
table(challenger$defecto)##
## 0 1
## 16 7
Representando defectos y los no defectos de manera visual (gráfica):
colores <- NULL
colores[challenger$defecto==0] <- "green"
colores[challenger$defecto==1] <- "red"
plot(challenger$temp, challenger$defecto, pch = 21, bg = colores, xlab = 'Temperatura', ylab = 'Probabilidad de defectos')
legend('bottomleft', c('No defecto', 'Si defecto'), pch = 21, col = c('green', 'red'))Representando los defectos vs no defectos de una forma gráfica
colores <- NULL #Para asignar colores propios
colores[challenger$defecto==0] <- "green"
colores[challenger$defecto==1] <- "red"
plot(challenger$temp, challenger$defecto, pch = 21, bg = colores, xlab = "Temperatura", ylab = "Probabilidad de defectos" )
legend("bottomleft" , c("no defecto", "si defecto"), pch = 21 , col = c("green","red")) Se han usado los argumentos “pch” y “bg” para mejorar el aspecto del gráfico. También hemos usado el comando “legend” para incluir una leyenda explicativa.
Es razonable , a la vista de los datos, pensar que la temperatura puede influye en la probabilidad de que los propulsores tengan algún tipo de defecto. En esta práctica, se va a ajustar un modelo de regresión logística para estudiar su posible relación. Para ajustar el modelo se usa el comando “glm” (para modelos lineales generalizados) indicando que la respuesta es binomial mediante el argumento family:
##
## Call:
## glm(formula = defecto ~ temp, family = binomial, data = challenger)
##
## Deviance Residuals:
## Min 1Q Median 3Q Max
## -1.0611 -0.7613 -0.3783 0.4524 2.2175
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) 15.0429 7.3786 2.039 0.0415 *
## temp -0.2322 0.1082 -2.145 0.0320 *
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for binomial family taken to be 1)
##
## Null deviance: 28.267 on 22 degrees of freedom
## Residual deviance: 20.315 on 21 degrees of freedom
## AIC: 24.315
##
## Number of Fisher Scoring iterations: 5
regresion logisitca (paraaso lineal cuando no tenemos c)
En el modelo de regresión logística la raíz de las desviaciones representa el papel de los residuos:
\[ D_i = \mp \sqrt{-2 [Y_i\log \hat p_i + (1-Y_i)\log(1-\hat p_i)]},\]