En este ejercicio se analizaran datos de 17 pacientes que sufrieron
sobredosis de amitriptilina.
Las variables de respuesta son:
TOT: Nivel total de TCAD en plasma.
AMI: Nivel de amitriptilina en plasma.
Los predictores son:
GEN: Género (1 = femenino, 0 = masculino).
AMT: Cantidad ingerida en la sobredosis.
PR: Medición de la onda PR.
DIAP: Presión sanguínea diastólica.
ORS: Medición de la onda QRS.
data<-read.table("T7-6.DAT")
colnames(data)<-c("TOT","AMI","GEN","AMT","PR","DIAP","QRS")
str(data)
## 'data.frame': 17 obs. of 7 variables:
## $ TOT : int 3389 1101 1131 596 896 1767 807 1111 645 628 ...
## $ AMI : int 3149 653 810 448 844 1450 493 941 547 392 ...
## $ GEN : int 1 1 0 1 1 1 1 0 1 1 ...
## $ AMT : int 7500 1975 3600 675 750 2500 350 1500 375 1050 ...
## $ PR : int 220 200 205 160 185 180 154 200 137 167 ...
## $ DIAP: int 0 0 60 60 70 60 80 70 60 60 ...
## $ QRS : int 140 100 111 120 83 80 98 93 105 74 ...
summary(data)
## TOT AMI GEN AMT
## Min. : 500 Min. : 384.0 Min. :0.0000 Min. : 350
## 1st Qu.: 652 1st Qu.: 458.0 1st Qu.:0.0000 1st Qu.: 750
## Median : 896 Median : 653.0 Median :1.0000 Median :1750
## Mean :1120 Mean : 882.4 Mean :0.7059 Mean :2146
## 3rd Qu.:1131 3rd Qu.: 941.0 3rd Qu.:1.0000 3rd Qu.:3000
## Max. :3389 Max. :3149.0 Max. :1.0000 Max. :7500
## PR DIAP QRS
## Min. :135.0 Min. : 0 Min. : 60.00
## 1st Qu.:160.0 1st Qu.:60 1st Qu.: 80.00
## Median :180.0 Median :60 Median : 98.00
## Mean :174.9 Mean :52 Mean : 97.18
## 3rd Qu.:185.0 3rd Qu.:70 3rd Qu.:111.00
## Max. :220.0 Max. :90 Max. :140.00
model_tot <- lm(TOT ~ GEN + AMT + PR + DIAP + QRS, data)
summary(model_tot)
##
## Call:
## lm(formula = TOT ~ GEN + AMT + PR + DIAP + QRS, data = data)
##
## Residuals:
## Min 1Q Median 3Q Max
## -399.2 -180.1 4.5 164.1 366.8
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -2.879e+03 8.933e+02 -3.224 0.008108 **
## GEN 6.757e+02 1.621e+02 4.169 0.001565 **
## AMT 2.848e-01 6.091e-02 4.677 0.000675 ***
## PR 1.027e+01 4.255e+00 2.414 0.034358 *
## DIAP 7.251e+00 3.225e+00 2.248 0.046026 *
## QRS 7.598e+00 3.849e+00 1.974 0.074006 .
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 281.2 on 11 degrees of freedom
## Multiple R-squared: 0.8871, Adjusted R-squared: 0.8358
## F-statistic: 17.29 on 5 and 11 DF, p-value: 6.983e-05
Se observan los coeficientes estimados y la significancia estadística de cada predictor. El modelo explica qué variables tienen más relación con el nivel total de TCAD. Teniendo como principales predictores significativos a AMT y GEN, siendo tambien significativos pero en menor medida se encuentran tambien PR y DIAP. #Análisis de residuos
par(mfrow=c(2,2))
plot(model_tot)
par(mfrow=c(1,1))
El gráfico de residuos vs ajustados nos permite verificar linealidad y homocedasticidad. Asi como el Q-Q plot verifica normalidad de residuos. Los residuos estandarizados ayudan a identificar posibles outliers.
Se pide un elipsoide de prediccion del 95% para el TCAD total para la cantidad de amitriptilina con GEN = 1, AMT = 1200, PR = 140, DIAP = 70, QRS = 85.
data_m <- data.frame(GEN=1, AMT=1200, PR=140, DIAP=70, QRS=85)
predict(model_tot, data_m, interval="prediction", level=0.95)
## fit lwr upr
## 1 729.5248 41.34785 1417.702
El intervalo de predicción al 95% nos da un rango plausible para el valor de TOT en un nuevo paciente con esas características.
##Inciso (b).- Regresión con respuesta AMI
model_ami <- lm(AMI ~ GEN + AMT + PR + DIAP + QRS, data)
summary(model_ami)
##
## Call:
## lm(formula = AMI ~ GEN + AMT + PR + DIAP + QRS, data = data)
##
## Residuals:
## Min 1Q Median 3Q Max
## -373.85 -247.29 -83.74 217.13 462.72
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -2.729e+03 9.288e+02 -2.938 0.013502 *
## GEN 7.630e+02 1.685e+02 4.528 0.000861 ***
## AMT 3.064e-01 6.334e-02 4.837 0.000521 ***
## PR 8.896e+00 4.424e+00 2.011 0.069515 .
## DIAP 7.206e+00 3.354e+00 2.149 0.054782 .
## QRS 4.987e+00 4.002e+00 1.246 0.238622
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 292.4 on 11 degrees of freedom
## Multiple R-squared: 0.8764, Adjusted R-squared: 0.8202
## F-statistic: 15.6 on 5 and 11 DF, p-value: 0.0001132
Repetimos el análisis de residuos e intervalo de predicción:
par(mfrow=c(2,2))
plot(model_ami)
par(mfrow=c(1,1))
predict(model_ami, data_m, interval="prediction", level=0.95)
## fit lwr upr
## 1 575.7255 -139.8674 1291.318
Se consideran ambas respuestas en un modelo de regresión multivariante.
Y <- cbind(data$TOT, data$AMI)
model_mv <- lm(Y ~ GEN + AMT + PR + DIAP + QRS, data)
Manova(model_mv)
##
## Type II MANOVA Tests: Pillai test statistic
## Df test stat approx F num Df den Df Pr(>F)
## GEN 1 0.65521 9.5015 2 10 0.004873 **
## AMT 1 0.69097 11.1795 2 10 0.002819 **
## PR 1 0.34649 2.6509 2 10 0.119200
## DIAP 1 0.32381 2.3944 2 10 0.141361
## QRS 1 0.29184 2.0606 2 10 0.178092
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
El análisis MANOVA nos permite ver si los predictores tienen un efecto conjunto sobre TOT y AMI
#Elipse de predicción conjunta La elipse de predicción al 95% nos da una región para los valores conjuntos de TOT y AMI en un nuevo paciente. Comparada con los intervalos de predicción individuales, la elipse muestra la relación entre ambas respuestas (su correlación).
# Predicciones multivariantes
pred <- predict(model_mv, newdata=data_m , interval="prediction", level=0.95)
# Matriz de covarianzas de los residuos
Sigma <- cov(residuals(model_mv))
# Media estimada (centroide de la predicción)
## Elipse de predicción conjunta con ellipse
# Centroide de la predicción (valores ajustados de TOT y AMI para new_data)
mu <- predict(model_mv, newdata=data_m)
# Elipse al 95%
ell <- ellipse(Sigma, centre = mu, level=0.95)
# Gráfico
plot(ell, type="l", col="blue", lwd=2,
xlab="TOT (Total TCAD)", ylab="AMI (Amitriptyline)",
main="Elipse de predicción conjunta (95%)")
points(mu[1], mu[2], pch=19, col="red")
El punto rojo es la predicción esperada para TOT y AMI en un paciente
con las características dadas. La elipse azul representa la región de
predicción conjunta al 95%. Esto complementa los intervalos de
predicción univariados de las partes (a) y (b), mostrando además la
correlación entre ambas respuestas.
Ambos modelos individuales muestran qué variables influyen en TOT y AMI por separado.Y el modelo multivariante permite analizar de manera conjunta las dos respuestas.