Introducción

En este ejercicio se analizaran datos de 17 pacientes que sufrieron sobredosis de amitriptilina.
Las variables de respuesta son:
TOT: Nivel total de TCAD en plasma.
AMI: Nivel de amitriptilina en plasma.
Los predictores son:
GEN: Género (1 = femenino, 0 = masculino).
AMT: Cantidad ingerida en la sobredosis.
PR: Medición de la onda PR.
DIAP: Presión sanguínea diastólica.
ORS: Medición de la onda QRS.

data<-read.table("T7-6.DAT")
colnames(data)<-c("TOT","AMI","GEN","AMT","PR","DIAP","QRS")
str(data)
## 'data.frame':    17 obs. of  7 variables:
##  $ TOT : int  3389 1101 1131 596 896 1767 807 1111 645 628 ...
##  $ AMI : int  3149 653 810 448 844 1450 493 941 547 392 ...
##  $ GEN : int  1 1 0 1 1 1 1 0 1 1 ...
##  $ AMT : int  7500 1975 3600 675 750 2500 350 1500 375 1050 ...
##  $ PR  : int  220 200 205 160 185 180 154 200 137 167 ...
##  $ DIAP: int  0 0 60 60 70 60 80 70 60 60 ...
##  $ QRS : int  140 100 111 120 83 80 98 93 105 74 ...
summary(data)
##       TOT            AMI              GEN              AMT      
##  Min.   : 500   Min.   : 384.0   Min.   :0.0000   Min.   : 350  
##  1st Qu.: 652   1st Qu.: 458.0   1st Qu.:0.0000   1st Qu.: 750  
##  Median : 896   Median : 653.0   Median :1.0000   Median :1750  
##  Mean   :1120   Mean   : 882.4   Mean   :0.7059   Mean   :2146  
##  3rd Qu.:1131   3rd Qu.: 941.0   3rd Qu.:1.0000   3rd Qu.:3000  
##  Max.   :3389   Max.   :3149.0   Max.   :1.0000   Max.   :7500  
##        PR             DIAP         QRS        
##  Min.   :135.0   Min.   : 0   Min.   : 60.00  
##  1st Qu.:160.0   1st Qu.:60   1st Qu.: 80.00  
##  Median :180.0   Median :60   Median : 98.00  
##  Mean   :174.9   Mean   :52   Mean   : 97.18  
##  3rd Qu.:185.0   3rd Qu.:70   3rd Qu.:111.00  
##  Max.   :220.0   Max.   :90   Max.   :140.00

Inciso a).-

Regresión con respuesta TOT

model_tot <- lm(TOT ~ GEN + AMT + PR + DIAP + QRS, data)
summary(model_tot)
## 
## Call:
## lm(formula = TOT ~ GEN + AMT + PR + DIAP + QRS, data = data)
## 
## Residuals:
##    Min     1Q Median     3Q    Max 
## -399.2 -180.1    4.5  164.1  366.8 
## 
## Coefficients:
##               Estimate Std. Error t value Pr(>|t|)    
## (Intercept) -2.879e+03  8.933e+02  -3.224 0.008108 ** 
## GEN          6.757e+02  1.621e+02   4.169 0.001565 ** 
## AMT          2.848e-01  6.091e-02   4.677 0.000675 ***
## PR           1.027e+01  4.255e+00   2.414 0.034358 *  
## DIAP         7.251e+00  3.225e+00   2.248 0.046026 *  
## QRS          7.598e+00  3.849e+00   1.974 0.074006 .  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 281.2 on 11 degrees of freedom
## Multiple R-squared:  0.8871, Adjusted R-squared:  0.8358 
## F-statistic: 17.29 on 5 and 11 DF,  p-value: 6.983e-05

Se observan los coeficientes estimados y la significancia estadística de cada predictor. El modelo explica qué variables tienen más relación con el nivel total de TCAD. Teniendo como principales predictores significativos a AMT y GEN, siendo tambien significativos pero en menor medida se encuentran tambien PR y DIAP. #Análisis de residuos

par(mfrow=c(2,2))
plot(model_tot)

par(mfrow=c(1,1))

El gráfico de residuos vs ajustados nos permite verificar linealidad y homocedasticidad. Asi como el Q-Q plot verifica normalidad de residuos. Los residuos estandarizados ayudan a identificar posibles outliers.

Intervalo de predicción

Se pide un elipsoide de prediccion del 95% para el TCAD total para la cantidad de amitriptilina con GEN = 1, AMT = 1200, PR = 140, DIAP = 70, QRS = 85.

data_m <- data.frame(GEN=1, AMT=1200, PR=140, DIAP=70, QRS=85)
predict(model_tot, data_m, interval="prediction", level=0.95)
##        fit      lwr      upr
## 1 729.5248 41.34785 1417.702

El intervalo de predicción al 95% nos da un rango plausible para el valor de TOT en un nuevo paciente con esas características.

##Inciso (b).- Regresión con respuesta AMI

model_ami <- lm(AMI ~ GEN + AMT + PR + DIAP + QRS, data)
summary(model_ami)
## 
## Call:
## lm(formula = AMI ~ GEN + AMT + PR + DIAP + QRS, data = data)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -373.85 -247.29  -83.74  217.13  462.72 
## 
## Coefficients:
##               Estimate Std. Error t value Pr(>|t|)    
## (Intercept) -2.729e+03  9.288e+02  -2.938 0.013502 *  
## GEN          7.630e+02  1.685e+02   4.528 0.000861 ***
## AMT          3.064e-01  6.334e-02   4.837 0.000521 ***
## PR           8.896e+00  4.424e+00   2.011 0.069515 .  
## DIAP         7.206e+00  3.354e+00   2.149 0.054782 .  
## QRS          4.987e+00  4.002e+00   1.246 0.238622    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 292.4 on 11 degrees of freedom
## Multiple R-squared:  0.8764, Adjusted R-squared:  0.8202 
## F-statistic:  15.6 on 5 and 11 DF,  p-value: 0.0001132

Repetimos el análisis de residuos e intervalo de predicción:

par(mfrow=c(2,2))
plot(model_ami)

par(mfrow=c(1,1))
predict(model_ami, data_m, interval="prediction", level=0.95)
##        fit       lwr      upr
## 1 575.7255 -139.8674 1291.318

Inciso (c).- Regresión multivariante (TOT y AMI)

Se consideran ambas respuestas en un modelo de regresión multivariante.

Y <- cbind(data$TOT, data$AMI)
model_mv <- lm(Y ~ GEN + AMT + PR + DIAP + QRS, data)
Manova(model_mv)
## 
## Type II MANOVA Tests: Pillai test statistic
##      Df test stat approx F num Df den Df   Pr(>F)   
## GEN   1   0.65521   9.5015      2     10 0.004873 **
## AMT   1   0.69097  11.1795      2     10 0.002819 **
## PR    1   0.34649   2.6509      2     10 0.119200   
## DIAP  1   0.32381   2.3944      2     10 0.141361   
## QRS   1   0.29184   2.0606      2     10 0.178092   
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

El análisis MANOVA nos permite ver si los predictores tienen un efecto conjunto sobre TOT y AMI

#Elipse de predicción conjunta La elipse de predicción al 95% nos da una región para los valores conjuntos de TOT y AMI en un nuevo paciente. Comparada con los intervalos de predicción individuales, la elipse muestra la relación entre ambas respuestas (su correlación).

# Predicciones multivariantes
pred <- predict(model_mv, newdata=data_m , interval="prediction", level=0.95)

# Matriz de covarianzas de los residuos
Sigma <- cov(residuals(model_mv))

# Media estimada (centroide de la predicción)
## Elipse de predicción conjunta con ellipse
# Centroide de la predicción (valores ajustados de TOT y AMI para new_data)
mu <- predict(model_mv, newdata=data_m)

# Elipse al 95%
ell <- ellipse(Sigma, centre = mu, level=0.95)

# Gráfico
plot(ell, type="l", col="blue", lwd=2,
     xlab="TOT (Total TCAD)", ylab="AMI (Amitriptyline)",
     main="Elipse de predicción conjunta (95%)")
points(mu[1], mu[2], pch=19, col="red")

El punto rojo es la predicción esperada para TOT y AMI en un paciente con las características dadas. La elipse azul representa la región de predicción conjunta al 95%. Esto complementa los intervalos de predicción univariados de las partes (a) y (b), mostrando además la correlación entre ambas respuestas.

Conclusión

Ambos modelos individuales muestran qué variables influyen en TOT y AMI por separado.Y el modelo multivariante permite analizar de manera conjunta las dos respuestas.