| Conf | Carga | Tiempo | |
|---|---|---|---|
| SDD:12 | Min. : 1.000 | Min. :0.300 | |
| HDD:13 | 1st Qu.: 3.100 | 1st Qu.:1.500 | |
| NA | Median : 5.800 | Median :3.200 | |
| NA | Mean : 5.648 | Mean :2.828 | |
| NA | 3rd Qu.: 8.000 | 3rd Qu.:3.900 | |
| NA | Max. :10.200 | Max. :5.800 |
Con base en la información anterior, los discos duros analizados tienen proporciones similares. Además, los datos no presentan outliers.
Con base en la información anterior, los discos duros analizados tienen proporciones similares. Además, los datos analizados no presentan outliers.
Con base en los gráficos anteriores y en los coeficientes de correlación, se puede decir que, sin dividir por disco duro, se presenta una relación lineal entre la Carga y el Tiempo. Sin embargo, si lo dividimos por disco duro, la relación entre la Carga y el Tiempo en discos tipo HDD es logarítmiica, mientras que para los SDD es lineal.
##
## Call:
## lm(formula = Tiempo ~ Carga, data = disco_duro)
##
## Residuals:
## Min 1Q Median 3Q Max
## -1.16824 -0.40281 -0.03945 0.43541 1.07627
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 0.04838 0.26321 0.184 0.856
## Carga 0.49214 0.04177 11.783 3.18e-11 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.5837 on 23 degrees of freedom
## Multiple R-squared: 0.8579, Adjusted R-squared: 0.8517
## F-statistic: 138.8 on 1 and 23 DF, p-value: 3.177e-11
## Analysis of Variance Table
##
## Response: Tiempo
## Df Sum Sq Mean Sq F value Pr(>F)
## Carga 1 47.313 47.313 138.84 3.177e-11 ***
## Residuals 23 7.838 0.341
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Con base en los resultados obtenidos para el modelo 1 y el test de ANOVA, la Carga es un predictor significativo para predecir el Tiempo de procesamiento de los disco duros. Además, con base en el R2, este modelo simple es capaz de explicar el 85.17% de la variabilidad del Tiempo de respuesta. Por otro lado, el indicador de bondad de ajuste tiene un p-value menor a 0.05, por lo tanto, el modelo sí es significativo. En cuanto a la carga se puede decir que cada unidad de Carga, aumenta el tiempo de procesamiento de los discos en 0.49214.
##
## Call:
## lm(formula = Tiempo ~ Carga + Conf + (Conf * Carga), data = disco_duro)
##
## Residuals:
## Min 1Q Median 3Q Max
## -0.68547 -0.11333 0.06881 0.15302 0.41807
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -1.37549 0.20902 -6.581 1.62e-06 ***
## Carga 0.71979 0.03367 21.376 9.88e-16 ***
## ConfHDD 2.26391 0.26520 8.536 2.86e-08 ***
## Carga:ConfHDD -0.35734 0.04227 -8.454 3.36e-08 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.2844 on 21 degrees of freedom
## Multiple R-squared: 0.9692, Adjusted R-squared: 0.9648
## F-statistic: 220.2 on 3 and 21 DF, p-value: 5.042e-16
## Analysis of Variance Table
##
## Response: Tiempo
## Df Sum Sq Mean Sq F value Pr(>F)
## Carga 1 47.313 47.313 584.8051 < 2.2e-16 ***
## Conf 1 0.357 0.357 4.4132 0.04791 *
## Carga:Conf 1 5.782 5.782 71.4618 3.364e-08 ***
## Residuals 21 1.699 0.081
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Con base en los resultados obtenidos para el modelo 2, al agregar el tipo de disco duro como predictor, el modelo mejora, logrando un R2 ajustado del 96.48%. Además, el indicador de bondad de ajuste tienen un p-value menor a 0.05, por lo tanto, el modelo sí es significativo. Adicionalmente, las variables analizadas son significativas, con base en los test. Por otro lado, analizando los coeficientes, se puede decir que:
## Analysis of Variance Table
##
## Model 1: Tiempo ~ Carga
## Model 2: Tiempo ~ Carga + Conf + (Conf * Carga)
## Res.Df RSS Df Sum of Sq F Pr(>F)
## 1 23 7.8375
## 2 21 1.6990 2 6.1386 37.938 1.067e-07 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
De acuerdo con el resultado del test de ANOVA, el nuevo modelo (incluyendo tipo de disco duro y su interacción con la carga) mejora significativamente el ajuste del modelo, ya que el p-value es muy pequeño (menor a 0.05), por ende, se selecciona el modelo 2.
| Media_Cero | Heterocedasticidad | Independencia | Normalidad | |
|---|---|---|---|---|
| p-value | 0.884731 | 0.4432059 | 0.0342127 | 0.0634754 |
Con base en los gráficos y los test estadísticos para los supuestos del error, se puede decir que:
| Acc | Exp | Edad | Pot | Sexo | |
|---|---|---|---|---|---|
| No:20 | Min. : 1.000 | Min. :20 | Min. : 70.0 | Mujer :21 | |
| Si:15 | 1st Qu.: 6.500 | 1st Qu.:25 | 1st Qu.: 90.0 | Hombre:14 | |
| NA | Median : 9.000 | Median :29 | Median : 95.0 | NA | |
| NA | Mean : 9.543 | Mean :31 | Mean :101.6 | NA | |
| NA | 3rd Qu.:12.000 | 3rd Qu.:36 | 3rd Qu.:110.0 | NA | |
| NA | Max. :20.000 | Max. :56 | Max. :150.0 | NA |
## Warning in corrplot::corrplot(AQ.cor, method = "ellipse", addCoef.col =
## "black", : p.mat and corr may be not paired, their rownames and colnames are
## not totally same!
No hay relaciones significativas entre las variables años de
experiencia, edad y potencia del motor.
Ecuación del modelo 1: \[
Modelo 1 = \frac{1}{1+e^{-(1.9419 - 0.2456Exp)}}
\] Representación gráfica del modelo 1
Test razón de verosimilitud modelo 1
## Analysis of Deviance Table
##
## Model: binomial, link: logit
##
## Response: Acc
##
## Terms added sequentially (first to last)
##
##
## Df Deviance Resid. Df Resid. Dev Pr(>Chi)
## NULL 34 47.804
## Exp 1 7.7977 33 40.006 0.005231 **
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Ecuación del modelo 2: \[
Modelo 2 = \frac{1}{1+e^{-(0.8890 - 0.2400Exp + 2.9866Sexo)}}
\] Representación gráfica del modelo 2
Test razón de verosimilitud modelo 2
## Analysis of Deviance Table
##
## Model: binomial, link: logit
##
## Response: Acc
##
## Terms added sequentially (first to last)
##
##
## Df Deviance Resid. Df Resid. Dev Pr(>Chi)
## NULL 34 47.804
## Exp 1 7.7977 33 40.006 0.005231 **
## Sexo 1 10.7571 32 29.249 0.001039 **
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
| AIC | deviance | AUC | |
|---|---|---|---|
| Modelo_RL1 | 44.00583 | 40.00583 | 0.7983333 |
| Modelo_RL2 | 35.24875 | 29.24875 | 0.8683333 |
## Analysis of Deviance Table
##
## Model 1: Acc ~ Exp
## Model 2: Acc ~ Exp + Sexo
## Resid. Df Resid. Dev Df Deviance Pr(>Chi)
## 1 33 40.006
## 2 32 29.249 1 10.757 0.001039 **
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Con base en los resultados obtenidos en la tabla de bondad de ajuste, y haciendo el test ANOVA para comparar los dos modelos, podemos decir que el modelo 2 es el que mejor se ajusta, ya que tanto los indicadores de AIC y deviance del el modelo 2 tienen menores valores que el modelo 1, y comparando el área bajo la curva, el modelo dos tiene una métrica de 0.868 vs. 0.798 del modelo 1. Además, el p-value en el test de comparación es de 0.001039, menor al nivel de significancia de 0.05, lo cual nos dice que el modelo 2 es mejor que el modelo 1.
| Coef | 2.5 % | 97.5 % | |
|---|---|---|---|
| (Intercept) | 0.8890341 | -1.3776790 | 3.6489708 |
| Exp | -0.2399985 | -0.5285605 | -0.0401726 |
| SexoHombre | 2.9865699 | 1.1292126 | 5.5884081 |
| e-beta | 2.5 % | 97.5 % | |
|---|---|---|---|
| (Intercept) | 2.432779 | 0.2521631 | 38.4350894 |
| Exp | 0.786629 | 0.5894529 | 0.9606236 |
| SexoHombre | 19.817589 | 3.0932200 | 267.3097416 |
Con base en las tablas anteriores, se puede decir que
Con base en la curva ROC, el mejor punto de corte para el modelo seleccionado es de 0.845.
## [1] "Matriz de confusión"
## predicho
## observado No Si
## No 20 0
## Si 6 9
|
Con base en los indicadores de bondad de clasificación, se puede decir que:
| AIC | deviance | AUC | |
|---|---|---|---|
| Modelo_RL1 | 44.00583 | 40.00583 | 0.7983333 |
| Modelo_RL2 | 35.24875 | 29.24875 | 0.8683333 |
| Modelo_RL3 | 22.69953 | 12.69953 | 0.9666667 |
## Analysis of Deviance Table
##
## Model 1: Acc ~ Exp + Sexo
## Model 2: Acc ~ Exp + Edad + Pot + Sexo
## Resid. Df Resid. Dev Df Deviance Pr(>Chi)
## 1 32 29.249
## 2 30 12.700 2 16.549 0.0002549 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Con base en los resultados de indicadores de bondad de ajuste y realizando el test de ANOVA para comprar el modelo seleccionado y el modelo 3, se puede decir que el nuevo modelo que involucra todas las variables es mejor que el anterior (modelo con solo años de experiencia y género), ya que presenta mejores indicadores en cuanto a AIC, deviance y AUC, y el p-value es menor a 0.05. A continuación se presentará la interpretación de los coeficientes para el nuevo modelo.
## Warning: glm.fit: fitted probabilities numerically 0 or 1 occurred
## Warning: glm.fit: fitted probabilities numerically 0 or 1 occurred
## Warning: glm.fit: fitted probabilities numerically 0 or 1 occurred
## Warning: glm.fit: fitted probabilities numerically 0 or 1 occurred
## Warning: glm.fit: fitted probabilities numerically 0 or 1 occurred
## Warning: glm.fit: fitted probabilities numerically 0 or 1 occurred
## Warning: glm.fit: fitted probabilities numerically 0 or 1 occurred
## Warning: glm.fit: fitted probabilities numerically 0 or 1 occurred
## Warning: glm.fit: fitted probabilities numerically 0 or 1 occurred
## Warning: glm.fit: fitted probabilities numerically 0 or 1 occurred
## Warning: glm.fit: fitted probabilities numerically 0 or 1 occurred
## Warning: glm.fit: fitted probabilities numerically 0 or 1 occurred
## Warning: glm.fit: fitted probabilities numerically 0 or 1 occurred
## Warning: glm.fit: fitted probabilities numerically 0 or 1 occurred
## Warning: glm.fit: fitted probabilities numerically 0 or 1 occurred
## Warning: glm.fit: fitted probabilities numerically 0 or 1 occurred
## Warning: glm.fit: fitted probabilities numerically 0 or 1 occurred
## Warning: glm.fit: fitted probabilities numerically 0 or 1 occurred
## Warning: glm.fit: fitted probabilities numerically 0 or 1 occurred
## Warning: glm.fit: fitted probabilities numerically 0 or 1 occurred
## Warning: glm.fit: fitted probabilities numerically 0 or 1 occurred
## Warning: glm.fit: fitted probabilities numerically 0 or 1 occurred
| Coef | 2.5 % | 97.5 % | |
|---|---|---|---|
| (Intercept) | -19.9739842 | -44.5548931 | -6.2467567 |
| Exp | -0.4795153 | -1.6395185 | -0.0309068 |
| Edad | -0.0258531 | -0.2010543 | 0.1767231 |
| Pot | 0.2468708 | 0.0892520 | 0.5243585 |
| SexoHombre | 3.0493974 | -0.8046982 | 10.0151645 |
| e-beta | 2.5 % | 97.5 % | |
|---|---|---|---|
| (Intercept) | 0.0000000 | 0.0000000 | 1.936700e-03 |
| Exp | 0.6190834 | 0.1940735 | 9.695660e-01 |
| Edad | 0.9744782 | 0.8178680 | 1.193301e+00 |
| Pot | 1.2800137 | 1.0933561 | 1.689375e+00 |
| SexoHombre | 21.1026240 | 0.4472229 | 2.236303e+04 |
Con base en lo anterior, se puede decir que: