## [1] 25  3
## [1] "Conf"   "Carga"  "Tiempo"
## 'data.frame':    25 obs. of  3 variables:
##  $ Conf  : int  1 0 1 0 1 1 0 0 0 1 ...
##  $ Carga : num  1 2 2.4 3.1 4 4.3 5.8 6.6 7.5 8 ...
##  $ Tiempo: num  0.9 0.3 2 0.8 2.7 2.6 2.5 3.2 3.7 3.9 ...
##       Conf          Carga            Tiempo     
##  Min.   :0.00   Min.   : 1.000   Min.   :0.300  
##  1st Qu.:0.00   1st Qu.: 3.100   1st Qu.:1.500  
##  Median :1.00   Median : 5.800   Median :3.200  
##  Mean   :0.52   Mean   : 5.648   Mean   :2.828  
##  3rd Qu.:1.00   3rd Qu.: 8.000   3rd Qu.:3.900  
##  Max.   :1.00   Max.   :10.200   Max.   :5.800
##  [1]  1.0  2.0  2.4  3.1  4.0  4.3  5.8  6.6  7.5  8.0  9.0  9.2 10.2  1.8  2.0
## [16]  2.5  3.9  4.2  5.5  6.4  7.0  8.0  8.2  9.1  9.5
##  [1] 0.9 0.3 2.0 0.8 2.7 2.6 2.5 3.2 3.7 3.9 5.3 4.2 3.9 1.1 1.5 0.5 1.5 1.6 3.3
## [20] 3.3 3.5 4.3 4.0 4.3 5.8
## 
## DatosTaller$Carga 
##                 1
## 
## DatosTaller$Tiempo 
##                  1

1. Relación entre el tiempo de respuesta y la carga de trabajo diferenciando los dos tipos de disco duro

## 
##  Shapiro-Wilk normality test
## 
## data:  Carga
## W = 0.9373, p-value = 0.1282
## 
##  Shapiro-Wilk normality test
## 
## data:  Tiempo
## W = 0.96267, p-value = 0.4703
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
## 
##  Pearson's product-moment correlation
## 
## data:  Datos0$Carga and Datos0$Tiempo
## t = 28.334, df = 10, p-value = 1
## alternative hypothesis: true correlation is less than 0
## 95 percent confidence interval:
##  -1.0000000  0.9979347
## sample estimates:
##       cor 
## 0.9938293
## 
##  Pearson's product-moment correlation
## 
## data:  Datos1$Carga and Datos1$Tiempo
## t = 12.024, df = 11, p-value = 1
## alternative hypothesis: true correlation is less than 0
## 95 percent confidence interval:
##  -1.0000000  0.9871297
## sample estimates:
##       cor 
## 0.9640003

De acuerdo con el coeficiente de correlación de Pearson, ambos discos duros, tanto SSD como HDD, están correlacionadas con el tiempo de respuesta y carga del trabajo. Este coeficiente al ser positivo y mayor a cero, indica una correlación positiva y entre más cercano esté de 1, más alta es su asociación.

Los resultados del coeficiente fueron:

HDD=0.9640

SDD=0.9938

Lo que indica que ambos discos duros, pero sobre todo el SSD, tienen una alta asociación con el tiempo de respuesta y carga del trabajo, indicando una relación lineal positiva casi perfecta.

2.Primer modelo de regresión simple

## 
## Call:
## lm(formula = Tiempo ~ Carga)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -1.16824 -0.40281 -0.03945  0.43541  1.07627 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  0.04838    0.26321   0.184    0.856    
## Carga        0.49214    0.04177  11.783 3.18e-11 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.5837 on 23 degrees of freedom
## Multiple R-squared:  0.8579, Adjusted R-squared:  0.8517 
## F-statistic: 138.8 on 1 and 23 DF,  p-value: 3.177e-11

El modelo 1 indica una bondad de ajuste del 85% con variables estadísticamente significativas en ambos casos (su p-valor < 0.05), lo que quiere decir que las variables independientes elegidas para el modelo (en este caso la carga) explican en ese porcentaje las variaciones de la variable dependiente que es el tiempo de respuesta. El modelo arroja que un un aumento el tiempo de carga en una unidad (segundo) implica un aumento de 0.4921 segundos en el tiempo de respuesta, esto sin incluir la configuración del disco duro.

3. Segundo modelo de regresión simple

## 
## Call:
## lm(formula = Tiempo ~ Carga + Disco + (Carga * Disco))
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -0.68547 -0.11333  0.06881  0.15302  0.41807 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  -1.37549    0.20902  -6.581 1.62e-06 ***
## Carga         0.71979    0.03367  21.376 9.88e-16 ***
## Disco1        2.26391    0.26520   8.536 2.86e-08 ***
## Carga:Disco1 -0.35734    0.04227  -8.454 3.36e-08 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.2844 on 21 degrees of freedom
## Multiple R-squared:  0.9692, Adjusted R-squared:  0.9648 
## F-statistic: 220.2 on 3 and 21 DF,  p-value: 5.042e-16

## `geom_smooth()` using formula 'y ~ x'

En el modelo 2 todas las variables independientes usadas (la carga y disco duro) para explicar la variable dependiente (Tiempo de respuesta) son estadísticamente significativas, esto se sabe pues su p-valor < 0.05, esto quiere decir que la carga y el tipo de disco duro sí influyen en el tiempo de respuesta, además, el modelo presentó un R^2 de 0.96 que significa que las variables elegidas explican las variaciones de la variable dependiente en un 96% (bondad de ajuste).

En este modelo el disco 1 tiene un tiempo en promedio 2.26391 segundos más que el disco 2 (representado por el intercepto). Si la carga aumenta una unidad, el disco 1 disminuirá en promedio 0.35734 segundos del tiempo de respuesta, manteniendo lo demás constante. Finalmente, con el disco 2 el tiempo de respuesta aumentará 0.71 segundos.

4.Ecuación del modelo 2

Tiempo = 1.4 + 0.72Carga + 2.3Disco + (0.4(CargaDisco))

Tiempo = 0.72Carga + 2.3Disco - (0.4(CargaDisco)) - 1.

## `geom_smooth()` using method = 'loess' and formula 'y ~ x'

En ambos casos presentan curvas leves lo cual indica que no es lineal o no lo es del todo, pero si tienen una relación positiva. La línea azul presenta concavidad hacia abajo o decreciente, mientras que la línea roja tiene concavidad creciente o hacia arriba.. Hay algunos puntos alejados de las líneas, pero dentro de las bandas por lo que puede sugerir que los datos provienen de poblaciones normales. En ese sentido, el modelo no es el adecuado para aplicar.

5.Test anova Comparación entre modelos:

Hipotesis:

Ho: Los dos modelos tienen un similar ajuste

H1: El modelo2 (que incluye disco) presenta un mejor ajuste que el modelo 1 (solamente tiempo y carga).

## Analysis of Variance Table
## 
## Model 1: Tiempo ~ Carga
## Model 2: Tiempo ~ Carga + Disco + (Carga * Disco)
##   Res.Df    RSS Df Sum of Sq      F    Pr(>F)    
## 1     23 7.8375                                  
## 2     21 1.6990  2    6.1386 37.938 1.067e-07 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Se rechaza la hipótesis nula al tener un p-valor menor al 0.05 ya que los modelos no tienen un ajuste similar, siendo el modelo 2 el que mejor se ajusta ya que se le agrega el tipo de disco y la interacción de la carga del equipo.

6. Supuestos:

-Normalidad:

Hipótesis:

H0: Los datos siguen la distribución normal

H1: Los datos no siguen la distribución normal

## 
##  Anderson-Darling normality test
## 
## data:  residuals(Modelo2)
## A = 0.41309, p-value = 0.3132

La prueba de hipótesis de normalidad no se rechaza porque el p-valor es mayor al 0,05, por lo tanto, los datos no son estadísticamente diferentes de una distribución.

-Media:

## [1] -3.192108e-17

El supuesto de media cero en el término de error se cumple.

-Varianza constante:

Hipótesis:

H0: Homocedasticidad

H1: Heterocedasticidad

## Loading required package: zoo
## 
## Attaching package: 'zoo'
## The following objects are masked from 'package:base':
## 
##     as.Date, as.Date.numeric
## 
##  studentized Breusch-Pagan test
## 
## data:  Modelo2
## BP = 2.6825, df = 3, p-value = 0.4432

Siendo el p-valor mayor a 0.05 no hay suficiente información para rechazar la hipótesis nula (la varianza no cambia en el residual), por lo tanto, hay homocedasticidad en el modelo de regresión, entonces, se cumple el supuesto de varianza constante.

-Autocorrelación:

Hipótesis:

H0: No existe correlación entre los residuos.

H1: Los residuos están autocorrelacionados.

## 
##  Durbin-Watson test
## 
## data:  Modelo2
## DW = 1.3285, p-value = 0.06843
## alternative hypothesis: true autocorrelation is not 0

Dado que el p-valor es mayor a 0,05 no se rechaza la hipótesis nula, por lo tanto, los residuos del modelo de regresión no están autocorrelacionados.

7. Conclusiones:

Ambos modelos presentan variables significativas al hacer su respectiva estimación, aún así presentan algunas inconsistencias. Al incluir la variable cualitativa de configuración de disco en el segundo modelo, hay mejor ajuste como lo indica la bondad de ajuste y el Test ANOVA, pero se presentan inconsistencias con la prueba de normalidad con el test de Anderson-Darling que mide la distribución de los datos, es decir, si sigue o no una distribución normal, pero en este caso no cumple con ese supuesto.