Aplicar un modelo de regresion lineal multiple un conjunto de datos simulados con la finalidad de evaluar, predecir, interpretar y comunicar resultados al modelo.
Se crea un conjunto de datos con cuatro variables dependientes y una variable independiente.
El significado de los datos es a partir de una construcción de los mismos pretendiendo conocer el nivel de bienestar de una persona en una escala de 0 a 100 siendo lo mas cercano a 100 aspectos de mucha felicidad y auto realización, por el contrario niveles mas bajos implicarían menos bienestar.
El simulacro se hace con un conjunto de una muestra 364 estudiantes a quienes de manera imaginaria se les indaga con posibles instrumentos de medición y determinar con valores cuantitativos sobre capacidad adquisitiva económica que tienen, el rendimiento académico basado en el promedio de calificaciones, la fortaleza o debilidad emocional en si mismo, la parte de social empática que tienen con otros compañeros como para adaptarse y socializar y por supuesto como variable dependiente el nivel de bienestar.
La idea es aplicar un modelo de regresión lineal múltiple en donde se construya el modelo a partir del conjunto de datos con datos de entrenamiento y utilizar datos de validación para conocer las predicciones, luego con valores nuevos, determinar la predicción de una persona para conocer su nivel de bienestar en un escala de 0-100.
En la mayoría de los problemas de investigación en los que se aplica el análisis de regresión se necesita más de una variable independiente para el modelo de regresión. La complejidad de la mayoría de mecanismos científicos es tal que, con el fin de predecir una respuesta importante, se requiere un modelo de regresión múltiple. Cuando un modelo es lineal en los coeficientes se denomina modelo de regresión lineal múltiple.
Para el caso de k variables independientes, el modelo que da \(x_{1},x_{2},...,x_{k},\) y \(y\) como la variable dependiente \(x_{1},x_{2},...,x_{k},\) son las variables que afectan a la variable dependiente en el modelo de regresión lineal múltiple. [@walpole_probabilidad_2012]
Muchos problemas de de investigación y de la industria, requieren la estimación de las relaciones existentes entre el patrón de variabilidad de una variable aleatoria y los valores de una o más variables aleatorias. [@urrutia_mosquera_evaluacion_2011]
Al generar un modelo de regresión linel múltiple es importante identificar los estadísticos de $R^
2$, que se denomina coeficiente de determinación y es una medida de la proporción de la variabilidad explicada por el modelo ajustado.
De igual forma, el valor de R2 ajustado o coeficiente de determinación ajustado, es una variación de R2 que proporciona un ajuste para los grados de libertad [@walpole_probabilidad_2012]. R Ajustado está diseñado para proporcionar un estadístico que castigue un modelo sobreajustado, de manera que se puede esperar que favorezca al modelo.[@walpole_probabilidad_2012].
Una variable \(Y\) puede predecirse conforme y de cuerdo con
\(y= b_{0} + ,b_{1}x_{1} + b_{2}x_{2} + b_{3}x_{3} + . . . . .b_{k}x_{k}\)
library(readr)
library(ggplot2)
library(caret)
## Loading required package: lattice
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(knitr)
library(patchwork)
options(scipen = 999) # Notación NO CENTÍFICA
Se tienen cuatro variables dependientes:
Dinero = Poder adquisitivo de un estudiante
Promedio = El promedio de calificaiocnes de un estudiante
Emocional = Grado de fortaleza o debilidad emocional de una persona
Sociabildad = Empatía que tiene para adaptarse e intregrase con sus compañeros
Se tienen una variable dependiente:
bienestar que significa que tan feliz es una persona estudiante de una Institución de educación superior.
Los datos son simulados y generados, todas las variables estarán dadas en una escala de 0 a 100, la variable promedio será el valor numérico del rendimiento escolar. Todos los datos se generan con un valor de media y desviación estándar específica diferente para cada variable y de manera aleatoria.
Se generan valores de las cuatro variables: independientes y la variable dependiente, con distribuciones normales y de manera aleatoria.
set.seed(2021)
n <- 364
dinero <- c(round(rnorm(n = 164, mean = 25, sd = 1), 2), round(rnorm(n = 100, mean = 28, sd = 1), 2), round(rnorm(n = 100, mean = 34, sd = 1), 2) )
#dinero
promedio <- promedio <- c(round(rnorm(n=91, mean = 90, sd = 4),0), round(rnorm(n=91, mean = 85, sd = 4),0), round(rnorm(n=91, mean = 80, sd = 4),0), round(rnorm(n=91, mean = 75, sd = 4),0))
# promedio
emocional <- c(round(rnorm(n=91, mean = 80, sd = 10),0), round(rnorm(n=91, mean = 70, sd = 10),0), round(rnorm(n=91, mean = 60, sd = 10),0), round(rnorm(n=91, mean = 50, sd = 10),0))
social <- c(round(rnorm(n=100, mean = 70, sd = 15),0),round(rnorm(n=100, mean = 60, sd = 15),0), round(rnorm(n=164, mean = 50, sd = 15),0) )
bienestar <- c(round(rnorm(n=100, mean = 80, sd = 10),0), round(rnorm(n=100, mean = 60, sd = 10),0), round(rnorm(n=164, mean = 40, sd = 10),0))
datos <- data.frame(dinero, promedio, emocional, social, bienestar)
datos
## dinero promedio emocional social bienestar
## 1 24.88 87 92 70 91
## 2 25.55 89 68 62 87
## 3 25.35 85 76 55 100
## 4 25.36 85 85 74 72
## 5 25.90 91 75 60 93
## 6 23.08 86 81 106 85
## 7 25.26 92 75 60 74
## 8 25.92 88 81 69 93
## 9 25.01 90 75 61 89
## 10 26.73 88 73 54 76
## 11 23.92 94 81 84 83
## 12 24.73 93 82 98 76
## 13 25.18 87 80 94 75
## 14 26.51 95 83 75 81
## 15 26.60 89 78 85 91
## 16 23.16 88 89 88 79
## 17 26.62 93 84 73 72
## 18 25.13 91 70 74 94
## 19 26.48 93 105 66 71
## 20 26.51 86 88 79 74
## 21 24.06 82 78 67 74
## 22 24.81 90 88 58 85
## 23 23.90 88 97 48 93
## 24 26.21 95 82 47 87
## 25 23.38 90 88 52 84
## 26 25.11 92 91 80 67
## 27 23.54 88 72 69 76
## 28 24.65 84 84 72 84
## 29 24.91 90 91 38 74
## 30 26.10 94 78 58 86
## 31 23.04 86 80 64 86
## 32 23.55 92 73 76 83
## 33 26.02 91 80 78 67
## 34 23.58 96 76 52 70
## 35 24.40 100 85 34 67
## 36 23.42 89 75 71 89
## 37 23.71 87 90 108 99
## 38 23.55 91 81 46 103
## 39 24.91 92 69 87 81
## 40 25.50 88 80 78 87
## 41 25.12 94 71 45 79
## 42 26.76 84 87 44 103
## 43 24.65 91 91 88 78
## 44 27.12 93 88 68 80
## 45 24.97 92 86 84 86
## 46 24.21 90 69 84 74
## 47 26.48 86 90 57 87
## 48 24.27 87 73 62 81
## 49 25.31 85 75 76 83
## 50 25.69 93 103 55 76
## 51 24.50 88 77 92 97
## 52 22.74 97 83 73 81
## 53 25.04 97 90 86 81
## 54 24.63 89 95 99 95
## 55 24.04 92 77 48 87
## 56 25.10 86 74 69 97
## 57 25.43 95 81 86 106
## 58 24.83 92 84 94 80
## 59 23.45 91 101 48 75
## 60 23.49 84 72 68 92
## 61 25.02 93 83 55 82
## 62 24.81 95 74 52 78
## 63 25.39 94 91 89 78
## 64 24.24 95 79 71 86
## 65 25.23 98 84 60 89
## 66 24.02 97 74 55 72
## 67 25.57 98 97 70 85
## 68 26.62 94 69 61 74
## 69 24.75 86 91 89 77
## 70 23.94 97 104 72 74
## 71 24.65 88 57 84 95
## 72 24.96 96 81 77 77
## 73 23.60 88 86 75 68
## 74 26.49 89 69 80 78
## 75 23.96 90 86 80 74
## 76 24.76 98 92 59 87
## 77 24.00 91 87 73 89
## 78 23.61 94 73 41 77
## 79 25.98 86 88 86 91
## 80 25.36 90 66 91 77
## 81 24.66 91 74 94 81
## 82 24.36 92 94 83 92
## 83 22.83 92 67 73 89
## 84 25.63 93 90 64 76
## 85 24.86 91 73 56 85
## 86 23.76 98 68 45 65
## 87 25.53 95 88 73 68
## 88 23.41 86 77 78 101
## 89 24.01 88 62 36 85
## 90 25.48 90 79 58 83
## 91 25.81 90 84 93 84
## 92 24.71 81 73 51 81
## 93 24.95 81 82 71 112
## 94 25.74 86 62 62 75
## 95 25.01 89 75 90 68
## 96 24.88 94 69 89 83
## 97 24.35 91 79 67 78
## 98 24.13 87 68 73 65
## 99 24.49 82 63 72 71
## 100 22.92 86 63 47 89
## 101 24.74 81 48 73 76
## 102 25.45 85 63 55 62
## 103 24.86 91 62 60 59
## 104 24.51 88 68 90 60
## 105 23.80 88 57 60 48
## 106 25.05 91 75 58 50
## 107 24.87 86 76 58 59
## 108 22.30 85 70 73 61
## 109 24.43 92 87 47 61
## 110 25.59 84 81 74 62
## 111 25.49 84 68 79 57
## 112 24.87 77 63 64 52
## 113 23.74 87 53 61 55
## 114 25.20 82 78 60 50
## 115 23.08 84 66 64 58
## 116 26.67 93 41 80 71
## 117 25.47 86 77 59 53
## 118 26.41 82 73 66 65
## 119 25.08 80 91 81 94
## 120 23.20 83 75 70 57
## 121 25.75 97 72 38 65
## 122 24.69 86 85 63 72
## 123 23.27 82 55 78 63
## 124 22.86 90 63 56 65
## 125 27.37 87 67 54 70
## 126 25.48 81 61 48 58
## 127 26.09 83 68 57 61
## 128 25.30 81 87 50 55
## 129 26.02 89 58 76 54
## 130 27.45 85 70 76 57
## 131 24.75 78 62 92 80
## 132 25.54 88 59 76 62
## 133 25.20 88 80 66 60
## 134 22.93 92 77 66 60
## 135 25.51 91 63 70 53
## 136 24.59 85 74 41 64
## 137 25.36 86 88 61 80
## 138 24.67 79 88 67 69
## 139 25.08 85 59 73 68
## 140 24.74 80 74 43 73
## 141 24.12 83 50 66 62
## 142 25.74 87 63 52 57
## 143 22.32 82 64 52 56
## 144 24.05 85 68 46 56
## 145 25.45 86 74 50 74
## 146 23.71 92 78 27 65
## 147 24.84 86 79 77 82
## 148 25.35 82 74 58 53
## 149 24.94 80 58 69 51
## 150 26.48 86 79 63 70
## 151 24.35 81 85 68 70
## 152 24.74 77 65 59 67
## 153 23.75 81 60 43 67
## 154 25.77 82 63 28 54
## 155 24.09 82 84 40 50
## 156 24.31 98 73 58 55
## 157 24.38 81 98 89 63
## 158 25.76 80 59 62 79
## 159 23.91 87 70 73 61
## 160 24.60 82 87 62 58
## 161 25.83 86 67 64 60
## 162 25.36 80 76 70 63
## 163 25.16 90 59 78 62
## 164 25.96 90 61 96 37
## 165 27.66 95 63 83 75
## 166 27.27 91 83 42 47
## 167 26.30 84 75 68 63
## 168 29.95 89 62 62 69
## 169 30.67 85 71 28 66
## 170 30.06 87 85 61 66
## 171 28.82 83 81 61 68
## 172 27.92 89 68 59 70
## 173 27.51 76 60 65 53
## 174 28.85 80 79 54 71
## 175 27.04 81 77 60 65
## 176 28.93 90 80 65 47
## 177 28.38 84 79 67 39
## 178 29.49 82 82 64 75
## 179 27.53 83 70 81 58
## 180 28.26 79 67 71 42
## 181 27.01 89 59 67 65
## 182 26.94 85 57 36 57
## 183 28.27 76 82 55 70
## 184 28.95 74 65 62 67
## 185 28.73 83 38 62 56
## 186 27.75 73 49 45 67
## 187 29.49 76 60 64 64
## 188 28.23 84 56 54 70
## 189 28.28 77 76 61 73
## 190 28.15 84 62 90 56
## 191 26.80 81 63 45 75
## 192 28.09 77 51 30 52
## 193 29.22 80 63 62 69
## 194 27.44 77 62 60 80
## 195 28.34 78 54 27 64
## 196 26.46 80 60 44 75
## 197 27.76 78 73 52 59
## 198 28.51 81 60 68 52
## 199 27.76 84 62 73 61
## 200 28.58 84 46 51 67
## 201 28.27 79 44 30 31
## 202 26.66 83 62 41 45
## 203 27.15 74 66 47 37
## 204 27.59 78 48 55 40
## 205 27.33 80 57 63 37
## 206 27.90 73 60 39 35
## 207 27.08 74 56 42 34
## 208 28.44 83 66 18 33
## 209 27.99 84 60 45 69
## 210 27.35 82 55 55 43
## 211 29.34 74 82 54 50
## 212 28.33 81 52 40 33
## 213 28.00 84 45 58 44
## 214 29.10 80 64 90 51
## 215 29.16 78 71 41 53
## 216 28.10 87 49 28 43
## 217 27.61 77 78 53 37
## 218 27.59 81 66 63 47
## 219 27.09 83 57 36 43
## 220 27.46 80 79 65 50
## 221 28.12 68 43 42 38
## 222 29.73 80 56 45 50
## 223 27.96 84 57 53 36
## 224 28.54 77 61 69 66
## 225 29.92 76 52 36 52
## 226 27.76 81 51 55 42
## 227 29.57 77 56 47 27
## 228 28.48 76 69 56 31
## 229 28.04 80 50 74 33
## 230 28.44 84 50 58 32
## 231 26.12 78 43 51 51
## 232 26.28 78 82 29 39
## 233 29.88 78 69 75 49
## 234 27.97 82 71 36 41
## 235 29.00 84 55 83 32
## 236 28.30 77 55 32 56
## 237 27.99 81 71 55 43
## 238 27.76 79 45 11 46
## 239 26.23 75 71 50 42
## 240 27.84 80 59 62 33
## 241 29.92 81 28 55 52
## 242 29.11 86 65 54 39
## 243 26.01 85 53 67 30
## 244 28.81 74 43 68 31
## 245 29.10 84 77 53 29
## 246 26.56 74 53 68 47
## 247 29.22 74 50 46 46
## 248 27.22 78 45 53 34
## 249 25.93 83 62 60 50
## 250 28.33 74 44 40 54
## 251 28.26 75 47 44 62
## 252 27.57 83 65 61 63
## 253 26.13 74 63 49 48
## 254 27.20 78 59 30 30
## 255 28.33 87 73 28 46
## 256 28.01 82 61 52 42
## 257 28.85 76 73 59 43
## 258 26.47 79 50 57 35
## 259 27.97 82 62 53 45
## 260 29.43 76 53 36 45
## 261 27.07 78 64 22 40
## 262 29.01 78 55 64 37
## 263 27.91 78 59 46 38
## 264 28.94 80 64 43 46
## 265 33.48 83 59 15 31
## 266 33.07 77 62 47 41
## 267 35.23 79 75 57 49
## 268 33.76 79 52 36 48
## 269 34.27 80 71 55 28
## 270 35.43 86 72 54 44
## 271 32.86 85 58 34 48
## 272 34.90 86 66 18 45
## 273 34.08 80 68 48 22
## 274 34.35 73 51 49 27
## 275 32.74 76 27 50 44
## 276 34.84 82 57 58 48
## 277 32.74 78 14 44 31
## 278 34.15 74 48 37 40
## 279 33.52 76 49 28 57
## 280 36.21 77 48 30 30
## 281 34.08 77 64 49 29
## 282 34.72 75 65 19 36
## 283 35.05 80 74 63 23
## 284 34.28 72 46 40 40
## 285 33.58 76 60 60 55
## 286 36.52 75 37 44 39
## 287 34.00 76 51 45 48
## 288 32.44 74 48 54 37
## 289 32.01 74 20 44 45
## 290 32.51 72 49 42 37
## 291 34.26 77 32 58 59
## 292 33.19 73 41 35 23
## 293 34.83 82 52 32 28
## 294 32.85 72 36 24 37
## 295 33.86 72 44 58 49
## 296 35.18 78 58 63 43
## 297 34.19 77 53 55 36
## 298 33.31 77 57 42 24
## 299 33.54 73 58 43 43
## 300 33.52 69 42 50 47
## 301 35.21 75 57 62 35
## 302 34.99 72 57 42 26
## 303 35.54 78 49 48 55
## 304 34.29 78 48 32 43
## 305 34.51 76 36 53 56
## 306 33.46 75 46 47 25
## 307 33.33 68 34 64 37
## 308 34.68 74 38 57 38
## 309 34.19 77 54 33 36
## 310 32.61 83 52 57 48
## 311 32.94 82 53 68 39
## 312 34.37 74 65 35 30
## 313 33.00 70 38 77 21
## 314 33.96 75 39 44 39
## 315 33.99 76 58 70 39
## 316 32.96 71 53 65 52
## 317 33.67 82 44 57 57
## 318 33.39 76 75 30 38
## 319 35.52 75 51 47 64
## 320 34.30 77 63 75 33
## 321 34.40 70 50 53 47
## 322 34.75 80 41 58 33
## 323 33.91 80 29 21 60
## 324 32.91 82 43 74 38
## 325 33.91 79 57 23 20
## 326 34.47 73 40 51 43
## 327 34.00 78 51 16 62
## 328 34.62 73 53 38 48
## 329 33.35 77 49 57 36
## 330 34.45 82 41 72 35
## 331 33.82 78 60 56 46
## 332 33.19 74 47 45 38
## 333 32.19 74 45 72 43
## 334 33.22 71 71 64 45
## 335 32.01 71 61 71 46
## 336 35.00 77 36 62 41
## 337 32.96 77 46 20 30
## 338 34.20 79 57 41 48
## 339 34.28 80 44 43 35
## 340 34.16 78 44 41 35
## 341 32.41 74 35 55 33
## 342 34.55 66 66 49 14
## 343 32.63 72 51 47 38
## 344 32.88 81 42 30 51
## 345 34.16 78 41 59 45
## 346 35.51 75 71 52 49
## 347 33.65 89 45 24 36
## 348 32.03 78 41 40 55
## 349 33.15 72 42 67 20
## 350 32.23 75 53 46 57
## 351 35.09 73 47 53 42
## 352 32.60 79 46 25 38
## 353 34.94 81 41 76 52
## 354 33.99 71 56 40 45
## 355 34.26 70 37 25 26
## 356 35.15 77 55 31 33
## 357 35.17 76 57 69 28
## 358 32.81 77 47 39 37
## 359 34.22 75 52 88 40
## 360 35.13 75 42 77 43
## 361 34.51 79 57 28 35
## 362 32.50 74 51 55 51
## 363 32.88 69 67 63 33
## 364 33.24 73 44 50 40
summary(datos)
## dinero promedio emocional social
## Min. :22.30 Min. : 66.00 Min. : 14.00 Min. : 11.00
## 1st Qu.:25.01 1st Qu.: 77.00 1st Qu.: 53.00 1st Qu.: 46.00
## Median :27.21 Median : 82.00 Median : 65.00 Median : 58.00
## Mean :28.22 Mean : 82.82 Mean : 65.05 Mean : 58.03
## 3rd Qu.:32.53 3rd Qu.: 88.00 3rd Qu.: 77.00 3rd Qu.: 70.00
## Max. :36.52 Max. :100.00 Max. :105.00 Max. :108.00
## bienestar
## Min. : 14.00
## 1st Qu.: 42.00
## Median : 57.00
## Mean : 58.29
## 3rd Qu.: 74.00
## Max. :112.00
Por cada variable independiente se hace un diagrama de dispersión con la tendencia lineal con respecto a la variable dependiente bienestar
g <- ggplot(data = datos, mapping = aes(x = dinero, y = bienestar)) +
geom_point(color = "forestgreen", size = 2) +
labs(title = 'bienestar ~ dinero', x = 'dinero') +
geom_smooth(method = "lm", se = FALSE, color = "black") +
theme_bw() +
theme(plot.title = element_text(hjust = 0.5))
g
## `geom_smooth()` using formula 'y ~ x'
g <- ggplot(data = datos, mapping = aes(x = promedio, y = bienestar)) +
geom_point(color = "orange", size = 2) +
labs(title = 'bienestar ~ promedio ', x = 'promedio ') +
geom_smooth(method = "lm", se = FALSE, color = "black") +
theme_bw() +
theme(plot.title = element_text(hjust = 0.5))
g
## `geom_smooth()` using formula 'y ~ x'
g <- ggplot(data = datos, mapping = aes(x = emocional, y = bienestar)) +
geom_point(color = "red", size = 2) +
labs(title = 'bienestar ~ emocional ', x = 'emocional ') +
geom_smooth(method = "lm", se = FALSE, color = "black") +
theme_bw() +
theme(plot.title = element_text(hjust = 0.5))
g
## `geom_smooth()` using formula 'y ~ x'
Los datos de entrenamiento serán aleatoriamente el 70% del total de los datos, aproximadamente \(364×0.70=\) 255 observaciones.
entrena <- createDataPartition(y = datos$bienestar, p = 0.7, list = FALSE, times = 1)
datos.entrenamiento <- datos[entrena, ] # [renglones, columna]
datos.entrenamiento
## dinero promedio emocional social bienestar
## 1 24.88 87 92 70 91
## 2 25.55 89 68 62 87
## 3 25.35 85 76 55 100
## 4 25.36 85 85 74 72
## 6 23.08 86 81 106 85
## 7 25.26 92 75 60 74
## 8 25.92 88 81 69 93
## 9 25.01 90 75 61 89
## 10 26.73 88 73 54 76
## 12 24.73 93 82 98 76
## 13 25.18 87 80 94 75
## 15 26.60 89 78 85 91
## 17 26.62 93 84 73 72
## 18 25.13 91 70 74 94
## 19 26.48 93 105 66 71
## 20 26.51 86 88 79 74
## 21 24.06 82 78 67 74
## 22 24.81 90 88 58 85
## 24 26.21 95 82 47 87
## 25 23.38 90 88 52 84
## 28 24.65 84 84 72 84
## 29 24.91 90 91 38 74
## 35 24.40 100 85 34 67
## 36 23.42 89 75 71 89
## 37 23.71 87 90 108 99
## 38 23.55 91 81 46 103
## 39 24.91 92 69 87 81
## 40 25.50 88 80 78 87
## 41 25.12 94 71 45 79
## 42 26.76 84 87 44 103
## 43 24.65 91 91 88 78
## 44 27.12 93 88 68 80
## 45 24.97 92 86 84 86
## 48 24.27 87 73 62 81
## 49 25.31 85 75 76 83
## 52 22.74 97 83 73 81
## 54 24.63 89 95 99 95
## 55 24.04 92 77 48 87
## 56 25.10 86 74 69 97
## 58 24.83 92 84 94 80
## 59 23.45 91 101 48 75
## 60 23.49 84 72 68 92
## 62 24.81 95 74 52 78
## 63 25.39 94 91 89 78
## 65 25.23 98 84 60 89
## 66 24.02 97 74 55 72
## 67 25.57 98 97 70 85
## 68 26.62 94 69 61 74
## 69 24.75 86 91 89 77
## 70 23.94 97 104 72 74
## 71 24.65 88 57 84 95
## 72 24.96 96 81 77 77
## 74 26.49 89 69 80 78
## 75 23.96 90 86 80 74
## 77 24.00 91 87 73 89
## 78 23.61 94 73 41 77
## 80 25.36 90 66 91 77
## 81 24.66 91 74 94 81
## 83 22.83 92 67 73 89
## 84 25.63 93 90 64 76
## 85 24.86 91 73 56 85
## 86 23.76 98 68 45 65
## 87 25.53 95 88 73 68
## 89 24.01 88 62 36 85
## 91 25.81 90 84 93 84
## 92 24.71 81 73 51 81
## 93 24.95 81 82 71 112
## 95 25.01 89 75 90 68
## 96 24.88 94 69 89 83
## 98 24.13 87 68 73 65
## 99 24.49 82 63 72 71
## 100 22.92 86 63 47 89
## 101 24.74 81 48 73 76
## 103 24.86 91 62 60 59
## 104 24.51 88 68 90 60
## 105 23.80 88 57 60 48
## 106 25.05 91 75 58 50
## 107 24.87 86 76 58 59
## 108 22.30 85 70 73 61
## 111 25.49 84 68 79 57
## 112 24.87 77 63 64 52
## 113 23.74 87 53 61 55
## 115 23.08 84 66 64 58
## 117 25.47 86 77 59 53
## 118 26.41 82 73 66 65
## 119 25.08 80 91 81 94
## 121 25.75 97 72 38 65
## 122 24.69 86 85 63 72
## 123 23.27 82 55 78 63
## 124 22.86 90 63 56 65
## 126 25.48 81 61 48 58
## 127 26.09 83 68 57 61
## 129 26.02 89 58 76 54
## 131 24.75 78 62 92 80
## 132 25.54 88 59 76 62
## 133 25.20 88 80 66 60
## 134 22.93 92 77 66 60
## 135 25.51 91 63 70 53
## 137 25.36 86 88 61 80
## 140 24.74 80 74 43 73
## 141 24.12 83 50 66 62
## 142 25.74 87 63 52 57
## 145 25.45 86 74 50 74
## 147 24.84 86 79 77 82
## 148 25.35 82 74 58 53
## 150 26.48 86 79 63 70
## 151 24.35 81 85 68 70
## 152 24.74 77 65 59 67
## 153 23.75 81 60 43 67
## 154 25.77 82 63 28 54
## 155 24.09 82 84 40 50
## 156 24.31 98 73 58 55
## 158 25.76 80 59 62 79
## 161 25.83 86 67 64 60
## 162 25.36 80 76 70 63
## 163 25.16 90 59 78 62
## 164 25.96 90 61 96 37
## 166 27.27 91 83 42 47
## 167 26.30 84 75 68 63
## 168 29.95 89 62 62 69
## 169 30.67 85 71 28 66
## 171 28.82 83 81 61 68
## 172 27.92 89 68 59 70
## 173 27.51 76 60 65 53
## 175 27.04 81 77 60 65
## 179 27.53 83 70 81 58
## 180 28.26 79 67 71 42
## 181 27.01 89 59 67 65
## 182 26.94 85 57 36 57
## 183 28.27 76 82 55 70
## 184 28.95 74 65 62 67
## 185 28.73 83 38 62 56
## 187 29.49 76 60 64 64
## 188 28.23 84 56 54 70
## 189 28.28 77 76 61 73
## 191 26.80 81 63 45 75
## 192 28.09 77 51 30 52
## 195 28.34 78 54 27 64
## 196 26.46 80 60 44 75
## 197 27.76 78 73 52 59
## 198 28.51 81 60 68 52
## 201 28.27 79 44 30 31
## 203 27.15 74 66 47 37
## 208 28.44 83 66 18 33
## 210 27.35 82 55 55 43
## 211 29.34 74 82 54 50
## 212 28.33 81 52 40 33
## 213 28.00 84 45 58 44
## 214 29.10 80 64 90 51
## 216 28.10 87 49 28 43
## 217 27.61 77 78 53 37
## 218 27.59 81 66 63 47
## 220 27.46 80 79 65 50
## 221 28.12 68 43 42 38
## 222 29.73 80 56 45 50
## 223 27.96 84 57 53 36
## 224 28.54 77 61 69 66
## 225 29.92 76 52 36 52
## 226 27.76 81 51 55 42
## 227 29.57 77 56 47 27
## 228 28.48 76 69 56 31
## 229 28.04 80 50 74 33
## 231 26.12 78 43 51 51
## 233 29.88 78 69 75 49
## 234 27.97 82 71 36 41
## 235 29.00 84 55 83 32
## 236 28.30 77 55 32 56
## 238 27.76 79 45 11 46
## 239 26.23 75 71 50 42
## 240 27.84 80 59 62 33
## 242 29.11 86 65 54 39
## 243 26.01 85 53 67 30
## 244 28.81 74 43 68 31
## 245 29.10 84 77 53 29
## 246 26.56 74 53 68 47
## 247 29.22 74 50 46 46
## 248 27.22 78 45 53 34
## 249 25.93 83 62 60 50
## 250 28.33 74 44 40 54
## 251 28.26 75 47 44 62
## 252 27.57 83 65 61 63
## 253 26.13 74 63 49 48
## 255 28.33 87 73 28 46
## 256 28.01 82 61 52 42
## 257 28.85 76 73 59 43
## 258 26.47 79 50 57 35
## 259 27.97 82 62 53 45
## 261 27.07 78 64 22 40
## 263 27.91 78 59 46 38
## 264 28.94 80 64 43 46
## 266 33.07 77 62 47 41
## 267 35.23 79 75 57 49
## 268 33.76 79 52 36 48
## 269 34.27 80 71 55 28
## 270 35.43 86 72 54 44
## 272 34.90 86 66 18 45
## 273 34.08 80 68 48 22
## 276 34.84 82 57 58 48
## 277 32.74 78 14 44 31
## 280 36.21 77 48 30 30
## 281 34.08 77 64 49 29
## 282 34.72 75 65 19 36
## 284 34.28 72 46 40 40
## 285 33.58 76 60 60 55
## 286 36.52 75 37 44 39
## 287 34.00 76 51 45 48
## 289 32.01 74 20 44 45
## 292 33.19 73 41 35 23
## 293 34.83 82 52 32 28
## 294 32.85 72 36 24 37
## 296 35.18 78 58 63 43
## 297 34.19 77 53 55 36
## 298 33.31 77 57 42 24
## 299 33.54 73 58 43 43
## 300 33.52 69 42 50 47
## 301 35.21 75 57 62 35
## 302 34.99 72 57 42 26
## 303 35.54 78 49 48 55
## 304 34.29 78 48 32 43
## 305 34.51 76 36 53 56
## 306 33.46 75 46 47 25
## 309 34.19 77 54 33 36
## 310 32.61 83 52 57 48
## 312 34.37 74 65 35 30
## 313 33.00 70 38 77 21
## 314 33.96 75 39 44 39
## 316 32.96 71 53 65 52
## 318 33.39 76 75 30 38
## 319 35.52 75 51 47 64
## 320 34.30 77 63 75 33
## 324 32.91 82 43 74 38
## 326 34.47 73 40 51 43
## 327 34.00 78 51 16 62
## 328 34.62 73 53 38 48
## 329 33.35 77 49 57 36
## 331 33.82 78 60 56 46
## 332 33.19 74 47 45 38
## 333 32.19 74 45 72 43
## 337 32.96 77 46 20 30
## 339 34.28 80 44 43 35
## 340 34.16 78 44 41 35
## 341 32.41 74 35 55 33
## 345 34.16 78 41 59 45
## 346 35.51 75 71 52 49
## 347 33.65 89 45 24 36
## 348 32.03 78 41 40 55
## 349 33.15 72 42 67 20
## 350 32.23 75 53 46 57
## 351 35.09 73 47 53 42
## 352 32.60 79 46 25 38
## 354 33.99 71 56 40 45
## 355 34.26 70 37 25 26
## 357 35.17 76 57 69 28
## 358 32.81 77 47 39 37
## 359 34.22 75 52 88 40
## 363 32.88 69 67 63 33
## 364 33.24 73 44 50 40
Los datos de validación serán aquellos registros que no son de entrenamiento.
datos.validacion <- datos[-entrena, ]
datos.validacion
## dinero promedio emocional social bienestar
## 5 25.90 91 75 60 93
## 11 23.92 94 81 84 83
## 14 26.51 95 83 75 81
## 16 23.16 88 89 88 79
## 23 23.90 88 97 48 93
## 26 25.11 92 91 80 67
## 27 23.54 88 72 69 76
## 30 26.10 94 78 58 86
## 31 23.04 86 80 64 86
## 32 23.55 92 73 76 83
## 33 26.02 91 80 78 67
## 34 23.58 96 76 52 70
## 46 24.21 90 69 84 74
## 47 26.48 86 90 57 87
## 50 25.69 93 103 55 76
## 51 24.50 88 77 92 97
## 53 25.04 97 90 86 81
## 57 25.43 95 81 86 106
## 61 25.02 93 83 55 82
## 64 24.24 95 79 71 86
## 73 23.60 88 86 75 68
## 76 24.76 98 92 59 87
## 79 25.98 86 88 86 91
## 82 24.36 92 94 83 92
## 88 23.41 86 77 78 101
## 90 25.48 90 79 58 83
## 94 25.74 86 62 62 75
## 97 24.35 91 79 67 78
## 102 25.45 85 63 55 62
## 109 24.43 92 87 47 61
## 110 25.59 84 81 74 62
## 114 25.20 82 78 60 50
## 116 26.67 93 41 80 71
## 120 23.20 83 75 70 57
## 125 27.37 87 67 54 70
## 128 25.30 81 87 50 55
## 130 27.45 85 70 76 57
## 136 24.59 85 74 41 64
## 138 24.67 79 88 67 69
## 139 25.08 85 59 73 68
## 143 22.32 82 64 52 56
## 144 24.05 85 68 46 56
## 146 23.71 92 78 27 65
## 149 24.94 80 58 69 51
## 157 24.38 81 98 89 63
## 159 23.91 87 70 73 61
## 160 24.60 82 87 62 58
## 165 27.66 95 63 83 75
## 170 30.06 87 85 61 66
## 174 28.85 80 79 54 71
## 176 28.93 90 80 65 47
## 177 28.38 84 79 67 39
## 178 29.49 82 82 64 75
## 186 27.75 73 49 45 67
## 190 28.15 84 62 90 56
## 193 29.22 80 63 62 69
## 194 27.44 77 62 60 80
## 199 27.76 84 62 73 61
## 200 28.58 84 46 51 67
## 202 26.66 83 62 41 45
## 204 27.59 78 48 55 40
## 205 27.33 80 57 63 37
## 206 27.90 73 60 39 35
## 207 27.08 74 56 42 34
## 209 27.99 84 60 45 69
## 215 29.16 78 71 41 53
## 219 27.09 83 57 36 43
## 230 28.44 84 50 58 32
## 232 26.28 78 82 29 39
## 237 27.99 81 71 55 43
## 241 29.92 81 28 55 52
## 254 27.20 78 59 30 30
## 260 29.43 76 53 36 45
## 262 29.01 78 55 64 37
## 265 33.48 83 59 15 31
## 271 32.86 85 58 34 48
## 274 34.35 73 51 49 27
## 275 32.74 76 27 50 44
## 278 34.15 74 48 37 40
## 279 33.52 76 49 28 57
## 283 35.05 80 74 63 23
## 288 32.44 74 48 54 37
## 290 32.51 72 49 42 37
## 291 34.26 77 32 58 59
## 295 33.86 72 44 58 49
## 307 33.33 68 34 64 37
## 308 34.68 74 38 57 38
## 311 32.94 82 53 68 39
## 315 33.99 76 58 70 39
## 317 33.67 82 44 57 57
## 321 34.40 70 50 53 47
## 322 34.75 80 41 58 33
## 323 33.91 80 29 21 60
## 325 33.91 79 57 23 20
## 330 34.45 82 41 72 35
## 334 33.22 71 71 64 45
## 335 32.01 71 61 71 46
## 336 35.00 77 36 62 41
## 338 34.20 79 57 41 48
## 342 34.55 66 66 49 14
## 343 32.63 72 51 47 38
## 344 32.88 81 42 30 51
## 353 34.94 81 41 76 52
## 356 35.15 77 55 31 33
## 360 35.13 75 42 77 43
## 361 34.51 79 57 28 35
## 362 32.50 74 51 55 51
El modelo se construye a partir de la función lm(data = datos.entrenamiento, formula = bienestar ~ .) y el significado es que la variable dependiente bienestar estará en función de “.” todas las variables independientes.
También se puede indicar la fórmula como sigue: modelo <- lm(data = datos.entrenamiento, formula = bienestar ~ dinero + promedio, emocional + social)
modelo <- lm(data = datos.entrenamiento, formula = bienestar ~ .)
#modelo <- lm(data = datos.entrenamiento, formula = bienestar ~ dinero + promedio, emocional + social)
summary(modelo)
##
## Call:
## lm(formula = bienestar ~ ., data = datos.entrenamiento)
##
## Residuals:
## Min 1Q Median 3Q Max
## -31.944 -9.537 -0.422 8.960 40.772
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 41.29410 19.96755 2.068 0.03965 *
## dinero -1.89520 0.30904 -6.133 0.00000000332 ***
## promedio 0.47983 0.17196 2.790 0.00567 **
## emocional 0.36479 0.07267 5.020 0.00000097737 ***
## social 0.11888 0.05103 2.329 0.02063 *
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 13.04 on 252 degrees of freedom
## Multiple R-squared: 0.5826, Adjusted R-squared: 0.576
## F-statistic: 87.93 on 4 and 252 DF, p-value: < 0.00000000000000022
¿Cuánto vale R square adjusted? en el modelo construido
Se hacen predicciones con los datos de validación y se construye un data.frame para observar lo real contra lo predicho.
\(yˆ =\beta0 + \beta1(x_{1}) + \beta2(x_{2}) + \beta3(x_{3}) + \beta4(x_{4})\)
\(bienestar =\beta0 + \beta1(dinero) + \beta2(promedio) + \beta3(emocional) + \beta4(social)\)
predicciones <- predict(object = modelo, newdata = datos.validacion)
las.predicciones <- data.frame(datos.validacion, predicciones)
las.predicciones
## dinero promedio emocional social bienestar predicciones
## 5 25.90 91 75 60 93 70.36490
## 11 23.92 94 81 84 83 80.59877
## 14 26.51 95 83 75 81 75.82968
## 16 23.16 88 89 88 79 82.55401
## 23 23.90 88 97 48 93 79.31466
## 26 25.11 92 91 80 67 80.55621
## 27 23.54 88 72 69 76 73.37365
## 30 26.10 94 78 58 86 72.28196
## 31 23.04 86 80 64 86 75.68552
## 32 23.55 92 73 76 83 76.47097
## 33 26.02 91 80 78 67 74.10129
## 34 23.58 96 76 52 70 76.57467
## 46 24.21 90 69 84 74 73.75236
## 47 26.48 86 90 57 87 71.98177
## 50 25.69 93 103 55 76 81.34230
## 51 24.50 88 77 92 97 76.11246
## 53 25.04 97 90 86 81 83.43651
## 57 25.43 95 81 86 106 78.45461
## 61 25.02 93 83 55 82 75.31627
## 64 24.24 95 79 71 86 78.19711
## 73 23.60 88 86 75 68 79.08030
## 76 24.76 98 92 59 87 81.96681
## 79 25.98 86 88 86 91 75.64733
## 82 24.36 92 94 83 92 83.42863
## 88 23.41 86 77 78 101 75.55425
## 90 25.48 90 79 58 83 71.90246
## 94 25.74 86 62 62 75 63.76447
## 97 24.35 91 79 67 78 75.59380
## 102 25.45 85 63 55 62 63.36688
## 109 24.43 92 87 47 61 76.46273
## 110 25.59 84 81 74 62 71.44669
## 114 25.20 82 78 60 50 68.46746
## 116 26.67 93 41 80 71 59.83997
## 120 23.20 83 75 70 57 72.83213
## 125 27.37 87 67 54 70 62.02803
## 128 25.30 81 87 50 55 69.89243
## 130 27.45 85 70 76 57 64.62650
## 136 24.59 85 74 41 64 67.34513
## 138 24.67 79 88 67 69 72.51251
## 139 25.08 85 59 73 68 64.74879
## 143 22.32 82 64 52 56 67.86753
## 144 24.05 85 68 46 56 66.77419
## 146 23.71 92 78 27 65 72.16654
## 149 24.94 80 58 69 51 61.77466
## 157 24.38 81 98 89 63 80.28506
## 159 23.91 87 70 73 61 71.93854
## 160 24.60 82 87 62 58 73.12547
## 165 27.66 95 63 83 75 67.30542
## 170 30.06 87 85 61 66 64.32833
## 174 28.85 80 79 54 71 60.24182
## 176 28.93 90 80 65 47 66.56097
## 177 28.38 84 79 67 39 64.59733
## 178 29.49 82 82 64 75 62.27173
## 186 27.75 73 49 45 67 46.95408
## 190 28.15 84 62 90 56 61.56603
## 193 29.22 80 63 62 69 54.65498
## 194 27.44 77 62 60 80 55.98640
## 199 27.76 84 62 73 61 60.28419
## 200 28.58 84 46 51 67 50.27809
## 202 26.66 83 62 41 45 58.08490
## 204 27.59 78 48 55 40 50.48047
## 205 27.33 80 57 63 37 56.16705
## 206 27.90 73 60 39 35 49.96922
## 207 27.08 74 56 42 34 50.90059
## 209 27.99 84 60 45 69 55.79005
## 215 29.16 78 71 41 53 54.23087
## 219 27.09 83 57 36 43 54.85161
## 230 28.44 84 50 58 32 52.83475
## 232 26.28 78 82 29 39 62.27519
## 237 27.99 81 71 55 43 59.55207
## 241 29.92 81 28 55 52 40.20831
## 254 27.20 78 59 30 30 52.26029
## 260 29.43 76 53 36 45 45.59887
## 262 29.01 78 55 64 37 51.41275
## 265 33.48 83 59 15 31 40.97435
## 271 32.86 85 58 34 48 45.00297
## 274 34.35 73 51 49 27 35.65084
## 275 32.74 76 27 50 44 31.50550
## 278 34.15 74 48 37 40 33.98877
## 279 33.52 76 49 28 57 35.43727
## 283 35.05 80 74 63 23 47.73753
## 288 32.44 74 48 54 37 39.25054
## 290 32.51 72 49 42 37 37.09644
## 291 34.26 77 32 58 59 31.87962
## 295 33.86 72 44 58 49 34.61605
## 307 33.33 68 34 64 37 30.76657
## 308 34.68 74 38 57 38 31.71402
## 311 32.94 82 53 68 39 45.62985
## 315 33.99 76 58 70 39 42.82263
## 317 33.67 82 44 57 57 39.65555
## 321 34.40 70 50 53 47 34.22733
## 322 34.75 80 41 58 33 35.67358
## 323 33.91 80 29 21 60 28.48947
## 325 33.91 79 57 23 20 38.46156
## 330 34.45 82 41 72 35 38.86612
## 334 33.22 71 71 64 45 45.91180
## 335 32.01 71 61 71 46 45.38925
## 336 35.00 77 36 62 41 32.41186
## 338 34.20 79 57 41 48 40.05180
## 342 34.55 66 66 49 14 37.38487
## 343 32.63 72 51 47 38 38.19300
## 344 32.88 81 42 30 51 36.73357
## 353 34.94 81 41 76 52 37.93317
## 356 35.15 77 55 31 33 35.37331
## 360 35.13 75 42 77 43 35.17778
## 361 34.51 79 57 28 35 37.91884
## 362 32.50 74 51 55 51 40.35008
Se sometió a prueba un grupo de camiones ligeros con motores que utilizan diesel como combustible para saber si la humedad, la temperatura del aire y la presión barométrica influyen en la cantidad de óxido nitroso que emiten (en ppm). Las emisiones se midieron en distintos momentos y en diversas condiciones experimentales. (Walpole, Myers, and Myers 2012)
humedad <- c(72.4, 41.6, 34.3, 35.1, 10.7, 12.9, 8.3, 20.1, 72.2, 24.0, 23.2, 47.4, 31.5, 10.6, 11.2, 73.3, 75.4, 96.6, 107.4, 54.9)
temperatura <- c(76.3, 70.3, 77.1, 68.0, 79.0, 67.4, 66.8, 76.9, 77.7, 67.7, 76.8, 86.6, 76.9, 86.3, 86.0, 76.3, 77.9,
78.7, 86.8, 70.9)
presion <- c(29.18, 29.35, 29.24, 29.27, 29.78, 29.39, 29.69, 29.48, 29.09, 29.60, 29.38, 29.35, 29.63, 29.56, 29.48, 29.40, 29.28, 29.29, 29.03, 29.37)
oxido.nitroso <- c(0.90, 0.91, 0.96, 0.89, 1.00, 1.10, 1.15, 1.03, 0.77, 1.07, 1.07, 0.94, 1.10, 1.10, 1.10, 0.91, 0.87, 0.78, 0.82, 0.95)
datos <- data.frame(oxido.nitroso, humedad, temperatura, presion)
kable(datos, caption = "Factores ambientales que influyen en la formación de óxido nitroso en motores disel en camiones")
oxido.nitroso | humedad | temperatura | presion |
---|---|---|---|
0.90 | 72.4 | 76.3 | 29.18 |
0.91 | 41.6 | 70.3 | 29.35 |
0.96 | 34.3 | 77.1 | 29.24 |
0.89 | 35.1 | 68.0 | 29.27 |
1.00 | 10.7 | 79.0 | 29.78 |
1.10 | 12.9 | 67.4 | 29.39 |
1.15 | 8.3 | 66.8 | 29.69 |
1.03 | 20.1 | 76.9 | 29.48 |
0.77 | 72.2 | 77.7 | 29.09 |
1.07 | 24.0 | 67.7 | 29.60 |
1.07 | 23.2 | 76.8 | 29.38 |
0.94 | 47.4 | 86.6 | 29.35 |
1.10 | 31.5 | 76.9 | 29.63 |
1.10 | 10.6 | 86.3 | 29.56 |
1.10 | 11.2 | 86.0 | 29.48 |
0.91 | 73.3 | 76.3 | 29.40 |
0.87 | 75.4 | 77.9 | 29.28 |
0.78 | 96.6 | 78.7 | 29.29 |
0.82 | 107.4 | 86.8 | 29.03 |
0.95 | 54.9 | 70.9 | 29.37 |
Variable depeneidnete \(y\) = Oxido Nitroso
Varible independiete \(x1\)= humedad
Varible independiete \(x2\)= temperatura
Varible independiete \(x3\) = presión
Diagrama de dispersión y tendencia lineal
g1 <- ggplot(data = datos, mapping = aes(x = humedad, y = oxido.nitroso)) +
geom_point(color = "forestgreen", size = 2) +
labs(title = 'oxido.nitroso ~ humedad', x = 'humedad') +
geom_smooth(method = "lm", se = FALSE, color = "black") +
theme_bw() +
theme(plot.title = element_text(hjust = 0.5))
g2 <- ggplot(data = datos, mapping = aes(x = temperatura, y = oxido.nitroso)) +
geom_point(color = "orange", size = 2) +
labs(title = 'oxido.nitroso ~ temperatura', x = 'tempertura') +
geom_smooth(method = "lm", se = FALSE, color = "black") +
theme_bw() +
theme(plot.title = element_text(hjust = 0.5))
g3 <- ggplot(data = datos, mapping = aes(x = presion, y = oxido.nitroso)) +
geom_point(color = "darkblue", size = 2) +
labs(title = 'oxido.nitroso ~ presion', x = 'presion') +
geom_smooth(method = "lm", se = FALSE, color = "black") +
theme_bw() +
theme(plot.title = element_text(hjust = 0.5))
g1 + g2 + g3
## `geom_smooth()` using formula 'y ~ x'
## `geom_smooth()` using formula 'y ~ x'
## `geom_smooth()` using formula 'y ~ x'
Generando el modelo de regresión lineal múltiple, el óxido nitroso \(y\) en función ~ de las tres variables \(x_{1}.x_{2},x_{3}\)
Este ejercicio utiliza todos los datos y no incorpora el concepto de datos de entrenamiento y datos de validación.
modelo <- lm(formula = oxido.nitroso ~ ., data = datos)
summary(modelo)
##
## Call:
## lm(formula = oxido.nitroso ~ ., data = datos)
##
## Residuals:
## Min 1Q Median 3Q Max
## -0.11799 -0.02526 0.01345 0.04103 0.06523
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -3.5077781 3.0048641 -1.167 0.26017
## humedad -0.0026250 0.0006549 -4.008 0.00101 **
## temperatura 0.0007989 0.0020451 0.391 0.70121
## presion 0.1541550 0.1013675 1.521 0.14784
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.05617 on 16 degrees of freedom
## Multiple R-squared: 0.8005, Adjusted R-squared: 0.763
## F-statistic: 21.4 on 3 and 16 DF, p-value: 0.000007609
b0 = modelo$coefficients[1]
b1 = modelo$coefficients[2]
b2 = modelo$coefficients[3]
b3 = modelo$coefficients[4]
El resumen del modelo con la función summary(modelo) identifica que las variables temperatura y humedad no son estadísticamente significativas dado que presentan valores por encima de 0.5 en \(Pr(>|t|),\) sólo la humedad es estadísticamente significativa.
\(b0 =\) -3.5077781
\(b1 =\) -0.002625
\(b2 =\) 0.0007989
\(b3 =\) 0.154155
Para 50% de humedad, una temperatura de 76˚F y una presión barométrica de 29.30, ¿cuánto es la cantidad estimada de óxido nitroso emitido?
nuevo.dato <- data.frame(humedad = 50, temperatura = 76, presion =29.30)
prediccion <- predict(modelo, newdata = nuevo.dato)
paste("La cantidad estimada de óxido nitroso emitido es:", round(prediccion, 2))
## [1] "La cantidad estimada de óxido nitroso emitido es: 0.94"
Los valores de Multiple R-squared: 0.8005, Adjusted R-squared: 0.763 representan lo siguiente:
El valor del R2 (Multiple R-squared) es de 0.8005, traduciéndose en que el modelo permite explicar el 80% de la variabilidad del óxido nitroso. El valor del R2 –ajustado es de 0.763, valor que expresa que hay buen ajuste entre los datos reales y los datos modelados de predicción.
La variable que más significado estadístico tiene con relación al óxido nitroso es humedad: humedad **.
Se cree que la energía eléctrica que una planta química consume cada mes se relaciona con:
la temperatura ambiental promedio, x1;
el número de días del mes, x2;
la pureza promedio del producto, x3;
y las toneladas fabricadas del producto, x4.
Se identifica a y como el consumo de energía eléctrica
y <- c(240, 236, 290, 274, 301, 316, 300, 296, 267, 276, 288, 261)
x1 <- c(25, 31, 45, 60, 65, 72, 80, 84, 75, 60, 50, 38)
x2 <- c(24, 21, 24, 25, 25, 26, 25, 25, 24, 25, 25, 23)
x3 <- c(91, 90, 88, 87, 91, 94, 87, 86, 88, 91, 90, 89)
x4 <- c(100, 95, 110, 88, 94, 99, 97, 96, 110, 105, 100, 98)
datos <- data.frame(y, x1, x2, x3, x4)
kable(datos, caption = "Aspectos que se relacionan con el consumo de energía eléctrica en una plata química")
y | x1 | x2 | x3 | x4 |
---|---|---|---|---|
240 | 25 | 24 | 91 | 100 |
236 | 31 | 21 | 90 | 95 |
290 | 45 | 24 | 88 | 110 |
274 | 60 | 25 | 87 | 88 |
301 | 65 | 25 | 91 | 94 |
316 | 72 | 26 | 94 | 99 |
300 | 80 | 25 | 87 | 97 |
296 | 84 | 25 | 86 | 96 |
267 | 75 | 24 | 88 | 110 |
276 | 60 | 25 | 91 | 105 |
288 | 50 | 25 | 90 | 100 |
261 | 38 | 23 | 89 | 98 |
Diagrama de dispersión y tendencia lineal
g1 <- ggplot(data = datos, mapping = aes(x = x1, y = y)) +
geom_point(color = "orange", size = 2) +
labs(title = 'consumo ~ tempertura', x = 'temperatura') +
geom_smooth(method = "lm", se = FALSE, color = "black") +
theme_bw() +
theme(plot.title = element_text(hjust = 0.5))
g2 <- ggplot(data = datos, mapping = aes(x = x2, y = y)) +
geom_point(color = "forestgreen", size = 2) +
labs(title = 'consumo ~ dias de mes', x = 'dias de mes') +
geom_smooth(method = "lm", se = FALSE, color = "black") +
theme_bw() +
theme(plot.title = element_text(hjust = 0.5))
g3 <- ggplot(data = datos, mapping = aes(x = x3, y = y)) +
geom_point(color = "purple", size = 2) +
labs(title = 'consumo ~ purezas del producto', x = 'purezas del producto') +
geom_smooth(method = "lm", se = FALSE, color = "black") +
theme_bw() +
theme(plot.title = element_text(hjust = 0.5))
g4 <- ggplot(data = datos, mapping = aes(x = x4, y = y)) +
geom_point(color = "red", size = 2) +
labs(title = 'consumo ~ produccion toneladas', x = 'produccion toneldas') +
geom_smooth(method = "lm", se = FALSE, color = "black") +
theme_bw() +
theme(plot.title = element_text(hjust = 0.5))
g1 + g2 + g3 + g4
## `geom_smooth()` using formula 'y ~ x'
## `geom_smooth()` using formula 'y ~ x'
## `geom_smooth()` using formula 'y ~ x'
## `geom_smooth()` using formula 'y ~ x'
modelo <- lm(formula = y ~ ., data = datos)
summary(modelo)
##
## Call:
## lm(formula = y ~ ., data = datos)
##
## Residuals:
## Min 1Q Median 3Q Max
## -18.758 -9.952 3.350 6.627 23.311
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -102.71324 207.85885 -0.494 0.636
## x1 0.60537 0.36890 1.641 0.145
## x2 8.92364 5.30052 1.684 0.136
## x3 1.43746 2.39162 0.601 0.567
## x4 0.01361 0.73382 0.019 0.986
##
## Residual standard error: 15.58 on 7 degrees of freedom
## Multiple R-squared: 0.7447, Adjusted R-squared: 0.5989
## F-statistic: 5.106 on 4 and 7 DF, p-value: 0.0303
b0 = modelo$coefficients[1]
b1 = modelo$coefficients[2]
b2 = modelo$coefficients[3]
b3 = modelo$coefficients[4]
b4 = modelo$coefficients[5]
El resumen del modelo con la función summary(modelo) identifica que ninguna de las variables \(x1,x2...x4\) son estadísticamente significativas dado que presentan valores por encima de 0.5 en \(Pr(>|t|).\)
\(b0 =\) -102.7132364
\(b1 =\) 0.6053705
\(b2 =\) 8.9236442
\(b3 =\) 1.4374567
\(b4 =\) 0.0136093
Para un mes en que \(x1 = 75°F, x2 = 24 días, x3 = 90\) y \(x4 = 98\) toneladas. ¿Cúal es la predicción de consumo de energía eléctrica?
nuevo.dato <- data.frame(x1 = 75, x2 = 24, x3 = 90, x4 = 98)
prediccion <- predict(modelo, newdata = nuevo.dato)
paste("La predicción de consumo de energía eléctrica es:", round(prediccion, 2))
## [1] "La predicción de consumo de energía eléctrica es: 287.56"
Las variables independientes no son estadísticamente significativas para la variable dependiente.
Multiple R-squared: 0.7447, Adjusted R-squared: 0.5989
El valor del R2 (Multiple R-squared) es de 0.7447, traduciéndose en que el modelo permite explicar el 74% de la variabilidad del consumo de energía eléctrica. El valor del R2 –ajustado es de 0.5989, valor que expresa que hay un regular ajuste entre los datos reales y los datos modelados de predicción.
En este conjunto de datos tenemos cuatro cuatro variables dependientes y una variable independiente. Sobre las que podemos estimar un modelo logit: bienestar, felicidad y auto realización de una persona.
En estadística, la regresión logística es un tipo de análisis de regresión utilizado para predecir el resultado de una variable categórica (una variable que puede adoptar un número limitado de categorías) en función de las variables independientes o predictoras.
Nos mostrará la variable promedio del rendimiento escolar, todos los datos que generanron con un valor de media y desviación estándar específican cada cosa de cada persona aleatoria, como su promedio, bienestar, emocional, etc. Nos arroja diferentes valores demostrando así lo que representa cada persnas.
Este ejercicio es para probar que el grupo de camiones ligeros con motores utilizan diesel como combustible para saber si la humedad, la temperatura del aire y la presión barométrica influyen en la cantidad de óxido nitroso y así saber los factores ambientales que influyen en la formación de óxido nitroso en motores disel en camiones.
Nos muestra así los valores aleatoriamente y simulados.
Nos muestra valores del consumo de energía que hay diariamente en una planta quimica y el como se relaciona con la temperatura ambiental, así como el número de días del mes, ya que todo esto consume energía.
Walpole, Ronald E., Raymond H. Myers, and Sharon L. Myers. 2012. Probabilidad y Estadística Para Ingeniería y Ciencias. Novena Edición. México: Pearson.