Determinar predicciones de datos bajo el modelo de regresión lineal simple.
De un conjunto de datos con dos variables (bivariable) en donde una de ellas es \(X\) variable independiente y otra de ellas \(Y\) variable dependiente, predecir el valor de Y conforme la historia de X.
\[Y = a + bx\]
En donde:
\[ b = r \cdot(\frac{ s_{y}}{s_x}) = r \cdot \frac{\sqrt{ \frac{\sum_{i=1}^n(y_i- \bar{y})^2}{n-1}}} {\sqrt{ \frac{\sum_{i=1}^n(x_i- \bar{x})^2}{n-1}}} \]
En donde:
\(r\) es el coeficiente de correlación.
\(S_y\) es la desviación estándar de \(y\). \(\text {es el denominador}\)
\(S_x\) es la desviación estándar de la variable \(x\). \(\text{es el numerador}\)
\[a = \bar{y} - b \cdot\bar{x}\]
Se cagan funciones previamente codificadas
| goles | puntos | media.x | media.y | x_menos_media.x | y_menos_media.y | x_menos_media.x_cuad | y_menos_media.y_cuad | x_menos_media.x_cuad_POR_y_menos_media.y_cuad | |
|---|---|---|---|---|---|---|---|---|---|
| 1 | 8 | 9 | 6.3 | 6.7 | 1.7 | 2.3 | 2.89 | 5.29 | 3.91 |
| 2 | 4 | 3 | 6.3 | 6.7 | -2.3 | -3.7 | 5.29 | 13.69 | 8.51 |
| 3 | 4 | 5 | 6.3 | 6.7 | -2.3 | -1.7 | 5.29 | 2.89 | 3.91 |
| 4 | 6 | 8 | 6.3 | 6.7 | -0.3 | 1.3 | 0.09 | 1.69 | -0.39 |
| 5 | 8 | 8 | 6.3 | 6.7 | 1.7 | 1.3 | 2.89 | 1.69 | 2.21 |
| 6 | 7 | 7 | 6.3 | 6.7 | 0.7 | 0.3 | 0.49 | 0.09 | 0.21 |
| 7 | 6 | 5 | 6.3 | 6.7 | -0.3 | -1.7 | 0.09 | 2.89 | 0.51 |
| 8 | 5 | 6 | 6.3 | 6.7 | -1.3 | -0.7 | 1.69 | 0.49 | 0.91 |
| 9 | 7 | 6 | 6.3 | 6.7 | 0.7 | -0.7 | 0.49 | 0.49 | -0.49 |
| 10 | 8 | 10 | 6.3 | 6.7 | 1.7 | 3.3 | 2.89 | 10.89 | 5.61 |
| Sumatorias | 63 | 67 | 63.0 | 67.0 | 0.0 | 0.0 | 22.10 | 40.10 | 24.90 |
\[ b = r \cdot(\frac{ s_{y}}{s_x}) = r \cdot \frac{\sqrt{ \frac{\sum_{i=1}^n(y_i- \bar{y})^2}{n-1}}} {\sqrt{ \frac{\sum_{i=1}^n(x_i- \bar{x})^2}{n-1}}} = cor(datos) \cdot \frac{ds(datos$goles)}{ds(datos$puntos)} \therefore \]
\[ b = 0.836432 \cdot \frac{2.110819}{1.567021} = 1.126697 \]
\[ a = \bar{y} - b \cdot\bar{x} \therefore \]
\[ a = 6.7 - 1.126697 \cdot 6.3 = -0.39819 \]
\[ Y = a + bx = -0.39819 + 1.126697 \cdot 4 = 4.108597 \]
Se construye un modelo de regresión lineal simple con los datos y la fórmula en donde los puntos dependen de los goles. puntos ~ goles
Call:
lm(formula = puntos ~ goles, data = datos)
Residuals:
Min 1Q Median 3Q Max
-1.48869 -0.98529 -0.05204 0.85973 1.63801
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -0.3982 1.6896 -0.236 0.81960
goles 1.1267 0.2610 4.317 0.00256 **
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 1.227 on 8 degrees of freedom
Multiple R-squared: 0.6996, Adjusted R-squared: 0.6621
F-statistic: 18.63 on 1 and 8 DF, p-value: 0.002558
R Square significa que los goles representan y explican aproximadamente el 69% a la variable puntos.
La presión arterial es la fuerza que la sangre ejerce contra las paredes arteriales. Se mide y se registra con dos números.
El primer número, presión arterial sistólica, es causada cuando el corazón se contrae y empuja la sangre hacia afuera.
El segundo número, presión arterial diastólica, es la presión que ocurre cuando el corazón se relaja y se llena de sangre.
Se expresa colocando la presión arterial sistólica sobre el número de la presión arterial diastólica, por ejemplo, 138/72. La presión normal para adultos se define como una presión sistólica de menos de 120 y una presión diastólica de menos de 80. Esto se indica como 120/80.
Por lo general, se presta más atención a la presión arterial sistólica (el primer número) como factor de riesgo principal de enfermedades cardiovasculares en personas mayores de 50 años
temperatura sistolica diastolica sis_dis
Min. : 3.00 Min. :102.0 Min. : 66.00 120/90 : 48
1st Qu.:12.00 1st Qu.:114.0 1st Qu.: 78.00 116/81 : 20
Median :12.00 Median :117.0 Median : 82.00 119/89 : 20
Mean :14.35 Mean :116.5 Mean : 83.09 109/79 : 19
3rd Qu.:17.03 3rd Qu.:119.0 3rd Qu.: 88.00 110/80 : 19
Max. :28.00 Max. :131.0 Max. :102.00 115/78 : 18
(Other):556
Call:
lm(formula = sistolica ~ temperatura, data = datos)
Residuals:
Min 1Q Median 3Q Max
-11.1002 -1.8937 -0.0009 2.3157 12.5237
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 105.17964 0.40632 258.86 <0.0000000000000002 ***
temperatura 0.79205 0.02691 29.43 <0.0000000000000002 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 3.343 on 698 degrees of freedom
Multiple R-squared: 0.5537, Adjusted R-squared: 0.5531
F-statistic: 866.1 on 1 and 698 DF, p-value: < 0.00000000000000022
\[ Y = 105.1796 +0.7920 \cdot x_i \]
R Squared significa que la temperatura representa y explican aproximadamente el 55% a la variable presión sistólica.
prediccion <- predict(object = modelo, newdata = data.frame(temperatura = c(28.5)))
paste("Para una persona que se toma la presión en una temperatur abiente de 28.5 grados, la predicción sería ", round(prediccion), "de presión arterial")[1] "Para una persona que se toma la presión en una temperatur abiente de 28.5 grados, la predicción sería 128 de presión arterial"
https://www.nia.nih.gov/espanol/presion-arterial-alta#que