La siguiente tabla relaciona la solubilidad del nitrato de sodio \((Na NO_3)\) con la temperatura del agua. A la temperatura indicada, las \(y\) partes de sodio se disuelven en 100 partes de agua.
\(x:\) temperatura del agua
\(y:\) solubilidad del \(NaNO_3\)
\[ \begin{array}{|r|r|} \hline \mbox{t }^\circ C \; H_2O & \mbox{Solub.} \; NaNO_3 \\ \hline 0 & 66,7 \\ 3 & 69,0 \\ 4 & 71,0 \\ 5 & 73,0 \\ 8 & 75,0 \\ 10 & 76,3 \\ 15 & 80,6 \\ 21 & 85,7 \\ 29 & 92,9 \\ 36 & 99,4 \\ 51 & 113,6 \\ 55 & 115,0 \\ 60 & 120,0 \\ 68 & 125,1 \\ \hline \end{array} \]
Estime los parámetros de la recta de regresion
Calcule la varianza residual
Estime el coeficiente de correlación lineal
Verifique con un nivel de significación del 1% si el coeficiente de correlación lineal es significativo y superior a 0,80
Estime con una confianza del 95% la solubilidad del nitrato de sodio \(NaNO_3\) cuando la temperatura del agua es de 18°C
Calculamos \(SCx\), \(SCy\), \(SPxy\).
x <- c(0, 3, 4, 5, 8, 10, 15, 21, 29, 36, 51, 55, 60, 68)
y <- c(66.7, 69, 71, 73, 75, 76.3, 80.6, 85.7, 92.9, 99.4, 113.6, 115, 120, 125.1)
n <- length(x)
sum(x)
[1] 365
sum(x^2)
[1] 16867
sum(y)
[1] 1263.3
sum(y^2)
[1] 119558.2
sum(x*y)
[1] 39325.6
SCx <- sum(x^2) - n * mean(x)^2
SCx
[1] 7350.929
SCy <- sum(y^2) - n * mean(y)^2
SCy
[1] 5563.392
SPxy <- sum(x*y) - n * mean(x) * mean(y)
SPxy
[1] 6389.564
tabla <- data.frame(
Sumas = c("x","x²","y","y²","xy","SCx","SCy","SPxy"),
val = c(sum(x),sum(x^2),sum(y),sum(y^2),sum(x*y),SCx,SCy,SPxy)
)
tabla
b1 <- SPxy / SCx
b1
[1] 0.8692187
\[ b_0 = \overline{y} - b_1 \cdot \overline{x} \]
b0 <- mean(y) - b1 * mean(x)
b0
[1] 67.57394
\(\Rightarrow\) La recta de regresión es \[ \hat{y} = 67,57 + 0,869 x \]
plot(x,y, xlab = "Temperatura del agua", ylab = "Solubilidad", title("nitrato de sodio") )
regresion <- lm(y~x)
abline(regresion)
grid()
summary(regresion)
Call:
lm(formula = y ~ x)
Residuals:
Min 1Q Median 3Q Max
-1.58081 -0.31761 0.01082 0.42247 1.69591
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 67.57394 0.35952 187.96 <2e-16 ***
x 0.86922 0.01036 83.92 <2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 0.8881 on 12 degrees of freedom
Multiple R-squared: 0.9983, Adjusted R-squared: 0.9982
F-statistic: 7042 on 1 and 12 DF, p-value: < 2.2e-16
\[ R^2 = \frac{b_1^2 SCx}{SCy} \]
R2 <- b1^2 * SCx / SCy
R2
[1] 0.9982989
Se2 <- ( SCy - b1^2 * SCx )/( n-2 )
Se2
[1] 0.7886361
r <- SPxy / sqrt(SCx * SCy)
r
[1] 0.9991491
Observación: El coeficiente de correlación lineal al cuadrado es igual al coeficiente de determinación.
El valor de \(r_c\) lo buscamos en la tabla para \(n=14\) y un nivel de significación del 1%
Como 0,998 > 0,661 \(\Rightarrow\) Rechazamos la \(H_0 \rightarrow \rho\) es significativo
La recta de regresión es \[ \hat{y} = 67,57 + 0,869 x \] Por lo tanto \(y(18)\)
y0 <- b0 + b1 *18
y0
[1] 83.21988
\[ \hat{y}(x_0) \pm t_{(n-2)} \sqrt{ \hat{V}(x_0)} \]
x0 <- 18
ts <- qt(1-0.05/2, df = n - 2)
Vy <- Se2 * (1 + 1/n + (x0 - mean(x))^2 / SCx )
Li <- y0 - ts * sqrt(Vy)
Ls <- y0 + ts * sqrt(Vy)
I <- c(Li,Ls)
I
[1] 81.20880 85.23095
El intervalo es: [81.208;85.23095]