| Peso.en.libras | Longitud.del.rostral | Longitud.de.la.aleta | Longitud.del.rostral.a.la.cola | Longitud.de.la.cola.a.la.aleta | Ancho |
|---|---|---|---|---|---|
| 1.95 | 1.31 | 1.07 | 0.44 | 0.75 | 0.35 |
| 2.90 | 1.55 | 1.49 | 0.53 | 0.90 | 0.47 |
| 0.72 | 0.99 | 0.84 | 0.34 | 0.57 | 0.32 |
| 0.81 | 0.99 | 0.83 | 0.34 | 0.54 | 0.27 |
| 1.09 | 1.01 | 0.90 | 0.36 | 0.64 | 0.30 |
| 1.22 | 1.09 | 0.93 | 0.42 | 0.61 | 0.31 |
| 1.02 | 1.08 | 0.90 | 0.10 | 0.61 | 0.31 |
| 1.93 | 1.27 | 1.08 | 0.44 | 0.77 | 0.36 |
| 0.64 | 0.99 | 0.85 | 0.36 | 0.56 | 0.31 |
| 2.08 | 1.34 | 1.13 | 0.45 | 0.77 | 0.38 |
| 1.98 | 1.30 | 1.10 | 0.45 | 0.76 | 0.36 |
| 1.90 | 1.33 | 1.10 | 0.48 | 0.77 | 0.36 |
| 8.56 | 1.86 | 1.47 | 0.60 | 1.01 | 0.49 |
| 4.49 | 1.58 | 1.34 | 0.52 | 0.95 | 0.43 |
| 8.49 | 1.97 | 1.59 | 0.67 | 1.20 | 0.54 |
| 6.17 | 1.80 | 1.56 | 0.66 | 1.02 | 0.49 |
| 7.54 | 1.75 | 1.58 | 0.63 | 1.18 | 0.52 |
| 6.36 | 1.72 | 1.43 | 0.64 | 1.05 | 0.50 |
| 7.63 | 1.68 | 1.57 | 0.72 | 1.13 | 0.53 |
| 7.78 | 1.75 | 1.59 | 0.68 | 1.20 | 0.51 |
| 10.15 | 2.19 | 1.86 | 0.75 | 1.29 | 0.61 |
| 6.88 | 1.73 | 1.67 | 0.64 | 1.11 | 0.53 |
Taller estimación de parámetros e inferencia sobre el modelo de regresión lineal múltiple.
1 Introduccion
El presente estudio tiene como propósito analizar la relación entre el tamaño de los calamares y las características morfológicas de su boca, con el fin de comprender mejor los factores que determinan su peso, variable de gran interés ecológico dado su papel en la cadena alimenticia de especies depredadoras como los tiburones y atunes. Para ello, se dispone de un conjunto de datos que incluye mediciones de diversas dimensiones físicas del calamar —como la longitud del rostral, la longitud de la aleta, la distancia del rostral a la cola, la longitud de la cola a la aleta y el ancho total— expresadas en pulgadas, junto con el peso en libras.
A través del uso de técnicas de regresión lineal múltiple, se busca estimar los parámetros del modelo que mejor describan la relación entre el peso y las variables explicativas mencionadas. Posteriormente, se realizará un proceso de inferencia estadística tanto para el modelo en su conjunto como para cada uno de los parámetros individuales, utilizando el software R como herramienta de análisis. Este enfoque permitirá determinar qué características influyen significativamente en el peso de los calamares y en qué medida lo hacen, contribuyendo así a una mejor comprensión de la morfología de la especie y su papel dentro del ecosistema marino.
2 Problema
Se realiza un estudio para analizar el tamaño de los calamares consumidor por tiburones y atunes. Las variables regresoras son características de la boca del calamar, los datos son los siguientes:
2.1 Variables
- \(x_1:\) Longitud del rostral (pulgadas)
- \(x_2:\) Longitud de la aleta (pulgadas)
- \(x_3:\) Longitud del rostral a la cola (pulgadas)
- \(x_4:\) Longitud de la cola a la aleta (pulgadas)
- \(x_5:\) Ancho (pulgadas)
- \(y:\) Peso (libras)
3 Estimacion de los parametros del modelo de regresion
3.1 Estimacion de parametros mediante cuadrados minimos
Usando:
\[\beta=(XX^´)^{-1}X^´Y\]
Con los datos del problema:
library(readxl)
Datos_taller_3 <- read_excel("C:/Users/OSCAR}/OneDrive - UPB/David/OneDrive - UPB/Datos taller 3.xlsx")
Peso<- Datos_taller_3$`Peso en libras`
Longitud_Rostral<- Datos_taller_3$`Longitud del rostral`
Longitud_Aleta<- Datos_taller_3$`Longitud de la aleta`
Longitud_Rostral_cola<- Datos_taller_3$`Longitud del rostral a la cola`
Longitud_cola_aleta<- Datos_taller_3$`Longitud de la cola a la aleta`
Ancho<- Datos_taller_3$Ancho
Y <- matrix(Peso, nrow = length(Peso), ncol = 1)
X <- matrix(c(rep(1,length(Peso)),Longitud_Rostral,Longitud_Aleta, Longitud_Rostral_cola, Longitud_cola_aleta,Ancho ), nrow = length(Peso), ncol = 6)
XT<- t(X)
XTX<- XT%*%X
INV_XTX <- solve(XTX)
XTY<- XT%*%Y
BETAS <- INV_XTX%*%XTY
BETAS [,1]
[1,] -6.3139982
[2,] 0.6882341
[3,] -3.7754277
[4,] -0.4878213
[5,] 7.9018456
[6,] 16.6400637
Por lo tanto los parametros estimados para el modelo son:
- \(\hat{\beta}_0=-6.3139982\)
- \(\hat{\beta}_1= 0.6882341\)
- \(\hat{\beta}_2= -3.7754277\)
- \(\hat{\beta}_3= -0.4878213\)
- \(\hat{\beta}_4= 7.9018456\)
- \(\hat{\beta}_5= 16.6400637\)
De los resultados obtenidos en la matriz se tiene la función de regresión estimada:
\[y=-6.3139982 + 0.6882341x_1 -3.775427x_2 -0.4878213x_3 + 7.9018456x_4 + 16.6400637x_5\]
4 Inferencia sobre el modelo completo (analisis de varianza)
4.1 Suma de cuadrados
Para ello se debe calcular la suma de cuadrados del total \(SST\), la suma de cuadrados del error \(SSE\) y la suma de cuadrados del modelo \(SSR\) que se calculan mediante las siguientes ecuaciones:
Suma de cuadrados del total \(SST\)
La suma de cuadrados del error \(SST\) se calcula asi:
\[SST = Y' \left[ I - \left( \frac{1}{n} \right) J \right] Y\] La matriz \(J\) es una matriz definida en la con todos los elementos \([a_{ij}]=1\)
La matriz \(H\) esta definida por:
\[H=X(X^´X)^{-1}X^´\] Suma de cuadrados del error \(SSE\)
La suma de cuadrados del error \(SSE\) se calcula asi:
\[SSE=Y^´(I-H)Y\]
Suma de cuadrados del modelo \(SSR\)
La suma de cuadrados del modelo \(SSR\) se calcula asi:
\[SSR = Y' \left[ H - \left( \frac{1}{n} \right) J \right] Y\]
4.2 Grados de libertad
Para calcular los grados de libertad se utilizan las siguientes ecuaciones:
Grados de libertad del total \(DF_T\)
Los grados de libertad del total \(DF_T\) se calculan asi:
\[DF_T=n-1\]
Grados de libertad del error \(DF_E\)
los grados de libertad del error \(DF_E\) se calculan asi:
\[DF_E=n-p\]
Grados de libertad del modelo \(DF_R\)
Los grados de libertad del modelo \(DF_R\) se calculan asi:
\[DF_R=p-1\]
4.3 Cuadrados medios \(MS\)
Cuadrados medios del total \(MST\)
Los cuadrados medios del total \(MST\) se calculan asi:
\[MST=\frac{SST}{DF_T}\]
Cuadrados medios del error \(MSE\)
Los cuadrados medios del error \(MSE\) se calculan asi:
\[MSE=\frac{SSE}{DF_E}\]
Cuadrados medios del modelo \(MSR\)
Los cuadrados medios del modelo \(MSR\) se calculan asi:
\[MSR=\frac{SSR}{DF_R}\]
4.4 Estadistico de prueba \(F_0\)
El estadistico de prueba \(F_0\) se calcula asi:
\[F_0=\frac{MSR}{MSE}\]
library(readxl)
Datos_taller_3 <- read_excel("C:/Users/OSCAR}/OneDrive - UPB/David/OneDrive - UPB/Datos taller 3.xlsx")
Peso<- Datos_taller_3$`Peso en libras`
Longitud_Rostral<- Datos_taller_3$`Longitud del rostral`
Longitud_Aleta<- Datos_taller_3$`Longitud de la aleta`
Longitud_Rostral_cola<- Datos_taller_3$`Longitud del rostral a la cola`
Longitud_cola_aleta<- Datos_taller_3$`Longitud de la cola a la aleta`
Ancho<- Datos_taller_3$Ancho
Y <- matrix(Peso, nrow = length(Peso), ncol = 1)
X <- matrix(c(rep(1,length(Peso)),Longitud_Rostral,Longitud_Aleta, Longitud_Rostral_cola, Longitud_cola_aleta,Ancho ), nrow = length(Peso), ncol = 6)
XT<- t(X)
XTX<- XT%*%X
INV_XTX <- solve(XTX)
XTY<- XT%*%Y
BETAS <- INV_XTX%*%XTY
BETAS [,1]
[1,] -6.3139982
[2,] 0.6882341
[3,] -3.7754277
[4,] -0.4878213
[5,] 7.9018456
[6,] 16.6400637
J<- matrix(c(rep(1,22*22)),ncol=length(Peso),nrow = length(Peso))
I<- diag(22) #length ventas
YT<- t(Y)
J_sobre_n<- (1/length(Peso))*J
SST <- YT%*%(I-J_sobre_n)%*%Y
SST [,1]
[1,] 215.9248
H<- X%*%INV_XTX%*%XT
SSE<- YT%*%(I-H)%*%Y
SSE [,1]
[1,] 7.418969
SSR<- YT%*%(H-J_sobre_n)%*%Y
SSR [,1]
[1,] 208.5058
# Grados de libertad
DFT<- 22-1
DFE<- 22-6
DFR<- 6-1
MST<- SST/DFT
MST [,1]
[1,] 10.28213
MSE<- SSE/DFE
MSE [,1]
[1,] 0.4636856
MSR<- SSR/DFR
MSR [,1]
[1,] 41.70116
F_0<- MSR/MSE
F_0 [,1]
[1,] 89.93413
qf(0.05, 5, 16, lower.tail = FALSE)[1] 2.852409
p_value<- pf(F_0,DFR, DFE, lower.tail = FALSE)
p_value [,1]
[1,] 3.92017e-11
4.5 Planteaminto de hipotesis
\[H_0: \beta_1=\beta_2...=\beta_5=0\]
\[H_1: \beta_k\neq0\quad \text{para el menos un k}; k=1,2,3,4,5,6 \]
Teniendo en cuenta el estadistico de prueba calculado:
- \(F_0=89.93413\)
El estadistico teorico:
- \(F_{\alpha,p-1,n-p}\)= 2.852409
Y el P-value:
- \(P\text{-value}=\) 3.92017e-11
Sabiendo que:
\[ \text{Rechazo H0 si:} \quad F_0> F_{\alpha,p-1,n-p}\]
Comparando ambos resultados para un nivel de significancia \(\alpha=0.05\), \(F_0=89.93413 > F_{\alpha,p-1,n-p}= 2.852409\) y \(P\text{-value}= 3.92017e^{-11} < \alpha=0.05\) por lo que existe evidencia estadistica suficiente para rechazar \(H_0\), por lo tanto al menos un \(\beta_k\neq0\) se puede concluir que la variable respuesta peso esta relacionado con al menos una de las variables regresoras (la longitud del rostral , la longitud de la aleta , la longitud del rostral a la cola , la longitud de la cola a la aleta y el ancho) y se puede decir que el modelo de regresion es significativo
5 Inferencia sobre los parametros \(\beta\)
Los estimadores \(\hat{\beta}\) obtenidos mediante mínimos cuadrados (o máxima verosimilitud) son insesgados
\[E \left[\hat{\beta} \right]\]
La matriz de varianza covarianza se puede estimar usando la matriz \(S^2(\hat{\beta})\) que esta dada por:
\[S^2(\hat{\beta})= MSE(X^´X)^{-1}\]
library(readxl)
Datos_taller_3 <- read_excel("C:/Users/OSCAR}/OneDrive - UPB/David/OneDrive - UPB/Datos taller 3.xlsx")
Peso<- Datos_taller_3$`Peso en libras`
Longitud_Rostral<- Datos_taller_3$`Longitud del rostral`
Longitud_Aleta<- Datos_taller_3$`Longitud de la aleta`
Longitud_Rostral_cola<- Datos_taller_3$`Longitud del rostral a la cola`
Longitud_cola_aleta<- Datos_taller_3$`Longitud de la cola a la aleta`
Ancho<- Datos_taller_3$Ancho
Y <- matrix(Peso, nrow = length(Peso), ncol = 1)
X <- matrix(c(rep(1,length(Peso)),Longitud_Rostral,Longitud_Aleta, Longitud_Rostral_cola, Longitud_cola_aleta,Ancho ), nrow = length(Peso), ncol = 6)
XT<- t(X)
XTX<- XT%*%X
INV_XTX <- solve(XTX)
XTY<- XT%*%Y
BETAS <- INV_XTX%*%XTY
BETAS [,1]
[1,] -6.3139982
[2,] 0.6882341
[3,] -3.7754277
[4,] -0.4878213
[5,] 7.9018456
[6,] 16.6400637
BETA0<- BETAS[1,1]
BETA1<- BETAS[2,1]
BETA2<- BETAS[3,1]
BETA3<- BETAS[4,1]
BETA4<- BETAS[5,1]
BETA5<- BETAS[6,1]
I<- diag(22) #length ventas
YT<- t(Y)
H<- X%*%INV_XTX%*%XT
SSE<- YT%*%(I-H)%*%Y
DFE<- 22-6
MSE<- SSE/DFE
MSE<- MSE[1,1]
VAR_COV<- MSE*(solve(t(X)%*%X))
VAR_COV [,1] [,2] [,3] [,4] [,5] [,6]
[1,] 0.59227914 -0.9899985 -0.4723280 0.04671064 0.8369069 1.583482
[2,] -0.98999855 6.5960788 -0.5049095 0.47920440 -6.8848429 -5.083705
[3,] -0.47232803 -0.5049095 6.3087098 -1.27245481 -5.5070644 -2.987880
[4,] 0.04671064 0.4792044 -1.2724548 5.78401736 -0.8916651 -2.841432
[5,] 0.83690693 -6.8848429 -5.5070644 -0.89166507 16.6569520 5.049599
[6,] 1.58348231 -5.0837052 -2.9878797 -2.84143165 5.0495988 14.564931
Teniendo la matriz de varianza-covarianza se pueden realizar las pruebas de hipótesis para cada uno de los \(\beta_k\)
5.1 Inferencia para \(\beta_0\)
Hipotesis
\[H_0:\beta_0=0\]
\[H_1:\beta_0\neq0\]
El estadístico de prueba se calcularía de la siguiente manera:
\[t_{0_{\beta_0}}=\frac{\hat{\beta_0}}{S\hat{\beta_0}}\]
\(\hat{\beta_0}\) se calculo mediante cuadrados minimos y es igual a \(\hat{\beta_0}=6.3139982\)
\(S^2\hat{\beta_0}\) se puede tomar de la matriz varianza-covarianza y con él, se puede calcular \(S\hat{\beta_0}\) y el estadistico de prueba \(t_{0_{\beta_0}}\)
S_BETA0<- sqrt(VAR_COV[1,1])
S_BETA0[1] 0.7695967
t_0_BETA0<- BETA0/S_BETA0
t_0_BETA0[1] -8.204294
Y el cuantil teorico o estadistico teorico \(t_{1-\frac{\alpha}{2},16}\) para un nivel de significancia \(\alpha=0.05\) corresponde a:
CUANTIL_TEORICO<- qt(1-(0.05/2),16)
CUANTIL_TEORICO[1] 2.119905
Calculamos tambien el \(p\text{-value}\) para \(\beta_0\)
P_VALUE_BETA0<- 2*pt(abs(t_0_BETA0),16,lower.tail = FALSE)
P_VALUE_BETA0[1] 3.992037e-07
Como:
\[|t_{0_{\beta_0}}|=8.204294 \ngtr t_{1-\frac{\alpha}{2},16}=2.119905\]
\[p\text{-value}_{\beta_0}= 3.992037e^{-07} < \alpha=0.05\]
Se encuentra evidencia estadistica suficiente para rechazar \(H_0\) por lo tanto \(\beta_k\neq0\). Dentro del modelo el intersecto es significativo para la variable respuesta Peso
5.2 Inferencia para \(\beta_1\)
Hipotesis
\[H_0:\beta_1=0\]
\[H_1:\beta_1\neq0\]
El estadístico de prueba se calcularía de la siguiente manera:
\[t_{0_{\beta_1}}=\frac{\hat{\beta_1}}{S\hat{\beta_1}}\]
\(\hat{\beta_1}\) se calculo mediante cuadrados minimos y es igual a \(\hat{\beta_1}=0.6882341\)
\(S^2\hat{\beta_1}\) se puede tomar de la matriz varianza-covarianza y con él, se puede calcular \(S\hat{\beta_1}\) y el estadistico de prueba \(t_{0_{\beta_1}}\)
S_BETA1<- sqrt(VAR_COV[2,2])
S_BETA1[1] 2.568283
t_0_BETA1<- BETA1/S_BETA1
t_0_BETA1[1] 0.2679744
Y el cuantil teorico o estadistico teorico \(t_{1-\frac{\alpha}{2},16}\) para un nivel de significancia \(\alpha=0.05\) corresponde a:
CUANTIL_TEORICO<- qt(1-(0.05/2),16)
CUANTIL_TEORICO[1] 2.119905
Calculamos tambien el \(p\text{-value}\) para \(\beta_1\)
P_VALUE_BETA1<- 2*pt(abs(t_0_BETA1),16,lower.tail = FALSE)
P_VALUE_BETA1[1] 0.7921431
Como:
\[|t_{0_{\beta_1}}|=0.2679744 \ngtr t_{1-\frac{\alpha}{2},16}=2.119905\]
\[p\text{-value}_{\beta_1}= 0.7921431 < \alpha=0.05\]
No se encuentra evidencia estadistica suficiente para rechazar \(H_0\) por lo tanto \(\beta_1 =0\). Dentro del modelo la variable regresora longitud del rostral no es significativa para la variable respuesta Peso
5.3 Inferencia para \(\beta_2\)
Hipotesis
\[H_0:\beta_2=0\]
\[H_1:\beta_2\neq0\]
El estadístico de prueba se calcularía de la siguiente manera:
\[t_{0_{\beta_2}}=\frac{\hat{\beta_2}}{S\hat{\beta_2}}\]
\(\hat{\beta_2}\) se calculo mediante cuadrados minimos y es igual a \(\hat{\beta_2}=-3.7754277\)
\(S^2\hat{\beta_2}\) se puede tomar de la matriz varianza-covarianza y con él, se puede calcular \(S\hat{\beta_2}\) y el estadistico de prueba \(t_{0_{\beta_2}}\)
S_BETA2<- sqrt(VAR_COV[3,3])
S_BETA2[1] 2.511715
t_0_BETA2<- BETA2/S_BETA2
t_0_BETA2[1] -1.503128
Y el cuantil teorico o estadistico teorico \(t_{1-\frac{\alpha}{2},16}\) para un nivel de significancia \(\alpha=0.05\) corresponde a:
CUANTIL_TEORICO<- qt(1-(0.05/2),16)
CUANTIL_TEORICO[1] 2.119905
Calculamos tambien el \(p\text{-value}\) para \(\beta_2\)
P_VALUE_BETA2<- 2*pt(abs(t_0_BETA2),16,lower.tail = FALSE)
P_VALUE_BETA2[1] 0.1522865
Como:
\[|t_{0_{\beta_2}}|=1.503128 \ngtr t_{1-\frac{\alpha}{2},16}=2.119905\]
\[p\text{-value}_{\beta_2}= 0.15228651 < \alpha=0.05\]
No se encuentra evidencia estadistica suficiente para rechazar \(H_0\) por lo tanto \(\beta_2 =0\). Dentro del modelo la variable regresora longitud de la aleta no es significativa para la variable respuesta Peso
5.4 Inferencia para \(\beta_3\)
Hipotesis
\[H_0:\beta_3=0\]
\[H_1:\beta_3\neq0\]
El estadístico de prueba se calcularía de la siguiente manera:
\[t_{0_{\beta_3}}=\frac{\hat{\beta_3}}{S\hat{\beta_3}}\]
\(\hat{\beta_3}\) se calculo mediante cuadrados minimos y es igual a \(\hat{\beta_3}=-0.4878213\)
\(S^2\hat{\beta_3}\) se puede tomar de la matriz varianza-covarianza y con él, se puede calcular \(S\hat{\beta_3}\) y el estadistico de prueba \(t_{0_{\beta_3}}\)
S_BETA3<- sqrt(VAR_COV[4,4])
S_BETA3[1] 2.404998
t_0_BETA3<- BETA3/S_BETA3
t_0_BETA3[1] -0.2028364
Y el cuantil teorico o estadistico teorico \(t_{1-\frac{\alpha}{2},16}\) para un nivel de significancia \(\alpha=0.05\) corresponde a:
CUANTIL_TEORICO<- qt(1-(0.05/2),16)
CUANTIL_TEORICO[1] 2.119905
Calculamos tambien el \(p\text{-value}\) para \(\beta_3\)
P_VALUE_BETA3<- 2*pt(abs(t_0_BETA3),16,lower.tail = FALSE)
P_VALUE_BETA3[1] 0.8418198
Como:
\[|t_{0_{\beta_3}}|=0.2028364 \ngtr t_{1-\frac{\alpha}{2},16}=2.119905\]
\[p\text{-value}_{\beta_3}= 0.8418198 < \alpha=0.05\]
No se encuentra evidencia estadistica suficiente para rechazar \(H_0\) por lo tanto \(\beta_3 =0\). Dentro del modelo la variable regresora longitud del rostral a la cola no es significativa para la variable respuesta Peso
5.5 Inferencia para \(\beta_4\)
Hipotesis
\[H_0:\beta_4=0\]
\[H_1:\beta_4\neq0\]
El estadístico de prueba se calcularía de la siguiente manera:
\[t_{0_{\beta_4}}=\frac{\hat{\beta_4}}{S\hat{\beta_4}}\]
\(\hat{\beta_4}\) se calculo mediante cuadrados minimos y es igual a \(\hat{\beta_4}=7.9018456\)
\(S^2\hat{\beta_4}\) se puede tomar de la matriz varianza-covarianza y con él, se puede calcular \(S\hat{\beta_4}\) y el estadistico de prueba \(t_{0_{\beta_4}}\)
S_BETA4<- sqrt(VAR_COV[5,5])
S_BETA4[1] 4.081293
t_0_BETA4<- BETA4/S_BETA4
t_0_BETA4[1] 1.936113
Y el cuantil teorico o estadistico teorico \(t_{1-\frac{\alpha}{2},16}\) para un nivel de significancia \(\alpha=0.05\) corresponde a:
CUANTIL_TEORICO<- qt(1-(0.05/2),16)
CUANTIL_TEORICO[1] 2.119905
Calculamos tambien el \(p\text{-value}\) para \(\beta_4\)
P_VALUE_BETA4<- 2*pt(abs(t_0_BETA4),16,lower.tail = FALSE)
P_VALUE_BETA4[1] 0.07072393
Como:
\[|t_{0_{\beta_4}}|=1.936113 \ngtr t_{1-\frac{\alpha}{2},16}=2.119905\]
\[p\text{-value}_{\beta_4}= 0.07072393 < \alpha=0.05\]
No se encuentra evidencia estadistica suficiente para rechazar \(H_0\) por lo tanto \(\beta_4=0\). Dentro del modelo la variable regresora longitud de la cola a la aleta no es significativa para la variable respuesta Peso
5.6 Inferencia para \(\beta_5\)
Hipotesis
\[H_0:\beta_5=0\]
\[H_1:\beta_5\neq0\]
El estadístico de prueba se calcularía de la siguiente manera:
\[t_{0_{\beta_5}}=\frac{\hat{\beta_5}}{S\hat{\beta_5}}\]
\(\hat{\beta_5}\) se calculo mediante cuadrados minimos y es igual a \(\hat{\beta_5}=16.6400637\)
\(S^2\hat{\beta_5}\) se puede tomar de la matriz varianza-covarianza y con él, se puede calcular \(S\hat{\beta_5}\) y el estadistico de prueba \(t_{0_{\beta_5}}\)
S_BETA5<- sqrt(VAR_COV[6,6])
S_BETA5[1] 3.816403
t_0_BETA5<- BETA5/S_BETA5
t_0_BETA5[1] 4.360143
Y el cuantil teorico o estadistico teorico \(t_{1-\frac{\alpha}{2},16}\) para un nivel de significancia \(\alpha=0.05\) corresponde a:
CUANTIL_TEORICO<- qt(1-(0.05/2),16)
CUANTIL_TEORICO[1] 2.119905
Calculamos tambien el \(p\text{-value}\) para \(\beta_5\)
P_VALUE_BETA5<- 2*pt(abs(t_0_BETA5),16,lower.tail = FALSE)
P_VALUE_BETA5[1] 0.0004858575
Como:
\[|t_{0_{\beta_5}}|=4.360143 \ngtr t_{1-\frac{\alpha}{2},16}=2.119905\]
\[p\text{-value}_{\beta_4}= 0.0004858575 < \alpha=0.05\]
Se encuentra evidencia estadistica suficiente para rechazar \(H_0\) por lo tanto \(\beta_5 \neq 0\). Dentro del modelo la variable regresora Ancho es significativa y afecta a la variable respuesta Peso