Crear modelo de regresión

modelo <- lm(PUNT_GLOBAL ~ ESTU_GENERO + ESTU_TIENEETNIA + ESTU_DEPTO_RESIDE + FAMI_ESTRATOVIVIENDA + COLE_NATURALEZA + PUNT_LECTURA_CRITICA + PUNT_MATEMATICAS + PUNT_C_NATURALES + PUNT_SOCIALES_CIUDADANAS + PUNT_INGLES)

Resumen del modelo

summary(modelo)
## 
## Call:
## lm(formula = PUNT_GLOBAL ~ ESTU_GENERO + ESTU_TIENEETNIA + ESTU_DEPTO_RESIDE + 
##     FAMI_ESTRATOVIVIENDA + COLE_NATURALEZA + PUNT_LECTURA_CRITICA + 
##     PUNT_MATEMATICAS + PUNT_C_NATURALES + PUNT_SOCIALES_CIUDADANAS + 
##     PUNT_INGLES)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -0.6054 -0.1759 -0.0116  0.1696  0.6192 
## 
## Coefficients:
##                                   Estimate Std. Error t value Pr(>|t|)    
## (Intercept)                       0.561568   0.316951   1.772   0.0801 .  
## ESTU_GENEROM                     -0.139223   0.208523  -0.668   0.5062    
## ESTU_TIENEETNIASi                -0.154678   0.103100  -1.500   0.1373    
## ESTU_DEPTO_RESIDEARAUCA           0.139780   0.241130   0.580   0.5637    
## ESTU_DEPTO_RESIDEATLANTICO       -0.178729   0.170676  -1.047   0.2980    
## ESTU_DEPTO_RESIDEBOGOTÃ\u0081    -0.012284   0.164419  -0.075   0.9406    
## ESTU_DEPTO_RESIDEBOLIVAR         -0.147907   0.187332  -0.790   0.4320    
## ESTU_DEPTO_RESIDEBOYACA          -0.116444   0.328179  -0.355   0.7236    
## ESTU_DEPTO_RESIDECASANARE        -0.212254   0.257638  -0.824   0.4124    
## ESTU_DEPTO_RESIDECAUCA           -0.429185   0.245677  -1.747   0.0843 .  
## ESTU_DEPTO_RESIDECESAR            0.084244   0.188216   0.448   0.6556    
## ESTU_DEPTO_RESIDECHOCO            0.123590   0.386323   0.320   0.7498    
## ESTU_DEPTO_RESIDECORDOBA         -0.191209   0.185117  -1.033   0.3046    
## ESTU_DEPTO_RESIDECUNDINAMARCA    -0.154132   0.184098  -0.837   0.4048    
## ESTU_DEPTO_RESIDEHUILA           -0.508629   0.287098  -1.772   0.0801 .  
## ESTU_DEPTO_RESIDELA GUAJIRA      -0.265521   0.230296  -1.153   0.2522    
## ESTU_DEPTO_RESIDEMAGDALENA       -0.234528   0.208034  -1.127   0.2628    
## ESTU_DEPTO_RESIDEMETA            -0.021957   0.212080  -0.104   0.9178    
## ESTU_DEPTO_RESIDENORTE SANTANDER -0.112338   0.213478  -0.526   0.6001    
## ESTU_DEPTO_RESIDEQUINDIO          0.130221   0.332012   0.392   0.6959    
## ESTU_DEPTO_RESIDESANTANDER       -0.219618   0.219843  -0.999   0.3207    
## ESTU_DEPTO_RESIDESUCRE           -0.023145   0.185715  -0.125   0.9011    
## ESTU_DEPTO_RESIDEVALLE           -0.133133   0.223576  -0.595   0.5531    
## FAMI_ESTRATOVIVIENDAEstrato 1    -0.325982   0.139747  -2.333   0.0221 *  
## FAMI_ESTRATOVIVIENDAEstrato 2    -0.279375   0.141202  -1.979   0.0511 .  
## FAMI_ESTRATOVIVIENDAEstrato 3    -0.206605   0.148832  -1.388   0.1688    
## FAMI_ESTRATOVIVIENDAEstrato 4    -0.312775   0.150104  -2.084   0.0402 *  
## FAMI_ESTRATOVIVIENDAEstrato 5    -0.014870   0.330626  -0.045   0.9642    
## FAMI_ESTRATOVIVIENDASin Estrato  -0.202827   0.240313  -0.844   0.4011    
## COLE_NATURALEZAOFICIAL            0.024173   0.075461   0.320   0.7495    
## PUNT_LECTURA_CRITICA              1.150021   0.004859 236.678   <2e-16 ***
## PUNT_MATEMATICAS                  1.159515   0.004417 262.537   <2e-16 ***
## PUNT_C_NATURALES                  1.148001   0.004754 241.486   <2e-16 ***
## PUNT_SOCIALES_CIUDADANAS          1.156887   0.003643 317.573   <2e-16 ***
## PUNT_INGLES                       0.384491   0.003967  96.925   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.2859 on 84 degrees of freedom
## Multiple R-squared:      1,  Adjusted R-squared:      1 
## F-statistic: 1.165e+05 on 34 and 84 DF,  p-value: < 2.2e-16

Hipótesis:

H0: B0 = 0

H1: B0 ≠ 0

Si el valor p > 0.05, entonces se acepta la H0.

Todos los valores que estén estadísticamente cercanos a 1 se consideran no significativos estadísticamente.

Selección de Variables:

seleccion <- stepAIC(modelo, direction = c("both"))
## Start:  AIC=-269.44
## PUNT_GLOBAL ~ ESTU_GENERO + ESTU_TIENEETNIA + ESTU_DEPTO_RESIDE + 
##     FAMI_ESTRATOVIVIENDA + COLE_NATURALEZA + PUNT_LECTURA_CRITICA + 
##     PUNT_MATEMATICAS + PUNT_C_NATURALES + PUNT_SOCIALES_CIUDADANAS + 
##     PUNT_INGLES
## 
##                            Df Sum of Sq    RSS     AIC
## - ESTU_DEPTO_RESIDE        20       1.6    8.5 -284.54
## - COLE_NATURALEZA           1       0.0    6.9 -271.29
## - FAMI_ESTRATOVIVIENDA      6       0.6    7.5 -271.23
## - ESTU_GENERO               1       0.0    6.9 -270.81
## <none>                                     6.9 -269.44
## - ESTU_TIENEETNIA           1       0.2    7.1 -268.29
## - PUNT_INGLES               1     768.0  774.8  290.95
## - PUNT_LECTURA_CRITICA      1    4579.2 4586.0  502.55
## - PUNT_C_NATURALES          1    4767.1 4774.0  507.33
## - PUNT_MATEMATICAS          1    5634.5 5641.4  527.19
## - PUNT_SOCIALES_CIUDADANAS  1    8244.4 8251.3  572.44
## 
## Step:  AIC=-284.54
## PUNT_GLOBAL ~ ESTU_GENERO + ESTU_TIENEETNIA + FAMI_ESTRATOVIVIENDA + 
##     COLE_NATURALEZA + PUNT_LECTURA_CRITICA + PUNT_MATEMATICAS + 
##     PUNT_C_NATURALES + PUNT_SOCIALES_CIUDADANAS + PUNT_INGLES
## 
##                            Df Sum of Sq    RSS     AIC
## - FAMI_ESTRATOVIVIENDA      6       0.6    9.1 -288.49
## - COLE_NATURALEZA           1       0.0    8.5 -286.53
## - ESTU_GENERO               1       0.0    8.5 -286.27
## - ESTU_TIENEETNIA           1       0.1    8.6 -284.96
## <none>                                     8.5 -284.54
## + ESTU_DEPTO_RESIDE        20       1.6    6.9 -269.44
## - PUNT_INGLES               1     998.7 1007.2  282.16
## - PUNT_LECTURA_CRITICA      1    5375.4 5383.9  481.63
## - PUNT_C_NATURALES          1    5738.4 5746.9  489.40
## - PUNT_MATEMATICAS          1    6562.7 6571.1  505.35
## - PUNT_SOCIALES_CIUDADANAS  1    9667.8 9676.3  551.40
## 
## Step:  AIC=-288.49
## PUNT_GLOBAL ~ ESTU_GENERO + ESTU_TIENEETNIA + COLE_NATURALEZA + 
##     PUNT_LECTURA_CRITICA + PUNT_MATEMATICAS + PUNT_C_NATURALES + 
##     PUNT_SOCIALES_CIUDADANAS + PUNT_INGLES
## 
##                            Df Sum of Sq    RSS     AIC
## - COLE_NATURALEZA           1       0.0    9.1 -290.49
## - ESTU_GENERO               1       0.0    9.1 -290.02
## - ESTU_TIENEETNIA           1       0.1    9.2 -288.69
## <none>                                     9.1 -288.49
## + FAMI_ESTRATOVIVIENDA      6       0.6    8.5 -284.54
## + ESTU_DEPTO_RESIDE        20       1.6    7.5 -271.23
## - PUNT_INGLES               1    1082.3 1091.4  279.71
## - PUNT_LECTURA_CRITICA      1    5451.3 5460.4  471.31
## - PUNT_C_NATURALES          1    5944.4 5953.5  481.60
## - PUNT_MATEMATICAS          1    7004.7 7013.8  501.10
## - PUNT_SOCIALES_CIUDADANAS  1    9798.9 9808.0  541.01
## 
## Step:  AIC=-290.49
## PUNT_GLOBAL ~ ESTU_GENERO + ESTU_TIENEETNIA + PUNT_LECTURA_CRITICA + 
##     PUNT_MATEMATICAS + PUNT_C_NATURALES + PUNT_SOCIALES_CIUDADANAS + 
##     PUNT_INGLES
## 
##                            Df Sum of Sq    RSS     AIC
## - ESTU_GENERO               1       0.0    9.1 -292.01
## - ESTU_TIENEETNIA           1       0.1    9.2 -290.62
## <none>                                     9.1 -290.49
## + COLE_NATURALEZA           1       0.0    9.1 -288.49
## + FAMI_ESTRATOVIVIENDA      6       0.6    8.5 -286.53
## + ESTU_DEPTO_RESIDE        20       1.6    7.5 -273.20
## - PUNT_INGLES               1    1141.6 1150.7  284.01
## - PUNT_LECTURA_CRITICA      1    5477.0 5486.0  469.87
## - PUNT_C_NATURALES          1    5948.4 5957.5  479.68
## - PUNT_MATEMATICAS          1    7065.5 7074.6  500.13
## - PUNT_SOCIALES_CIUDADANAS  1    9849.1 9858.1  539.61
## 
## Step:  AIC=-292.01
## PUNT_GLOBAL ~ ESTU_TIENEETNIA + PUNT_LECTURA_CRITICA + PUNT_MATEMATICAS + 
##     PUNT_C_NATURALES + PUNT_SOCIALES_CIUDADANAS + PUNT_INGLES
## 
##                            Df Sum of Sq    RSS     AIC
## - ESTU_TIENEETNIA           1       0.1    9.2 -292.44
## <none>                                     9.1 -292.01
## + ESTU_GENERO               1       0.0    9.1 -290.49
## + COLE_NATURALEZA           1       0.0    9.1 -290.02
## + FAMI_ESTRATOVIVIENDA      6       0.6    8.5 -288.27
## + ESTU_DEPTO_RESIDE        20       1.6    7.5 -274.65
## - PUNT_INGLES               1    1145.2 1154.3  282.38
## - PUNT_LECTURA_CRITICA      1    5477.1 5486.2  467.87
## - PUNT_C_NATURALES          1    5952.4 5961.5  477.76
## - PUNT_MATEMATICAS          1    7065.5 7074.6  498.13
## - PUNT_SOCIALES_CIUDADANAS  1    9978.3 9987.4  539.16
## 
## Step:  AIC=-292.44
## PUNT_GLOBAL ~ PUNT_LECTURA_CRITICA + PUNT_MATEMATICAS + PUNT_C_NATURALES + 
##     PUNT_SOCIALES_CIUDADANAS + PUNT_INGLES
## 
##                            Df Sum of Sq     RSS     AIC
## <none>                                      9.2 -292.44
## + ESTU_TIENEETNIA           1       0.1     9.1 -292.01
## + ESTU_GENERO               1       0.0     9.2 -290.62
## + COLE_NATURALEZA           1       0.0     9.2 -290.53
## + FAMI_ESTRATOVIVIENDA      6       0.6     8.6 -288.88
## + ESTU_DEPTO_RESIDE        20       1.5     7.7 -273.54
## - PUNT_INGLES               1    1157.9  1167.1  281.70
## - PUNT_LECTURA_CRITICA      1    5477.5  5486.7  465.88
## - PUNT_C_NATURALES          1    5973.4  5982.6  476.18
## - PUNT_MATEMATICAS          1    7217.4  7226.6  498.66
## - PUNT_SOCIALES_CIUDADANAS  1   10072.9 10082.1  538.29

Resumen de la selección

summary(seleccion)
## 
## Call:
## lm(formula = PUNT_GLOBAL ~ PUNT_LECTURA_CRITICA + PUNT_MATEMATICAS + 
##     PUNT_C_NATURALES + PUNT_SOCIALES_CIUDADANAS + PUNT_INGLES)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -0.49737 -0.23774  0.01314  0.22777  0.51927 
## 
## Coefficients:
##                          Estimate Std. Error t value Pr(>|t|)    
## (Intercept)              0.093692   0.149700   0.626    0.533    
## PUNT_LECTURA_CRITICA     1.151301   0.004442 259.171   <2e-16 ***
## PUNT_MATEMATICAS         1.159645   0.003898 297.500   <2e-16 ***
## PUNT_C_NATURALES         1.147097   0.004238 270.648   <2e-16 ***
## PUNT_SOCIALES_CIUDADANAS 1.155192   0.003287 351.457   <2e-16 ***
## PUNT_INGLES              0.384876   0.003230 119.161   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.2856 on 113 degrees of freedom
## Multiple R-squared:      1,  Adjusted R-squared:      1 
## F-statistic: 7.941e+05 on 5 and 113 DF,  p-value: < 2.2e-16

El proceso ha eliminado variables como ESTU_DEPTO_RESIDE, COLE_NATURALEZA, FAMI_ESTRATOVIVIENDA, y ESTU_GENERO, que no contribuían significativamente al ajuste del modelo según el AIC.”

Modelo final

modelo_final <- lm(PUNT_GLOBAL ~ PUNT_LECTURA_CRITICA + PUNT_MATEMATICAS + PUNT_C_NATURALES + PUNT_SOCIALES_CIUDADANAS + PUNT_INGLES, data = datos)

Resumen del nuevo modelo

summary(modelo_final)
## 
## Call:
## lm(formula = PUNT_GLOBAL ~ PUNT_LECTURA_CRITICA + PUNT_MATEMATICAS + 
##     PUNT_C_NATURALES + PUNT_SOCIALES_CIUDADANAS + PUNT_INGLES, 
##     data = datos)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -0.49737 -0.23774  0.01314  0.22777  0.51927 
## 
## Coefficients:
##                          Estimate Std. Error t value Pr(>|t|)    
## (Intercept)              0.093692   0.149700   0.626    0.533    
## PUNT_LECTURA_CRITICA     1.151301   0.004442 259.171   <2e-16 ***
## PUNT_MATEMATICAS         1.159645   0.003898 297.500   <2e-16 ***
## PUNT_C_NATURALES         1.147097   0.004238 270.648   <2e-16 ***
## PUNT_SOCIALES_CIUDADANAS 1.155192   0.003287 351.457   <2e-16 ***
## PUNT_INGLES              0.384876   0.003230 119.161   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.2856 on 113 degrees of freedom
## Multiple R-squared:      1,  Adjusted R-squared:      1 
## F-statistic: 7.941e+05 on 5 and 113 DF,  p-value: < 2.2e-16

Ejemplo de significancia:

library(corrplot)
## corrplot 0.95 loaded
cor_matrix <- cor(datos[, c("PUNT_LECTURA_CRITICA", "PUNT_MATEMATICAS", "PUNT_C_NATURALES", "PUNT_SOCIALES_CIUDADANAS", "PUNT_INGLES", "PUNT_GLOBAL")], use = "complete.obs")
corrplot(cor_matrix, method = "color", addCoef.col = "black", tl.cex = 0.8, number.cex = 0.7)

El gráfico de correlación muestra las relaciones entre las variables predictoras y el puntaje global.

Intervalos de confianza

intervalos <- predict(modelo_final, interval = "confidence", level = 0.95)

Imprimir intervalos

print(intervalos)
##          fit      lwr      upr
## 1   207.7495 207.6105 207.8885
## 2   298.8955 298.8064 298.9845
## 3   299.3266 299.1159 299.5373
## 4   308.7956 308.6402 308.9510
## 5   287.6753 287.5934 287.7572
## 6   198.0017 197.8590 198.1444
## 7   355.3287 355.2056 355.4518
## 8   312.6972 312.5815 312.8128
## 9   288.3805 288.2249 288.5360
## 10  335.7644 335.5961 335.9326
## 11  186.6307 186.4933 186.7680
## 12  166.0951 165.9548 166.2355
## 13  301.8789 301.7794 301.9785
## 14  280.8340 280.7258 280.9422
## 15  220.0264 219.9128 220.1399
## 16  269.1787 269.0629 269.2945
## 17  318.9197 318.7907 319.0488
## 18  263.4364 263.3311 263.5418
## 19  233.8503 233.7332 233.9674
## 20  237.6288 237.4782 237.7795
## 21  291.5707 291.4829 291.6585
## 22  241.9295 241.8234 242.0356
## 23  262.3268 262.2157 262.4380
## 24  169.6362 169.5045 169.7679
## 25  297.7559 297.5847 297.9271
## 26  350.0456 349.8938 350.1974
## 27  276.1637 276.0653 276.2621
## 28  236.9439 236.8734 237.0145
## 29  199.6553 199.5582 199.7524
## 30  318.3874 318.2439 318.5310
## 31  211.2876 211.1035 211.4717
## 32  253.8128 253.7124 253.9132
## 33  308.8823 308.7802 308.9844
## 34  256.1629 256.1036 256.2223
## 35  257.6900 257.6275 257.7524
## 36  265.7969 265.6864 265.9073
## 37  155.4203 155.2829 155.5576
## 38  312.9869 312.8215 313.1522
## 39  282.6249 282.5104 282.7393
## 40  178.8272 178.7195 178.9348
## 41  304.9792 304.8647 305.0937
## 42  317.7020 317.5521 317.8519
## 43  242.0087 241.8874 242.1301
## 44  320.7180 320.5602 320.8759
## 45  249.9945 249.8810 250.1079
## 46  333.4221 333.3254 333.5188
## 47  293.0734 292.9366 293.2101
## 48  356.9200 356.8003 357.0396
## 49  318.0397 317.8912 318.1883
## 50  250.0068 249.8949 250.1187
## 51  226.5435 226.4731 226.6139
## 52  283.8622 283.7640 283.9604
## 53  212.2982 212.1730 212.4233
## 54  231.5224 231.4518 231.5931
## 55  280.0102 279.9353 280.0851
## 56  202.3564 202.2533 202.4595
## 57  344.2346 344.1228 344.3465
## 58  245.4180 245.3244 245.5116
## 59  259.9685 259.8639 260.0730
## 60  330.3123 330.1817 330.4428
## 61  328.7876 328.6353 328.9399
## 62  316.3081 316.0833 316.5330
## 63  339.1850 339.0677 339.3023
## 64  335.7236 335.6015 335.8456
## 65  300.6308 300.4675 300.7941
## 66  189.9820 189.8184 190.1457
## 67  318.0608 317.9687 318.1528
## 68  202.9984 202.8499 203.1469
## 69  321.1733 321.0063 321.3404
## 70  199.9649 199.8516 200.0782
## 71  277.6646 277.5862 277.7430
## 72  347.6534 347.5290 347.7778
## 73  201.6046 201.4562 201.7531
## 74  261.6087 261.5086 261.7087
## 75  228.4159 228.3011 228.5307
## 76  293.8772 293.7790 293.9754
## 77  297.3219 297.1594 297.4845
## 78  306.5604 306.4735 306.6472
## 79  294.5850 294.4992 294.6708
## 80  321.0644 320.8842 321.2447
## 81  195.7895 195.6981 195.8810
## 82  288.8637 288.7576 288.9697
## 83  196.1122 196.0071 196.2174
## 84  216.2188 216.0887 216.3489
## 85  232.7175 232.6232 232.8117
## 86  258.8801 258.7342 259.0261
## 87  259.1806 259.0594 259.3018
## 88  236.8993 236.7471 237.0514
## 89  296.1832 296.0853 296.2811
## 90  269.2890 269.1560 269.4220
## 91  171.4807 171.3230 171.6385
## 92  233.3977 233.2915 233.5040
## 93  157.7801 157.6220 157.9382
## 94  173.4104 173.2582 173.5626
## 95  299.9573 299.8673 300.0473
## 96  219.9843 219.8770 220.0916
## 97  274.6644 274.5214 274.8074
## 98  202.1908 202.0006 202.3809
## 99  280.3893 280.2973 280.4813
## 100 222.2872 222.1148 222.4596
## 101 197.6663 197.5717 197.7609
## 102 150.4139 150.2707 150.5571
## 103 225.4462 225.3219 225.5704
## 104 193.9362 193.8037 194.0687
## 105 220.0566 219.9212 220.1920
## 106 226.4885 226.3509 226.6261
## 107 209.1864 209.0705 209.3024
## 108 178.8900 178.7705 179.0095
## 109 333.4324 333.3316 333.5333
## 110 257.2982 257.1817 257.4147
## 111 258.4933 258.3895 258.5970
## 112 302.2408 302.1180 302.3637
## 113 233.1941 233.0536 233.3346
## 114 187.2717 187.0414 187.5020
## 115 184.6362 184.5442 184.7282
## 116 238.4974 238.4235 238.5712
## 117 203.4496 203.3243 203.5749
## 118 231.1231 231.0449 231.2012
## 119 268.0409 267.9708 268.1109

Los intervalos de confianza al 95% son en su mayoría bastante estrechos, lo que sugiere que las predicciones realizadas por el modelo tienen una alta precisión.

Por ejemplo, en la primera observación, el intervalo de confianza es de [207.6105, 207.8885], lo que significa que la predicción puntual de 207.7495 tiene una incertidumbre muy baja. La pequeña diferencia entre los límites inferior y superior del intervalo (aproximadamente 0.278) indica que el modelo tiene alta confiabilidad para esa predicción.

ANOVA

anova <- aov(modelo_final)

Resuemn anova

summary(anova)
##                           Df Sum Sq Mean Sq F value Pr(>F)    
## PUNT_LECTURA_CRITICA       1 252808  252808 3100156 <2e-16 ***
## PUNT_MATEMATICAS           1  45923   45923  563148 <2e-16 ***
## PUNT_C_NATURALES           1  13228   13228  162209 <2e-16 ***
## PUNT_SOCIALES_CIUDADANAS   1  10647   10647  130564 <2e-16 ***
## PUNT_INGLES                1   1158    1158   14199 <2e-16 ***
## Residuals                113      9       0                   
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Todas las variables independientes (PUNT_LECTURA_CRITICA, PUNT_MATEMATICAS, PUNT_C_NATURALES, PUNT_SOCIALES_CIUDADANAS, PUNT_INGLES) tienen un valor de p menor a 0.05 (<2e-16 en todos los casos), lo que indica que todas estas variables son estadísticamente significativas en el modelo.

Analisis residual

residual <- shapiro.test(resid(modelo_final))

Hipótesis:

H0: los datos provienen de una población normal con media=0

H1: Los datos no provienen de una población normal con meida =0

Si el valor p < 0.05 rechazamos la hipotesis nula, es decir, los datos no siguen una distribución normal

print(residual)
## 
##  Shapiro-Wilk normality test
## 
## data:  resid(modelo_final)
## W = 0.95916, p-value = 0.001147
qqnorm(resid(modelo_final), main = "Gráfico Q-Q de Residuos")
qqline(resid(modelo_final), col = "red")

Los datos no siguen una distribución normal

Varianza constante

varianza_constante <- bartlett.test(list(PUNT_GLOBAL, PUNT_LECTURA_CRITICA, PUNT_MATEMATICAS, PUNT_C_NATURALES, PUNT_SOCIALES_CIUDADANAS, PUNT_INGLES), data = datos)

Hipótesis:

H0: varianza1 = varianza2… =varianzaj = constante

H1: varianza1 != varianza2 …=! varianzaj != constante

print(varianza_constante)
## 
##  Bartlett test of homogeneity of variances
## 
## data:  list(PUNT_GLOBAL, PUNT_LECTURA_CRITICA, PUNT_MATEMATICAS, PUNT_C_NATURALES, PUNT_SOCIALES_CIUDADANAS, PUNT_INGLES)
## Bartlett's K-squared = 631.17, df = 5, p-value < 2.2e-16

Valor p < 0.05, rechazamos la hipótesis nula ya que la varianza no es constante

Predicción

nuevos_datos = data.frame(
    PUNT_LECTURA_CRITICA = c(50, 60),
    PUNT_MATEMATICAS = c(55, 65),
    PUNT_C_NATURALES = c(58, 62),
    PUNT_SOCIALES_CIUDADANAS = c(53, 67),
    PUNT_INGLES = c(40, 75)
)
predicciones = predict(modelo_final, newdata = nuevos_datos, interval = "confidence", level = 0.95)
print(predicciones)
##        fit      lwr      upr
## 1 264.5911 264.4603 264.7219
## 2 321.9323 321.8046 322.0600

El primer conjunto de datos (con puntuaciones más bajas en los exámenes) predice un PUNT_GLOBAL de aproximadamente 264.59.

El segundo conjunto de datos (con puntuaciones más altas en los exámenes) predice un PUNT_GLOBAL de aproximadamente 321.93.

Esto muestra que, como era de esperar, los estudiantes con puntuaciones más altas en las diferentes áreas tienen un PUNT_GLOBAL significativamente más alto.