Estudiar, desde el punto de vista de la estadĆstica descriptiva multivariante (calculos, visualizaciones e interpretaciones) a un conjunto de datos relacionados con la insuficiencia cardĆaca.
Fuente del conjunto de Datos
El conjunto de datos de trabajo se obtuvo totalmente de Kaggle: Insuficiencia cardiaca. Es conveniente anotar que Kaggle es una compaƱia subsidiaria de Google LLC que mantiene una comunidad online de cientĆficos de datos y profesionales del aprendizaje automĆ”tico, Esta empresa permite a sus usuarios encontrar y publicar conjuntos de datos, explorar y crear modelos en un entorno de ciencia de datos basado en la web, trabajar con otros cientificos de datos e ingenieros de aprendizaje automatico y participar en concursos para resolver desafios de ciencia de datos.
Contexto del conjunto de Datos
El conjunto registra datos sobre 11 campos relacionados con el estado de salud, comportamientos y resultados de chequeos mƩdicos generales. Este conjunto de datos fue actualizado por ultima vez en septiembre del 2021.
Descripcion del conjunto de Datos
El conjunto de datos contiene 12 campos y 917 registros. En donde uno de los campos tiene valores negativos en los registros; también existen otros 3 campos en donde sus registros son de naturaleza politómica, otros 4 campos de naturaleza dicotómica y el resto de campos son de naturaleza estrictamente numérica positiva. La lista a continuación harÔ una descripción en el mismo orden de los campo que seria de izquierda a derecha, también se harÔ una descripción del tipo de variable y su escala medición con base en esta nomenclatura (tipo de variable::escala de medición [ordenamiento]).
⢠Edad (cuantitativa::razón): Registra la edad del paciente en años.
⢠Sexo (cualitativa::nominal): Registra el sexo de cada paciente de la siguiente forma: M (paciente del sexo masculino) y F (paciente del sexo femenino).
⢠Tipo_dolor_pecho (cualitativa::nominal): Registra el tipo de dolor en el pecho que presenta el paciente, el cual se clasifica en el conjunto de datos de la siguiente forma: Anginia atĆpica, dolor no anginoso, anginia atĆpica y asintomĆ”tico. Se recalcar que los criterios de estas categorĆas no fueron proporcionados.
⢠PA_reposo (cuantitativa::razón): Registra la presión arterial en reposo y la unidad de medida a utilizar es milĆmetro de mercurio (mm Hg).La escala de este campo desde 80 hasta 200.
⢠Colesterol (cuantitativa::razón): Registra el nivel de colesterol sérico de cada paciente utilizando una unidad de medida de miligramo por decilitro (mg/dl) y la escala que utiliza va desde 40 hasta 603.
⢠AZ_Ayunas (cuantitativa::razón): Registra el nivel de azúcar en la sangre en ayunas de los pacientes, la cual utiliza una escala de medida de miligramo por decilitro (mg/dl) desde 80 hasta 400.
⢠ECG_reposo (cualitativa::nominal): Registra el resultado del electrocardiograma en reposo el cual tiene 3 categorias: Normal, ST (anomalia en las ondas st-t) y LVH (Hipertrofia ventricular izquierda).
⢠FrecC_Max (cuantitativa::razón): Registra la frecuencia cardiaca mÔxima de los pacientes, y se mide en latidos por minuto (lpm) y la escala del campo esta entre 60 y 202.
⢠Anginia_Ejercicio (cualitativa::nominal): Registra la angina o dolor en la caja torÔcica inducida por el ejercicio y esta tiene dos clasificaciones N (no presenta), y Y (si presenta).
⢠Oldpeak (cuantitativa::razón): Registra el valor numĆ©rico de la depresión del segmento ST en un electrocardiograma y se mide en milĆmetros (mm) el cual tiene una escala que va desde -26 hasta 62.
⢠Pendi_Segme_ST_Ejercicio (cualitativa::nominal): Registra la pendiente del segmento ST cuando se esta realizando el mÔximo ejercicio y este tiene 3 clasificaciones: Ascendente, descendente y plano.
⢠Clase_salida (cualitativa::nominal): Registra si el paciente se diagnostica con una enfermedad cardiaca o si sale en condiciones normales, este campo tiene dos clasificaciones 0 (para salida normal) y 1 (para salida con enfermedad cardiaca).
Por Ćŗltimo, se recalca que el conjunto de datos fue reescrito, y en algunos casos en las variables cuantitativas como el azĆŗcar en sangre que originalmente era una variable cualitativa con registros 0 (menor o igual a 120 mg/dl) y 1 (mayor a 120 mg/dl) a una cuantitiva de escala razon.
str(heart_diseases_Dataset)
## tibble [917 Ć 12] (S3: tbl_df/tbl/data.frame)
## $ Edad : num [1:917] 40 49 37 48 54 39 45 54 37 48 ...
## $ Sexo : chr [1:917] "M" "F" "M" "F" ...
## $ Tipo_dolor_pecho : chr [1:917] "angina atipica" "dolor no anginoso" "angina atipica" "asintomatico" ...
## $ PA_reposo : num [1:917] 140 160 130 138 150 120 130 110 140 120 ...
## $ Colesterol : num [1:917] 289 180 283 214 195 339 237 208 207 284 ...
## $ AZ_Ayunas : num [1:917] 92 122 109 112 97 109 85 98 95 100 ...
## $ ECG_reposo : chr [1:917] "Normal" "Normal" "ST" "Normal" ...
## $ FrecC_Max : num [1:917] 172 156 98 108 122 170 170 142 130 120 ...
## $ Angina_Ejercicio : chr [1:917] "N" "N" "N" "Y" ...
## $ Oldpeak : num [1:917] 0 1 0 15 0 0 0 0 15 0 ...
## $ Pendi_Segme_ST_Ejercicio: chr [1:917] "ascendente" "plano" "ascendente" "plano" ...
## $ Clase_salida : chr [1:917] "Normal" "Enfermedad cardiaca" "Normal" "Enfermedad cardiaca" ...
heart_diseases_Dataset
## # A tibble: 917 Ć 12
## Edad Sexo Tipo_dolor_pecho PA_reposo Colesterol AZ_Ayunas ECG_reposo
## <dbl> <chr> <chr> <dbl> <dbl> <dbl> <chr>
## 1 40 M angina atipica 140 289 92 Normal
## 2 49 F dolor no anginoso 160 180 122 Normal
## 3 37 M angina atipica 130 283 109 ST
## 4 48 F asintomatico 138 214 112 Normal
## 5 54 M dolor no anginoso 150 195 97 Normal
## 6 39 M dolor no anginoso 120 339 109 Normal
## 7 45 F angina atipica 130 237 85 Normal
## 8 54 M angina atipica 110 208 98 Normal
## 9 37 M asintomatico 140 207 95 Normal
## 10 48 F angina atipica 120 284 100 Normal
## # ā¹ 907 more rows
## # ā¹ 5 more variables: FrecC_Max <dbl>, Angina_Ejercicio <chr>, Oldpeak <dbl>,
## # Pendi_Segme_ST_Ejercicio <chr>, Clase_salida <chr>
Las medidas de media, varianza y covarianza constituyen un conjunto fundamental para describir el comportamiento posicional, dispersivo y correlacional de variables aleatorias. En el contexto de un conjunto de datos que contiene seis variables aleatorias numƩricas y se representa matricialmente, estas medidas se calculan utilizando vectores y matrices en el anƔlisis descriptivo multivariable.
El vector de medias describe el comportamiento posicional de cada variable en relación con todos sus registros, representando el valor esperado o punto medio para cada variable.
La matriz de varianzas-covarianzas proporciona información sobre las dispersiones de cada variable en relación con sus medias. En su diagonal principal, se encuentran las varianzas de cada variable respecto a su media. Por encima o por debajo de la diagonal principal, se encuentran las covarianzas que estiman las relaciones lineales entre todas las combinaciones posibles de pares de variables en el conjunto de datos.
Planteamiento del Problema
Con base en el cojunto de datos mencionado anteriormente lo que se pretendera es calcular e interpretar este conjunto, para las variables estrictamente numericas, como: el vector de medias, la varianza-covarianza y la matriz de correlacionadas. Para recordar cuales fueron las variables numericas (con una escala de medicion de razon) son: Edad, PA_reposo, Colesterol, AZ_Ayunas, FrecC_Max y Oldpeak
Desarrollo del AnƔlisis
En base a la navegacion de pestaƱas que nos permite RStudio se calculo los siguientes tres objetos: Vector de Medias, Matriz de Varianzas-Cobarianzas y Matriz de Correlaciones.
BasĆ”ndonos en la pestaƱa Vector de Medias, se observa que en general los datos registrados para cada una de las variables tienden a presentar colas derechas en sus distribuciones, lo que hace que las medias estimadas tiendan a ser altas. AdemĆ”s, en relación con la mediana, solo la variable Colesterol y Oldpeak muestran un sesgo notable en comparación con las demĆ”s. TambiĆ©n se ha observado que todos los casos atĆpicos se encuentran en el extremo superior. Si revisamos los rangos de las variables estudiadas, podemos encontrar que las medias son bajas en comparación con los extremos superiores de cada rango.
Basandonos en la pestaƱa Matriz de Varianza-Covarianza Se puede interpretar que en general, las relaciones entre las variables tomadas por pares en su mayoria tienden a ser de proporcionalidad indirecta y en la diagonal de la matriz podemos observar como varian los datos dentro de su propia clasificacion.
Basandonos en la pestaƱa Matriz de Correlaciones y al considerar los resultados de la Matriz de Varianzas-Covarianzas se puede verificar que los coeficientes de correlacion son negativos y positivos entre las variables: Edad, PA_reposo, Colesterol, AZ_Ayunas, FrecC_Max y Oldpeak. Estas correlaciones eran de esperarse en el conjunto estudiado.
apply(heart_diseases_Dataset[,-c(2,3,7,9,11,12)], 2, mean)
## Edad PA_reposo Colesterol AZ_Ayunas FrecC_Max Oldpeak
## 53.50927 132.54089 210.95856 140.54853 136.78953 5.38277
heart_diseases_Dataset_Reducido =heart_diseases_Dataset[,-c(2,3,7,9,11,12)]
par(mfrow = c(1, ncol(heart_diseases_Dataset_Reducido)))
invisible(lapply(1:ncol(heart_diseases_Dataset_Reducido), function(i) boxplot(heart_diseases_Dataset_Reducido[, i])))
round(cov(heart_diseases_Dataset[,-c(2,3,7,9,11, 12)]),2)
## Edad PA_reposo Colesterol AZ_Ayunas FrecC_Max Oldpeak
## Edad 89.07 44.69 -77.67 126.27 -91.88 18.83
## PA_reposo 44.69 323.99 103.07 116.81 -50.28 16.31
## Colesterol -77.67 103.07 6865.61 -1271.61 501.51 13.56
## AZ_Ayunas 126.27 116.81 -1271.61 6233.09 -240.75 51.56
## FrecC_Max -91.88 -50.28 501.51 -240.75 648.57 -17.86
## Oldpeak 18.83 16.31 13.56 51.56 -17.86 76.97
round(cor(heart_diseases_Dataset[,-c(2,3,7,9,11,12)]),2)
## Edad PA_reposo Colesterol AZ_Ayunas FrecC_Max Oldpeak
## Edad 1.00 0.26 -0.10 0.17 -0.38 0.23
## PA_reposo 0.26 1.00 0.07 0.08 -0.11 0.10
## Colesterol -0.10 0.07 1.00 -0.19 0.24 0.02
## AZ_Ayunas 0.17 0.08 -0.19 1.00 -0.12 0.07
## FrecC_Max -0.38 -0.11 0.24 -0.12 1.00 -0.08
## Oldpeak 0.23 0.10 0.02 0.07 -0.08 1.00
Se menciona que en tĆ©rminos generales, los grĆ”ficos multivariados cumplen dos objetivos escenciales: en primer lugar, ayudan a comparar el comportamiento de poblaciones de estudio basĆ”ndose en variables categóricas, y en segundo lugar, facilitan la comprensión de la estructura de correlación entre mĆŗltiples variables. En este contexto, el conjunto de datos en cuestión serĆ” respaldado visualmente a travĆ©s de tres tipos de diagramas: uno que integra dispersión, distribución y correlaciones; otro que utiliza la renderización de polĆgonos; y finalmente, uno que emplea caras de Chernoff para representación grĆ”fica.
Planteamiento del Problema
Con base en el conjunto de datos descrito en la fase 1 seccion 1.2, se calcularÔn e interpretarÔn diversas grÔficas multivariadas para las variables numéricas. Las variables numéricas utilizadas (en una escala de medición de razón) incluyen: Edad, PA_reposo, Colesterol, AZ_Ayunas, FrecC_Max y Oldpeak.
A continuación, se realizarÔn las siguientes grÔficas multivariadas:
Diagrama de Correlaciones: Este diagrama mostrarĆ” las relaciones de correlación entre pares de variables numĆ©ricas. Las lĆneas o colores indicarĆ”n la fuerza y dirección de la correlación entre cada par de variables. Esto ayudarĆ” a identificar patrones de asociación lineal entre las variables.
Matriz de Diagrama de Dispersión: La matriz de diagrama de dispersión representarĆ” grĆ”ficamente la relación entre todas las combinaciones posibles de variables numĆ©ricas. Cada celda de la matriz mostrarĆ” un diagrama de dispersión que ilustra la relación entre un par especĆfico de variables. Esto permitirĆ” visualizar simultĆ”neamente mĆŗltiples relaciones entre las variables.
Diagrama de Estrellas: Este tipo de diagrama se utiliza para mostrar relaciones complejas entre mĆŗltiples variables. Cada variable se representa como un eje en un grĆ”fico radial, y los puntos o lĆneas conectadas indicarĆ”n las observaciones de datos. Esto facilita la identificación de patrones o agrupaciones en los datos multivariados.
Caras de Chernoff: Las caras de Chernoff son un mĆ©todo visual Ćŗnico para representar mĆŗltiples variables numĆ©ricas mediante la modificación de las caracterĆsticas faciales (como forma de ojos, boca, etc.) para reflejar los valores de las variables. Cada cara representa una observación en el conjunto de datos y permite una visualización intuitiva de las diferencias y similitudes entre las observaciones basadas en mĆŗltiples caracterĆsticas.
Estas grÔficas multivariadas proporcionarÔn una visión completa y detallada de la estructura de los datos numéricos, ayudando a identificar patrones, asociaciones y posibles agrupaciones en el conjunto de datos descrito en la sección 1.2.
Desarollo del Analisis
La navegación a través de pestañas que nos permite RStudio mostrarÔ las grÔficas multivariadas de: Diagrama Conjunto de Dispersión, Distribución y Correlaciones (sin agrupación SA y con agrupación CA; teniendo en cuenta las 6 variables categóricas: Sexo: SEX, Tipo_dolor_pecho: TIP, ECG_reposo: ECG, Angina_Ejercicio: ANE, Pendi_Segme_ST_Ejercicio: PST, Clase_salida: CS), Diagrama de Estrellas y Caras de Chernoff.
BasĆ”ndonos en la pestaƱa Diagrama Conjunto de Dispersión, Distribución y Correlaciones [SA], donde podemos observar que existen dos correlaciones, una positiva mĆ”s alta, superior a \(0.2\), y una negativa mĆ”s baja, inferior a \(-0.1\). En general, dependiendo de con quiĆ©n se correlacionen, nos pueden dar resultados positivos o negativos. Ahora, el significado de esto nos indica el nivel de proporcionalidad (directa o indirecta) que tienen las variables cuando se relacionan unas con otras. Sin embargo, es importante destacar que ninguna de estas variables es extremadamente explicativa por sĆ sola. Aunque muestran correlaciones altas y bajas, lo que sugiere un cierto nivel de relación entre ellas, ninguna de ellas puede explicar completamente este fenómeno, lo cual sugiere que tambiĆ©n hay influencia de otros factores externos para poder diagnosticar si existe insuficiencia cardĆaca o no en el paciente.
De manera complementaria, basĆ”ndonos en las pestaƱas Diagrama Conjunto de Dispersión, Distribución y Correlaciones, pero en sus versiones en grupos de las variables categóricas: Sexo, Tipo_dolor_pecho, ECG_reposo, Angina_Ejercicio, Pendi_Segme_ST_Ejercicio y Clase_salida, se puede apreciar que en la comparativa entre distintas categorĆas, el Sexo no muestra tanta relevancia como para elevar de manera tan significativa la probabilidad de que a un paciente se le diagnostique insuficiencia cardĆaca, a diferencia de lo que ocurre con la categorĆa Pendi_Segme_ST_Ejercicio, que se muestra de manera diferente a lo mencionado anteriormente. Es decir, que un paciente que muestra una pendiente anómala en el momento en que se le realiza su evaluación cardĆaca, este resultado puede resultar mĆ”s significativo en el diagnóstico de insuficiencia cardĆaca. Por otro lado, la categorĆa Angina_Ejercicio tambiĆ©n puede dar una correlación significativa entre la insuficiencia cardĆaca y los padecimientos resultantes al realizar ejercicio.
En base a la pestaƱa Diagrama de Estrellas, se puede interpretar que hay una gran variedad bastante notable entre los pacientes y, en tƩrminos de datos, hay ciertas relaciones pero no son lo suficientemente altas como para separar en grupos, en general presentan una alta variablilidad
AdemÔs complementariamente Diagramas de Estrellas, la pestaña Caras de Chernoff revela la gran diversidad entre los pacientes. Con bastante claridad, las Caras de Chernoff, desde el número 1 hasta el 23, muestran una gran variabilidad, lo que hace imposible separarlos en grupos similares. Este hallazgo coincide con lo observado en el Diagrama de Estrellas.
ggpairs(heart_diseases_Dataset[,-c(2,3,7,9,11,12)])
ggpairs(heart_diseases_Dataset, columns = c(1,4,5,6,8,10), aes(color = Sexo, alpha = 0.5), upper = list(continuous = wrap("cor", size = 2.5)))
ggpairs(heart_diseases_Dataset, columns = c(1,4,5,6,8,10), aes(color = Tipo_dolor_pecho, alpha = 0.5), upper = list(continuous = wrap("cor", size = 2.5)))
ggpairs(heart_diseases_Dataset, columns = c(1,4,5,6,8,10), aes(color = ECG_reposo, alpha = 0.5), upper = list(continuous = wrap("cor", size = 2.5)))
ggpairs(heart_diseases_Dataset, columns = c(1,4,5,6,8,10), aes(color = Angina_Ejercicio, alpha = 0.5), upper = list(continuous = wrap("cor", size = 2.5)))
ggpairs(heart_diseases_Dataset, columns = c(1,4,5,6,8,10), aes(color = Pendi_Segme_ST_Ejercicio, alpha = 0.5), upper = list(continuous = wrap("cor", size = 2.5)))
ggpairs(heart_diseases_Dataset, columns = c(1,4,5,6,8,10), aes(color = Clase_salida, alpha = 0.5), upper = list(continuous = wrap("cor", size = 2.5)))
set.seed(780728)
heart_diseases_Dataset_Muestreado = heart_diseases_Dataset[sample(1:nrow(heart_diseases_Dataset),23),-c(2,3,7,9,11,12)]
stars(heart_diseases_Dataset_Muestreado, len = 1, cex = 0.4, key.loc = c(10, 2), draw.segments = TRUE)
set.seed(780728)
heart_diseases_Dataset_Muestreado = heart_diseases_Dataset[sample(1:nrow(heart_diseases_Dataset),23),-c(2,3,7,9,11,12)]
faces(heart_diseases_Dataset_Muestreado)
## effect of variables:
## modified item Var
## "height of face " "Edad"
## "width of face " "PA_reposo"
## "structure of face" "Colesterol"
## "height of mouth " "AZ_Ayunas"
## "width of mouth " "FrecC_Max"
## "smiling " "Oldpeak"
## "height of eyes " "Edad"
## "width of eyes " "PA_reposo"
## "height of hair " "Colesterol"
## "width of hair " "AZ_Ayunas"
## "style of hair " "FrecC_Max"
## "height of nose " "Oldpeak"
## "width of nose " "Edad"
## "width of ear " "PA_reposo"
## "height of ear " "Colesterol"
Para investigar o determinar el tipo de distribución multivariada de un conjunto de datos, se pueden utilizar procedimientos descriptivos, como grĆ”ficos, o procedimientos inferenciales, como pruebas estadĆsticas. En este contexto, se logra una generalización de resultados al emplear estos Ćŗltimos, aunque los primeros respaldan las interpretaciones.
En esta sección se considera el uso de procedimientos inferenciales para determinar si el conjunto de datos con respecto a sus variables numéricas, sigue una distribución normal multivariada (DNM). Se aplicarÔn pruebas de normalidad multivariada (PNM) que incluyen las pruebas de Mardia, Henze-Zirkler, Doornik-Hansen y Royston. Estas pruebas de normalidad se llevarÔn a cabo con un nivel de significancia \(\alpha = 0.05\) y bajo las siguientes hipótesis:\[H_0: \text {El conjunto de datos sigue una distribución normal multivariada.}\] \[H_1: \text {El conjunto de datos NO sigue una distribución normal multivariada.}\]
La prueba de Mardia se fundamenta en extensiones de asimetrĆa y curtosis, el cuadrado de la distancia de Mahalanobis, la cantidad de variables \(p\) en anĆ”lisis y la cantidad de registros \(n\). En este contexto, la prueba estadĆstica para la asimetrĆa sigue una distribución \(\chi^2\), mientras que la prueba estadĆstica para la curtosis se aproxima a una distribución normal.
La prueba de Henze-Zirkler se fundamenta en la distancia funcional. Si el conjunto de datos sigue una distribución normal multivariada, el estadĆstico de la prueba se distribuye aproximadamente como una log-normal, con parĆ”metros de media \(\mu\) y varianza \(\sigma^2\).
La prueba de Doornik-Hansen se basa en la asimetrĆa y la curtosis de un conjunto de datos multivariados, los cuales se transforman para asegurar la independencia. Esta prueba se considera mĆ”s potente que la prueba de Shapiro-Wilk en casos multivariados. El estadĆstico de prueba estĆ” definido como la suma de las transformaciones al cuadrado de la asimetrĆa y la curtosis, y sigue aproximadamente una distribución \(\chi^2\).
La prueba de Royston utiliza las pruebas de Shapiro-Wilk o Shapiro-Francia para evaluar la normalidad multivariada. Si la curtosis es mayor que 3, la prueba de Royston emplea Shapiro-Francia para distribuciones leptocúrticas. Por otro lado, para distribuciones platicúrticas utiliza Shapiro-Wilk. En esta prueba, los parÔmetros son obtenidos mediante aproximaciones polinomiales.
Planteamiento del Problema
Con base en el conjunto de datos descrito en la fase 1 sección 1.2, se realizarĆ” una prueba estadĆstica de normalidad multivariada con un nivel de significancia \(\alpha=0.05\), para determinar si los datos mĆ©tricos provienen de una población normal multivariada. Las variables numĆ©ricas del conjunto de datos (en escala de medición de razón) son: Edad, PA_reposo, Colesterol, AZ_Ayunas, FrecC_Max y Oldpeak.
Se utilizarÔ una de las pruebas de normalidad multivariada mencionadas anteriormente, como la prueba de Mardia, Henze-Zirkler, Doornik-Hansen o Royston, dependiendo de la distribución de las variables y la curtosis observada. El objetivo es evaluar si estas variables siguen una distribución normal conjunta en el espacio multivariado.
El procedimiento implicarĆ” calcular el estadĆstico de prueba especĆfico (por ejemplo, basado en asimetrĆa y curtosis) y compararlo con su distribución teórica bajo la hipótesis nula de normalidad multivariada. Se establecerĆ” un criterio de rechazo de la hipótesis nula si el valor \(p-value\) asociado al estadĆstico de prueba es menor que \(\alpha\).
Una conclusión positiva (no rechazo de la hipótesis nula) indicarĆa evidencia de que las variables analizadas siguen una distribución normal multivariada. Por el contrario, un rechazo de la hipótesis nula sugerirĆa que al menos una de las variables no sigue una distribución normal, lo que podrĆa tener implicaciones en el anĆ”lisis posterior de los datos.
Desarrollo del AnƔlisis
La exploración a través de las diferentes pruebas de normalidad multivariada indica que el conjunto de datos, considerando sus variables numéricas, no sigue una distribución normal multivariada. Aquà estÔn los hallazgos clave de cada prueba:
Prueba de Mardia: Los valores \(p\) asociados con las pruebas de asimetrĆa (Skewness) y curtosis (Kurtosis) son menores que el nivel de significancia \(\alpha = 0.05\). Esto sugiere que no hay suficiente evidencia para sostener la hipótesis de normalidad multivariada para las variables del conjunto de datos.
Prueba de Henze-Zirkler: El estadĆstico de prueba no se distribuye aproximadamente como log-normal, ya que el valor \(p\) es menor que \(\alpha = 0.05\). Por lo tanto, no hay apoyo para que el conjunto de datos siga una distribución normal multivariada segĆŗn esta prueba.
Prueba de Doornik-Hansen: El estadĆstico de prueba no sigue una distribución \(\chi^2\) aproximadamente, dado que el valor \(p\) es menor que \(\alpha = 0.05\). Esto sugiere que las evidencias no respaldan la normalidad multivariada del conjunto de datos.
Prueba de Royston: El conjunto de datos, reducido a sus variables numéricas, no sigue una distribución normal multivariada según esta prueba, ya que el valor \(p\) es menor que \(\alpha = 0.05\).
En resumen, con un nivel de significancia de \(0.05\), las pruebas indican consistentemente que el conjunto de datos analizado, con respecto a sus variables numéricas, no sigue una distribución normal multivariada. Este hallazgo es importante para la interpretación y el anÔlisis subsiguiente de los datos.
mvn(heart_diseases_Dataset[,-c(2,3,7,9,11,12)], mvnTest="mardia")
## $multivariateNormality
## Test Statistic p value Result
## 1 Mardia Skewness 1330.39701506226 2.03529324264984e-241 NO
## 2 Mardia Kurtosis 15.8588696120447 0 NO
## 3 MVN <NA> <NA> NO
##
## $univariateNormality
## Test Variable Statistic p value Normality
## 1 Anderson-Darling Edad 2.7693 <0.001 NO
## 2 Anderson-Darling PA_reposo 7.4597 <0.001 NO
## 3 Anderson-Darling Colesterol 7.0365 <0.001 NO
## 4 Anderson-Darling AZ_Ayunas 124.7066 <0.001 NO
## 5 Anderson-Darling FrecC_Max 1.6082 4e-04 NO
## 6 Anderson-Darling Oldpeak 101.4988 <0.001 NO
##
## $Descriptives
## n Mean Std.Dev Median Min Max 25th 75th Skew
## Edad 917 53.50927 9.437636 54 28 77 47 60 -0.1946831
## PA_reposo 917 132.54089 17.999749 130 80 200 120 140 0.6052097
## Colesterol 917 210.95856 82.858974 219 40 603 163 264 0.1055706
## AZ_Ayunas 917 140.54853 78.949925 109 80 400 95 124 1.8483617
## FrecC_Max 917 136.78953 25.467129 138 60 202 120 156 -0.1419928
## Oldpeak 917 5.38277 8.773387 1 -26 62 0 8 1.9282516
## Kurtosis
## Edad -0.3990863
## PA_reposo 0.7727619
## Colesterol 0.7795042
## AZ_Ayunas 2.2250249
## FrecC_Max -0.4585589
## Oldpeak 5.0171989
mvn(heart_diseases_Dataset[,-c(2,3,7,9,11,12)], mvnTest="hz")
## $multivariateNormality
## Test HZ p value MVN
## 1 Henze-Zirkler 6.525351 0 NO
##
## $univariateNormality
## Test Variable Statistic p value Normality
## 1 Anderson-Darling Edad 2.7693 <0.001 NO
## 2 Anderson-Darling PA_reposo 7.4597 <0.001 NO
## 3 Anderson-Darling Colesterol 7.0365 <0.001 NO
## 4 Anderson-Darling AZ_Ayunas 124.7066 <0.001 NO
## 5 Anderson-Darling FrecC_Max 1.6082 4e-04 NO
## 6 Anderson-Darling Oldpeak 101.4988 <0.001 NO
##
## $Descriptives
## n Mean Std.Dev Median Min Max 25th 75th Skew
## Edad 917 53.50927 9.437636 54 28 77 47 60 -0.1946831
## PA_reposo 917 132.54089 17.999749 130 80 200 120 140 0.6052097
## Colesterol 917 210.95856 82.858974 219 40 603 163 264 0.1055706
## AZ_Ayunas 917 140.54853 78.949925 109 80 400 95 124 1.8483617
## FrecC_Max 917 136.78953 25.467129 138 60 202 120 156 -0.1419928
## Oldpeak 917 5.38277 8.773387 1 -26 62 0 8 1.9282516
## Kurtosis
## Edad -0.3990863
## PA_reposo 0.7727619
## Colesterol 0.7795042
## AZ_Ayunas 2.2250249
## FrecC_Max -0.4585589
## Oldpeak 5.0171989
mvn(heart_diseases_Dataset[,-c(2,3,7,9,11,12)], mvnTest="dh")
## $multivariateNormality
## Test E df p value MVN
## 1 Doornik-Hansen 359.3139 12 1.517767e-69 NO
##
## $univariateNormality
## Test Variable Statistic p value Normality
## 1 Anderson-Darling Edad 2.7693 <0.001 NO
## 2 Anderson-Darling PA_reposo 7.4597 <0.001 NO
## 3 Anderson-Darling Colesterol 7.0365 <0.001 NO
## 4 Anderson-Darling AZ_Ayunas 124.7066 <0.001 NO
## 5 Anderson-Darling FrecC_Max 1.6082 4e-04 NO
## 6 Anderson-Darling Oldpeak 101.4988 <0.001 NO
##
## $Descriptives
## n Mean Std.Dev Median Min Max 25th 75th Skew
## Edad 917 53.50927 9.437636 54 28 77 47 60 -0.1946831
## PA_reposo 917 132.54089 17.999749 130 80 200 120 140 0.6052097
## Colesterol 917 210.95856 82.858974 219 40 603 163 264 0.1055706
## AZ_Ayunas 917 140.54853 78.949925 109 80 400 95 124 1.8483617
## FrecC_Max 917 136.78953 25.467129 138 60 202 120 156 -0.1419928
## Oldpeak 917 5.38277 8.773387 1 -26 62 0 8 1.9282516
## Kurtosis
## Edad -0.3990863
## PA_reposo 0.7727619
## Colesterol 0.7795042
## AZ_Ayunas 2.2250249
## FrecC_Max -0.4585589
## Oldpeak 5.0171989
mvn(heart_diseases_Dataset[,-c(2,3,7,9,11,12)], mvnTest="royston")
## $multivariateNormality
## Test H p value MVN
## 1 Royston 459.6305 3.937501e-96 NO
##
## $univariateNormality
## Test Variable Statistic p value Normality
## 1 Anderson-Darling Edad 2.7693 <0.001 NO
## 2 Anderson-Darling PA_reposo 7.4597 <0.001 NO
## 3 Anderson-Darling Colesterol 7.0365 <0.001 NO
## 4 Anderson-Darling AZ_Ayunas 124.7066 <0.001 NO
## 5 Anderson-Darling FrecC_Max 1.6082 4e-04 NO
## 6 Anderson-Darling Oldpeak 101.4988 <0.001 NO
##
## $Descriptives
## n Mean Std.Dev Median Min Max 25th 75th Skew
## Edad 917 53.50927 9.437636 54 28 77 47 60 -0.1946831
## PA_reposo 917 132.54089 17.999749 130 80 200 120 140 0.6052097
## Colesterol 917 210.95856 82.858974 219 40 603 163 264 0.1055706
## AZ_Ayunas 917 140.54853 78.949925 109 80 400 95 124 1.8483617
## FrecC_Max 917 136.78953 25.467129 138 60 202 120 156 -0.1419928
## Oldpeak 917 5.38277 8.773387 1 -26 62 0 8 1.9282516
## Kurtosis
## Edad -0.3990863
## PA_reposo 0.7727619
## Colesterol 0.7795042
## AZ_Ayunas 2.2250249
## FrecC_Max -0.4585589
## Oldpeak 5.0171989
En términos generales, esta segunda etapa del estudio presentarÔ cÔlculos, visualizaciones e interpretaciones basadas en el conjunto de datos tratado en la fase 1. Esta vez, el enfoque se centrarÔ en el anÔlisis de componentes principales de las variables cuantitativas, lo que incluirÔ la selección, calidad de representación, contribuciones e interpretación.
El AnĆ”lisis de Componentes Principales (ACP) reestructura un conjunto de datos multivariado al reducir el nĆŗmero de variables, sin necesidad de asumir ninguna distribución de probabilidad para ellas. Esta reducción se logra mediante combinaciones lineales de las variables originales, que capturan la mayor variabilidad posible presente en el conjunto de datos. AsĆ, el ACP crea nuevas variables, conocidas como componentes principales, que son estadĆsticamente independientes (basadas en el supuesto de normalidad) y no estĆ”n correlacionadas.
El ACP se desarrolla a través de las siguientes fases: generación de nuevas variables, reducción dimensional del espacio de datos, eliminación de variables de poco aporte e interpretación de los componentes resultantes en el contexto del problema del cual se obtuvieron los datos.
Planteamiento del Problema
Con base en las variables cuantitativas del conjunto de datos descrito en la fase anterior, primero se debe establecer el porcentaje de varianza explicado por cada dimensión una vez procesado el ACP. Posteriormente, utilizando el autovalor medio o un diagrama de sedimentación, se decidirÔ cuÔntos componentes retener.
Desarrollo del AnƔlisis
Con base a la navegacion en pestaƱas se puede apreciar que el conjunto de datos, relacionado con sus variables numericas puede ser representado por unos conjuntos mas pequeƱos que llegan a retener el \(79,21\) \(\%\) de la variabilidad del conjunto, estas en particular:
La Matriz ACP muestra en total seis dimenciones en donde la primera retiene un \(23,32\) \(\%\), la siguiente un \(19,72\) \(\%\) y las demas de manera respectiva \(15,26\) \(\%\) y \(14,91\) \(\%\) dandonos un total de \(79,21\) \(\%\) como habiamos mencionado antes, En este sentido la representatividad de la combinacion lineal por dimenciones individuales es relativamente baja pero si tomamos de la dimencion 1 a 4 son significativamente altas a comparacion del resto. Como esta matriz no identifica la relacion con las variables originales se seguira indagando para indentificar las variables que mas contribuyes a las 4 primeras dimensiones que tengan el valor propio mas alto.
La Matriz de Correlaciones permite continuar con el proceso de las descripciones de las combinaciones lineales que conforman las dimensiones de mayor interés: Dimencion 1 a 4. Asà mismo esta matriz como se describio en secciones pasadas, ayudara a verificar que la intencidad de correlaciones es relativamente aceptable y positiva entre las variables: PA_reposo, Edad, FrecC_Max y Colesterol, lo cual muestra una relacion con el fenomeno que se esta estudiando, por lo tanto, se podira esperar que estas variables participen de manera significativa en la combinación Lineal que define a la dimencion 1 a 4.
La pestaña de Valores y Vectores Propios muestra estos elementos calculados a partir de la matriz de correlaciones del conjunto de datos. En este contexto, se asegura que la suma de los valores propios sea igual a la dimensión de dicha matriz y a la variabilidad total del conjunto, lo que permite calcular fÔcilmente las proporciones de retención de variabilidad. AdemÔs, la matriz de vectores propios define, para cada componente y en relación con cada variable del conjunto de datos, los coeficientes de la combinación lineal que la conforman, por ejemplo, ajustados a dos cifras decimales, la componente 1 estaria representada por la combinacion lineal (donde \(E\) es Edad, \(P\) es PA_reposo, \(C\) es Colesterol, \(A\) es AZ_Ayunas, \(F\) es FrecC_Max y \(O\) es Oldpeak, y ademas son variables estandarizadas): de esta mismma forma se haran con los componenetes 1 a 4 quedando de la siguiente forma: \[Componente_1 = 0.58*E+0.33*P-0,29*C+0,35*A-0,51*F+0.30*O\]
\[Componente_2 = 0,19*E+0,50*P+0,67*C-0,28*A+0,19*F+0,39*O\] \[Componente_3 = 0,17*E+0,21*P+0,02*C-0,60*A-0,45*F-0,60*O\] \[Componente_4 = 0,09*E-0,56*P-0,08*C-0,54*A+-0.25*F+0,56*O\] Se escogen estas 4 porque en el ACP forman el \(79,21\) \(\%\) y juntas representan una versión mÔs compacta y rica del conjunto original, y hasta este punto se puede observar que el numero de dimensiones resultantes es equivalente al numero de variables tratadas, sin contar las variables nuevas ya que estan son incorreladas entre si, ver la pestaña Correlaciones comparadas.
Por último, tanto el GrÔfico de Cattell como el GrÔfico de Cattell-Kaiser, que representan el codo y la sedimentación respectivamente, ayudan a decidir cuÔntas componentes retener en la reducción de dimensionalidad, asegurando que se conserve una cantidad suficiente de variabilidad para abordar el problema en cuestión. No obstante, es importante destacar que se sugiere tomar decisiones basadas en criterios mÔs comunes en lugar de criterios de aceptación universal.
El GrÔfico de Cattell revela que los cambios en la pendiente indican una alta capacidad explicativa de las dimensiones en comparación con las demÔs. Por otro lado, el GrÔfico de Cattell-Kaiser, al combinar el grÔfico anterior con el criterio de Kaiser en la misma visualización, respalda la idea de retener solo 2 dimensión y no 4 como se habia propuesto, enfatizando que esta elección debe conservar un porcentaje adecuado de variabilidad para el anÔlisis del problema en cuestión.
get_eigenvalue(PCA(heart_diseases_Dataset[,-c(2,3,7,9,11,12)], ncp = 6, scale.unit = TRUE, graph = F))
## eigenvalue variance.percent cumulative.variance.percent
## Dim.1 1.7592474 29.320790 29.32079
## Dim.2 1.1830382 19.717303 49.03809
## Dim.3 0.9155510 15.259183 64.29728
## Dim.4 0.8946274 14.910457 79.20773
## Dim.5 0.6954416 11.590693 90.79843
## Dim.6 0.5520944 9.201574 100.00000
round(cor(heart_diseases_Dataset[,-c(2,3,7,9,11,12)]),2)
## Edad PA_reposo Colesterol AZ_Ayunas FrecC_Max Oldpeak
## Edad 1.00 0.26 -0.10 0.17 -0.38 0.23
## PA_reposo 0.26 1.00 0.07 0.08 -0.11 0.10
## Colesterol -0.10 0.07 1.00 -0.19 0.24 0.02
## AZ_Ayunas 0.17 0.08 -0.19 1.00 -0.12 0.07
## FrecC_Max -0.38 -0.11 0.24 -0.12 1.00 -0.08
## Oldpeak 0.23 0.10 0.02 0.07 -0.08 1.00
princomp(heart_diseases_Dataset[,-c(2,3,7,9,11,12)], cor = TRUE)$sdev^2
## Comp.1 Comp.2 Comp.3 Comp.4 Comp.5 Comp.6
## 1.7592474 1.1830382 0.9155510 0.8946274 0.6954416 0.5520944
princomp(heart_diseases_Dataset[,-c(2,3,7,9,11,12)], cor = TRUE)$loadings[ ,1:6]
## Comp.1 Comp.2 Comp.3 Comp.4 Comp.5 Comp.6
## Edad 0.5776364 0.1872497 0.16574216 0.09472231 0.2633580 0.7248955
## PA_reposo 0.3266561 0.5023551 0.21376899 -0.56185201 -0.4950656 -0.1856618
## Colesterol -0.2889849 0.6695748 0.01694501 -0.08358424 0.6561984 -0.1740330
## AZ_Ayunas 0.3487904 -0.2783312 -0.60487484 -0.54444940 0.3509656 -0.1241026
## FrecC_Max -0.5149622 0.1897350 -0.44646771 -0.24897437 -0.2818786 0.5983622
## Oldpeak 0.2987956 0.3883024 -0.60111416 0.55673179 -0.2287442 -0.1906041
par(mfrow=c(1,2))
corrplot::corrplot(cor(heart_diseases_Dataset[,-c(2,3,7,9,11,12)]), method = "color", type = "upper", number.cex = 0.4)
corrplot::corrplot(cor(princomp(heart_diseases_Dataset[,-c(2,3,7,9,11,12)], cor = TRUE)$scores), method = "color", type = "upper", number.cex = 0.4)
fviz_eig(PCA(heart_diseases_Dataset[,-c(2,3,7,9,11,12)], scale.unit = T, graph = F), addlabels = T, ylim=c(0,90), main = "")
scree(heart_diseases_Dataset[,-c(2,3,7,9,11,12)],factors = FALSE, pc = TRUE, main ="")
Después de reducir la dimensionalidad del conjunto de datos y proyectar las variables estandarizadas en la hiperesfera de correlaciones, es esencial iniciar la interpretación de los componentes teniendo en cuenta estas correlaciones. Esto nos permite entender cómo las variables originales se relacionan entre sà y cómo estas relaciones se reflejan en los componentes principales. Esta comprensión nos ayuda a inferir patrones y estructuras importantes en los datos. AdemÔs, es crucial evaluar la calidad de las representaciones de los componentes, asegurÔndonos de que conserven la información crucial del conjunto de datos original y sean útiles para el anÔlisis subsiguiente, garantizando asà una comprensión precisa y útil de la estructura de los datos.
Planteamiento del Problema
Con base en el conjunto de datos descrito en la fase 1 se requiere determinar la calidad de representación de las variables cuantitativas en relación con la cantidad de dimensiones calculadas que retienen la mayor cantidad de variabilidad. Para obtener mÔs información al respecto, se recomienda consultar la sección 2.2 del documento.
Desarrollo del AnƔlisis
Explorar las pestaƱas revela, que reducir la dimensionalidad del conjunto de datos permite analizar las calidades de representación. Esto se evalĆŗa en función de la escala de contribuciones relativas, basada en un cociente de proyecciones con propiedades aditivas y una respuesta en una escala continua de 0 a 1. AsĆ, en particular:
El CĆrculo de correlaciones nos muestra de manera visual cómo se comportan las seis variables de interĆ©s. En este caso, cuatro de ellas estĆ”n bastante próximas a las fronteras del cĆrculo unitario y cerca de los dos ejes principales, dependiendo de la variable que se tome como referencia. Esto indica que estas variables tienen una buena representación en el plano de los componentes principales. AdemĆ”s, podemos observar tanto correlaciones positivas como negativas entre ellas. Un aspecto importante a destacar es la correlación existente entre las variables. Un ejemplo representativo es la relación entre PA_reposo y Oldpeak. Estas dos variables muestran cómo las correlaciones pueden variar significativamente, reflejando relaciones complejas que pueden ser positivas o negativas dependiendo de su posición relativa en el cĆrculo.
La Matriz de Representación muestra algunos valores signicativamente cercanos a 0 y pocos cercanos a 1,los valores anteriormente mencionados son los cocientes de las proyecciones coseno cuadrado que estan relacionados con la dimensión 1. asà de la misma manera la Calidad de Representación en cuanto se relaciona con la componente 1 esta encabezada Edad y cierra con Colesterol cabe recalcar que en la dimension 2 se obtine una mejor representacion por parte del Colesterol, por lo tanto lo que nos dice esto es que la representacion relacionada con la primera dimension se ve afectada. Tambien es importante mencionar que la escala que muestra la Calidad de Representación indica su escala un piso alto de \(0.04\).
Por último, las Coordenadas Individuales permiten identificar, aunque de manera menos intuitiva, los perfiles de los registros individuales, en este caso los pacientes, en relación con las dimensiones mÔs importantes que retienen la mayor parte de la variabilidad: las componentes 1 y 2. Estas coordenadas nos ayudan a entender cómo se distribuyen y agrupan los pacientes en el espacio definido por estas componentes principales. Por ejemplo, al analizar los registros 1, 6, 17 y 20, podemos observar que los registros anteriormente mencionados presentan perfiles similares. Esta observación se mantiene incluso cuando consideramos otras variables como la peor representada. Este anÔlisis sugiere que las principales diferencias y similitudes entre estos registros se capturan de manera efectiva a través de las componentes 1 y 2.
fviz_pca_var(PCA(heart_diseases_Dataset[,-c(2,3,7,9,11,12)], scale.unit = T, graph = F),col.var="#3B83BD", repel = T, col.circle = "#CDCDCD", ggtheme = theme_bw())
(get_pca_var(PCA(heart_diseases_Dataset[,-c(2,3,7,9,11,12)], ncp = 6, scale.unit = TRUE, graph = F)))$cos2
## Dim.1 Dim.2 Dim.3 Dim.4 Dim.5 Dim.6
## Edad 0.5869973 0.04148021 0.0251506119 0.008026879 0.04823403 0.290111004
## PA_reposo 0.1877191 0.29855232 0.0418380998 0.282413903 0.17044573 0.019030872
## Colesterol 0.1469188 0.53039205 0.0002628851 0.006250157 0.29945457 0.016721547
## AZ_Ayunas 0.2140208 0.09164794 0.3349759121 0.265190061 0.08566229 0.008503053
## FrecC_Max 0.4665280 0.04258863 0.1824999061 0.055456374 0.05525670 0.197670404
## Oldpeak 0.1570636 0.17837703 0.3308235854 0.277290021 0.03638823 0.020057559
fviz_pca_var(PCA(heart_diseases_Dataset[,-c(2,3,7,9,11,12)], ncp = 6, scale.unit = TRUE, graph = F), col.var="cos2", gradient.cols=c("#00AFBB","#E7B800","#FC4E07"), repel = TRUE)
head((PCA(heart_diseases_Dataset[,-c(2,3,7,9,11,12)], ncp = 6, scale.unit = TRUE, graph = F))$ind$coord, n = 23L)
## Dim.1 Dim.2 Dim.3 Dim.4 Dim.5 Dim.6
## 1 -2.0745726 0.76644699 0.009227874 0.79858453 -0.4295182466 -0.25808450
## 2 -0.2895121 0.44149242 -0.346393583 1.20981991 -1.3077699147 0.01117777
## 3 -0.8466390 -0.23244178 -0.985698628 -0.09620251 0.6094854060 -2.13917590
## 4 0.5351111 0.37964288 -0.033227936 -0.86031274 -0.3389857782 -1.32706703
## 5 0.3260574 0.17324290 -1.175071823 0.42085244 -0.4827020407 -0.27111234
## 6 -2.5578366 0.51750272 0.349457699 0.33219744 0.5868934249 -0.30735765
## 7 -1.7589753 0.17580935 -0.037903336 0.31571282 -0.4357491967 0.30264406
## 8 -0.8458294 -0.69305982 -0.343944020 -0.61275276 0.5040290251 0.58297405
## 9 -0.5980179 0.38448539 0.393303433 -0.59655370 -1.0758632563 -1.63443788
## 10 -0.8429563 -0.08949189 -0.743457451 -0.36487444 0.9160561373 -0.66137655
## 11 -1.5165263 -0.46190515 -0.252835121 0.21322041 -0.4794341960 -0.94249379
## 12 0.9231004 -0.44359735 -1.400312147 -0.49500497 -0.0644372390 -0.32566049
## 13 -1.6516759 -0.70393272 -0.184087642 -0.15899785 -0.2771234148 -0.58619841
## 14 -0.6632656 0.31674827 -0.653407515 0.25549002 -0.2990938923 -0.22012789
## 15 -1.3461761 -0.84700088 -0.188829742 -0.29917130 0.1639075188 -0.53355797
## 16 -0.4357071 0.75095454 0.876526211 -0.94335531 0.3707367228 0.16743651
## 17 -2.3047020 -0.90058769 0.299305439 -0.28463015 -0.3391489529 -0.04464171
## 18 -1.8583487 -0.45384180 -0.002599241 -0.09626023 -0.4685229681 0.21812171
## 19 -0.4701640 -0.57341891 -0.652691545 -1.25062637 1.3769438016 0.65914534
## 20 -2.1503982 -0.09410554 0.508481756 0.05656228 0.0006864491 -0.69947908
## 21 -1.6826551 -1.12582727 0.087750216 -0.68906606 0.6621182939 -0.21586985
## 22 -1.2074402 -0.72329648 -0.297915574 -0.36363041 -0.3155482275 -0.24273915
## 23 -1.2035596 -0.38569260 0.164190710 0.26222677 -0.2042976920 0.54523574
La interpretación de los resultados en el anÔlisis de componentes principales (ACP) se ve enriquecida por el cÔlculo de diversas métricas, tales como coordenadas, contribuciones y cosenos cuadrados. Estos indicadores son fundamentales para comprender la relación entre las variables originales y los componentes principales generados. Es crucial que las variables estén claramente conceptualizadas, contextualizadas en el marco del problema de estudio, para poder interpretar con precisión sus contribuciones a los componentes.
El cÔlculo de las contribuciones de cada variable a cada componente permite entender el grado de influencia de cada una en la formación de los componentes principales. Este anÔlisis facilita la identificación de aquellas variables que mÔs contribuyen a la estructura de cada componente y, por ende, a la variabilidad general de los datos. AdemÔs, proporciona insights sobre las relaciones subyacentes entre las variables y cómo estas se reflejan en los componentes.
Planteamiento del Problema
Con base en las variables cuantitativas del conjunto de datos descrito en la fase 1 se requiere determinar las contribuciones que cada variable realiza en la construcción de cada componente. Este anÔlisis permitirÔ comprender el papel de cada variable en la estructura subyacente de los datos y su impacto en la formación de los componentes principales. Mediante el cÔlculo de estas contribuciones, serÔ posible identificar qué variables tienen una influencia mÔs significativa en cada componente, lo que facilitarÔ la interpretación de los resultados del anÔlisis de componentes principales y proporcionarÔ información valiosa para el estudio del problema en cuestión.
Desarrollo del AnƔlisis
Con base a travƩs de las pestaƱas de navegacion nos permite reconocer las representaciones numericas y graficas de las contribuciones de cada variable del conjunto de datos de manera porcentual a la construcion de cada componente. Entonces en particular llegamos a encontrar lo siguiente:
La Matriz de contribuciones nos muestra en terminos numericos la retencion de la variabilidad que tiene cada variable en su respectiva componente, de la misma se haran diagramas de barras que nos expliquen de manera visual las Contribuciones a D1 hasta Contribuciones a D6 y esta misma se hara a travƩs de la naevagacion de pestaƱas. Tambien de manera complementaria cada grafico tendra su propia linea que nos ayudara a identificar la contribucion media, esto nos ayudara a identificar las variables que contribuyan de mejor manera a sus repectivas dimenciones.
En Contribuciones a D1 se visualizan que las variables que estan por encima de la contribucion media son: Edad y FrecC_Max que retiene aproximadamente el \(59,89\) \(%\) de la variabilidad de la componente 1.
En Contribuciones a D2 se visualizan que las variables que estan por encima de la contribucion media son: Colesterol y PA_reposo que retiene aproximadamente el \(70,07\) \(%\) de la variabilidad de la componente 2.
En Contribuciones a D3 se visualizan que las variables que estan por encima de la contribucion media son: AZ_Ayunas, Oldpeak y FrecC_Max que retiene aproximadamente el \(91,63\) \(%\) de la variabilidad de la componente 3.
En Contribuciones a D4 se visualizan que las variables que estan por encima de la contribucion media son: PA_reposo, Oldpeak y AZ_Ayunas que retiene aproximadamente el \(92.21\) \(%\) de la variabilidad de la componente 4.
En Contribuciones a D5 se visualizan que las variables que estan por encima de la contribucion media son: Colesterol y PA_reposo que retiene aproximadamente el \(67,57\) \(%\) de la variabilidad de la componente 5.
Por ultimo tenenemos la pestaƱa Contribuciones a D6 se visualizan que las variables que estan por encima de la contribucion media son: Edad y FrecC_Max que retiene aproximadamente el \(88,35\) \(%\) de la variabilidad de la componente 6.
Con los datos procesados hasta este momento podemos seguir con el siguiente paso que seria la interpretacion de cada componenete.
(get_pca_var(PCA(heart_diseases_Dataset[,-c(2,3,7,9,11,12)], ncp = 6, scale.unit = TRUE, graph = F)))$contrib
## Dim.1 Dim.2 Dim.3 Dim.4 Dim.5 Dim.6
## Edad 33.366385 3.506244 2.74704652 0.8972315 6.935741 52.547351
## PA_reposo 10.670419 25.236068 4.56971810 31.5677683 24.508995 3.447032
## Colesterol 8.351229 44.833046 0.02871332 0.6986325 43.059631 3.028748
## AZ_Ayunas 12.165472 7.746828 36.58735690 29.6425152 12.317683 1.540145
## FrecC_Max 26.518611 3.599937 19.93334135 6.1988236 7.945556 35.803730
## Oldpeak 8.927884 15.077876 36.13382381 30.9950290 5.232393 3.632994
fviz_contrib(PCA(heart_diseases_Dataset[,-c(2,3,7,9,11,12)], ncp = 6, scale.unit = TRUE, graph = F), choice = "var", axes = 1, top = 10)
fviz_contrib(PCA(heart_diseases_Dataset[,-c(2,3,7,9,11,12)], ncp = 6, scale.unit = TRUE, graph = F), choice = "var", axes = 2, top = 10)
fviz_contrib(PCA(heart_diseases_Dataset[,-c(2,3,7,9,11,12)], ncp = 6, scale.unit = TRUE, graph = F), choice = "var", axes = 3, top = 10)
fviz_contrib(PCA(heart_diseases_Dataset[,-c(2,3,7,9,11,12)], ncp = 6, scale.unit = TRUE, graph = F), choice = "var", axes = 4, top = 10)
fviz_contrib(PCA(heart_diseases_Dataset[,-c(2,3,7,9,11,12)], ncp = 6, scale.unit = TRUE, graph = F), choice = "var", axes = 5, top = 10)
fviz_contrib(PCA(heart_diseases_Dataset[,-c(2,3,7,9,11,12)], ncp = 6, scale.unit = TRUE, graph = F), choice = "var", axes = 6, top = 10)
Se sabe que a partir de las coordenadas de los registros dimensionalmente reducidos, es posible ubicarlos en un plano de factores para anÔlisis e interpretación. En este proceso, las variables reducidas actúan como las componentes principales, que se representan como ejes en el plano, mientras que los valores que toman son los puntajes de las componentes. Como se explica en el mismo trabajo, las distancias entre los puntos definidos por los puntajes de las componentes tienen un significado relevante al ayudar a establecer semejanzas de perfiles en las observaciones realizadas.
Es importante destacar que los valores semejantes de las variables pueden darse solo en algunas de ellas, sin que sea necesario que suceda en todas. Sin embargo, se espera que las distancias en el espacio dimensional original de las observaciones queden bien representadas en el espacio reducido de las componentes. Este proceso de reducción dimensional conserva la estructura subyacente de las relaciones entre las observaciones, lo que permite una representación mÔs compacta y comprensible de los datos mientras se mantienen las distancias relevantes para la interpretación de semejanzas y diferencias entre observaciones.
Planteamiento del Problema
Con base en las variables cuantitativas del conjunto de datos descrito en la fase 1 se requiere definir e interpretar sus componentes principales. La definición de cada componente principal implica comprender cómo se combinan linealmente las variables originales para formarlos, asà como su contribución relativa a la variabilidad total de los datos. Por otro lado, la interpretación de los componentes implica analizar qué aspectos o patrones de los datos representan, y cómo se relacionan con el problema o fenómeno estudiado.
Desarrollo del AnƔlisis
La navegación a travĆ©s de las pestaƱas permite visualizar objetos grĆ”ficos y matriciales que, al incluir lo hecho en las secciones anteriores, ayudan a robustecer la interpretación de las componentes calculadas. Como se mostró en la sección 2.3, la cantidad de componentes seleccionadas se redujo (segĆŗn el criterio de Kaiser) a dos, y se estableció que la componente 1 y 2 retiene el \(49\) \(%\) de la variabilidad de los datos. AsĆ, en el cĆrculo de correlaciones de la sección 2.4 se observa que la representación de las variables conjugadas en la componente 1 y 2 la configura como una de tipo tamaƱo, lo que puede interpretarse como una especie de Ćndice de proporcionalidad directa. Esto tambiĆ©n se respalda con el hecho de que todas las variables presentan calidades de representación entre 0.4 y 0.6. En consecuencia, cuanto mayor sea el valor de las variables, mayor serĆ” la probabilidad de que el paciente se le diagnostique insuficiencia cardiaca. AsĆ, dada la naturaleza de las variables, estas componentes puede representar para un paciente la probabilidad de sufrir problemas cardiacos. Al respecto:
Las pestaƱas de Biplot Variables y Registros Totales en S (Sexo), TDP (Tipo_dolor_pecho), ECG (ECG_reposo), AE (Angina_Ejercicio), PST (Pendi_Segme_ST_Ejercicio) y CS (Clase_salida), se muestran con base en las agrupaciones que estas variables categoricas cualitativas se prestan para establecer la representacion en una dimencionalidad reducida en el plano de factores de registros y dimenciones con base en los puntajes por componentes. En este sentido, es posible apreciar que las agrupaciones con base en Clase_salida y Angina_Ejercicio capturan diferencias acentuadas en la distribucion de las observaciones, contrario al resto de agrupaciones anteriormente mensionadas.
Por ultimo, para mostar de manera mas facil la ubicacion en el plano de componentes (en particular, siempre esta conformado por las dos componentes por el interes que sucitan) y, asi mismo, las semejanzas de perfiles de correlacion entre cada variable, se dispone de las pestaƱas de Coordenadas Individuales [Subconjunto CS] y Biplot de Variables y Registros [Subconjunto CS]. Estas muestran, con base en un subconjunto de 61 registros muestreados de manera aleatoria simple, los puntajes por componente y el biplot de ese subconjunto, con base en la agrupacion provista por la variable categorica Clase_salida, sin perder una cantidad significativa de detalles. Esto, se insiste con el fin de visualizar los datos de mejor manera ya que el conjunto original posee mas de 900 registros y genera una dificualdad en la identificacion visual.
data_HD <- heart_diseases_Dataset[,-c(3,7,9,11,12)]
data_All <- cbind(heart_diseases_Dataset[,-c(2,3,7,9,11,12)], data_HD$Sexo)
fviz_pca_biplot(PCA(data_All, ncp = 6, scale.unit = TRUE, graph = F, quali.sup = 7), axes = c(1, 2), repel = TRUE, habillage = 7)
data_HD <- heart_diseases_Dataset[,-c(2,7,9,11,12)]
data_All <- cbind(heart_diseases_Dataset[,-c(2,3,7,9,11,12)], data_HD$Tipo_dolor_pecho)
fviz_pca_biplot(PCA(data_All, ncp = 6, scale.unit = TRUE, graph = F, quali.sup = 7), axes = c(1, 2), repel = TRUE, habillage = 7)
data_HD <- heart_diseases_Dataset[,-c(2,3,9,11,12)]
data_All <- cbind(heart_diseases_Dataset[,-c(2,3,7,9,11,12)], data_HD$ECG_reposo)
fviz_pca_biplot(PCA(data_All, ncp = 6, scale.unit = TRUE, graph = F, quali.sup = 7), axes = c(1, 2), repel = TRUE, habillage = 7)
data_HD <- heart_diseases_Dataset[,-c(2,3,7,11,12)]
data_All <- cbind(heart_diseases_Dataset[,-c(2,3,7,9,11,12)], data_HD$Angina_Ejercicio)
fviz_pca_biplot(PCA(data_All, ncp = 6, scale.unit = TRUE, graph = F, quali.sup = 7), axes = c(1, 2), repel = TRUE, habillage = 7)
data_HD <- heart_diseases_Dataset[,-c(2,3,7,9,12)]
data_All <- cbind(heart_diseases_Dataset[,-c(2,3,7,9,11,12)], data_HD$Pendi_Segme_ST_Ejercicio)
fviz_pca_biplot(PCA(data_All, ncp = 6, scale.unit = TRUE, graph = F, quali.sup = 7), axes = c(1, 2), repel = TRUE, habillage = 7)
data_HD <- heart_diseases_Dataset[,-c(2,3,7,9,11)]
data_All <- cbind(heart_diseases_Dataset[,-c(2,3,7,9,11,12)], data_HD$Clase_salida)
fviz_pca_biplot(PCA(data_All, ncp = 6, scale.unit = TRUE, graph = F, quali.sup = 7), axes = c(1, 2), repel = TRUE, habillage = 7)
set.seed(780728)
data_61_HD <- heart_diseases_Dataset[sample(1:nrow(heart_diseases_Dataset),61),-c(2,3,7,9,11)]
set.seed(780728)
data_61 <- cbind(heart_diseases_Dataset[sample(1:nrow(heart_diseases_Dataset),61),-c(2,3,7,9,11,12)], data_61_HD$Clase_salida)
head(PCA(data_61, ncp = 6, scale.unit = T, graph = F, quali.sup = 7)$ind$coord, n = 61L)
## Dim.1 Dim.2 Dim.3 Dim.4 Dim.5 Dim.6
## 1 0.55854136 -0.015910010 2.55820760 -0.23511977 -0.93029910 -1.45684946
## 2 1.13696122 0.054712778 -0.78132994 -0.95249261 1.11732238 -0.39405787
## 3 -1.52620507 -0.106554514 -0.15662412 1.02498076 -0.02252833 -0.21550983
## 4 0.44406833 2.384642044 0.12572117 -0.65472060 -2.12516548 0.44237233
## 5 1.40425851 -0.663404925 -0.51811628 -1.83571571 0.04924307 -0.32077657
## 6 -1.60406673 -0.371429541 0.59642586 0.13853442 0.63843117 0.59254226
## 7 -0.14583240 0.768092867 -0.84650985 -0.46672270 -0.60098248 -0.24494774
## 8 -0.47418483 0.082834291 0.05551959 -1.36212705 -0.52161261 0.67880454
## 9 -1.00259945 -1.619082122 0.30303647 -0.21473776 -0.08333087 -0.20905487
## 10 0.11605793 0.103431902 -0.73511408 -1.62320226 -1.19461724 0.58982899
## 11 -2.41836764 0.915732091 0.12688408 0.54838579 -0.63259375 0.83311552
## 12 -0.80896616 0.176442461 0.21576542 -0.66992953 -0.35083059 1.18913549
## 13 2.23546348 -2.633541989 1.31076163 0.43399177 -1.31529051 0.04908444
## 14 -1.29482427 -1.412528871 0.55102729 0.34392086 0.38775536 0.05018932
## 15 -0.82075189 0.368059423 0.33798096 -0.44367263 0.71548309 0.93310137
## 16 0.74182564 -0.164390756 -0.73596169 -0.93787347 0.25254014 0.08926713
## 17 0.27728830 -0.645326124 0.09180417 0.72665333 0.75583231 0.37085936
## 18 0.01526031 0.672166823 0.46496814 -0.58637446 0.70103646 1.25422167
## 19 0.75805337 0.110128262 -0.81117419 -1.46993462 0.04412278 0.22418287
## 20 -1.39060049 -0.721065453 0.67123118 -0.29111271 0.64250636 0.20487969
## 21 -1.93951953 -0.886761862 0.05795576 0.58531909 -0.46806205 -0.63129669
## 22 0.65984886 0.405535995 -0.64578650 0.23299686 1.07473784 -0.69874560
## 23 0.59032645 -1.533831556 -0.15728874 1.03523093 -0.36691333 0.86812888
## 24 -0.48442083 -1.293114316 0.02129009 -0.89419238 0.03124815 -0.26057307
## 25 -0.76301602 0.534559728 -0.38186530 0.18336419 0.39936093 0.16087822
## 26 0.46894593 1.813010422 -0.25225232 -0.74345713 -0.30667938 0.29924466
## 27 -0.65120803 -0.082099424 0.06894299 0.26614946 0.37515951 0.06758962
## 28 -0.28996053 -0.495342057 -0.21904876 -0.27526685 0.35198805 0.01123825
## 29 -2.23359595 -1.184207506 0.28010116 -0.07102325 -1.36361868 -0.18011047
## 30 0.11616013 1.747504992 -1.17327185 -0.01838953 0.01663929 0.54999472
## 31 -1.87635059 -0.994126993 0.28824563 0.04326530 -0.43841382 -0.25188799
## 32 -0.66780962 1.096042881 -0.72602777 0.61343576 0.80397740 -0.23373338
## 33 0.53836682 0.038682766 0.16760247 -1.00525987 1.54068274 0.91470026
## 34 0.83106567 1.227865019 0.17188471 -0.81281674 -1.63626735 -0.51093177
## 35 1.40098174 -0.485674407 -0.94843508 -1.01501678 0.96859366 -0.56327331
## 36 0.61796699 -0.246056639 -1.54810837 -0.64432964 -0.34761095 -1.92020423
## 37 -2.39362121 -1.656655898 0.73503478 0.37782089 -0.54740764 -0.19631137
## 38 1.48863356 -1.141826648 -0.43357676 1.13322684 0.46676564 0.19230755
## 39 1.67892095 -1.297810516 -0.23261688 0.59384402 0.81273251 0.36272741
## 40 -0.67903331 0.434718949 0.36567421 -0.15120207 0.06804151 0.25622615
## 41 -1.63250373 -3.085301434 -0.44663519 0.02818511 0.63679694 -0.42142955
## 42 0.97836636 2.445140846 3.17256984 0.60531984 0.14993696 -0.81035506
## 43 -0.70333619 -0.004349406 -0.19785640 -0.17291137 0.32742078 0.13411447
## 44 2.05160351 0.307933850 1.33527177 -0.96830790 1.56940682 -0.03928967
## 45 0.71470820 2.185972498 1.86716284 0.79983829 0.06040591 -0.63918440
## 46 -1.64815145 -0.884073369 0.28928473 0.10861140 0.14707816 -0.31585334
## 47 3.55750471 0.039227262 -0.81288499 1.41306953 0.17421551 -0.89264279
## 48 -1.17154123 0.693540388 -0.75281082 -0.11323964 -1.05430438 -0.01521446
## 49 0.54598398 0.091931221 -0.97591214 -0.68337004 0.05705810 -0.25043117
## 50 -0.59451677 -0.113403024 0.86715318 -0.29621670 -0.46893453 0.27006755
## 51 2.09483760 -1.615382089 -0.50233304 1.99164118 0.08283898 1.02360627
## 52 -0.17809752 0.668894607 -0.38172603 -0.22935159 0.65491521 -0.11399294
## 53 -1.77087364 0.103090232 -0.50535141 1.15550776 -0.39169039 -0.80831895
## 54 -1.52422644 2.451864644 -1.35383487 2.34170150 0.39875678 -0.69578652
## 55 0.08601282 0.138581216 -1.26378265 -0.64986948 -0.72038382 -0.80121489
## 56 2.59464758 -0.238455007 2.00551087 -0.16302103 0.40247856 -0.71760066
## 57 -0.83255171 0.215008949 1.15857700 0.25955909 1.14657166 -0.01296365
## 58 -0.42816162 2.918762552 -1.31448479 1.13590482 0.54484818 0.60882886
## 59 2.24311259 -0.724651338 -1.94065240 1.06529779 -1.11602118 -0.37008539
## 60 3.41479136 -0.473735232 0.49568429 1.30813645 -1.69783489 1.79186073
## 61 -0.41166939 1.595981065 0.99409331 0.15708485 0.13446445 0.17952906
set.seed(780728)
data_61_HD <- heart_diseases_Dataset[sample(1:nrow(heart_diseases_Dataset),61),-c(2,3,7,9,11)]
set.seed(780728)
data_61 <- cbind(heart_diseases_Dataset[sample(1:nrow(heart_diseases_Dataset),61),-c(2,3,7,9,11,12)], data_61_HD$Clase_salida)
fviz_pca_biplot(PCA(data_61, ncp = 6, scale.unit = T, graph = F, quali.sup = 7), axes = c(1, 2), repel = T, habillage = 7)
En términos generales, esta tercera etapa de estudio presentarÔ cÔlculos, visualizaciones e interpretaciones basadas en el conjunto de datos tratado en las fases 1 y 2. En esta fase, se utilizarÔ un enfoque de anÔlisis de correspondencias simples y múltiples aplicado a las variables cualitativas. Este anÔlisis incluirÔ la construcción de tablas de contingencia y tablas disyuntivas completas, asà como la evaluación de las calidades de representación, contribuciones y las correspondientes interpretaciones. Es importante recordar que el conjunto de datos de trabajo estÔ descrito en la sección 2 y los fundamentos teóricos se encuentran en la sección 1.
Se sabe que el anĆ”lisis de correspondencias simple (ACS) busca representar en un espacio multidimensional reducido la relación existente entre las categorĆas de un par de variables categóricas. En este sentido, el ACS muestra las distancias entre los niveles de dos variables categóricas y, en consecuencia, ayuda a visualizar tablas de contingencia. AdemĆ”s, se establece que el nĆŗmero mĆ”ximo de dimensiones que expliquen la asociación entre las variables fila y columna es igual a uno menos el menor nĆŗmero de categorĆas de alguna de las variables involucradas. Por lo tanto, el anĆ”lisis de correspondencias permite describir la proximidad existente entre los perfiles de los objetos observados.
El ACS, que basa sus cÔlculos en tablas de contingencia, puede extenderse a mÔs de dos variables categóricas, lo cual se conoce como anÔlisis de correspondencias múltiples (ACM), basado en una estructura llamada tabla disyuntiva completa.
Esta sección trata el anÔlisis de correspondencias simples basÔndose en pares de variables categóricas del conjunto de datos descrito.
Planteamiento del problema
A partir de las variables cualitativas del conjunto de datos descrito, se requiere desarrollar un anƔlisis de correspondencias simple. Este anƔlisis se basarƔ en tablas de contingencia y de frecuencias relativas, y se apoyarƔ en grƔficos de perfiles y de puntos superpuestos en el primer plano factorial.
Desarrollo del anƔlisis
Con base en la navegacion en pestaƱas esta nos permitira visualizar objetos matriciales y graficos que nos ayudaran a darle peso a la interpretacion del anƔlisis de correspondecias simples o binarias entre cada par de variables categoricas que mostraron mayor relevancia en el biplot de la seccion 2.5 del conjunto de datos: Sexo, Anginia_Ejerccio y Clase_salida. Por ser una baja cantidad de variables se trabajara con las parejas combinadas sin repeticion de estas tres variables.
La pestaña AC Parejas Totales agrupa los calculos para totas las combinaciones de parejas variables. En particular en Contingencias para darnos un ejemplo haremos una lectura de las tablas de contigencia: La tabla de contingencia Sexo vs. Angina_Ejercicio se encontro que 43 pacientes de un total de 193 del sexo femenino presentaron dolor anginoso a la hora realizar ejercicio; ademas, de los 546 pacientes que no presentaron dolor anginoso a la hora de hacer ejercicio 150 son del sexo femenino y 396 del sexo masculino, de un total de 917 pasientes. En la tabla de contingencia Sexo vs. Clase_salida se encontro que de un total de 724 pasientes del sexo masculino, 457 presentaron una salida con enfermedad cardiaca. ademas, de los 917 pasientes, 507 presentaron salida con enfermedad cardiaca y 410 con una salida normal. En la tabla de contingencia Angina_Ejercicio vs. Clase_salida se encontro que de los 371 que presentaron anginia a la hora de realizar ejercicio 316 pacientes tuvieron una salida con enfermedad cardiaca; ademas, de los 546 pasientes que no presentaron anginia solo 355 tuvieron una salida normal.
Si tomamos como base las tablas de contingencia antes mencionadas, se presenta a traves de una subpestañas la Probabilidades las proporciones relativas en terminos de los pares de variables que se examinaron con anterioridad. En concordancia con esto, a nivel de ejemplo se presenta algunas lecturas de los resultados: en la tabla de probabilidades sexo vs. Angina_Ejercicio el \(40,46\) \(%\) aproximadamente presento angina por ejercicio de los cuales el \(35,77\) \(%\) aproximadamente son de sexo masculino; ademas, encontramos que el \(78,95\) \(%\) aproximadamente son pasientes del sexo masculino en el conjunto de datos, en la tabla de probabiidades Sexo vs. Clase_salida se encontro que de un \(55,26\) \(%\) aproximadamente el \(49,94\) \(%\) son de sexo masculino; ademas, el \(78,95\) \(%\) de los pasientes son de sexo masculino, la tabla de probabilidades Angina_Ejercicio vs. Clase_salida se encontro que el \(40,46\) \(%\) de los pacientes tuvo angina por ejercicio adicional a ello \(34,46\) \(%\) son de sexo masculino.
De la misma forma que ocurrio con las tablas de probabilidades, en la subpestaña Frecuencias [CPF y CPC] las frecuencias condicionadas por filas y columnas de manera respectiva, se calcularon con base en las tablas de contingencia Siguiendo con esto mismo se hara una lectora como ejemplo de los resultados: segun la matriz de frecuencias CPF de Sexo vs. Angina_Ejercicio el \(77,72\) \(%\) de los pacientes de sexo femenino no muestras angina por ejercicio mientras que el \(22,28\) \(%\) si la presenta, en el caso de los pacientes de sexo masculino el \(54,7\) \(%\) no la presenta y el \(45,30\) \(%\) si presenta angina por ejercicio; por otro lado en la CPC tenemos a los pacientes de sexo masuculino que presentan un \(88,41\) \(%\) de presentar anginia por ejercicio; por otro lado el \(77,53\) \(%\) de los pacientes que no presentan angina por ejercicio son de sexo masculino y el \(27,47\) \(%\) son de sexo femenino, ahora en le caso de los pacientes que la presentan el \(88,41\) \(%\) son de sexo masculino, esto nos indica que hay mas prevalencia de sufir de angina por ejercicio segun el sexo del paciente, segun la matriz de frecuencias CPF Sexo vs. Clase_salida en cuanto a pacientes de sexo masuculino el \(63,12\) \(%\) presentaron una salida con enfermedad cardiaca, el caso de los pacientes de sexo femenino el \(74,09\) \(%\) presentaron una salida normal; por otro lado en la CPC tenemos que el \(90,14\) \(%\) de los pacientes que salieron con enferdad cardiaca fueron de sexo masculino y para el sexo femenino el \(34,88\) \(%\) tuvo una salida normal, segun la matriz de frecuencias CPF de Angina_Ejercicio vs. Clase_salida el \(85,18\) \(%\) de los que presentaron angina por ejercicio y presentaron una salida con enfermedad cardiaca, y el \(65,02\) \(%\) de los que no presentaron angina por ejercicio y tuvieron una salida normal, por otro lado la CPC tenemos que de los que tuvieron una clase de salida con enfermedad cardiaca el \(62,33\) \(%\) presento angina por ejercicio mientras que el \(37,67\) \(%\) que tuvo esta salida no presento angina por ejercicio.
Con base en las matrices de frecuencia se entienden los perfiles condicionados por filas y columnas que se muestran en la subpestaƱa Perfiles [CPF y CPC]. Los graficos de perfiles se muestran en el mismo orden de lo anteriormente mensionado. Sin embargo, en los graficos de perfiles se pueden cotejar las proporciones contra un individuo promedio o un perfil promedio el cual se va a etiquetar como marg. Con esto dicho, los perfiles fila y columna que corresponden a las variables Sexo y Angina_Ejercicio muestran ua distribucion marginal un poco alejadas entre si; es decir, si son calculadas las proporciones totales seran un poco distintas entre si, por ejemplo: (Perfiles Fila) la proporcion de pacientes de sexo masculino y femenino que si presentaron angina por ejercicio son \(22,47\) \(%\) y \(45,30\) \(%\) respectivamente; ademas, (perfiles columna) la proporcion de pasientes de sexo masculino que no presentaron y si presentaron angina por ejercicio son \(72,53\) \(%\) y \(88,41\) \(%\) respectivamente. De la misma forma, los perfiles fila y columna que corresponden con las variables Sexo y Clase_salida muestran una distribucion marginal un poco alejadas entre si, por ejemplo: (perfiles fila) las proporciones de pasientes de sexo masculino y femenino que presentaron una salida con enfermedad cardiaca son \(63,12\) \(%\) y \(25,91\) \(%\) de manera respectiva; ademas, (Perfiles Columna) la proporcion de pacientes de sexo masculino que presentaron una clase de salida por enfermedad cardiaca y normal es \(90,14\) \(%\) y \(65,12\) \(%\) de manera respectiva, de la misma forma los perfiles fila y columna que corresponden con las variables Angina_Ejercicio y Clase_salida muestran una distribucion marginal un poco alejadas entre si, por ejemplo: (Perfiles Fila) las proporciones de pasientes que presentaron y no presentaron angina por ejercicio y tubieron una salida con enfermedad cardiaca son \(85,18\) \(%\) y \(34,98\) \(%\) de manera respectiva, ademas, (perfiles Columna) la proporcion de pasientes que si presentaron angina por ejercicio y tuvieron una salida con enfermedad cardiaca y normal son \(62,33\) \(%\) y \(13,41\) \(%\) respectivamente.
Con base en las descripciones hechas es posible anticipar que los pares de variables categoricas Sexo vs Clase_salida y Angina_Ejercicio vs Clase_salida sean independientes. Este conclucion se apoya en los resultados de la prueba de hipótesis visualizada a travĆ©s de la subpestaƱa con ese mismo nombre. Para estas prubebas a un nivel de significancia \(\alpha = 0.05\), las hipótesis formuladas fueron:\[H_0: \text {Las variables categóricas son independientes}\] \[H_1: \text {las variables categóricas son dependientes}\] De la misma forma, el par de variables que tuvo a favor de a dependencia fueron Angina_Ejercicio y Clase_salida, en esta prueba \(p-valor\) resultó menor o igual que el nivel de significancia y, comparativamente, el valor del estadĆstico \(\chi^2\) fue grande. Por lo tanto, el par de variables que continuaron en anĆ”lisis fueron estas Ćŗltimas.
A travĆ©s de la pestaƱa AC Pareja Ćnica se despliegan las subpestaƱas relacionadas con el anĆ”lisis de correspondencias entre las variables seleccionadas. En la sección de Contingencias y Residuales [ANG-CS] (donde ANG representa Angina_Ejercicio y CS Clase_salida) se pueden visualizar las tablas de contingencia, valores esperados y residuales de la pareja de variables en curso. En las dos primeras tablas, se observa que el recuento observado y el recuento esperado bajo la hipótesis nula son significativamente diferentes, lo que refuerza la dependencia entre las variables. El rango_observado representa los recuentos asociados con cada categorĆa de datos, mientras que el rango_esperado indica los recuentos esperados bajo la hipótesis nula. AdemĆ”s, el anĆ”lisis de residuales de Pearson y estandarizados muestra que las mayores desviaciones respecto a los valores esperados ocurren entre las universidades de cinco, cuatro, dos y una estrella. En la subpestaƱa Contribuciones [ANG-CS], se puede apreciar que el valor de aquellos que no presentaron Angina_ejercicio es mĆ”s bajo en comparación con los que sĆ la presentaron; sin embargo, los valores no estĆ”n muy alejados en general, lo que indica que ambos grupos aportan una contribución significativa al comportamiento del conjunto de datos.
Por ultimo, el resultado que sera definitivo del analisis de correspondencias simples se muestra en la subpestaƱa Correspondecias Simples Unidimencionales [ANG-CS]. En este apartado se establece qeu solo una dimension absorbe toda la variabilidad de la pareja, por lo que la representacion bidimensional en le plano de factores es imposible de realizar. Sin embargo, es posible hacer una interpretacion unidimensional de los resultados obtenidos. Al ser requeridas las variables de soporte del AC, primero por columnas y luego por filas, las coordenadas proyectadas de la variable Clase_salida en relacion con las categoria normal se presenta en el lado positivo del eje, mientras tanto la categoria enfermedad cardiaca se encuentra en lado negativo del eje, Asi mismo presentando una mayor contribucion la categoria normal, aunque cabe recalcar que la categoria enfermedad cardiaca tambien presenta una buena contribucion pero es menor a la otra categoria es decir son bastante equilibradas, ademas, es determinante que la calidad de representacion alcanza el maximo con cada una de las variables. Un comportamiento semenjante a lo mensionado de manera anterior se puede apreciar con la variable fila Angina_ejercicio su calidad de representacion es maxima, las coordenadas de sus categorias se interponen en el eje unidimensional y sus contribuciones son bastante equilibradas. De lo mencionado se puede interpretar que presenta asociacion relevante, positiva y negativa entre filas y columnas, las cotegorias (de las respectivas variables) Sin angina por ejercicio con salida normal y con angina por ejercicio con enfermedad cardiaca
addmargins(table(heart_diseases_Dataset$Sexo, heart_diseases_Dataset$Angina_Ejercicio))
##
## N Y Sum
## F 150 43 193
## M 396 328 724
## Sum 546 371 917
addmargins(table(heart_diseases_Dataset$Sexo, heart_diseases_Dataset$Clase_salida))
##
## Enfermedad cardiaca Normal Sum
## F 50 143 193
## M 457 267 724
## Sum 507 410 917
addmargins(table(heart_diseases_Dataset$Angina_Ejercicio, heart_diseases_Dataset$Clase_salida))
##
## Enfermedad cardiaca Normal Sum
## N 191 355 546
## Y 316 55 371
## Sum 507 410 917
addmargins(prop.table(table(heart_diseases_Dataset$Sexo, heart_diseases_Dataset$Angina_Ejercicio))*100)
##
## N Y Sum
## F 16.357688 4.689204 21.046892
## M 43.184297 35.768811 78.953108
## Sum 59.541985 40.458015 100.000000
addmargins(prop.table(table(heart_diseases_Dataset$Sexo, heart_diseases_Dataset$Clase_salida))*100)
##
## Enfermedad cardiaca Normal Sum
## F 5.452563 15.594329 21.046892
## M 49.836423 29.116685 78.953108
## Sum 55.288986 44.711014 100.000000
addmargins(prop.table(table(heart_diseases_Dataset$Angina_Ejercicio, heart_diseases_Dataset$Clase_salida))*100)
##
## Enfermedad cardiaca Normal Sum
## N 20.828790 38.713195 59.541985
## Y 34.460196 5.997819 40.458015
## Sum 55.288986 44.711014 100.000000
round(addmargins(prop.table(table(heart_diseases_Dataset$Sexo, heart_diseases_Dataset$Angina_Ejercicio), 1)*100, 2), 2)
##
## N Y Sum
## F 77.72 22.28 100.00
## M 54.70 45.30 100.00
round(addmargins(prop.table(table(heart_diseases_Dataset$Sexo, heart_diseases_Dataset$Angina_Ejercicio), 2)*100, 1), 2)
##
## N Y
## F 27.47 11.59
## M 72.53 88.41
## Sum 100.00 100.00
round(addmargins(prop.table(table(heart_diseases_Dataset$Sexo, heart_diseases_Dataset$Clase_salida), 1)*100, 2), 2)
##
## Enfermedad cardiaca Normal Sum
## F 25.91 74.09 100.00
## M 63.12 36.88 100.00
round(addmargins(prop.table(table(heart_diseases_Dataset$Sexo, heart_diseases_Dataset$Clase_salida), 2)*100, 1), 2)
##
## Enfermedad cardiaca Normal
## F 9.86 34.88
## M 90.14 65.12
## Sum 100.00 100.00
round(addmargins(prop.table(table(heart_diseases_Dataset$Angina_Ejercicio, heart_diseases_Dataset$Clase_salida), 1)*100, 2), 2)
##
## Enfermedad cardiaca Normal Sum
## N 34.98 65.02 100.00
## Y 85.18 14.82 100.00
round(addmargins(prop.table(table(heart_diseases_Dataset$Angina_Ejercicio, heart_diseases_Dataset$Clase_salida), 2)*100, 1), 2)
##
## Enfermedad cardiaca Normal
## N 37.67 86.59
## Y 62.33 13.41
## Sum 100.00 100.00
plotct(table(heart_diseases_Dataset$Sexo, heart_diseases_Dataset$Angina_Ejercicio),"row")
plotct(table(heart_diseases_Dataset$Sexo, heart_diseases_Dataset$Angina_Ejercicio),"col")
plotct(table(heart_diseases_Dataset$Sexo, heart_diseases_Dataset$Clase_salida),"row")
plotct(table(heart_diseases_Dataset$Sexo, heart_diseases_Dataset$Clase_salida),"col")
plotct(table(heart_diseases_Dataset$Angina_Ejercicio, heart_diseases_Dataset$Clase_salida),"row")
plotct(table(heart_diseases_Dataset$Angina_Ejercicio, heart_diseases_Dataset$Clase_salida),"col")
chisq.test(table(heart_diseases_Dataset$Sexo, heart_diseases_Dataset$Angina_Ejercicio))
##
## Pearson's Chi-squared test with Yates' continuity correction
##
## data: table(heart_diseases_Dataset$Sexo, heart_diseases_Dataset$Angina_Ejercicio)
## X-squared = 32.583, df = 1, p-value = 1.142e-08
chisq.test(table(heart_diseases_Dataset$Sexo, heart_diseases_Dataset$Clase_salida))
##
## Pearson's Chi-squared test with Yates' continuity correction
##
## data: table(heart_diseases_Dataset$Sexo, heart_diseases_Dataset$Clase_salida)
## X-squared = 83.871, df = 1, p-value < 2.2e-16
chisq.test(table(heart_diseases_Dataset$Angina_Ejercicio, heart_diseases_Dataset$Clase_salida))
##
## Pearson's Chi-squared test with Yates' continuity correction
##
## data: table(heart_diseases_Dataset$Angina_Ejercicio, heart_diseases_Dataset$Clase_salida)
## X-squared = 223.11, df = 1, p-value < 2.2e-16
chisq.test(table(heart_diseases_Dataset$Angina_Ejercicio, heart_diseases_Dataset$Clase_salida))$observed
##
## Enfermedad cardiaca Normal
## N 191 355
## Y 316 55
chisq.test(table(heart_diseases_Dataset$Angina_Ejercicio, heart_diseases_Dataset$Clase_salida))$expected
##
## Enfermedad cardiaca Normal
## N 301.8779 244.1221
## Y 205.1221 165.8779
chisq.test(table(heart_diseases_Dataset$Angina_Ejercicio, heart_diseases_Dataset$Clase_salida))$residuals
##
## Enfermedad cardiaca Normal
## N -6.381595 7.096452
## Y 7.741740 -8.608959
chisq.test(table(heart_diseases_Dataset$Angina_Ejercicio, heart_diseases_Dataset$Clase_salida))$stdres
##
## Enfermedad cardiaca Normal
## N -15.00444 15.00444
## Y 15.00444 -15.00444
chisq.test(table(heart_diseases_Dataset$Angina_Ejercicio, heart_diseases_Dataset$Clase_salida))$residuals^2/chisq.test(table(heart_diseases_Dataset$Angina_Ejercicio, heart_diseases_Dataset$Clase_salida))$statistic*100
##
## Enfermedad cardiaca Normal
## N 18.25344 22.57194
## Y 26.86356 33.21908
CA(table(heart_diseases_Dataset$Angina_Ejercicio, heart_diseases_Dataset$Clase_salida), graph = FALSE)$eig
## eigenvalue percentage of variance cumulative percentage of variance
## dim 1 0.2455105 100 100
CA(table(heart_diseases_Dataset$Angina_Ejercicio, heart_diseases_Dataset$Clase_salida), graph = FALSE)$col
## $coord
## [,1]
## Enfermedad cardiaca -0.4455772
## Normal 0.5509942
##
## $contrib
## [,1]
## Enfermedad cardiaca 44.71101
## Normal 55.28899
##
## $cos2
## [,1]
## Enfermedad cardiaca 1
## Normal 1
##
## $inertia
## [1] 0.1097702 0.1357402
CA(table(heart_diseases_Dataset$Angina_Ejercicio, heart_diseases_Dataset$Clase_salida), graph = FALSE)$row
## $coord
## N Y
## 0.4084375 -0.6010967
##
## $contrib
## N Y
## 40.45802 59.54198
##
## $cos2
## N Y
## 1 1
##
## $inertia
## [1] 0.09932866 0.14618180
Se afirma que el AnĆ”lisis de Correspondencias Simples (ACS) puede ampliarse desde tablas de contingencia hacia tablas disyuntivas completas. En estas Ćŗltimas, las filas representan objetos a los que se les registran caracterĆsticas de interĆ©s a travĆ©s de las columnas, que recopilan las modalidades de las variables categóricas estudiadas. De esta manera, el AnĆ”lisis de Correspondencias MĆŗltiple (ACM) es el ACS aplicado a una tabla disyuntiva completa. Por lo tanto, en el ACM, una variable categórica asigna a cada objeto de una población una modalidad especĆfica, dividiĆ©ndolos de manera exclusiva y exhaustiva.
Esta sección se desarrolla como una alternativa para completar el anĆ”lisis de correspondencias simples, que resultó insuficiente debido a la unidimensionalidad en la representación de los datos al proyectar las variables categóricas que cumplĆan con la hipótesis de dependencia. Por lo tanto, se espera que el tratamiento conjunto de todas las variables categóricas proporcione una representación en el primer plano factorial.
Planteamiento del Problema
Con base en las variables cualitativas del conjunto de datos descrito, se requiere desarrollar un anÔlisis de correspondencias múltiples (ACM) para lograr una representación grÔfica en el primer plano factorial, ya que esto no fue posible mediante el anÔlisis de correspondencias simple (ACS).
El ACM permitirÔ analizar conjuntamente todas las variables categóricas del conjunto de datos, proporcionando una representación mÔs completa y multidimensional. Se utilizarÔn tablas disyuntivas completas para este anÔlisis y se generarÔn grÔficos que representen los perfiles y puntos superpuestos en el primer plano factorial, facilitando asà una interpretación mÔs clara y detallada de las relaciones entre las variables categóricas y los objetos estudiados.
Desarrollo del AnƔlisis
Con base en la navegacion a través de pestañas se permitira visualizar objetos matriciales y graficos que ayuden a desarrollar e interpretar los resultados del anÔlisis de correspondecias múltiples (ACM) entre las variables categoricas del conjunto de datos.
La pestaƱa ACM muestra la multidimencionalidad que se esperaba,comparada con la unidimensional del ACS de la fase 3 al trabajar de manera conjunta con las 6 variables categoricas del conjunto de datos: Sexo, Tipo_dolor_pecho, ECG_reposo, Angina_Ejercicio, Pendi_Segme_ST_Ejercicio y Clase_salida. Muestran ademas que las dimensiones del plan principal explican el \(37,59\) \(%\) del conjunto (sera este plano que se continuara con las interpretaciones del ACM). Ademas, la evidente baja de concentracion de absorcion de varianza por parte de algunas dimensiones se vera reflejado en las distacias de los perfiles de las variables categoricas.
En la pestaƱa Biplot ACM se mostraran las semenjazas de los perfiles de los pacientes de manera grafica por este motivo a partir de este se creo el Biplot ACM [Reducido] que facilitara la comprension de los resultados, en concordancia con esto los puntos azules sobrepuestos indican coordenadas de convergencia y las asociaciones entre algunas categorias de las variables y conjuntos de pasientes. Cabe reclacar que las sememjanzas entre categorias de variables estan representadas por sus coordenadas respecto a los semiejes dimensionales, mas que por la proximidad de estos entre si, esto concuerda con los resultados obtenidos en la fase 3. Por ejemplo, en semejanza a nivel de las categorias de las variables destacan los grupos: observaciones numeradas en el lado derecho del grĆ”fico, cercanas a modalidades como angina tĆpica y Angina_Ejersicio_N, sugieren que estas observaciones tienen caracterĆsticas relacionadas con estas modalidades. Por otro lado, observaciones numeradas en el lado izquierdo del grĆ”fico, cercanas a modalidades como Enfermedad cardĆaca y ECG en reposo_LVH, indican una asociación con estas condiciones. En general se pueden visualizar facilmente las asociaciones entre las categorias de las variables y los grupos de pacientes afines a estas.
Seguidamente, la pestaƱa Calidad de Representacion muestra que las categorias de la variable Clase_salida fueron las mejores representadas, en posicion a las categorias desendentes de la variable Pendi_Segme_ST_Ejercicio. El resto quedo en un rango en un rango bajo-alto de calidad de representacion. Como la calidad de representacion en subespacios de dimensiones reducidas se mide en porcentajes de inercia con repecto al total del acercania de un punto repecto al origen del plano factorial indica una baja representacion en el, de manera complementaria la matriz de calidad de representaciones evidencia numerica de las contribuciones de cada dimension tomando como ejemplo la 1 teniendo la contribucion mas alta de \(0,73\).
Tambien de manera complementaria, la pestaƱa Contribuciones muestra que para las dimenciones del primer plano factorial, y en concordancia con lo antes mencionado la categoria de la variable Clase_salida: normal y enfermedad cardiaca quedan por encima de la linea media de la primera dimension, pero de manera particular, la categoria de Tipo_dolor_pecho: angina atipica se encuentra un poco mas arriba de la linea media en las dos primeras dimenciones, cosa que no ocurre con la primera variable mencionada, En ese sentido en la pestaƱa Biplot con contribuciones se visualiza una representacion en el primer plano factorial semejante a la obtenida en la pestaƱa Calidad de Representaciones.
round(MCA(heart_diseases_Dataset[1:917, -c(1,4,5,6,8,10)], graph = FALSE)$eig,2)
## eigenvalue percentage of variance cumulative percentage of variance
## dim 1 0.44 26.22 26.22
## dim 2 0.19 11.37 37.59
## dim 3 0.17 10.36 47.96
## dim 4 0.16 9.89 57.85
## dim 5 0.16 9.67 67.52
## dim 6 0.16 9.43 76.96
## dim 7 0.14 8.41 85.36
## dim 8 0.10 5.93 91.30
## dim 9 0.09 5.44 96.74
## dim 10 0.05 3.26 100.00
fviz_mca_biplot(MCA(heart_diseases_Dataset[1:917, -c(1,4,5,6,8,10)], graph = FALSE), repel = TRUE)
set.seed(780728)
fviz_mca_biplot(MCA(heart_diseases_Dataset[sample(1:nrow(heart_diseases_Dataset),150), -c(1,4,5,6,8,10)], graph = FALSE), repel = TRUE)
fviz_mca_var(MCA(heart_diseases_Dataset[1:917, -c(1,4,5,6,8,10)], graph = FALSE), col.var ="cos2", gradient.cols = c("#00AFBB", "#E7B800", "#FC4E07"), repel = TRUE)
MCA(heart_diseases_Dataset[1:917, -c(1,4,5,6,8,10)], graph = FALSE)$var$cos2
## Dim 1 Dim 2 Dim 3
## F 0.1733053996 1.165236e-02 0.0450171827
## M 0.1733053996 1.165236e-02 0.0450171827
## angina atipica 0.3238946018 1.553950e-01 0.0746789380
## angina tipica 0.0075263309 3.360387e-01 0.0814224737
## asintomatico 0.4855875046 3.194743e-02 0.0070496922
## dolor no anginoso 0.0649938918 7.937301e-02 0.2593093186
## ECG_reposo_LVH 0.0004140751 5.260410e-01 0.0116631482
## ECG_reposo_Normal 0.0266934484 2.467054e-01 0.0676042458
## ECG_reposo_ST 0.0329513132 1.570603e-02 0.1867725248
## Angina_Ejercicio.N 0.5431374271 1.483601e-02 0.0002465765
## Angina_Ejercicio.Y 0.5431374271 1.483601e-02 0.0002465765
## ascendente 0.5902330512 1.426892e-02 0.0201714935
## descendente 0.0406801756 5.519248e-02 0.3723242915
## plano 0.4340536342 3.011041e-07 0.2019123077
## Clase_salida_Enfermedad cardiaca 0.7337250662 9.484742e-05 0.0019903810
## Clase_salida_Normal 0.7337250662 9.484742e-05 0.0019903810
## Dim 4 Dim 5
## F 0.0001932359 0.0037435604
## M 0.0001932359 0.0037435604
## angina atipica 0.0384898912 0.0138189370
## angina tipica 0.3538838909 0.0180390268
## asintomatico 0.0062927454 0.0268773726
## dolor no anginoso 0.3527293847 0.0563399087
## ECG_reposo_LVH 0.0005794692 0.0306929063
## ECG_reposo_Normal 0.0350302800 0.2720974461
## ECG_reposo_ST 0.0429200170 0.6801257328
## Angina_Ejercicio.N 0.0083368055 0.0052494001
## Angina_Ejercicio.Y 0.0083368055 0.0052494001
## ascendente 0.0019596869 0.0025643025
## descendente 0.2501756081 0.1893266477
## plano 0.0881365118 0.0288905904
## Clase_salida_Enfermedad cardiaca 0.0081818339 0.0005200968
## Clase_salida_Normal 0.0081818339 0.0005200968
fviz_contrib(MCA(heart_diseases_Dataset[1:917, -c(1,4,5,6,8,10)], graph = FALSE), choice = "var", axes = 1, top = 15)
fviz_contrib(MCA(heart_diseases_Dataset[1:917, -c(1,4,5,6,8,10)], graph = FALSE), choice = "var", axes = 2, top = 15)
fviz_contrib(MCA(heart_diseases_Dataset[1:917, -c(1,4,5,6,8,10)], graph = FALSE), choice = "var", axes = 3, top = 15)
fviz_contrib(MCA(heart_diseases_Dataset[1:917, -c(1,4,5,6,8,10)], graph = FALSE), choice = "var", axes = 4, top = 15)
fviz_contrib(MCA(heart_diseases_Dataset[1:917, -c(1,4,5,6,8,10)], graph = FALSE), choice = "var", axes = 5, top = 15)
fviz_mca_var(MCA(heart_diseases_Dataset[1:917, -c(1,4,5,6,8,10)], graph = FALSE), col.var ="contrib", gradient.cols = c("#00AFBB", "#E7B800", "#FC4E07"), repel = TRUE)
En tĆ©rminos generales, este estudio explorarĆ” la relación entre dos o mĆ”s variables mediante la obtención de información sobre una de ellas basada en el conocimiento de los valores de las demĆ”s. La relación establecida entre ellas serĆ” de naturaleza no determinĆstica, es decir, se formularĆ”n relaciones probabilĆsticas y se desarrollarĆ”n procedimientos para hacer inferencias sobre los modelos utilizados en este estudio, al mismo tiempo que se obtienen medidas cuantitativas del grado de relación entre las variables. Los modelos analizados pueden considerarse casos especiales del modelo lineal generalizado: Regresión Lineal Simple, Regresión Lineal MĆŗltiple y Regresión LogĆstica. En cada sección se describirĆ” teóricamente cada modelo y se aplicarĆ” a un conjunto de datos especĆfico. Se reconoce que el anĆ”lisis de regresión es un proceso de naturaleza estadĆstica utilizado para estimar relaciones entre variables (una dependiente o de respuesta y otras independientes o predictoras) mediante tĆ©cnicas de modelado y anĆ”lisis que permiten comprender cómo varĆa el valor de la variable dependiente al cambiar el valor de una o mĆ”s variables independientes. Los modelos de anĆ”lisis de regresión estudiados en este documento serĆ”n: lineal (simple y mĆŗltiple) y logĆstico, todos ellos entendidos como casos del modelo de regresión lineal generalizado.
Este modelo, que eventualmente serĆ” llamado en este estudio como RLS, estĆ” conformado por dos variables estadĆsticas \(x\) y \(Y\), donde \(Y\) se asume que estĆ” influida por \(x\). La relación estĆ” dada matemĆ”ticamente por: \[Y = \beta_0 + \beta_1 x + \varepsilon \hspace{10mm} \hspace{10mm}(1)\] donde:
En comparación con el modelo lineal simple determinĆstico \(y = \beta_0 + \beta_1 x\), el probablĆstico supone que el valor esperado de \(Y\) es una función lineal de \(x\), pero que con \(x\) fija, la variable \(Y\) difiere de su valor esperado en una cantidad aleatoria \(\varepsilon\). AdemĆ”s, la cantidad \(\varepsilon\) en la ecuación de modelo \((1)\) se supone normalmente distribuida con \(E(\varepsilon)=0\) y \(V(\varepsilon)=\sigma^2\). La variable aleatoria \(\varepsilon\) tambiĆ©n se conoce como tĆ©rmino de error aleatorio o desviación aleatoria en el modelo.
Complementariamente, casi nunca serĆ”n conocidos los valores \(\beta_0\), \(\beta_1\) y \(\sigma^2\), a cambio estarĆ” disponible una muestra de datos compuesta de pares ordenados \((x_1,y_1)... (x_n,y_n)\) con la que los parĆ”metros del modelo y la lĆnea de regresión verdadera pueden ser estimados, bajo el supuesto de independencia de las observaciones. AsĆ, \(y_i\) es el valor observado de una variable aleatoria \(Y_i\), donde \(Y_i=\beta_0+\beta_1x_i+\varepsilon_i\) y las \(n\) desviaciones \(\varepsilon_1\), \(\varepsilon_2\), \(...\), \(\varepsilon_n\) son variables independientes.
De acuerdo con el modelo, los puntos observados estarĆ”n distribuidos aleatoriamente alrededor de la lĆnea de regresión verdadera. En este sentido, la estimación de \(y=\beta_0+\beta_1x\) deberĆ” ser una lĆnea que se ajuste lo mejor posible a los puntos muestra. Tal lĆnea deberĆ” poseer la caracterĆstica de que las distancias verticales (desviaciones) de los puntos observados a la lĆnea misma son pequeƱas. La medida de la bondad de ajuste serĆ” la suma de los cuadrados de estas desviaciones. En consecuencia, la lĆnea que mejor se ajusta serĆ” la que tenga la suma mĆ”s pequeƱa posible de desviaciones al cuadrado. El resultado que implica las ideas expuestas se conoce como: principio de los mĆnimos cuadrados y se remonta a los matemĆ”ticos Carl Friedrich Gauss y Adrien-Marie Legendre, entre el Ćŗltimo lustro del siglo XVIII y el primero del siglo XIX.
El principio de los mĆnimos cuadrados establece que la desviación vertical del punto \((x_i,y_i)\) con respecto a la lĆnea \(y=b_0+b_1x\) es \(y_i-(b_0+b_1x)\) y la suma de las desviaciones verticales al cuadrado de los puntos \((x_i,y_i)\) a la lĆnea es \(f(b_0,b_1)=\sum_{i=1}^n (y_i-(b_0+b_1x_i))^2\). AsĆ, las estimaciones puntuales de \(\beta_0\) y \(\beta_1\), representadas como \(\hat{\beta}_0\) y \(\hat{\beta}_1\) y llamadas estimaciones de mĆnimos cuadrados, son los valores que minimizan a \(f(b_0,b_1)\); es decir, \(f(\hat{\beta}_0,\hat{\beta}_1)\leq f(b_0,b_1)\) para cualesquiera \(\beta_0\) y \(\beta_1\). Por lo tanto, la lĆnea de regresión estimada o lĆnea de mĆnimos cuadrados es \(y=\hat{\beta}_0+\hat{\beta}_1x\).
Luego de calcular y resolver las ecuaciones en derivadas parciales de \(f(b_0,b_1)\) respecto a \(b_0\) y \(b_1\) igualadas a cero, se obtiene un sistemas de ecuaciones llamadas normales que son lineales en \(b_0\) y \(b_1\) y para las cuales, siempre que por lo menos dos de las \(x_i\) sean diferentes, las estimaciones de los mĆnimos cuadrados son la Ćŗnica solución del sistema. En consecuencia, la estimación de los mĆnimos cuadrados de \(\beta_1\) de la lĆnea de regresión verdadera es: \[\hat{\beta}_1=\dfrac{\sum_{i=1}^n(x_i-\bar{x})(y_i-\bar{y})}{\sum_{i=1}^n(x_i-\bar{x})^2}=\dfrac{S_{xy}}{S_{xx}}\hspace{10mm}(2)\] y la estimación de los mĆnimos cuadrados de \(\beta_0\) de la lĆnea de regresión verdadera es: \[\hat{\beta}_0=\dfrac{\sum_{i=1}^ny_i-\hat{\beta}_1\sum_{i=1}^nx_i}{n}=\bar{y}-\hat{\beta}_1\bar{x}\hspace{10mm}(3)\] Para hacer los cĆ”lculos que las ecuaciones anteriores demandan es necesario reducir al mĆnimo los efectos de redondeo. TambiĆ©n, antes de calcular \(\hat{\beta}_1\) y \(\hat{\beta}_0\) se debe examir grĆ”ficamente el conjunto de datos por usar para percibir la factibilidad de uso de un modelo probabilĆstico lineal, es decir, si grĆ”ficamente los puntos estĆ”n lejos de tender a aglomerarse en torno a una lĆnea recta con aproximadamente el mismo grado de dispersión de todas las \(x_i\), entonces deben ser indagados otros modelos.
Es indispensable mencionar que la lĆnea de mĆnimos cuadrados debe usarse restringidamente para predecir valores de \(x\) lejanos del rango de los datos, porque la relación ajustada puede carecer de validez para ellos.
Ahora, el parĆ”metro \(\sigma^2\) que determina la cantidad de variabilidad es inherente en el modelo de regresión descrito: su valor conducirĆ” a establecer que los valores observados estarĆ”n dispersos en mayor o menor medida en torno a la lĆnea de regresión verdadera. AsĆ, los residuos \(y_i - \hat{y_i}\) son las desviaciones verticales con respecto a la lĆnea estimada. Si todos los residuos son pequeƱos comparados con cero, entonces la variabilidad de los valores \(y\) observados se deberĆa en una elevada medida a la relación lineal entre \(x\) y \(y\), mientras que si los residuos son grandes comparados con cero, entonces queda sugerida una variabilidad inherente en \(y\) con respecto a la cantidad debida a la relación lineal. AsĆ, la estimación de \(\sigma^2\) en un anĆ”lisis de regresión estĆ” basada en el cĆ”lculo de la suma de cuadrados residuales (o suma de cuadrados del error SCE) que se reduce a: \[SCE=\sum_{i=1}^ny_i^2-\hat{\beta}_0\sum_{i=1}^ny_i-\hat{\beta}_1\sum_{i=1}^nx_iy_i\hspace{10mm}(4)\] \[\hat\sigma^2=s^2=\dfrac{SCE}{n-2}\hspace{10mm}(5)\] Si se ha entendido que la cantidad SCE establece una medida de cuĆ”nta variación de \(y\) es inexplicada por el modelo; es decir, sin atribución a la relación lineal, se entenderĆ” tambiĆ©n que existe otra cantidad llamada la suma total de los cuadrados STC, que permite obtener una medida de la cantidad de variación total en los valores \(y\) observados: \[STC=\sum_{i=1}^ny_i^2-\frac{(\sum_{i=1}^ny_i)^2}{n}\hspace{10mm}(6)\] Si se formula la razón \(SCE/STC\) se calcula la proporción de variación total inexplicada por el modelo de regresión lineal simple; por lo tanto, se llega a la definición del coeficiente de determinación \(r^2\): \[r^2=1-\frac{SCE}{STC}\hspace{10mm}(7)\] que se interpreta como la proporción de variación \(y\) observada que puede ser explicada por el modelo de regresión lineal simple; es decir, aquella atribuida a una relación lineal aproximada entre \(x\) y \(y\): mientras mĆ”s cercano a 1 sea \(r^2\), mĆ”s exitoso es el modelo de regresión lineal simple al explicar la variación de \(y\). Una forma alternativa de calcular el coeficiente de determinación se basa en la suma de cuadrados debidad a la regresión SCR (o al modelo de regresión SCM), que es la cantidad de variación total que es explicada por el modelo. Con base en ella el coeficiente de determinación se expresa como: \[r^2=1-\frac{SCE}{STC}=\frac{STC-SCE}{STC}=\frac{SCR}{STC}\hspace{10mm}(8)\]Como se sabe, cualquier cantidad calculada a partir de datos muestrales varĆa de una cantidad a otra, en este sentido, los procedimientos inferenciales estandarizan un estimador restando su valor medio y luego dividiĆ©ndolo entre su desviación estĆ”ndar estimada. En particular, para un modelo supuesto de regresión lineal simple se implica que las variables estĆ”ndares: \(t_{(n-2)}=\dfrac{\hat{\beta}_0-\beta_0}{\hat{\sigma} \sqrt{1/n+\bar{x}^2/S_{xx}}}\) y \(t_{(n-2)}=\dfrac{\hat{\beta}_1-\beta_1}{ \hat{\sigma} \sqrt{1/S_{xx}}}\) tienen distribuciones \(t\) con \(n-2\) grados de libertad. De esto se deduce que los intervalos de confianza de \(100*(1-\alpha)\%\) para la pendiente \(\beta_1\) y el intercepto \(\beta_0\) de la lĆnea de regrasión verdadera son: \[\hat{\beta}_0 \pm t_{\alpha/2, n-2} \cdot \hat{\sigma} \sqrt{1/n+\bar{x}^2/S_{xx}}\hspace{10mm}(9)\] \[\hat{\beta}_1 \pm t_{\alpha/2, n-2} \cdot \hat{\sigma} \sqrt{1/S_{xx}} \hspace{10mm} (10)\]estos intervalos estĆ”n centarados en la en la estimación puntual de cada parĆ”metro y la cantidad abarcada a cada lado de la estimación depende del nivel de confianza deseado y de la cantidad de variabilidad del estimador.
Dado lo anterior, para los procedimientos de prueba de hipótesis, y como se procede habitualmente, las hipótesis nulas respecto a los beta del modelo de regresión lineal simple serĆ”n enunciados de igualdad. Los valores nulos para \(\beta_0\) y \(\beta_1\) se representan respectivamente como \(\beta_{00}\) (ābeta cero ceroā) y \(\beta_{10}\) (ābeta uno ceroā). AdemĆ”s, como los estadĆsticos de prueba tienen distribuciones \(t\) con \(n-2\) grados de libertad cuando \(H_0\) es verdadera, la probabilidad de error Tipo I permanece al nivel deseado \(\alpha\) usando un valor crĆtico \(t\) adecuado. AsĆ, las hipótesis comĆŗnmente usadas para \(\beta_0\)son: \[H_0: \beta_0 = \beta_{00}\hspace{10mm}(11)\] \[H_1: \beta_0 \neq \beta_{00}\hspace{10mm}(12)\]cuyo estadĆstico de prueba es: \[t_{(n-2)}=\dfrac{\hat{\beta}_0-\beta_{00}}{\hat{\sigma} \sqrt{1/n+\bar{x}^2/S_{xx}}}\hspace{10mm}(13)\]y para \(\beta_1\) son: \[H_0: \beta_1 = \beta_{10}\hspace{10mm}(14)\] \[H_1: \beta_1 \neq \beta_{10}\hspace{10mm}(15)\]cuyo estadĆstico de prueba es:\[t_{(n-2)}=\dfrac{\hat{\beta}_1-\beta_{10}}{\hat{\sigma} \sqrt{1/S_{xx}}}\hspace{10mm}(16)\]el par de hipótesis definidas por \(14\), \(15\) y \(16\) se conoce como la prueba de utilidad del modelo de regresión lineal simple, donde: la región de rechazo de \(H_0\) para una prueba a nivel \(\alpha\) a favor de \(H_1: \beta_1>\beta_{10}\) es \(t\geq t_{\alpha,n-2}\); la región de rechazo de \(H_0\) para una prueba a nivel \(\alpha\) a favor de \(H_1: \beta_1<\beta_{10}\) es \(t\leq -t_{\alpha,n-2}\); y la región de rechazo de \(H_0\) para una prueba a nivel \(\alpha\) a favor de \(H_1: \beta_1\neq\beta_{10}\) es \(t\leq -t_{\alpha/2,n-2}\) o \(t\geq t_{\alpha/2,n-2}\). AdemĆ”s, se sabe que la prueba de utilidad del modelo de regresión simple puede ser probada con una tabla ANOVA: rechazando \(H_0\) si \(f\geq F_{\alpha,1,n-2}\). La prueba \(F\) da exactamente el mismo resultado que la prueba \(t\) de utilidad del modelo de regresión lineal simple.
Por Ćŗltimo, se entiende que en un modelo de regresión lineal simple un valor futuro de \(Y\) no es parĆ”metro sino una variable aleatoria, por lo que se debe hacer referencia a un intervalo de valores factibles para un valor futuro de \(Y\), al cual se le llama intervalo de predicción. Cuando se predice con base en el modelo de regresión lineal simple, el error de predicción es \(Y-( \hat{\beta}_0+ \hat{\beta}_1 x^*)\) que corresponde con una diferencia entre dos variables aleatorias, por lo que, en comparación con una estimación, habrĆ” mĆ”s incertidumbre en ese; por lo tanto, un intervalo de predicción serĆ” mĆ”s ancho que un intervalo de confianza. AdemĆ”s, a partir de la varianza del error de predicción se puede establecer que la variable estandarizada: \[T=\dfrac{Y-(\hat{\beta}_0+ \hat{\beta}_1 x^*)}{S \displaystyle\sqrt{1+\dfrac{1}{n} + \dfrac{(x^*-\bar{x})^2}{S_{xx}}}}\hspace{10mm}(17)\] tiene una distribución \(t\) con \(n-2\) grados de libertad, a partir de la cual se obtine un intervalo de predicción de \(100*(1-\alpha)\%\) para una observación \(Y\) futura que se harĆ” cuando \(x=x^*\) igual a: \[\hat{\beta}_0+\hat{\beta}_1 x^*\pm t_{n-2,\alpha/2}\cdot s \displaystyle\sqrt{1+\dfrac{1}{n}+\dfrac{(x^*-\bar{x})^2}{S_{xx}}}\hspace{10mm}(18)\] La interpretación del nivel de predicción de \(100*(1-\alpha)\%\) establece que al usar \((18)\) repetidamente, los intervalos resultantes contendrĆ”n los valores \(y\) observados el \(100*(1-\alpha)\%\) del tiempo. AdemĆ”s, el nĆŗmero \(1\) en la raĆz cuadrada hace que el intervalo de predicción sea mĆ”s ancho que intervalos de confianza como \((9)\) y \((10)\). Asimismo, a medida que \(n\to\infty\) el ancho del intervalo no tiende a cero, porque la incertidumbre en la predicción serĆ” permanente, incluso al tener conocimiento perfecto sobre \(\beta_0\) y \(\beta_1\).
Planteamiento del Problema
Con base en el conjunto de datos descrito en la fase 2 se formularÔ un modelo de regresión lineal simple para estudiar la relación lineal supuesta entre las varaibles definidas por los campos: FrecC_Max (Variable dependiente) y Colesterol (variable independiente).
Desarrollo del AnƔlisis
En el siguiente desarrollo del anƔlisis se hara en R Stutio y este mismo contara con varias secciones que se presentaran a continuacion.
En base a la navegacion a travƩs de pestaƱas muestra el resumen estadistico de las variables de interes: FrecC_Max (Variable dependiente) y Colesterol (variable independiente) junto con sus repectivos diagramas de caja. AdemƔs de manera complementaria se incluye el diagrama de dispersion de sus valores conjuntos donde se comparan con las dos combinaciones posibles entre estas variables.
En base en la pestaƱa Resumen de Colesterol se puede apreciar que la variable Colesterol presenta un sesgo lijeramente negativo con un rango cuartilico muy ancho entre el tercer y cuarto cuartil esto debido a la presencia de valores atipicos lo cuales tambien estan generando el sesgo. En comparacion segun la pestaƱa Resumen de FrecC_Max, la variable FrecC_Max se puede apreciar que tiene un sesgo mas simetrico que el anterior dado que su media y mediana se encuentran en valores extremadamente cercanas entre si lo cual nos indica que no muestra valores atipicos y esto lo podemos comprobar de manera grafica.
De manera complementaria en Diagrama de Dispersion Colesterol vs.Ā FrecC_Max se puede observar que existe una correlacion positiva de naturaleza aparentemente lineal entre las variables Colesterol y FrecC_Max, cabe recalcar que tambien existe una variante donde las posiciones de las variables se invierten. Si se observa el grafico de Diagramas Totales de Dispersion (en donde se excluyen las variables cualitativas::nominales) es razonable mencionar que hay otro par de variables que muestran una correlacion mas internsa entre las mismas PA_reposo y Edad.
summary(heart_diseases_Dataset$Colesterol)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 40 163 219 211 264 603
boxplot(heart_diseases_Dataset$Colesterol, main = "Diagrama de Caja de Colesterol", col = c("orange"))
summary(heart_diseases_Dataset$FrecC_Max)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 60.0 120.0 138.0 136.8 156.0 202.0
boxplot(heart_diseases_Dataset$FrecC_Max, main = "Diagrama de Caja de FrecC_Max", col = c("orange"))
plot(heart_diseases_Dataset$Colesterol, heart_diseases_Dataset$FrecC_Max , main = "Diagrama de Dispersión Colesterol vs. FrecC_Max")
plot(heart_diseases_Dataset$FrecC_Max, heart_diseases_Dataset$Colesterol, main = "Diagrama de Dispersión FrecC_Max vs. Colesterol")
pairs(~Edad + PA_reposo + Colesterol + AZ_Ayunas + FrecC_Max + Oldpeak, data = heart_diseases_Dataset)
En base a la navegacion a travƩs de la pestaƱas se muestran los coeficientes del modelo de regrecion linela simple, su resumen estadistico y su tabla ANOVA. Se menciona de nuevo que las variables de interes son FrecC_Max (variable dependiente) y Colesterol (variable independiente).
Se considero las dos posibles combinaciones pero finalmente se utilizaran los resultados de la pestaƱa Coeficientes del Modelo RLS FRE/CO y a traves de este se pudo establecer que el modelo de regresion lineal simple que relaciona a las varaibles de interes, las cuales se resumiran como \(FRECM\) y \(COL\), se tiene la formulacion: \(FRECM = 121,37957942 +0,07304729*COL\) \((19)\) Para este modelo se obvia la interpretacion del intercepto por caracter de sentido dado que para FrecC_Max se obtendria un valor moderado si el sucede un valor nulo en Colesterol lo que es medicamente imposible, y la ultima situacion en especial carece de sentido, sin embargo, el coeficiente lineal muestra una correlacion de proporcionalidad directa entre las dos variables de interes, aunque con un crecimiento medianamente moderado en FrecC_Max por cada unidad marginal de Colesterol.
De manera complementaria, la pestaƱa de Resumen Estadistico del Modelo RLS FRE/CO se consta que a cualquier nivel de significancia las evidencias a favor son un poco bajas pero esto era de esperar dado el nivle de correlacion existente entre las variables de interes. Ademas, el nivel de del coeficiente de determinacion esta a favor de la correlacion con un resultado bajo del \(5,55\) \(%\) de la variabilidad de FrecC_Max es explicado por Colesterol, en resumen lo que nos indica este resultado nos sugiere que el colesterol no es un predictor fuerte de la frecuencia cardiaca maxima y que hay otros factores influyendo en esta como era de esperarse dado el contexto en el que se encuentra, estos resultados eran de esperarse dado el fenomeno medico que se esta estudiando, y lo anteriormente mencionado quedo confirmado a traves de la pestaƱa Tabla ANOVA para el Modelo RLS FREC/CO
modelo_RL_Simple_CO_FRE = lm(heart_diseases_Dataset$Colesterol~heart_diseases_Dataset$FrecC_Max)
coef(modelo_RL_Simple_CO_FRE)
## (Intercept) heart_diseases_Dataset$FrecC_Max
## 105.1852444 0.7732559
modelo_RL_Simple_FRE_CO = lm(heart_diseases_Dataset$FrecC_Max~heart_diseases_Dataset$Colesterol)
coef(modelo_RL_Simple_FRE_CO)
## (Intercept) heart_diseases_Dataset$Colesterol
## 121.37957942 0.07304729
summary(modelo_RL_Simple_CO_FRE)
##
## Call:
## lm(formula = heart_diseases_Dataset$Colesterol ~ heart_diseases_Dataset$FrecC_Max)
##
## Residuals:
## Min 1Q Median 3Q Max
## -178.17 -53.71 4.48 52.29 401.16
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 105.1852 14.5368 7.236 9.79e-13 ***
## heart_diseases_Dataset$FrecC_Max 0.7733 0.1045 7.401 3.06e-13 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 80.53 on 915 degrees of freedom
## Multiple R-squared: 0.05648, Adjusted R-squared: 0.05545
## F-statistic: 54.78 on 1 and 915 DF, p-value: 3.057e-13
summary(modelo_RL_Simple_FRE_CO)
##
## Call:
## lm(formula = heart_diseases_Dataset$FrecC_Max ~ heart_diseases_Dataset$Colesterol)
##
## Residuals:
## Min 1Q Median 3Q Max
## -68.246 -17.251 0.774 18.175 65.719
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 121.37958 2.23678 54.265 < 2e-16 ***
## heart_diseases_Dataset$Colesterol 0.07305 0.00987 7.401 3.06e-13 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 24.75 on 915 degrees of freedom
## Multiple R-squared: 0.05648, Adjusted R-squared: 0.05545
## F-statistic: 54.78 on 1 and 915 DF, p-value: 3.057e-13
anova(modelo_RL_Simple_FRE_CO)
## Analysis of Variance Table
##
## Response: heart_diseases_Dataset$FrecC_Max
## Df Sum Sq Mean Sq F value Pr(>F)
## heart_diseases_Dataset$Colesterol 1 33557 33557 54.777 3.057e-13 ***
## Residuals 915 560537 613
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
En base a la navegacion a traves de pestaƱas muestran el intervalo de confianza para \(\beta_1\) y para la prediccion del modelo de regresion linal, ambos estarƔn al \(95\) \(%\). Se volvera a recapitular sobre cuales son las variables de interes que son: FrecC_Max (variable dependiente) y Colesterol (variable independiente).
El analisis del modelo RLS muestra que no muestra un gran aporte como en cuanto a la variable predictora posiblemente por diversos factores aun asi fue relevante estimar FrecC_Max a partir de Colesterol. Esto debido a que el intervalo de confianza de \(COL\) en el modelo excluye al cero:
\(0,05367739 < \beta_1 < 0,09241719\) \((20)\)
Por ultimo, la pestaƱa Predicciones y Intervalos de Prediccion muestran los calculos con base en el modelo, bajo un intervalo de predicccion al \(95\) \(%\), de las predicciones de todas las pestaƱas del conjunto de datos para la variable FrecC_MAx. Cabe recalcar que estos intervalos resultan mas anchos que en aquellos calculados en la pestaƱa Predicciones y sus intervalos de confianza y esta misma como lo dice su nombre a un mismo nivel de significancia.
confint(modelo_RL_Simple_FRE_CO, level = 0.95)
## 2.5 % 97.5 %
## (Intercept) 116.98975820 125.76940064
## heart_diseases_Dataset$Colesterol 0.05367739 0.09241719
predict(modelo_RL_Simple_FRE_CO, data.frame(seq(1,917)), interval='prediction', level = 0.95)
## fit lwr upr
## 1 142.4902 93.86505 191.1154
## 2 134.5281 85.92270 183.1335
## 3 142.0520 93.43024 190.6737
## 4 137.0117 88.40997 185.6134
## 5 135.6238 87.02113 184.2265
## 6 146.1426 97.47768 194.8075
## 7 138.6918 90.08748 187.2961
## 8 136.5734 87.97169 185.1751
## 9 136.5004 87.89862 185.1021
## 10 142.1250 93.50273 190.7473
## 11 136.7926 88.19087 185.3942
## 12 133.3593 84.74913 181.9695
## 13 136.2812 87.67935 184.8831
## 14 138.4726 89.86891 187.0764
## 15 136.7926 88.19087 185.3942
## 16 141.3215 92.70495 189.9380
## 17 135.6968 87.09430 184.2994
## 18 136.0621 87.46001 184.6642
## 19 139.4953 90.88832 188.1023
## 20 140.8832 92.26940 189.4970
## 21 137.6691 89.06688 186.2714
## 22 134.8203 86.21579 183.4248
## 23 136.0621 87.46001 184.6642
## 24 142.4172 93.79261 191.0418
## 25 137.0847 88.48299 185.6865
## 26 136.6465 88.04476 185.2482
## 27 140.3719 91.76090 188.9828
## 28 142.1250 93.50273 190.7473
## 29 155.5657 106.70966 204.4218
## 30 135.1125 86.50875 183.7162
## 31 159.2181 110.25385 208.1823
## 32 133.5785 84.96933 182.1876
## 33 137.7422 89.13983 186.3445
## 34 133.9437 85.33617 182.5513
## 35 134.9664 86.36228 183.5705
## 36 139.9336 91.32475 188.5424
## 37 143.7321 95.09551 192.3686
## 38 139.6414 91.03383 188.2490
## 39 134.3090 85.70281 182.9151
## 40 137.9613 89.35863 186.5640
## 41 138.1805 89.57737 186.7835
## 42 142.8555 94.22718 191.4838
## 43 140.6641 92.05152 189.2766
## 44 140.2988 91.68823 188.9094
## 45 134.1629 85.55618 182.7695
## 46 144.6086 95.96272 193.2545
## 47 137.6691 89.06688 186.2714
## 48 137.1578 88.55601 185.7596
## 49 146.2157 97.54974 194.8816
## 50 142.4902 93.86505 191.1154
## 51 138.3996 89.79603 187.0032
## 52 136.3543 87.75245 184.9561
## 53 137.7422 89.13983 186.3445
## 54 139.2762 90.67000 187.8823
## 55 134.5281 85.92270 183.1335
## 56 135.5508 86.94795 184.1536
## 57 141.1023 92.48721 189.7175
## 58 136.9387 88.33695 185.5404
## 59 148.0418 99.34865 196.7350
## 60 146.3618 97.69383 195.0297
## 61 139.8605 91.25203 188.4691
## 62 139.9336 91.32475 188.5424
## 63 137.7422 89.13983 186.3445
## 64 141.6137 92.99516 190.2322
## 65 136.1351 87.53313 184.7371
## 66 140.3719 91.76090 188.9828
## 67 143.0746 94.44437 191.7049
## 68 137.8152 89.21277 186.4177
## 69 139.3492 90.74278 187.9556
## 70 151.4751 102.71762 200.2325
## 71 140.7371 92.12415 189.3501
## 72 137.0847 88.48299 185.6865
## 73 134.6742 86.06926 183.2791
## 74 137.3039 88.70201 185.9058
## 75 140.9563 92.34201 189.5705
## 76 133.2863 84.67572 181.8969
## 77 160.0216 111.03104 209.0122
## 78 133.5785 84.96933 182.1876
## 79 128.6843 80.03512 177.3335
## 80 136.4273 87.82554 185.0291
## 81 141.6137 92.99516 190.2322
## 82 138.7648 90.16032 187.3693
## 83 137.6691 89.06688 186.2714
## 84 135.6968 87.09430 184.2994
## 85 136.9387 88.33695 185.5404
## 86 131.5332 82.91148 180.1548
## 87 140.5910 91.97887 189.2032
## 88 137.1578 88.55601 185.7596
## 89 142.6363 94.00993 191.2628
## 90 138.1074 89.50446 186.7104
## 91 136.5734 87.97169 185.1751
## 92 143.8051 95.16782 192.4424
## 93 136.7195 88.11782 185.3212
## 94 145.4121 96.75670 194.0676
## 95 134.6742 86.06926 183.2791
## 96 140.5910 91.97887 189.2032
## 97 136.5004 87.89862 185.1021
## 98 132.1175 83.50005 180.7350
## 99 127.5886 78.92571 176.2515
## 100 141.0293 92.41461 189.6440
## 101 141.4676 92.85007 190.0851
## 102 134.4550 85.84941 183.0607
## 103 150.0141 101.28608 198.7422
## 104 155.4196 106.56750 204.2717
## 105 134.9664 86.36228 183.5705
## 106 140.3719 91.76090 188.9828
## 107 139.9336 91.32475 188.5424
## 108 137.0117 88.40997 185.6134
## 109 130.8027 82.17507 179.4303
## 110 138.9840 90.37880 187.5891
## 111 135.1125 86.50875 183.7162
## 112 140.0066 91.39746 188.6158
## 113 141.5406 92.92262 190.1586
## 114 143.0746 94.44437 191.7049
## 115 136.5004 87.89862 185.1021
## 116 139.3492 90.74278 187.9556
## 117 141.9789 93.35775 190.6001
## 118 146.0696 97.40562 194.7335
## 119 133.0671 84.45543 181.6789
## 120 132.7750 84.16161 181.3883
## 121 139.4953 90.88832 188.1023
## 122 141.2484 92.63237 189.8645
## 123 138.9109 90.30598 187.5159
## 124 150.0872 101.35773 198.8166
## 125 138.1805 89.57737 186.7835
## 126 139.3492 90.74278 187.9556
## 127 133.1402 84.52887 181.7515
## 128 133.2863 84.67572 181.8969
## 129 138.1805 89.57737 186.7835
## 130 138.0344 89.43155 186.6372
## 131 142.7094 94.08236 191.3364
## 132 136.1351 87.53313 184.7371
## 133 149.7219 100.99941 198.4445
## 134 138.1805 89.57737 186.7835
## 135 142.8555 94.22718 191.4838
## 136 140.7371 92.12415 189.3501
## 137 137.0847 88.48299 185.6865
## 138 138.9840 90.37880 187.5891
## 139 133.5054 84.89594 182.1149
## 140 139.4223 90.81556 188.0290
## 141 145.5582 96.90095 194.2155
## 142 146.2887 97.62179 194.9556
## 143 142.6363 94.00993 191.2628
## 144 139.1301 90.52442 187.7357
## 145 141.7598 93.14022 190.3793
## 146 141.3215 92.70495 189.9380
## 147 135.8429 87.24061 184.4453
## 148 139.5684 90.96108 188.1756
## 149 133.6515 85.04271 182.2603
## 150 165.4271 116.23573 214.6185
## 151 137.0847 88.48299 185.6865
## 152 132.9941 84.38199 181.6062
## 153 141.4676 92.85007 190.0851
## 154 141.1023 92.48721 189.7175
## 155 142.6363 94.00993 191.2628
## 156 146.3618 97.69383 195.0297
## 157 135.2586 86.65518 183.8620
## 158 134.8933 86.28904 183.4976
## 159 142.5633 93.93750 191.1891
## 160 135.6238 87.02113 184.2265
## 161 140.6641 92.05152 189.2766
## 162 136.8656 88.26391 185.4673
## 163 140.5910 91.97887 189.2032
## 164 135.6968 87.09430 184.2994
## 165 137.8152 89.21277 186.4177
## 166 141.2484 92.63237 189.8645
## 167 138.2535 89.65026 186.8567
## 168 138.7648 90.16032 187.3693
## 169 137.5961 88.99392 186.1982
## 170 134.4550 85.84941 183.0607
## 171 139.1301 90.52442 187.7357
## 172 138.5457 89.94177 187.1496
## 173 144.7547 96.10715 193.4023
## 174 135.0394 86.43552 183.6433
## 175 140.8102 92.19678 189.4235
## 176 142.4172 93.79261 191.0418
## 177 137.1578 88.55601 185.7596
## 178 142.3442 93.72015 190.9682
## 179 135.5508 86.94795 184.1536
## 180 138.7648 90.16032 187.3693
## 181 137.8152 89.21277 186.4177
## 182 137.7422 89.13983 186.3445
## 183 150.8907 102.14537 199.6360
## 184 138.7648 90.16032 187.3693
## 185 144.1703 95.52925 192.8114
## 186 136.7926 88.19087 185.3942
## 187 139.7144 91.10657 188.3223
## 188 138.6918 90.08748 187.2961
## 189 145.3391 96.68456 193.9936
## 190 142.1981 93.57521 190.8209
## 191 141.8328 93.21274 190.4529
## 192 136.6465 88.04476 185.2482
## 193 139.2762 90.67000 187.8823
## 194 135.4047 86.80158 184.0077
## 195 134.8203 86.21579 183.4248
## 196 135.4777 86.87477 184.0806
## 197 143.0746 94.44437 191.7049
## 198 140.9563 92.34201 189.5705
## 199 139.3492 90.74278 187.9556
## 200 143.8781 95.24012 192.5162
## 201 139.5684 90.96108 188.1756
## 202 138.1805 89.57737 186.7835
## 203 132.1175 83.50005 180.7350
## 204 137.3769 88.77500 185.9789
## 205 134.8203 86.21579 183.4248
## 206 137.0847 88.48299 185.6865
## 207 143.8781 95.24012 192.5162
## 208 140.1527 91.54286 188.7626
## 209 131.0218 82.39607 179.6476
## 210 137.1578 88.55601 185.7596
## 211 140.5910 91.97887 189.2032
## 212 142.4172 93.79261 191.0418
## 213 141.5406 92.92262 190.1586
## 214 137.3769 88.77500 185.9789
## 215 137.8883 89.28570 186.4908
## 216 138.6918 90.08748 187.2961
## 217 141.8328 93.21274 190.4529
## 218 137.2308 88.62901 185.8327
## 219 135.6968 87.09430 184.2994
## 220 140.5910 91.97887 189.2032
## 221 137.5961 88.99392 186.1982
## 222 143.5129 94.87853 192.1473
## 223 135.6238 87.02113 184.2265
## 224 143.1477 94.51675 191.7786
## 225 140.0797 91.47017 188.6892
## 226 140.6641 92.05152 189.2766
## 227 135.6238 87.02113 184.2265
## 228 129.9261 81.29036 178.5619
## 229 142.9285 94.29959 191.5575
## 230 134.0168 85.40951 182.6240
## 231 144.3895 95.74602 193.0329
## 232 141.9059 93.28525 190.5265
## 233 141.4676 92.85007 190.0851
## 234 139.6414 91.03383 188.2490
## 235 143.9512 95.31242 192.5900
## 236 135.9890 87.38688 184.5912
## 237 145.9235 97.26147 194.5855
## 238 142.9285 94.29959 191.5575
## 239 147.3114 98.62966 195.9931
## 240 135.4777 86.87477 184.0806
## 241 145.1930 96.54025 193.8457
## 242 135.8429 87.24061 184.4453
## 243 142.7094 94.08236 191.3364
## 244 140.8102 92.19678 189.4235
## 245 140.9563 92.34201 189.5705
## 246 133.8707 85.26281 182.4785
## 247 138.6918 90.08748 187.2961
## 248 141.4676 92.85007 190.0851
## 249 137.3769 88.77500 185.9789
## 250 146.2887 97.62179 194.9556
## 251 157.2458 108.34234 206.1493
## 252 140.3719 91.76090 188.9828
## 253 142.7094 94.08236 191.3364
## 254 141.1754 92.55979 189.7910
## 255 139.4953 90.88832 188.1023
## 256 141.3945 92.77751 190.0116
## 257 150.1602 101.42937 198.8911
## 258 133.0671 84.45543 181.6789
## 259 135.9890 87.38688 184.5912
## 260 144.7547 96.10715 193.4023
## 261 141.4676 92.85007 190.0851
## 262 137.5230 88.92095 186.1251
## 263 138.2535 89.65026 186.8567
## 264 130.5835 81.95400 179.2131
## 265 135.4777 86.87477 184.0806
## 266 143.6590 95.02319 192.2948
## 267 143.1477 94.51675 191.7786
## 268 137.4500 88.84798 186.0520
## 269 139.0570 90.45162 187.6624
## 270 138.5457 89.94177 187.1496
## 271 137.8152 89.21277 186.4177
## 272 135.8429 87.24061 184.4453
## 273 136.0621 87.46001 184.6642
## 274 137.4500 88.84798 186.0520
## 275 142.9285 94.29959 191.5575
## 276 136.9387 88.33695 185.5404
## 277 133.0671 84.45543 181.6789
## 278 137.6691 89.06688 186.2714
## 279 146.7270 98.05392 195.4001
## 280 139.8605 91.25203 188.4691
## 281 139.3492 90.74278 187.9556
## 282 137.5961 88.99392 186.1982
## 283 137.4500 88.84798 186.0520
## 284 146.5078 97.83789 195.1778
## 285 147.5305 98.84544 196.2156
## 286 135.2586 86.65518 183.8620
## 287 133.7246 85.11609 182.3331
## 288 134.6011 85.99599 183.2063
## 289 143.8781 95.24012 192.5162
## 290 133.5054 84.89594 182.1149
## 291 136.7926 88.19087 185.3942
## 292 140.1527 91.54286 188.7626
## 293 134.6742 86.06926 183.2791
## 294 125.8355 77.14705 174.5239
## 295 130.3644 81.73285 178.9959
## 296 130.4374 81.80658 179.0683
## 297 125.3241 76.62744 174.0208
## 298 125.9085 77.22125 174.5958
## 299 128.1730 79.51761 176.8283
## 300 125.8355 77.14705 174.5239
## 301 130.3644 81.73285 178.9959
## 302 130.4374 81.80658 179.0683
## 303 130.2183 81.58539 178.8512
## 304 129.9261 81.29036 178.5619
## 305 124.3745 75.66146 173.0876
## 306 124.5206 75.81016 173.2311
## 307 127.8077 79.14773 176.4678
## 308 129.6339 80.99521 178.2726
## 309 125.4702 76.77594 174.1645
## 310 129.7070 81.06901 178.3449
## 311 125.1780 76.47892 173.8772
## 312 129.6339 80.99521 178.2726
## 313 130.1453 81.51164 178.7789
## 314 124.8128 76.10746 173.5181
## 315 129.8531 81.21658 178.4895
## 316 129.2687 80.62610 177.9113
## 317 129.2687 80.62610 177.9113
## 318 130.2183 81.58539 178.8512
## 319 126.2737 77.59213 174.9554
## 320 129.9261 81.29036 178.5619
## 321 130.5105 81.88029 179.1407
## 322 129.9261 81.29036 178.5619
## 323 130.7296 82.10139 179.3579
## 324 129.3417 80.69994 177.9835
## 325 128.2460 79.59156 176.9005
## 326 124.5937 75.88449 173.3028
## 327 128.4652 79.81338 177.1170
## 328 129.8531 81.21658 178.4895
## 329 125.5433 76.85018 174.2364
## 330 127.7347 79.07373 176.3957
## 331 130.8027 82.17507 179.4303
## 332 129.4878 80.84759 178.1281
## 333 129.2687 80.62610 177.9113
## 334 124.4476 75.73581 173.1593
## 335 128.6843 80.03512 177.3335
## 336 126.7851 78.11104 175.4591
## 337 128.6113 79.96121 177.2613
## 338 127.5886 78.92571 176.2515
## 339 125.3241 76.62744 174.0208
## 340 129.9261 81.29036 178.5619
## 341 127.5886 78.92571 176.2515
## 342 129.5609 80.92140 178.2004
## 343 129.3417 80.69994 177.9835
## 344 125.1780 76.47892 173.8772
## 345 127.5886 78.92571 176.2515
## 346 124.4476 75.73581 173.1593
## 347 130.5835 81.95400 179.2131
## 348 125.6163 76.92441 174.3082
## 349 130.4374 81.80658 179.0683
## 350 124.4476 75.73581 173.1593
## 351 125.1780 76.47892 173.8772
## 352 127.7347 79.07373 176.3957
## 353 126.9312 78.25923 175.6031
## 354 126.0546 77.36963 174.7396
## 355 129.8531 81.21658 178.4895
## 356 126.4198 77.74043 175.0993
## 357 129.8531 81.21658 178.4895
## 358 127.8077 79.14773 176.4678
## 359 127.0773 78.40739 175.7471
## 360 126.8581 78.18514 175.5311
## 361 125.1780 76.47892 173.8772
## 362 130.8027 82.17507 179.4303
## 363 126.1277 77.44380 174.8115
## 364 128.3921 79.73945 177.0448
## 365 124.5937 75.88449 173.3028
## 366 128.9765 80.33067 177.6223
## 367 127.1503 78.48146 175.8192
## 368 124.3015 75.58710 173.0158
## 369 125.9816 77.29544 174.6677
## 370 127.6616 78.99972 176.3236
## 371 125.6894 76.99863 174.3801
## 372 125.2511 76.55318 173.9490
## 373 127.7347 79.07373 176.3957
## 374 128.7574 80.10902 177.4057
## 375 125.6163 76.92441 174.3082
## 376 128.5382 79.88730 177.1891
## 377 126.7120 78.03693 175.3871
## 378 124.9589 76.25607 173.6617
## 379 127.4425 78.77766 176.1074
## 380 126.4929 77.81457 175.1712
## 381 126.2737 77.59213 174.9554
## 382 129.9992 81.36413 178.6342
## 383 124.3745 75.66146 173.0876
## 384 125.1050 76.40464 173.8053
## 385 126.2007 77.51797 174.8834
## 386 127.9538 79.29571 176.6120
## 387 128.3921 79.73945 177.0448
## 388 129.2687 80.62610 177.9113
## 389 128.4652 79.81338 177.1170
## 390 128.6843 80.03512 177.3335
## 391 128.2460 79.59156 176.9005
## 392 129.2687 80.62610 177.9113
## 393 128.1730 79.51761 176.8283
## 394 130.4374 81.80658 179.0683
## 395 126.8581 78.18514 175.5311
## 396 125.9085 77.22125 174.5958
## 397 127.8808 79.22172 176.5399
## 398 126.0546 77.36963 174.7396
## 399 127.6616 78.99972 176.3236
## 400 128.5382 79.88730 177.1891
## 401 127.7347 79.07373 176.3957
## 402 129.1956 80.55225 177.8390
## 403 128.1730 79.51761 176.8283
## 404 124.5937 75.88449 173.3028
## 405 129.1226 80.47840 177.7668
## 406 129.8531 81.21658 178.4895
## 407 126.7120 78.03693 175.3871
## 408 127.5156 78.85169 176.1794
## 409 130.7296 82.10139 179.3579
## 410 128.9035 80.25679 177.5501
## 411 125.4702 76.77594 174.1645
## 412 124.5206 75.81016 173.2311
## 413 125.6894 76.99863 174.3801
## 414 129.0495 80.40454 177.6946
## 415 130.7296 82.10139 179.3579
## 416 126.4198 77.74043 175.0993
## 417 129.0495 80.40454 177.6946
## 418 124.5206 75.81016 173.2311
## 419 130.7296 82.10139 179.3579
## 420 127.4425 78.77766 176.1074
## 421 129.0495 80.40454 177.6946
## 422 124.4476 75.73581 173.1593
## 423 126.5659 77.88870 175.2432
## 424 125.9816 77.29544 174.6677
## 425 129.5609 80.92140 178.2004
## 426 125.1050 76.40464 173.8053
## 427 128.6113 79.96121 177.2613
## 428 128.6113 79.96121 177.2613
## 429 130.8027 82.17507 179.4303
## 430 130.7296 82.10139 179.3579
## 431 130.6566 82.02770 179.2855
## 432 126.9312 78.25923 175.6031
## 433 127.8808 79.22172 176.5399
## 434 126.7120 78.03693 175.3871
## 435 127.0773 78.40739 175.7471
## 436 126.0546 77.36963 174.7396
## 437 126.8581 78.18514 175.5311
## 438 129.7070 81.06901 178.3449
## 439 124.4476 75.73581 173.1593
## 440 129.5609 80.92140 178.2004
## 441 128.3921 79.73945 177.0448
## 442 126.9312 78.25923 175.6031
## 443 125.9085 77.22125 174.5958
## 444 126.0546 77.36963 174.7396
## 445 130.4374 81.80658 179.0683
## 446 128.0999 79.44365 176.7562
## 447 124.8128 76.10746 173.5181
## 448 126.6390 77.96282 175.3151
## 449 124.6667 75.95882 173.3746
## 450 129.7070 81.06901 178.3449
## 451 129.2687 80.62610 177.9113
## 452 125.6894 76.99863 174.3801
## 453 124.8128 76.10746 173.5181
## 454 129.2687 80.62610 177.9113
## 455 125.0319 76.33036 173.7335
## 456 125.1050 76.40464 173.8053
## 457 126.0546 77.36963 174.7396
## 458 126.6390 77.96282 175.3151
## 459 124.8128 76.10746 173.5181
## 460 126.0546 77.36963 174.7396
## 461 130.6566 82.02770 179.2855
## 462 130.0722 81.43789 178.7065
## 463 128.0269 79.36968 176.6841
## 464 125.9816 77.29544 174.6677
## 465 138.9109 90.30598 187.5159
## 466 130.5835 81.95400 179.2131
## 467 131.8253 83.20583 180.4449
## 468 129.5609 80.92140 178.2004
## 469 134.6742 86.06926 183.2791
## 470 128.7574 80.10902 177.4057
## 471 132.4097 83.79416 181.0253
## 472 135.0394 86.43552 183.6433
## 473 130.2183 81.58539 178.8512
## 474 131.9714 83.35296 180.5899
## 475 133.4324 84.82254 182.0422
## 476 134.2359 85.62950 182.8423
## 477 130.3644 81.73285 178.9959
## 478 129.9992 81.36413 178.6342
## 479 128.9035 80.25679 177.5501
## 480 134.1629 85.55618 182.7695
## 481 135.1125 86.50875 183.7162
## 482 132.4828 83.86766 181.0979
## 483 130.2183 81.58539 178.8512
## 484 128.7574 80.10902 177.4057
## 485 134.1629 85.55618 182.7695
## 486 137.0117 88.40997 185.6134
## 487 137.0117 88.40997 185.6134
## 488 139.7875 91.17931 188.3957
## 489 137.4500 88.84798 186.0520
## 490 137.0117 88.40997 185.6134
## 491 136.2082 87.60625 184.8101
## 492 133.0671 84.45543 181.6789
## 493 128.7574 80.10902 177.4057
## 494 132.2636 83.64712 180.8801
## 495 129.9261 81.29036 178.5619
## 496 130.4374 81.80658 179.0683
## 497 131.8984 83.27940 180.5174
## 498 131.8253 83.20583 180.4449
## 499 143.0746 94.44437 191.7049
## 500 139.4953 90.88832 188.1023
## 501 143.8781 95.24012 192.5162
## 502 136.5734 87.97169 185.1751
## 503 137.9613 89.35863 186.5640
## 504 136.7195 88.11782 185.3212
## 505 139.2762 90.67000 187.8823
## 506 137.8152 89.21277 186.4177
## 507 138.9109 90.30598 187.5159
## 508 131.2410 82.61701 179.8649
## 509 134.9664 86.36228 183.5705
## 510 133.7976 85.18945 182.4058
## 511 130.8757 82.24875 179.5027
## 512 132.3367 83.72064 180.9527
## 513 131.8253 83.20583 180.4449
## 514 133.1402 84.52887 181.7515
## 515 130.2913 81.65912 178.9236
## 516 133.3593 84.74913 181.9695
## 517 133.7976 85.18945 182.4058
## 518 133.2132 84.60230 181.8242
## 519 143.6590 95.02319 192.2948
## 520 137.6691 89.06688 186.2714
## 521 141.9789 93.35775 190.6001
## 522 146.8731 98.19790 195.5483
## 523 133.0671 84.45543 181.6789
## 524 133.0671 84.45543 181.6789
## 525 138.6187 90.01463 187.2229
## 526 144.1703 95.52925 192.8114
## 527 142.0520 93.43024 190.6737
## 528 131.7523 83.13225 180.3723
## 529 136.7926 88.19087 185.3942
## 530 137.3039 88.70201 185.9058
## 531 143.7321 95.09551 192.3686
## 532 134.9664 86.36228 183.5705
## 533 139.7875 91.17931 188.3957
## 534 137.5961 88.99392 186.1982
## 535 129.7800 81.14280 178.4172
## 536 135.1125 86.50875 183.7162
## 537 140.2258 91.61555 188.8360
## 538 136.1351 87.53313 184.7371
## 539 135.7699 87.16745 184.3723
## 540 136.2812 87.67935 184.8831
## 541 129.6339 80.99521 178.2726
## 542 141.3945 92.77751 190.0116
## 543 135.4047 86.80158 184.0077
## 544 143.1477 94.51675 191.7786
## 545 141.2484 92.63237 189.8645
## 546 137.4500 88.84798 186.0520
## 547 135.9890 87.38688 184.5912
## 548 140.4449 91.83357 189.0563
## 549 134.6011 85.99599 183.2063
## 550 140.3719 91.76090 188.9828
## 551 137.4500 88.84798 186.0520
## 552 137.5230 88.92095 186.1251
## 553 137.1578 88.55601 185.7596
## 554 134.1629 85.55618 182.7695
## 555 137.3769 88.77500 185.9789
## 556 144.0242 95.38470 192.6638
## 557 136.5734 87.97169 185.1751
## 558 138.3266 89.72315 186.9299
## 559 141.3215 92.70495 189.9380
## 560 136.2082 87.60625 184.8101
## 561 134.6742 86.06926 183.2791
## 562 141.3945 92.77751 190.0116
## 563 136.2812 87.67935 184.8831
## 564 141.1023 92.48721 189.7175
## 565 142.7094 94.08236 191.3364
## 566 133.8707 85.26281 182.4785
## 567 137.5230 88.92095 186.1251
## 568 142.4902 93.86505 191.1154
## 569 137.2308 88.62901 185.8327
## 570 137.6691 89.06688 186.2714
## 571 129.4148 80.77377 178.0558
## 572 135.4777 86.87477 184.0806
## 573 130.3644 81.73285 178.9959
## 574 136.7195 88.11782 185.3212
## 575 141.9789 93.35775 190.6001
## 576 133.7976 85.18945 182.4058
## 577 148.3340 99.63603 197.0320
## 578 134.0168 85.40951 182.6240
## 579 142.4902 93.86505 191.1154
## 580 132.4828 83.86766 181.0979
## 581 136.5734 87.97169 185.1751
## 582 137.1578 88.55601 185.7596
## 583 141.1754 92.55979 189.7910
## 584 139.2031 90.59722 187.8090
## 585 142.1981 93.57521 190.8209
## 586 139.1301 90.52442 187.7357
## 587 138.9109 90.30598 187.5159
## 588 137.3769 88.77500 185.9789
## 589 138.6918 90.08748 187.2961
## 590 133.4324 84.82254 182.0422
## 591 136.9387 88.33695 185.5404
## 592 142.3442 93.72015 190.9682
## 593 140.2258 91.61555 188.8360
## 594 140.0797 91.47017 188.6892
## 595 134.9664 86.36228 183.5705
## 596 140.6641 92.05152 189.2766
## 597 134.8933 86.28904 183.4976
## 598 137.8883 89.28570 186.4908
## 599 136.2082 87.60625 184.8101
## 600 136.5004 87.89862 185.1021
## 601 142.1250 93.50273 190.7473
## 602 145.9965 97.33355 194.6595
## 603 144.0242 95.38470 192.6638
## 604 139.9336 91.32475 188.5424
## 605 140.2258 91.61555 188.8360
## 606 139.9336 91.32475 188.5424
## 607 143.2938 94.66148 191.9260
## 608 133.7976 85.18945 182.4058
## 609 144.0242 95.38470 192.6638
## 610 145.7043 97.04518 194.3635
## 611 131.5332 82.91148 180.1548
## 612 137.6691 89.06688 186.2714
## 613 149.5028 100.78432 198.2213
## 614 139.9336 91.32475 188.5424
## 615 144.9008 96.25155 193.5501
## 616 162.5783 113.49783 211.6587
## 617 140.4449 91.83357 189.0563
## 618 140.5910 91.97887 189.2032
## 619 141.0293 92.41461 189.6440
## 620 134.3090 85.70281 182.9151
## 621 140.0797 91.47017 188.6892
## 622 138.8379 90.23316 187.4426
## 623 142.7824 94.15477 191.4101
## 624 151.1098 102.36002 199.8596
## 625 138.4726 89.86891 187.0764
## 626 137.8883 89.28570 186.4908
## 627 138.5457 89.94177 187.1496
## 628 138.4726 89.86891 187.0764
## 629 143.5129 94.87853 192.1473
## 630 132.2636 83.64712 180.8801
## 631 144.0973 95.45698 192.7376
## 632 136.2082 87.60625 184.8101
## 633 136.7926 88.19087 185.3942
## 634 135.9160 87.31375 184.5182
## 635 138.1074 89.50446 186.7104
## 636 139.2762 90.67000 187.8823
## 637 143.5129 94.87853 192.1473
## 638 136.2812 87.67935 184.8831
## 639 142.4172 93.79261 191.0418
## 640 141.4676 92.85007 190.0851
## 641 139.1301 90.52442 187.7357
## 642 142.9285 94.29959 191.5575
## 643 138.1805 89.57737 186.7835
## 644 140.7371 92.12415 189.3501
## 645 138.1074 89.50446 186.7104
## 646 138.0344 89.43155 186.6372
## 647 137.0847 88.48299 185.6865
## 648 145.1930 96.54025 193.8457
## 649 135.9890 87.38688 184.5912
## 650 140.0797 91.47017 188.6892
## 651 136.5004 87.89862 185.1021
## 652 141.3215 92.70495 189.9380
## 653 134.5281 85.92270 183.1335
## 654 137.5961 88.99392 186.1982
## 655 137.6691 89.06688 186.2714
## 656 136.6465 88.04476 185.2482
## 657 138.3996 89.79603 187.0032
## 658 135.7699 87.16745 184.3723
## 659 137.3039 88.70201 185.9058
## 660 136.7926 88.19087 185.3942
## 661 132.2636 83.64712 180.8801
## 662 135.7699 87.16745 184.3723
## 663 139.3492 90.74278 187.9556
## 664 137.8152 89.21277 186.4177
## 665 144.3895 95.74602 193.0329
## 666 136.3543 87.75245 184.9561
## 667 151.8403 103.07502 200.6056
## 668 135.6238 87.02113 184.2265
## 669 138.4726 89.86891 187.0764
## 670 135.8429 87.24061 184.4453
## 671 133.5054 84.89594 182.1149
## 672 134.3820 85.77612 182.9879
## 673 139.5684 90.96108 188.1756
## 674 141.9059 93.28525 190.5265
## 675 130.5835 81.95400 179.2131
## 676 143.6590 95.02319 192.2948
## 677 137.8883 89.28570 186.4908
## 678 138.9109 90.30598 187.5159
## 679 138.3996 89.79603 187.0032
## 680 141.5406 92.92262 190.1586
## 681 140.4449 91.83357 189.0563
## 682 144.6817 96.03494 193.3284
## 683 139.0570 90.45162 187.6624
## 684 139.1301 90.52442 187.7357
## 685 140.3719 91.76090 188.9828
## 686 147.2383 98.55772 195.9189
## 687 139.2762 90.67000 187.8823
## 688 135.7699 87.16745 184.3723
## 689 137.6691 89.06688 186.2714
## 690 143.9512 95.31242 192.5900
## 691 136.5734 87.97169 185.1751
## 692 135.9160 87.31375 184.5182
## 693 136.6465 88.04476 185.2482
## 694 138.6187 90.01463 187.2229
## 695 137.3039 88.70201 185.9058
## 696 135.8429 87.24061 184.4453
## 697 141.1023 92.48721 189.7175
## 698 137.0117 88.40997 185.6134
## 699 136.0621 87.46001 184.6642
## 700 139.2031 90.59722 187.8090
## 701 136.5734 87.97169 185.1751
## 702 141.1023 92.48721 189.7175
## 703 143.7321 95.09551 192.3686
## 704 139.1301 90.52442 187.7357
## 705 137.5230 88.92095 186.1251
## 706 145.4852 96.82883 194.1415
## 707 140.8102 92.19678 189.4235
## 708 136.4273 87.82554 185.0291
## 709 136.8656 88.26391 185.4673
## 710 141.4676 92.85007 190.0851
## 711 143.4399 94.80619 192.0735
## 712 138.4726 89.86891 187.0764
## 713 144.2434 95.60152 192.8852
## 714 139.2031 90.59722 187.8090
## 715 131.6792 83.05867 180.2998
## 716 138.6918 90.08748 187.2961
## 717 141.0293 92.41461 189.6440
## 718 142.4902 93.86505 191.1154
## 719 139.9336 91.32475 188.5424
## 720 141.3945 92.77751 190.0116
## 721 137.5961 88.99392 186.1982
## 722 140.2258 91.61555 188.8360
## 723 134.3090 85.70281 182.9151
## 724 133.0671 84.45543 181.6789
## 725 145.2660 96.61241 193.9197
## 726 138.5457 89.94177 187.1496
## 727 143.6590 95.02319 192.2948
## 728 143.5860 94.95086 192.2210
## 729 142.9285 94.29959 191.5575
## 730 141.1754 92.55979 189.7910
## 731 139.5684 90.96108 188.1756
## 732 142.4172 93.79261 191.0418
## 733 137.8883 89.28570 186.4908
## 734 142.0520 93.43024 190.6737
## 735 135.1125 86.50875 183.7162
## 736 142.2711 93.64768 190.8945
## 737 141.3945 92.77751 190.0116
## 738 147.6766 98.98925 196.3640
## 739 141.3215 92.70495 189.9380
## 740 136.0621 87.46001 184.6642
## 741 140.8832 92.26940 189.4970
## 742 135.6968 87.09430 184.2994
## 743 136.0621 87.46001 184.6642
## 744 138.1805 89.57737 186.7835
## 745 141.0293 92.41461 189.6440
## 746 136.8656 88.26391 185.4673
## 747 137.8883 89.28570 186.4908
## 748 139.3492 90.74278 187.9556
## 749 138.3266 89.72315 186.9299
## 750 134.3090 85.70281 182.9151
## 751 141.6137 92.99516 190.2322
## 752 139.5684 90.96108 188.1756
## 753 136.7195 88.11782 185.3212
## 754 136.5004 87.89862 185.1021
## 755 136.8656 88.26391 185.4673
## 756 141.1754 92.55979 189.7910
## 757 138.3996 89.79603 187.0032
## 758 136.9387 88.33695 185.5404
## 759 142.0520 93.43024 190.6737
## 760 141.9789 93.35775 190.6001
## 761 138.1805 89.57737 186.7835
## 762 133.5785 84.96933 182.1876
## 763 137.7422 89.13983 186.3445
## 764 140.9563 92.34201 189.5705
## 765 139.6414 91.03383 188.2490
## 766 137.3769 88.77500 185.9789
## 767 140.8832 92.26940 189.4970
## 768 143.5129 94.87853 192.1473
## 769 140.0797 91.47017 188.6892
## 770 136.2812 87.67935 184.8831
## 771 137.2308 88.62901 185.8327
## 772 143.8781 95.24012 192.5162
## 773 135.4777 86.87477 184.0806
## 774 138.0344 89.43155 186.6372
## 775 138.2535 89.65026 186.8567
## 776 139.2031 90.59722 187.8090
## 777 140.5180 91.90623 189.1297
## 778 140.2988 91.68823 188.9094
## 779 136.7926 88.19087 185.3942
## 780 145.1199 96.46809 193.7718
## 781 139.9336 91.32475 188.5424
## 782 135.7699 87.16745 184.3723
## 783 138.6187 90.01463 187.2229
## 784 141.9789 93.35775 190.6001
## 785 138.4726 89.86891 187.0764
## 786 139.9336 91.32475 188.5424
## 787 143.2207 94.58912 191.8523
## 788 136.7926 88.19087 185.3942
## 789 134.6742 86.06926 183.2791
## 790 142.8555 94.22718 191.4838
## 791 143.1477 94.51675 191.7786
## 792 138.2535 89.65026 186.8567
## 793 139.9336 91.32475 188.5424
## 794 135.6968 87.09430 184.2994
## 795 138.9109 90.30598 187.5159
## 796 151.2559 102.50308 200.0088
## 797 133.9437 85.33617 182.5513
## 798 140.7371 92.12415 189.3501
## 799 139.3492 90.74278 187.9556
## 800 144.3895 95.74602 193.0329
## 801 134.8203 86.21579 183.4248
## 802 138.3996 89.79603 187.0032
## 803 150.1602 101.42937 198.8911
## 804 141.0293 92.41461 189.6440
## 805 138.8379 90.23316 187.4426
## 806 134.0898 85.48285 182.6968
## 807 143.9512 95.31242 192.5900
## 808 141.9789 93.35775 190.6001
## 809 140.0066 91.39746 188.6158
## 810 139.6414 91.03383 188.2490
## 811 139.4953 90.88832 188.1023
## 812 137.0117 88.40997 185.6134
## 813 138.8379 90.23316 187.4426
## 814 143.5860 94.95086 192.2210
## 815 141.6137 92.99516 190.2322
## 816 143.2938 94.66148 191.9260
## 817 140.2258 91.61555 188.8360
## 818 143.2207 94.58912 191.8523
## 819 142.4902 93.86505 191.1154
## 820 143.1477 94.51675 191.7786
## 821 144.6086 95.96272 193.2545
## 822 138.9109 90.30598 187.5159
## 823 143.9512 95.31242 192.5900
## 824 139.6414 91.03383 188.2490
## 825 142.4172 93.79261 191.0418
## 826 139.2762 90.67000 187.8823
## 827 136.9387 88.33695 185.5404
## 828 137.1578 88.55601 185.7596
## 829 136.2812 87.67935 184.8831
## 830 136.2812 87.67935 184.8831
## 831 139.7875 91.17931 188.3957
## 832 137.9613 89.35863 186.5640
## 833 140.2258 91.61555 188.8360
## 834 137.4500 88.84798 186.0520
## 835 138.8379 90.23316 187.4426
## 836 139.9336 91.32475 188.5424
## 837 133.6515 85.04271 182.2603
## 838 145.4852 96.82883 194.1415
## 839 134.7472 86.14253 183.3519
## 840 136.2082 87.60625 184.8101
## 841 140.5910 91.97887 189.2032
## 842 146.2887 97.62179 194.9556
## 843 142.0520 93.43024 190.6737
## 844 134.9664 86.36228 183.5705
## 845 143.8051 95.16782 192.4424
## 846 137.3769 88.77500 185.9789
## 847 140.3719 91.76090 188.9828
## 848 140.0066 91.39746 188.6158
## 849 138.2535 89.65026 186.8567
## 850 133.3593 84.74913 181.9695
## 851 138.4726 89.86891 187.0764
## 852 134.3090 85.70281 182.9151
## 853 140.1527 91.54286 188.7626
## 854 145.1199 96.46809 193.7718
## 855 141.3945 92.77751 190.0116
## 856 144.8278 96.17935 193.4762
## 857 140.6641 92.05152 189.2766
## 858 140.9563 92.34201 189.5705
## 859 143.8781 95.24012 192.5162
## 860 139.8605 91.25203 188.4691
## 861 139.4953 90.88832 188.1023
## 862 141.0293 92.41461 189.6440
## 863 134.8933 86.28904 183.4976
## 864 141.9789 93.35775 190.6001
## 865 135.1125 86.50875 183.7162
## 866 137.3769 88.77500 185.9789
## 867 142.5633 93.93750 191.1891
## 868 134.1629 85.55618 182.7695
## 869 136.8656 88.26391 185.4673
## 870 143.4399 94.80619 192.0735
## 871 139.1301 90.52442 187.7357
## 872 147.1653 98.48577 195.8448
## 873 145.8504 97.18938 194.5115
## 874 139.4223 90.81556 188.0290
## 875 146.2157 97.54974 194.8816
## 876 136.4273 87.82554 185.0291
## 877 142.1250 93.50273 190.7473
## 878 140.8102 92.19678 189.4235
## 879 138.1074 89.50446 186.7104
## 880 135.9160 87.31375 184.5182
## 881 140.5910 91.97887 189.2032
## 882 142.8555 94.22718 191.4838
## 883 135.4047 86.80158 184.0077
## 884 142.2711 93.64768 190.8945
## 885 137.1578 88.55601 185.7596
## 886 137.6691 89.06688 186.2714
## 887 139.4223 90.81556 188.0290
## 888 136.2812 87.67935 184.8831
## 889 136.2812 87.67935 184.8831
## 890 137.9613 89.35863 186.5640
## 891 141.6867 93.06769 190.3058
## 892 137.4500 88.84798 186.0520
## 893 138.3266 89.72315 186.9299
## 894 135.7699 87.16745 184.3723
## 895 145.8504 97.18938 194.5115
## 896 139.8605 91.25203 188.4691
## 897 136.3543 87.75245 184.9561
## 898 135.4047 86.80158 184.0077
## 899 136.2082 87.60625 184.8101
## 900 144.6086 95.96272 193.2545
## 901 137.8152 89.21277 186.4177
## 902 137.4500 88.84798 186.0520
## 903 137.5230 88.92095 186.1251
## 904 138.9109 90.30598 187.5159
## 905 136.8656 88.26391 185.4673
## 906 146.3618 97.69383 195.0297
## 907 133.7246 85.11609 182.3331
## 908 135.0394 86.43552 183.6433
## 909 135.7699 87.16745 184.3723
## 910 132.8480 84.23508 181.4609
## 911 134.2359 85.62950 182.8423
## 912 138.9840 90.37880 187.5891
## 913 140.6641 92.05152 189.2766
## 914 135.4777 86.87477 184.0806
## 915 130.9488 82.32241 179.5751
## 916 138.6187 90.01463 187.2229
## 917 134.1629 85.55618 182.7695
predict(modelo_RL_Simple_FRE_CO, data.frame(seq(1,917)), interval='confidence', level = 0.95)
## fit lwr upr
## 1 142.4902 140.2861 144.6944
## 2 134.5281 132.8156 136.2406
## 3 142.0520 139.9258 144.1781
## 4 137.0117 135.4065 138.6169
## 5 135.6238 133.9902 137.2574
## 6 146.1426 143.1889 149.0963
## 7 138.6918 137.0103 140.3733
## 8 136.5734 134.9683 138.1785
## 9 136.5004 134.8944 138.1063
## 10 142.1250 139.9861 144.2639
## 11 136.7926 135.1885 138.3967
## 12 133.3593 131.5153 135.2034
## 13 136.2812 134.6715 137.8910
## 14 138.4726 136.8076 140.1377
## 15 136.7926 135.1885 138.3967
## 16 141.3215 139.3172 143.3258
## 17 135.6968 134.0668 137.3269
## 18 136.0621 134.4464 137.6777
## 19 139.4953 137.7381 141.2526
## 20 140.8832 138.9463 142.8201
## 21 137.6691 136.0482 139.2901
## 22 134.8203 133.1333 136.5072
## 23 136.0621 134.4464 137.6777
## 24 142.4172 140.2263 144.6081
## 25 137.0847 135.4787 138.6908
## 26 136.6465 135.0419 138.2510
## 27 140.3719 138.5076 142.2361
## 28 142.1250 139.9861 144.2639
## 29 155.5657 150.3348 160.7966
## 30 135.1125 133.4479 136.7771
## 31 159.2181 153.0582 165.3780
## 32 133.5785 131.7624 135.3946
## 33 137.7422 136.1183 139.3660
## 34 133.9437 132.1710 135.7164
## 35 134.9664 133.2910 136.6417
## 36 139.9336 138.1258 141.7414
## 37 143.7321 141.2903 146.1738
## 38 139.6414 137.8680 141.4148
## 39 134.3090 132.5752 136.0427
## 40 137.9613 136.3274 139.5952
## 41 138.1805 136.5345 139.8264
## 42 142.8555 140.5838 145.1271
## 43 140.6641 138.7592 142.5690
## 44 140.2988 138.4444 142.1533
## 45 134.1629 132.4141 135.9116
## 46 144.6086 141.9872 147.2301
## 47 137.6691 136.0482 139.2901
## 48 137.1578 135.5507 138.7649
## 49 146.2157 143.2457 149.1856
## 50 142.4902 140.2861 144.6944
## 51 138.3996 136.7397 140.0595
## 52 136.3543 134.7460 137.9625
## 53 137.7422 136.1183 139.3660
## 54 139.2762 137.5418 141.0105
## 55 134.5281 132.8156 136.2406
## 56 135.5508 133.9134 137.1881
## 57 141.1023 139.1323 143.0724
## 58 136.9387 135.3341 138.5432
## 59 148.0418 144.6542 151.4295
## 60 146.3618 143.3591 149.3644
## 61 139.8605 138.0616 141.6595
## 62 139.9336 138.1258 141.7414
## 63 137.7422 136.1183 139.3660
## 64 141.6137 139.5620 143.6654
## 65 136.1351 134.5217 137.7486
## 66 140.3719 138.5076 142.2361
## 67 143.0746 140.7615 145.3878
## 68 137.8152 136.1882 139.4422
## 69 139.3492 137.6074 141.0910
## 70 151.4751 147.2635 155.6867
## 71 140.7371 138.8217 142.6525
## 72 137.0847 135.4787 138.6908
## 73 134.6742 132.9748 136.3735
## 74 137.3039 135.6940 138.9138
## 75 140.9563 139.0085 142.9040
## 76 133.2863 131.4326 135.1400
## 77 160.0216 153.6557 166.3874
## 78 133.5785 131.7624 135.3946
## 79 128.6843 126.0024 131.3662
## 80 136.4273 134.8204 138.0343
## 81 141.6137 139.5620 143.6654
## 82 138.7648 137.0774 140.4523
## 83 137.6691 136.0482 139.2901
## 84 135.6968 134.0668 137.3269
## 85 136.9387 135.3341 138.5432
## 86 131.5332 129.4081 133.6582
## 87 140.5910 138.6965 142.4856
## 88 137.1578 135.5507 138.7649
## 89 142.6363 140.4055 144.8672
## 90 138.1074 136.4657 139.7491
## 91 136.5734 134.9683 138.1785
## 92 143.8051 141.3487 146.2615
## 93 136.7195 135.1153 138.3237
## 94 145.4121 142.6191 148.2052
## 95 134.6742 132.9748 136.3735
## 96 140.5910 138.6965 142.4856
## 97 136.5004 134.8944 138.1063
## 98 132.1175 130.0907 134.1443
## 99 127.5886 124.6687 130.5085
## 100 141.0293 139.0705 142.9881
## 101 141.4676 139.4398 143.4954
## 102 134.4550 132.7356 136.1744
## 103 150.0141 146.1579 153.8703
## 104 155.4196 150.2256 160.6137
## 105 134.9664 133.2910 136.6417
## 106 140.3719 138.5076 142.2361
## 107 139.9336 138.1258 141.7414
## 108 137.0117 135.4065 138.6169
## 109 130.8027 128.5458 133.0595
## 110 138.9840 137.2776 140.6904
## 111 135.1125 133.4479 136.7771
## 112 140.0066 138.1898 141.8235
## 113 141.5406 139.5009 143.5803
## 114 143.0746 140.7615 145.3878
## 115 136.5004 134.8944 138.1063
## 116 139.3492 137.6074 141.0910
## 117 141.9789 139.8655 144.0924
## 118 146.0696 143.1321 149.0070
## 119 133.0671 131.1837 134.9506
## 120 132.7750 130.8498 134.7002
## 121 139.4953 137.7381 141.2526
## 122 141.2484 139.2557 143.2412
## 123 138.9109 137.2111 140.6108
## 124 150.0872 146.2133 153.9610
## 125 138.1805 136.5345 139.8264
## 126 139.3492 137.6074 141.0910
## 127 133.1402 131.2668 135.0136
## 128 133.2863 131.4326 135.1400
## 129 138.1805 136.5345 139.8264
## 130 138.0344 136.3967 139.6721
## 131 142.7094 140.4650 144.9538
## 132 136.1351 134.5217 137.7486
## 133 149.7219 145.9360 153.5078
## 134 138.1805 136.5345 139.8264
## 135 142.8555 140.5838 145.1271
## 136 140.7371 138.8217 142.6525
## 137 137.0847 135.4787 138.6908
## 138 138.9840 137.2776 140.6904
## 139 133.5054 131.6802 135.3307
## 140 139.4223 137.6728 141.1717
## 141 145.5582 142.7334 148.3831
## 142 146.2887 143.3024 149.2750
## 143 142.6363 140.4055 144.8672
## 144 139.1301 137.4101 140.8500
## 145 141.7598 139.6837 143.8359
## 146 141.3215 139.3172 143.3258
## 147 135.8429 134.2193 137.4666
## 148 139.5684 137.8031 141.3336
## 149 133.6515 131.8445 135.4586
## 150 165.4271 157.6657 173.1885
## 151 137.0847 135.4787 138.6908
## 152 132.9941 131.1004 134.8878
## 153 141.4676 139.4398 143.4954
## 154 141.1023 139.1323 143.0724
## 155 142.6363 140.4055 144.8672
## 156 146.3618 143.3591 149.3644
## 157 135.2586 133.6039 136.9132
## 158 134.8933 133.2123 136.5744
## 159 142.5633 140.3458 144.7808
## 160 135.6238 133.9902 137.2574
## 161 140.6641 138.7592 142.5690
## 162 136.8656 135.2614 138.4698
## 163 140.5910 138.6965 142.4856
## 164 135.6968 134.0668 137.3269
## 165 137.8152 136.1882 139.4422
## 166 141.2484 139.2557 143.2412
## 167 138.2535 136.6031 139.9039
## 168 138.7648 137.0774 140.4523
## 169 137.5961 135.9778 139.2144
## 170 134.4550 132.7356 136.1744
## 171 139.1301 137.4101 140.8500
## 172 138.5457 136.8754 140.2160
## 173 144.7547 142.1025 147.4069
## 174 135.0394 133.3695 136.7093
## 175 140.8102 138.8841 142.7362
## 176 142.4172 140.2263 144.6081
## 177 137.1578 135.5507 138.7649
## 178 142.3442 140.1664 144.5219
## 179 135.5508 133.9134 137.1881
## 180 138.7648 137.0774 140.4523
## 181 137.8152 136.1882 139.4422
## 182 137.7422 136.1183 139.3660
## 183 150.8907 146.8219 154.9594
## 184 138.7648 137.0774 140.4523
## 185 144.1703 141.6398 146.7009
## 186 136.7926 135.1885 138.3967
## 187 139.7144 137.9327 141.4962
## 188 138.6918 137.0103 140.3733
## 189 145.3391 142.5619 148.1163
## 190 142.1981 140.0463 144.3498
## 191 141.8328 139.7444 143.9213
## 192 136.6465 135.0419 138.2510
## 193 139.2762 137.5418 141.0105
## 194 135.4047 133.7591 137.0503
## 195 134.8203 133.1333 136.5072
## 196 135.4777 133.8363 137.1191
## 197 143.0746 140.7615 145.3878
## 198 140.9563 139.0085 142.9040
## 199 139.3492 137.6074 141.0910
## 200 143.8781 141.4070 146.3492
## 201 139.5684 137.8031 141.3336
## 202 138.1805 136.5345 139.8264
## 203 132.1175 130.0907 134.1443
## 204 137.3769 135.7653 138.9886
## 205 134.8203 133.1333 136.5072
## 206 137.0847 135.4787 138.6908
## 207 143.8781 141.4070 146.3492
## 208 140.1527 138.3174 141.9881
## 209 131.0218 128.8055 133.2382
## 210 137.1578 135.5507 138.7649
## 211 140.5910 138.6965 142.4856
## 212 142.4172 140.2263 144.6081
## 213 141.5406 139.5009 143.5803
## 214 137.3769 135.7653 138.9886
## 215 137.8883 136.2579 139.5186
## 216 138.6918 137.0103 140.3733
## 217 141.8328 139.7444 143.9213
## 218 137.2308 135.6225 138.8392
## 219 135.6968 134.0668 137.3269
## 220 140.5910 138.6965 142.4856
## 221 137.5961 135.9778 139.2144
## 222 143.5129 141.1147 145.9112
## 223 135.6238 133.9902 137.2574
## 224 143.1477 140.8205 145.4748
## 225 140.0797 138.2537 141.9057
## 226 140.6641 138.7592 142.5690
## 227 135.6238 133.9902 137.2574
## 228 129.9261 127.5001 132.3521
## 229 142.9285 140.6431 145.2139
## 230 134.0168 132.2522 135.7813
## 231 144.3895 141.8137 146.9652
## 232 141.9059 139.8050 144.0068
## 233 141.4676 139.4398 143.4954
## 234 139.6414 137.8680 141.4148
## 235 143.9512 141.4653 146.4371
## 236 135.9890 134.3710 137.6071
## 237 145.9235 143.0184 148.8285
## 238 142.9285 140.6431 145.2139
## 239 147.3114 144.0930 150.5297
## 240 135.4777 133.8363 137.1191
## 241 145.1930 142.4473 147.9387
## 242 135.8429 134.2193 137.4666
## 243 142.7094 140.4650 144.9538
## 244 140.8102 138.8841 142.7362
## 245 140.9563 139.0085 142.9040
## 246 133.8707 132.0896 135.6517
## 247 138.6918 137.0103 140.3733
## 248 141.4676 139.4398 143.4954
## 249 137.3769 135.7653 138.9886
## 250 146.2887 143.3024 149.2750
## 251 157.2458 151.5892 162.9024
## 252 140.3719 138.5076 142.2361
## 253 142.7094 140.4650 144.9538
## 254 141.1754 139.1941 143.1567
## 255 139.4953 137.7381 141.2526
## 256 141.3945 139.3785 143.4105
## 257 150.1602 146.2687 154.0517
## 258 133.0671 131.1837 134.9506
## 259 135.9890 134.3710 137.6071
## 260 144.7547 142.1025 147.4069
## 261 141.4676 139.4398 143.4954
## 262 137.5230 135.9072 139.1389
## 263 138.2535 136.6031 139.9039
## 264 130.5835 128.2854 132.8816
## 265 135.4777 133.8363 137.1191
## 266 143.6590 141.2318 146.0862
## 267 143.1477 140.8205 145.4748
## 268 137.4500 135.8364 139.0636
## 269 139.0570 137.3439 140.7701
## 270 138.5457 136.8754 140.2160
## 271 137.8152 136.1882 139.4422
## 272 135.8429 134.2193 137.4666
## 273 136.0621 134.4464 137.6777
## 274 137.4500 135.8364 139.0636
## 275 142.9285 140.6431 145.2139
## 276 136.9387 135.3341 138.5432
## 277 133.0671 131.1837 134.9506
## 278 137.6691 136.0482 139.2901
## 279 146.7270 143.6420 149.8119
## 280 139.8605 138.0616 141.6595
## 281 139.3492 137.6074 141.0910
## 282 137.5961 135.9778 139.2144
## 283 137.4500 135.8364 139.0636
## 284 146.5078 143.4724 149.5433
## 285 147.5305 144.2617 150.7993
## 286 135.2586 133.6039 136.9132
## 287 133.7246 131.9263 135.5228
## 288 134.6011 132.8953 136.3070
## 289 143.8781 141.4070 146.3492
## 290 133.5054 131.6802 135.3307
## 291 136.7926 135.1885 138.3967
## 292 140.1527 138.3174 141.9881
## 293 134.6742 132.9748 136.3735
## 294 125.8355 122.5173 129.1536
## 295 130.3644 128.0243 132.7045
## 296 130.4374 128.1114 132.7634
## 297 125.3241 121.8866 128.7616
## 298 125.9085 122.6073 129.2097
## 299 128.1730 125.3813 130.9647
## 300 125.8355 122.5173 129.1536
## 301 130.3644 128.0243 132.7045
## 302 130.4374 128.1114 132.7634
## 303 130.2183 127.8499 132.5867
## 304 129.9261 127.5001 132.3521
## 305 124.3745 120.7124 128.0366
## 306 124.5206 120.8933 128.1479
## 307 127.8077 124.9362 130.6793
## 308 129.6339 127.1493 132.1186
## 309 125.4702 122.0669 128.8735
## 310 129.7070 127.2371 132.1768
## 311 125.1780 121.7062 128.6498
## 312 129.6339 127.1493 132.1186
## 313 130.1453 127.7626 132.5280
## 314 124.8128 121.2548 128.3708
## 315 129.8531 127.4125 132.2936
## 316 129.2687 126.7093 131.8281
## 317 129.2687 126.7093 131.8281
## 318 130.2183 127.8499 132.5867
## 319 126.2737 123.0568 129.4907
## 320 129.9261 127.5001 132.3521
## 321 130.5105 128.1985 132.8225
## 322 129.9261 127.5001 132.3521
## 323 130.7296 128.4591 133.0001
## 324 129.3417 126.7974 131.8860
## 325 128.2460 125.4701 131.0219
## 326 124.5937 120.9837 128.2036
## 327 128.4652 125.7365 131.1938
## 328 129.8531 127.4125 132.2936
## 329 125.5433 122.1571 128.9295
## 330 127.7347 124.8471 130.6223
## 331 130.8027 128.5458 133.0595
## 332 129.4878 126.9735 132.0022
## 333 129.2687 126.7093 131.8281
## 334 124.4476 120.8029 128.0923
## 335 128.6843 126.0024 131.3662
## 336 126.7851 123.6849 129.8852
## 337 128.6113 125.9138 131.3087
## 338 127.5886 124.6687 130.5085
## 339 125.3241 121.8866 128.7616
## 340 129.9261 127.5001 132.3521
## 341 127.5886 124.6687 130.5085
## 342 129.5609 127.0614 132.0603
## 343 129.3417 126.7974 131.8860
## 344 125.1780 121.7062 128.6498
## 345 127.5886 124.6687 130.5085
## 346 124.4476 120.8029 128.0923
## 347 130.5835 128.2854 132.8816
## 348 125.6163 122.2472 128.9855
## 349 130.4374 128.1114 132.7634
## 350 124.4476 120.8029 128.0923
## 351 125.1780 121.7062 128.6498
## 352 127.7347 124.8471 130.6223
## 353 126.9312 123.8641 129.9982
## 354 126.0546 122.7872 129.3220
## 355 129.8531 127.4125 132.2936
## 356 126.4198 123.2364 129.6033
## 357 129.8531 127.4125 132.2936
## 358 127.8077 124.9362 130.6793
## 359 127.0773 124.0432 130.1114
## 360 126.8581 123.7745 129.9417
## 361 125.1780 121.7062 128.6498
## 362 130.8027 128.5458 133.0595
## 363 126.1277 122.8771 129.3782
## 364 128.3921 125.6478 131.1365
## 365 124.5937 120.9837 128.2036
## 366 128.9765 126.3563 131.5967
## 367 127.1503 124.1326 130.1680
## 368 124.3015 120.6220 127.9810
## 369 125.9816 122.6972 129.2659
## 370 127.6616 124.7579 130.5654
## 371 125.6894 122.3372 129.0415
## 372 125.2511 121.7964 128.7057
## 373 127.7347 124.8471 130.6223
## 374 128.7574 126.0910 131.4237
## 375 125.6163 122.2472 128.9855
## 376 128.5382 125.8252 131.2512
## 377 126.7120 123.5953 129.8288
## 378 124.9589 121.4355 128.4823
## 379 127.4425 124.4902 130.3948
## 380 126.4929 123.3262 129.6596
## 381 126.2737 123.0568 129.4907
## 382 129.9992 127.5877 132.4106
## 383 124.3745 120.7124 128.0366
## 384 125.1050 121.6160 128.5940
## 385 126.2007 122.9670 129.4344
## 386 127.9538 125.1144 130.7933
## 387 128.3921 125.6478 131.1365
## 388 129.2687 126.7093 131.8281
## 389 128.4652 125.7365 131.1938
## 390 128.6843 126.0024 131.3662
## 391 128.2460 125.4701 131.0219
## 392 129.2687 126.7093 131.8281
## 393 128.1730 125.3813 130.9647
## 394 130.4374 128.1114 132.7634
## 395 126.8581 123.7745 129.9417
## 396 125.9085 122.6073 129.2097
## 397 127.8808 125.0253 130.7363
## 398 126.0546 122.7872 129.3220
## 399 127.6616 124.7579 130.5654
## 400 128.5382 125.8252 131.2512
## 401 127.7347 124.8471 130.6223
## 402 129.1956 126.6212 131.7701
## 403 128.1730 125.3813 130.9647
## 404 124.5937 120.9837 128.2036
## 405 129.1226 126.5329 131.7123
## 406 129.8531 127.4125 132.2936
## 407 126.7120 123.5953 129.8288
## 408 127.5156 124.5795 130.4516
## 409 130.7296 128.4591 133.0001
## 410 128.9035 126.2679 131.5390
## 411 125.4702 122.0669 128.8735
## 412 124.5206 120.8933 128.1479
## 413 125.6894 122.3372 129.0415
## 414 129.0495 126.4446 131.6544
## 415 130.7296 128.4591 133.0001
## 416 126.4198 123.2364 129.6033
## 417 129.0495 126.4446 131.6544
## 418 124.5206 120.8933 128.1479
## 419 130.7296 128.4591 133.0001
## 420 127.4425 124.4902 130.3948
## 421 129.0495 126.4446 131.6544
## 422 124.4476 120.8029 128.0923
## 423 126.5659 123.4159 129.7159
## 424 125.9816 122.6972 129.2659
## 425 129.5609 127.0614 132.0603
## 426 125.1050 121.6160 128.5940
## 427 128.6113 125.9138 131.3087
## 428 128.6113 125.9138 131.3087
## 429 130.8027 128.5458 133.0595
## 430 130.7296 128.4591 133.0001
## 431 130.6566 128.3723 132.9409
## 432 126.9312 123.8641 129.9982
## 433 127.8808 125.0253 130.7363
## 434 126.7120 123.5953 129.8288
## 435 127.0773 124.0432 130.1114
## 436 126.0546 122.7872 129.3220
## 437 126.8581 123.7745 129.9417
## 438 129.7070 127.2371 132.1768
## 439 124.4476 120.8029 128.0923
## 440 129.5609 127.0614 132.0603
## 441 128.3921 125.6478 131.1365
## 442 126.9312 123.8641 129.9982
## 443 125.9085 122.6073 129.2097
## 444 126.0546 122.7872 129.3220
## 445 130.4374 128.1114 132.7634
## 446 128.0999 125.2923 130.9075
## 447 124.8128 121.2548 128.3708
## 448 126.6390 123.5056 129.7723
## 449 124.6667 121.0741 128.2593
## 450 129.7070 127.2371 132.1768
## 451 129.2687 126.7093 131.8281
## 452 125.6894 122.3372 129.0415
## 453 124.8128 121.2548 128.3708
## 454 129.2687 126.7093 131.8281
## 455 125.0319 121.5257 128.5382
## 456 125.1050 121.6160 128.5940
## 457 126.0546 122.7872 129.3220
## 458 126.6390 123.5056 129.7723
## 459 124.8128 121.2548 128.3708
## 460 126.0546 122.7872 129.3220
## 461 130.6566 128.3723 132.9409
## 462 130.0722 127.6751 132.4693
## 463 128.0269 125.2034 130.8504
## 464 125.9816 122.6972 129.2659
## 465 138.9109 137.2111 140.6108
## 466 130.5835 128.2854 132.8816
## 467 131.8253 129.7503 133.9004
## 468 129.5609 127.0614 132.0603
## 469 134.6742 132.9748 136.3735
## 470 128.7574 126.0910 131.4237
## 471 132.4097 130.4293 134.3901
## 472 135.0394 133.3695 136.7093
## 473 130.2183 127.8499 132.5867
## 474 131.9714 129.9207 134.0221
## 475 133.4324 131.5978 135.2669
## 476 134.2359 132.4947 135.9771
## 477 130.3644 128.0243 132.7045
## 478 129.9992 127.5877 132.4106
## 479 128.9035 126.2679 131.5390
## 480 134.1629 132.4141 135.9116
## 481 135.1125 133.4479 136.7771
## 482 132.4828 130.5137 134.4519
## 483 130.2183 127.8499 132.5867
## 484 128.7574 126.0910 131.4237
## 485 134.1629 132.4141 135.9116
## 486 137.0117 135.4065 138.6169
## 487 137.0117 135.4065 138.6169
## 488 139.7875 137.9972 141.5778
## 489 137.4500 135.8364 139.0636
## 490 137.0117 135.4065 138.6169
## 491 136.2082 134.5967 137.8197
## 492 133.0671 131.1837 134.9506
## 493 128.7574 126.0910 131.4237
## 494 132.2636 130.2603 134.2670
## 495 129.9261 127.5001 132.3521
## 496 130.4374 128.1114 132.7634
## 497 131.8984 129.8356 133.9612
## 498 131.8253 129.7503 133.9004
## 499 143.0746 140.7615 145.3878
## 500 139.4953 137.7381 141.2526
## 501 143.8781 141.4070 146.3492
## 502 136.5734 134.9683 138.1785
## 503 137.9613 136.3274 139.5952
## 504 136.7195 135.1153 138.3237
## 505 139.2762 137.5418 141.0105
## 506 137.8152 136.1882 139.4422
## 507 138.9109 137.2111 140.6108
## 508 131.2410 129.0643 133.4176
## 509 134.9664 133.2910 136.6417
## 510 133.7976 132.0081 135.5872
## 511 130.8757 128.6325 133.1190
## 512 132.3367 130.3449 134.3285
## 513 131.8253 129.7503 133.9004
## 514 133.1402 131.2668 135.0136
## 515 130.2913 127.9371 132.6455
## 516 133.3593 131.5153 135.2034
## 517 133.7976 132.0081 135.5872
## 518 133.2132 131.3498 135.0767
## 519 143.6590 141.2318 146.0862
## 520 137.6691 136.0482 139.2901
## 521 141.9789 139.8655 144.0924
## 522 146.8731 143.7550 149.9912
## 523 133.0671 131.1837 134.9506
## 524 133.0671 131.1837 134.9506
## 525 138.6187 136.9429 140.2946
## 526 144.1703 141.6398 146.7009
## 527 142.0520 139.9258 144.1781
## 528 131.7523 129.6649 133.8397
## 529 136.7926 135.1885 138.3967
## 530 137.3039 135.6940 138.9138
## 531 143.7321 141.2903 146.1738
## 532 134.9664 133.2910 136.6417
## 533 139.7875 137.9972 141.5778
## 534 137.5961 135.9778 139.2144
## 535 129.7800 127.3248 132.2352
## 536 135.1125 133.4479 136.7771
## 537 140.2258 138.3810 142.0706
## 538 136.1351 134.5217 137.7486
## 539 135.7699 134.1432 137.3966
## 540 136.2812 134.6715 137.8910
## 541 129.6339 127.1493 132.1186
## 542 141.3945 139.3785 143.4105
## 543 135.4047 133.7591 137.0503
## 544 143.1477 140.8205 145.4748
## 545 141.2484 139.2557 143.2412
## 546 137.4500 135.8364 139.0636
## 547 135.9890 134.3710 137.6071
## 548 140.4449 138.5707 142.3191
## 549 134.6011 132.8953 136.3070
## 550 140.3719 138.5076 142.2361
## 551 137.4500 135.8364 139.0636
## 552 137.5230 135.9072 139.1389
## 553 137.1578 135.5507 138.7649
## 554 134.1629 132.4141 135.9116
## 555 137.3769 135.7653 138.9886
## 556 144.0242 141.5235 146.5249
## 557 136.5734 134.9683 138.1785
## 558 138.3266 136.6715 139.9816
## 559 141.3215 139.3172 143.3258
## 560 136.2082 134.5967 137.8197
## 561 134.6742 132.9748 136.3735
## 562 141.3945 139.3785 143.4105
## 563 136.2812 134.6715 137.8910
## 564 141.1023 139.1323 143.0724
## 565 142.7094 140.4650 144.9538
## 566 133.8707 132.0896 135.6517
## 567 137.5230 135.9072 139.1389
## 568 142.4902 140.2861 144.6944
## 569 137.2308 135.6225 138.8392
## 570 137.6691 136.0482 139.2901
## 571 129.4148 126.8855 131.9441
## 572 135.4777 133.8363 137.1191
## 573 130.3644 128.0243 132.7045
## 574 136.7195 135.1153 138.3237
## 575 141.9789 139.8655 144.0924
## 576 133.7976 132.0081 135.5872
## 577 148.3340 144.8780 151.7901
## 578 134.0168 132.2522 135.7813
## 579 142.4902 140.2861 144.6944
## 580 132.4828 130.5137 134.4519
## 581 136.5734 134.9683 138.1785
## 582 137.1578 135.5507 138.7649
## 583 141.1754 139.1941 143.1567
## 584 139.2031 137.4761 140.9302
## 585 142.1981 140.0463 144.3498
## 586 139.1301 137.4101 140.8500
## 587 138.9109 137.2111 140.6108
## 588 137.3769 135.7653 138.9886
## 589 138.6918 137.0103 140.3733
## 590 133.4324 131.5978 135.2669
## 591 136.9387 135.3341 138.5432
## 592 142.3442 140.1664 144.5219
## 593 140.2258 138.3810 142.0706
## 594 140.0797 138.2537 141.9057
## 595 134.9664 133.2910 136.6417
## 596 140.6641 138.7592 142.5690
## 597 134.8933 133.2123 136.5744
## 598 137.8883 136.2579 139.5186
## 599 136.2082 134.5967 137.8197
## 600 136.5004 134.8944 138.1063
## 601 142.1250 139.9861 144.2639
## 602 145.9965 143.0753 148.9178
## 603 144.0242 141.5235 146.5249
## 604 139.9336 138.1258 141.7414
## 605 140.2258 138.3810 142.0706
## 606 139.9336 138.1258 141.7414
## 607 143.2938 140.9384 145.6491
## 608 133.7976 132.0081 135.5872
## 609 144.0242 141.5235 146.5249
## 610 145.7043 142.8475 148.5611
## 611 131.5332 129.4081 133.6582
## 612 137.6691 136.0482 139.2901
## 613 149.5028 145.7694 153.2361
## 614 139.9336 138.1258 141.7414
## 615 144.9008 142.2177 147.5840
## 616 162.5783 155.5543 169.6022
## 617 140.4449 138.5707 142.3191
## 618 140.5910 138.6965 142.4856
## 619 141.0293 139.0705 142.9881
## 620 134.3090 132.5752 136.0427
## 621 140.0797 138.2537 141.9057
## 622 138.8379 137.1443 140.5314
## 623 142.7824 140.5245 145.0404
## 624 151.1098 146.9876 155.2320
## 625 138.4726 136.8076 140.1377
## 626 137.8883 136.2579 139.5186
## 627 138.5457 136.8754 140.2160
## 628 138.4726 136.8076 140.1377
## 629 143.5129 141.1147 145.9112
## 630 132.2636 130.2603 134.2670
## 631 144.0973 141.5817 146.6129
## 632 136.2082 134.5967 137.8197
## 633 136.7926 135.1885 138.3967
## 634 135.9160 134.2953 137.5367
## 635 138.1074 136.4657 139.7491
## 636 139.2762 137.5418 141.0105
## 637 143.5129 141.1147 145.9112
## 638 136.2812 134.6715 137.8910
## 639 142.4172 140.2263 144.6081
## 640 141.4676 139.4398 143.4954
## 641 139.1301 137.4101 140.8500
## 642 142.9285 140.6431 145.2139
## 643 138.1805 136.5345 139.8264
## 644 140.7371 138.8217 142.6525
## 645 138.1074 136.4657 139.7491
## 646 138.0344 136.3967 139.6721
## 647 137.0847 135.4787 138.6908
## 648 145.1930 142.4473 147.9387
## 649 135.9890 134.3710 137.6071
## 650 140.0797 138.2537 141.9057
## 651 136.5004 134.8944 138.1063
## 652 141.3215 139.3172 143.3258
## 653 134.5281 132.8156 136.2406
## 654 137.5961 135.9778 139.2144
## 655 137.6691 136.0482 139.2901
## 656 136.6465 135.0419 138.2510
## 657 138.3996 136.7397 140.0595
## 658 135.7699 134.1432 137.3966
## 659 137.3039 135.6940 138.9138
## 660 136.7926 135.1885 138.3967
## 661 132.2636 130.2603 134.2670
## 662 135.7699 134.1432 137.3966
## 663 139.3492 137.6074 141.0910
## 664 137.8152 136.1882 139.4422
## 665 144.3895 141.8137 146.9652
## 666 136.3543 134.7460 137.9625
## 667 151.8403 147.5390 156.1416
## 668 135.6238 133.9902 137.2574
## 669 138.4726 136.8076 140.1377
## 670 135.8429 134.2193 137.4666
## 671 133.5054 131.6802 135.3307
## 672 134.3820 132.6555 136.1085
## 673 139.5684 137.8031 141.3336
## 674 141.9059 139.8050 144.0068
## 675 130.5835 128.2854 132.8816
## 676 143.6590 141.2318 146.0862
## 677 137.8883 136.2579 139.5186
## 678 138.9109 137.2111 140.6108
## 679 138.3996 136.7397 140.0595
## 680 141.5406 139.5009 143.5803
## 681 140.4449 138.5707 142.3191
## 682 144.6817 142.0449 147.3185
## 683 139.0570 137.3439 140.7701
## 684 139.1301 137.4101 140.8500
## 685 140.3719 138.5076 142.2361
## 686 147.2383 144.0368 150.4399
## 687 139.2762 137.5418 141.0105
## 688 135.7699 134.1432 137.3966
## 689 137.6691 136.0482 139.2901
## 690 143.9512 141.4653 146.4371
## 691 136.5734 134.9683 138.1785
## 692 135.9160 134.2953 137.5367
## 693 136.6465 135.0419 138.2510
## 694 138.6187 136.9429 140.2946
## 695 137.3039 135.6940 138.9138
## 696 135.8429 134.2193 137.4666
## 697 141.1023 139.1323 143.0724
## 698 137.0117 135.4065 138.6169
## 699 136.0621 134.4464 137.6777
## 700 139.2031 137.4761 140.9302
## 701 136.5734 134.9683 138.1785
## 702 141.1023 139.1323 143.0724
## 703 143.7321 141.2903 146.1738
## 704 139.1301 137.4101 140.8500
## 705 137.5230 135.9072 139.1389
## 706 145.4852 142.6763 148.2941
## 707 140.8102 138.8841 142.7362
## 708 136.4273 134.8204 138.0343
## 709 136.8656 135.2614 138.4698
## 710 141.4676 139.4398 143.4954
## 711 143.4399 141.0560 145.8238
## 712 138.4726 136.8076 140.1377
## 713 144.2434 141.6978 146.7889
## 714 139.2031 137.4761 140.9302
## 715 131.6792 129.5794 133.7791
## 716 138.6918 137.0103 140.3733
## 717 141.0293 139.0705 142.9881
## 718 142.4902 140.2861 144.6944
## 719 139.9336 138.1258 141.7414
## 720 141.3945 139.3785 143.4105
## 721 137.5961 135.9778 139.2144
## 722 140.2258 138.3810 142.0706
## 723 134.3090 132.5752 136.0427
## 724 133.0671 131.1837 134.9506
## 725 145.2660 142.5046 148.0274
## 726 138.5457 136.8754 140.2160
## 727 143.6590 141.2318 146.0862
## 728 143.5860 141.1733 145.9986
## 729 142.9285 140.6431 145.2139
## 730 141.1754 139.1941 143.1567
## 731 139.5684 137.8031 141.3336
## 732 142.4172 140.2263 144.6081
## 733 137.8883 136.2579 139.5186
## 734 142.0520 139.9258 144.1781
## 735 135.1125 133.4479 136.7771
## 736 142.2711 140.1064 144.4358
## 737 141.3945 139.3785 143.4105
## 738 147.6766 144.3740 150.9792
## 739 141.3215 139.3172 143.3258
## 740 136.0621 134.4464 137.6777
## 741 140.8832 138.9463 142.8201
## 742 135.6968 134.0668 137.3269
## 743 136.0621 134.4464 137.6777
## 744 138.1805 136.5345 139.8264
## 745 141.0293 139.0705 142.9881
## 746 136.8656 135.2614 138.4698
## 747 137.8883 136.2579 139.5186
## 748 139.3492 137.6074 141.0910
## 749 138.3266 136.6715 139.9816
## 750 134.3090 132.5752 136.0427
## 751 141.6137 139.5620 143.6654
## 752 139.5684 137.8031 141.3336
## 753 136.7195 135.1153 138.3237
## 754 136.5004 134.8944 138.1063
## 755 136.8656 135.2614 138.4698
## 756 141.1754 139.1941 143.1567
## 757 138.3996 136.7397 140.0595
## 758 136.9387 135.3341 138.5432
## 759 142.0520 139.9258 144.1781
## 760 141.9789 139.8655 144.0924
## 761 138.1805 136.5345 139.8264
## 762 133.5785 131.7624 135.3946
## 763 137.7422 136.1183 139.3660
## 764 140.9563 139.0085 142.9040
## 765 139.6414 137.8680 141.4148
## 766 137.3769 135.7653 138.9886
## 767 140.8832 138.9463 142.8201
## 768 143.5129 141.1147 145.9112
## 769 140.0797 138.2537 141.9057
## 770 136.2812 134.6715 137.8910
## 771 137.2308 135.6225 138.8392
## 772 143.8781 141.4070 146.3492
## 773 135.4777 133.8363 137.1191
## 774 138.0344 136.3967 139.6721
## 775 138.2535 136.6031 139.9039
## 776 139.2031 137.4761 140.9302
## 777 140.5180 138.6337 142.4023
## 778 140.2988 138.4444 142.1533
## 779 136.7926 135.1885 138.3967
## 780 145.1199 142.3900 147.8499
## 781 139.9336 138.1258 141.7414
## 782 135.7699 134.1432 137.3966
## 783 138.6187 136.9429 140.2946
## 784 141.9789 139.8655 144.0924
## 785 138.4726 136.8076 140.1377
## 786 139.9336 138.1258 141.7414
## 787 143.2207 140.8795 145.5619
## 788 136.7926 135.1885 138.3967
## 789 134.6742 132.9748 136.3735
## 790 142.8555 140.5838 145.1271
## 791 143.1477 140.8205 145.4748
## 792 138.2535 136.6031 139.9039
## 793 139.9336 138.1258 141.7414
## 794 135.6968 134.0668 137.3269
## 795 138.9109 137.2111 140.6108
## 796 151.2559 147.0980 155.4138
## 797 133.9437 132.1710 135.7164
## 798 140.7371 138.8217 142.6525
## 799 139.3492 137.6074 141.0910
## 800 144.3895 141.8137 146.9652
## 801 134.8203 133.1333 136.5072
## 802 138.3996 136.7397 140.0595
## 803 150.1602 146.2687 154.0517
## 804 141.0293 139.0705 142.9881
## 805 138.8379 137.1443 140.5314
## 806 134.0898 132.3332 135.8464
## 807 143.9512 141.4653 146.4371
## 808 141.9789 139.8655 144.0924
## 809 140.0066 138.1898 141.8235
## 810 139.6414 137.8680 141.4148
## 811 139.4953 137.7381 141.2526
## 812 137.0117 135.4065 138.6169
## 813 138.8379 137.1443 140.5314
## 814 143.5860 141.1733 145.9986
## 815 141.6137 139.5620 143.6654
## 816 143.2938 140.9384 145.6491
## 817 140.2258 138.3810 142.0706
## 818 143.2207 140.8795 145.5619
## 819 142.4902 140.2861 144.6944
## 820 143.1477 140.8205 145.4748
## 821 144.6086 141.9872 147.2301
## 822 138.9109 137.2111 140.6108
## 823 143.9512 141.4653 146.4371
## 824 139.6414 137.8680 141.4148
## 825 142.4172 140.2263 144.6081
## 826 139.2762 137.5418 141.0105
## 827 136.9387 135.3341 138.5432
## 828 137.1578 135.5507 138.7649
## 829 136.2812 134.6715 137.8910
## 830 136.2812 134.6715 137.8910
## 831 139.7875 137.9972 141.5778
## 832 137.9613 136.3274 139.5952
## 833 140.2258 138.3810 142.0706
## 834 137.4500 135.8364 139.0636
## 835 138.8379 137.1443 140.5314
## 836 139.9336 138.1258 141.7414
## 837 133.6515 131.8445 135.4586
## 838 145.4852 142.6763 148.2941
## 839 134.7472 133.0542 136.4403
## 840 136.2082 134.5967 137.8197
## 841 140.5910 138.6965 142.4856
## 842 146.2887 143.3024 149.2750
## 843 142.0520 139.9258 144.1781
## 844 134.9664 133.2910 136.6417
## 845 143.8051 141.3487 146.2615
## 846 137.3769 135.7653 138.9886
## 847 140.3719 138.5076 142.2361
## 848 140.0066 138.1898 141.8235
## 849 138.2535 136.6031 139.9039
## 850 133.3593 131.5153 135.2034
## 851 138.4726 136.8076 140.1377
## 852 134.3090 132.5752 136.0427
## 853 140.1527 138.3174 141.9881
## 854 145.1199 142.3900 147.8499
## 855 141.3945 139.3785 143.4105
## 856 144.8278 142.1601 147.4954
## 857 140.6641 138.7592 142.5690
## 858 140.9563 139.0085 142.9040
## 859 143.8781 141.4070 146.3492
## 860 139.8605 138.0616 141.6595
## 861 139.4953 137.7381 141.2526
## 862 141.0293 139.0705 142.9881
## 863 134.8933 133.2123 136.5744
## 864 141.9789 139.8655 144.0924
## 865 135.1125 133.4479 136.7771
## 866 137.3769 135.7653 138.9886
## 867 142.5633 140.3458 144.7808
## 868 134.1629 132.4141 135.9116
## 869 136.8656 135.2614 138.4698
## 870 143.4399 141.0560 145.8238
## 871 139.1301 137.4101 140.8500
## 872 147.1653 143.9805 150.3501
## 873 145.8504 142.9615 148.7394
## 874 139.4223 137.6728 141.1717
## 875 146.2157 143.2457 149.1856
## 876 136.4273 134.8204 138.0343
## 877 142.1250 139.9861 144.2639
## 878 140.8102 138.8841 142.7362
## 879 138.1074 136.4657 139.7491
## 880 135.9160 134.2953 137.5367
## 881 140.5910 138.6965 142.4856
## 882 142.8555 140.5838 145.1271
## 883 135.4047 133.7591 137.0503
## 884 142.2711 140.1064 144.4358
## 885 137.1578 135.5507 138.7649
## 886 137.6691 136.0482 139.2901
## 887 139.4223 137.6728 141.1717
## 888 136.2812 134.6715 137.8910
## 889 136.2812 134.6715 137.8910
## 890 137.9613 136.3274 139.5952
## 891 141.6867 139.6229 143.7506
## 892 137.4500 135.8364 139.0636
## 893 138.3266 136.6715 139.9816
## 894 135.7699 134.1432 137.3966
## 895 145.8504 142.9615 148.7394
## 896 139.8605 138.0616 141.6595
## 897 136.3543 134.7460 137.9625
## 898 135.4047 133.7591 137.0503
## 899 136.2082 134.5967 137.8197
## 900 144.6086 141.9872 147.2301
## 901 137.8152 136.1882 139.4422
## 902 137.4500 135.8364 139.0636
## 903 137.5230 135.9072 139.1389
## 904 138.9109 137.2111 140.6108
## 905 136.8656 135.2614 138.4698
## 906 146.3618 143.3591 149.3644
## 907 133.7246 131.9263 135.5228
## 908 135.0394 133.3695 136.7093
## 909 135.7699 134.1432 137.3966
## 910 132.8480 130.9335 134.7626
## 911 134.2359 132.4947 135.9771
## 912 138.9840 137.2776 140.6904
## 913 140.6641 138.7592 142.5690
## 914 135.4777 133.8363 137.1191
## 915 130.9488 128.7190 133.1785
## 916 138.6187 136.9429 140.2946
## 917 134.1629 132.4141 135.9116
Este modelo, que puede inicialmente pensarse como una extensión de la regresión lineal simple para facilitar su comprensión, y que eventualmente serÔ llamado en este estudio como RLM, tiene como ecuación general aditiva:
\[y_i=\beta_0+\beta_1 x_{i1}+\cdots+\beta_k x_{ik}+\varepsilon_i, \hspace{3mm}i=1,2,\dots,n\hspace{10mm}(21)\]
donde \(E(\epsilon)=0\) y \(V(\epsilon)=\sigma^2\). TambiĆ©n, para hacer pruebas de hipótesis y calcular intervalos de confianza y de predicción, se supone que \(\epsilon\) estĆ” normalmente distribuida. Complementariamente, con base en el enfoque de los mĆnimos cuadrados ordinarios, la estimación de sus parĆ”metros se plantea en tĆ©rminos de la minimización de una función de ensayo desde la cual se observan los cuadrados de las desviaciones de la variable estudiada. La función de ensayo se representa como \(f(b_0,b_1,...,b_k)= \sum_{j}[y_i-(b_0+b_1x_{1j}+b_2x_{2j}+...+b_kx_{kj})]^2\). Esto conduce a un conjunto de ecuaciones normales lineales en \(b_0,b_1,...,b_k\), que al ser resueltas entregan las estimaciones de mĆnimos cuadrados de \(\hat{\beta_0},\hat{\beta_1},...,, \hat{\beta_k}\).
Complementariamente, la proporción de variación total explicada por el modelo de regresión múltiple a través del coeficiente de determinación múltiple se ajusta, generalmente, con base en el número de parÔmetros del modelo.
AdemĆ”s, una prueba de utilidad del modelo de regresión lineal mĆŗltiple consiste en una prueba de hipótesis basada en un estadĆstico que tiene una distribución \(F\) particular cuando \(H_0\) es verdadera, esto de expresa en el par:
\[H_0:\beta_1=\beta_2=\cdots=\beta_k=0\hspace{10mm}(22)\] \[H_1: \text {al menos una }\beta_i\neq 0\hspace{5mm}(i=1,...,k)\hspace{10mm}(23)\]
el valor del estadĆstico de prueba es:
\[f=\frac{R^2/k}{(1-R^2)(n-(k+1))}=\frac{SCR/k}{SCE/(n-(k+1))}=\frac{RMC}{CME}\hspace{10mm}(24)\]
donde \(SCR=STC-SCE\), que es la suma de cuadrados de regresión, y la región de rechazo para una prueba de nivel \(\alpha\) es:
\[f\geq F_{\alpha, k,n-(k+1)}\hspace{10mm}(25)\]
Por Ćŗltimo, un intervalo de confianza al \(100(1-\alpha)\%\) para \(\beta_i\) es:
\[\hat\beta_i\pm t_{\alpha/2,n-(k+1)}\cdot s_{\hat\beta_{i}}\hspace{10mm}(26)\] y un intervalo de confianza al mismo nivel de significancia para un valor futuro estĆ” dado por:
\[\hat y\pm t_{\alpha/2,n-(k+1)}\cdot \sqrt{s^2+s^2_{\hat Y}}\hspace{10mm}(27)\]
Para cerrar, es necesario mencionar que eventualmente surgen problemas en los anÔlisis de regresión múltiple que implican considerar técnicas de solución relacionadas con transformaciones de no-linealidad, estandarización y selección de variables, identificación de observaciones influyentes, multicolinealidad, entre otras.
Planteaminto del problema
Basandonos en el conjunto descrito en la fase 1 se formulara un modelo de regresion linal multiple para estudiar la relacion linal multiple supuesta entre las varaibles definidas por los campos: FrecC_Max (Variable dependiente) y las demas como variables independientes: Edad, PA_reposo, Colesterol, AS_Ayunas, Oldpeak, Sexo, ipo_dolor_pecho, ECG_reposo, Angina_Ejercicio, Pendi_Segme_ST_Ejercicio y Clase_salida
Desarrollo del anƔlisis
En el siguiente desarrollo del anƔlisis se hara en R Stutio y este mismo contara con varias secciones que se presentaran a continuacion.
En base a la navegacion a travƩs de pestaƱas muestran un resumen estadistico de todas la variables del conjunto de datos, Sin embargo, para las variables qeu son de naturaleza Cuantitativas::Razon el resumen se hara de manera tradiconal, pero para las variables que son de naturaleza Cualitativas::Nominal el resumen estadistico solo considerara conteos, proporciones y diagramas de barra. Se recalca de nuevo que la variable dependiente es FrecC_Max.
summary(heart_diseases_Dataset$Edad)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 28.00 47.00 54.00 53.51 60.00 77.00
summary(heart_diseases_Dataset$PA_reposo)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 80.0 120.0 130.0 132.5 140.0 200.0
summary(heart_diseases_Dataset$Colesterol)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 40 163 219 211 264 603
summary(heart_diseases_Dataset$AS_Ayunas)
## Warning: Unknown or uninitialised column: `AS_Ayunas`.
## Length Class Mode
## 0 NULL NULL
summary(heart_diseases_Dataset$FrecC_Max)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 60.0 120.0 138.0 136.8 156.0 202.0
summary(heart_diseases_Dataset$Oldpeak)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## -26.000 0.000 1.000 5.383 8.000 62.000
table(heart_diseases_Dataset$Sexo)
##
## F M
## 193 724
prop.table(table(heart_diseases_Dataset$Sexo))
##
## F M
## 0.2104689 0.7895311
barplot(table(heart_diseases_Dataset$Sexo))
table(heart_diseases_Dataset$Tipo_dolor_pecho)
##
## angina atipica angina tipica asintomatico dolor no anginoso
## 173 46 496 202
prop.table(table(heart_diseases_Dataset$Tipo_dolor_pecho))
##
## angina atipica angina tipica asintomatico dolor no anginoso
## 0.18865867 0.05016358 0.54089422 0.22028353
barplot(table(heart_diseases_Dataset$Tipo_dolor_pecho))
table(heart_diseases_Dataset$ECG_reposo)
##
## LVH Normal ST
## 188 551 178
prop.table(table(heart_diseases_Dataset$ECG_reposo))
##
## LVH Normal ST
## 0.2050164 0.6008724 0.1941112
barplot(table(heart_diseases_Dataset$ECG_reposo))
table(heart_diseases_Dataset$Angina_Ejercicio)
##
## N Y
## 546 371
prop.table(table(heart_diseases_Dataset$Angina_Ejercicio))
##
## N Y
## 0.5954198 0.4045802
barplot(table(heart_diseases_Dataset$Angina_Ejercicio))
table(heart_diseases_Dataset$Pendi_Segme_ST_Ejercicio)
##
## ascendente descendente plano
## 395 63 459
prop.table(table(heart_diseases_Dataset$Pendi_Segme_ST_Ejercicio))
##
## ascendente descendente plano
## 0.43075245 0.06870229 0.50054526
barplot(table(heart_diseases_Dataset$Pendi_Segme_ST_Ejercicio))
table(heart_diseases_Dataset$Clase_salida)
##
## Enfermedad cardiaca Normal
## 507 410
prop.table(table(heart_diseases_Dataset$Clase_salida))
##
## Enfermedad cardiaca Normal
## 0.5528899 0.4471101
barplot(table(heart_diseases_Dataset$Clase_salida))
pairs(~Edad + PA_reposo + Colesterol + AZ_Ayunas + FrecC_Max + Oldpeak, data = heart_diseases_Dataset)
En base a la navegacion a traves de las pestaƱas muestra el resumen y la tabla ANOVA del modelo de regresion lineal multiple total y los coeficientes tanto del modelo mencionado anteriormente como el logrado luego de reducirlo. Con base en la exploracion de lo datos mencionados anteriormente y la tabla ANOVA del modelo total se formularan para comparaciones del modelo RLM: uno que incluye a todas las variables del conjunto de datos y se excluyeron las variables PA_reposo, Colesterol y AS_Ayunas .Se menciona de nuevo que FrecC_Max es la variable dependiente
Antes de continuar cabe reclacar que se hicieron las siguientes modificaciones en cuanto a las variables Cualitativas en donde se modifico su etiquetado por uno numerico: Sexo (0: M y 1: F), Tipo_dolor_pecho (1: angina tĆpica, 2: angina atĆpica, 3: dolor no anginoso y 4: asintomĆ”tico), ECG_reposo (1: Normal, 2: ST y 3: LVH), Angina_Ejercicio (0: N y 1: Y), Pendi_Segme_ST_Ejercicio (1: ascendente, 2: Plano y 3: descendente) y Clase_salida (0: Normal y 1: Enfermedad cardĆaca) el conjunto de datos se llamara Prediccion_Insuficiencia_cardiaca_Var_MOD.
Al considerar los resultados que se presentan en la pestaƱa de Coeficientes del Modelo RLM Total se puede establecer que el modelo de regresion linal multiple que relaciona a la variable de interes, las cuales se resumirian como: \(FRECM\) (FrecC_Max), \(ED\) (Edad), \(PAR\) (PA_reposo), \(COL\) (Colesterol), \(ASY\) (AS_Ayunas), \(OLD\) (Oldpeak), \(S_1\) (Sexo::1), \(T_2\) (Tipo_dolor_pecho::2) \(T_3\) (Tipo_dolor_pecho::3) \(T_4\) (Tipo_dolor_pecho::4), \(E_2\) (ECG_reposo::2), \(E_3\) (ECG_reposo::3), \(A_1\) (Angina_Ejercicio::1), \(P_2\) (Pendi_Segme_ST_Ejercicio::2), \(P_3\) (Pendi_Segme_ST_Ejercicio::3) y \(C_1\) (Clase_salida::1), tiene la formualcion (con unos coeficientes redondeados a 4 cifras decimales por tema de estetica)
\(FRECM = 184,9992-0,7925*ED-0,0054*PAR+0,0381*COL+0,0062*ASY+0,2071*OLD+3,2926*S_1-4,2267*T_2\) \(-4,2704*T_3-11,2141*T_4-1,3551*E_2+8,0578*E_3-6,9187*A_1-9,3213*P_2-5,7960*P_3-2,7596*C_1\) \((28)\)
Para este modelo se obvian las interpretaciones en que las variables fucen cero ya que por la naturaleza de alguna de estas carece de sentido y la interpretacion del intercepto si que tiene sentido ya que trabajamos con una frecuencia cardiaca aunque el valor que tomaria seria muy alto comparado con lo normal.
Por otro lado, luego de revisar el resumen estadistico y la tabal ANOVA del modelo RLM total (con nombre de pestaƱa homonimo a este), se puede establecer, con el apoyo de los resumenes estadisticos de las variables de estudio, que pueden excluirse directamente del modelo por baja significancia a las variables PA_reposo, Colesterol y AS_Ayunas. Esto implico que se calculase un modelo reducidocon la formulacion (Con base ne las mismas consideraciones de edicion del modelo total):
\(FRECM = 193,8626-0,8124*ED+0,2313*OLD+4,4319*S_1-3,5217*T_2-4,4422*T_3-11,2238*T_4\) \(-2,1197*E_2+9,3526*E_3-6,5243*A_1-8,990*P_2-6,2565*P_3-3.6201*C_1\) \((29)\)
summary(lm(heart_diseases_Dataset_VR_MOD$FrecC_Max~heart_diseases_Dataset_VR_MOD$Edad+heart_diseases_Dataset_VR_MOD$PA_reposo+heart_diseases_Dataset_VR_MOD$Colesterol+heart_diseases_Dataset_VR_MOD$AZ_Ayunas+heart_diseases_Dataset_VR_MOD$Oldpeak+as.factor(heart_diseases_Dataset_VR_MOD$Sexo)+as.factor(heart_diseases_Dataset_VR_MOD$Tipo_dolor_pecho)+as.factor(heart_diseases_Dataset_VR_MOD$ECG_reposo)+as.factor(heart_diseases_Dataset_VR_MOD$Angina_Ejercicio)+as.factor(heart_diseases_Dataset_VR_MOD$Pendi_Segme_ST_Ejercicio)+as.factor(heart_diseases_Dataset_VR_MOD$Clase_salida)))
##
## Call:
## lm(formula = heart_diseases_Dataset_VR_MOD$FrecC_Max ~ heart_diseases_Dataset_VR_MOD$Edad +
## heart_diseases_Dataset_VR_MOD$PA_reposo + heart_diseases_Dataset_VR_MOD$Colesterol +
## heart_diseases_Dataset_VR_MOD$AZ_Ayunas + heart_diseases_Dataset_VR_MOD$Oldpeak +
## as.factor(heart_diseases_Dataset_VR_MOD$Sexo) + as.factor(heart_diseases_Dataset_VR_MOD$Tipo_dolor_pecho) +
## as.factor(heart_diseases_Dataset_VR_MOD$ECG_reposo) + as.factor(heart_diseases_Dataset_VR_MOD$Angina_Ejercicio) +
## as.factor(heart_diseases_Dataset_VR_MOD$Pendi_Segme_ST_Ejercicio) +
## as.factor(heart_diseases_Dataset_VR_MOD$Clase_salida))
##
## Residuals:
## Min 1Q Median 3Q Max
## -71.435 -12.249 0.991 14.600 55.542
##
## Coefficients:
## Estimate
## (Intercept) 184.999165
## heart_diseases_Dataset_VR_MOD$Edad -0.792522
## heart_diseases_Dataset_VR_MOD$PA_reposo -0.005399
## heart_diseases_Dataset_VR_MOD$Colesterol 0.038062
## heart_diseases_Dataset_VR_MOD$AZ_Ayunas 0.006255
## heart_diseases_Dataset_VR_MOD$Oldpeak 0.207178
## as.factor(heart_diseases_Dataset_VR_MOD$Sexo)1 3.292589
## as.factor(heart_diseases_Dataset_VR_MOD$Tipo_dolor_pecho)2 -4.226743
## as.factor(heart_diseases_Dataset_VR_MOD$Tipo_dolor_pecho)3 -4.270412
## as.factor(heart_diseases_Dataset_VR_MOD$Tipo_dolor_pecho)4 -11.214059
## as.factor(heart_diseases_Dataset_VR_MOD$ECG_reposo)2 -1.355094
## as.factor(heart_diseases_Dataset_VR_MOD$ECG_reposo)3 8.057764
## as.factor(heart_diseases_Dataset_VR_MOD$Angina_Ejercicio)1 -6.918709
## as.factor(heart_diseases_Dataset_VR_MOD$Pendi_Segme_ST_Ejercicio)2 -9.321259
## as.factor(heart_diseases_Dataset_VR_MOD$Pendi_Segme_ST_Ejercicio)3 -5.795977
## as.factor(heart_diseases_Dataset_VR_MOD$Clase_salida)1 -2.759563
## Std. Error
## (Intercept) 6.988841
## heart_diseases_Dataset_VR_MOD$Edad 0.081304
## heart_diseases_Dataset_VR_MOD$PA_reposo 0.040041
## heart_diseases_Dataset_VR_MOD$Colesterol 0.008985
## heart_diseases_Dataset_VR_MOD$AZ_Ayunas 0.009161
## heart_diseases_Dataset_VR_MOD$Oldpeak 0.086784
## as.factor(heart_diseases_Dataset_VR_MOD$Sexo)1 1.792769
## as.factor(heart_diseases_Dataset_VR_MOD$Tipo_dolor_pecho)2 3.543471
## as.factor(heart_diseases_Dataset_VR_MOD$Tipo_dolor_pecho)3 3.410477
## as.factor(heart_diseases_Dataset_VR_MOD$Tipo_dolor_pecho)4 3.318489
## as.factor(heart_diseases_Dataset_VR_MOD$ECG_reposo)2 1.836158
## as.factor(heart_diseases_Dataset_VR_MOD$ECG_reposo)3 1.827431
## as.factor(heart_diseases_Dataset_VR_MOD$Angina_Ejercicio)1 1.723821
## as.factor(heart_diseases_Dataset_VR_MOD$Pendi_Segme_ST_Ejercicio)2 1.867817
## as.factor(heart_diseases_Dataset_VR_MOD$Pendi_Segme_ST_Ejercicio)3 3.163740
## as.factor(heart_diseases_Dataset_VR_MOD$Clase_salida)1 2.079388
## t value
## (Intercept) 26.471
## heart_diseases_Dataset_VR_MOD$Edad -9.748
## heart_diseases_Dataset_VR_MOD$PA_reposo -0.135
## heart_diseases_Dataset_VR_MOD$Colesterol 4.236
## heart_diseases_Dataset_VR_MOD$AZ_Ayunas 0.683
## heart_diseases_Dataset_VR_MOD$Oldpeak 2.387
## as.factor(heart_diseases_Dataset_VR_MOD$Sexo)1 1.837
## as.factor(heart_diseases_Dataset_VR_MOD$Tipo_dolor_pecho)2 -1.193
## as.factor(heart_diseases_Dataset_VR_MOD$Tipo_dolor_pecho)3 -1.252
## as.factor(heart_diseases_Dataset_VR_MOD$Tipo_dolor_pecho)4 -3.379
## as.factor(heart_diseases_Dataset_VR_MOD$ECG_reposo)2 -0.738
## as.factor(heart_diseases_Dataset_VR_MOD$ECG_reposo)3 4.409
## as.factor(heart_diseases_Dataset_VR_MOD$Angina_Ejercicio)1 -4.014
## as.factor(heart_diseases_Dataset_VR_MOD$Pendi_Segme_ST_Ejercicio)2 -4.990
## as.factor(heart_diseases_Dataset_VR_MOD$Pendi_Segme_ST_Ejercicio)3 -1.832
## as.factor(heart_diseases_Dataset_VR_MOD$Clase_salida)1 -1.327
## Pr(>|t|)
## (Intercept) < 2e-16 ***
## heart_diseases_Dataset_VR_MOD$Edad < 2e-16 ***
## heart_diseases_Dataset_VR_MOD$PA_reposo 0.892773
## heart_diseases_Dataset_VR_MOD$Colesterol 2.51e-05 ***
## heart_diseases_Dataset_VR_MOD$AZ_Ayunas 0.494876
## heart_diseases_Dataset_VR_MOD$Oldpeak 0.017179 *
## as.factor(heart_diseases_Dataset_VR_MOD$Sexo)1 0.066599 .
## as.factor(heart_diseases_Dataset_VR_MOD$Tipo_dolor_pecho)2 0.233252
## as.factor(heart_diseases_Dataset_VR_MOD$Tipo_dolor_pecho)3 0.210842
## as.factor(heart_diseases_Dataset_VR_MOD$Tipo_dolor_pecho)4 0.000758 ***
## as.factor(heart_diseases_Dataset_VR_MOD$ECG_reposo)2 0.460704
## as.factor(heart_diseases_Dataset_VR_MOD$ECG_reposo)3 1.16e-05 ***
## as.factor(heart_diseases_Dataset_VR_MOD$Angina_Ejercicio)1 6.48e-05 ***
## as.factor(heart_diseases_Dataset_VR_MOD$Pendi_Segme_ST_Ejercicio)2 7.23e-07 ***
## as.factor(heart_diseases_Dataset_VR_MOD$Pendi_Segme_ST_Ejercicio)3 0.067281 .
## as.factor(heart_diseases_Dataset_VR_MOD$Clase_salida)1 0.184811
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 20.64 on 901 degrees of freedom
## Multiple R-squared: 0.3537, Adjusted R-squared: 0.343
## F-statistic: 32.87 on 15 and 901 DF, p-value: < 2.2e-16
anova(lm(heart_diseases_Dataset_VR_MOD$FrecC_Max~heart_diseases_Dataset_VR_MOD$Edad+heart_diseases_Dataset_VR_MOD$PA_reposo+heart_diseases_Dataset_VR_MOD$Colesterol+heart_diseases_Dataset_VR_MOD$AZ_Ayunas+heart_diseases_Dataset_VR_MOD$Oldpeak+as.factor(heart_diseases_Dataset_VR_MOD$Sexo)+as.factor(heart_diseases_Dataset_VR_MOD$Tipo_dolor_pecho)+as.factor(heart_diseases_Dataset_VR_MOD$ECG_reposo)+as.factor(heart_diseases_Dataset_VR_MOD$Angina_Ejercicio)+as.factor(heart_diseases_Dataset_VR_MOD$Pendi_Segme_ST_Ejercicio)+as.factor(heart_diseases_Dataset_VR_MOD$Clase_salida)))
## Analysis of Variance Table
##
## Response: heart_diseases_Dataset_VR_MOD$FrecC_Max
## Df Sum Sq
## heart_diseases_Dataset_VR_MOD$Edad 1 86820
## heart_diseases_Dataset_VR_MOD$PA_reposo 1 53
## heart_diseases_Dataset_VR_MOD$Colesterol 1 24392
## heart_diseases_Dataset_VR_MOD$AZ_Ayunas 1 193
## heart_diseases_Dataset_VR_MOD$Oldpeak 1 0
## as.factor(heart_diseases_Dataset_VR_MOD$Sexo) 1 9686
## as.factor(heart_diseases_Dataset_VR_MOD$Tipo_dolor_pecho) 3 41729
## as.factor(heart_diseases_Dataset_VR_MOD$ECG_reposo) 2 11966
## as.factor(heart_diseases_Dataset_VR_MOD$Angina_Ejercicio) 1 17954
## as.factor(heart_diseases_Dataset_VR_MOD$Pendi_Segme_ST_Ejercicio) 2 16594
## as.factor(heart_diseases_Dataset_VR_MOD$Clase_salida) 1 751
## Residuals 901 383956
## Mean Sq
## heart_diseases_Dataset_VR_MOD$Edad 86820
## heart_diseases_Dataset_VR_MOD$PA_reposo 53
## heart_diseases_Dataset_VR_MOD$Colesterol 24392
## heart_diseases_Dataset_VR_MOD$AZ_Ayunas 193
## heart_diseases_Dataset_VR_MOD$Oldpeak 0
## as.factor(heart_diseases_Dataset_VR_MOD$Sexo) 9686
## as.factor(heart_diseases_Dataset_VR_MOD$Tipo_dolor_pecho) 13910
## as.factor(heart_diseases_Dataset_VR_MOD$ECG_reposo) 5983
## as.factor(heart_diseases_Dataset_VR_MOD$Angina_Ejercicio) 17954
## as.factor(heart_diseases_Dataset_VR_MOD$Pendi_Segme_ST_Ejercicio) 8297
## as.factor(heart_diseases_Dataset_VR_MOD$Clase_salida) 751
## Residuals 426
## F value
## heart_diseases_Dataset_VR_MOD$Edad 203.7327
## heart_diseases_Dataset_VR_MOD$PA_reposo 0.1246
## heart_diseases_Dataset_VR_MOD$Colesterol 57.2385
## heart_diseases_Dataset_VR_MOD$AZ_Ayunas 0.4539
## heart_diseases_Dataset_VR_MOD$Oldpeak 0.0006
## as.factor(heart_diseases_Dataset_VR_MOD$Sexo) 22.7302
## as.factor(heart_diseases_Dataset_VR_MOD$Tipo_dolor_pecho) 32.6407
## as.factor(heart_diseases_Dataset_VR_MOD$ECG_reposo) 14.0398
## as.factor(heart_diseases_Dataset_VR_MOD$Angina_Ejercicio) 42.1314
## as.factor(heart_diseases_Dataset_VR_MOD$Pendi_Segme_ST_Ejercicio) 19.4701
## as.factor(heart_diseases_Dataset_VR_MOD$Clase_salida) 1.7612
## Residuals
## Pr(>F)
## heart_diseases_Dataset_VR_MOD$Edad < 2.2e-16 ***
## heart_diseases_Dataset_VR_MOD$PA_reposo 0.7242
## heart_diseases_Dataset_VR_MOD$Colesterol 9.522e-14 ***
## heart_diseases_Dataset_VR_MOD$AZ_Ayunas 0.5006
## heart_diseases_Dataset_VR_MOD$Oldpeak 0.9799
## as.factor(heart_diseases_Dataset_VR_MOD$Sexo) 2.173e-06 ***
## as.factor(heart_diseases_Dataset_VR_MOD$Tipo_dolor_pecho) < 2.2e-16 ***
## as.factor(heart_diseases_Dataset_VR_MOD$ECG_reposo) 9.901e-07 ***
## as.factor(heart_diseases_Dataset_VR_MOD$Angina_Ejercicio) 1.407e-10 ***
## as.factor(heart_diseases_Dataset_VR_MOD$Pendi_Segme_ST_Ejercicio) 5.271e-09 ***
## as.factor(heart_diseases_Dataset_VR_MOD$Clase_salida) 0.1848
## Residuals
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
coefficients(lm(heart_diseases_Dataset_VR_MOD$FrecC_Max~heart_diseases_Dataset_VR_MOD$Edad+heart_diseases_Dataset_VR_MOD$PA_reposo+heart_diseases_Dataset_VR_MOD$Colesterol+heart_diseases_Dataset_VR_MOD$AZ_Ayunas+heart_diseases_Dataset_VR_MOD$Oldpeak+as.factor(heart_diseases_Dataset_VR_MOD$Sexo)+as.factor(heart_diseases_Dataset_VR_MOD$Tipo_dolor_pecho)+as.factor(heart_diseases_Dataset_VR_MOD$ECG_reposo)+as.factor(heart_diseases_Dataset_VR_MOD$Angina_Ejercicio)+as.factor(heart_diseases_Dataset_VR_MOD$Pendi_Segme_ST_Ejercicio)+as.factor(heart_diseases_Dataset_VR_MOD$Clase_salida)))
## (Intercept)
## 184.999164912
## heart_diseases_Dataset_VR_MOD$Edad
## -0.792522115
## heart_diseases_Dataset_VR_MOD$PA_reposo
## -0.005398864
## heart_diseases_Dataset_VR_MOD$Colesterol
## 0.038061776
## heart_diseases_Dataset_VR_MOD$AZ_Ayunas
## 0.006255459
## heart_diseases_Dataset_VR_MOD$Oldpeak
## 0.207177645
## as.factor(heart_diseases_Dataset_VR_MOD$Sexo)1
## 3.292588647
## as.factor(heart_diseases_Dataset_VR_MOD$Tipo_dolor_pecho)2
## -4.226743236
## as.factor(heart_diseases_Dataset_VR_MOD$Tipo_dolor_pecho)3
## -4.270412166
## as.factor(heart_diseases_Dataset_VR_MOD$Tipo_dolor_pecho)4
## -11.214058889
## as.factor(heart_diseases_Dataset_VR_MOD$ECG_reposo)2
## -1.355094124
## as.factor(heart_diseases_Dataset_VR_MOD$ECG_reposo)3
## 8.057764318
## as.factor(heart_diseases_Dataset_VR_MOD$Angina_Ejercicio)1
## -6.918709208
## as.factor(heart_diseases_Dataset_VR_MOD$Pendi_Segme_ST_Ejercicio)2
## -9.321259141
## as.factor(heart_diseases_Dataset_VR_MOD$Pendi_Segme_ST_Ejercicio)3
## -5.795977024
## as.factor(heart_diseases_Dataset_VR_MOD$Clase_salida)1
## -2.759563310
coefficients(lm(heart_diseases_Dataset_VR_MOD$FrecC_Max~heart_diseases_Dataset_VR_MOD$Edad+heart_diseases_Dataset_VR_MOD$Oldpeak+as.factor(heart_diseases_Dataset_VR_MOD$Sexo)+as.factor(heart_diseases_Dataset_VR_MOD$Tipo_dolor_pecho)+as.factor(heart_diseases_Dataset_VR_MOD$ECG_reposo)+as.factor(heart_diseases_Dataset_VR_MOD$Angina_Ejercicio)+as.factor(heart_diseases_Dataset_VR_MOD$Pendi_Segme_ST_Ejercicio)+as.factor(heart_diseases_Dataset_VR_MOD$Clase_salida)))
## (Intercept)
## 193.8625671
## heart_diseases_Dataset_VR_MOD$Edad
## -0.8124233
## heart_diseases_Dataset_VR_MOD$Oldpeak
## 0.2313500
## as.factor(heart_diseases_Dataset_VR_MOD$Sexo)1
## 4.4318673
## as.factor(heart_diseases_Dataset_VR_MOD$Tipo_dolor_pecho)2
## -3.5216920
## as.factor(heart_diseases_Dataset_VR_MOD$Tipo_dolor_pecho)3
## -4.4422221
## as.factor(heart_diseases_Dataset_VR_MOD$Tipo_dolor_pecho)4
## -11.2238106
## as.factor(heart_diseases_Dataset_VR_MOD$ECG_reposo)2
## -2.1196904
## as.factor(heart_diseases_Dataset_VR_MOD$ECG_reposo)3
## 9.3525525
## as.factor(heart_diseases_Dataset_VR_MOD$Angina_Ejercicio)1
## -6.5242607
## as.factor(heart_diseases_Dataset_VR_MOD$Pendi_Segme_ST_Ejercicio)2
## -8.9903956
## as.factor(heart_diseases_Dataset_VR_MOD$Pendi_Segme_ST_Ejercicio)3
## -6.2564802
## as.factor(heart_diseases_Dataset_VR_MOD$Clase_salida)1
## -3.6201479
En base a travez de la navegacion de pestañas, en primera parte Mejor Modelo Iterado según AIC muestra que la desicion de de que excluir dos variables (PA_reposo, y AS_Ayunas) de las tres propuestas tambien nos mustra que desidio excluir la variable Clase_salida y la cambio por Colesterol esto cabe recalcar que fue un cambio curioso si lo miramos lo que aporta la variable al modelo, tambien se debe mencionar que todo esto se hizo en la cuarta iteracion. Ademas el algoritmo tambien construyo un modelo basado en casi las mismas variables del modelo reducido lo cual fundamenta la inspeccion de las variables en la partes precedentes.
De manera complementaria, en la pestaƱa de Bondades de Ajuste, Significancias y Criterios de Informacion Comparados se presenta de manera paralela los modelos generados. La consideracion de todas las variables del cojunto de datos presento una bondad de ajuste con base en el coeficiente de determinacion multiple qeu solo se redujo hablando en terminos absolutos en \(0,013\) puntos (es decir se paso de explicar el \(35,4\) \(%\) de la variabilidad a un \(34,1\) \(%\)) en comparacion con el modelo reducido y el iterado; ademas, las significancias global e individuales de estos evidencias que ambos modelos son similares pero no iguales, tiene cierto grado de diferencia, aportan una cantidad significante de informacion relevante para la variable dependiente FrecC_Max, porque para los valores criticos obtenidos para las pruebas \(F\) (para la significancia glogal) y \(t\) (para las significancias individuales), los \(p-value\) en la mayoria de los casos resultaron siempre menores para cualquier nivel de significancia \(\alpha\) incluido dentro de los tradiciones commo por ejemplo, \(\alpha\ = 0,01\).
Por ultimo, los criterios de informacion AIC y BIC muestran efectivamente que los modelos son similares reducido e iterado la relacion entre el sesgo y la varianza en sus formulaciones respectivas, es decir, entre sus semejanzas y complejidades, resulta modelo total: \(AIC_{IteradoSTEP}=8168,475<8172,424=AIC_{RLMTotal}<8184,6238=AIC_{RLMReducido}\) y \(BIC_{IteradoSTEP}=8235,971<8252,133=BIC_{RLMReducido}<8254,383=BIC_{RLMTotal}\).
Y tambien demuestran que el modelo iterado por el metodo STEP tiene los valores mas bajos tanto en el AIC como de BIC en comparacion con el modelo total y reducido, es decir que le modelo iterado por el metod STEP proporcion un mejor ajuste de los datos.
modelo_Iterado_STEP = step(lm(heart_diseases_Dataset_VR_MOD$FrecC_Max~heart_diseases_Dataset_VR_MOD$Edad+heart_diseases_Dataset_VR_MOD$PA_reposo+heart_diseases_Dataset_VR_MOD$Colesterol+heart_diseases_Dataset_VR_MOD$AZ_Ayunas+heart_diseases_Dataset_VR_MOD$Oldpeak+as.factor(heart_diseases_Dataset_VR_MOD$Sexo)+as.factor(heart_diseases_Dataset_VR_MOD$Tipo_dolor_pecho)+as.factor(heart_diseases_Dataset_VR_MOD$ECG_reposo)+as.factor(heart_diseases_Dataset_VR_MOD$Angina_Ejercicio)+as.factor(heart_diseases_Dataset_VR_MOD$Pendi_Segme_ST_Ejercicio)+as.factor(heart_diseases_Dataset_VR_MOD$Clase_salida)))
## Start: AIC=5568.09
## heart_diseases_Dataset_VR_MOD$FrecC_Max ~ heart_diseases_Dataset_VR_MOD$Edad +
## heart_diseases_Dataset_VR_MOD$PA_reposo + heart_diseases_Dataset_VR_MOD$Colesterol +
## heart_diseases_Dataset_VR_MOD$AZ_Ayunas + heart_diseases_Dataset_VR_MOD$Oldpeak +
## as.factor(heart_diseases_Dataset_VR_MOD$Sexo) + as.factor(heart_diseases_Dataset_VR_MOD$Tipo_dolor_pecho) +
## as.factor(heart_diseases_Dataset_VR_MOD$ECG_reposo) + as.factor(heart_diseases_Dataset_VR_MOD$Angina_Ejercicio) +
## as.factor(heart_diseases_Dataset_VR_MOD$Pendi_Segme_ST_Ejercicio) +
## as.factor(heart_diseases_Dataset_VR_MOD$Clase_salida)
##
## Df
## - heart_diseases_Dataset_VR_MOD$PA_reposo 1
## - heart_diseases_Dataset_VR_MOD$AZ_Ayunas 1
## - as.factor(heart_diseases_Dataset_VR_MOD$Clase_salida) 1
## <none>
## - as.factor(heart_diseases_Dataset_VR_MOD$Sexo) 1
## - heart_diseases_Dataset_VR_MOD$Oldpeak 1
## - as.factor(heart_diseases_Dataset_VR_MOD$Angina_Ejercicio) 1
## - heart_diseases_Dataset_VR_MOD$Colesterol 1
## - as.factor(heart_diseases_Dataset_VR_MOD$Tipo_dolor_pecho) 3
## - as.factor(heart_diseases_Dataset_VR_MOD$ECG_reposo) 2
## - as.factor(heart_diseases_Dataset_VR_MOD$Pendi_Segme_ST_Ejercicio) 2
## - heart_diseases_Dataset_VR_MOD$Edad 1
## Sum of Sq
## - heart_diseases_Dataset_VR_MOD$PA_reposo 8
## - heart_diseases_Dataset_VR_MOD$AZ_Ayunas 199
## - as.factor(heart_diseases_Dataset_VR_MOD$Clase_salida) 751
## <none>
## - as.factor(heart_diseases_Dataset_VR_MOD$Sexo) 1437
## - heart_diseases_Dataset_VR_MOD$Oldpeak 2429
## - as.factor(heart_diseases_Dataset_VR_MOD$Angina_Ejercicio) 6865
## - heart_diseases_Dataset_VR_MOD$Colesterol 7648
## - as.factor(heart_diseases_Dataset_VR_MOD$Tipo_dolor_pecho) 9507
## - as.factor(heart_diseases_Dataset_VR_MOD$ECG_reposo) 9739
## - as.factor(heart_diseases_Dataset_VR_MOD$Pendi_Segme_ST_Ejercicio) 10682
## - heart_diseases_Dataset_VR_MOD$Edad 40491
## RSS
## - heart_diseases_Dataset_VR_MOD$PA_reposo 383964
## - heart_diseases_Dataset_VR_MOD$AZ_Ayunas 384155
## - as.factor(heart_diseases_Dataset_VR_MOD$Clase_salida) 384707
## <none> 383956
## - as.factor(heart_diseases_Dataset_VR_MOD$Sexo) 385394
## - heart_diseases_Dataset_VR_MOD$Oldpeak 386385
## - as.factor(heart_diseases_Dataset_VR_MOD$Angina_Ejercicio) 390821
## - heart_diseases_Dataset_VR_MOD$Colesterol 391604
## - as.factor(heart_diseases_Dataset_VR_MOD$Tipo_dolor_pecho) 393463
## - as.factor(heart_diseases_Dataset_VR_MOD$ECG_reposo) 393695
## - as.factor(heart_diseases_Dataset_VR_MOD$Pendi_Segme_ST_Ejercicio) 394638
## - heart_diseases_Dataset_VR_MOD$Edad 424447
## AIC
## - heart_diseases_Dataset_VR_MOD$PA_reposo 5566.1
## - heart_diseases_Dataset_VR_MOD$AZ_Ayunas 5566.6
## - as.factor(heart_diseases_Dataset_VR_MOD$Clase_salida) 5567.9
## <none> 5568.1
## - as.factor(heart_diseases_Dataset_VR_MOD$Sexo) 5569.5
## - heart_diseases_Dataset_VR_MOD$Oldpeak 5571.9
## - as.factor(heart_diseases_Dataset_VR_MOD$Angina_Ejercicio) 5582.3
## - heart_diseases_Dataset_VR_MOD$Colesterol 5584.2
## - as.factor(heart_diseases_Dataset_VR_MOD$Tipo_dolor_pecho) 5584.5
## - as.factor(heart_diseases_Dataset_VR_MOD$ECG_reposo) 5587.1
## - as.factor(heart_diseases_Dataset_VR_MOD$Pendi_Segme_ST_Ejercicio) 5589.3
## - heart_diseases_Dataset_VR_MOD$Edad 5658.0
##
## Step: AIC=5566.11
## heart_diseases_Dataset_VR_MOD$FrecC_Max ~ heart_diseases_Dataset_VR_MOD$Edad +
## heart_diseases_Dataset_VR_MOD$Colesterol + heart_diseases_Dataset_VR_MOD$AZ_Ayunas +
## heart_diseases_Dataset_VR_MOD$Oldpeak + as.factor(heart_diseases_Dataset_VR_MOD$Sexo) +
## as.factor(heart_diseases_Dataset_VR_MOD$Tipo_dolor_pecho) +
## as.factor(heart_diseases_Dataset_VR_MOD$ECG_reposo) + as.factor(heart_diseases_Dataset_VR_MOD$Angina_Ejercicio) +
## as.factor(heart_diseases_Dataset_VR_MOD$Pendi_Segme_ST_Ejercicio) +
## as.factor(heart_diseases_Dataset_VR_MOD$Clase_salida)
##
## Df
## - heart_diseases_Dataset_VR_MOD$AZ_Ayunas 1
## - as.factor(heart_diseases_Dataset_VR_MOD$Clase_salida) 1
## <none>
## - as.factor(heart_diseases_Dataset_VR_MOD$Sexo) 1
## - heart_diseases_Dataset_VR_MOD$Oldpeak 1
## - as.factor(heart_diseases_Dataset_VR_MOD$Angina_Ejercicio) 1
## - heart_diseases_Dataset_VR_MOD$Colesterol 1
## - as.factor(heart_diseases_Dataset_VR_MOD$Tipo_dolor_pecho) 3
## - as.factor(heart_diseases_Dataset_VR_MOD$ECG_reposo) 2
## - as.factor(heart_diseases_Dataset_VR_MOD$Pendi_Segme_ST_Ejercicio) 2
## - heart_diseases_Dataset_VR_MOD$Edad 1
## Sum of Sq
## - heart_diseases_Dataset_VR_MOD$AZ_Ayunas 195
## - as.factor(heart_diseases_Dataset_VR_MOD$Clase_salida) 754
## <none>
## - as.factor(heart_diseases_Dataset_VR_MOD$Sexo) 1436
## - heart_diseases_Dataset_VR_MOD$Oldpeak 2422
## - as.factor(heart_diseases_Dataset_VR_MOD$Angina_Ejercicio) 6979
## - heart_diseases_Dataset_VR_MOD$Colesterol 7682
## - as.factor(heart_diseases_Dataset_VR_MOD$Tipo_dolor_pecho) 9508
## - as.factor(heart_diseases_Dataset_VR_MOD$ECG_reposo) 9749
## - as.factor(heart_diseases_Dataset_VR_MOD$Pendi_Segme_ST_Ejercicio) 10686
## - heart_diseases_Dataset_VR_MOD$Edad 42783
## RSS
## - heart_diseases_Dataset_VR_MOD$AZ_Ayunas 384159
## - as.factor(heart_diseases_Dataset_VR_MOD$Clase_salida) 384717
## <none> 383964
## - as.factor(heart_diseases_Dataset_VR_MOD$Sexo) 385400
## - heart_diseases_Dataset_VR_MOD$Oldpeak 386386
## - as.factor(heart_diseases_Dataset_VR_MOD$Angina_Ejercicio) 390943
## - heart_diseases_Dataset_VR_MOD$Colesterol 391645
## - as.factor(heart_diseases_Dataset_VR_MOD$Tipo_dolor_pecho) 393472
## - as.factor(heart_diseases_Dataset_VR_MOD$ECG_reposo) 393713
## - as.factor(heart_diseases_Dataset_VR_MOD$Pendi_Segme_ST_Ejercicio) 394650
## - heart_diseases_Dataset_VR_MOD$Edad 426747
## AIC
## - heart_diseases_Dataset_VR_MOD$AZ_Ayunas 5564.6
## - as.factor(heart_diseases_Dataset_VR_MOD$Clase_salida) 5565.9
## <none> 5566.1
## - as.factor(heart_diseases_Dataset_VR_MOD$Sexo) 5567.5
## - heart_diseases_Dataset_VR_MOD$Oldpeak 5569.9
## - as.factor(heart_diseases_Dataset_VR_MOD$Angina_Ejercicio) 5580.6
## - heart_diseases_Dataset_VR_MOD$Colesterol 5582.3
## - as.factor(heart_diseases_Dataset_VR_MOD$Tipo_dolor_pecho) 5582.5
## - as.factor(heart_diseases_Dataset_VR_MOD$ECG_reposo) 5585.1
## - as.factor(heart_diseases_Dataset_VR_MOD$Pendi_Segme_ST_Ejercicio) 5587.3
## - heart_diseases_Dataset_VR_MOD$Edad 5661.0
##
## Step: AIC=5564.57
## heart_diseases_Dataset_VR_MOD$FrecC_Max ~ heart_diseases_Dataset_VR_MOD$Edad +
## heart_diseases_Dataset_VR_MOD$Colesterol + heart_diseases_Dataset_VR_MOD$Oldpeak +
## as.factor(heart_diseases_Dataset_VR_MOD$Sexo) + as.factor(heart_diseases_Dataset_VR_MOD$Tipo_dolor_pecho) +
## as.factor(heart_diseases_Dataset_VR_MOD$ECG_reposo) + as.factor(heart_diseases_Dataset_VR_MOD$Angina_Ejercicio) +
## as.factor(heart_diseases_Dataset_VR_MOD$Pendi_Segme_ST_Ejercicio) +
## as.factor(heart_diseases_Dataset_VR_MOD$Clase_salida)
##
## Df
## - as.factor(heart_diseases_Dataset_VR_MOD$Clase_salida) 1
## <none>
## - as.factor(heart_diseases_Dataset_VR_MOD$Sexo) 1
## - heart_diseases_Dataset_VR_MOD$Oldpeak 1
## - as.factor(heart_diseases_Dataset_VR_MOD$Angina_Ejercicio) 1
## - heart_diseases_Dataset_VR_MOD$Colesterol 1
## - as.factor(heart_diseases_Dataset_VR_MOD$Tipo_dolor_pecho) 3
## - as.factor(heart_diseases_Dataset_VR_MOD$ECG_reposo) 2
## - as.factor(heart_diseases_Dataset_VR_MOD$Pendi_Segme_ST_Ejercicio) 2
## - heart_diseases_Dataset_VR_MOD$Edad 1
## Sum of Sq
## - as.factor(heart_diseases_Dataset_VR_MOD$Clase_salida) 657
## <none>
## - as.factor(heart_diseases_Dataset_VR_MOD$Sexo) 1413
## - heart_diseases_Dataset_VR_MOD$Oldpeak 2426
## - as.factor(heart_diseases_Dataset_VR_MOD$Angina_Ejercicio) 7268
## - heart_diseases_Dataset_VR_MOD$Colesterol 7500
## - as.factor(heart_diseases_Dataset_VR_MOD$Tipo_dolor_pecho) 9507
## - as.factor(heart_diseases_Dataset_VR_MOD$ECG_reposo) 9640
## - as.factor(heart_diseases_Dataset_VR_MOD$Pendi_Segme_ST_Ejercicio) 10714
## - heart_diseases_Dataset_VR_MOD$Edad 42629
## RSS
## - as.factor(heart_diseases_Dataset_VR_MOD$Clase_salida) 384816
## <none> 384159
## - as.factor(heart_diseases_Dataset_VR_MOD$Sexo) 385572
## - heart_diseases_Dataset_VR_MOD$Oldpeak 386585
## - as.factor(heart_diseases_Dataset_VR_MOD$Angina_Ejercicio) 391427
## - heart_diseases_Dataset_VR_MOD$Colesterol 391659
## - as.factor(heart_diseases_Dataset_VR_MOD$Tipo_dolor_pecho) 393666
## - as.factor(heart_diseases_Dataset_VR_MOD$ECG_reposo) 393799
## - as.factor(heart_diseases_Dataset_VR_MOD$Pendi_Segme_ST_Ejercicio) 394873
## - heart_diseases_Dataset_VR_MOD$Edad 426788
## AIC
## - as.factor(heart_diseases_Dataset_VR_MOD$Clase_salida) 5564.1
## <none> 5564.6
## - as.factor(heart_diseases_Dataset_VR_MOD$Sexo) 5565.9
## - heart_diseases_Dataset_VR_MOD$Oldpeak 5568.3
## - as.factor(heart_diseases_Dataset_VR_MOD$Angina_Ejercicio) 5579.8
## - heart_diseases_Dataset_VR_MOD$Colesterol 5580.3
## - as.factor(heart_diseases_Dataset_VR_MOD$Tipo_dolor_pecho) 5581.0
## - as.factor(heart_diseases_Dataset_VR_MOD$ECG_reposo) 5583.3
## - as.factor(heart_diseases_Dataset_VR_MOD$Pendi_Segme_ST_Ejercicio) 5585.8
## - heart_diseases_Dataset_VR_MOD$Edad 5659.1
##
## Step: AIC=5564.14
## heart_diseases_Dataset_VR_MOD$FrecC_Max ~ heart_diseases_Dataset_VR_MOD$Edad +
## heart_diseases_Dataset_VR_MOD$Colesterol + heart_diseases_Dataset_VR_MOD$Oldpeak +
## as.factor(heart_diseases_Dataset_VR_MOD$Sexo) + as.factor(heart_diseases_Dataset_VR_MOD$Tipo_dolor_pecho) +
## as.factor(heart_diseases_Dataset_VR_MOD$ECG_reposo) + as.factor(heart_diseases_Dataset_VR_MOD$Angina_Ejercicio) +
## as.factor(heart_diseases_Dataset_VR_MOD$Pendi_Segme_ST_Ejercicio)
##
## Df
## <none>
## - as.factor(heart_diseases_Dataset_VR_MOD$Sexo) 1
## - heart_diseases_Dataset_VR_MOD$Oldpeak 1
## - heart_diseases_Dataset_VR_MOD$Colesterol 1
## - as.factor(heart_diseases_Dataset_VR_MOD$Angina_Ejercicio) 1
## - as.factor(heart_diseases_Dataset_VR_MOD$ECG_reposo) 2
## - as.factor(heart_diseases_Dataset_VR_MOD$Tipo_dolor_pecho) 3
## - as.factor(heart_diseases_Dataset_VR_MOD$Pendi_Segme_ST_Ejercicio) 2
## - heart_diseases_Dataset_VR_MOD$Edad 1
## Sum of Sq
## <none>
## - as.factor(heart_diseases_Dataset_VR_MOD$Sexo) 1904
## - heart_diseases_Dataset_VR_MOD$Oldpeak 2192
## - heart_diseases_Dataset_VR_MOD$Colesterol 8186
## - as.factor(heart_diseases_Dataset_VR_MOD$Angina_Ejercicio) 8293
## - as.factor(heart_diseases_Dataset_VR_MOD$ECG_reposo) 9659
## - as.factor(heart_diseases_Dataset_VR_MOD$Tipo_dolor_pecho) 12145
## - as.factor(heart_diseases_Dataset_VR_MOD$Pendi_Segme_ST_Ejercicio) 16515
## - heart_diseases_Dataset_VR_MOD$Edad 44153
## RSS
## <none> 384816
## - as.factor(heart_diseases_Dataset_VR_MOD$Sexo) 386720
## - heart_diseases_Dataset_VR_MOD$Oldpeak 387008
## - heart_diseases_Dataset_VR_MOD$Colesterol 393002
## - as.factor(heart_diseases_Dataset_VR_MOD$Angina_Ejercicio) 393110
## - as.factor(heart_diseases_Dataset_VR_MOD$ECG_reposo) 394475
## - as.factor(heart_diseases_Dataset_VR_MOD$Tipo_dolor_pecho) 396961
## - as.factor(heart_diseases_Dataset_VR_MOD$Pendi_Segme_ST_Ejercicio) 401332
## - heart_diseases_Dataset_VR_MOD$Edad 428969
## AIC
## <none> 5564.1
## - as.factor(heart_diseases_Dataset_VR_MOD$Sexo) 5566.7
## - heart_diseases_Dataset_VR_MOD$Oldpeak 5567.3
## - heart_diseases_Dataset_VR_MOD$Colesterol 5581.4
## - as.factor(heart_diseases_Dataset_VR_MOD$Angina_Ejercicio) 5581.7
## - as.factor(heart_diseases_Dataset_VR_MOD$ECG_reposo) 5582.9
## - as.factor(heart_diseases_Dataset_VR_MOD$Tipo_dolor_pecho) 5586.6
## - as.factor(heart_diseases_Dataset_VR_MOD$Pendi_Segme_ST_Ejercicio) 5598.7
## - heart_diseases_Dataset_VR_MOD$Edad 5661.7
coefficients(modelo_Iterado_STEP)
## (Intercept)
## 184.92620045
## heart_diseases_Dataset_VR_MOD$Edad
## -0.79953564
## heart_diseases_Dataset_VR_MOD$Colesterol
## 0.03858603
## heart_diseases_Dataset_VR_MOD$Oldpeak
## 0.19561423
## as.factor(heart_diseases_Dataset_VR_MOD$Sexo)1
## 3.71107944
## as.factor(heart_diseases_Dataset_VR_MOD$Tipo_dolor_pecho)2
## -4.13451811
## as.factor(heart_diseases_Dataset_VR_MOD$Tipo_dolor_pecho)3
## -4.23820806
## as.factor(heart_diseases_Dataset_VR_MOD$Tipo_dolor_pecho)4
## -11.78892978
## as.factor(heart_diseases_Dataset_VR_MOD$ECG_reposo)2
## -1.32079476
## as.factor(heart_diseases_Dataset_VR_MOD$ECG_reposo)3
## 8.02554534
## as.factor(heart_diseases_Dataset_VR_MOD$Angina_Ejercicio)1
## -7.41921884
## as.factor(heart_diseases_Dataset_VR_MOD$Pendi_Segme_ST_Ejercicio)2
## -10.36377817
## as.factor(heart_diseases_Dataset_VR_MOD$Pendi_Segme_ST_Ejercicio)3
## -6.37187993
modelo_RLM_TOTAL = lm(heart_diseases_Dataset_VR_MOD$FrecC_Max~heart_diseases_Dataset_VR_MOD$Edad+heart_diseases_Dataset_VR_MOD$PA_reposo+heart_diseases_Dataset_VR_MOD$Colesterol+heart_diseases_Dataset_VR_MOD$AZ_Ayunas+heart_diseases_Dataset_VR_MOD$Oldpeak+as.factor(heart_diseases_Dataset_VR_MOD$Sexo)+as.factor(heart_diseases_Dataset_VR_MOD$Tipo_dolor_pecho)+as.factor(heart_diseases_Dataset_VR_MOD$ECG_reposo)+as.factor(heart_diseases_Dataset_VR_MOD$Angina_Ejercicio)+as.factor(heart_diseases_Dataset_VR_MOD$Pendi_Segme_ST_Ejercicio)+as.factor(heart_diseases_Dataset_VR_MOD$Clase_salida))
modelo_RLM_REDUCIDO = lm(heart_diseases_Dataset_VR_MOD$FrecC_Max~heart_diseases_Dataset_VR_MOD$Edad+heart_diseases_Dataset_VR_MOD$Oldpeak+as.factor(heart_diseases_Dataset_VR_MOD$Sexo)+as.factor(heart_diseases_Dataset_VR_MOD$Tipo_dolor_pecho)+as.factor(heart_diseases_Dataset_VR_MOD$ECG_reposo)+as.factor(heart_diseases_Dataset_VR_MOD$Angina_Ejercicio)+as.factor(heart_diseases_Dataset_VR_MOD$Pendi_Segme_ST_Ejercicio)+as.factor(heart_diseases_Dataset_VR_MOD$Clase_salida))
stargazer(modelo_RLM_TOTAL, modelo_RLM_REDUCIDO, modelo_Iterado_STEP, type = "text", df = TRUE)
##
## =====================================================================================================
## Dependent variable:
## --------------------------------------------------------------------------
## FrecC_Max
## (1) (2) (3)
## -----------------------------------------------------------------------------------------------------
## Edad -0.793*** -0.812*** -0.800***
## (0.081) (0.079) (0.079)
##
## PA_reposo -0.005
## (0.040)
##
## Colesterol 0.038*** 0.039***
## (0.009) (0.009)
##
## AZ_Ayunas 0.006
## (0.009)
##
## Oldpeak 0.207** 0.231*** 0.196**
## (0.087) (0.087) (0.086)
##
## Sexo)1 3.293* 4.432** 3.711**
## (1.793) (1.785) (1.755)
##
## Tipo_dolor_pecho)2 -4.227 -3.522 -4.135
## (3.543) (3.564) (3.535)
##
## Tipo_dolor_pecho)3 -4.270 -4.442 -4.238
## (3.410) (3.432) (3.400)
##
## Tipo_dolor_pecho)4 -11.214*** -11.224*** -11.789***
## (3.318) (3.338) (3.281)
##
## ECG_reposo)2 -1.355 -2.120 -1.321
## (1.836) (1.832) (1.827)
##
## ECG_reposo)3 8.058*** 9.353*** 8.026***
## (1.827) (1.815) (1.826)
##
## Angina_Ejercicio)1 -6.919*** -6.524*** -7.419***
## (1.724) (1.717) (1.681)
##
## Pendi_Segme_ST_Ejercicio)2 -9.321*** -8.990*** -10.364***
## (1.868) (1.882) (1.670)
##
## Pendi_Segme_ST_Ejercicio)3 -5.796* -6.256** -6.372**
## (3.164) (3.179) (3.105)
##
## Clase_salida)1 -2.760 -3.620*
## (2.079) (2.056)
##
## Constant 184.999*** 193.863*** 184.926***
## (6.989) (5.172) (5.525)
##
## -----------------------------------------------------------------------------------------------------
## Observations 917 917 917
## R2 0.354 0.341 0.352
## Adjusted R2 0.343 0.332 0.344
## Residual Std. Error 20.643 (df = 901) 20.815 (df = 904) 20.632 (df = 904)
## F Statistic 32.874*** (df = 15; 901) 38.937*** (df = 12; 904) 40.969*** (df = 12; 904)
## =====================================================================================================
## Note: *p<0.1; **p<0.05; ***p<0.01
AIC(modelo_RLM_TOTAL, modelo_RLM_REDUCIDO, modelo_Iterado_STEP)
## df AIC
## modelo_RLM_TOTAL 17 8172.424
## modelo_RLM_REDUCIDO 14 8184.638
## modelo_Iterado_STEP 14 8168.475
BIC(modelo_RLM_TOTAL, modelo_RLM_REDUCIDO, modelo_Iterado_STEP)
## df BIC
## modelo_RLM_TOTAL 17 8254.383
## modelo_RLM_REDUCIDO 14 8252.133
## modelo_Iterado_STEP 14 8235.971
Este modelo, eventualmente llamado RLogS, difiere del modelo de regresión lineal simple al relacionar una variable categórica dicotómica (con valores posibles \(1\) (éxito) y \(0\) (fracaso)) dependiente \(y\) con el valor de probabilidad \(p(x)\in [0, 1]\) que depende de alguna variable cuantitativa \(x\).
Como se mencionó en la sección 1, los modelos de regresión usados en este estudio pueden ser vistos como casos particulares del Modelo Lineal Generalizado (GLM). Este modelo extiende el modelo lineal general al relacionar la variable dependiente linealmente con sus factores y covariables a travĆ©s de alguna función de enlace, permitiendo que la variable dependiente tenga una distribución diferente a la normal. AdemĆ”s de los modelos usados en este estudio, el GLM tambiĆ©n cubre modelos loglineales para datos de recuento, modelos log-log complementarios para datos de supervivencia censurados por intervalos, y otros modelos estadĆsticos a travĆ©s de la formulación general del modelo.
Como el GLM permite especificar distribuciones diferentes a la normal y una función de enlace diferente a la identidad, se pueden trabajar con muchas combinaciones posibles de distribuciones y funciones de enlace, varias de las cuales pueden ser adecuadas para un conjunto de datos en particular. La elección de la combinación estarÔ orientada por consideraciones teóricas a priori, la naturaleza de las variables, la experiencia del investigador y los resultados al comparar combinaciones.
En este caso, se trabajarÔ con una distribución binomial (adecuada para variables que representan una respuesta binaria) con función de enlace logit:
\[\pi(x)=\dfrac{e^{\beta_0+\beta_1 x}}{1+ e^{\beta_0 +\beta_1 x}}= \dfrac{1}{1+ e^{-(\beta_0+\beta_1 x)}}\hspace{10mm}(30)\]
Este enfoque, conocido como regresión logĆstica binaria, es apropiado para la distribución binomial. El tĆ©rmino ālogĆsticoā se refiere a que la función de enlace constituye un refinamiento del modelo exponencial de crecimiento, descrito por la función sigmoidea, de una magnitud asociada con un conjunto \(C\).
Para facilitar las interpretaciones, la función de enlace \(\pi(x)\) proviene de una razón de probabilidades (conocida en inglĆ©s como ODDS ratio (OR)), que a su vez es el argumento de un logaritmo: \(\log\left(\frac{\pi(x)}{1-\pi(x)}\right)\). AsĆ, se modela la probabilidad de que la variable de respuesta pertenezca al nivel de referencia \(1\) en función del valor de los predictores. La transformación conserva la monotonicidad de sentidos y convierte el intervalo de probabilidad \([0,1]\) a \((-\infty,\infty)\).
Las propiedades entre las probabilidades complementarias de éxito y fracaso, sus razones y la función de enlace logit son:
| \(p(Ʃxito)=p(fracaso)\) | \(OR=1\) | \(Logit\left(OR\right)=0\) |
| \(p(Ʃxito)<p(fracaso)\) | \(OR<1\) | \(Logit\left(OR\right)<0\) |
| \(p(Ʃxito)>p(fracaso)\) | \(OR>1\) | \(Logit\left(OR\right)>0\) |
Es importante tener en cuenta que la transformación Logit carece de sentido para la certeza del éxito o del fracaso.
Plantemiento del problema
Tomando como base el conjunto de datos descrito en la fase 2 se formulara un modelo de regresion logistica simple para estudiar la relacion logistica supuesta entre las variables definidas por campos: FrecC_Max (variable independiente) y Clase_salida (varaible dependiente), con base en una distribucion binomial y la funcion de enlace \(Logit\).
Desarrollo del AnƔlisis
En el siguiente desarrollo del anƔlisis se hara en R Stutio y este mismo contara con varias secciones que se presentaran a continuacion.
En base a la navegacion de las pestaƱas se muestra el resumen estadistico de la variable independiente FrecC_Max, se presenta su bloxpot e histograma. De la variable dependiente Clase_salida se mostrara su diagrama de barras, asi como su media y mediana. Ademas, se exhibira un diagrama de Cajas conjunto entre aquellas variables que mencionamos.
En base en la pestaƱa Resumen y Bloxplot de FrecC_Max se puede comentar que la variable FrecC_Max como se menciono en la seccion 4.2.1. presenta un sesgo mas simetrico dado que su media y mediana se encuentran en valores extremadamente cercanas entre si lo cual nos indica que no muestra valores atipicos. Lo anterior mencionado tambien es contable a traves de la pestaƱa Histograma de FrecC_Mac.
Continuando, segun la pestaƱa Resumen y Diagrama de Barras de Clase_salida la variable cualitativa::nominal Clase_salida muestra una mayor proporcionalidad para los casos 1 (Enfermedad Caridiaca), que para los caso 0 (Normal): \(55,29\) \(%\) y \(44,71\) \(%\), repespectivamente.
Complementariamente, el Resumen y el Diagrama de Cajas Conjunto muestran que las observaciones son consistentes con el contexto del problema. Es decir, para los casos con Clase_salida = 0 (Normal), los valores de FrecC_Max son mayores en comparación con los casos con Clase_salida = 1 (Enfermedad Cardiaca). AdemĆ”s, ambos grupos muestran sesgo, aunque la asimetrĆa negativa es mĆ”s notoria para el grupo con Clase_salida = 1.
En cuanto a la dispersión, se observan diferencias opuestas entre los grupos: el grupo con Clase_salida = 0 muestra una mayor dispersión en el rango intercuartĆlico hacia la mitad superior de los datos, mientras que el grupo con Clase_salida = 1 muestra una dispersión mĆ”s centrada pero con ligera asimetrĆa negativa. Los atĆpicos en ambos grupos se presentan en los extremos inferiores de las distribuciones, sugiriendo que los valores bajos de FrecC_Max son mĆ”s extraƱos.
summary(heart_diseases_Dataset_VR_MOD$FrecC_Max)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 60.0 120.0 138.0 136.8 156.0 202.0
boxplot(heart_diseases_Dataset_VR_MOD$FrecC_Max, main = "Diagrama de Caja de FrecC_Max", col = c("orange"))
summary(heart_diseases_Dataset_VR_MOD$FrecC_Max)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 60.0 120.0 138.0 136.8 156.0 202.0
hist(heart_diseases_Dataset_VR_MOD$FrecC_Max, main = "Histograma de FrecC_Max", col = c("gold"))
table(heart_diseases_Dataset_VR_MOD$Clase_salida)
##
## 0 1
## 410 507
prop.table(table(heart_diseases_Dataset_VR_MOD$Clase_salida))
##
## 0 1
## 0.4471101 0.5528899
barplot(table(heart_diseases_Dataset_VR_MOD$Clase_salida))
tapply(heart_diseases_Dataset_VR_MOD$FrecC_Max, heart_diseases_Dataset_VR_MOD$Clase_salida, mean)
## 0 1
## 148.1512 127.6016
tapply(heart_diseases_Dataset_VR_MOD$FrecC_Max, heart_diseases_Dataset_VR_MOD$Clase_salida, median)
## 0 1
## 150 126
boxplot(heart_diseases_Dataset_VR_MOD$FrecC_Max~heart_diseases_Dataset_VR_MOD$Clase_salida, main = "Boxplot Conjunto: FrecC_MAx - Clase_salida", col = c("orange", "gold"))
En base a la navegacion a traves de pestaƱas se muestran los coeficientes del modelo RLogS y su resumen estadistico. Se menciona de nuevo las variables que son de interes: FrecC_Max (Variable independiente) y Clase_salida (Variable dependiente).
La pestaña Coeficientes del Modelo RLogS nos permite establecer que el modelo RLogS selcciona a \(\pi(x)\) con \(x\) a través de la función de enlace \(Logit\) de la siguiente manera:\[\frac{\pi(x)}{1-\pi(x)}=e^{5,34123645-0,03714453\cdot x}\hspace{10mm}(31)\]
De la misma forma, la pestaƱa Resumen Estadistico del Modelo RLogS muestra para efectos de comparacion, los resumenes del modelo estuadiado y uno alternativo tomando como base la variable cualitativa::nominal Angina_Ejercicio. Con base en el criterio de informacion que nos proporciona el Akaike (AIC por sus siglas en ingles), del cual se sabe que es una medida de bondad de ajuste de un modelo estadistico que describe la relacion entre el sesgo y la varianza en la formulacion del modelo, es decir, entre su exatitud y complejidad, se verifica que en base a los resultados podemos verificar que el mejor modelo es con la variable Clase_salida que con la variable Angina_Ejercicio por una diferencia muy corta, porque: \(AIC_C = 1105,2 < 1108,7 = AIC_A\). Tambien, para apoyar que el modelo basado en la variable Clase_salida es mejor que el modelo basado en la variable Angina_Ejercicio, el cociente entre la desviacion nula (Null Deviance) y la desviacion recidual (Residual Desviance), observable en la pestaƱa Resumen Estadistico del Modelo RLogS, es un poco mayor en el modelo propuesto que en el de comparacion.
modelo_RLog_Simple = glm(heart_diseases_Dataset_VR_MOD$Clase_salida~heart_diseases_Dataset_VR_MOD$FrecC_Max, family = "binomial", data = data.frame(heart_diseases_Dataset_VR_MOD$Clase_salida, heart_diseases_Dataset_VR_MOD$FrecC_Max))
coef(modelo_RLog_Simple)
## (Intercept) heart_diseases_Dataset_VR_MOD$FrecC_Max
## 5.34123645 -0.03714453
summary(modelo_RLog_Simple)
##
## Call:
## glm(formula = heart_diseases_Dataset_VR_MOD$Clase_salida ~ heart_diseases_Dataset_VR_MOD$FrecC_Max,
## family = "binomial", data = data.frame(heart_diseases_Dataset_VR_MOD$Clase_salida,
## heart_diseases_Dataset_VR_MOD$FrecC_Max))
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) 5.341236 0.461831 11.56 <2e-16
## heart_diseases_Dataset_VR_MOD$FrecC_Max -0.037145 0.003277 -11.34 <2e-16
##
## (Intercept) ***
## heart_diseases_Dataset_VR_MOD$FrecC_Max ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for binomial family taken to be 1)
##
## Null deviance: 1261.0 on 916 degrees of freedom
## Residual deviance: 1101.2 on 915 degrees of freedom
## AIC: 1105.2
##
## Number of Fisher Scoring iterations: 3
modelo_RLog_Simple_AN = glm(heart_diseases_Dataset_VR_MOD$Angina_Ejercicio~heart_diseases_Dataset_VR_MOD$FrecC_Max, family = "binomial", data = data.frame(heart_diseases_Dataset_VR_MOD$Angina_Ejercicio, heart_diseases_Dataset_VR_MOD$FrecC_Max))
summary(modelo_RLog_Simple_AN)
##
## Call:
## glm(formula = heart_diseases_Dataset_VR_MOD$Angina_Ejercicio ~
## heart_diseases_Dataset_VR_MOD$FrecC_Max, family = "binomial",
## data = data.frame(heart_diseases_Dataset_VR_MOD$Angina_Ejercicio,
## heart_diseases_Dataset_VR_MOD$FrecC_Max))
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) 4.127853 0.430926 9.579 <2e-16
## heart_diseases_Dataset_VR_MOD$FrecC_Max -0.033427 0.003178 -10.518 <2e-16
##
## (Intercept) ***
## heart_diseases_Dataset_VR_MOD$FrecC_Max ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for binomial family taken to be 1)
##
## Null deviance: 1237.6 on 916 degrees of freedom
## Residual deviance: 1104.7 on 915 degrees of freedom
## AIC: 1108.7
##
## Number of Fisher Scoring iterations: 4
En base a pestaƱas se motraran los resultados de algunas predicciones obtenidas a traves del modelo RLogS para identificar en sus respuestas la correspondencia de sentido en las razones de probabilidades ODDS a favor o en contra del evento considerando: \(\frac{\pi}{1-\pi}\) y \(\frac{1-\pi}{\pi}\), respectivamente. Se menciona de nuevo que las variables de interes son FrecC_Max (variable independiente) y Clase_salida (varaible dependiente).
La pestaƱa Variable Predictora igual a Cero plantea dos situaciones interpretativas. La primera nos permite comprender el coeficiente del factor en el cual esta presente la variable predictora, y una probabilidad cercana a cero de que un caso sea favorable pero dado el contexto de la variable predictora esta es imposible que se torne cero por lo tanto carece de sentido, la segunda situacion conlleva una interpretacion mas delicada: como la variable **FrecC_Max se mide en el intervalo \([60 , 202]\) una medida de unidad razonable para el aumento seria de una unidad ejemplo: pasar de \(99\) ppm a \(100\) ppm implicando un aumanto de una unidad de medida. Asi, se entiende que el cociente de probabilidades en relacion con la variable predictora en le modelo RLogS refleja un incremento acumulado de \(\approx 0,9635\) veces desde \(60\) hasta \(202\) con incrementos de \(1\).
Con base en lo anterior, a traves de la pestaƱa Probabilidades Estimadas se puede apreciar entre los registros \(422\) y \(540\) un delta de cambio absoluto igual a \(0,0156032\) (equivalente a un icremento relativo del \(\approx 2,21\) \(%\)) al incrementar la variable predictora en una unidad como se definio en el parrafo anterior.
Por ultimo, el grafico de curva logistica, en la pestaƱa Grafica del modelo RLogS, nos permite visualizar y comprender el comportamiento de las variables involucradas en el modelo propuesto; es decir, los casos favorables en relacion con la variable Clase_salida presenta una menor probabilidad a medida de que la FrecC_Max es mayor.
coef(modelo_RLog_Simple)
## (Intercept) heart_diseases_Dataset_VR_MOD$FrecC_Max
## 5.34123645 -0.03714453
round(exp(coef(modelo_RLog_Simple)),6)
## (Intercept) heart_diseases_Dataset_VR_MOD$FrecC_Max
## 208.770686 0.963537
predict(modelo_RLog_Simple, data.frame(seq(1, 917)), type = "response")
## 1 2 3 4 5 6 7 8
## 0.2596818 0.3885739 0.8456747 0.7907789 0.6920250 0.2742164 0.2742164 0.5166720
## 9 10 11 12 13 14 15 16
## 0.6253800 0.7076282 0.5166720 0.8407645 0.4888216 0.5351922 0.5627758 0.4426427
## 17 18 19 20 21 22 23 24
## 0.3047550 0.3126817 0.6677819 0.3539117 0.5166720 0.5166720 0.3207195 0.4426427
## 25 26 27 28 29 30 31 32
## 0.5536158 0.2191733 0.7651363 0.7227576 0.6511006 0.4888216 0.6253800 0.7515245
## 33 34 35 36 37 38 39 40
## 0.6920250 0.6253800 0.4063629 0.3974345 0.8918387 0.5166720 0.4610405 0.6253800
## 41 42 43 44 45 46 47 48
## 0.6253800 0.8357285 0.2892468 0.2742164 0.7076282 0.7076282 0.2892468 0.2742164
## 49 50 51 52 53 54 55 56
## 0.1834183 0.2742164 0.6998845 0.8456747 0.6920250 0.4426427 0.5351922 0.2742164
## 57 58 59 60 61 62 63 64
## 0.4153536 0.5351922 0.5899767 0.8551231 0.2456567 0.2388387 0.4981059 0.6677819
## 65 66 67 68 69 70 71 72
## 0.4888216 0.6253800 0.4981059 0.1834183 0.9084941 0.2742164 0.4888216 0.5809622
## 73 74 75 76 77 78 79 80
## 0.4426427 0.7445237 0.6426159 0.7373946 0.6253800 0.4426427 0.5536158 0.2742164
## 81 82 83 84 85 86 87 88
## 0.3539117 0.4063629 0.7445237 0.3126817 0.6677819 0.8640860 0.7651363 0.5166720
## 89 90 91 92 93 94 95 96
## 0.3974345 0.7782225 0.3539117 0.5351922 0.4610405 0.8725771 0.2067252 0.5351922
## 97 98 99 100 101 102 103 104
## 0.5536158 0.3539117 0.5351922 0.4981059 0.7445237 0.8357285 0.6253800 0.4244010
## 105 106 107 108 109 110 111 112
## 0.6759704 0.5351922 0.7782225 0.2892468 0.5809622 0.8028046 0.6759704 0.8725771
## 113 114 115 116 117 118 119 120
## 0.6677819 0.4426427 0.5809622 0.4426427 0.2742164 0.6253800 0.1779202 0.2067252
## 121 122 123 124 125 126 127 128
## 0.2742164 0.5444192 0.5351922 0.7782225 0.4426427 0.7782225 0.1523581 0.2388387
## 129 130 131 132 133 134 135 136
## 0.5351922 0.4244010 0.6253800 0.4426427 0.6920250 0.6759704 0.7076282 0.2388387
## 137 138 139 140 141 142 143 144
## 0.2388387 0.4795451 0.7227576 0.6253800 0.8640860 0.6677819 0.3710769 0.3974345
## 145 146 147 148 149 150 151 152
## 0.4426427 0.6078200 0.3974345 0.2321517 0.3539117 0.6677819 0.7076282 0.8357285
## 153 154 155 156 157 158 159 160
## 0.4426427 0.5351922 0.3539117 0.4426427 0.4426427 0.6253800 0.8357285 0.6253800
## 161 162 163 164 165 166 167 168
## 0.7152534 0.8551231 0.2456567 0.4426427 0.5351922 0.2388387 0.5351922 0.7227576
## 169 170 171 172 173 174 175 176
## 0.8357285 0.3539117 0.3539117 0.1622018 0.3371149 0.2596818 0.5899767 0.5809622
## 177 178 179 180 181 182 183 184
## 0.8086188 0.4426427 0.4426427 0.8806110 0.7076282 0.4426427 0.6759704 0.5351922
## 185 186 187 188 189 190 191 192
## 0.6253800 0.8725771 0.7782225 0.5536158 0.7782225 0.7076282 0.7076282 0.7373946
## 193 194 195 196 197 198 199 200
## 0.3539117 0.7782225 0.2067252 0.7373946 0.6078200 0.5718933 0.7373946 0.8456747
## 201 202 203 204 205 206 207 208
## 0.4426427 0.4426427 0.4795451 0.4426427 0.8357285 0.5351922 0.2067252 0.5351922
## 209 210 211 212 213 214 215 216
## 0.1779202 0.5351922 0.7782225 0.5351922 0.6426159 0.3207195 0.8456747 0.2742164
## 217 218 219 220 221 222 223 224
## 0.4426427 0.5627758 0.4426427 0.2742164 0.7651363 0.4426427 0.6677819 0.1779202
## 225 226 227 228 229 230 231 232
## 0.5627758 0.4426427 0.5351922 0.5899767 0.2742164 0.1834183 0.3710769 0.2969424
## 233 234 235 236 237 238 239 240
## 0.6340408 0.5166720 0.5351922 0.3539117 0.7227576 0.5718933 0.8407645 0.8252737
## 241 242 243 244 245 246 247 248
## 0.3974345 0.5166720 0.5073915 0.7227576 0.8198527 0.5627758 0.4426427 0.4426427
## 249 250 251 252 253 254 255 256
## 0.6253800 0.7076282 0.5809622 0.7445237 0.7445237 0.4244010 0.8551231 0.6253800
## 257 258 259 260 261 262 263 264
## 0.4426427 0.2596818 0.7076282 0.3974345 0.3126817 0.5536158 0.7445237 0.6677819
## 265 266 267 268 269 270 271 272
## 0.4888216 0.2388387 0.7782225 0.4426427 0.8766502 0.4888216 0.5351922 0.3126817
## 273 274 275 276 277 278 279 280
## 0.6253800 0.5899767 0.2067252 0.8357285 0.4426427 0.6594907 0.6594907 0.3974345
## 281 282 283 284 285 286 287 288
## 0.5809622 0.6920250 0.3539117 0.3539117 0.2742164 0.7076282 0.5351922 0.6078200
## 289 290 291 292 293 294 295 296
## 0.3885739 0.2067252 0.5536158 0.5809622 0.4610405 0.8683896 0.6511006 0.7782225
## 297 298 299 300 301 302 303 304
## 0.5444192 0.6166380 0.8725771 0.4518252 0.4518252 0.4426427 0.7076282 0.6840526
## 305 306 307 308 309 310 311 312
## 0.6594907 0.6511006 0.3974345 0.7076282 0.5536158 0.1948076 0.4063629 0.7782225
## 313 314 315 316 317 318 319 320
## 0.2321517 0.4063629 0.5259410 0.6840526 0.4610405 0.6998845 0.9228067 0.5718933
## 321 322 323 324 325 326 327 328
## 0.2388387 0.7845671 0.3047550 0.6426159 0.5989311 0.6426159 0.5536158 0.7152534
## 329 330 331 332 333 334 335 336
## 0.9084941 0.6253800 0.5073915 0.9084941 0.2128829 0.4981059 0.2742164 0.5899767
## 337 338 339 340 341 342 343 344
## 0.7515245 0.4063629 0.4518252 0.4888216 0.6920250 0.7515245 0.7583957 0.7076282
## 345 346 347 348 349 350 351 352
## 0.8143013 0.6253800 0.7445237 0.6426159 0.8143013 0.6677819 0.7076282 0.5351922
## 353 354 355 356 357 358 359 360
## 0.8357285 0.8357285 0.8725771 0.6677819 0.7583957 0.8596644 0.6426159 0.7445237
## 361 362 363 364 365 366 367 368
## 0.9350408 0.6759704 0.8407645 0.4610405 0.8504604 0.5351922 0.7301386 0.7076282
## 369 370 371 372 373 374 375 376
## 0.7076282 0.8953700 0.9526252 0.7907789 0.8456747 0.7445237 0.8086188 0.6998845
## 377 378 379 380 381 382 383 384
## 0.7227576 0.6920250 0.3797863 0.3885739 0.8407645 0.7076282 0.4888216 0.3885739
## 385 386 387 388 389 390 391 392
## 0.3974345 0.8086188 0.8407645 0.5809622 0.9053590 0.4888216 0.9574081 0.8725771
## 393 394 395 396 397 398 399 400
## 0.7445237 0.7076282 0.8456747 0.4426427 0.5073915 0.8086188 0.6920250 0.9394098
## 401 402 403 404 405 406 407 408
## 0.7782225 0.3288651 0.9454505 0.6426159 0.7076282 0.6253800 0.8357285 0.9350408
## 409 410 411 412 413 414 415 416
## 0.8640860 0.6920250 0.9201188 0.4426427 0.8198527 0.8456747 0.7782225 0.8806110
## 417 418 419 420 421 422 423 424
## 0.7651363 0.6511006 0.5351922 0.4518252 0.8407645 0.7076282 0.8086188 0.5351922
## 425 426 427 428 429 430 431 432
## 0.5259410 0.3797863 0.5351922 0.7301386 0.7076282 0.7076282 0.4610405 0.8953700
## 433 434 435 436 437 438 439 440
## 0.9021280 0.6677819 0.7076282 0.7227576 0.6759704 0.8028046 0.7717454 0.7373946
## 441 442 443 444 445 446 447 448
## 0.2067252 0.6340408 0.6677819 0.5351922 0.7076282 0.6759704 0.7301386 0.7782225
## 449 450 451 452 453 454 455 456
## 0.8086188 0.7782225 0.6920250 0.7227576 0.5989311 0.6840526 0.6166380 0.9144854
## 457 458 459 460 461 462 463 464
## 0.3126817 0.8953700 0.7717454 0.7227576 0.9021280 0.7301386 0.7968580 0.6426159
## 465 466 467 468 469 470 471 472
## 0.3539117 0.6677819 0.6253800 0.8504604 0.3454651 0.8028046 0.6253800 0.5351922
## 473 474 475 476 477 478 479 480
## 0.6920250 0.6253800 0.7076282 0.5444192 0.7907789 0.4610405 0.6840526 0.7782225
## 481 482 483 484 485 486 487 488
## 0.7227576 0.6677819 0.8028046 0.7651363 0.6426159 0.2067252 0.4981059 0.5809622
## 489 490 491 492 493 494 495 496
## 0.5351922 0.8252737 0.7907789 0.4888216 0.6511006 0.7782225 0.5351922 0.9414899
## 497 498 499 500 501 502 503 504
## 0.4610405 0.6253800 0.6253800 0.5351922 0.5536158 0.5351922 0.5536158 0.7651363
## 505 506 507 508 509 510 511 512
## 0.6166380 0.7651363 0.9144854 0.4426427 0.7782225 0.6594907 0.8882032 0.4153536
## 513 514 515 516 517 518 519 520
## 0.4426427 0.7076282 0.3539117 0.6078200 0.7076282 0.7782225 0.6998845 0.6426159
## 521 522 523 524 525 526 527 528
## 0.5809622 0.7076282 0.7301386 0.4426427 0.4981059 0.7583957 0.5809622 0.6511006
## 529 530 531 532 533 534 535 536
## 0.7845671 0.6426159 0.7445237 0.8252737 0.5351922 0.5809622 0.6920250 0.7152534
## 537 538 539 540 541 542 543 544
## 0.6253800 0.7651363 0.8357285 0.6920250 0.7076282 0.8086188 0.6340408 0.7076282
## 545 546 547 548 549 550 551 552
## 0.5444192 0.3371149 0.8357285 0.5351922 0.5809622 0.9327478 0.8953700 0.7907789
## 553 554 555 556 557 558 559 560
## 0.7373946 0.3539117 0.7227576 0.7651363 0.6920250 0.6759704 0.8252737 0.5627758
## 561 562 563 564 565 566 567 568
## 0.5259410 0.4063629 0.6594907 0.3539117 0.7445237 0.6426159 0.7445237 0.8086188
## 569 570 571 572 573 574 575 576
## 0.7782225 0.7152534 0.7845671 0.5809622 0.6253800 0.7651363 0.6594907 0.7076282
## 577 578 579 580 581 582 583 584
## 0.7782225 0.7152534 0.7782225 0.6253800 0.3624504 0.9021280 0.6594907 0.7373946
## 585 586 587 588 589 590 591 592
## 0.7076282 0.6920250 0.3126817 0.6920250 0.8640860 0.5989311 0.7782225 0.4426427
## 593 594 595 596 597 598 599 600
## 0.6253800 0.7583957 0.5351922 0.8357285 0.5718933 0.6511006 0.8456747 0.8551231
## 601 602 603 604 605 606 607 608
## 0.6840526 0.8456747 0.7651363 0.4334993 0.8551231 0.7907789 0.6426159 0.5536158
## 609 610 611 612 613 614 615 616
## 0.6594907 0.4063629 0.5627758 0.8357285 0.5809622 0.8683896 0.7845671 0.3539117
## 617 618 619 620 621 622 623 624
## 0.5259410 0.8086188 0.6998845 0.5351922 0.5166720 0.5166720 0.2742164 0.4063629
## 625 626 627 628 629 630 631 632
## 0.3454651 0.7717454 0.2067252 0.4888216 0.3624504 0.6677819 0.7076282 0.3974345
## 633 634 635 636 637 638 639 640
## 0.4981059 0.2191733 0.6340408 0.2067252 0.2007002 0.5073915 0.3624504 0.5444192
## 641 642 643 644 645 646 647 648
## 0.4244010 0.3797863 0.3126817 0.6253800 0.4426427 0.5536158 0.2742164 0.5351922
## 649 650 651 652 653 654 655 656
## 0.6594907 0.4426427 0.5536158 0.6677819 0.4426427 0.1725521 0.2007002 0.3288651
## 657 658 659 660 661 662 663 664
## 0.2128829 0.3885739 0.5899767 0.3126817 0.6594907 0.2255963 0.7076282 0.7515245
## 665 666 667 668 669 670 671 672
## 0.6677819 0.1834183 0.3797863 0.2128829 0.2388387 0.2892468 0.6677819 0.8551231
## 673 674 675 676 677 678 679 680
## 0.5073915 0.8198527 0.2526048 0.5166720 0.2816707 0.2668862 0.4426427 0.7651363
## 681 682 683 684 685 686 687 688
## 0.1725521 0.4244010 0.4518252 0.4244010 0.5351922 0.3288651 0.5073915 0.7373946
## 689 690 691 692 693 694 695 696
## 0.5166720 0.4702826 0.4610405 0.2128829 0.2526048 0.2191733 0.8086188 0.6253800
## 697 698 699 700 701 702 703 704
## 0.7717454 0.2892468 0.6594907 0.2191733 0.5351922 0.4888216 0.3288651 0.6426159
## 705 706 707 708 709 710 711 712
## 0.3207195 0.2816707 0.7845671 0.7907789 0.2892468 0.7227576 0.4334993 0.3885739
## 713 714 715 716 717 718 719 720
## 0.5989311 0.3371149 0.2388387 0.9372608 0.3288651 0.6759704 0.4702826 0.3047550
## 721 722 723 724 725 726 727 728
## 0.5073915 0.3797863 0.3371149 0.5536158 0.7301386 0.4153536 0.3454651 0.2742164
## 729 730 731 732 733 734 735 736
## 0.3371149 0.3371149 0.4981059 0.5989311 0.7515245 0.8198527 0.5444192 0.7373946
## 737 738 739 740 741 742 743 744
## 0.8882032 0.4334993 0.4244010 0.3288651 0.8407645 0.2816707 0.3710769 0.3539117
## 745 746 747 748 749 750 751 752
## 0.2816707 0.6078200 0.2191733 0.8551231 0.3126817 0.3539117 0.2596818 0.4981059
## 753 754 755 756 757 758 759 760
## 0.1430097 0.2892468 0.6078200 0.1948076 0.3288651 0.6677819 0.1298882 0.8596644
## 761 762 763 764 765 766 767 768
## 0.3539117 0.7515245 0.2526048 0.2596818 0.2128829 0.3710769 0.2969424 0.6920250
## 769 770 771 772 773 774 775 776
## 0.4518252 0.2596818 0.7717454 0.2742164 0.3371149 0.3126817 0.1948076 0.4063629
## 777 778 779 780 781 782 783 784
## 0.3974345 0.6253800 0.3454651 0.4063629 0.3624504 0.4244010 0.4244010 0.2456567
## 785 786 787 788 789 790 791 792
## 0.6166380 0.4795451 0.6677819 0.7445237 0.2456567 0.8028046 0.6920250 0.4702826
## 793 794 795 796 797 798 799 800
## 0.3288651 0.3288651 0.1341442 0.4426427 0.3710769 0.6920250 0.2526048 0.3371149
## 801 802 803 804 805 806 807 808
## 0.8086188 0.4702826 0.3797863 0.7651363 0.3539117 0.6677819 0.3885739 0.3885739
## 809 810 811 812 813 814 815 816
## 0.2388387 0.3454651 0.6920250 0.3710769 0.4334993 0.3371149 0.4334993 0.2668862
## 817 818 819 820 821 822 823 824
## 0.5259410 0.2526048 0.4888216 0.2191733 0.3539117 0.4063629 0.6166380 0.1673130
## 825 826 827 828 829 830 831 832
## 0.3624504 0.3047550 0.3126817 0.6166380 0.1032189 0.2596818 0.2596818 0.4063629
## 833 834 835 836 837 838 839 840
## 0.4702826 0.2742164 0.6594907 0.6511006 0.2456567 0.6078200 0.1948076 0.6078200
## 841 842 843 844 845 846 847 848
## 0.8504604 0.5718933 0.3371149 0.1523581 0.4795451 0.5351922 0.1779202 0.3454651
## 849 850 851 852 853 854 855 856
## 0.4795451 0.4888216 0.3539117 0.7076282 0.3885739 0.2596818 0.4426427 0.1948076
## 857 858 859 860 861 862 863 864
## 0.5073915 0.3539117 0.5166720 0.4981059 0.3710769 0.4610405 0.3974345 0.5166720
## 865 866 867 868 869 870 871 872
## 0.7583957 0.1622018 0.4153536 0.6840526 0.3797863 0.3371149 0.5627758 0.6078200
## 873 874 875 876 877 878 879 880
## 0.3710769 0.2668862 0.2596818 0.6078200 0.3539117 0.2668862 0.2892468 0.3371149
## 881 882 883 884 885 886 887 888
## 0.2526048 0.4153536 0.4610405 0.7907789 0.7445237 0.2816707 0.5073915 0.3885739
## 889 890 891 892 893 894 895 896
## 0.3371149 0.3974345 0.4244010 0.4244010 0.3207195 0.6166380 0.5073915 0.2128829
## 897 898 899 900 901 902 903 904
## 0.6253800 0.2456567 0.3454651 0.5351922 0.4795451 0.4981059 0.3288651 0.2816707
## 905 906 907 908 909 910 911 912
## 0.4426427 0.3047550 0.4981059 0.4981059 0.5718933 0.1948076 0.8806110 0.6840526
## 913 914 915 916 917
## 0.6078200 0.5259410 0.7445237 0.2456567 0.2526048
Clase_salida <- heart_diseases_Dataset_VR_MOD$Clase_salida
FrecC_Max <- heart_diseases_Dataset_VR_MOD$FrecC_Max
dataPlot <- data.frame(FrecC_Max, Clase_salida)
plot(Clase_salida~FrecC_Max, data = dataPlot, main = "Modelo RLogS: FrecC_Max - Clase_salida", xlab = "FrecC_Max", ylab = "Clase_salida = 0 | Clase_salida = 1", col = "gold", pch = "I")
curve(predict(glm(Clase_salida~FrecC_Max, family = "binomial", data = dataPlot), data.frame(FrecC_Max = x), type = "response"), col = "orange", lwd = 3, add = TRUE)
Complementariamente a los analisis que fueron expuestos en las fases anteriores de estudio de cada modelo tratado en este trabajo es importante hacer una mencion global sobre el problema que se esta tratando abordar considerando a la luz de todo lo obtenido:
Para que a un paciente se le diagnostique de insuficiencia cardiaca, para el cual el genero es poco significativo, la frecuencia cardiaca maxima y la angina porducida por el ejercicio como ejemplo segun su valor puede ayudar a que el paciente se le diagnostique insuficiencia cardiaca. Sin embargo, las variables de trabajo usadas en este estudio solo explican en conjunto, aproximadamente el \(35\) \(%\) de la variabilidad de la variable objetivo, este valor no es suficiente para decir con certeza si un paciente se le diagnostica insuficiencia cardiaca o no, dado que el \(75\) \(%\) restante queda sujeto a especulaciones como si tiene problemas cardiacos hereditarios en su nucleo familiar, la cantidad de ejercicio que realiza por dia, como estos y otros parametros que no se cuentan en el conjunto de datos que se estudio, sin embargo que resultaria interesenta de estudiar para tener un resultado mas preciso sobre el problema que se aborda.
Por Ćŗltimo, es importante resaltar el aspecto tĆ©cnico relacionado con el procesamiento estadĆstico hecho en este estudio a nivel de robustez, eficiencia e integración que R, RStudio y RMarkdown ofrecen al usuario para que este se pueda enfocar en Ć©l sin pasar mayores inconvenientes con el soporte documental para presentarlo.