Base ENFERMEDADES CARDIACAS
library(readxl)
act4 <- read_excel("C:/Users/psicr/Downloads/a4_heart_disease_uci.xlsx", sheet =1)
act4
## # A tibble: 920 × 16
## id age sex dataset cp trestbps chol fbs restecg thalch exang
## <dbl> <dbl> <chr> <chr> <chr> <dbl> <dbl> <lgl> <chr> <dbl> <lgl>
## 1 1 63 Male Cleveland typic… 145 233 TRUE lv hyp… 150 FALSE
## 2 2 67 Male Cleveland asymp… 160 286 FALSE lv hyp… 108 TRUE
## 3 3 67 Male Cleveland asymp… 120 229 FALSE lv hyp… 129 TRUE
## 4 4 37 Male Cleveland non-a… 130 250 FALSE normal 187 FALSE
## 5 5 41 Female Cleveland atypi… 130 204 FALSE lv hyp… 172 FALSE
## 6 6 56 Male Cleveland atypi… 120 236 FALSE normal 178 FALSE
## 7 7 62 Female Cleveland asymp… 140 268 FALSE lv hyp… 160 FALSE
## 8 8 57 Female Cleveland asymp… 120 354 FALSE normal 163 TRUE
## 9 9 63 Male Cleveland asymp… 130 254 FALSE lv hyp… 147 FALSE
## 10 10 53 Male Cleveland asymp… 140 203 TRUE lv hyp… 155 TRUE
## # ℹ 910 more rows
## # ℹ 5 more variables: oldpeak <dbl>, slope <chr>, ca <dbl>, thal <chr>,
## # num <dbl>
summary(act4)
## id age sex dataset
## Min. : 1.0 Min. :28.00 Length:920 Length:920
## 1st Qu.:230.8 1st Qu.:47.00 Class :character Class :character
## Median :460.5 Median :54.00 Mode :character Mode :character
## Mean :460.5 Mean :53.51
## 3rd Qu.:690.2 3rd Qu.:60.00
## Max. :920.0 Max. :77.00
##
## cp trestbps chol fbs
## Length:920 Min. : 0.0 Min. : 0.0 Mode :logical
## Class :character 1st Qu.:120.0 1st Qu.:175.0 FALSE:692
## Mode :character Median :130.0 Median :223.0 TRUE :138
## Mean :132.1 Mean :199.1 NA's :90
## 3rd Qu.:140.0 3rd Qu.:268.0
## Max. :200.0 Max. :603.0
## NA's :59 NA's :30
## restecg thalch exang oldpeak
## Length:920 Min. : 60.0 Mode :logical Min. :-2.6000
## Class :character 1st Qu.:120.0 FALSE:528 1st Qu.: 0.0000
## Mode :character Median :140.0 TRUE :337 Median : 0.5000
## Mean :137.5 NA's :55 Mean : 0.8788
## 3rd Qu.:157.0 3rd Qu.: 1.5000
## Max. :202.0 Max. : 6.2000
## NA's :55 NA's :62
## slope ca thal num
## Length:920 Min. :0.0000 Length:920 Min. :0.0000
## Class :character 1st Qu.:0.0000 Class :character 1st Qu.:0.0000
## Mode :character Median :0.0000 Mode :character Median :1.0000
## Mean :0.6764 Mean :0.9957
## 3rd Qu.:1.0000 3rd Qu.:2.0000
## Max. :3.0000 Max. :4.0000
## NA's :611
La base de datos presenta la evaluación de diferentes factores que
pueden ser indicadores de enfermedad cardiaca; para el presente estudio
se retoma: la presión arterial en reposo (trestbps), el resultado del
electrocardiagrama (restecg), aparición de angina inducida por ejercicio
(exang), la frecuencia cardiaca máxima alcanzada (thalch), y el
diagnóstico final (num).
El diagnóstico final se asume como la variabla dependiente, la cual
permite generar la pregunta ¿los factores presión arterial, resultado de
electrocardiograma, angina por ejercicio y frecuencia máxima alcanzada
son predictores de enfermedad cardiaca?
Considerando el tipo de variables, y con base en la pregunta de
investigación, se hipotetiza que (a) la presión arterial en reposo y la
frecuencia cardiaca máxima tienen una relación de efecto positiva sobre
el diagnóstico final, (b) habrá una diferencia significativa en el
diagnóstico final entre los resultados del electrocardiagrama y entre la
aparición de angina por ejercicio.