Base ENFERMEDADES CARDIACAS

library(readxl)
act4 <- read_excel("C:/Users/psicr/Downloads/a4_heart_disease_uci.xlsx", sheet =1)
act4
## # A tibble: 920 × 16
##       id   age sex    dataset   cp     trestbps  chol fbs   restecg thalch exang
##    <dbl> <dbl> <chr>  <chr>     <chr>     <dbl> <dbl> <lgl> <chr>    <dbl> <lgl>
##  1     1    63 Male   Cleveland typic…      145   233 TRUE  lv hyp…    150 FALSE
##  2     2    67 Male   Cleveland asymp…      160   286 FALSE lv hyp…    108 TRUE 
##  3     3    67 Male   Cleveland asymp…      120   229 FALSE lv hyp…    129 TRUE 
##  4     4    37 Male   Cleveland non-a…      130   250 FALSE normal     187 FALSE
##  5     5    41 Female Cleveland atypi…      130   204 FALSE lv hyp…    172 FALSE
##  6     6    56 Male   Cleveland atypi…      120   236 FALSE normal     178 FALSE
##  7     7    62 Female Cleveland asymp…      140   268 FALSE lv hyp…    160 FALSE
##  8     8    57 Female Cleveland asymp…      120   354 FALSE normal     163 TRUE 
##  9     9    63 Male   Cleveland asymp…      130   254 FALSE lv hyp…    147 FALSE
## 10    10    53 Male   Cleveland asymp…      140   203 TRUE  lv hyp…    155 TRUE 
## # ℹ 910 more rows
## # ℹ 5 more variables: oldpeak <dbl>, slope <chr>, ca <dbl>, thal <chr>,
## #   num <dbl>
summary(act4)
##        id             age            sex              dataset         
##  Min.   :  1.0   Min.   :28.00   Length:920         Length:920        
##  1st Qu.:230.8   1st Qu.:47.00   Class :character   Class :character  
##  Median :460.5   Median :54.00   Mode  :character   Mode  :character  
##  Mean   :460.5   Mean   :53.51                                        
##  3rd Qu.:690.2   3rd Qu.:60.00                                        
##  Max.   :920.0   Max.   :77.00                                        
##                                                                       
##       cp               trestbps          chol          fbs         
##  Length:920         Min.   :  0.0   Min.   :  0.0   Mode :logical  
##  Class :character   1st Qu.:120.0   1st Qu.:175.0   FALSE:692      
##  Mode  :character   Median :130.0   Median :223.0   TRUE :138      
##                     Mean   :132.1   Mean   :199.1   NA's :90       
##                     3rd Qu.:140.0   3rd Qu.:268.0                  
##                     Max.   :200.0   Max.   :603.0                  
##                     NA's   :59      NA's   :30                     
##    restecg              thalch        exang            oldpeak       
##  Length:920         Min.   : 60.0   Mode :logical   Min.   :-2.6000  
##  Class :character   1st Qu.:120.0   FALSE:528       1st Qu.: 0.0000  
##  Mode  :character   Median :140.0   TRUE :337       Median : 0.5000  
##                     Mean   :137.5   NA's :55        Mean   : 0.8788  
##                     3rd Qu.:157.0                   3rd Qu.: 1.5000  
##                     Max.   :202.0                   Max.   : 6.2000  
##                     NA's   :55                      NA's   :62       
##     slope                 ca             thal                num        
##  Length:920         Min.   :0.0000   Length:920         Min.   :0.0000  
##  Class :character   1st Qu.:0.0000   Class :character   1st Qu.:0.0000  
##  Mode  :character   Median :0.0000   Mode  :character   Median :1.0000  
##                     Mean   :0.6764                      Mean   :0.9957  
##                     3rd Qu.:1.0000                      3rd Qu.:2.0000  
##                     Max.   :3.0000                      Max.   :4.0000  
##                     NA's   :611

La base de datos presenta la evaluación de diferentes factores que pueden ser indicadores de enfermedad cardiaca; para el presente estudio se retoma: la presión arterial en reposo (trestbps), el resultado del electrocardiagrama (restecg), aparición de angina inducida por ejercicio (exang), la frecuencia cardiaca máxima alcanzada (thalch), y el diagnóstico final (num).

El diagnóstico final se asume como la variabla dependiente, la cual permite generar la pregunta ¿los factores presión arterial, resultado de electrocardiograma, angina por ejercicio y frecuencia máxima alcanzada son predictores de enfermedad cardiaca?

Considerando el tipo de variables, y con base en la pregunta de investigación, se hipotetiza que (a) la presión arterial en reposo y la frecuencia cardiaca máxima tienen una relación de efecto positiva sobre el diagnóstico final, (b) habrá una diferencia significativa en el diagnóstico final entre los resultados del electrocardiagrama y entre la aparición de angina por ejercicio.