ANALISIS ESTADISTICO DE ENFERMEDADES CARDIACAS

1. Analisis univariado para las variables cuantitativas

1.1 Representacion grafica de las variables cuantitativas

1.1.1 Variable de Presion arterial

  hist(enfermedades$Presion_arterial,xlab="Resultado en mmHg", main="Histograma",col=c(234))

1.1.2 Variable de colesterol

 boxplot(enfermedades$Colesterol,main="Diagrama de cajas",xlab="Resultado en mg/dl",col=c(123),horizontal = TRUE)

1.1.3 Variable de Frecuencia Cardiaca Maxima

  hist(enfermedades$Frecuencia_cardiaca_maxima,xlab="Resultado en lpm",main="Histograma",col=c(996))

1.1.4 Variable de Depresion en ST

 boxplot(enfermedades$Depresion_en_ST,main="Diagrama de cajas",col=c(445),horizontal = TRUE)

Medidas Estadisticas

datos_cua
##                          Edad Presion arterial Colesterol
## Media               54.438944        131.68977  246.69307
## Desviacion estandar  9.038662         17.59975   51.77692
## 1er Cuartil         48.000000        120.00000  211.00000
## 3er Cuartil         61.000000        140.00000  275.00000
## Mediana             56.000000        130.00000  241.00000
##                     Frecuencia cardiaca maxima Depresion en ST
## Media                                 149.6073        1.039604
## Desviacion estandar                    22.8750        1.161075
## 1er Cuartil                           133.5000        0.000000
## 3er Cuartil                           166.0000        1.600000
## Mediana                               153.0000        0.800000

1.2 Representacion grafica de las variables cualitativas

1.2.1 Variable de Sexo

pie(porcentaje, labels = label, clockwise = TRUE, main="Diagrama Circular", col = color)
legend("topright",c("Femenino","Masculino"), cex = 0.8, fill = color)

1.2.2 Variable de Tipo de Dolor en el Pecho

ggplot(tabla_dolorPecho, aes(x=dolorPecho))+geom_bar(fill="Red2")+ggtitle("Diagrama de Barras")+labs(x="Tipo de Dolor en Pecho",y="Frecuencia")+scale_fill_manual(values = c("red","blue","purple","orange"))

table(dolorPecho)
## dolorPecho
##       Angina Tipico      Angina Atipico Sin Dolor de Angina        Asintomatico 
##                  23                  50                  86                 144

1.2.3 Variable de Glucosa en Ayunas

pie(porcentaje, labels = label, clockwise = TRUE, main="Diagrama Circular", col = color)
legend("topright",c("Menor que 120mg/dl","Mayor que 120mg/dl"), cex = 0.8, fill = color)

1.2.4 Variable de Electrocardiograma

ggplot(tabla_electriocardiograma, aes(x=Electriocardiograma))+geom_bar(fill="steelblue")+ggtitle("Diagrama de Barras")+labs(x="Resultados",y="Frecuencia")+scale_fill_manual(values = c("green","orange","blue"))

table(Niveles)
## Niveles
##                                                     Normal 
##                                                        151 
##                          L1:Tiene Anormalidad en Onda ST-T 
##                                                          4 
## L2:Hipertrofia Ventricular Izquierda Probable o Definitiva 
##                                                        148

1.2.5 Variable de Angina Inducida por Ejercicio

pie(porcentaje, labels = label, clockwise = TRUE, main="Diagrama Circular", col = color)
legend("topright",c("NO","SI"), cex = 0.8, fill = color)

1.2.6 Variable de Pendiente en ST

tabla_PendienteST
##           fi  Fi  fi/n Fi/n
## Ascenso  142 140 0.470 0.47
## Plano    140 280 0.460 0.93
## Descenso  21 300 0.069 1.00

1.2.7 Variable de THAL

tabla_THAL
##                     fi  Fi  fi/n Fi/n
## Normal             166 170 0.550 0.55
## Defecto Fijo        18 180 0.059 0.61
## Defecto Reversible 117 300 0.390 1.00

1.2.8 Variable de Angiografia

tabla_Angiografia
##    fi  Fi  fi/n Fi/n
## 0 164 160 0.540 0.54
## 1  55 220 0.180 0.72
## 2  36 260 0.120 0.84
## 3  35 290 0.120 0.96
## 4  13 300 0.043 1.00

1.2.9 Variable de Examen de CAD

ggplot(tabla_CAD, aes(x=CAD))+geom_bar(fill="salmon")+ggtitle("Diagrama de Barras")+labs(x="Resultados",y="Frecuencia")+scale_fill_manual(values = c("green","orange","blue","gray"))

table(CAD)
## CAD
##   0   1   2   3 
## 176  65  38  20
plot_ly(df, x=var, y=freq, name="var1", type='bar')%>%layout(title="Diagrama de Barras Interactivo",xaxis=list(title="Resultados"),yaxis=list(title="Frecuencia"))
## Warning: `arrange_()` is deprecated as of dplyr 0.7.0.
## Please use `arrange()` instead.
## See vignette('programming') for more help
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_warnings()` to see where this warning was generated.

2.1 Analisis bivariado y multivariado para las variables cuantitativas

Matriz y grafica de correlacion

round(cor(M),digits=2)
##                             Edad Presion arterial Colesterol
## Edad                        1.00             0.28       0.21
## Presion arterial            0.28             1.00       0.13
## Colesterol                  0.21             0.13       1.00
## Frecuencia cardiaca maxima -0.39            -0.05       0.00
## Depresion en ST             0.20             0.19       0.05
##                            Frecuencia cardiaca maxima Depresion en ST
## Edad                                            -0.39            0.20
## Presion arterial                                -0.05            0.19
## Colesterol                                       0.00            0.05
## Frecuencia cardiaca maxima                       1.00           -0.34
## Depresion en ST                                 -0.34            1.00
corrplot(cor(M))

Matriz de Varianza y Covarianza

round(cov(M),digits=2)
##                              Edad Presion arterial Colesterol
## Edad                        81.70            45.33      97.79
## Presion arterial            45.33           309.75     118.57
## Colesterol                  97.79           118.57    2680.85
## Frecuencia cardiaca maxima -81.42           -18.26      -4.06
## Depresion en ST              2.14             3.87       2.80
##                            Frecuencia cardiaca maxima Depresion en ST
## Edad                                           -81.42            2.14
## Presion arterial                               -18.26            3.87
## Colesterol                                      -4.06            2.80
## Frecuencia cardiaca maxima                     523.27           -9.11
## Depresion en ST                                 -9.11            1.35

Matriz de diagrama de dispersion

plot(enfermedades[,1],enfermedades[,4],xlab = "Edad (aƱos)",ylab = "Presion arterial (mmHg)",main="Diagrama de Dispersion: Edad Vs Presion arterial")
abline(lm(enfermedades[,1]~enfermedades[,4]), col=c(252))

plot(enfermedades[,1],enfermedades[,8],xlab = "Edad (aƱos)",ylab = "Frecuencia cardiaca maxima(lpm) ",main="Diagrama de Dispersion: Edad Vs Frecuencia cardiaca maxima")
abline(lm(enfermedades[,1]~enfermedades[,4]), col=c(493))

2.2 Grafico segmentado de variable cualitativa y cuantitativa

Diagrama de Caja de Colesterol Segmentado por Glucosa

  boxplot(col_glu$va_coles~col_glu$glucosa,main="Diagrama de Cajas",col=c("red","green"),ylab="Glucosa",xlab="Colesterol",horizontal = TRUE)

Diagrama de Caja de Edad Segmentado por Tipo de Dolor en el Pecho

  boxplot(df$edad~df$dolor_pecho,main="Diagrama de Cajas",col=c("blue","orange","purple","yellow"),ylab="Dolor de Pecho",xlab="Edad",horizontal = TRUE)

Diagrama de Caja de Frecuencia Cardiaca Maxima Segmentado por Sexo

  boxplot(df$freq_card~df$sexo,main="Diagrama de Cajas",col=c("gray","red"),ylab="Sexo",xlab="Frecuencia Cardiaca Maxima",horizontal = TRUE)

Diagrama de Caja de Depresion en ST Segmentado por Angiografia

  boxplot(df$depresion~df$angiografia,main="Diagrama de Cajas",col=c("salmon","green3"),ylab="Angiografia",xlab="Depresion en ST",horizontal = TRUE)

Diagrama de Caja de Presion Arterial Segmentado por Electrocardiograma

 boxplot(df$presion~df$electrocardiograma,main="Diagrama de Cajas",col=c("orange","purple","yellow"),ylab="Electrocardiograma",xlab="Presion arterial",horizontal = TRUE)

Diagramas de Barras Segmentados

Generamos estos graficos como evidencia del intento por brindar mejor apreciacion en los datos cuando hay segmentacion con dos varibales, sin embargo, la lectura y analisis de los mismos puede ser muy confusa y ambigua, por lo que se decidio quedarse con los diagramas de caja.
ggplot(dataframe, aes(x=presion))+geom_bar(aes(fill=Angina))+
  theme_dark()+scale_fill_manual(values=c("red","green"))+ggtitle("Diagrama de Barras")+labs(x="Presion Arterial",y="Angina")

ggplot(dataframe, aes(x=presion))+geom_bar(fill="Salmon")+facet_wrap(~electro,nrow=1)+ggtitle("Diagrama de Barras")+labs(x="Presion Arterial",y="Electrocardiograma")

plot_ly(dataframe, x=presion,y=angina,name = "Angina", type = 'bar')%>%add_trace(y=electro,name="Electrocardiograma")%>%layout(title="Diagrama de Barras Segmentado Interactivo")