BLoque 0

data <- read.csv("https://archive.ics.uci.edu/ml/machine-learning-databases/heart-disease/processed.cleveland.data",header=FALSE)
                 
names(data) <- c( "edad", "sexo", "tipo de dolor de pecho", "presión arterial", "colesterol sérico","azúcar en sangre en ayunas", "resultados electrocardioagráficos","frecuencia cardíaca max alcanzada","angina por ejercicio", " depresión  en el test de estres ","pendiente del test de estres", "numero de vasos principales", "talasemia", "diagnostico de enfermedad cardíaca")

Bloque 1 Estadistica descriptiva univariante

Variables cuantitativas

dim(data)
## [1] 303  14
names(data)
##  [1] "edad"                               "sexo"                              
##  [3] "tipo de dolor de pecho"             "presión arterial"                  
##  [5] "colesterol sérico"                  "azúcar en sangre en ayunas"        
##  [7] "resultados electrocardioagráficos"  "frecuencia cardíaca max alcanzada" 
##  [9] "angina por ejercicio"               " depresión  en el test de estres " 
## [11] "pendiente del test de estres"       "numero de vasos principales"       
## [13] "talasemia"                          "diagnostico de enfermedad cardíaca"
head(data,3)
##   edad sexo tipo de dolor de pecho presión arterial colesterol sérico
## 1   63    1                      1              145               233
## 2   67    1                      4              160               286
## 3   67    1                      4              120               229
##   azúcar en sangre en ayunas resultados electrocardioagráficos
## 1                          1                                 2
## 2                          0                                 2
## 3                          0                                 2
##   frecuencia cardíaca max alcanzada angina por ejercicio
## 1                               150                    0
## 2                               108                    1
## 3                               129                    1
##    depresión  en el test de estres  pendiente del test de estres
## 1                               2.3                            3
## 2                               1.5                            2
## 3                               2.6                            2
##   numero de vasos principales talasemia diagnostico de enfermedad cardíaca
## 1                         0.0       6.0                                  0
## 2                         3.0       3.0                                  2
## 3                         2.0       7.0                                  1
str(data)
## 'data.frame':    303 obs. of  14 variables:
##  $ edad                              : num  63 67 67 37 41 56 62 57 63 53 ...
##  $ sexo                              : num  1 1 1 1 0 1 0 0 1 1 ...
##  $ tipo de dolor de pecho            : num  1 4 4 3 2 2 4 4 4 4 ...
##  $ presión arterial                  : num  145 160 120 130 130 120 140 120 130 140 ...
##  $ colesterol sérico                 : num  233 286 229 250 204 236 268 354 254 203 ...
##  $ azúcar en sangre en ayunas        : num  1 0 0 0 0 0 0 0 0 1 ...
##  $ resultados electrocardioagráficos : num  2 2 2 0 2 0 2 0 2 2 ...
##  $ frecuencia cardíaca max alcanzada : num  150 108 129 187 172 178 160 163 147 155 ...
##  $ angina por ejercicio              : num  0 1 1 0 0 0 0 1 0 1 ...
##  $  depresión  en el test de estres  : num  2.3 1.5 2.6 3.5 1.4 0.8 3.6 0.6 1.4 3.1 ...
##  $ pendiente del test de estres      : num  3 2 2 3 1 1 3 1 2 3 ...
##  $ numero de vasos principales       : chr  "0.0" "3.0" "2.0" "0.0" ...
##  $ talasemia                         : chr  "6.0" "3.0" "7.0" "3.0" ...
##  $ diagnostico de enfermedad cardíaca: int  0 2 1 0 0 0 3 0 2 1 ...
table(data$edad)
## 
## 29 34 35 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 
##  1  2  4  2  2  4  3 10  8  8 11  8  7  5  7  5  7 12 13  8 16  8 11 17 19 14 
## 60 61 62 63 64 65 66 67 68 69 70 71 74 76 77 
## 12  8 11  9 10  8  7  9  4  3  4  3  1  1  1

1

Histograma de Trestbps

hist(data$`presión arterial`,col= "pink")

Diagrama de cajas de Trestbps

boxplot(data$`presión arterial`,col = "pink", border = "purple")

Medidas estadisticas de Trestbps

mean(data$`presión arterial`)
## [1] 131.6898
median(data$`presión arterial`)
## [1] 130
sd(data$`presión arterial`)
## [1] 17.59975
quantile(data$`presión arterial`)
##   0%  25%  50%  75% 100% 
##   94  120  130  140  200

2

Histograma de edad

hist(data$edad,col = "red")

Diagrama de cajas de edad

boxplot(data$edad,col= "red", border= "purple")

Medidas estadisticas de edad

mean(data$edad)
## [1] 54.43894
median(data$edad)
## [1] 56
sd(data$edad)
## [1] 9.038662
quantile(data$edad)
##   0%  25%  50%  75% 100% 
##   29   48   56   61   77

3

Histograma de chol

hist(data$`colesterol sérico`,col = "purple")

Diagrama de cajas de chol

boxplot(data$`colesterol sérico`,col = "purple", border = "blue")

Medidas estadisticas de chol

mean(data$`colesterol sérico`)
## [1] 246.6931
median(data$`colesterol sérico`)
## [1] 241
sd=(data$`colesterol sérico`)
quantile(data$`colesterol sérico`)
##   0%  25%  50%  75% 100% 
##  126  211  241  275  564

4

Histograma de oldpeak

hist(data$` depresión  en el test de estres `,col = "orange")

Diagrama de cajas de oldpeak

boxplot(data$` depresión  en el test de estres `,col = "orange")

Medidas estadisticas de oldpeak

mean(data$` depresión  en el test de estres `)
## [1] 1.039604
median(data$` depresión  en el test de estres `)
## [1] 0.8
sd=(data$` depresión  en el test de estres `)
quantile(data$` depresión  en el test de estres `)
##   0%  25%  50%  75% 100% 
##  0.0  0.0  0.8  1.6  6.2

Varables cualitativas

1

Tabla de frecuencias de cp

table(data$`tipo de dolor de pecho`)
## 
##   1   2   3   4 
##  23  50  86 144

Diagrama de Barras de cp

x<- data$`tipo de dolor de pecho`
y<- 1:303
barplot(table(data$`tipo de dolor de pecho`),xlab = "Ciclofosfamida(cp)",ylab = "Frecuencia",main = "Resultados",col = "purple")

2

Tabla de frecuencias de num

table(data$`diagnostico de enfermedad cardíaca`)
## 
##   0   1   2   3   4 
## 164  55  36  35  13

Diagrama de barras de num

x<- data$`diagnostico de enfermedad cardíaca`
y<- 1:303

barplot(table(data$`diagnostico de enfermedad cardíaca`),xlab = "NUM",ylab = "Frecuencia",main = "Resultados", col = "green")

3

Tabla de Frecuencia de thal

table(data$talasemia)
## 
##   ? 3.0 6.0 7.0 
##   2 166  18 117

Diagrama de barras

x<- data$talasemia
y<- 1:50
barplot(table(data$talasemia),xlab = "Frecuencia Cardiaca maxima alcanzada(thalach)",ylab = "Frecuencia",main = "Resultados",col = "yellow")

1

Para variables cuantitativas

Matriz de correlacion de Trestbps

z<- data$`presión arterial`
y<- 1:303
cor(z,y)
## [1] -0.02202834

Matriz de varianza y covarianza de Trestbps

z<- data$`presión arterial`
y<- 1:303
cov(z,y)
## [1] -33.96689

Matriz de diagramas de dispersion de Trestbps

z<- data$`presión arterial`
y<- 1:303
plot(z,y,col= "green")

2

Matriz de correlacion de chol

g<- data$`colesterol sérico`
y<- 1:303
cor(g,y)
## [1] -0.09551825

Matriz de varianza y covarianza de chol

g<- data$`colesterol sérico`
y<- 1:303
cov(g,y)
## [1] -433.3013

Matriz de diagrmas de dispersion de chol

g<- data$`colesterol sérico`
y<- 1:303
plot(g,y,col= "orange")

3

Matriz de correlacion de oldpeak

j<- data$` depresión  en el test de estres `
y<- 1:303
cor(j,y)
## [1] -0.1203836

Matriz de varianza y covarianza de oldpeak

j<- data$` depresión  en el test de estres `
y<- 1:303
cov(j,y)
## [1] -12.24603

Matriz de diagramas de dispersion de oldpeak

j<- data$` depresión  en el test de estres `
y<- 1:303
plot(j,y,col= "pink")

4

Matris de correlacion de edad

g<- data$edad
y<- 1:303
cor(g,y)
## [1] -0.002366671

Matriz de varianza y covarianza de edad

g<- data$edad
y<- 1:303
cov(g,y)
## [1] -1.874172

Matriz de diagramas de dispersion

g<- data$edad
y<- 1:303
plot(g,y,col= "yellow")

1

Para variables cualitativas

Diagrama de caja de edad con sexo

boxplot(data$edad ~ data$sexo,horizontal= T, col= rainbow(2))

2

Diagrama de cajas trestps con num

boxplot(data$`presión arterial` ~ data$`diagnostico de enfermedad cardíaca`,horizontal = T,col=rainbow(2))

3

Diagrama de cajas edad con cp

boxplot(data$edad ~ data$`tipo de dolor de pecho`,horizontal= T,col=rainbow(2))

4

Diagrama de cajas de chol con thal

boxplot(data$`colesterol sérico` ~ data$talasemia,horizontal = T,col=rainbow(2))

5

Diagrama de cajas de oldpeak con cp

boxplot(data$` depresión  en el test de estres ` ~ data$`tipo de dolor de pecho`,horizontal = T,col=rainbow(2))