BLoque 0
data <- read.csv("https://archive.ics.uci.edu/ml/machine-learning-databases/heart-disease/processed.cleveland.data",header=FALSE)
names(data) <- c( "edad", "sexo", "tipo de dolor de pecho", "presión arterial", "colesterol sérico","azúcar en sangre en ayunas", "resultados electrocardioagráficos","frecuencia cardíaca max alcanzada","angina por ejercicio", " depresión en el test de estres ","pendiente del test de estres", "numero de vasos principales", "talasemia", "diagnostico de enfermedad cardíaca")
Bloque 1 Estadistica descriptiva univariante
Variables cuantitativas
dim(data)
## [1] 303 14
names(data)
## [1] "edad" "sexo"
## [3] "tipo de dolor de pecho" "presión arterial"
## [5] "colesterol sérico" "azúcar en sangre en ayunas"
## [7] "resultados electrocardioagráficos" "frecuencia cardíaca max alcanzada"
## [9] "angina por ejercicio" " depresión en el test de estres "
## [11] "pendiente del test de estres" "numero de vasos principales"
## [13] "talasemia" "diagnostico de enfermedad cardíaca"
head(data,3)
## edad sexo tipo de dolor de pecho presión arterial colesterol sérico
## 1 63 1 1 145 233
## 2 67 1 4 160 286
## 3 67 1 4 120 229
## azúcar en sangre en ayunas resultados electrocardioagráficos
## 1 1 2
## 2 0 2
## 3 0 2
## frecuencia cardíaca max alcanzada angina por ejercicio
## 1 150 0
## 2 108 1
## 3 129 1
## depresión en el test de estres pendiente del test de estres
## 1 2.3 3
## 2 1.5 2
## 3 2.6 2
## numero de vasos principales talasemia diagnostico de enfermedad cardíaca
## 1 0.0 6.0 0
## 2 3.0 3.0 2
## 3 2.0 7.0 1
str(data)
## 'data.frame': 303 obs. of 14 variables:
## $ edad : num 63 67 67 37 41 56 62 57 63 53 ...
## $ sexo : num 1 1 1 1 0 1 0 0 1 1 ...
## $ tipo de dolor de pecho : num 1 4 4 3 2 2 4 4 4 4 ...
## $ presión arterial : num 145 160 120 130 130 120 140 120 130 140 ...
## $ colesterol sérico : num 233 286 229 250 204 236 268 354 254 203 ...
## $ azúcar en sangre en ayunas : num 1 0 0 0 0 0 0 0 0 1 ...
## $ resultados electrocardioagráficos : num 2 2 2 0 2 0 2 0 2 2 ...
## $ frecuencia cardíaca max alcanzada : num 150 108 129 187 172 178 160 163 147 155 ...
## $ angina por ejercicio : num 0 1 1 0 0 0 0 1 0 1 ...
## $ depresión en el test de estres : num 2.3 1.5 2.6 3.5 1.4 0.8 3.6 0.6 1.4 3.1 ...
## $ pendiente del test de estres : num 3 2 2 3 1 1 3 1 2 3 ...
## $ numero de vasos principales : chr "0.0" "3.0" "2.0" "0.0" ...
## $ talasemia : chr "6.0" "3.0" "7.0" "3.0" ...
## $ diagnostico de enfermedad cardíaca: int 0 2 1 0 0 0 3 0 2 1 ...
table(data$edad)
##
## 29 34 35 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59
## 1 2 4 2 2 4 3 10 8 8 11 8 7 5 7 5 7 12 13 8 16 8 11 17 19 14
## 60 61 62 63 64 65 66 67 68 69 70 71 74 76 77
## 12 8 11 9 10 8 7 9 4 3 4 3 1 1 1
1
Histograma de Trestbps
hist(data$`presión arterial`,col= "pink")

Diagrama de cajas de Trestbps
boxplot(data$`presión arterial`,col = "pink", border = "purple")

Medidas estadisticas de Trestbps
mean(data$`presión arterial`)
## [1] 131.6898
median(data$`presión arterial`)
## [1] 130
sd(data$`presión arterial`)
## [1] 17.59975
quantile(data$`presión arterial`)
## 0% 25% 50% 75% 100%
## 94 120 130 140 200
2
Histograma de edad
hist(data$edad,col = "red")

Diagrama de cajas de edad
boxplot(data$edad,col= "red", border= "purple")

Medidas estadisticas de edad
mean(data$edad)
## [1] 54.43894
median(data$edad)
## [1] 56
sd(data$edad)
## [1] 9.038662
quantile(data$edad)
## 0% 25% 50% 75% 100%
## 29 48 56 61 77
3
Histograma de chol
hist(data$`colesterol sérico`,col = "purple")

Diagrama de cajas de chol
boxplot(data$`colesterol sérico`,col = "purple", border = "blue")

Medidas estadisticas de chol
mean(data$`colesterol sérico`)
## [1] 246.6931
median(data$`colesterol sérico`)
## [1] 241
sd=(data$`colesterol sérico`)
quantile(data$`colesterol sérico`)
## 0% 25% 50% 75% 100%
## 126 211 241 275 564
4
Histograma de oldpeak
hist(data$` depresión en el test de estres `,col = "orange")

Diagrama de cajas de oldpeak
boxplot(data$` depresión en el test de estres `,col = "orange")

Medidas estadisticas de oldpeak
mean(data$` depresión en el test de estres `)
## [1] 1.039604
median(data$` depresión en el test de estres `)
## [1] 0.8
sd=(data$` depresión en el test de estres `)
quantile(data$` depresión en el test de estres `)
## 0% 25% 50% 75% 100%
## 0.0 0.0 0.8 1.6 6.2
Varables cualitativas
1
Tabla de frecuencias de cp
table(data$`tipo de dolor de pecho`)
##
## 1 2 3 4
## 23 50 86 144
Diagrama de Barras de cp
x<- data$`tipo de dolor de pecho`
y<- 1:303
barplot(table(data$`tipo de dolor de pecho`),xlab = "Ciclofosfamida(cp)",ylab = "Frecuencia",main = "Resultados",col = "purple")

2
Tabla de frecuencias de num
table(data$`diagnostico de enfermedad cardíaca`)
##
## 0 1 2 3 4
## 164 55 36 35 13
Diagrama de barras de num
x<- data$`diagnostico de enfermedad cardíaca`
y<- 1:303
barplot(table(data$`diagnostico de enfermedad cardíaca`),xlab = "NUM",ylab = "Frecuencia",main = "Resultados", col = "green")

3
Tabla de Frecuencia de thal
table(data$talasemia)
##
## ? 3.0 6.0 7.0
## 2 166 18 117
Diagrama de barras
x<- data$talasemia
y<- 1:50
barplot(table(data$talasemia),xlab = "Frecuencia Cardiaca maxima alcanzada(thalach)",ylab = "Frecuencia",main = "Resultados",col = "yellow")

1
Para variables cuantitativas
Matriz de correlacion de Trestbps
z<- data$`presión arterial`
y<- 1:303
cor(z,y)
## [1] -0.02202834
Matriz de varianza y covarianza de Trestbps
z<- data$`presión arterial`
y<- 1:303
cov(z,y)
## [1] -33.96689
Matriz de diagramas de dispersion de Trestbps
z<- data$`presión arterial`
y<- 1:303
plot(z,y,col= "green")

2
Matriz de correlacion de chol
g<- data$`colesterol sérico`
y<- 1:303
cor(g,y)
## [1] -0.09551825
Matriz de varianza y covarianza de chol
g<- data$`colesterol sérico`
y<- 1:303
cov(g,y)
## [1] -433.3013
Matriz de diagrmas de dispersion de chol
g<- data$`colesterol sérico`
y<- 1:303
plot(g,y,col= "orange")

3
Matriz de correlacion de oldpeak
j<- data$` depresión en el test de estres `
y<- 1:303
cor(j,y)
## [1] -0.1203836
Matriz de varianza y covarianza de oldpeak
j<- data$` depresión en el test de estres `
y<- 1:303
cov(j,y)
## [1] -12.24603
Matriz de diagramas de dispersion de oldpeak
j<- data$` depresión en el test de estres `
y<- 1:303
plot(j,y,col= "pink")

4
Matris de correlacion de edad
g<- data$edad
y<- 1:303
cor(g,y)
## [1] -0.002366671
Matriz de varianza y covarianza de edad
g<- data$edad
y<- 1:303
cov(g,y)
## [1] -1.874172
Matriz de diagramas de dispersion
g<- data$edad
y<- 1:303
plot(g,y,col= "yellow")

1
Para variables cualitativas
Diagrama de caja de edad con sexo
boxplot(data$edad ~ data$sexo,horizontal= T, col= rainbow(2))

2
Diagrama de cajas trestps con num
boxplot(data$`presión arterial` ~ data$`diagnostico de enfermedad cardíaca`,horizontal = T,col=rainbow(2))

3
Diagrama de cajas edad con cp
boxplot(data$edad ~ data$`tipo de dolor de pecho`,horizontal= T,col=rainbow(2))

4
Diagrama de cajas de chol con thal
boxplot(data$`colesterol sérico` ~ data$talasemia,horizontal = T,col=rainbow(2))

5
Diagrama de cajas de oldpeak con cp
boxplot(data$` depresión en el test de estres ` ~ data$`tipo de dolor de pecho`,horizontal = T,col=rainbow(2))
