library(readxl)
datos <- read_excel("Diabetes.xlsx")
## New names:
## • `HTA` -> `HTA...12`
## • `HTA` -> `HTA...24`
head(datos)
## # A tibble: 6 × 31
## `Numero paciente` Sexo Edad Estadocivil Estudios Trabajo Fuma
## <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 1 2 14 1 4 2 2
## 2 2 1 39 2 7 1 2
## 3 3 1 25 3 6 2 2
## 4 4 1 29 3 5 1 2
## 5 5 1 24 1 7 2 2
## 6 6 2 48 3 8 2 1
## # ℹ 24 more variables: `Frecuencia Fuma` <dbl>, `Actividad Fisica` <dbl>,
## # Frec.ActFisica <dbl>, ACV <dbl>, HTA...12 <dbl>, DIABETES <dbl>,
## # ANTOBESIDAD <dbl>, ObesAutor <dbl>, Cintura <dbl>, Peso <dbl>, Talla <dbl>,
## # IMC <dbl>, Nutricional <dbl>, OBS_IMC <dbl>, PAS <dbl>, PAD <dbl>,
## # HTA...24 <dbl>, Diabetes <dbl>, TTODIABETES <dbl>, Alcohol <dbl>,
## # EDADINICIO <dbl>, FRECUENCIA <dbl>, BioquimicAS <dbl>, estadodesalud <dbl>
Se observa que en la variable SEXO aparecen 1 y 2 como etiquetas
datos$Sexo <- factor(datos$Sexo, levels = c(1, 2), labels = c("Hombre", "Mujer"))
Luego de crear las etiquetas se verifica en la data para ver si en realidad se hizo el cambio.
Vemos que efectivamente la variable SEXO muestra etiquetas de Hombre y Mujer
head(datos)
## # A tibble: 6 × 31
## `Numero paciente` Sexo Edad Estadocivil Estudios Trabajo Fuma
## <dbl> <fct> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 1 Mujer 14 1 4 2 2
## 2 2 Hombre 39 2 7 1 2
## 3 3 Hombre 25 3 6 2 2
## 4 4 Hombre 29 3 5 1 2
## 5 5 Hombre 24 1 7 2 2
## 6 6 Mujer 48 3 8 2 1
## # ℹ 24 more variables: `Frecuencia Fuma` <dbl>, `Actividad Fisica` <dbl>,
## # Frec.ActFisica <dbl>, ACV <dbl>, HTA...12 <dbl>, DIABETES <dbl>,
## # ANTOBESIDAD <dbl>, ObesAutor <dbl>, Cintura <dbl>, Peso <dbl>, Talla <dbl>,
## # IMC <dbl>, Nutricional <dbl>, OBS_IMC <dbl>, PAS <dbl>, PAD <dbl>,
## # HTA...24 <dbl>, Diabetes <dbl>, TTODIABETES <dbl>, Alcohol <dbl>,
## # EDADINICIO <dbl>, FRECUENCIA <dbl>, BioquimicAS <dbl>, estadodesalud <dbl>
library(ggplot2)
ggplot(datos, aes(x = Sexo, fill = Sexo)) +
geom_bar() +
geom_text(stat='count', aes(label=..count..), vjust=-0.5) + # Agrega etiquetas
labs(title = "Distribución de Género en la Base de Datos Diabetes",
x = "Género",
y = "Cantidad") +
scale_fill_manual(values = c("blue", "pink")) +
theme_minimal()
## Warning: The dot-dot notation (`..count..`) was deprecated in ggplot2 3.4.0.
## ℹ Please use `after_stat(count)` instead.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.
frecuencia_sexo <- table(datos$Sexo)
porcentaje_sexo <- prop.table(frecuencia_sexo) * 100
tabla_resumen <- data.frame(Sexo = names(frecuencia_sexo),
Frecuencia = as.numeric(frecuencia_sexo),
Porcentaje = as.numeric(porcentaje_sexo))
tabla_resumen
## Sexo Frecuencia Porcentaje
## 1 Hombre 166 48.68035
## 2 Mujer 175 51.31965