Pasos para cambiar etiquetas en una variable

1. En primer lugar se deba cargar la Data

library(readxl)
datos <- read_excel("Diabetes.xlsx")
## New names:
## • `HTA` -> `HTA...12`
## • `HTA` -> `HTA...24`
head(datos)
## # A tibble: 6 × 31
##   `Numero paciente`  Sexo  Edad Estadocivil Estudios Trabajo  Fuma
##               <dbl> <dbl> <dbl>       <dbl>    <dbl>   <dbl> <dbl>
## 1                 1     2    14           1        4       2     2
## 2                 2     1    39           2        7       1     2
## 3                 3     1    25           3        6       2     2
## 4                 4     1    29           3        5       1     2
## 5                 5     1    24           1        7       2     2
## 6                 6     2    48           3        8       2     1
## # ℹ 24 more variables: `Frecuencia Fuma` <dbl>, `Actividad Fisica` <dbl>,
## #   Frec.ActFisica <dbl>, ACV <dbl>, HTA...12 <dbl>, DIABETES <dbl>,
## #   ANTOBESIDAD <dbl>, ObesAutor <dbl>, Cintura <dbl>, Peso <dbl>, Talla <dbl>,
## #   IMC <dbl>, Nutricional <dbl>, OBS_IMC <dbl>, PAS <dbl>, PAD <dbl>,
## #   HTA...24 <dbl>, Diabetes <dbl>, TTODIABETES <dbl>, Alcohol <dbl>,
## #   EDADINICIO <dbl>, FRECUENCIA <dbl>, BioquimicAS <dbl>, estadodesalud <dbl>

Se observa que en la variable SEXO aparecen 1 y 2 como etiquetas

2. En este paso cambiaremos los numeros 1 y 2 a ‘Hombre’ y ‘Mujer’

datos$Sexo <- factor(datos$Sexo, levels = c(1, 2), labels = c("Hombre", "Mujer"))

Luego de crear las etiquetas se verifica en la data para ver si en realidad se hizo el cambio.

Vemos que efectivamente la variable SEXO muestra etiquetas de Hombre y Mujer

head(datos)
## # A tibble: 6 × 31
##   `Numero paciente` Sexo    Edad Estadocivil Estudios Trabajo  Fuma
##               <dbl> <fct>  <dbl>       <dbl>    <dbl>   <dbl> <dbl>
## 1                 1 Mujer     14           1        4       2     2
## 2                 2 Hombre    39           2        7       1     2
## 3                 3 Hombre    25           3        6       2     2
## 4                 4 Hombre    29           3        5       1     2
## 5                 5 Hombre    24           1        7       2     2
## 6                 6 Mujer     48           3        8       2     1
## # ℹ 24 more variables: `Frecuencia Fuma` <dbl>, `Actividad Fisica` <dbl>,
## #   Frec.ActFisica <dbl>, ACV <dbl>, HTA...12 <dbl>, DIABETES <dbl>,
## #   ANTOBESIDAD <dbl>, ObesAutor <dbl>, Cintura <dbl>, Peso <dbl>, Talla <dbl>,
## #   IMC <dbl>, Nutricional <dbl>, OBS_IMC <dbl>, PAS <dbl>, PAD <dbl>,
## #   HTA...24 <dbl>, Diabetes <dbl>, TTODIABETES <dbl>, Alcohol <dbl>,
## #   EDADINICIO <dbl>, FRECUENCIA <dbl>, BioquimicAS <dbl>, estadodesalud <dbl>

3. Luego lo grafico para observar como se ve el comportamiento.

library(ggplot2)

ggplot(datos, aes(x = Sexo, fill = Sexo)) +
  geom_bar() +
  geom_text(stat='count', aes(label=..count..), vjust=-0.5) +  # Agrega etiquetas
  labs(title = "Distribución de Género en la Base de Datos Diabetes",
       x = "Género",
       y = "Cantidad") +
  scale_fill_manual(values = c("blue", "pink")) +
  theme_minimal()
## Warning: The dot-dot notation (`..count..`) was deprecated in ggplot2 3.4.0.
## ℹ Please use `after_stat(count)` instead.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.

Pasos para mostrar tabla de frecuencia y porcentaje de variable cualitativa (Sexo).

1. Calcula la tabla de frecuencia de la variable “Sexo”

frecuencia_sexo <- table(datos$Sexo)

2. Calcula los porcentajes

porcentaje_sexo <- prop.table(frecuencia_sexo) * 100

3.Crea una tabla resumen con la frecuencia y porcentaje de la variable “Sexo”

tabla_resumen <- data.frame(Sexo = names(frecuencia_sexo),
                            Frecuencia = as.numeric(frecuencia_sexo),
                            Porcentaje = as.numeric(porcentaje_sexo))

4. Muestra la tabla resumen

tabla_resumen
##     Sexo Frecuencia Porcentaje
## 1 Hombre        166   48.68035
## 2  Mujer        175   51.31965