1 Exploración del Dataset sobre cancer de mama.

cargamos nuestro datos y obersamos las 6 primeras filas a continuación

datos <- read.table("breast-cancer.data", sep=",")
names(datos) <- c("Clase","age","menopause","tumor_size",
                       "inv_nodes","node_caps","deg_malig",
                       "breast","breast_quad","irradiat")
head(datos)

Ver las dimensiones de Dataset

## [1] 286  10

Ahora voy a explorar la variable age con una tabla

table(datos$age)
## 
## 20-29 30-39 40-49 50-59 60-69 70-79 
##     1    36    90    96    57     6

luego , veremos la variable menopause con un grafico de barras

barplot(table(datos$menopause))

2 Tabset

2.1 Tab 1

text 1

2.2 Tab 2

text 2

2.2.1 End tabset

#3. Organización y visualización: Variables Cualitativas ##3.1 Tablas de Frecuencia

table(datos$Clase)
## 
## no-recurrence-events    recurrence-events 
##                  201                   85
proptable = prop.table(table(datos$Clase))

round(proptable, 3)
## 
## no-recurrence-events    recurrence-events 
##                0.703                0.297