Removiendo duplicados

Vistazo del dataset

str(family)

## 'data.frame':    7 obs. of  3 variables:
##  $ family.salary: num  40000 60000 50000 80000 60000 70000 60000
##  $ family.size  : num  4 3 2 2 3 4 3
##  $ family.car   : chr  "Lujo" "Compacto" "Utilitario" "Lujo" ...

head(family)

##   family.salary family.size family.car
## 1         40000           4       Lujo
## 2         60000           3   Compacto
## 3         50000           2 Utilitario
## 4         80000           2       Lujo
## 5         60000           3   Compacto
## 6         70000           4   Compacto

La función unique devuelve un vector, data frame o matriz pero con elementos/filas duplicados eliminados.

family.unique <- unique(family)
family.unique

##   family.salary family.size family.car
## 1         40000           4       Lujo
## 2         60000           3   Compacto
## 3         50000           2 Utilitario
## 4         80000           2       Lujo
## 6         70000           4   Compacto

La función duplicated() determina qué elementos de un vector o dataframe son duplicados de elementos con subíndices más pequeños y devuelve un vector lógico que indica qué elementos (filas) son duplicados.

duplicated(family)

## [1] FALSE FALSE FALSE FALSE  TRUE FALSE  TRUE

family[duplicated(family),]

##   family.salary family.size family.car
## 5         60000           3   Compacto
## 7         60000           3   Compacto

Removiendo duplicados

Mauricio Carrillo

30/3/2021

Armando un dataset improvisado

Vistazo del dataset