Armando un dataset improvisado

family.salary = c(40000, 60000, 50000, 80000, 60000, 70000, 60000)
family.size = c(4, 3, 2, 2, 3, 4, 3)
family.car = c("Lujo", "Compacto", "Utilitario", "Lujo", 
               "Compacto", "Compacto", "Compacto")
family <- data.frame(family.salary, family.size, family.car)

Vistazo del dataset

str(family)
## 'data.frame':    7 obs. of  3 variables:
##  $ family.salary: num  40000 60000 50000 80000 60000 70000 60000
##  $ family.size  : num  4 3 2 2 3 4 3
##  $ family.car   : chr  "Lujo" "Compacto" "Utilitario" "Lujo" ...
head(family)
##   family.salary family.size family.car
## 1         40000           4       Lujo
## 2         60000           3   Compacto
## 3         50000           2 Utilitario
## 4         80000           2       Lujo
## 5         60000           3   Compacto
## 6         70000           4   Compacto

La función unique devuelve un vector, data frame o matriz pero con elementos/filas duplicados eliminados.

family.unique <- unique(family)
family.unique
##   family.salary family.size family.car
## 1         40000           4       Lujo
## 2         60000           3   Compacto
## 3         50000           2 Utilitario
## 4         80000           2       Lujo
## 6         70000           4   Compacto

La función duplicated() determina qué elementos de un vector o dataframe son duplicados de elementos con subíndices más pequeños y devuelve un vector lógico que indica qué elementos (filas) son duplicados.

duplicated(family)
## [1] FALSE FALSE FALSE FALSE  TRUE FALSE  TRUE
family[duplicated(family),]
##   family.salary family.size family.car
## 5         60000           3   Compacto
## 7         60000           3   Compacto