R_aggregate()

R을 이용한 데이터처리 & 분석실무 책을 참고로 합니다. 정확한 지식은 책을 통해 얻으시길 바랍니다

apply() 시리즈에서 tapply()를 통해 데이터를 그룹별로 나눈 후 특정 연산을 산출했습니다.

aggregate() 함수를 사용하면 비슷한 연산을 할 수 있으며 결과가 dataframe 형태로 산출됩니다.

aggregate(Sepal.Width ~ Species, mean, data = iris)

##      Species Sepal.Width
## 1     setosa       3.428
## 2 versicolor       2.770
## 3  virginica       2.974

tapply(X = iris$Sepal.Length, INDEX = iris$Species, mean)

##     setosa versicolor  virginica 
##      5.006      5.936      6.588

이 정도의 차이가 있습니다.