R을 이용한 데이터처리 & 분석실무 책을 참고로 합니다. 정확한 지식은 책을 통해 얻으시길 바랍니다
apply() 시리즈에서 tapply()를 통해 데이터를 그룹별로 나눈 후 특정 연산을 산출했습니다.
aggregate() 함수를 사용하면 비슷한 연산을 할 수 있으며 결과가 dataframe 형태로 산출됩니다.
aggregate(Sepal.Width ~ Species, mean, data = iris)
## Species Sepal.Width
## 1 setosa 3.428
## 2 versicolor 2.770
## 3 virginica 2.974
tapply(X = iris$Sepal.Length, INDEX = iris$Species, mean)
## setosa versicolor virginica
## 5.006 5.936 6.588
이 정도의 차이가 있습니다.