데이터분석
R에서 파생변수는 데이터프레임에 있는 다른 변수들을 가지고 새로운 변수를 데이터 프레임 안에 생성하는 방법이다.
이 절차를 위해 cars데이터를 열고
cars 데이터의 컬러이름을 추출한다. cars 데이터는 총 ’r ncol(cars)’개의 변수와 ’r nrow(cars) 개의 관측치러 이루어진 데이터 프레임 자료이다.
변수들의 이름은 다음과 같다.
## [1] "speed" "dist"
파생변수를 생성하기 이전에 변수들의 이름을 한글로 변경하였다.
그 결과로서 앞에서부터 6개의 자료를 보여주는 것은 다음과 같다.
## 속도 거리
## 1 4 2
## 2 4 10
## 3 7 4
## 4 7 22
## 5 8 16
## 6 9 10
새로 생성되는 파생변수의 이름은 ’속도x거리’이며 이 값은 속도와 거리의 곱이다.
## 속도 거리 속도x거리
## 1 4 2 8
## 2 4 10 40
## 3 7 4 28
## 4 7 22 154
## 5 8 16 128
## 6 9 10 90
그 결과로서 cars 데이터는 총 ‘r ncol(cars)’ 개의 변수와 ’r nrow(cars)’개의 관측치로 이루어진 데이터 프레임으로 업데이트 되었다.