데이터분석

데이터분석

2일차 학습 내용

파생변수 만들기

R에서 파생변수는 데이터프레임에 다른 변수들을 가지고 새로운 변수를 데이터 프레임 안에 생성하는 방법이다.

생성절차

이 절차를 위해 cars데이터를 열고

cars 데이터의 컬럼이름을 추출한다. cars 데이터는 총 2개의 변수와 50개의 변수로 이루어진 데이터 프레임 자료이다.

변수들의 이름은 다음가 같다.

## [1] "speed" "dist"

파생변수를 생성하기 이전에 변수들의 이름을 한글로 변경하였다.

그 결과로서 앞에서부터 6개의 자료를 보여주는 것은 다음과 같다.

##   속도 거리
## 1    4    2
## 2    4   10
## 3    7    4
## 4    7   22
## 5    8   16
## 6    9   10

새로 생성되는 파생변수로의 이름은 ‘속도x거리’ 이며 이 값은 속도와 거리의 곱이다.

##   속도 거리 속도x거리
## 1    4    2         8
## 2    4   10        40
## 3    7    4        28
## 4    7   22       154
## 5    8   16       128
## 6    9   10        90

그 결과로 cars 데이터는 총 3개의 변수와 50개의 변수로 이루어진 데이터 프레임으로 업데이트 되었다.