데이터분석

0.1 2일차 학습내용

0.1.1 파생변수 만들기

R에서 파생변수는 데이터프레임에 있는 다른 변수들을 가지고 새로운 변수를 데이터 프레임 안에 생성하는 방법이다.

이 절차를 위해 cars데이터를 열고

cars 데이터의 컬러이름을 추출한다. cars 데이터는 총 ’r ncol(cars)’개의 변수와 ’r nrow(cars) 개의 관측치러 이루어진 데이터 프레임 자료이다.

변수들의 이름은 다음과 같다.

## [1] "speed" "dist"

파생변수를 생성하기 이전에 변수들의 이름을 한글로 변경하였다.

그 결과로서 앞에서부터 6개의 자료를 보여주는 것은 다음과 같다.

##   속도 거리
## 1    4    2
## 2    4   10
## 3    7    4
## 4    7   22
## 5    8   16
## 6    9   10

새로 생성되는 파생변수의 이름은 ’속도x거리’이며 이 값은 속도와 거리의 곱이다.

##   속도 거리 속도x거리
## 1    4    2         8
## 2    4   10        40
## 3    7    4        28
## 4    7   22       154
## 5    8   16       128
## 6    9   10        90

그 결과로서 cars 데이터는 총 ‘r ncol(cars)’ 개의 변수와 ’r nrow(cars)’개의 관측치로 이루어진 데이터 프레임으로 업데이트 되었다.