0908 all
if("rJava" %in% installed.packages("rJava") == FALSE)install.packages("rJava")
library(rJava)
if("DBI" %in% installed.packages("DBI") == FALSE)install.packages("DBI")
library(DBI)
if("RJDBC" %in% installed.packages("RJDBC") == FALSE)install.packages("RJDBC")
library(RJDBC)
if("dplyr" %in% installed.packages("dplyr") == FALSE)install.packages("dplyr")
library(dplyr)
if("data.table" %in% installed.packages("data.table") == FALSE)install.packages("data.table")
library(data.table)
#oracle 데이터를 Rstudio로 가져오는 방법
myJDBC <- JDBC("oracle.jdbc.driver.OracleDriver",
"C:\\oraclexeapp\\oracle\\product\\11.2.0\\server\\jdbc\\lib\\ojdbc6.jar")
conn <- dbConnect(myJDBC,
"jdbc:oracle:thin:@localhost:1521:xe",
"hr",
"oracle"
)
tab <- dbGetQuery(conn, "SELECT * FROM TAB")
head(tab)
tab
#dplyr
#filterm select, arrange, mutate,
#summarise, group_by, left_join, bind_rows
tab <- data.frame(tab)
View(tab)
tname <- tab$TNAME
tname <- as.vector(tname)
tname
# [1] "COUNTRIES" cnt "DEPARTMENTS" dep
# [2] "EMPLOYEES" emp "EMP_DETAILS_VIEW" empd
# [3] "JOBS" job "JOB_HISTORY" jobh
# [4] "LOCATIONS" loc "REGIONS" reg
cnt <- data.frame(dbGetQuery(conn, "SELECT * FROM COUNTRIES"))
dep <- data.frame(dbGetQuery(conn, "SELECT * FROM DEPARTMENTS"))
emp <- data.frame(dbGetQuery(conn, "SELECT * FROM EMPLOYEES"))
empd <- data.frame(dbGetQuery(conn, "SELECT * FROM EMP_DETAILS_VIEW"))
job <- data.frame(dbGetQuery(conn, "SELECT * FROM JOBS"))
jobh <- data.frame(dbGetQuery(conn, "SELECT * FROM JOB_HISTORY"))
loc <- data.frame(dbGetQuery(conn, "SELECT * FROM LOCATIONS"))
reg <- data.frame(dbGetQuery(conn, "SELECT * FROM REGIONS"))
head(cnt)
# cnt 의 컬럼명을 한글로 전환하시오. (3.5.1)
str(cnt)
# COUNTRY_ID 국가아이디,
# COUNTRY_NAME 국가명,
# REGION_ID 지역아이디
cnt <- cnt %>%
dplyr::rename(국가아이디 = COUNTRY_ID,
국가명 = COUNTRY_NAME,
지역아이디 = REGION_ID)
str(cnt)
# dep 의 컬럼명 전환
str(dep)
# DEPARTMENT_ID 부서아이디,
# DEPARTMENT_NAME 부서명,
# MANAGER_ID 매니저아이디,
# LOCATION_ID 위치아이디
dep <- dep %>%
dplyr::rename(부서아이디 = DEPARTMENT_ID,
부서명 = DEPARTMENT_NAME,
매니저아이디 = MANAGER_ID,
위치아이디 = LOCATION_ID)
str(dep)
## emp 의 컬럼명을 한글로 전환하시오.
## 그리고 First Name 과 Last Name 을
## 붙여서 이름 으로 된 컬럼을 추가하시오
## 단, 이름 간격은 띄울것. ex) James Dean
## 직원아이디 = EMPLOYEE_ID
## 이메일 = EMAIL
## 전화번호 = PHONE_NUMBER
## 채용일 = HIRE_DATE
## 업무아이디 = JOB_ID
## 연봉 = SALARY
## 커미션비율 = COMMISSION_PCT
## 매니저아이디 = MANAGER_ID
## 부서아이디 = DEPARTMENT_ID
str(emp)
emp <- emp %>%
dplyr::rename(직원아이디 = EMPLOYEE_ID,
이메일 = EMAIL,
전화번호 = PHONE_NUMBER,
채용일 = HIRE_DATE,
업무아이디 = JOB_ID,
연봉 = SALARY,
커미션비율 = COMMISSION_PCT,
매니저아이디 = MANAGER_ID,
부서아이디 = DEPARTMENT_ID) %>%
mutate(이름 = paste(FIRST_NAME, LAST_NAME))
View(head(emp))
# 필요없는 변수 삭제하기
emp <- subset(emp,select = -c(FIRST_NAME, LAST_NAME))
View(head(emp))
# 매달 지급하는 월급여 (연봉/12)를 보여주는 월급이라는 컬럼(변수)를 추가시키시오.
# 0단위 이하는 절삭
emp <- emp %>%
dplyr::mutate(월급 = 연봉 %/% 12)
emp %>% head
# 연봉이 10000불 이상인 사원(emp)의 목록을 이름, 직원아이디, 연봉만 구하되,
# 연봉 내림차순으로 보여주시오.
emp %>%
left_join(dep,by="부서아이디") %>%
filter(연봉 >= 10000) %>%
select(이름, 직원아이디, 연봉, 부서명) %>%
arrange(desc(연봉))
# 연봉이 3000 미만인 사원에게 보너스로 급여를 1%를 지급하겠다고 합니다.
# 대상자의 목록을 이름, 직원아이디, 연봉, 보너스를 기재하고
# 아이디 오름차순으로 보여주시오.
# 단, 보너스는 이번 달만 주는 것이므로
# emp DF에 저장하지 않고 1회용 임시 DF를 따로 생성해서 저장하고, 기한이 지나면 폐기하시오.
보너스지급명세서<- emp %>%
filter(연봉 < 3000) %>%
dplyr::mutate(보너스 = 연봉 * 0.01) %>%
select(이름, 직원아이디, 연봉, 보너스) %>%
arrange(직원아이디)
View(보너스지급명세서)
rm(보너스지급명세서)
View(dep)
# 연봉이 10000 이 넘는 직원의 부서명, 이름, 연봉을 출력(get)하시오.
emp %>%
left_join(dep,by="부서아이디") %>%
filter(연봉 >= 10000) %>%
select(부서명, 이름, 연봉)
# 부서별로 연봉 평균을 구하시오.
dep %>%
left_join(emp,by="부서아이디") %>%
group_by(부서명, 부서아이디) %>%
dplyr::summarise(연봉평균=mean(연봉,na.rm=T)) %>%
arrange(desc(연봉평균)) %>%
View
# 이 회사의 부서의 수를 구하시오.
dep %>%
dplyr::distinct(부서명) %>%#distinct는 중복을 제거함.
count
# 연봉이 12000 이 넘는 직원의 부서명, 이름, 연봉, 직책 을 기재하시오.
job <- job %>%
rename(업무아이디 = JOB_ID,
직책 = JOB_TITLE,
최소연봉 = MIN_SALARY,
최대연봉 = MAX_SALARY
)
job %>% View
dep %>%
left_join(emp,by="부서아이디") %>%
left_join(job,by="업무아이디") %>%
filter(연봉 > 12000) %>%
select(부서명, 이름, 연봉, 직책)
emp %>%
left_join(dep,by="부서아이디") %>%
left_join(job,by="업무아이디") %>%
filter(연봉 > 12000) %>%
select(부서명, 이름, 연봉, 직책)
# 부서별로 가장 높은 연봉을 받는 부서아이디, 부서명, 최대연봉을 구하시오.
emp %>%
left_join(dep,by="부서아이디") %>%
left_join(job,by="업무아이디") %>%
group_by(부서아이디, 부서명) %>%
summarise(max(연봉))
# 부서아이디를 발급 받지 않으면 신입입니다.
# 신입의 이름과 연봉을 구하시오.
emp %>%
filter(is.na(emp %>% select(부서아이디))) %>%
select(이름, 연봉, 부서아이디)
---
title: "R Notebook"
output: html_notebook
---
#####0908 all

```{r}
if("rJava" %in% installed.packages("rJava") == FALSE)install.packages("rJava")
library(rJava)
if("DBI" %in% installed.packages("DBI") == FALSE)install.packages("DBI")
library(DBI)
if("RJDBC" %in% installed.packages("RJDBC") == FALSE)install.packages("RJDBC")
library(RJDBC)
if("dplyr" %in% installed.packages("dplyr") == FALSE)install.packages("dplyr")
library(dplyr)
if("data.table" %in% installed.packages("data.table") == FALSE)install.packages("data.table")
library(data.table)
#oracle 데이터를 Rstudio로 가져오는 방법
myJDBC <- JDBC("oracle.jdbc.driver.OracleDriver",
               "C:\\oraclexeapp\\oracle\\product\\11.2.0\\server\\jdbc\\lib\\ojdbc6.jar")
conn <- dbConnect(myJDBC,
                  "jdbc:oracle:thin:@localhost:1521:xe",
                  "hr",
                  "oracle"
)
tab <- dbGetQuery(conn, "SELECT * FROM TAB")
head(tab)
tab
#dplyr
#filterm select, arrange, mutate,
#summarise, group_by, left_join, bind_rows
tab <- data.frame(tab)
View(tab)
tname <- tab$TNAME
tname <- as.vector(tname)
tname

# [1] "COUNTRIES" cnt  "DEPARTMENTS"  dep
# [2] "EMPLOYEES"  emp  "EMP_DETAILS_VIEW"  empd
# [3] "JOBS"      job  "JOB_HISTORY"  jobh
# [4] "LOCATIONS"  loc  "REGIONS"  reg

cnt <- data.frame(dbGetQuery(conn, "SELECT * FROM COUNTRIES"))
dep <- data.frame(dbGetQuery(conn, "SELECT * FROM DEPARTMENTS"))
emp <- data.frame(dbGetQuery(conn, "SELECT * FROM EMPLOYEES"))
empd <- data.frame(dbGetQuery(conn, "SELECT * FROM EMP_DETAILS_VIEW"))
job <- data.frame(dbGetQuery(conn, "SELECT * FROM JOBS"))
jobh <- data.frame(dbGetQuery(conn, "SELECT * FROM JOB_HISTORY"))
loc <- data.frame(dbGetQuery(conn, "SELECT * FROM LOCATIONS"))
reg <- data.frame(dbGetQuery(conn, "SELECT * FROM REGIONS"))
head(cnt)


# cnt 의 컬럼명을 한글로 전환하시오. (3.5.1)

str(cnt)
# COUNTRY_ID 국가아이디,
# COUNTRY_NAME 국가명,
# REGION_ID 지역아이디
cnt <- cnt %>%
  dplyr::rename(국가아이디 = COUNTRY_ID,
                     국가명 = COUNTRY_NAME,
                     지역아이디 = REGION_ID)
str(cnt)


# dep 의 컬럼명 전환
str(dep)
# DEPARTMENT_ID 부서아이디,
# DEPARTMENT_NAME 부서명,
# MANAGER_ID 매니저아이디,
# LOCATION_ID 위치아이디
dep <- dep %>% 
  dplyr::rename(부서아이디 = DEPARTMENT_ID,
                     부서명 = DEPARTMENT_NAME,
                     매니저아이디 = MANAGER_ID,
                     위치아이디 = LOCATION_ID)
str(dep)


## emp 의 컬럼명을 한글로 전환하시오.
## 그리고 First Name 과 Last Name 을
## 붙여서 이름 으로 된 컬럼을 추가하시오
## 단, 이름 간격은 띄울것. ex) James Dean
## 직원아이디 = EMPLOYEE_ID
## 이메일 = EMAIL
## 전화번호 = PHONE_NUMBER
## 채용일 = HIRE_DATE
## 업무아이디 = JOB_ID
## 연봉 = SALARY
## 커미션비율 = COMMISSION_PCT
## 매니저아이디 = MANAGER_ID
## 부서아이디 = DEPARTMENT_ID

str(emp)
emp <- emp %>%
  dplyr::rename(직원아이디 = EMPLOYEE_ID,
                     이메일 = EMAIL,
                     전화번호 = PHONE_NUMBER,
                     채용일 = HIRE_DATE,
                     업무아이디 = JOB_ID,
                     연봉 = SALARY,
                     커미션비율 = COMMISSION_PCT,
                     매니저아이디 = MANAGER_ID,
                     부서아이디 = DEPARTMENT_ID) %>%
  mutate(이름 = paste(FIRST_NAME, LAST_NAME))
View(head(emp))

# 필요없는 변수 삭제하기
emp <- subset(emp,select = -c(FIRST_NAME, LAST_NAME))
View(head(emp)) 

# 매달 지급하는 월급여 (연봉/12)를 보여주는 월급이라는 컬럼(변수)를 추가시키시오.
# 0단위 이하는 절삭

emp <- emp %>% 
  dplyr::mutate(월급 = 연봉 %/% 12)
emp %>% head


# 연봉이 10000불 이상인 사원(emp)의 목록을 이름, 직원아이디, 연봉만 구하되,
# 연봉 내림차순으로 보여주시오.

emp %>% 
  left_join(dep,by="부서아이디") %>% 
  filter(연봉 >= 10000) %>% 
  select(이름, 직원아이디, 연봉, 부서명) %>% 
  arrange(desc(연봉))

# 연봉이 3000 미만인 사원에게 보너스로 급여를 1%를 지급하겠다고 합니다.
# 대상자의 목록을 이름, 직원아이디, 연봉, 보너스를 기재하고
# 아이디 오름차순으로 보여주시오.
# 단, 보너스는 이번 달만 주는 것이므로
# emp DF에 저장하지 않고 1회용 임시 DF를 따로 생성해서 저장하고, 기한이 지나면 폐기하시오.

보너스지급명세서<- emp %>% 
  filter(연봉 < 3000) %>% 
  dplyr::mutate(보너스 = 연봉 * 0.01) %>% 
  select(이름, 직원아이디, 연봉, 보너스) %>% 
  arrange(직원아이디)
View(보너스지급명세서)
rm(보너스지급명세서)

View(dep)
# 연봉이 10000 이 넘는 직원의 부서명, 이름, 연봉을 출력(get)하시오.

emp %>%
  left_join(dep,by="부서아이디") %>% 
  filter(연봉 >= 10000) %>%
  select(부서명, 이름, 연봉)


# 부서별로 연봉 평균을 구하시오.
dep %>%
  left_join(emp,by="부서아이디") %>%
  group_by(부서명, 부서아이디) %>%
  dplyr::summarise(연봉평균=mean(연봉,na.rm=T)) %>% 
  arrange(desc(연봉평균)) %>% 
  View

# 이 회사의 부서의 수를 구하시오.
dep %>%
  dplyr::distinct(부서명) %>%#distinct는 중복을 제거함.
  count

# 연봉이 12000 이 넘는 직원의 부서명, 이름, 연봉, 직책 을 기재하시오.
job <- job %>% 
  rename(업무아이디 = JOB_ID,
              직책 = JOB_TITLE,
              최소연봉 = MIN_SALARY,
              최대연봉 = MAX_SALARY
  )
job %>% View

dep %>% 
  left_join(emp,by="부서아이디") %>% 
  left_join(job,by="업무아이디") %>% 
  filter(연봉 > 12000) %>% 
  select(부서명, 이름, 연봉, 직책)

emp %>%
  left_join(dep,by="부서아이디") %>%
  left_join(job,by="업무아이디") %>%
  filter(연봉 > 12000) %>% 
  select(부서명, 이름, 연봉, 직책)

# 부서별로 가장 높은 연봉을 받는 부서아이디, 부서명, 최대연봉을 구하시오.

emp %>%
  left_join(dep,by="부서아이디") %>%
  left_join(job,by="업무아이디") %>%
  group_by(부서아이디, 부서명) %>% 
  summarise(max(연봉))

# 부서아이디를 발급 받지 않으면 신입입니다.
# 신입의 이름과 연봉을 구하시오.
emp %>% 
  filter(is.na(emp %>% select(부서아이디))) %>% 
  select(이름, 연봉, 부서아이디)

```
