Day 2 Assignment

Section 1

Give an introduction to section 1: Setting up function

Sub Section 1.1

Viet ham tinh dien tich cua mot hinh chu nhat. Code chunk ’’‘{r}’’’

rm(list = ls())

library(dplyr)
library(readr)

dien_tich_hcn <- function(a, b) {
  result <- a*b
  print(result)
}

dien_tich_hcn(3, 7)

## [1] 21

Sub Section 1.2

Tinh sample standard deviation cua 1 vector numeric

tinh_std_deviation <- function(a) {
  
  n <- length(a)
  result <- sqrt(sum((a-mean(a))^2/(n-1)))
  print(result)
    
}

a <- c(2, 6, 7, 13, 19)

tinh_std_deviation(a)

## [1] 6.655825

Section 2

Give an introduction to section 2: WOrking with stock dataset

Sub Section 2.1

Data type of the dataset: character

all_data_path <- dir("D:/Intro_to_R_n_Python_May2020/Intro_to_R/stock/stock", full.names = TRUE)

typeof(all_data_path)

## [1] "character"

class(all_data_path)

## [1] "character"

Sub Section 2.2

Co ton tai file du lieu nao co 3 chu cai vnm khong?

list.files(path = "D:/Intro_to_R_n_Python_May2020/Intro_to_R/stock/stock", recursive = TRUE, pattern = "vnm") -> vnm_file

vnm_file

## [1] "excel_vnm.csv"

Sub Section 2.3

Co bao nhieu file du lieu co ky hieu ^

test <- "\\^" #special expression, deactivate by \\

grep(test, all_data_path) -> whichfile

length(whichfile)

## [1] 2

Sub Section 2.4

Đọc hai files dữ liệu lần lượt có các cụm từ vnm và fpt rồi sử dụng lệnh bind_rows() để join hai bộ dữ liệu này thành một data frame duy nhất

library(readr)

library(dplyr)

library(purrr)

key1 = "vnm"

key2 = "fpt"

#key <- c(key1, key2)

vnm_files <- dir("D:/Intro_to_R_n_Python_May2020/Intro_to_R/stock/stock", full.names = TRUE, pattern = key1)

fpt_files <- dir("D:/Intro_to_R_n_Python_May2020/Intro_to_R/stock/stock", full.names = TRUE, pattern = key2)

selected_files <- c(vnm_files, fpt_files)

data <- selected_files %>% 
  map(read_csv) %>% 
  bind_rows()

data #merged files of VNM and FPT

## # A tibble: 5,510 x 14
##    `<Ticker>` `<DTYYYYMMDD>` `<OpenFixed>` `<HighFixed>` `<LowFixed>`
##    <chr>               <dbl>         <dbl>         <dbl>        <dbl>
##  1 VNM              20170731          153           153          152.
##  2 VNM              20170728          153.          153.         153.
##  3 VNM              20170727          153           153          153.
##  4 VNM              20170726          152           154.         152.
##  5 VNM              20170725          152.          152          151.
##  6 VNM              20170724          151.          152          150 
##  7 VNM              20170721          151.          152          151.
##  8 VNM              20170720          152           153.         152.
##  9 VNM              20170719          153           154.         153.
## 10 VNM              20170718          152           153          151 
## # ... with 5,500 more rows, and 9 more variables: `<CloseFixed>` <dbl>,
## #   `<Volume>` <dbl>, `<Open>` <dbl>, `<High>` <dbl>, `<Low>` <dbl>,
## #   `<Close>` <dbl>, `<VolumeDeal>` <dbl>, `<VolumeFB>` <dbl>,
## #   `<VolumeFS>` <dbl>

Sub Section 2.5

Lặp lại công việc ở câu hỏi 4 nhưng cho tất cả các files dữ liệu có trong thư mục stock.

library(dplyr)

library(readr)

#df_space <- data.frame()


#for (i in 1:length(all_data_path)) {
 # read_csv(all_data_path[i]) -> df_space 
  #  bind_rows()
#}

df_space <-
  do.call(bind_rows, lapply((all_data_path), read_csv))

Sub Section 2.5

Đọc hai files dữ liệu lần lượt có các cụm từ vnm và fpt rồi sử dụng lệnh bind_rows() để join hai bộ dữ liệu này thành một data frame duy nhất

library(ggplot2)

iris %>% 
  group_by(Species) %>% 
  count() %>% 
  ggplot(aes(Species, n, fill = Species)) + 
  geom_col()

Sub Section 2.5

Đọc hai files dữ liệu lần lượt có các cụm từ vnm và fpt rồi sử dụng lệnh bind_rows() để join hai bộ dữ liệu này thành một data frame duy nhất

library(ggplot2)
iris %>% 
  group_by(Species) %>% 
  count() %>% 
  ggplot(aes(Species, n, fill = Species)) + 
  geom_col()

LS0tDQp0aXRsZTogIkRheSAyIEFzc2lnbm1lbnQiDQphdXRob3I6ICJUcmFuIE1pbmggSGllbiINCnN1YnRpdGxlOiBSIGZvciBEYXRhIFZpc3VhbGl6YXRpb24NCm91dHB1dDoNCiAgaHRtbF9kb2N1bWVudDoNCiAgICBjb2RlX2Rvd25sb2FkOiB5ZXMNCiAgICBjb2RlX2ZvbGRpbmc6IGhpZGUNCiAgICBoaWdobGlnaHQ6IHB5Z21lbnRzDQogICAgdGhlbWU6IGZsYXRseQ0KICAgIHRvYzogeWVzDQogICAgdG9jX2Zsb2F0OiB5ZXMNCiAgd29yZF9kb2N1bWVudDoNCiAgICB0b2M6IHllcw0KLS0tDQoNCmBgYHtyIHNldHVwLGluY2x1ZGU9RkFMU0V9DQprbml0cjo6b3B0c19jaHVuayRzZXQoZWNobyA9IFRSVUUsIHdhcm5pbmcgPSBGQUxTRSwgbWVzc2FnZSA9IEZBTFNFKQ0KYGBgDQoNCiMjIFNlY3Rpb24gMSB7LnRhYnNldH0NCg0KR2l2ZSBhbiBpbnRyb2R1Y3Rpb24gdG8gc2VjdGlvbiAxOiBTZXR0aW5nIHVwIGZ1bmN0aW9uDQoNCg0KIyMjIFN1YiBTZWN0aW9uIDEuMQ0KDQpWaWV0IGhhbSB0aW5oIGRpZW4gdGljaCBjdWEgbW90IGhpbmggY2h1IG5oYXQuIENvZGUgY2h1bmsgJycne3J9JycnDQoNCmBgYHtyfQ0Kcm0obGlzdCA9IGxzKCkpDQoNCmxpYnJhcnkoZHBseXIpDQpsaWJyYXJ5KHJlYWRyKQ0KDQpkaWVuX3RpY2hfaGNuIDwtIGZ1bmN0aW9uKGEsIGIpIHsNCiAgcmVzdWx0IDwtIGEqYg0KICBwcmludChyZXN1bHQpDQp9DQoNCmRpZW5fdGljaF9oY24oMywgNykNCg0KYGBgDQoNCiMjIyBTdWIgU2VjdGlvbiAxLjINCg0KVGluaCBzYW1wbGUgc3RhbmRhcmQgZGV2aWF0aW9uIGN1YSAxIHZlY3RvciBudW1lcmljDQoNCmBgYHtyfQ0KDQp0aW5oX3N0ZF9kZXZpYXRpb24gPC0gZnVuY3Rpb24oYSkgew0KICANCiAgbiA8LSBsZW5ndGgoYSkNCiAgcmVzdWx0IDwtIHNxcnQoc3VtKChhLW1lYW4oYSkpXjIvKG4tMSkpKQ0KICBwcmludChyZXN1bHQpDQogICAgDQp9DQoNCmEgPC0gYygyLCA2LCA3LCAxMywgMTkpDQoNCnRpbmhfc3RkX2RldmlhdGlvbihhKQ0KDQpgYGANCg0KDQojIyBTZWN0aW9uIDIgey50YWJzZXR9DQoNCkdpdmUgYW4gaW50cm9kdWN0aW9uIHRvIHNlY3Rpb24gMjogV09ya2luZyB3aXRoIHN0b2NrIGRhdGFzZXQNCg0KIyMjIFN1YiBTZWN0aW9uIDIuMQ0KDQpEYXRhIHR5cGUgb2YgdGhlIGRhdGFzZXQ6IGNoYXJhY3Rlcg0KDQpgYGB7cn0NCmFsbF9kYXRhX3BhdGggPC0gZGlyKCJEOi9JbnRyb190b19SX25fUHl0aG9uX01heTIwMjAvSW50cm9fdG9fUi9zdG9jay9zdG9jayIsIGZ1bGwubmFtZXMgPSBUUlVFKQ0KDQp0eXBlb2YoYWxsX2RhdGFfcGF0aCkNCg0KY2xhc3MoYWxsX2RhdGFfcGF0aCkNCmBgYA0KDQojIyMgU3ViIFNlY3Rpb24gMi4yDQoNCkNvIHRvbiB0YWkgZmlsZSBkdSBsaWV1IG5hbyBjbyAzIGNodSBjYWkgdm5tIGtob25nPw0KDQpgYGB7cn0NCg0KbGlzdC5maWxlcyhwYXRoID0gIkQ6L0ludHJvX3RvX1Jfbl9QeXRob25fTWF5MjAyMC9JbnRyb190b19SL3N0b2NrL3N0b2NrIiwgcmVjdXJzaXZlID0gVFJVRSwgcGF0dGVybiA9ICJ2bm0iKSAtPiB2bm1fZmlsZQ0KDQp2bm1fZmlsZQ0KIA0KDQpgYGANCg0KIyMjIFN1YiBTZWN0aW9uIDIuMw0KDQpDbyBiYW8gbmhpZXUgZmlsZSBkdSBsaWV1IGNvIGt5IGhpZXUgXg0KDQpgYGB7cn0NCg0KdGVzdCA8LSAiXFxeIiAjc3BlY2lhbCBleHByZXNzaW9uLCBkZWFjdGl2YXRlIGJ5IFxcDQoNCmdyZXAodGVzdCwgYWxsX2RhdGFfcGF0aCkgLT4gd2hpY2hmaWxlDQoNCmxlbmd0aCh3aGljaGZpbGUpDQoNCmBgYA0KDQoNCiMjIyBTdWIgU2VjdGlvbiAyLjQNCg0KxJDhu41jIGhhaSBmaWxlcyBk4buvIGxp4buHdSBs4bqnbiBsxrDhu6N0IGPDsyBjw6FjIGPhu6VtIHThu6sgdm5tIHbDoCBmcHQgcuG7k2kgc+G7rSBk4bulbmcgbOG7h25oIGJpbmRfcm93cygpIMSR4buDIGpvaW4gaGFpIGLhu5kgZOG7ryBsaeG7h3UgbsOgeSB0aMOgbmggbeG7mXQgZGF0YSBmcmFtZSBkdXkgbmjhuqV0DQoNCmBgYHtyfQ0KDQpsaWJyYXJ5KHJlYWRyKQ0KDQpsaWJyYXJ5KGRwbHlyKQ0KDQpsaWJyYXJ5KHB1cnJyKQ0KDQprZXkxID0gInZubSINCg0Ka2V5MiA9ICJmcHQiDQoNCiNrZXkgPC0gYyhrZXkxLCBrZXkyKQ0KDQp2bm1fZmlsZXMgPC0gZGlyKCJEOi9JbnRyb190b19SX25fUHl0aG9uX01heTIwMjAvSW50cm9fdG9fUi9zdG9jay9zdG9jayIsIGZ1bGwubmFtZXMgPSBUUlVFLCBwYXR0ZXJuID0ga2V5MSkNCg0KZnB0X2ZpbGVzIDwtIGRpcigiRDovSW50cm9fdG9fUl9uX1B5dGhvbl9NYXkyMDIwL0ludHJvX3RvX1Ivc3RvY2svc3RvY2siLCBmdWxsLm5hbWVzID0gVFJVRSwgcGF0dGVybiA9IGtleTIpDQoNCnNlbGVjdGVkX2ZpbGVzIDwtIGModm5tX2ZpbGVzLCBmcHRfZmlsZXMpDQoNCmRhdGEgPC0gc2VsZWN0ZWRfZmlsZXMgJT4lIA0KICBtYXAocmVhZF9jc3YpICU+JSANCiAgYmluZF9yb3dzKCkNCg0KZGF0YSAjbWVyZ2VkIGZpbGVzIG9mIFZOTSBhbmQgRlBUDQoNCmBgYA0KDQoNCg0KIyMjIFN1YiBTZWN0aW9uIDIuNQ0KDQpM4bq3cCBs4bqhaSBjw7RuZyB2aeG7h2Mg4bufIGPDonUgaOG7j2kgNCBuaMawbmcgY2hvIHThuqV0IGPhuqMgY8OhYyBmaWxlcyBk4buvIGxp4buHdSBjw7MgdHJvbmcgdGjGsCBt4bulYyBzdG9jay4NCg0KYGBge3J9DQoNCmxpYnJhcnkoZHBseXIpDQoNCmxpYnJhcnkocmVhZHIpDQoNCiNkZl9zcGFjZSA8LSBkYXRhLmZyYW1lKCkNCg0KDQojZm9yIChpIGluIDE6bGVuZ3RoKGFsbF9kYXRhX3BhdGgpKSB7DQogIyByZWFkX2NzdihhbGxfZGF0YV9wYXRoW2ldKSAtPiBkZl9zcGFjZSANCiAgIyAgYmluZF9yb3dzKCkNCiN9DQoNCmRmX3NwYWNlIDwtDQogIGRvLmNhbGwoYmluZF9yb3dzLCBsYXBwbHkoKGFsbF9kYXRhX3BhdGgpLCByZWFkX2NzdikpDQoNCg0KDQpgYGANCg0KDQoNCg0KIyMjIFN1YiBTZWN0aW9uIDIuNQ0KDQrEkOG7jWMgaGFpIGZpbGVzIGThu68gbGnhu4d1IGzhuqduIGzGsOG7o3QgY8OzIGPDoWMgY+G7pW0gdOG7qyB2bm0gdsOgIGZwdCBy4buTaSBz4butIGThu6VuZyBs4buHbmggYmluZF9yb3dzKCkgxJHhu4Mgam9pbiBoYWkgYuG7mSBk4buvIGxp4buHdSBuw6B5IHRow6BuaCBt4buZdCBkYXRhIGZyYW1lIGR1eSBuaOG6pXQNCg0KYGBge3J9DQpsaWJyYXJ5KGdncGxvdDIpDQoNCmlyaXMgJT4lIA0KICBncm91cF9ieShTcGVjaWVzKSAlPiUgDQogIGNvdW50KCkgJT4lIA0KICBnZ3Bsb3QoYWVzKFNwZWNpZXMsIG4sIGZpbGwgPSBTcGVjaWVzKSkgKyANCiAgZ2VvbV9jb2woKQ0KYGBgDQoNCg0KDQojIyMgU3ViIFNlY3Rpb24gMi41DQoNCsSQ4buNYyBoYWkgZmlsZXMgZOG7ryBsaeG7h3UgbOG6p24gbMaw4bujdCBjw7MgY8OhYyBj4bulbSB04burIHZubSB2w6AgZnB0IHLhu5NpIHPhu60gZOG7pW5nIGzhu4duaCBiaW5kX3Jvd3MoKSDEkeG7gyBqb2luIGhhaSBi4buZIGThu68gbGnhu4d1IG7DoHkgdGjDoG5oIG3hu5l0IGRhdGEgZnJhbWUgZHV5IG5o4bqldA0KDQpgYGB7cn0NCg0KbGlicmFyeShnZ3Bsb3QyKQ0KaXJpcyAlPiUgDQogIGdyb3VwX2J5KFNwZWNpZXMpICU+JSANCiAgY291bnQoKSAlPiUgDQogIGdncGxvdChhZXMoU3BlY2llcywgbiwgZmlsbCA9IFNwZWNpZXMpKSArIA0KICBnZW9tX2NvbCgpDQpgYGA=

Day 2 Assignment

R for Data Visualization

Tran Minh Hien

Section 1

Sub Section 1.1

Sub Section 1.2

Section 2

Sub Section 2.1

Sub Section 2.2

Sub Section 2.3

Sub Section 2.4

Sub Section 2.5

Sub Section 2.5

Sub Section 2.5