11/14/2019

Tidyverse

Tidyverse багцын тухай

  • Tidyverse нь өгөгдлийн шинжилгээнд зориулагдсан багцуудын цуглуулга юм. Үүнд: ggplot2, tidyr, tibble, readr, purrr, dplyr болон бусад багцууд хамаарна.
  • Дараах командын тусламжтай багцыг суулгана.
install.packages("tidyverse")

Data wrangling with dplyr and tidyr

library(tidyverse)
library(DT)
datatable(iris, fillContainer = FALSE, options = list(pageLength = 5))

Синтакс

Pipe operator %>%

iris %>% group_by(Species) %>% summarise(avg=mean(Sepal.Length))

Хэлбэрийг өөрчлөх өгөгдөл

economics

Багануудыг мөрөөр цуглуулах

gecon<-gather(economics,"indicators","values",-date)
gecon

Subset observations (Мөр)

econ<-economics %>% filter(date<=as.Date("1970-01-01"))
econ

Subset variables (Багана)

diamonds

diamonds %>% select(starts_with("c"))

Хураангуйлах

diamonds %>% summarise(minimum=min(price),maximum=max(price)) %>%
  print.data.frame()
##   minimum maximum
## 1     326   18823

Бүлэглэх

diamonds %>% group_by(cut)

Шинэ хувьсагч үүсгэх

diamonds %>% mutate(xy=x*y)

Нэгтгэх

df1<-econ %>% select("date","pop")
df2<-econ %>% select("unemploy")
bind_cols(df1,df2)

Ggplot2 - ийн гайхамшиг

Өгөгдлийн хэлбэрийг нь өөрчлөх замаар дараах графикийг дүрслэх боломжтой болно. gecon өгөгдөлийг IV-р хуудсанд олж авсан билээ.

library(scales) # load package to use comma()

my_plot<-ggplot(gecon,aes(x=date,y=values))+
  geom_line(color="darkblue")+scale_y_continuous(labels = scales::comma)+
  facet_wrap(~indicators, scales = "free", ncol = 3) + 
  labs(x="Date",y="values",title="Economics")

# save plot by pdf format in working directory
ggsave(plot =my_plot , filename = "my_plot.pdf", width = 25.4,
       height = 10.73)

Дүрслэл

my_plot

library(plotly)
ggplotly(my_plot) # get interactive plot

Өөр жишээ

head(EuStockMarkets,5)
##          DAX    SMI    CAC   FTSE
## [1,] 1628.75 1678.1 1772.8 2443.6
## [2,] 1613.63 1688.5 1750.5 2460.2
## [3,] 1606.51 1678.6 1718.0 2448.2
## [4,] 1621.04 1684.1 1708.1 2470.4
## [5,] 1618.16 1686.6 1723.1 2484.7
stock<-as.data.frame(EuStockMarkets) %>%
  gather(index,price) %>% 
  mutate(date=rep(time(EuStockMarkets),4))

attach(stock)

plot_ly(x=date, y=price, color = index, mode= "line")

Дүрслэл

attach(gecon)
plot_ly(x=date ,y=values, color = indicators, mode="line")

Leatlet

The birthplace of R

library(leaflet)  # https://rstudio.github.io/leaflet/
leaflet() %>% addTiles() %>%  
  addMarkers(lng=174.768, lat=-36.852, popup="The birthplace of R")

University of financial economics

leaflet() %>% addTiles() %>%
  addMarkers(lng=106.930831, lat=47.918574, popup="UFE")

R хэрхэн сурах вэ?

Хаанаас сурах вэ?

  1. Datacamp
  2. Edx, coursera болон бусад онлайн сургалт
  3. Youtube гэж сайхан багш байна шүү цаана чинь.

Хэнээс асуух вэ?

R ийн хамгийн том давуу тал нь open source. Иймд маш олон хүн хэрэглэдэг бөгөөд бие биеээсээ асуух бололцоотой.

  1. Stackoverflow - асуултаа буруу ойлгуулсан муу жишээ
  2. Facebook groups
  3. Community forum

Талархал /Gratitude/

Thank you my brothers

Michal Siwik

Michal Siwik

Choisuren Mygmar

Choisuren Mygmar

Анхаарал хандуулсан явдалд баярлалаа