Lab1.knit

Introduction to R

Introductions

Office: 19W4th Room 322 (3rd floor)

Getting Started in R

A primary objective of these recitations is to get you working and comfortable with the R Language for Statistical Computing and Graphics. You can download R here and RStudio here if you don’t already have these things installed on your own computer (all computers in the lab should have these pre-installed).

Once these things are installed, you should be able to download the code underlying this RMarkdown document by clicking the “code” button at the top of the web-page. Once downloaded, you will be able to open the file within RStudio and follow/play along!

Before jumping into coding essentials, I thought it would be useful to point you towards some useful and free resources for getting into the R language. Foremost among these is likely R for Data Science by Hadley Wickham and Garrett Grolemund and Hands-On Programming with R by Garrett Grolemund. Both books provide excellent overviews of the essentials you need to get working with R as quickly as possible.

If you already have some experience with R, you might find Hadley Wickham’s Advanced R, ggplot2, or R Markdown: The Definitive Guide by Allaire and Grolemund. These books cover more advanced aspects of the programming language, provide an authoritative take on creating graphics in R, and give a detailed overview of R Markdown (the typesetting approach used to create these lab documents). Once you get these things down, you should be easily able to shift into more advanced applications than will be covered in this course, such as Deep Learning with R or dive right in to exploring the various CRAN Task Views which collect a large number of packages relevant to tasks from Bayesian inference to Natural Language Processing and Machine Learning.

But before we can think of doing any of that, we need to pound out some basics of the R Programming Language.

Some Basics

First thing is first; let’s install/load all of the packages that we will be using, and clear out the environment.

packages <- c("haven","dplyr","ggplot2","countrycode","tidyr","gridExtra","grid",
              "stargazer","tidyselect")
for(i in packages){
  if(!require(i,character.only = T, quietly = T)){
    install.packages(i,repos = "http://cran.us.r-project.org")
  }
  library(i, character.only = T, quietly = T)
}

rm(list=ls())

If you haven’t seen R before that is a bunch of hieroglyphics. Let’s break it down and get a feel for the most basic operations and entities used in the language. First, R is an object oriented programming language. This means that we will create named objects which exist within our working environment that we can then access or manipulate. First, let’s create an object named packages which contains a vector of package names:

packages <- c("haven","dplyr","ggplot2","countrycode","tidyr","gridExtra","grid",
              "stargazer")

This is an example of the most basic operation within R, object assignment. In general, the syntax looks like <object name> <- <stuff> where <- is the most commonly used assignment operator. Suppose we wanted to access only the first three elements of this vector; to do so we can specify the indices we want like so:

packages[1:3]

## [1] "haven"   "dplyr"   "ggplot2"

Note that unlike some other languages, indices in R start at 1 rather than 0. Suppose we wanted the 2nd, 5th, and 8th element of the vector instead. We can do so by supplying a vector thusly:

packages[c(2,5,8)]

## [1] "dplyr"     "tidyr"     "stargazer"

There are a few particularly important classes within R. Above we have a character vector which is comprised of strings. We can check the class of an object with the class function:

class(packages)

## [1] "character"

Other particularly important classes are numeric and factor variables, the former being self descriptive while the latter is the name for categorical data in R. We are able to convert between classes with the as.whatever family of functions. For an example, let’s draw 15 random normal deviates with mean 5 and standard deviation 10 after setting a seed (this ensures that we draw the same pseudo-random samples every time):

set.seed(1234)
num <- rnorm(n = 15, mean = 5, sd = 10)
class(num)

## [1] "numeric"

As expected, our numeric data is, well, numeric. We can convert it to a factor variable with the as.factor function.

fac <- as.character(num)
class(fac)

## [1] "character"

Of note, to convert a factor variable back to numeric an additional step is required. Let’s create a data.frame to see what happens and to learn how to conduct basic modifications of such objects.

dat <- data.frame(num,fac)
dat$wrong <- as.numeric(dat$fac)
dat$right <- as.numeric(as.character(dat$fac))
dat

##            num                fac       wrong       right
## 1   -7.0706575  -7.07065749385421  -7.0706575  -7.0706575
## 2    7.7742924    7.7742924211066   7.7742924   7.7742924
## 3   15.8444118   15.8444117668306  15.8444118  15.8444118
## 4  -18.4569770  -18.4569770262935 -18.4569770 -18.4569770
## 5    9.2912469    9.2912468881105   9.2912469   9.2912469
## 6   10.0605589   10.0605589215757  10.0605589  10.0605589
## 7   -0.7473996 -0.747399601346488  -0.7473996  -0.7473996
## 8   -0.4663186 -0.466318557841871  -0.4663186  -0.4663186
## 9   -0.6445200  -0.64451999093283  -0.6445200  -0.6445200
## 10  -3.9003783  -3.90037829044104  -3.9003783  -3.9003783
## 11   0.2280730   0.22807300246453   0.2280730   0.2280730
## 12  -4.9838644  -4.98386444859704  -4.9838644  -4.9838644
## 13  -2.7625389   -2.7625389463799  -2.7625389  -2.7625389
## 14   5.6445882   5.64458817276269   5.6445882   5.6445882
## 15  14.5949406   14.5949405897077  14.5949406  14.5949406

What we did in the above was create a data.frame with two columns, num and fac. Note that converting from a factor variable directly to numeric returns the factor level rather than the value itself while converting to a character in-between gives us back the correct information.

This is an example of why it is so important for beginners in the R programming language, or any language for that matter, to read the documentation so that mistakes are not made. To access the documentation for a function we can simply ask for help:

help(as.numeric)

R has great documentation and you should always read about functions you are unfamiliar with. Scrolling down a bit we can see under the warning header that “If x is a factor, as.numeric will return the underlying numeric (integer) representation, which is often meaningless as it may not correspond to the factor levels.”

Since we have a data.frame handy, let’s learn how to interact with it. Using the $ operator we can access columns of the data in a straighforward manner:

dat$num

##  [1]  -7.0706575   7.7742924  15.8444118 -18.4569770   9.2912469  10.0605589
##  [7]  -0.7473996  -0.4663186  -0.6445200  -3.9003783   0.2280730  -4.9838644
## [13]  -2.7625389   5.6445882  14.5949406

There are two other useful ways of extracting information from data.frames. First, we can use indices in a way very similar to the above except for noting that now we have both rows AND column indices. For example, we can access the first dat[[of columns 2 and 4 like so:

dat[1:3,c(2,4)]

##                 fac     right
## 1 -7.07065749385421 -7.070657
## 2   7.7742924211066  7.774292
## 3  15.8444117668306 15.844412

Alternatively, we can also call variables by their names like this:

dat[,c("num","fac")]

##            num                fac
## 1   -7.0706575  -7.07065749385421
## 2    7.7742924    7.7742924211066
## 3   15.8444118   15.8444117668306
## 4  -18.4569770  -18.4569770262935
## 5    9.2912469    9.2912468881105
## 6   10.0605589   10.0605589215757
## 7   -0.7473996 -0.747399601346488
## 8   -0.4663186 -0.466318557841871
## 9   -0.6445200  -0.64451999093283
## 10  -3.9003783  -3.90037829044104
## 11   0.2280730   0.22807300246453
## 12  -4.9838644  -4.98386444859704
## 13  -2.7625389   -2.7625389463799
## 14   5.6445882   5.64458817276269
## 15  14.5949406   14.5949405897077

Note that when you leave an index blank you get all of those elements back – in the above we got all of the rows for the two selected columns. Alternatively we could get all of the columns for a particular subset of rows like so:

dat[1:2,]

##         num               fac     wrong     right
## 1 -7.070657 -7.07065749385421 -7.070657 -7.070657
## 2  7.774292   7.7742924211066  7.774292  7.774292

Of particular importance is that the columns of data.frames can be different classes.

c(class(dat$num),class(dat$fac),class(dat$wrong),class(dat$right))

## [1] "numeric"   "character" "numeric"   "numeric"

This is distinct from the matrix class of object, generally only used in particular machine learning libraries or to do matrix algebra in R, but we won’t talk about those things in detail here. Note what happens when we coerce our data.frame to a matrix (note, accessing elements of matrices is almost identical to data.frames except that the $ no longer works):

head(as.matrix(dat))

##      num           fac                 wrong         right        
## [1,] " -7.0706575" "-7.07065749385421" " -7.0706575" " -7.0706575"
## [2,] "  7.7742924" "7.7742924211066"   "  7.7742924" "  7.7742924"
## [3,] " 15.8444118" "15.8444117668306"  " 15.8444118" " 15.8444118"
## [4,] "-18.4569770" "-18.4569770262935" "-18.4569770" "-18.4569770"
## [5,] "  9.2912469" "9.2912468881105"   "  9.2912469" "  9.2912469"
## [6,] " 10.0605589" "10.0605589215757"  " 10.0605589" " 10.0605589"

They are all characters now! We get the same behavior with vectors when combining various classes:

numz <- c(1,2,3)
chaz <- c("a","b","c")
c(numz,chaz)

## [1] "1" "2" "3" "a" "b" "c"

To see why, check out the “Details” section of the help file for the c function.

?c

The final main object type I want to introduce you to is my favorite: lists! They are kind of like a mash between data.frames and vectors in that they are one dimensional but can have elements of any class.

a_list <- list(packages,dat,chaz)
a_list

## [[1]]
## [1] "haven"       "dplyr"       "ggplot2"     "countrycode" "tidyr"      
## [6] "gridExtra"   "grid"        "stargazer"  
## 
## [[2]]
##            num                fac       wrong       right
## 1   -7.0706575  -7.07065749385421  -7.0706575  -7.0706575
## 2    7.7742924    7.7742924211066   7.7742924   7.7742924
## 3   15.8444118   15.8444117668306  15.8444118  15.8444118
## 4  -18.4569770  -18.4569770262935 -18.4569770 -18.4569770
## 5    9.2912469    9.2912468881105   9.2912469   9.2912469
## 6   10.0605589   10.0605589215757  10.0605589  10.0605589
## 7   -0.7473996 -0.747399601346488  -0.7473996  -0.7473996
## 8   -0.4663186 -0.466318557841871  -0.4663186  -0.4663186
## 9   -0.6445200  -0.64451999093283  -0.6445200  -0.6445200
## 10  -3.9003783  -3.90037829044104  -3.9003783  -3.9003783
## 11   0.2280730   0.22807300246453   0.2280730   0.2280730
## 12  -4.9838644  -4.98386444859704  -4.9838644  -4.9838644
## 13  -2.7625389   -2.7625389463799  -2.7625389  -2.7625389
## 14   5.6445882   5.64458817276269   5.6445882   5.6445882
## 15  14.5949406   14.5949405897077  14.5949406  14.5949406
## 
## [[3]]
## [1] "a" "b" "c"

To access their elements we use “double bracked” notation like so:

a_list[[2]]

##            num                fac       wrong       right
## 1   -7.0706575  -7.07065749385421  -7.0706575  -7.0706575
## 2    7.7742924    7.7742924211066   7.7742924   7.7742924
## 3   15.8444118   15.8444117668306  15.8444118  15.8444118
## 4  -18.4569770  -18.4569770262935 -18.4569770 -18.4569770
## 5    9.2912469    9.2912468881105   9.2912469   9.2912469
## 6   10.0605589   10.0605589215757  10.0605589  10.0605589
## 7   -0.7473996 -0.747399601346488  -0.7473996  -0.7473996
## 8   -0.4663186 -0.466318557841871  -0.4663186  -0.4663186
## 9   -0.6445200  -0.64451999093283  -0.6445200  -0.6445200
## 10  -3.9003783  -3.90037829044104  -3.9003783  -3.9003783
## 11   0.2280730   0.22807300246453   0.2280730   0.2280730
## 12  -4.9838644  -4.98386444859704  -4.9838644  -4.9838644
## 13  -2.7625389   -2.7625389463799  -2.7625389  -2.7625389
## 14   5.6445882   5.64458817276269   5.6445882   5.6445882
## 15  14.5949406   14.5949405897077  14.5949406  14.5949406

By the way – if you’d like to install only a single package you might do something like:

install.packages("gamlss")
library(gamlss)

Now that we have those basics in our heads we can start putting R to use.

Loading Data and Setting Paths

We will be using data from Peterson (2017): Export Diversity andd[1:5] Human Rights. You can download the replication archive by clicking here or download the data directly by running the following chunk.

d <- read_dta("https://www.dropbox.com/s/st8ugyfld4se1a5/JCR_final.dta?dl=1")
d

## # A tibble: 5,188 × 18
##    ccode  year twoway inhhi comper polity2 physint conflictonlocation lnpop
##    <dbl> <dbl>  <dbl> <dbl>  <dbl>   <dbl>   <dbl>              <dbl> <dbl>
##  1     2  1981  0.986 0.990  0.997      10       8                  0  19.3
##  2     2  1982  0.988 0.989  0.998      10       8                  0  19.3
##  3     2  1983  0.982 0.989  0.994      10       8                  1  19.3
##  4     2  1984  0.987 0.987  1          10       8                  0  19.3
##  5     2  1985  0.985 0.987  0.998      10       7                  0  19.3
##  6     2  1986  0.980 0.987  0.994      10       7                  0  19.3
##  7     2  1987  0.982 0.987  0.995      10       8                  0  19.3
##  8     2  1988  0.977 0.988  0.989      10       7                  0  19.3
##  9     2  1989  0.980 0.988  0.992      10       7                  1  19.3
## 10     2  1990  0.983 0.988  0.995      10       8                  0  19.4
## # ℹ 5,178 more rows
## # ℹ 9 more variables: lngdppc <dbl>, gdppc <dbl>, expdep <dbl>,
## #   gdpgrowth <dbl>, lib_HK <dbl>, meanarab <dbl>, meanpop <dbl>,
## #   sdarab_manual <dbl>, sdpop_manual <dbl>

The read_dta function comes from the haven package and is useful for reading in datasets from other statistical software like SPSS, STATA, or SAS.

Usually you’ll be loading data from your computer rather than from a link. For this it is important to get a feel for how file paths work on your computer and how to use working directories.

To check your working directory, you can run:

getwd()

## [1] "/Users/aliaelkattan/Documents/1- PhD/Honors Thesis"

To introduce you quickly to a few useful functions, let’s have R

Make us a new folder just off of your current working directory
Save the Peterson data as a .csv
Load that .csv into memory as a different object
Delete that object from memory

dir <- getwd()
path <- paste(dir,"example_folder",sep="/")
dir.create(path)
setwd(path)
write.csv(d,"peterson_2017.csv",row.names = F)
list.files()

## [1] "peterson_2017.csv"

Boom, there it is! Now if we wanted to read in the data we could:

dat_path <- paste(path,"peterson_2017.csv",sep="/")
dat <- read.csv(dat_path)

And boom there it is. Now let’s remove just that:

rm(dat)

Finally, before we get our hands dirty, let’s look at how to take a look at our data for the first time:

summary(d)

##      ccode            year          twoway           inhhi       
##  Min.   :  2.0   Min.   :1981   Min.   :0.0000   Min.   :0.0000  
##  1st Qu.:232.0   1st Qu.:1989   1st Qu.:0.1989   1st Qu.:0.6856  
##  Median :450.0   Median :1996   Median :0.4499   Median :0.8636  
##  Mean   :457.3   Mean   :1996   Mean   :0.4855   Mean   :0.7784  
##  3rd Qu.:670.0   3rd Qu.:2003   3rd Qu.:0.7919   3rd Qu.:0.9545  
##  Max.   :990.0   Max.   :2010   Max.   :0.9882   Max.   :0.9932  
##                                                                  
##      comper           polity2           physint      conflictonlocation
##  Min.   :0.00161   Min.   :-10.000   Min.   :0.000   Min.   :0.0000    
##  1st Qu.:0.32156   1st Qu.: -6.000   1st Qu.:3.000   1st Qu.:0.0000    
##  Median :0.58347   Median :  4.000   Median :5.000   Median :0.0000    
##  Mean   :0.57874   Mean   :  1.746   Mean   :4.838   Mean   :0.1714    
##  3rd Qu.:0.86127   3rd Qu.:  9.000   3rd Qu.:7.000   3rd Qu.:0.0000    
##  Max.   :1.00000   Max.   : 10.000   Max.   :8.000   Max.   :1.0000    
##                    NA's   :808       NA's   :701                       
##      lnpop          lngdppc           gdppc              expdep      
##  Min.   :10.61   Min.   : 4.889   Min.   :   132.8   Min.   :0.0007  
##  1st Qu.:14.67   1st Qu.: 7.455   1st Qu.:  1729.2   1st Qu.:0.0581  
##  Median :15.84   Median : 8.507   Median :  4951.4   Median :0.1164  
##  Mean   :15.67   Mean   : 8.473   Mean   :  9711.5   Mean   :0.1684  
##  3rd Qu.:16.90   3rd Qu.: 9.453   3rd Qu.: 12743.0   3rd Qu.:0.2103  
##  Max.   :21.00   Max.   :11.541   Max.   :102804.8   Max.   :3.7119  
##  NA's   :731     NA's   :731      NA's   :731        NA's   :731     
##    gdpgrowth           lib_HK           meanarab         meanpop         
##  Min.   :-0.6532   Min.   :-0.0142   Min.   : 0.000   Min.   :   0.1193  
##  1st Qu.:-0.0032   1st Qu.:-0.0016   1st Qu.: 7.661   1st Qu.:   6.8294  
##  Median : 0.0347   Median :-0.0002   Median :13.599   Median :  17.0428  
##  Mean   : 0.0377   Mean   : 0.0002   Mean   :15.963   Mean   :  62.5552  
##  3rd Qu.: 0.0742   3rd Qu.: 0.0016   3rd Qu.:24.007   3rd Qu.:  34.3939  
##  Max.   : 1.8620   Max.   : 0.0572   Max.   :73.389   Max.   :1216.1071  
##  NA's   :762       NA's   :1059      NA's   :1209     NA's   :1186       
##  sdarab_manual     sdpop_manual     
##  Min.   : 0.000   Min.   :  0.0000  
##  1st Qu.: 1.423   1st Qu.:  0.6023  
##  Median : 6.301   Median :  8.5648  
##  Mean   : 7.074   Mean   : 40.1050  
##  3rd Qu.:11.619   3rd Qu.: 26.2434  
##  Max.   :30.083   Max.   :629.2051  
##  NA's   :1209     NA's   :1186

Of particular importance is the NA counts representing missing data. This is not only important to take a look at to get a better sense of your data, but also is useful for alerting you to the behavior how functions like mean and sum react to missing data.

c(mean(d$polity2),
  sum(d$polity2))

## [1] NA NA

Checking documentation with ?mean or help(mean) you’ll note the argument na.rm defaults to FALSE. To compute these things omitting the missing values, you would specify:

c(mean(d$polity2, na.rm=T),
  sum(d$polity2, na.rm=TRUE))

## [1]    1.745662 7646.000000

where either T or TRUE can be used to indicate, well, true.

Basic Data Wrangling

When dealing with data, especially text data, certain data wrangling skills are important. Perhaps the most basic task you’ll need to know how to do is select cases and subset data. As with most things in R, there are multiple ways of accomplishing the same goal (base R vs packages, etc).

To get indices which satisfy logical statements you can use the which function

which(d$gdppc > 50000)

##  [1] 1153 1154 1155 1156 1157 1158 1159 1160 1161 1162 1163 1164 2116 2117 2118
## [16] 2119 2120 2121 2122 2123 2124 2125 2126 3981 3982 3983 3984 3985 3986 4017
## [31] 4018 4019 4020 4035 4036 4037 4038 4039 4040 4041 4042 4043 4044 4045 4046
## [46] 4802 4803 4804 4805 4806 4807 4808 4809 4810 4811 4812 4813 4814 4815 4816
## [61] 4817 4818 4820 4821 4823 4824 4825 4826 4827 4828 4830

which(d$gdppc < 2000 & d$polity2 == 10)

## [1] 4277 4278 4279 4280

which(d$gdpgrowth < -.5 | d$gdppc < 100)

## [1] 3040 3369 3717 3805 3967

We can combine this with indexing to subset down the data. We can also call columns in a variety of ways. Remember that you can create objects carrying this information to modularize your code, which might be helpful in particular situations to keep everything clear.

inds <- which(d$gdppc > 50000)
cols <- c("ccode","year","physint","lnpop")

sub1 <- d[inds,cols]
sub1

## # A tibble: 71 × 4
##    ccode  year physint lnpop
##    <dbl> <dbl>   <dbl> <dbl>
##  1   212  1999       8  13.0
##  2   212  2000       8  13.0
##  3   212  2001       8  13.0
##  4   212  2002       8  13.0
##  5   212  2003       8  13.0
##  6   212  2004       8  13.0
##  7   212  2005       8  13.0
##  8   212  2006       8  13.1
##  9   212  2007       8  13.1
## 10   212  2008       8  13.1
## # ℹ 61 more rows

Alternatively, one could use the subset function from base R to get the same result.

sub2 <- subset(d,d$gdppc > 50000,cols)
sub2

## # A tibble: 71 × 4
##    ccode  year physint lnpop
##    <dbl> <dbl>   <dbl> <dbl>
##  1   212  1999       8  13.0
##  2   212  2000       8  13.0
##  3   212  2001       8  13.0
##  4   212  2002       8  13.0
##  5   212  2003       8  13.0
##  6   212  2004       8  13.0
##  7   212  2005       8  13.0
##  8   212  2006       8  13.1
##  9   212  2007       8  13.1
## 10   212  2008       8  13.1
## # ℹ 61 more rows

identical(sub1,sub2)

## [1] TRUE

Another great option is the dplyr package, which is part of the tidyverse alongside the packages haven and ggplot2. One of the best things about the tidyverse family of packages is that they are very well documented, including a variety of cheatsheets and books. One thing that makes the wrangling tools particularly powerful is that they leverage a pipe (%>%) from the magrittr package which says,in pseudo-code, that x %>% f(y) is the same as f(x,y). This can create nice work flow. For example, to get the same subset yet again:

d %>% filter(gdppc > 50000) %>% dplyr::select(all_of(cols)) -> sub3

all(sub1 == sub3, na.rm=T)

## [1] TRUE

Neat. What we did was took our dataframe, filtered the rows that we wanted, and then selected the columns of interest.

If we want to sort data, there is a base R approach for vectors.

head(sort(d$gdpgrowth))

## [1] -0.6532034 -0.6011391 -0.5537450 -0.5498320 -0.5225903 -0.4939937

For dataframes you have to use order, which produces index numbers that can be used as before

d[order(d$gdpgrowth),c("ccode","year","gdpgrowth")]

## # A tibble: 5,188 × 3
##    ccode  year gdpgrowth
##    <dbl> <dbl>     <dbl>
##  1   645  1991    -0.653
##  2   572  2003    -0.601
##  3   517  1994    -0.554
##  4   690  1991    -0.550
##  5   660  1989    -0.523
##  6    92  2007    -0.494
##  7   475  1986    -0.480
##  8   450  1990    -0.475
##  9   373  1993    -0.440
## 10   411  1990    -0.423
## # ℹ 5,178 more rows

We can also switch the ordering around by setting decreasing = T

d[order(d$gdpgrowth,decreasing = T),c("ccode","year","gdpgrowth")]

## # A tibble: 5,188 × 3
##    ccode  year gdpgrowth
##    <dbl> <dbl>     <dbl>
##  1   690  1992     1.86 
##  2   572  2005     1.48 
##  3   450  1997     1.39 
##  4   411  1997     1.38 
##  5    92  2009     1.13 
##  6   411  2002     0.874
##  7   345  1996     0.854
##  8   411  1999     0.788
##  9   552  2010     0.752
## 10   411  1992     0.731
## # ℹ 5,178 more rows

Or we could use the handy %>%. In this case we have to use the placeholder . for the input, which might be handy to know that you can do for more complicated functions.

order(d$gdpgrowth,decreasing = T) %>% 
  d[.,c("ccode","year","gdpgrowth")]

## # A tibble: 5,188 × 3
##    ccode  year gdpgrowth
##    <dbl> <dbl>     <dbl>
##  1   690  1992     1.86 
##  2   572  2005     1.48 
##  3   450  1997     1.39 
##  4   411  1997     1.38 
##  5    92  2009     1.13 
##  6   411  2002     0.874
##  7   345  1996     0.854
##  8   411  1999     0.788
##  9   552  2010     0.752
## 10   411  1992     0.731
## # ℹ 5,178 more rows

Another basic task you’ll want to know how to do is merge datasets together. You may have noticed that the ccode variable isn’t particularly descriptive for which country it means. At the start we loaded in the countrycode package which contains additional information.

codes <- countrycode::codelist_panel

Let’s see what they have.

colnames(codes)

##  [1] "country.name.en"            "year"                      
##  [3] "ar5"                        "cctld"                     
##  [5] "continent"                  "country.name.de"           
##  [7] "country.name.de.regex"      "country.name.en.regex"     
##  [9] "country.name.fr"            "country.name.fr.regex"     
## [11] "country.name.it"            "country.name.it.regex"     
## [13] "cowc"                       "cown"                      
## [15] "currency"                   "dhs"                       
## [17] "ecb"                        "eu28"                      
## [19] "eurocontrol_pru"            "eurocontrol_statfor"       
## [21] "eurostat"                   "fao"                       
## [23] "fips"                       "gaul"                      
## [25] "genc2c"                     "genc3c"                    
## [27] "genc3n"                     "gwc"                       
## [29] "gwn"                        "icao.region"               
## [31] "imf"                        "ioc"                       
## [33] "iso2c"                      "iso3c"                     
## [35] "iso3n"                      "iso4217c"                  
## [37] "iso4217n"                   "p4c"                       
## [39] "p4n"                        "p5c"                       
## [41] "p5n"                        "region"                    
## [43] "region23"                   "un"                        
## [45] "un.region.code"             "un.regionintermediate.code"
## [47] "un.regionsub.code"          "unhcr"                     
## [49] "unhcr.region"               "unicode.symbol"            
## [51] "unpd"                       "vdem"                      
## [53] "wb"                         "wb_api2c"                  
## [55] "wb_api3c"                   "wvs"

The country codes we are currently using are cown. Let’s grab iso3c and region to add to the dataset. We also know that the dataset we are working with only has years from 1981 to 2010, so let’s practice our subsetting skillz

codes <- codes[codes$year %in% 1981:2010,c("cown","year","iso3c","country.name.en","region")]

One thing to pay attention to is losing or gaining observations during a merge. For a great overview, check out this handy NYU Data Services guide.

nrow(d)

## [1] 5188

out1 <- merge(d,codes,by.x=c("ccode","year"),by.y=c("cown","year"))
nrow(out1)

## [1] 5125

out2 <- merge(d,codes,by.x=c("ccode","year"),by.y=c("cown","year"),all.x=T)
nrow(out2)

## [1] 5188

out3 <- merge(d,codes,by.x=c("ccode","year"),by.y=c("cown","year"),all.y=T)
nrow(out3)

## [1] 5621

out4 <- merge(d,codes,by.x=c("ccode","year"),by.y=c("cown","year"),all=T)
nrow(out4)

## [1] 5684

And, of course, we can do the same merges using dplyr with inner_join, left_join, right_join, and full_join respectively. Going forward we will keep out2 as the working dataset.

Another basic task you’ll want to know how to do is calculate aggregates and summaries. There are a number of great things you can do with the apply family of functions, including easily going in parallel with the pbapply package. If you are interested in more details on this you should check out this tutorial and this taskview. We will focus on using dplyr to calculate summaries of interest.

One reason for this is that it is super easy to calculate summaries grouping on another variable. For example, if we wanted to think about regional variation in gdppc we could

out2 %>% 
  group_by(region) %>% 
  summarize(mean=mean(gdppc,na.rm=T),
            sd=sd(gdppc,na.rm=T),
            sum=sum(gdppc,na.rm=T))

## # A tibble: 8 × 4
##   region                       mean     sd       sum
##   <chr>                       <dbl>  <dbl>     <dbl>
## 1 East Asia & Pacific        13583. 15207.  6071507.
## 2 Europe & Central Asia      16667. 11640. 18734205.
## 3 Latin America & Caribbean   7137.  4608.  6194691.
## 4 Middle East & North Africa 13735. 17320.  6881093.
## 5 North America              32391.  5598.  1943448.
## 6 South Asia                  2619.  2070.   549891.
## 7 Sub-Saharan Africa          2048.  2652.  2523069.
## 8 <NA>                       25760. 24903.   386395.

We can also use the mutate function to add this information to our dataframe. In base R this would take mergeing the output of aggregate, so it can certainly be done, but dplyr makes it somewhat more straightforward and scaleable.

out2 %>% 
  group_by(region) %>% 
  mutate(mean_gdppc=mean(gdppc,na.rm=T),
         sd_gdppc=sd(gdppc,na.rm=T)) -> out2

out2

## # A tibble: 5,188 × 23
## # Groups:   region [8]
##    ccode  year twoway inhhi comper polity2 physint conflictonlocation lnpop
##    <dbl> <dbl>  <dbl> <dbl>  <dbl>   <dbl>   <dbl>              <dbl> <dbl>
##  1     2  1981  0.986 0.990  0.997      10       8                  0  19.3
##  2     2  1982  0.988 0.989  0.998      10       8                  0  19.3
##  3     2  1983  0.982 0.989  0.994      10       8                  1  19.3
##  4     2  1984  0.987 0.987  1          10       8                  0  19.3
##  5     2  1985  0.985 0.987  0.998      10       7                  0  19.3
##  6     2  1986  0.980 0.987  0.994      10       7                  0  19.3
##  7     2  1987  0.982 0.987  0.995      10       8                  0  19.3
##  8     2  1988  0.977 0.988  0.989      10       7                  0  19.3
##  9     2  1989  0.980 0.988  0.992      10       7                  1  19.3
## 10     2  1990  0.983 0.988  0.995      10       8                  0  19.4
## # ℹ 5,178 more rows
## # ℹ 14 more variables: lngdppc <dbl>, gdppc <dbl>, expdep <dbl>,
## #   gdpgrowth <dbl>, lib_HK <dbl>, meanarab <dbl>, meanpop <dbl>,
## #   sdarab_manual <dbl>, sdpop_manual <dbl>, iso3c <chr>,
## #   country.name.en <chr>, region <chr>, mean_gdppc <dbl>, sd_gdppc <dbl>

A base R version of the above might be

a1 <- aggregate(out2$gdppc,by=list(out2$region),mean,na.rm=T)
a1

##                      Group.1         x
## 1        East Asia & Pacific 13582.789
## 2      Europe & Central Asia 16667.442
## 3  Latin America & Caribbean  7136.741
## 4 Middle East & North Africa 13734.717
## 5              North America 32390.804
## 6                 South Asia  2618.530
## 7         Sub-Saharan Africa  2047.946

colnames(a1) <- c("region","mean_gdppc")
a2 <- aggregate(out2$gdppc,by=list(out2$region),sd,na.rm=T)
colnames(a2) <- c("region","sd_gdppc")

t1 <- merge(out2,a1,by="region")
t2 <- merge(t1,a2,by="region")
tbl_df(t2)

## Warning: `tbl_df()` was deprecated in dplyr 1.0.0.
## ℹ Please use `tibble::as_tibble()` instead.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.

## # A tibble: 5,125 × 25
##    region     ccode  year twoway inhhi comper polity2 physint conflictonlocation
##    <chr>      <dbl> <dbl>  <dbl> <dbl>  <dbl>   <dbl>   <dbl>              <dbl>
##  1 East Asia…   712  1995  0.187 0.781  0.240       9       6                  0
##  2 East Asia…   710  2009  0.974 0.976  0.998      -7       0                  0
##  3 East Asia…   712  1994  0.218 0.858  0.254       9       7                  0
##  4 East Asia…   712  2003  0.293 0.802  0.366      10       6                  0
##  5 East Asia…   712  1996  0.222 0.747  0.297      10       7                  0
##  6 East Asia…   712  1997  0.248 0.760  0.326      10       7                  0
##  7 East Asia…   712  2002  0.294 0.796  0.369      10       7                  0
##  8 East Asia…   740  1983  0.940 0.963  0.976      10       8                  0
##  9 East Asia…   712  2004  0.335 0.782  0.428      10       5                  0
## 10 East Asia…   712  1991  0.192 0.873  0.220       2       8                  0
## # ℹ 5,115 more rows
## # ℹ 16 more variables: lnpop <dbl>, lngdppc <dbl>, gdppc <dbl>, expdep <dbl>,
## #   gdpgrowth <dbl>, lib_HK <dbl>, meanarab <dbl>, meanpop <dbl>,
## #   sdarab_manual <dbl>, sdpop_manual <dbl>, iso3c <chr>,
## #   country.name.en <chr>, mean_gdppc.x <dbl>, sd_gdppc.x <dbl>,
## #   mean_gdppc.y <dbl>, sd_gdppc.y <dbl>

but the dplyr approach really is quite nice.

Basic Plotting

We will focus on using ggplot2 for graphics in R, although base R has nice capabilities on its own. ggplot is all about the `grammar of graphics’ which follows a layered approach to describe and construct graphics in a structured manner. To begin, we will always initialize a plot:

p1 <- ggplot(out2[which(out2$region == "North America"),], aes(x=log(gdppc)))

To get different plots, we will add layers. For example, if we wanted a dot plot

p1 + geom_dotplot(binwidth=0.1)

or a histogram

p1 + geom_histogram(binwidth=0.1)

or a density plot

p1 + geom_density()

we can just add a different layer to the same underlying plot.

The order of the layers does not matter, and there are a bunch more customizations that we can add.

p1 + geom_histogram(color="red",fill="red",binwidth = 0.03) +
     xlab("Natural Log of Per Capita GDP") +
     ylab("Frequency") +
     ggtitle('North American GDPPC') +
     theme_bw()  -> g1
g1

You can also add multiple geometries to the same underderlying plot.

p2 <- ggplot(out2[which(out2$region == "South Asia"),],aes(x=year,y=log(gdppc),color=iso3c))
p2  + geom_point(na.rm=T) + 
      geom_line(na.rm=T) +
      labs(color="Country") +
      scale_color_brewer(palette="Spectral")  -> g2
g2

You can even add some smoothers if you want.

p3 <- ggplot(out3[which(out3$iso3c=="RUS"),],aes(x=year,y=gdppc))
p3 + geom_point(na.rm=T) +
     geom_smooth(color ="gray", method = "lm", se = TRUE,na.rm=T, formula=y~x)

p3 <- ggplot(out3[which(out3$iso3c=="RUS"),],aes(x=year,y=gdppc))
p3 + geom_point(na.rm=T) +
     geom_smooth(color ="gray", method = "loess", se = TRUE,formula=y~x, na.rm=T) -> g3
g3

Two last notes on plots – faceting and adding plots together into a larger image.

Faceting can be a nice way to break up a continuous variable by category.

p4 <- ggplot(na.omit(out2[which(out2$region %in% c("Europe & Central Asia","Middle East & North Africa")),]),aes(x=log(gdppc)))
p4 + geom_histogram(binwidth = 0.1) + 
     facet_grid(region ~ .)

p4 <- ggplot(na.omit(out2[which(out2$region %in% c("Europe & Central Asia","Middle East & North Africa")),]),aes(x=log(gdppc)))
p4 + geom_histogram(binwidth = 0.1) + 
     facet_grid(. ~ region)

Once we do all that, we might want to add multiple plots together into a larger multi-panel graphic. The gridExtra package is great for this.

grid.arrange(g1,g2,g3,textGrob("Spiffy!"),ncol=2,nrow=2)

LS0tCnRpdGxlOiAiIgphdXRob3I6ICJDaHJpc3RvcGhlciBTY2h3YXJ6LCBlZGl0cyBieSBBbGlhIEVsS2F0dGFuIgpwYWdlczoKICBleHRyYTogdHJ1ZQpvdXRwdXQ6IAogIGh0bWxfZG9jdW1lbnQ6CiAgICB0b2M6IHRydWUKICAgIHRvY19kZXB0aDogMwogICAgdG9jX2Zsb2F0OiB0cnVlCiAgICBjb2RlX2Rvd25sb2FkOiB0cnVlCi0tLQoKYGBge3Igc2V0dXAsIGluY2x1ZGU9RkFMU0V9CmtuaXRyOjpvcHRzX2NodW5rJHNldChlY2hvID0gVFJVRSkKYGBgCgojIyBJbnRyb2R1Y3Rpb24gdG8gUgoKIyMjIEludHJvZHVjdGlvbnMKCkVtYWlsOiBbYWFlMzIyXEBueXUuZWR1XShtYWlsdG86YWFlMzIyQG55dS5lZHUpey5lbWFpbH0KCk9mZmljZTogMTlXNHRoIFJvb20gMzIyICgzcmQgZmxvb3IpCgoKIyMjIEdldHRpbmcgU3RhcnRlZCBpbiBSCgpBIHByaW1hcnkgb2JqZWN0aXZlIG9mIHRoZXNlIHJlY2l0YXRpb25zIGlzIHRvIGdldCB5b3Ugd29ya2luZyBhbmQgY29tZm9ydGFibGUgd2l0aCB0aGUgUiBMYW5ndWFnZSBmb3IgU3RhdGlzdGljYWwgQ29tcHV0aW5nIGFuZCBHcmFwaGljcy4gWW91IGNhbiBkb3dubG9hZCBSIFtoZXJlXShodHRwczovL2Nsb3VkLnItcHJvamVjdC5vcmcvKSBhbmQgUlN0dWRpbyBbaGVyZV0oaHR0cHM6Ly93d3cucnN0dWRpby5jb20vcHJvZHVjdHMvcnN0dWRpby9kb3dubG9hZC8jZG93bmxvYWQpIGlmIHlvdSBkb24ndCBhbHJlYWR5IGhhdmUgdGhlc2UgdGhpbmdzIGluc3RhbGxlZCBvbiB5b3VyIG93biBjb21wdXRlciAoYWxsIGNvbXB1dGVycyBpbiB0aGUgbGFiIHNob3VsZCBoYXZlIHRoZXNlIHByZS1pbnN0YWxsZWQpLgoKT25jZSB0aGVzZSB0aGluZ3MgYXJlIGluc3RhbGxlZCwgeW91IHNob3VsZCBiZSBhYmxlIHRvIGRvd25sb2FkIHRoZSBjb2RlIHVuZGVybHlpbmcgdGhpcyBSTWFya2Rvd24gZG9jdW1lbnQgYnkgY2xpY2tpbmcgdGhlICJjb2RlIiBidXR0b24gYXQgdGhlIHRvcCBvZiB0aGUgd2ViLXBhZ2UuIE9uY2UgZG93bmxvYWRlZCwgeW91IHdpbGwgYmUgYWJsZSB0byBvcGVuIHRoZSBmaWxlIHdpdGhpbiBSU3R1ZGlvIGFuZCBmb2xsb3cvcGxheSBhbG9uZyEKCkJlZm9yZSBqdW1waW5nIGludG8gY29kaW5nIGVzc2VudGlhbHMsIEkgdGhvdWdodCBpdCB3b3VsZCBiZSB1c2VmdWwgdG8gcG9pbnQgeW91IHRvd2FyZHMgc29tZSB1c2VmdWwgYW5kIGZyZWUgcmVzb3VyY2VzIGZvciBnZXR0aW5nIGludG8gdGhlIFIgbGFuZ3VhZ2UuIEZvcmVtb3N0IGFtb25nIHRoZXNlIGlzIGxpa2VseSBbUiBmb3IgRGF0YSBTY2llbmNlXShodHRwczovL3I0ZHMuaGFkLmNvLm56LykgYnkgSGFkbGV5IFdpY2toYW0gYW5kIEdhcnJldHQgR3JvbGVtdW5kIGFuZCBbSGFuZHMtT24gUHJvZ3JhbW1pbmcgd2l0aCBSXShodHRwczovL3JzdHVkaW8tZWR1Y2F0aW9uLmdpdGh1Yi5pby9ob3ByLykgYnkgR2FycmV0dCBHcm9sZW11bmQuIEJvdGggYm9va3MgcHJvdmlkZSBleGNlbGxlbnQgb3ZlcnZpZXdzIG9mIHRoZSBlc3NlbnRpYWxzIHlvdSBuZWVkIHRvIGdldCB3b3JraW5nIHdpdGggUiBhcyBxdWlja2x5IGFzIHBvc3NpYmxlLgoKSWYgeW91IGFscmVhZHkgaGF2ZSBzb21lIGV4cGVyaWVuY2Ugd2l0aCBSLCB5b3UgbWlnaHQgZmluZCBIYWRsZXkgV2lja2hhbSdzIFtBZHZhbmNlZCBSXShodHRwczovL2Fkdi1yLmhhZGxleS5uei8pLCBbZ2dwbG90Ml0oaHR0cHM6Ly9nZ3Bsb3QyLWJvb2sub3JnLyksIG9yIFtSIE1hcmtkb3duOiBUaGUgRGVmaW5pdGl2ZSBHdWlkZV0oaHR0cHM6Ly9ib29rZG93bi5vcmcveWlodWkvcm1hcmtkb3duLykgYnkgQWxsYWlyZSBhbmQgR3JvbGVtdW5kLiBUaGVzZSBib29rcyBjb3ZlciBtb3JlIGFkdmFuY2VkIGFzcGVjdHMgb2YgdGhlIHByb2dyYW1taW5nIGxhbmd1YWdlLCBwcm92aWRlIGFuIGF1dGhvcml0YXRpdmUgdGFrZSBvbiBjcmVhdGluZyBncmFwaGljcyBpbiBSLCBhbmQgZ2l2ZSBhIGRldGFpbGVkIG92ZXJ2aWV3IG9mIFIgTWFya2Rvd24gKHRoZSB0eXBlc2V0dGluZyBhcHByb2FjaCB1c2VkIHRvIGNyZWF0ZSB0aGVzZSBsYWIgZG9jdW1lbnRzKS4gT25jZSB5b3UgZ2V0IHRoZXNlIHRoaW5ncyBkb3duLCB5b3Ugc2hvdWxkIGJlIGVhc2lseSBhYmxlIHRvIHNoaWZ0IGludG8gbW9yZSBhZHZhbmNlZCBhcHBsaWNhdGlvbnMgdGhhbiB3aWxsIGJlIGNvdmVyZWQgaW4gdGhpcyBjb3Vyc2UsIHN1Y2ggYXMgW0RlZXAgTGVhcm5pbmcgd2l0aCBSXShodHRwczovL2xpdmVib29rLm1hbm5pbmcuY29tL2Jvb2svZGVlcC1sZWFybmluZy13aXRoLXIvY2hhcHRlci0xLykgb3IgZGl2ZSByaWdodCBpbiB0byBleHBsb3JpbmcgdGhlIHZhcmlvdXMgW0NSQU4gVGFzayBWaWV3c10oaHR0cHM6Ly9jcmFuLnItcHJvamVjdC5vcmcvd2ViL3ZpZXdzLykgd2hpY2ggY29sbGVjdCBhIGxhcmdlIG51bWJlciBvZiBwYWNrYWdlcyByZWxldmFudCB0byB0YXNrcyBmcm9tIEJheWVzaWFuIGluZmVyZW5jZSB0byBOYXR1cmFsIExhbmd1YWdlIFByb2Nlc3NpbmcgYW5kIE1hY2hpbmUgTGVhcm5pbmcuCgpCdXQgYmVmb3JlIHdlIGNhbiB0aGluayBvZiBkb2luZyBhbnkgb2YgdGhhdCwgd2UgbmVlZCB0byBwb3VuZCBvdXQgc29tZSBiYXNpY3Mgb2YgdGhlIFIgUHJvZ3JhbW1pbmcgTGFuZ3VhZ2UuCgojIyMgU29tZSBCYXNpY3MKCkZpcnN0IHRoaW5nIGlzIGZpcnN0OyBsZXQncyBpbnN0YWxsL2xvYWQgYWxsIG9mIHRoZSBwYWNrYWdlcyB0aGF0IHdlIHdpbGwgYmUgdXNpbmcsIGFuZCBjbGVhciBvdXQgdGhlIGVudmlyb25tZW50LgoKYGBge3IgbWVzc2FnZT1GQUxTRSwgd2FybmluZz1GQUxTRX0KcGFja2FnZXMgPC0gYygiaGF2ZW4iLCJkcGx5ciIsImdncGxvdDIiLCJjb3VudHJ5Y29kZSIsInRpZHlyIiwiZ3JpZEV4dHJhIiwiZ3JpZCIsCiAgICAgICAgICAgICAgInN0YXJnYXplciIsInRpZHlzZWxlY3QiKQpmb3IoaSBpbiBwYWNrYWdlcyl7CiAgaWYoIXJlcXVpcmUoaSxjaGFyYWN0ZXIub25seSA9IFQsIHF1aWV0bHkgPSBUKSl7CiAgICBpbnN0YWxsLnBhY2thZ2VzKGkscmVwb3MgPSAiaHR0cDovL2NyYW4udXMuci1wcm9qZWN0Lm9yZyIpCiAgfQogIGxpYnJhcnkoaSwgY2hhcmFjdGVyLm9ubHkgPSBULCBxdWlldGx5ID0gVCkKfQoKcm0obGlzdD1scygpKQpgYGAKCklmIHlvdSBoYXZlbid0IHNlZW4gUiBiZWZvcmUgdGhhdCBpcyBhIGJ1bmNoIG9mIGhpZXJvZ2x5cGhpY3MuIExldCdzIGJyZWFrIGl0IGRvd24gYW5kIGdldCBhIGZlZWwgZm9yIHRoZSBtb3N0IGJhc2ljIG9wZXJhdGlvbnMgYW5kIGVudGl0aWVzIHVzZWQgaW4gdGhlIGxhbmd1YWdlLiBGaXJzdCwgUiBpcyBhbiBvYmplY3Qgb3JpZW50ZWQgcHJvZ3JhbW1pbmcgbGFuZ3VhZ2UuIFRoaXMgbWVhbnMgdGhhdCB3ZSB3aWxsIGNyZWF0ZSBuYW1lZCBvYmplY3RzIHdoaWNoIGV4aXN0IHdpdGhpbiBvdXIgd29ya2luZyBlbnZpcm9ubWVudCB0aGF0IHdlIGNhbiB0aGVuIGFjY2VzcyBvciBtYW5pcHVsYXRlLiBGaXJzdCwgbGV0J3MgY3JlYXRlIGFuIG9iamVjdCBuYW1lZCBgcGFja2FnZXNgIHdoaWNoIGNvbnRhaW5zIGEgKip2ZWN0b3IqKiBvZiAqKnBhY2thZ2UgbmFtZXMqKjoKCmBgYHtyfQpwYWNrYWdlcyA8LSBjKCJoYXZlbiIsImRwbHlyIiwiZ2dwbG90MiIsImNvdW50cnljb2RlIiwidGlkeXIiLCJncmlkRXh0cmEiLCJncmlkIiwKICAgICAgICAgICAgICAic3RhcmdhemVyIikKYGBgCgpUaGlzIGlzIGFuIGV4YW1wbGUgb2YgdGhlIG1vc3QgYmFzaWMgb3BlcmF0aW9uIHdpdGhpbiBSLCAqKm9iamVjdCBhc3NpZ25tZW50KiouIEluIGdlbmVyYWwsIHRoZSBzeW50YXggbG9va3MgbGlrZSBgPG9iamVjdCBuYW1lPiA8LSA8c3R1ZmY+YCB3aGVyZSBgPC1gIGlzIHRoZSBtb3N0IGNvbW1vbmx5IHVzZWQgKiphc3NpZ25tZW50IG9wZXJhdG9yKiouIFN1cHBvc2Ugd2Ugd2FudGVkIHRvIGFjY2VzcyBvbmx5IHRoZSBmaXJzdCB0aHJlZSBlbGVtZW50cyBvZiB0aGlzIHZlY3RvcjsgdG8gZG8gc28gd2UgY2FuIHNwZWNpZnkgdGhlIGluZGljZXMgd2Ugd2FudCBsaWtlIHNvOgoKYGBge3J9CnBhY2thZ2VzWzE6M10KYGBgCgpOb3RlIHRoYXQgdW5saWtlIHNvbWUgb3RoZXIgbGFuZ3VhZ2VzLCBpbmRpY2VzIGluIFIgc3RhcnQgYXQgMSByYXRoZXIgdGhhbiAwLiBTdXBwb3NlIHdlIHdhbnRlZCB0aGUgMm5kLCA1dGgsIGFuZCA4dGggZWxlbWVudCBvZiB0aGUgdmVjdG9yIGluc3RlYWQuIFdlIGNhbiBkbyBzbyBieSBzdXBwbHlpbmcgYSB2ZWN0b3IgdGh1c2x5OgoKYGBge3J9CnBhY2thZ2VzW2MoMiw1LDgpXQpgYGAKClRoZXJlIGFyZSBhIGZldyBwYXJ0aWN1bGFybHkgaW1wb3J0YW50ICoqY2xhc3NlcyoqIHdpdGhpbiBSLiBBYm92ZSB3ZSBoYXZlIGEgKipjaGFyYWN0ZXIqKiB2ZWN0b3Igd2hpY2ggaXMgY29tcHJpc2VkIG9mICoqc3RyaW5ncyoqLiBXZSBjYW4gY2hlY2sgdGhlIGNsYXNzIG9mIGFuIG9iamVjdCB3aXRoIHRoZSBgY2xhc3NgIGZ1bmN0aW9uOgoKYGBge3J9CmNsYXNzKHBhY2thZ2VzKQpgYGAKCk90aGVyIHBhcnRpY3VsYXJseSBpbXBvcnRhbnQgY2xhc3NlcyBhcmUgKipudW1lcmljKiogYW5kICoqZmFjdG9yKiogdmFyaWFibGVzLCB0aGUgZm9ybWVyIGJlaW5nIHNlbGYgZGVzY3JpcHRpdmUgd2hpbGUgdGhlIGxhdHRlciBpcyB0aGUgbmFtZSBmb3IgY2F0ZWdvcmljYWwgZGF0YSBpbiBSLiBXZSBhcmUgYWJsZSB0byBjb252ZXJ0IGJldHdlZW4gY2xhc3NlcyB3aXRoIHRoZSBgYXMud2hhdGV2ZXJgIGZhbWlseSBvZiBmdW5jdGlvbnMuIEZvciBhbiBleGFtcGxlLCBsZXQncyBkcmF3IDE1IHJhbmRvbSBub3JtYWwgZGV2aWF0ZXMgd2l0aCBtZWFuIDUgYW5kIHN0YW5kYXJkIGRldmlhdGlvbiAxMCBhZnRlciBzZXR0aW5nIGEgKipzZWVkKiogKHRoaXMgZW5zdXJlcyB0aGF0IHdlIGRyYXcgdGhlIHNhbWUgcHNldWRvLXJhbmRvbSBzYW1wbGVzIGV2ZXJ5IHRpbWUpOgoKYGBge3J9CnNldC5zZWVkKDEyMzQpCm51bSA8LSBybm9ybShuID0gMTUsIG1lYW4gPSA1LCBzZCA9IDEwKQpjbGFzcyhudW0pCmBgYAoKQXMgZXhwZWN0ZWQsIG91ciBudW1lcmljIGRhdGEgaXMsIHdlbGwsIG51bWVyaWMuIFdlIGNhbiBjb252ZXJ0IGl0IHRvIGEgZmFjdG9yIHZhcmlhYmxlIHdpdGggdGhlIGBhcy5mYWN0b3JgIGZ1bmN0aW9uLgoKYGBge3J9CmZhYyA8LSBhcy5jaGFyYWN0ZXIobnVtKQpjbGFzcyhmYWMpCmBgYAoKT2Ygbm90ZSwgdG8gY29udmVydCBhIGZhY3RvciB2YXJpYWJsZSBiYWNrIHRvIG51bWVyaWMgYW4gYWRkaXRpb25hbCBzdGVwIGlzIHJlcXVpcmVkLiBMZXQncyBjcmVhdGUgYSBgZGF0YS5mcmFtZWAgdG8gc2VlIHdoYXQgaGFwcGVucyBhbmQgdG8gbGVhcm4gaG93IHRvIGNvbmR1Y3QgYmFzaWMgbW9kaWZpY2F0aW9ucyBvZiBzdWNoIG9iamVjdHMuCgpgYGB7cn0KZGF0IDwtIGRhdGEuZnJhbWUobnVtLGZhYykKZGF0JHdyb25nIDwtIGFzLm51bWVyaWMoZGF0JGZhYykKZGF0JHJpZ2h0IDwtIGFzLm51bWVyaWMoYXMuY2hhcmFjdGVyKGRhdCRmYWMpKQpkYXQKYGBgCgpXaGF0IHdlIGRpZCBpbiB0aGUgYWJvdmUgd2FzIGNyZWF0ZSBhIGBkYXRhLmZyYW1lYCB3aXRoIHR3byBjb2x1bW5zLCBgbnVtYCBhbmQgYGZhY2AuIE5vdGUgdGhhdCBjb252ZXJ0aW5nIGZyb20gYSBmYWN0b3IgdmFyaWFibGUgZGlyZWN0bHkgdG8gbnVtZXJpYyByZXR1cm5zIHRoZSBmYWN0b3IgbGV2ZWwgcmF0aGVyIHRoYW4gdGhlIHZhbHVlIGl0c2VsZiB3aGlsZSBjb252ZXJ0aW5nIHRvIGEgY2hhcmFjdGVyIGluLWJldHdlZW4gZ2l2ZXMgdXMgYmFjayB0aGUgY29ycmVjdCBpbmZvcm1hdGlvbi4KClRoaXMgaXMgYW4gZXhhbXBsZSBvZiB3aHkgaXQgaXMgc28gaW1wb3J0YW50IGZvciBiZWdpbm5lcnMgaW4gdGhlIFIgcHJvZ3JhbW1pbmcgbGFuZ3VhZ2UsIG9yIGFueSBsYW5ndWFnZSBmb3IgdGhhdCBtYXR0ZXIsIHRvICoqcmVhZCB0aGUgZG9jdW1lbnRhdGlvbioqIHNvIHRoYXQgbWlzdGFrZXMgYXJlIG5vdCBtYWRlLiBUbyBhY2Nlc3MgdGhlIGRvY3VtZW50YXRpb24gZm9yIGEgZnVuY3Rpb24gd2UgY2FuIHNpbXBseSBhc2sgZm9yIGhlbHA6CgpgYGB7ciBldmFsPUZ9CmhlbHAoYXMubnVtZXJpYykKYGBgCgpSIGhhcyBncmVhdCBkb2N1bWVudGF0aW9uIGFuZCB5b3Ugc2hvdWxkIGFsd2F5cyByZWFkIGFib3V0IGZ1bmN0aW9ucyB5b3UgYXJlIHVuZmFtaWxpYXIgd2l0aC4gU2Nyb2xsaW5nIGRvd24gYSBiaXQgd2UgY2FuIHNlZSB1bmRlciB0aGUgd2FybmluZyBoZWFkZXIgdGhhdCAiSWYgeCBpcyBhIGZhY3RvciwgYXMubnVtZXJpYyB3aWxsIHJldHVybiB0aGUgdW5kZXJseWluZyBudW1lcmljIChpbnRlZ2VyKSByZXByZXNlbnRhdGlvbiwgd2hpY2ggaXMgb2Z0ZW4gbWVhbmluZ2xlc3MgYXMgaXQgbWF5IG5vdCBjb3JyZXNwb25kIHRvIHRoZSBmYWN0b3IgbGV2ZWxzLiIKClNpbmNlIHdlIGhhdmUgYSBgZGF0YS5mcmFtZWAgaGFuZHksIGxldCdzIGxlYXJuIGhvdyB0byBpbnRlcmFjdCB3aXRoIGl0LiBVc2luZyB0aGUgYCRgIG9wZXJhdG9yIHdlIGNhbiBhY2Nlc3MgY29sdW1ucyBvZiB0aGUgZGF0YSBpbiBhIHN0cmFpZ2hmb3J3YXJkIG1hbm5lcjoKCmBgYHtyfQpkYXQkbnVtCmBgYAoKVGhlcmUgYXJlIHR3byBvdGhlciB1c2VmdWwgd2F5cyBvZiBleHRyYWN0aW5nIGluZm9ybWF0aW9uIGZyb20gYGRhdGEuZnJhbWVgcy4gRmlyc3QsIHdlIGNhbiB1c2UgaW5kaWNlcyBpbiBhIHdheSB2ZXJ5IHNpbWlsYXIgdG8gdGhlIGFib3ZlIGV4Y2VwdCBmb3Igbm90aW5nIHRoYXQgbm93IHdlIGhhdmUgYm90aCByb3dzIEFORCBjb2x1bW4gaW5kaWNlcy4gRm9yIGV4YW1wbGUsIHdlIGNhbiBhY2Nlc3MgdGhlIGZpcnN0IGRhdFtbb2YgY29sdW1ucyAyIGFuZCA0IGxpa2Ugc286CgpgYGB7cn0KZGF0WzE6MyxjKDIsNCldCmBgYAoKQWx0ZXJuYXRpdmVseSwgd2UgY2FuIGFsc28gY2FsbCB2YXJpYWJsZXMgYnkgdGhlaXIgbmFtZXMgbGlrZSB0aGlzOgoKYGBge3J9CmRhdFssYygibnVtIiwiZmFjIildCmBgYAoKTm90ZSB0aGF0IHdoZW4geW91IGxlYXZlIGFuIGluZGV4IGJsYW5rIHlvdSBnZXQgYWxsIG9mIHRob3NlIGVsZW1lbnRzIGJhY2sgLS0gaW4gdGhlIGFib3ZlIHdlIGdvdCBhbGwgb2YgdGhlIHJvd3MgZm9yIHRoZSB0d28gc2VsZWN0ZWQgY29sdW1ucy4gQWx0ZXJuYXRpdmVseSB3ZSBjb3VsZCBnZXQgYWxsIG9mIHRoZSBjb2x1bW5zIGZvciBhIHBhcnRpY3VsYXIgc3Vic2V0IG9mIHJvd3MgbGlrZSBzbzoKCmBgYHtyfQpkYXRbMToyLF0KYGBgCgpPZiBwYXJ0aWN1bGFyIGltcG9ydGFuY2UgaXMgdGhhdCB0aGUgY29sdW1ucyBvZiBgZGF0YS5mcmFtZWBzIGNhbiBiZSBkaWZmZXJlbnQgY2xhc3Nlcy4KCmBgYHtyfQpjKGNsYXNzKGRhdCRudW0pLGNsYXNzKGRhdCRmYWMpLGNsYXNzKGRhdCR3cm9uZyksY2xhc3MoZGF0JHJpZ2h0KSkKYGBgCgpUaGlzIGlzIGRpc3RpbmN0IGZyb20gdGhlIGBtYXRyaXhgIGNsYXNzIG9mIG9iamVjdCwgZ2VuZXJhbGx5IG9ubHkgdXNlZCBpbiBwYXJ0aWN1bGFyIG1hY2hpbmUgbGVhcm5pbmcgbGlicmFyaWVzIG9yIHRvIGRvIG1hdHJpeCBhbGdlYnJhIGluIFIsIGJ1dCB3ZSB3b24ndCB0YWxrIGFib3V0IHRob3NlIHRoaW5ncyBpbiBkZXRhaWwgaGVyZS4gTm90ZSB3aGF0IGhhcHBlbnMgd2hlbiB3ZSBjb2VyY2Ugb3VyIGBkYXRhLmZyYW1lYCB0byBhIG1hdHJpeCAobm90ZSwgYWNjZXNzaW5nIGVsZW1lbnRzIG9mIG1hdHJpY2VzIGlzIGFsbW9zdCBpZGVudGljYWwgdG8gYGRhdGEuZnJhbWVgcyBleGNlcHQgdGhhdCB0aGUgYCRgIG5vIGxvbmdlciB3b3Jrcyk6CgpgYGB7cn0KaGVhZChhcy5tYXRyaXgoZGF0KSkKYGBgCgpUaGV5IGFyZSBhbGwgY2hhcmFjdGVycyBub3chIFdlIGdldCB0aGUgc2FtZSBiZWhhdmlvciB3aXRoIHZlY3RvcnMgd2hlbiBjb21iaW5pbmcgdmFyaW91cyBjbGFzc2VzOgoKYGBge3J9Cm51bXogPC0gYygxLDIsMykKY2hheiA8LSBjKCJhIiwiYiIsImMiKQpjKG51bXosY2hheikKYGBgCgpUbyBzZWUgd2h5LCBjaGVjayBvdXQgdGhlICJEZXRhaWxzIiBzZWN0aW9uIG9mIHRoZSBoZWxwIGZpbGUgZm9yIHRoZSBgY2AgZnVuY3Rpb24uCgpgYGB7ciBldmFsPUZ9Cj9jCmBgYAoKVGhlIGZpbmFsIG1haW4gb2JqZWN0IHR5cGUgSSB3YW50IHRvIGludHJvZHVjZSB5b3UgdG8gaXMgbXkgZmF2b3JpdGU6IGBsaXN0YHMhIFRoZXkgYXJlIGtpbmQgb2YgbGlrZSBhIG1hc2ggYmV0d2VlbiBgZGF0YS5mcmFtZWBzIGFuZCBgdmVjdG9yYHMgaW4gdGhhdCB0aGV5IGFyZSBvbmUgZGltZW5zaW9uYWwgYnV0IGNhbiBoYXZlIGVsZW1lbnRzIG9mIGFueSBjbGFzcy4KCmBgYHtyfQphX2xpc3QgPC0gbGlzdChwYWNrYWdlcyxkYXQsY2hheikKYV9saXN0CmBgYAoKVG8gYWNjZXNzIHRoZWlyIGVsZW1lbnRzIHdlIHVzZSAiZG91YmxlIGJyYWNrZWQiIG5vdGF0aW9uIGxpa2Ugc286CgpgYGB7cn0KYV9saXN0W1syXV0KYGBgCgpCeSB0aGUgd2F5IC0tIGlmIHlvdSdkIGxpa2UgdG8gaW5zdGFsbCBvbmx5IGEgc2luZ2xlIHBhY2thZ2UgeW91IG1pZ2h0IGRvIHNvbWV0aGluZyBsaWtlOgoKYGBge3IgbWVzc2FnZT1GQUxTRSwgd2FybmluZz1GQUxTRSwgZXZhbD1GQUxTRX0KaW5zdGFsbC5wYWNrYWdlcygiZ2FtbHNzIikKbGlicmFyeShnYW1sc3MpCmBgYAoKTm93IHRoYXQgd2UgaGF2ZSB0aG9zZSBiYXNpY3MgaW4gb3VyIGhlYWRzIHdlIGNhbiBzdGFydCBwdXR0aW5nIFIgdG8gdXNlLgoKIyMjIExvYWRpbmcgRGF0YSBhbmQgU2V0dGluZyBQYXRocwoKV2Ugd2lsbCBiZSB1c2luZyBkYXRhIGZyb20gUGV0ZXJzb24gKDIwMTcpOiBFeHBvcnQgRGl2ZXJzaXR5IGFuZGRbMTo1XSBIdW1hbiBSaWdodHMuIFlvdSBjYW4gZG93bmxvYWQgdGhlIHJlcGxpY2F0aW9uIGFyY2hpdmUgYnkgY2xpY2tpbmcgW2hlcmVdKGh0dHBzOi8vc2l0ZXMuZ29vZ2xlLmNvbS9zaXRlL3RpbW90aHltcGV0ZXJzb251c2MvSkNSJTIwLSUyMGV4cG9ydCUyMGRpdmVyc2l0eSUyMC0lMjByZXBsaWNhdGlvbiUyMGRhdGEuemlwKSBvciBkb3dubG9hZCB0aGUgZGF0YSBkaXJlY3RseSBieSBydW5uaW5nIHRoZSBmb2xsb3dpbmcgY2h1bmsuCgpgYGB7cn0KZCA8LSByZWFkX2R0YSgiaHR0cHM6Ly93d3cuZHJvcGJveC5jb20vcy9zdDh1Z3lmbGQ0c2UxYTUvSkNSX2ZpbmFsLmR0YT9kbD0xIikKZApgYGAKClRoZSBgcmVhZF9kdGFgIGZ1bmN0aW9uIGNvbWVzIGZyb20gdGhlIGBoYXZlbmAgcGFja2FnZSBhbmQgaXMgdXNlZnVsIGZvciByZWFkaW5nIGluIGRhdGFzZXRzIGZyb20gb3RoZXIgc3RhdGlzdGljYWwgc29mdHdhcmUgbGlrZSBTUFNTLCBTVEFUQSwgb3IgU0FTLgoKVXN1YWxseSB5b3UnbGwgYmUgbG9hZGluZyBkYXRhIGZyb20geW91ciBjb21wdXRlciByYXRoZXIgdGhhbiBmcm9tIGEgbGluay4gRm9yIHRoaXMgaXQgaXMgaW1wb3J0YW50IHRvIGdldCBhIGZlZWwgZm9yIGhvdyBmaWxlIHBhdGhzIHdvcmsgb24geW91ciBjb21wdXRlciBhbmQgaG93IHRvIHVzZSB3b3JraW5nIGRpcmVjdG9yaWVzLgoKVG8gY2hlY2sgeW91ciB3b3JraW5nIGRpcmVjdG9yeSwgeW91IGNhbiBydW46CgpgYGB7cn0KZ2V0d2QoKQpgYGAKClRvIGludHJvZHVjZSB5b3UgcXVpY2tseSB0byBhIGZldyB1c2VmdWwgZnVuY3Rpb25zLCBsZXQncyBoYXZlIFIKCjEuICBNYWtlIHVzIGEgbmV3IGZvbGRlciBqdXN0IG9mZiBvZiB5b3VyIGN1cnJlbnQgd29ya2luZyBkaXJlY3RvcnkKMi4gIFNhdmUgdGhlIFBldGVyc29uIGRhdGEgYXMgYSAuY3N2CjMuICBMb2FkIHRoYXQgLmNzdiBpbnRvIG1lbW9yeSBhcyBhIGRpZmZlcmVudCBvYmplY3QKNC4gIERlbGV0ZSB0aGF0IG9iamVjdCBmcm9tIG1lbW9yeQoKYGBge3Igd2FybmluZz1GQUxTRSwgbWVzc2FnZT1GQUxTRX0KZGlyIDwtIGdldHdkKCkKcGF0aCA8LSBwYXN0ZShkaXIsImV4YW1wbGVfZm9sZGVyIixzZXA9Ii8iKQpkaXIuY3JlYXRlKHBhdGgpCnNldHdkKHBhdGgpCndyaXRlLmNzdihkLCJwZXRlcnNvbl8yMDE3LmNzdiIscm93Lm5hbWVzID0gRikKbGlzdC5maWxlcygpCmBgYAoKQm9vbSwgdGhlcmUgaXQgaXMhIE5vdyBpZiB3ZSB3YW50ZWQgdG8gcmVhZCBpbiB0aGUgZGF0YSB3ZSBjb3VsZDoKCmBgYHtyfQpkYXRfcGF0aCA8LSBwYXN0ZShwYXRoLCJwZXRlcnNvbl8yMDE3LmNzdiIsc2VwPSIvIikKZGF0IDwtIHJlYWQuY3N2KGRhdF9wYXRoKQpgYGAKCkFuZCBib29tIHRoZXJlIGl0IGlzLiBOb3cgbGV0J3MgcmVtb3ZlIGp1c3QgdGhhdDoKCmBgYHtyfQpybShkYXQpCmBgYAoKCkZpbmFsbHksIGJlZm9yZSB3ZSBnZXQgb3VyIGhhbmRzIGRpcnR5LCBsZXQncyBsb29rIGF0IGhvdyB0byB0YWtlIGEgbG9vayBhdCBvdXIgZGF0YSBmb3IgdGhlIGZpcnN0IHRpbWU6CgpgYGB7cn0Kc3VtbWFyeShkKQpgYGAKCk9mIHBhcnRpY3VsYXIgaW1wb3J0YW5jZSBpcyB0aGUgYE5BYCBjb3VudHMgcmVwcmVzZW50aW5nIG1pc3NpbmcgZGF0YS4gVGhpcyBpcyBub3Qgb25seSBpbXBvcnRhbnQgdG8gdGFrZSBhIGxvb2sgYXQgdG8gZ2V0IGEgYmV0dGVyIHNlbnNlIG9mIHlvdXIgZGF0YSwgYnV0IGFsc28gaXMgdXNlZnVsIGZvciBhbGVydGluZyB5b3UgdG8gdGhlIGJlaGF2aW9yIGhvdyBmdW5jdGlvbnMgbGlrZSBgbWVhbmAgYW5kIGBzdW1gIHJlYWN0IHRvIG1pc3NpbmcgZGF0YS4KCmBgYHtyfQpjKG1lYW4oZCRwb2xpdHkyKSwKICBzdW0oZCRwb2xpdHkyKSkKYGBgCgpDaGVja2luZyBkb2N1bWVudGF0aW9uIHdpdGggYD9tZWFuYCBvciBgaGVscChtZWFuKWAgeW91J2xsIG5vdGUgdGhlIGFyZ3VtZW50IGBuYS5ybWAgZGVmYXVsdHMgdG8gYEZBTFNFYC4gVG8gY29tcHV0ZSB0aGVzZSB0aGluZ3Mgb21pdHRpbmcgdGhlIG1pc3NpbmcgdmFsdWVzLCB5b3Ugd291bGQgc3BlY2lmeToKCmBgYHtyfQpjKG1lYW4oZCRwb2xpdHkyLCBuYS5ybT1UKSwKICBzdW0oZCRwb2xpdHkyLCBuYS5ybT1UUlVFKSkKYGBgCgp3aGVyZSBlaXRoZXIgYFRgIG9yIGBUUlVFYCBjYW4gYmUgdXNlZCB0byBpbmRpY2F0ZSwgd2VsbCwgdHJ1ZS4KCiMjIyBCYXNpYyBEYXRhIFdyYW5nbGluZwoKV2hlbiBkZWFsaW5nIHdpdGggZGF0YSwgZXNwZWNpYWxseSB0ZXh0IGRhdGEsIGNlcnRhaW4gZGF0YSB3cmFuZ2xpbmcgc2tpbGxzIGFyZSBpbXBvcnRhbnQuIFBlcmhhcHMgdGhlIG1vc3QgYmFzaWMgdGFzayB5b3UnbGwgbmVlZCB0byBrbm93IGhvdyB0byBkbyBpcyAqKnNlbGVjdCBjYXNlcyBhbmQgc3Vic2V0IGRhdGEqKi4gQXMgd2l0aCBtb3N0IHRoaW5ncyBpbiBSLCB0aGVyZSBhcmUgbXVsdGlwbGUgd2F5cyBvZiBhY2NvbXBsaXNoaW5nIHRoZSBzYW1lIGdvYWwgKGJhc2UgUiB2cyBwYWNrYWdlcywgZXRjKS4KClRvIGdldCBpbmRpY2VzIHdoaWNoIHNhdGlzZnkgbG9naWNhbCBzdGF0ZW1lbnRzIHlvdSBjYW4gdXNlIHRoZSBgd2hpY2hgIGZ1bmN0aW9uCgpgYGB7cn0Kd2hpY2goZCRnZHBwYyA+IDUwMDAwKQpgYGAKCmBgYHtyfQp3aGljaChkJGdkcHBjIDwgMjAwMCAmIGQkcG9saXR5MiA9PSAxMCkKYGBgCgpgYGB7cn0Kd2hpY2goZCRnZHBncm93dGggPCAtLjUgfCBkJGdkcHBjIDwgMTAwKQpgYGAKCldlIGNhbiBjb21iaW5lIHRoaXMgd2l0aCBpbmRleGluZyB0byBzdWJzZXQgZG93biB0aGUgZGF0YS4gV2UgY2FuIGFsc28gY2FsbCBjb2x1bW5zIGluIGEgdmFyaWV0eSBvZiB3YXlzLiBSZW1lbWJlciB0aGF0IHlvdSBjYW4gY3JlYXRlIG9iamVjdHMgY2FycnlpbmcgdGhpcyBpbmZvcm1hdGlvbiB0byBtb2R1bGFyaXplIHlvdXIgY29kZSwgd2hpY2ggbWlnaHQgYmUgaGVscGZ1bCBpbiBwYXJ0aWN1bGFyIHNpdHVhdGlvbnMgdG8ga2VlcCBldmVyeXRoaW5nIGNsZWFyLgoKYGBge3J9CmluZHMgPC0gd2hpY2goZCRnZHBwYyA+IDUwMDAwKQpjb2xzIDwtIGMoImNjb2RlIiwieWVhciIsInBoeXNpbnQiLCJsbnBvcCIpCgpzdWIxIDwtIGRbaW5kcyxjb2xzXQpzdWIxCmBgYAoKQWx0ZXJuYXRpdmVseSwgb25lIGNvdWxkIHVzZSB0aGUgYHN1YnNldGAgZnVuY3Rpb24gZnJvbSBiYXNlIFIgdG8gZ2V0IHRoZSBzYW1lIHJlc3VsdC4KCmBgYHtyfQpzdWIyIDwtIHN1YnNldChkLGQkZ2RwcGMgPiA1MDAwMCxjb2xzKQpzdWIyCmBgYAoKYGBge3J9CmlkZW50aWNhbChzdWIxLHN1YjIpCmBgYAoKQW5vdGhlciBncmVhdCBvcHRpb24gaXMgdGhlIGBkcGx5cmAgcGFja2FnZSwgd2hpY2ggaXMgcGFydCBvZiB0aGUgW3RpZHl2ZXJzZV0oaHR0cHM6Ly93d3cudGlkeXZlcnNlLm9yZy8pIGFsb25nc2lkZSB0aGUgcGFja2FnZXMgYGhhdmVuYCBhbmQgYGdncGxvdDJgLiBPbmUgb2YgdGhlIGJlc3QgdGhpbmdzIGFib3V0IHRoZSB0aWR5dmVyc2UgZmFtaWx5IG9mIHBhY2thZ2VzIGlzIHRoYXQgdGhleSBhcmUgdmVyeSB3ZWxsIGRvY3VtZW50ZWQsIGluY2x1ZGluZyBbYV0oaHR0cHM6Ly9yc3R1ZGlvLmNvbS93cC1jb250ZW50L3VwbG9hZHMvMjAxNS8wMi9kYXRhLXdyYW5nbGluZy1jaGVhdHNoZWV0LnBkZikgW3ZhcmlldHldKGh0dHBzOi8vcnN0dWRpby5jb20vd3AtY29udGVudC91cGxvYWRzLzIwMTUvMDMvZ2dwbG90Mi1jaGVhdHNoZWV0LnBkZikgW29mXShodHRwOi8vd3d3LmZsdXR0ZXJieXMuY29tLmF1L3N0YXRzL2Rvd25sb2Fkcy9zbGlkZXMvZmlndXJlL2ZhY3RvcnMucGRmKSBbY2hlYXRzaGVldHNdKGh0dHBzOi8vZXZvbGR5bi5naXRsYWIuaW8vZXZvbWljcy0yMDE4L3JlZi1zaGVldHMvUl9wdXJyci5wZGYpIFthbmRdKGh0dHBzOi8vZ2dwbG90Mi1ib29rLm9yZy8pIFtib29rc10oaHR0cHM6Ly9yNGRzLmhhZC5jby5uei8pLiBPbmUgdGhpbmcgdGhhdCBtYWtlcyB0aGUgd3JhbmdsaW5nIHRvb2xzIHBhcnRpY3VsYXJseSBwb3dlcmZ1bCBpcyB0aGF0IHRoZXkgbGV2ZXJhZ2UgYSBwaXBlIChgJT4lYCkgZnJvbSB0aGUgYG1hZ3JpdHRyYCBwYWNrYWdlIHdoaWNoIHNheXMsaW4gcHNldWRvLWNvZGUsIHRoYXQgYHggJT4lIGYoeSlgIGlzIHRoZSBzYW1lIGFzIGBmKHgseSlgLiBUaGlzIGNhbiBjcmVhdGUgbmljZSB3b3JrIGZsb3cuIEZvciBleGFtcGxlLCB0byBnZXQgdGhlIHNhbWUgc3Vic2V0IHlldCBhZ2FpbjoKCmBgYHtyfQpkICU+JSBmaWx0ZXIoZ2RwcGMgPiA1MDAwMCkgJT4lIGRwbHlyOjpzZWxlY3QoYWxsX29mKGNvbHMpKSAtPiBzdWIzCgphbGwoc3ViMSA9PSBzdWIzLCBuYS5ybT1UKQpgYGAKCk5lYXQuIFdoYXQgd2UgZGlkIHdhcyB0b29rIG91ciBkYXRhZnJhbWUsIGBmaWx0ZXJgZWQgdGhlIHJvd3MgdGhhdCB3ZSB3YW50ZWQsIGFuZCB0aGVuIGBzZWxlY3RgZWQgdGhlIGNvbHVtbnMgb2YgaW50ZXJlc3QuCgpJZiB3ZSB3YW50IHRvIGBzb3J0YCBkYXRhLCB0aGVyZSBpcyBhIGJhc2UgUiBhcHByb2FjaCBmb3IgdmVjdG9ycy4KCmBgYHtyfQpoZWFkKHNvcnQoZCRnZHBncm93dGgpKQpgYGAKCkZvciBkYXRhZnJhbWVzIHlvdSBoYXZlIHRvIHVzZSBgb3JkZXJgLCB3aGljaCBwcm9kdWNlcyBpbmRleCBudW1iZXJzIHRoYXQgY2FuIGJlIHVzZWQgYXMgYmVmb3JlCgpgYGB7cn0KZFtvcmRlcihkJGdkcGdyb3d0aCksYygiY2NvZGUiLCJ5ZWFyIiwiZ2RwZ3Jvd3RoIildCmBgYAoKV2UgY2FuIGFsc28gc3dpdGNoIHRoZSBvcmRlcmluZyBhcm91bmQgYnkgc2V0dGluZyBgZGVjcmVhc2luZyA9IFRgCgpgYGB7cn0KZFtvcmRlcihkJGdkcGdyb3d0aCxkZWNyZWFzaW5nID0gVCksYygiY2NvZGUiLCJ5ZWFyIiwiZ2RwZ3Jvd3RoIildCmBgYAoKT3Igd2UgY291bGQgdXNlIHRoZSBoYW5keSBgJT4lYC4gSW4gdGhpcyBjYXNlIHdlIGhhdmUgdG8gdXNlIHRoZSBwbGFjZWhvbGRlciBgLmAgZm9yIHRoZSBpbnB1dCwgd2hpY2ggbWlnaHQgYmUgaGFuZHkgdG8ga25vdyB0aGF0IHlvdSBjYW4gZG8gZm9yIG1vcmUgY29tcGxpY2F0ZWQgZnVuY3Rpb25zLgoKYGBge3J9Cm9yZGVyKGQkZ2RwZ3Jvd3RoLGRlY3JlYXNpbmcgPSBUKSAlPiUgCiAgZFsuLGMoImNjb2RlIiwieWVhciIsImdkcGdyb3d0aCIpXQpgYGAKCgpBbm90aGVyIGJhc2ljIHRhc2sgeW91J2xsIHdhbnQgdG8ga25vdyBob3cgdG8gZG8gaXMgKiptZXJnZSBkYXRhc2V0cyB0b2dldGhlcioqLiBZb3UgbWF5IGhhdmUgbm90aWNlZCB0aGF0IHRoZSBjY29kZSB2YXJpYWJsZSBpc24ndCBwYXJ0aWN1bGFybHkgZGVzY3JpcHRpdmUgZm9yIHdoaWNoIGNvdW50cnkgaXQgbWVhbnMuIEF0IHRoZSBzdGFydCB3ZSBsb2FkZWQgaW4gdGhlIGBjb3VudHJ5Y29kZWAgcGFja2FnZSB3aGljaCBjb250YWlucyBhZGRpdGlvbmFsIGluZm9ybWF0aW9uLgoKYGBge3J9CmNvZGVzIDwtIGNvdW50cnljb2RlOjpjb2RlbGlzdF9wYW5lbApgYGAKCkxldCdzIHNlZSB3aGF0IHRoZXkgaGF2ZS4KCmBgYHtyfQpjb2xuYW1lcyhjb2RlcykKYGBgCgpUaGUgY291bnRyeSBjb2RlcyB3ZSBhcmUgY3VycmVudGx5IHVzaW5nIGFyZSBgY293bmAuIExldCdzIGdyYWIgYGlzbzNjYCBhbmQgYHJlZ2lvbmAgdG8gYWRkIHRvIHRoZSBkYXRhc2V0LiBXZSBhbHNvIGtub3cgdGhhdCB0aGUgZGF0YXNldCB3ZSBhcmUgd29ya2luZyB3aXRoIG9ubHkgaGFzIHllYXJzIGZyb20gMTk4MSB0byAyMDEwLCBzbyBsZXQncyBwcmFjdGljZSBvdXIgc3Vic2V0dGluZyBza2lsbHoKCmBgYHtyfQpjb2RlcyA8LSBjb2Rlc1tjb2RlcyR5ZWFyICVpbiUgMTk4MToyMDEwLGMoImNvd24iLCJ5ZWFyIiwiaXNvM2MiLCJjb3VudHJ5Lm5hbWUuZW4iLCJyZWdpb24iKV0KYGBgCgpPbmUgdGhpbmcgdG8gcGF5IGF0dGVudGlvbiB0byBpcyBsb3Npbmcgb3IgZ2FpbmluZyBvYnNlcnZhdGlvbnMgZHVyaW5nIGEgbWVyZ2UuIEZvciBhIGdyZWF0IG92ZXJ2aWV3LCBjaGVjayBvdXQgdGhpcyBoYW5keSBOWVUgRGF0YSBTZXJ2aWNlcyBbZ3VpZGVdKGh0dHBzOi8vZ3VpZGVzLm55dS5lZHUvcXVhbnQvbWVyZ2UpLgoKYGBge3J9Cm5yb3coZCkKYGBgCgpgYGB7cn0Kb3V0MSA8LSBtZXJnZShkLGNvZGVzLGJ5Lng9YygiY2NvZGUiLCJ5ZWFyIiksYnkueT1jKCJjb3duIiwieWVhciIpKQpucm93KG91dDEpCmBgYAoKYGBge3J9Cm91dDIgPC0gbWVyZ2UoZCxjb2RlcyxieS54PWMoImNjb2RlIiwieWVhciIpLGJ5Lnk9YygiY293biIsInllYXIiKSxhbGwueD1UKQpucm93KG91dDIpCmBgYAoKYGBge3J9Cm91dDMgPC0gbWVyZ2UoZCxjb2RlcyxieS54PWMoImNjb2RlIiwieWVhciIpLGJ5Lnk9YygiY293biIsInllYXIiKSxhbGwueT1UKQpucm93KG91dDMpCmBgYAoKYGBge3J9Cm91dDQgPC0gbWVyZ2UoZCxjb2RlcyxieS54PWMoImNjb2RlIiwieWVhciIpLGJ5Lnk9YygiY293biIsInllYXIiKSxhbGw9VCkKbnJvdyhvdXQ0KQpgYGAKCkFuZCwgb2YgY291cnNlLCB3ZSBjYW4gZG8gdGhlIHNhbWUgbWVyZ2VzIHVzaW5nIGRwbHlyIHdpdGggYGlubmVyX2pvaW5gLCBgbGVmdF9qb2luYCwgYHJpZ2h0X2pvaW5gLCBhbmQgYGZ1bGxfam9pbmAgcmVzcGVjdGl2ZWx5LiBHb2luZyBmb3J3YXJkIHdlIHdpbGwga2VlcCBgb3V0MmAgYXMgdGhlIHdvcmtpbmcgZGF0YXNldC4KCkFub3RoZXIgYmFzaWMgdGFzayB5b3UnbGwgd2FudCB0byBrbm93IGhvdyB0byBkbyBpcyBjYWxjdWxhdGUgKiphZ2dyZWdhdGVzIGFuZCBzdW1tYXJpZXMqKi4gVGhlcmUgYXJlIGEgbnVtYmVyIG9mIGdyZWF0IHRoaW5ncyB5b3UgY2FuIGRvIHdpdGggdGhlIGBhcHBseWAgZmFtaWx5IG9mIGZ1bmN0aW9ucywgaW5jbHVkaW5nIGVhc2lseSBnb2luZyBpbiBwYXJhbGxlbCB3aXRoIHRoZSBgcGJhcHBseWAgcGFja2FnZS4gSWYgeW91IGFyZSBpbnRlcmVzdGVkIGluIG1vcmUgZGV0YWlscyBvbiB0aGlzIHlvdSBzaG91bGQgY2hlY2sgb3V0IFt0aGlzIHR1dG9yaWFsXShodHRwczovL3d3dy5kYXRhY2FtcC5jb20vY29tbXVuaXR5L3R1dG9yaWFscy9yLXR1dG9yaWFsLWFwcGx5LWZhbWlseSkgYW5kIFt0aGlzIHRhc2t2aWV3XShodHRwczovL3d3dy5yLXBrZy5vcmcvY3R2L0hpZ2hQZXJmb3JtYW5jZUNvbXB1dGluZykuIFdlIHdpbGwgZm9jdXMgb24gdXNpbmcgYGRwbHlyYCB0byBjYWxjdWxhdGUgc3VtbWFyaWVzIG9mIGludGVyZXN0LgoKT25lIHJlYXNvbiBmb3IgdGhpcyBpcyB0aGF0IGl0IGlzIHN1cGVyIGVhc3kgdG8gY2FsY3VsYXRlIHN1bW1hcmllcyBncm91cGluZyBvbiBhbm90aGVyIHZhcmlhYmxlLiBGb3IgZXhhbXBsZSwgaWYgd2Ugd2FudGVkIHRvIHRoaW5rIGFib3V0IHJlZ2lvbmFsIHZhcmlhdGlvbiBpbiBgZ2RwcGNgIHdlIGNvdWxkCgpgYGB7cn0Kb3V0MiAlPiUgCiAgZ3JvdXBfYnkocmVnaW9uKSAlPiUgCiAgc3VtbWFyaXplKG1lYW49bWVhbihnZHBwYyxuYS5ybT1UKSwKICAgICAgICAgICAgc2Q9c2QoZ2RwcGMsbmEucm09VCksCiAgICAgICAgICAgIHN1bT1zdW0oZ2RwcGMsbmEucm09VCkpCmBgYAoKV2UgY2FuIGFsc28gdXNlIHRoZSBgbXV0YXRlYCBmdW5jdGlvbiB0byBhZGQgdGhpcyBpbmZvcm1hdGlvbiB0byBvdXIgZGF0YWZyYW1lLiBJbiBiYXNlIFIgdGhpcyB3b3VsZCB0YWtlIGBtZXJnZWBpbmcgdGhlIG91dHB1dCBvZiBgYWdncmVnYXRlYCwgc28gaXQgY2FuIGNlcnRhaW5seSBiZSBkb25lLCBidXQgYGRwbHlyYCBtYWtlcyBpdCBzb21ld2hhdCBtb3JlIHN0cmFpZ2h0Zm9yd2FyZCBhbmQgc2NhbGVhYmxlLgoKYGBge3J9Cm91dDIgJT4lIAogIGdyb3VwX2J5KHJlZ2lvbikgJT4lIAogIG11dGF0ZShtZWFuX2dkcHBjPW1lYW4oZ2RwcGMsbmEucm09VCksCiAgICAgICAgIHNkX2dkcHBjPXNkKGdkcHBjLG5hLnJtPVQpKSAtPiBvdXQyCgpvdXQyCmBgYAoKQSBiYXNlIFIgdmVyc2lvbiBvZiB0aGUgYWJvdmUgbWlnaHQgYmUKCmBgYHtyfQphMSA8LSBhZ2dyZWdhdGUob3V0MiRnZHBwYyxieT1saXN0KG91dDIkcmVnaW9uKSxtZWFuLG5hLnJtPVQpCmExCgpjb2xuYW1lcyhhMSkgPC0gYygicmVnaW9uIiwibWVhbl9nZHBwYyIpCmEyIDwtIGFnZ3JlZ2F0ZShvdXQyJGdkcHBjLGJ5PWxpc3Qob3V0MiRyZWdpb24pLHNkLG5hLnJtPVQpCmNvbG5hbWVzKGEyKSA8LSBjKCJyZWdpb24iLCJzZF9nZHBwYyIpCgp0MSA8LSBtZXJnZShvdXQyLGExLGJ5PSJyZWdpb24iKQp0MiA8LSBtZXJnZSh0MSxhMixieT0icmVnaW9uIikKdGJsX2RmKHQyKQpgYGAKCmJ1dCB0aGUgYGRwbHlyYCBhcHByb2FjaCByZWFsbHkgaXMgcXVpdGUgbmljZS4KCiMjIyBCYXNpYyBQbG90dGluZwoKV2Ugd2lsbCBmb2N1cyBvbiB1c2luZyBgZ2dwbG90MmAgZm9yIGdyYXBoaWNzIGluIFIsIGFsdGhvdWdoIGJhc2UgUiBoYXMgbmljZSBjYXBhYmlsaXRpZXMgb24gaXRzIG93bi4gYGdncGxvdGAgaXMgYWxsIGFib3V0IHRoZSBcYGdyYW1tYXIgb2YgZ3JhcGhpY3MnIHdoaWNoIGZvbGxvd3MgYSBsYXllcmVkIGFwcHJvYWNoIHRvIGRlc2NyaWJlIGFuZCBjb25zdHJ1Y3QgZ3JhcGhpY3MgaW4gYSBzdHJ1Y3R1cmVkIG1hbm5lci4gVG8gYmVnaW4sIHdlIHdpbGwgYWx3YXlzIGluaXRpYWxpemUgYSBwbG90OgoKYGBge3J9CnAxIDwtIGdncGxvdChvdXQyW3doaWNoKG91dDIkcmVnaW9uID09ICJOb3J0aCBBbWVyaWNhIiksXSwgYWVzKHg9bG9nKGdkcHBjKSkpCmBgYAoKVG8gZ2V0IGRpZmZlcmVudCBwbG90cywgd2Ugd2lsbCBhZGQgbGF5ZXJzLiBGb3IgZXhhbXBsZSwgaWYgd2Ugd2FudGVkIGEgZG90IHBsb3QKCmBgYHtyfQpwMSArIGdlb21fZG90cGxvdChiaW53aWR0aD0wLjEpCmBgYAoKb3IgYSBoaXN0b2dyYW0KCmBgYHtyfQpwMSArIGdlb21faGlzdG9ncmFtKGJpbndpZHRoPTAuMSkKYGBgCgpvciBhIGRlbnNpdHkgcGxvdAoKYGBge3J9CnAxICsgZ2VvbV9kZW5zaXR5KCkKYGBgCgp3ZSBjYW4ganVzdCBhZGQgYSBkaWZmZXJlbnQgbGF5ZXIgdG8gdGhlIHNhbWUgdW5kZXJseWluZyBwbG90LgoKVGhlIG9yZGVyIG9mIHRoZSBsYXllcnMgZG9lcyBub3QgbWF0dGVyLCBhbmQgdGhlcmUgYXJlIGEgYnVuY2ggbW9yZSBjdXN0b21pemF0aW9ucyB0aGF0IHdlIGNhbiBhZGQuCgpgYGB7cn0KcDEgKyBnZW9tX2hpc3RvZ3JhbShjb2xvcj0icmVkIixmaWxsPSJyZWQiLGJpbndpZHRoID0gMC4wMykgKwogICAgIHhsYWIoIk5hdHVyYWwgTG9nIG9mIFBlciBDYXBpdGEgR0RQIikgKwogICAgIHlsYWIoIkZyZXF1ZW5jeSIpICsKICAgICBnZ3RpdGxlKCdOb3J0aCBBbWVyaWNhbiBHRFBQQycpICsKICAgICB0aGVtZV9idygpICAtPiBnMQpnMQpgYGAKCllvdSBjYW4gYWxzbyBhZGQgbXVsdGlwbGUgZ2VvbWV0cmllcyB0byB0aGUgc2FtZSB1bmRlcmRlcmx5aW5nIHBsb3QuCgpgYGB7cn0KcDIgPC0gZ2dwbG90KG91dDJbd2hpY2gob3V0MiRyZWdpb24gPT0gIlNvdXRoIEFzaWEiKSxdLGFlcyh4PXllYXIseT1sb2coZ2RwcGMpLGNvbG9yPWlzbzNjKSkKcDIgICsgZ2VvbV9wb2ludChuYS5ybT1UKSArIAogICAgICBnZW9tX2xpbmUobmEucm09VCkgKwogICAgICBsYWJzKGNvbG9yPSJDb3VudHJ5IikgKwogICAgICBzY2FsZV9jb2xvcl9icmV3ZXIocGFsZXR0ZT0iU3BlY3RyYWwiKSAgLT4gZzIKZzIKYGBgCgpZb3UgY2FuIGV2ZW4gYWRkIHNvbWUgc21vb3RoZXJzIGlmIHlvdSB3YW50LgoKYGBge3J9CnAzIDwtIGdncGxvdChvdXQzW3doaWNoKG91dDMkaXNvM2M9PSJSVVMiKSxdLGFlcyh4PXllYXIseT1nZHBwYykpCnAzICsgZ2VvbV9wb2ludChuYS5ybT1UKSArCiAgICAgZ2VvbV9zbW9vdGgoY29sb3IgPSJncmF5IiwgbWV0aG9kID0gImxtIiwgc2UgPSBUUlVFLG5hLnJtPVQsIGZvcm11bGE9eX54KQoKYGBgCgpgYGB7ciB3YXJuaW5ncz1GQUxTRX0KcDMgPC0gZ2dwbG90KG91dDNbd2hpY2gob3V0MyRpc28zYz09IlJVUyIpLF0sYWVzKHg9eWVhcix5PWdkcHBjKSkKcDMgKyBnZW9tX3BvaW50KG5hLnJtPVQpICsKICAgICBnZW9tX3Ntb290aChjb2xvciA9ImdyYXkiLCBtZXRob2QgPSAibG9lc3MiLCBzZSA9IFRSVUUsZm9ybXVsYT15fngsIG5hLnJtPVQpIC0+IGczCmczCmBgYAoKVHdvIGxhc3Qgbm90ZXMgb24gcGxvdHMgLS0gZmFjZXRpbmcgYW5kIGFkZGluZyBwbG90cyB0b2dldGhlciBpbnRvIGEgbGFyZ2VyIGltYWdlLgoKRmFjZXRpbmcgY2FuIGJlIGEgbmljZSB3YXkgdG8gYnJlYWsgdXAgYSBjb250aW51b3VzIHZhcmlhYmxlIGJ5IGNhdGVnb3J5LgoKYGBge3J9CnA0IDwtIGdncGxvdChuYS5vbWl0KG91dDJbd2hpY2gob3V0MiRyZWdpb24gJWluJSBjKCJFdXJvcGUgJiBDZW50cmFsIEFzaWEiLCJNaWRkbGUgRWFzdCAmIE5vcnRoIEFmcmljYSIpKSxdKSxhZXMoeD1sb2coZ2RwcGMpKSkKcDQgKyBnZW9tX2hpc3RvZ3JhbShiaW53aWR0aCA9IDAuMSkgKyAKICAgICBmYWNldF9ncmlkKHJlZ2lvbiB+IC4pCmBgYAoKYGBge3J9CnA0IDwtIGdncGxvdChuYS5vbWl0KG91dDJbd2hpY2gob3V0MiRyZWdpb24gJWluJSBjKCJFdXJvcGUgJiBDZW50cmFsIEFzaWEiLCJNaWRkbGUgRWFzdCAmIE5vcnRoIEFmcmljYSIpKSxdKSxhZXMoeD1sb2coZ2RwcGMpKSkKcDQgKyBnZW9tX2hpc3RvZ3JhbShiaW53aWR0aCA9IDAuMSkgKyAKICAgICBmYWNldF9ncmlkKC4gfiByZWdpb24pCmBgYAoKT25jZSB3ZSBkbyBhbGwgdGhhdCwgd2UgbWlnaHQgd2FudCB0byBhZGQgbXVsdGlwbGUgcGxvdHMgdG9nZXRoZXIgaW50byBhIGxhcmdlciBtdWx0aS1wYW5lbCBncmFwaGljLiBUaGUgYGdyaWRFeHRyYWAgcGFja2FnZSBpcyBncmVhdCBmb3IgdGhpcy4KCmBgYHtyfQpncmlkLmFycmFuZ2UoZzEsZzIsZzMsdGV4dEdyb2IoIlNwaWZmeSEiKSxuY29sPTIsbnJvdz0yKQpgYGAKCgo=