DATA612 Project 2 | Content-Based and Collaborative Filtering

Book Recommendation from Goodreads

Goodreads is a free social cataloging website that allows individuals to freely search its database of books, annotations, reviews and ratings. People can check out personalized recommendations and find out if a books is a good for them. This dataset contain 10,000 books and 50,000+ users. Ratings are 1 - 5 and each users rated at least 2 books. Data can be found here.

library(tidyverse)
library(Matrix)
library(recommenderlab)
library(kableExtra)
library(gridExtra)

Data Prepocessing

book_ratings <- read.csv("https://raw.githubusercontent.com/zygmuntz/goodbooks-10k/master/ratings.csv", sep = ",", header = T, stringsAsFactors = F)
book_titles <- read.csv("https://raw.githubusercontent.com/zygmuntz/goodbooks-10k/master/books.csv", sep = ",", header = T, stringsAsFactors = F) %>% select(book_id, title)
book_titles$book_id <- as.factor(book_titles$book_id)
# table dimensions
dim(book_ratings)

[1] 5976479       3

# first few ratings for books
head(book_ratings, 10)

The size of this dataset:

object.size(book_ratings)

71718744 bytes

Only a subset of the data will be used to build the recommender systems.

book_ratings$user_id <- as.factor(book_ratings$user_id)
book_ratings$book_id <- as.factor(book_ratings$book_id)
bmatrix <- as(book_ratings, "realRatingMatrix")
dim(bmatrix@data)

[1] 53424 10000

Similarity Matrix

Users

sim <- similarity(bmatrix[1:10, ], method = "cosine", which = "users")
image(as.matrix(sim), main = "User Similarity")

Books

sim2 <- similarity(bmatrix[ ,1:10], method = "cosine", which = "items")
image(as.matrix(sim2), main = "Item Similarity")

Going forward, we will build recommender systems using data that consist of users who rated at least 150 books and books rated at least 300 times.

# users who rated at least 100 books and books rated at least 100 times
bmatrix <- bmatrix[rowCounts(bmatrix) > 150, colCounts(bmatrix) > 300]
bmatrix

4011 x 4147 rating matrix of class realRatingMatrix with 582842 ratings.

How are the ratings disributed?

tbl_ratings <- as.data.frame(table(as.vector(bmatrix@data)))
tbl_ratings

tbl_ratings <- tbl_ratings[-1,] #0 means missing values so remove missing values
ggplot(tbl_ratings, aes(x = Var1, y = Freq, fill = Var1)) + geom_bar(stat = "identity") + ggtitle("Distribution of Book Ratings")

Most rated books

rated_count <- colCounts(bmatrix)
read_book <- data.frame(
  book_id = names(rated_count),
  read = rated_count
)
top_books <- 
  inner_join(read_book, book_titles, by = "book_id") %>% 
  arrange(desc(read)) %>% 
  select(-book_id) %>% 
  head(10) %>% 
  ggplot(aes(x = title, y = read)) + geom_bar(stat = "identity", fill = "lightblue") + geom_text(aes(label=read), vjust=-0.3, size=3.5) + ggtitle("Top 10 Rated Books") +  coord_flip()

Column `book_id` joining factors with different levels, coercing to character vectorpackage <U+393C><U+3E31>bindrcpp<U+393C><U+3E32> was built under R version 3.5.2

top_books

Average book ratings

avg_book_ratings <- data.frame("avg_rating" = colMeans(bmatrix)) %>% 
  ggplot(aes(x = avg_rating)) + 
  geom_histogram(color = "black", fill = "lightgreen") + 
  ggtitle("Distribution of Average Ratings for Books")
avg_book_ratings

Matrix of first 100 users and 100 books. Darker spots represents the highest rated books.

image(bmatrix[1:100, 1:100], main = "First 100 users and books")

Top 1% of readers and books in the book matrix

min_readers <- quantile(rowCounts(bmatrix), 0.99)
min_books <- quantile(colCounts(bmatrix), 0.99)
a <- image(bmatrix[rowCounts(bmatrix) > min_readers, colCounts(bmatrix) > min_books], main = "Non-Normalized")
# to eliminate bias therefore average rating would be 0
book_norm <- normalize(bmatrix)
b <- image(book_norm[rowCounts(book_norm) > min_readers, colCounts(book_norm) > min_books], main = "Normalized")
grid.arrange(a, b, ncol = 2)

Training and Testing Datasets

train <- sample(x = c(T, F), size = nrow(bmatrix), replace = T, prob = c(0.8, 0.2)) 
books_train <- bmatrix[train, ] 
books_test <- bmatrix[-train, ]

Item-Item Collaborative Filtering

A filtering method in which the similarity between items is calculated using people’s ratings of those items. In other words the algorithm recommends items similar to the user’s previous selections. In the algorithm, the similarities between different items in the dataset are calculated by using one of a number of similarity measures, and then these similarity values are used to predict ratings for user-item pairs not present in the dataset.

Imodel <- Recommender(data = books_train, method = "IBCF")
Imodel

Recommender of type IBCF for realRatingMatrix 
learned using 3185 users.

Predict with test data.

Ipredict <- predict(Imodel, newdata = books_test, n = 5) %>% list()
Ipredict

[[1]]
Recommendations as topNList with n = 5 for 4010 users.

Books recommended for specific users simliar to a specified item or item chosen by user.

# function created to display recommended similar books to users
item_recc_books <- function(i){
p <- Ipredict[[1]]@items[[i]]
p <- data.frame("guess" = as.factor(p))
p <- inner_join(p, book_titles, by = c("guess" = "book_id")) %>% select(title)
r <- data.frame("name" = as.factor(i))
r <- inner_join(r, book_titles, by = c("name" = "book_id")) %>% select(title)
print(paste("Books similar to --", r))
return(as.list(p))
}
item_recc_books(5); item_recc_books(200); item_recc_books(18)

[1] "Books similar to -- The Great Gatsby"
$`title`
[1] "Something Borrowed (Darcy & Rachel, #1)"                                 
[2] "The Lord of the Rings (The Lord of the Rings, #1-3)"                     
[3] "Harry Potter and the Cursed Child - Parts One and Two (Harry Potter, #8)"
[4] "The Runaway Jury"                                                        
[5] "The Tales of Beedle the Bard"                                            

[1] "Books similar to -- And Then There Were None"
$`title`
[1] "The Host (The Host, #1)"                   
[2] "Dracula"                                   
[3] "Me Before You (Me Before You, #1)"         
[4] "City of Glass (The Mortal Instruments, #3)"
[5] "Beautiful Disaster (Beautiful, #1)"        

[1] "Books similar to -- Harry Potter and the Prisoner of Azkaban (Harry Potter, #3)"
$`title`
[1] "City of Bones (The Mortal Instruments, #1)"                       
[2] "Holes (Holes, #1)"                                                
[3] "Jurassic Park (Jurassic Park, #1)"                                
[4] "Alice's Adventures in Wonderland & Through the Looking-Glass"     
[5] "Quiet: The Power of Introverts in a World That Can't Stop Talking"

ibcf <- table(unlist(Ipredict[[1]]@items)) %>% barplot(main = "Distribution of the number of items for IBCF")

Some books were recommended more often than the others as seen in the plot above.

User-User Collaborative Filtering

Recommends items that are similar purchased by the same people. The algorithm identifies other people with similar tastes to a target user and combines their ratings to make recommendations for that user.

Create user-based model

Umodel <- Recommender(data = books_train, method = "UBCF")
Umodel

Recommender of type UBCF for realRatingMatrix 
learned using 3185 users.

Predict data with testing data

Upredict <- predict(Umodel, newdata = books_test, n = 5) %>% list()
Upredict

[[1]]
Recommendations as topNList with n = 5 for 4010 users.

# function created to display recommended similar books to users
user_recc_books <- function(u){
p <- Upredict[[1]]@items[[u]]
p <- data.frame("guess" = as.factor(p))
p <- inner_join(p, book_titles, by = c("guess" = "book_id")) %>% select(title)
r <- data.frame("name" = as.factor(u))
r <- inner_join(r, book_titles, by = c("name" = "book_id")) %>% select(title)
print(paste("Books similar to --", r, "-- based on similar users"))
return(as.list(p))
}
user_recc_books(5); user_recc_books(200); user_recc_books(18)

[1] "Books similar to -- The Great Gatsby -- based on similar users"
$`title`
[1] "A Clash of Kings  (A Song of Ice and Fire, #2)"     
[2] "A Storm of Swords (A Song of Ice and Fire, #3)"     
[3] "The Lord of the Rings (The Lord of the Rings, #1-3)"
[4] "The Two Towers (The Lord of the Rings, #2)"         
[5] "A Game of Thrones (A Song of Ice and Fire, #1)"     

[1] "Books similar to -- And Then There Were None -- based on similar users"
$`title`
[1] "Harry Potter and the Deathly Hallows (Harry Potter, #7)"
[2] "Words of Radiance (The Stormlight Archive, #2)"         
[3] "Ender's Game (Ender's Saga, #1)"                        
[4] "The Way of Kings (The Stormlight Archive, #1)"          
[5] "The Name of the Wind (The Kingkiller Chronicle, #1)"    

[1] "Books similar to -- Harry Potter and the Prisoner of Azkaban (Harry Potter, #3) -- based on similar users"
$`title`
[1] "The Da Vinci Code (Robert Langdon, #2)"                                
[2] "Under the Never Sky (Under the Never Sky, #1)"                         
[3] "Unbroken: A World War II Story of Survival, Resilience, and Redemption"
[4] "What Alice Forgot"                                                     
[5] "From Dead to Worse (Sookie Stackhouse, #8)"

ubcf <- table(unlist(Upredict[[1]]@items)) %>% barplot(main = "Distribution of the number of items for UBCF")

Some books were recommended to users more than the others.

Summary

Overall, building both reccommendation sysems gave a better understanding of how they work. On my end, the User Based CF took a longer time to compute than the IBCF. This was proven based on the fact that the book “Building Recommendation Systems with R” mentioned that the UBCF is a lazy method. It actually needs access to all of the data to perform a prediction hence why it does not work well with large matrices. On a whole, Item-item collaborative filtering had less error than user-user collaborative filtering.

LS0tDQp0aXRsZTogIkRBVEE2MTIgUHJvamVjdCAyIHwgQ29udGVudC1CYXNlZCBhbmQgQ29sbGFib3JhdGl2ZSBGaWx0ZXJpbmcgIg0KYXV0aG9yOiAiSmF2ZXJuIFdpbHNvbiINCmRhdGU6ICJKdW5lIDEzLCAyMDE5Ig0Kb3V0cHV0OiBodG1sX25vdGVib29rDQotLS0NCg0KIyMgQm9vayBSZWNvbW1lbmRhdGlvbiBmcm9tIFtHb29kcmVhZHNdKGh0dHBzOi8vd3d3Lmdvb2RyZWFkcy5jb20vKQ0KDQpHb29kcmVhZHMgaXMgYSBmcmVlIHNvY2lhbCBjYXRhbG9naW5nIHdlYnNpdGUgdGhhdCBhbGxvd3MgaW5kaXZpZHVhbHMgdG8gZnJlZWx5IHNlYXJjaCBpdHMgZGF0YWJhc2Ugb2YgYm9va3MsIGFubm90YXRpb25zLCByZXZpZXdzIGFuZCByYXRpbmdzLiBQZW9wbGUgY2FuIGNoZWNrIG91dCBwZXJzb25hbGl6ZWQgcmVjb21tZW5kYXRpb25zIGFuZCBmaW5kIG91dCBpZiBhIGJvb2tzIGlzIGEgZ29vZCBmb3IgdGhlbS4gVGhpcyBkYXRhc2V0IGNvbnRhaW4gMTAsMDAwIGJvb2tzIGFuZCA1MCwwMDArIHVzZXJzLiBSYXRpbmdzIGFyZSAxIC0gNSAgYW5kIGVhY2ggdXNlcnMgcmF0ZWQgYXQgbGVhc3QgMiBib29rcy4gRGF0YSBjYW4gYmUgZm91bmQgW2hlcmVdKGh0dHBzOi8vZ2l0aHViLmNvbS96eWdtdW50ei9nb29kYm9va3MtMTBrKS4gDQoNCmBgYHtyIG1lc3NhZ2U9RkFMU0UsIHdhcm5pbmc9RkFMU0V9DQpsaWJyYXJ5KHRpZHl2ZXJzZSkNCmxpYnJhcnkoTWF0cml4KQ0KbGlicmFyeShyZWNvbW1lbmRlcmxhYikNCmxpYnJhcnkoa2FibGVFeHRyYSkNCmxpYnJhcnkoZ3JpZEV4dHJhKQ0KYGBgDQoNCiMjIyMgRGF0YSBQcmVwb2Nlc3NpbmcNCmBgYHtyfQ0KYm9va19yYXRpbmdzIDwtIHJlYWQuY3N2KCJodHRwczovL3Jhdy5naXRodWJ1c2VyY29udGVudC5jb20venlnbXVudHovZ29vZGJvb2tzLTEway9tYXN0ZXIvcmF0aW5ncy5jc3YiLCBzZXAgPSAiLCIsIGhlYWRlciA9IFQsIHN0cmluZ3NBc0ZhY3RvcnMgPSBGKQ0KDQpib29rX3RpdGxlcyA8LSByZWFkLmNzdigiaHR0cHM6Ly9yYXcuZ2l0aHVidXNlcmNvbnRlbnQuY29tL3p5Z211bnR6L2dvb2Rib29rcy0xMGsvbWFzdGVyL2Jvb2tzLmNzdiIsIHNlcCA9ICIsIiwgaGVhZGVyID0gVCwgc3RyaW5nc0FzRmFjdG9ycyA9IEYpICU+JSBzZWxlY3QoYm9va19pZCwgdGl0bGUpDQoNCmJvb2tfdGl0bGVzJGJvb2tfaWQgPC0gYXMuZmFjdG9yKGJvb2tfdGl0bGVzJGJvb2tfaWQpDQoNCiMgdGFibGUgZGltZW5zaW9ucw0KZGltKGJvb2tfcmF0aW5ncykNCg0KIyBmaXJzdCBmZXcgcmF0aW5ncyBmb3IgYm9va3MNCmhlYWQoYm9va19yYXRpbmdzLCAxMCkNCmBgYA0KDQpUaGUgc2l6ZSBvZiB0aGlzIGRhdGFzZXQ6IA0KYGBge3J9DQpvYmplY3Quc2l6ZShib29rX3JhdGluZ3MpDQpgYGANCg0KT25seSBhIHN1YnNldCBvZiB0aGUgZGF0YSB3aWxsIGJlIHVzZWQgdG8gYnVpbGQgdGhlIHJlY29tbWVuZGVyIHN5c3RlbXMuDQoNCmBgYHtyfQ0KYm9va19yYXRpbmdzJHVzZXJfaWQgPC0gYXMuZmFjdG9yKGJvb2tfcmF0aW5ncyR1c2VyX2lkKQ0KYm9va19yYXRpbmdzJGJvb2tfaWQgPC0gYXMuZmFjdG9yKGJvb2tfcmF0aW5ncyRib29rX2lkKQ0KDQpibWF0cml4IDwtIGFzKGJvb2tfcmF0aW5ncywgInJlYWxSYXRpbmdNYXRyaXgiKQ0KZGltKGJtYXRyaXhAZGF0YSkNCg0KYGBgDQoNCg0KIyMjIyBTaW1pbGFyaXR5IE1hdHJpeA0KDQpVc2Vycw0KYGBge3J9DQpzaW0gPC0gc2ltaWxhcml0eShibWF0cml4WzE6MTAsIF0sIG1ldGhvZCA9ICJjb3NpbmUiLCB3aGljaCA9ICJ1c2VycyIpDQppbWFnZShhcy5tYXRyaXgoc2ltKSwgbWFpbiA9ICJVc2VyIFNpbWlsYXJpdHkiKQ0KYGBgDQoNCg0KQm9va3MNCmBgYHtyfQ0Kc2ltMiA8LSBzaW1pbGFyaXR5KGJtYXRyaXhbICwxOjEwXSwgbWV0aG9kID0gImNvc2luZSIsIHdoaWNoID0gIml0ZW1zIikNCmltYWdlKGFzLm1hdHJpeChzaW0yKSwgbWFpbiA9ICJJdGVtIFNpbWlsYXJpdHkiKQ0KDQoNCmBgYA0KDQpHb2luZyBmb3J3YXJkLCB3ZSB3aWxsIGJ1aWxkIHJlY29tbWVuZGVyIHN5c3RlbXMgdXNpbmcgZGF0YSB0aGF0IGNvbnNpc3Qgb2YgdXNlcnMgd2hvIHJhdGVkIGF0IGxlYXN0IDE1MCBib29rcyBhbmQgYm9va3MgcmF0ZWQgYXQgbGVhc3QgMzAwIHRpbWVzLg0KYGBge3J9DQojIHVzZXJzIHdobyByYXRlZCBhdCBsZWFzdCAxMDAgYm9va3MgYW5kIGJvb2tzIHJhdGVkIGF0IGxlYXN0IDEwMCB0aW1lcw0KYm1hdHJpeCA8LSBibWF0cml4W3Jvd0NvdW50cyhibWF0cml4KSA+IDE1MCwgY29sQ291bnRzKGJtYXRyaXgpID4gMzAwXQ0KYm1hdHJpeA0KDQpgYGANCg0KIyMjIyBIb3cgYXJlIHRoZSByYXRpbmdzIGRpc3JpYnV0ZWQ/DQpgYGB7cn0NCnRibF9yYXRpbmdzIDwtIGFzLmRhdGEuZnJhbWUodGFibGUoYXMudmVjdG9yKGJtYXRyaXhAZGF0YSkpKQ0KdGJsX3JhdGluZ3MNCnRibF9yYXRpbmdzIDwtIHRibF9yYXRpbmdzWy0xLF0gIzAgbWVhbnMgbWlzc2luZyB2YWx1ZXMgc28gcmVtb3ZlIG1pc3NpbmcgdmFsdWVzDQpnZ3Bsb3QodGJsX3JhdGluZ3MsIGFlcyh4ID0gVmFyMSwgeSA9IEZyZXEsIGZpbGwgPSBWYXIxKSkgKyBnZW9tX2JhcihzdGF0ID0gImlkZW50aXR5IikgKyBnZ3RpdGxlKCJEaXN0cmlidXRpb24gb2YgQm9vayBSYXRpbmdzIikNCmBgYA0KDQojIyMjIE1vc3QgcmF0ZWQgYm9va3MNCmBgYHtyfQ0KDQpyYXRlZF9jb3VudCA8LSBjb2xDb3VudHMoYm1hdHJpeCkNCg0KcmVhZF9ib29rIDwtIGRhdGEuZnJhbWUoDQogIGJvb2tfaWQgPSBuYW1lcyhyYXRlZF9jb3VudCksDQogIHJlYWQgPSByYXRlZF9jb3VudA0KKQ0KDQp0b3BfYm9va3MgPC0gDQogIGlubmVyX2pvaW4ocmVhZF9ib29rLCBib29rX3RpdGxlcywgYnkgPSAiYm9va19pZCIpICU+JSANCiAgYXJyYW5nZShkZXNjKHJlYWQpKSAlPiUgDQogIHNlbGVjdCgtYm9va19pZCkgJT4lIA0KICBoZWFkKDEwKSAlPiUgDQogIGdncGxvdChhZXMoeCA9IHRpdGxlLCB5ID0gcmVhZCkpICsgZ2VvbV9iYXIoc3RhdCA9ICJpZGVudGl0eSIsIGZpbGwgPSAibGlnaHRibHVlIikgKyBnZW9tX3RleHQoYWVzKGxhYmVsPXJlYWQpLCB2anVzdD0tMC4zLCBzaXplPTMuNSkgKyBnZ3RpdGxlKCJUb3AgMTAgUmF0ZWQgQm9va3MiKSArICBjb29yZF9mbGlwKCkNCnRvcF9ib29rcw0KDQpgYGANCg0KDQojIyMjIEF2ZXJhZ2UgYm9vayByYXRpbmdzDQoNCmBgYHtyfQ0KDQphdmdfYm9va19yYXRpbmdzIDwtIGRhdGEuZnJhbWUoImF2Z19yYXRpbmciID0gY29sTWVhbnMoYm1hdHJpeCkpICU+JSANCiAgZ2dwbG90KGFlcyh4ID0gYXZnX3JhdGluZykpICsgDQogIGdlb21faGlzdG9ncmFtKGNvbG9yID0gImJsYWNrIiwgZmlsbCA9ICJsaWdodGdyZWVuIikgKyANCiAgZ2d0aXRsZSgiRGlzdHJpYnV0aW9uIG9mIEF2ZXJhZ2UgUmF0aW5ncyBmb3IgQm9va3MiKQ0KDQphdmdfYm9va19yYXRpbmdzDQoNCg0KYGBgDQoNCg0KTWF0cml4IG9mIGZpcnN0IDEwMCB1c2VycyBhbmQgMTAwIGJvb2tzLiBEYXJrZXIgc3BvdHMgcmVwcmVzZW50cyB0aGUgaGlnaGVzdCByYXRlZCBib29rcy4gDQpgYGB7cn0NCmltYWdlKGJtYXRyaXhbMToxMDAsIDE6MTAwXSwgbWFpbiA9ICJGaXJzdCAxMDAgdXNlcnMgYW5kIGJvb2tzIikNCmBgYA0KDQoNCiMjIyMgVG9wIDElIG9mIHJlYWRlcnMgYW5kIGJvb2tzIGluIHRoZSBib29rIG1hdHJpeA0KYGBge3J9DQptaW5fcmVhZGVycyA8LSBxdWFudGlsZShyb3dDb3VudHMoYm1hdHJpeCksIDAuOTkpDQptaW5fYm9va3MgPC0gcXVhbnRpbGUoY29sQ291bnRzKGJtYXRyaXgpLCAwLjk5KQ0KDQphIDwtIGltYWdlKGJtYXRyaXhbcm93Q291bnRzKGJtYXRyaXgpID4gbWluX3JlYWRlcnMsIGNvbENvdW50cyhibWF0cml4KSA+IG1pbl9ib29rc10sIG1haW4gPSAiTm9uLU5vcm1hbGl6ZWQiKQ0KDQojIHRvIGVsaW1pbmF0ZSBiaWFzIHRoZXJlZm9yZSBhdmVyYWdlIHJhdGluZyB3b3VsZCBiZSAwDQpib29rX25vcm0gPC0gbm9ybWFsaXplKGJtYXRyaXgpDQoNCmIgPC0gaW1hZ2UoYm9va19ub3JtW3Jvd0NvdW50cyhib29rX25vcm0pID4gbWluX3JlYWRlcnMsIGNvbENvdW50cyhib29rX25vcm0pID4gbWluX2Jvb2tzXSwgbWFpbiA9ICJOb3JtYWxpemVkIikNCmdyaWQuYXJyYW5nZShhLCBiLCBuY29sID0gMikNCmBgYA0KDQoNCg0KIyMjIyBUcmFpbmluZyBhbmQgVGVzdGluZyBEYXRhc2V0cw0KYGBge3J9DQp0cmFpbiA8LSBzYW1wbGUoeCA9IGMoVCwgRiksIHNpemUgPSBucm93KGJtYXRyaXgpLCByZXBsYWNlID0gVCwgcHJvYiA9IGMoMC44LCAwLjIpKSANCmJvb2tzX3RyYWluIDwtIGJtYXRyaXhbdHJhaW4sIF0gDQoNCmJvb2tzX3Rlc3QgPC0gYm1hdHJpeFstdHJhaW4sIF0NCg0KYGBgDQoNCg0KIyMjIEl0ZW0tSXRlbSBDb2xsYWJvcmF0aXZlIEZpbHRlcmluZw0KDQpBIGZpbHRlcmluZyBtZXRob2QgaW4gd2hpY2ggdGhlIHNpbWlsYXJpdHkgYmV0d2VlbiBpdGVtcyBpcyBjYWxjdWxhdGVkIHVzaW5nIHBlb3BsZSdzIHJhdGluZ3Mgb2YgdGhvc2UgaXRlbXMuIEluIG90aGVyIHdvcmRzIHRoZSBhbGdvcml0aG0gcmVjb21tZW5kcyBpdGVtcyBzaW1pbGFyIHRvIHRoZSB1c2VyJ3MgcHJldmlvdXMgc2VsZWN0aW9ucy4gSW4gdGhlIGFsZ29yaXRobSwgdGhlIHNpbWlsYXJpdGllcyBiZXR3ZWVuIGRpZmZlcmVudCBpdGVtcyBpbiB0aGUgZGF0YXNldCBhcmUgY2FsY3VsYXRlZCBieSB1c2luZyBvbmUgb2YgYSBudW1iZXIgb2Ygc2ltaWxhcml0eSBtZWFzdXJlcywgYW5kIHRoZW4gdGhlc2Ugc2ltaWxhcml0eSB2YWx1ZXMgYXJlIHVzZWQgdG8gcHJlZGljdCByYXRpbmdzIGZvciB1c2VyLWl0ZW0gcGFpcnMgbm90IHByZXNlbnQgaW4gdGhlIGRhdGFzZXQuDQoNCmBgYHtyIG1lc3NhZ2U9RkFMU0UsIHdhcm5pbmc9RkFMU0V9DQoNCkltb2RlbCA8LSBSZWNvbW1lbmRlcihkYXRhID0gYm9va3NfdHJhaW4sIG1ldGhvZCA9ICJJQkNGIikNCg0KSW1vZGVsDQoNCmBgYA0KDQpQcmVkaWN0IHdpdGggdGVzdCBkYXRhLg0KYGBge3J9DQoNCklwcmVkaWN0IDwtIHByZWRpY3QoSW1vZGVsLCBuZXdkYXRhID0gYm9va3NfdGVzdCwgbiA9IDUpICU+JSBsaXN0KCkNCg0KSXByZWRpY3QNCmBgYA0KDQpCb29rcyByZWNvbW1lbmRlZCBmb3Igc3BlY2lmaWMgdXNlcnMgc2ltbGlhciB0byBhIHNwZWNpZmllZCBpdGVtIG9yIGl0ZW0gY2hvc2VuIGJ5IHVzZXIuDQpgYGB7ciBtZXNzYWdlPUZBTFNFLCB3YXJuaW5nPUZBTFNFfQ0KIyBmdW5jdGlvbiBjcmVhdGVkIHRvIGRpc3BsYXkgcmVjb21tZW5kZWQgc2ltaWxhciBib29rcyB0byB1c2Vycw0KaXRlbV9yZWNjX2Jvb2tzIDwtIGZ1bmN0aW9uKGkpew0KcCA8LSBJcHJlZGljdFtbMV1dQGl0ZW1zW1tpXV0NCnAgPC0gZGF0YS5mcmFtZSgiZ3Vlc3MiID0gYXMuZmFjdG9yKHApKQ0KcCA8LSBpbm5lcl9qb2luKHAsIGJvb2tfdGl0bGVzLCBieSA9IGMoImd1ZXNzIiA9ICJib29rX2lkIikpICU+JSBzZWxlY3QodGl0bGUpDQpyIDwtIGRhdGEuZnJhbWUoIm5hbWUiID0gYXMuZmFjdG9yKGkpKQ0KciA8LSBpbm5lcl9qb2luKHIsIGJvb2tfdGl0bGVzLCBieSA9IGMoIm5hbWUiID0gImJvb2tfaWQiKSkgJT4lIHNlbGVjdCh0aXRsZSkNCnByaW50KHBhc3RlKCJCb29rcyBzaW1pbGFyIHRvIC0tIiwgcikpDQoNCnJldHVybihhcy5saXN0KHApKQ0KfQ0KDQppdGVtX3JlY2NfYm9va3MoNSk7IGl0ZW1fcmVjY19ib29rcygyMDApOyBpdGVtX3JlY2NfYm9va3MoMTgpDQoNCmBgYA0KDQoNCmBgYHtyfQ0KDQppYmNmIDwtIHRhYmxlKHVubGlzdChJcHJlZGljdFtbMV1dQGl0ZW1zKSkgJT4lIGJhcnBsb3QobWFpbiA9ICJEaXN0cmlidXRpb24gb2YgdGhlIG51bWJlciBvZiBpdGVtcyBmb3IgSUJDRiIpDQoNCmBgYA0KDQpTb21lIGJvb2tzIHdlcmUgcmVjb21tZW5kZWQgbW9yZSBvZnRlbiB0aGFuIHRoZSBvdGhlcnMgYXMgc2VlbiBpbiB0aGUgcGxvdCBhYm92ZS4NCg0KDQojIyMgVXNlci1Vc2VyIENvbGxhYm9yYXRpdmUgRmlsdGVyaW5nIA0KDQpSZWNvbW1lbmRzIGl0ZW1zIHRoYXQgYXJlIHNpbWlsYXIgcHVyY2hhc2VkIGJ5IHRoZSBzYW1lIHBlb3BsZS4gVGhlIGFsZ29yaXRobSBpZGVudGlmaWVzIG90aGVyIHBlb3BsZSB3aXRoIHNpbWlsYXIgdGFzdGVzIHRvIGEgdGFyZ2V0IHVzZXIgYW5kIGNvbWJpbmVzIHRoZWlyIHJhdGluZ3MgdG8gbWFrZSByZWNvbW1lbmRhdGlvbnMgZm9yIHRoYXQgdXNlci4NCg0KDQpDcmVhdGUgdXNlci1iYXNlZCBtb2RlbA0KYGBge3J9DQoNClVtb2RlbCA8LSBSZWNvbW1lbmRlcihkYXRhID0gYm9va3NfdHJhaW4sIG1ldGhvZCA9ICJVQkNGIikNCg0KVW1vZGVsDQpgYGANCg0KUHJlZGljdCBkYXRhIHdpdGggdGVzdGluZyBkYXRhDQpgYGB7cn0NClVwcmVkaWN0IDwtIHByZWRpY3QoVW1vZGVsLCBuZXdkYXRhID0gYm9va3NfdGVzdCwgbiA9IDUpICU+JSBsaXN0KCkNCg0KVXByZWRpY3QNCg0KYGBgDQoNCg0KYGBge3IgbWVzc2FnZT1GQUxTRSwgd2FybmluZz1GQUxTRX0NCg0KIyBmdW5jdGlvbiBjcmVhdGVkIHRvIGRpc3BsYXkgcmVjb21tZW5kZWQgc2ltaWxhciBib29rcyB0byB1c2Vycw0KdXNlcl9yZWNjX2Jvb2tzIDwtIGZ1bmN0aW9uKHUpew0KcCA8LSBVcHJlZGljdFtbMV1dQGl0ZW1zW1t1XV0NCnAgPC0gZGF0YS5mcmFtZSgiZ3Vlc3MiID0gYXMuZmFjdG9yKHApKQ0KcCA8LSBpbm5lcl9qb2luKHAsIGJvb2tfdGl0bGVzLCBieSA9IGMoImd1ZXNzIiA9ICJib29rX2lkIikpICU+JSBzZWxlY3QodGl0bGUpDQpyIDwtIGRhdGEuZnJhbWUoIm5hbWUiID0gYXMuZmFjdG9yKHUpKQ0KciA8LSBpbm5lcl9qb2luKHIsIGJvb2tfdGl0bGVzLCBieSA9IGMoIm5hbWUiID0gImJvb2tfaWQiKSkgJT4lIHNlbGVjdCh0aXRsZSkNCnByaW50KHBhc3RlKCJCb29rcyBzaW1pbGFyIHRvIC0tIiwgciwgIi0tIGJhc2VkIG9uIHNpbWlsYXIgdXNlcnMiKSkNCnJldHVybihhcy5saXN0KHApKQ0KfQ0KDQp1c2VyX3JlY2NfYm9va3MoNSk7IHVzZXJfcmVjY19ib29rcygyMDApOyB1c2VyX3JlY2NfYm9va3MoMTgpDQoNCmBgYA0KDQoNCmBgYHtyfQ0KdWJjZiA8LSB0YWJsZSh1bmxpc3QoVXByZWRpY3RbWzFdXUBpdGVtcykpICU+JSBiYXJwbG90KG1haW4gPSAiRGlzdHJpYnV0aW9uIG9mIHRoZSBudW1iZXIgb2YgaXRlbXMgZm9yIFVCQ0YiKQ0KDQpgYGANClNvbWUgYm9va3Mgd2VyZSByZWNvbW1lbmRlZCB0byB1c2VycyBtb3JlIHRoYW4gdGhlIG90aGVycy4NCg0KDQojIyMgU3VtbWFyeQ0KDQpPdmVyYWxsLCBidWlsZGluZyBib3RoIHJlY2NvbW1lbmRhdGlvbiBzeXNlbXMgZ2F2ZSBhIGJldHRlciB1bmRlcnN0YW5kaW5nIG9mIGhvdyB0aGV5IHdvcmsuIE9uIG15IGVuZCwgdGhlIFVzZXIgQmFzZWQgQ0YgdG9vayBhIGxvbmdlciB0aW1lIHRvIGNvbXB1dGUgdGhhbiB0aGUgSUJDRi4gVGhpcyB3YXMgcHJvdmVuIGJhc2VkIG9uIHRoZSBmYWN0IHRoYXQgdGhlIGJvb2sgIkJ1aWxkaW5nIFJlY29tbWVuZGF0aW9uIFN5c3RlbXMgd2l0aCBSIiBtZW50aW9uZWQgdGhhdCB0aGUgVUJDRiBpcyBhIGxhenkgbWV0aG9kLiBJdCBhY3R1YWxseSBuZWVkcyBhY2Nlc3MgdG8gYWxsIG9mIHRoZSBkYXRhIHRvIHBlcmZvcm0gYSBwcmVkaWN0aW9uIGhlbmNlIHdoeSBpdCBkb2VzIG5vdCB3b3JrIHdlbGwgd2l0aCBsYXJnZSBtYXRyaWNlcy4gT24gYSB3aG9sZSwgSXRlbS1pdGVtIGNvbGxhYm9yYXRpdmUgZmlsdGVyaW5nIGhhZCBsZXNzIGVycm9yIHRoYW4gdXNlci11c2VyIGNvbGxhYm9yYXRpdmUgZmlsdGVyaW5nLiANCg==