Introduction

Product pricing is a tough challenge, especially at scale. For example, clothing has strong seasonal pricing trends and is heavily influenced by brand names, while electronics have fluctuating prices based on product specs.

In this Kaggle competition, Mercari, Japan’s biggest shopping app, is reaching out to the community of Kagglers to develop predictive models for suggestion of item price.

Data

train.tsv, test.tsv

The files consist of a list of product listings. These files are tab-delimited.

train_id or test_id - the id of the listing
name - the title of the listing. Note that we have cleaned the data to remove text that look like prices (e.g. $20) to avoid leakage. These removed prices are represented as [rm]
item_condition_id - the condition of the items provided by the seller
category_name - category of the listing
brand_name
price - the price that the item was sold for. This is the target variable that you will predict. The unit is USD. This column doesn’t exist in test.tsv since that is what you will predict. shipping - 1 if shipping fee is paid by seller and 0 by buyer
item_description - the full description of the item. Note that we have cleaned the data to remove text that look like prices (e.g. $20) to avoid leakage. These removed prices are represented as [rm]

sample_sumbmission.csv

A sample submission file in the correct format.

test_id - matches the test_id column in test.tsv
price

Without further ado, let’s dive into the analysis!

Exploratory analysis

library(data.table)
library(dplyr)
library(stringr)
library(ggplot2)
library(treemapify)
library(quanteda)
library(gridExtra)

Let’s load the training data first.

mercari <- fread("data/train.tsv", sep = "\t")


Read 77.6% of 1482535 rows
Read 1482535 rows and 8 (of 8) columns from 0.315 GB file in 00:00:03

First, let’s look into whether any columns are worth dropping straight away because they will not be useful for neither analysis nor training the models.

summary(mercari)

    train_id           name           item_condition_id category_name       brand_name            price            shipping     
 Min.   :      0   Length:1482535     Min.   :1.000     Length:1482535     Length:1482535     Min.   :   0.00   Min.   :0.0000  
 1st Qu.: 370634   Class :character   1st Qu.:1.000     Class :character   Class :character   1st Qu.:  10.00   1st Qu.:0.0000  
 Median : 741267   Mode  :character   Median :2.000     Mode  :character   Mode  :character   Median :  17.00   Median :0.0000  
 Mean   : 741267                      Mean   :1.907                                           Mean   :  26.74   Mean   :0.4473  
 3rd Qu.:1111900                      3rd Qu.:3.000                                           3rd Qu.:  29.00   3rd Qu.:1.0000  
 Max.   :1482534                      Max.   :5.000                                           Max.   :2009.00   Max.   :1.0000  
 item_description  
 Length:1482535    
 Class :character  
 Mode  :character

It seems like train_id is irrelevant for both tasks, so let’s remove it.

mercari$train_id <- NULL

What immediately stands out about this dataset is that there are only two features which are numeric (apart from price), namely: item_condition_id and shipping. This suggests that a lot of potentially useful information is contained in the text columns: item_description, category_name, name and brand.

Let’s look at whether there are any NA values.

apply(mercari, 2, anyNA)

             name item_condition_id     category_name        brand_name             price          shipping  item_description 
            FALSE             FALSE             FALSE             FALSE             FALSE             FALSE             FALSE

Luckily, there are none! Let’s look into numeric columns now.

item_condition_id

common_theme <- theme(plot.title = element_text(face = "bold", size = 16)) + theme_minimal()
ggplot(mercari, aes(x = item_condition_id)) + geom_bar(fill = "steelblue4") + ggtitle("Frequency of item_condition_id") + common_theme

Clearly, items with condition 1 are the most common, followed by 3, 2, 4 and, finally, 5. It is worth noting that there is a large difference in the frequency for classes 1-3 and 4-5.

It is worth investigating how the item price is related to its condition, so let’s do just that now.

ggplot(mercari, aes(x = price)) + geom_histogram(bins = 50) + ggtitle("Histogram of item price") + common_theme

range(mercari$price)

[1]    0 2009

The price variable is very left-skewed, with a very long right tail. The minimal price is 0 (most likely people giving things away for free), while the highest is 2009. Let’s transform the variable using log(x+1) to get rid of skewness (the +1 is there to avoid taking log(0)).

ggplot(mercari, aes(x = log(price + 1))) + geom_histogram(bins = 50, fill = "gold") + ggtitle("Histogram of log(pirce + 1)") + common_theme

Let’s now look at the joint relationship between price and item_condition_id

ggplot(mercari, aes(x = as.factor(item_condition_id), y = log(price + 1))) + geom_boxplot(fill = "steelblue4") + ggtitle("Relationship between item condition and its price") + common_theme + xlab("Item condition") + ylab("Price")

It seems like there is no clear trend between item condition and its price. Moreover, it is not clear whether condition 1 means the best or the worst item quality, and this is impossible to determine from the boxplot above. My best guess is that condition 1 corresponds to the highest quality due to the maximum values of log(price + 1) being the highest.

It is worth noting that condition 5 has the highest median price, but this is a less significant result due to very small sample size for that condition category.

shipping

Let’s now have a look at the shipping variable.

table(mercari$shipping)


     0      1 
819435 663100

The 0 category is dominant here. We can now look at how shipping is realted to price

ggplot(mercari, aes(x = as.factor(shipping), y = log(price + 1))) + geom_boxplot(fill = "darkorange") + ggtitle("Shipping vs price") + common_theme

ggplot(mercari, aes(x = log(price + 1), fill = factor(shipping))) + geom_density(alpha = 0.75, adjust = 2.5) + common_theme + ggtitle("Density of price by shipping category")

It seems like the median item price is higher when shipping = 0.

category_name, brand_name

Let’s now take a closer look at category_name and brand_name, both of which are textual variables. Note that category actually contains 4 sub-categories, so that we can split this column into 4 new ones.

newcols <- str_split_fixed(mercari$category_name, "/", 4)
mercari <- mercari %>% mutate(cat1 = newcols[, 1], cat2 = newcols[, 2], cat3 = newcols[, 3], cat4 = newcols[, 4])
mercari %>% summarise(cat1_unique = length(unique(cat1)), cat2_unique = length(unique(cat2)), cat3_unique = length(unique(cat3)), cat4_unique = length(unique(cat4)))

It seems like the most unique categories are in the 3rd category level. Let’s now look at the hierarchy of 1st and 2nd categories.

options(repr.plot.width=7, repr.plot.height=7)
mercari %>% group_by(cat1, cat2) %>% count() %>% ungroup() %>% ggplot(aes(area = n, fill = cat1, label = cat2, subgroup = cat1)) + geom_treemap() + ggtitle("Hierarchy of 1st and 2nd order categories") + geom_treemap_subgroup_text(min.size = 0, grow = T, alpha = 0.5, colour = "black", fontface = "italic") + geom_treemap_text(colour = "white", place = "topleft", reflow = T) + theme(legend.position = "null")

Women and beauty are the two most common majro categories, so we can have a closer look at 2nd order categories for these two only. Since there are a lot of 2nd order categories, we will only look at the top 10 ones (> 40000 associated items).

options(repr.plot.width=7, repr.plot.height=7)
summ <- mercari %>% filter(cat1 == "Women" | cat1 == "Beauty") %>% count(cat2) %>% filter(n > 40000)
ggplot(summ, aes(x = reorder(cat2, -n), y = n)) + geom_bar(stat = "identity") + ggtitle("2nd order categories for 'Women' and 'Beauty' categories") + theme(axis.text.x = element_text(angle = 45, hjust = 1)) + theme(axis.text.x = element_text(angle = 45), plot.title = element_text(size = 14, face = "bold")) + xlab("Category") + ylab("Count")

We can also have a look at the 2nd and 3rd order categories in a similar way.

mercari %>% group_by(cat2, cat3) %>% count() %>% ungroup() %>% ggplot(aes(area = n, fill = cat2, label = cat3, subgroup = cat2)) + geom_treemap() + ggtitle("Hierarchy of 2nd and 3rd order categories") + geom_treemap_subgroup_text(min.size = 0, grow = T, alpha = 0.5, colour = "black", fontface = "italic") + geom_treemap_text(colour = "white", place = "topleft", reflow = T) + theme(legend.position = "null")

It’s interesting to look closer at the items which don’t have a brand associated with them. This constitutes a large proportion of the dataset:

mean(mercari$brand_name == "")

[1] 0.4267569

mercari$has_brand <- mercari$brand_name != ""
mercari %>% ggplot(aes(x = reorder(cat1, -has_brand), fill = has_brand)) + geom_bar(position = "fill") + xlab("Category") + ylab("Proportion of items with brand") + ggtitle("Breakdown of 1st order categories\nby proportion of items with brand name") + theme(axis.text.x = element_text(angle = 30, hjust = 1))

We can see that there are huge differences in proportions of items with a brand; while over 75% of items in the Men category have a brand name, nearly no items have one in the Handmade category.

Let’s now look at what brands are the most popular.

top_brands <- mercari %>% filter(has_brand == T) %>% count(brand_name) %>% arrange(desc(n)) %>% head(15)
mercari %>% filter(brand_name %in% top_brands$brand_name) %>% ggplot(aes(x = factor(brand_name, levels = top_brands$brand_name), fill = cat1)) + geom_bar() + theme_minimal() + theme(axis.text.x = element_text(angle = 30, hjust = 1)) + xlab("Brand name") + labs(fill = "Category") + ggtitle("Most popular brands by category")

The top brands are clearly dominated by the Women category. We can also look at how expensive each brand is.

options(repr.plot.width=30, repr.plot.height=30)
brand_median_prices <- mercari %>% filter(has_brand == T & brand_name %in% top_brands$brand_name) %>% group_by(brand_name) %>% summarise(median(price))
colnames(brand_median_prices)[2] <- "median_price"
brand_median_prices <- brand_median_prices %>% arrange(desc(median_price))
mercari %>% filter(has_brand == T & brand_name %in% brand_median_prices$brand_name) %>% ggplot(aes(x = factor(brand_name, levels = rev(brand_median_prices$brand_name)), y = price, fill = as.factor(shipping))) + geom_boxplot() + coord_flip() + xlab("Brand name") + ylab("Price") + ggtitle("Brand name vs price") + labs(fill = "Shipping") + common_theme

We can see that Michael Kors is the most expensive brand, while Apple seems to have a highly left-skewed distribution, with a lot of highly-priced items. Moreover, it seems like the buyers pay the highest premium for shipping for Apple products too.

Let’s now do a little analysis of item descriptions.

First, we should perform some basic preprocessing by setting the description to “NA” where == “no description yet”. We will not yet transform the text to lowercase as this prevents the corpus() function of package quanteda from counting the sentences properly.

#mercari$item_description <- tolower(mercari$item_description)
mercari[mercari$item_description == "No description yet", "item_description"] = NA

Let’s count the number of characters and plot it against mean of log(price + 1).

mercari$desc_len <- nchar(mercari$item_description)
mean_log_price <- mercari %>% group_by(desc_len) %>% summarise(mean(log(price + 1)))
colnames(mean_log_price)[2] <- "mean_log_price"
ggplot(mean_log_price, aes(x = desc_len, y = mean_log_price)) + geom_point() + stat_smooth(method = "loess") + xlab("Description length") + ylab("Mean log price") + ggtitle("Mean log price vs item description length") + common_theme

There seems to be no clear relationship between description length and item price.

Let’s now create a corpus and a document term matrix and count the number of 1, 2 and 3-grams.

# 1-grams
desc_corpus <- corpus(mercari$item_description)
dtm1 <- dfm(desc_corpus, ngrams = 1, remove = c("rm", stopwords("english")), remove_punct = T, remove_numbers = T, stem = T)
top_1grams <- data.frame(term = names(topfeatures(dtm1, n = 20)), count = topfeatures(dtm1, n = 20))
p1 <- ggplot(top_1grams, aes(x = reorder(term, count), y = count)) + geom_bar(stat = "identity", fill = "steelblue4") + xlab("1-gram") + ylab("Count") + ggtitle("Frequency of 1-grams") + coord_flip() + common_theme
# Take 20% of corpus for computing 2-grams
desc_corpus_20 <- corpus_sample(desc_corpus, size = floor(ndoc(desc_corpus)*0.2))
# 2-grams
dtm2 <- dfm(desc_corpus_20, ngrams = 2, remove = c("rm", stopwords("english")), remove_punct = T, remove_numbers = T, concatenator = " ")
top_2grams <- data.frame(term = names(topfeatures(dtm2, n = 20)), count = topfeatures(dtm2, n = 20))
p2 <- ggplot(top_2grams, aes(x = reorder(term, count), y = count)) + geom_bar(stat = "identity", fill = "darkgreen") + xlab("2-gram") + ylab("Count") + ggtitle("Frequency of 2-grams") + coord_flip() + common_theme
# 3-grams
dtm3 <- dfm(desc_corpus_20, ngrams = 3, remove = c("rm", stopwords("english")), remove_punct = T, remove_numbers = T, concatenator = " ")
top_3grams <- data.frame(term = names(topfeatures(dtm3, n = 20)), count = topfeatures(dtm3, n = 20))
p3 <- ggplot(top_3grams, aes(x = reorder(term, count), y = count)) + geom_bar(stat = "identity", fill = "darkred") + xlab("3-gram") + ylab("Count") + ggtitle("Frequency of 3-grams") + coord_flip() + common_theme
grid.arrange(p1, p2, p3, nrow = 1)

For 1-grams, the most common ones are new and size. There is a relatively sharp count drop for 2-grams, where brand new is the most common by far, followed by roughly 2 times less common free shipping. When it comes to 3-grams, there is no marked sharp drop in frequency, and the most common trigrams are price is firm and new with tags.

LS0tCnRpdGxlOiAiTWVyY2FyaSBQcmljZSBTdWdnZXN0aW9uIC0gRXhwbG9yYXRvcnkgQW5hbHlzaXMiCm91dHB1dDogaHRtbF9ub3RlYm9vawotLS0KCiMgSW50cm9kdWN0aW9uClByb2R1Y3QgcHJpY2luZyBpcyBhIHRvdWdoIGNoYWxsZW5nZSwgZXNwZWNpYWxseSBhdCBzY2FsZS4gRm9yIGV4YW1wbGUsIGNsb3RoaW5nIGhhcyBzdHJvbmcgc2Vhc29uYWwgcHJpY2luZyB0cmVuZHMgYW5kIGlzIGhlYXZpbHkgaW5mbHVlbmNlZCBieSBicmFuZCBuYW1lcywgd2hpbGUgZWxlY3Ryb25pY3MgaGF2ZSBmbHVjdHVhdGluZyBwcmljZXMgYmFzZWQgb24gcHJvZHVjdCBzcGVjcy4KCkluIHRoaXMgS2FnZ2xlIGNvbXBldGl0aW9uLCBNZXJjYXJpLCBKYXBhbidzIGJpZ2dlc3Qgc2hvcHBpbmcgYXBwLCBpcyByZWFjaGluZyBvdXQgdG8gdGhlIGNvbW11bml0eSBvZiBLYWdnbGVycyB0byBkZXZlbG9wIHByZWRpY3RpdmUgbW9kZWxzIGZvciBzdWdnZXN0aW9uIG9mIGl0ZW0gcHJpY2UuCgojIERhdGEKKip0cmFpbi50c3YsIHRlc3QudHN2KioKClRoZSBmaWxlcyBjb25zaXN0IG9mIGEgbGlzdCBvZiBwcm9kdWN0IGxpc3RpbmdzLiBUaGVzZSBmaWxlcyBhcmUgdGFiLWRlbGltaXRlZC4KCiogKnRyYWluX2lkKiBvciAqdGVzdF9pZCogLSB0aGUgaWQgb2YgdGhlIGxpc3RpbmcKKiAqbmFtZSogLSB0aGUgdGl0bGUgb2YgdGhlIGxpc3RpbmcuIE5vdGUgdGhhdCB3ZSBoYXZlIGNsZWFuZWQgdGhlIGRhdGEgdG8gcmVtb3ZlIHRleHQgdGhhdCBsb29rIGxpa2UgcHJpY2VzIChlLmcuICQyMCkgdG8gYXZvaWQgbGVha2FnZS4gVGhlc2UgcmVtb3ZlZCBwcmljZXMgYXJlIHJlcHJlc2VudGVkIGFzIFtybV0KKiAqaXRlbV9jb25kaXRpb25faWQqIC0gdGhlIGNvbmRpdGlvbiBvZiB0aGUgaXRlbXMgcHJvdmlkZWQgYnkgdGhlIHNlbGxlcgoqICpjYXRlZ29yeV9uYW1lKiAtIGNhdGVnb3J5IG9mIHRoZSBsaXN0aW5nCiogKmJyYW5kX25hbWUqCiogKnByaWNlKiAtIHRoZSBwcmljZSB0aGF0IHRoZSBpdGVtIHdhcyBzb2xkIGZvci4gVGhpcyBpcyB0aGUgdGFyZ2V0IHZhcmlhYmxlIHRoYXQgeW91IHdpbGwgcHJlZGljdC4gVGhlIHVuaXQgaXMgVVNELiBUaGlzIGNvbHVtbiBkb2Vzbid0IGV4aXN0IGluIHRlc3QudHN2IHNpbmNlIHRoYXQgaXMgd2hhdCB5b3Ugd2lsbCBwcmVkaWN0LgpzaGlwcGluZyAtIDEgaWYgc2hpcHBpbmcgZmVlIGlzIHBhaWQgYnkgc2VsbGVyIGFuZCAwIGJ5IGJ1eWVyCiogKml0ZW1fZGVzY3JpcHRpb24qIC0gdGhlIGZ1bGwgZGVzY3JpcHRpb24gb2YgdGhlIGl0ZW0uIE5vdGUgdGhhdCB3ZSBoYXZlIGNsZWFuZWQgdGhlIGRhdGEgdG8gcmVtb3ZlIHRleHQgdGhhdCBsb29rIGxpa2UgcHJpY2VzIChlLmcuICQyMCkgdG8gYXZvaWQgbGVha2FnZS4gVGhlc2UgcmVtb3ZlZCBwcmljZXMgYXJlIHJlcHJlc2VudGVkIGFzIFtybV0KCioqc2FtcGxlX3N1bWJtaXNzaW9uLmNzdioqCgpBIHNhbXBsZSBzdWJtaXNzaW9uIGZpbGUgaW4gdGhlIGNvcnJlY3QgZm9ybWF0LgoKKiAqdGVzdF9pZCogLSBtYXRjaGVzIHRoZSAqdGVzdF9pZCogY29sdW1uIGluICp0ZXN0LnRzdioKKiAqcHJpY2UqCgpXaXRob3V0IGZ1cnRoZXIgYWRvLCBsZXQncyBkaXZlIGludG8gdGhlIGFuYWx5c2lzIQoKIyBFeHBsb3JhdG9yeSBhbmFseXNpcwoKYGBge3IsbWVzc2FnZT1GQUxTRSx3YXJuaW5nPUZBTFNFfQpsaWJyYXJ5KGRhdGEudGFibGUpCmxpYnJhcnkoZHBseXIpCmxpYnJhcnkoc3RyaW5ncikKbGlicmFyeShnZ3Bsb3QyKQpsaWJyYXJ5KHRyZWVtYXBpZnkpCmxpYnJhcnkocXVhbnRlZGEpCmxpYnJhcnkoZ3JpZEV4dHJhKQpgYGAKCkxldCdzIGxvYWQgdGhlIHRyYWluaW5nIGRhdGEgZmlyc3QuCgpgYGB7cn0KbWVyY2FyaSA8LSBmcmVhZCgiZGF0YS90cmFpbi50c3YiLCBzZXAgPSAiXHQiKQpgYGAKCkZpcnN0LCBsZXQncyBsb29rIGludG8gd2hldGhlciBhbnkgY29sdW1ucyBhcmUgd29ydGggZHJvcHBpbmcgc3RyYWlnaHQgYXdheSBiZWNhdXNlIHRoZXkgd2lsbCBub3QgYmUgdXNlZnVsIGZvciBuZWl0aGVyIGFuYWx5c2lzIG5vciB0cmFpbmluZyB0aGUgbW9kZWxzLgoKYGBge3J9CnN1bW1hcnkobWVyY2FyaSkKYGBgCgpJdCBzZWVtcyBsaWtlICp0cmFpbl9pZCogaXMgaXJyZWxldmFudCBmb3IgYm90aCB0YXNrcywgc28gbGV0J3MgcmVtb3ZlIGl0LgoKYGBge3J9Cm1lcmNhcmkkdHJhaW5faWQgPC0gTlVMTApgYGAKCldoYXQgaW1tZWRpYXRlbHkgc3RhbmRzIG91dCBhYm91dCB0aGlzIGRhdGFzZXQgaXMgdGhhdCB0aGVyZSBhcmUgb25seSB0d28gZmVhdHVyZXMgd2hpY2ggYXJlIG51bWVyaWMgKGFwYXJ0IGZyb20gKnByaWNlKiksIG5hbWVseTogKml0ZW1fY29uZGl0aW9uX2lkKiBhbmQgKnNoaXBwaW5nKi4gVGhpcyBzdWdnZXN0cyB0aGF0IGEgbG90IG9mIHBvdGVudGlhbGx5IHVzZWZ1bCBpbmZvcm1hdGlvbiBpcyBjb250YWluZWQgaW4gdGhlIHRleHQgY29sdW1uczogKml0ZW1fZGVzY3JpcHRpb24qLCAqY2F0ZWdvcnlfbmFtZSosICpuYW1lKiBhbmQgKmJyYW5kKi4KCkxldCdzIGxvb2sgYXQgd2hldGhlciB0aGVyZSBhcmUgYW55IE5BIHZhbHVlcy4KCmBgYHtyfQphcHBseShtZXJjYXJpLCAyLCBhbnlOQSkKYGBgCgpMdWNraWx5LCB0aGVyZSBhcmUgbm9uZSEgTGV0J3MgbG9vayBpbnRvIG51bWVyaWMgY29sdW1ucyBub3cuCgojI2l0ZW1fY29uZGl0aW9uX2lkCgpgYGB7cn0KY29tbW9uX3RoZW1lIDwtIHRoZW1lKHBsb3QudGl0bGUgPSBlbGVtZW50X3RleHQoZmFjZSA9ICJib2xkIiwgc2l6ZSA9IDE2KSkgKyB0aGVtZV9taW5pbWFsKCkKZ2dwbG90KG1lcmNhcmksIGFlcyh4ID0gaXRlbV9jb25kaXRpb25faWQpKSArIGdlb21fYmFyKGZpbGwgPSAic3RlZWxibHVlNCIpICsgZ2d0aXRsZSgiRnJlcXVlbmN5IG9mIGl0ZW1fY29uZGl0aW9uX2lkIikgKyBjb21tb25fdGhlbWUKYGBgCgpDbGVhcmx5LCBpdGVtcyB3aXRoIGNvbmRpdGlvbiAxIGFyZSB0aGUgbW9zdCBjb21tb24sIGZvbGxvd2VkIGJ5IDMsIDIsIDQgYW5kLCBmaW5hbGx5LCA1LiBJdCBpcyB3b3J0aCBub3RpbmcgdGhhdCB0aGVyZSBpcyBhIGxhcmdlIGRpZmZlcmVuY2UgaW4gdGhlIGZyZXF1ZW5jeSBmb3IgY2xhc3NlcyAxLTMgYW5kIDQtNS4KCkl0IGlzIHdvcnRoIGludmVzdGlnYXRpbmcgaG93IHRoZSBpdGVtIHByaWNlIGlzIHJlbGF0ZWQgdG8gaXRzIGNvbmRpdGlvbiwgc28gbGV0J3MgZG8ganVzdCB0aGF0IG5vdy4KCmBgYHtyfQpnZ3Bsb3QobWVyY2FyaSwgYWVzKHggPSBwcmljZSkpICsgZ2VvbV9oaXN0b2dyYW0oYmlucyA9IDUwKSArIGdndGl0bGUoIkhpc3RvZ3JhbSBvZiBpdGVtIHByaWNlIikgKyBjb21tb25fdGhlbWUKcmFuZ2UobWVyY2FyaSRwcmljZSkKYGBgCgpUaGUgcHJpY2UgdmFyaWFibGUgaXMgdmVyeSBsZWZ0LXNrZXdlZCwgd2l0aCBhIHZlcnkgbG9uZyByaWdodCB0YWlsLiBUaGUgbWluaW1hbCBwcmljZSBpcyAwIChtb3N0IGxpa2VseSBwZW9wbGUgZ2l2aW5nIHRoaW5ncyBhd2F5IGZvciBmcmVlKSwgd2hpbGUgdGhlIGhpZ2hlc3QgaXMgMjAwOS4gTGV0J3MgdHJhbnNmb3JtIHRoZSB2YXJpYWJsZSB1c2luZyBsb2coeCsxKSAgdG8gZ2V0IHJpZCBvZiBza2V3bmVzcyAodGhlICsxIGlzIHRoZXJlIHRvIGF2b2lkIHRha2luZyBsb2coMCkpLgoKYGBge3J9CmdncGxvdChtZXJjYXJpLCBhZXMoeCA9IGxvZyhwcmljZSArIDEpKSkgKyBnZW9tX2hpc3RvZ3JhbShiaW5zID0gNTAsIGZpbGwgPSAiZ29sZCIpICsgZ2d0aXRsZSgiSGlzdG9ncmFtIG9mIGxvZyhwaXJjZSArIDEpIikgKyBjb21tb25fdGhlbWUKYGBgCgpMZXQncyBub3cgbG9vayBhdCB0aGUgam9pbnQgcmVsYXRpb25zaGlwIGJldHdlZW4gKnByaWNlKiBhbmQgKml0ZW1fY29uZGl0aW9uX2lkKgoKYGBge3J9CmdncGxvdChtZXJjYXJpLCBhZXMoeCA9IGFzLmZhY3RvcihpdGVtX2NvbmRpdGlvbl9pZCksIHkgPSBsb2cocHJpY2UgKyAxKSkpICsgZ2VvbV9ib3hwbG90KGZpbGwgPSAic3RlZWxibHVlNCIpICsgZ2d0aXRsZSgiUmVsYXRpb25zaGlwIGJldHdlZW4gaXRlbSBjb25kaXRpb24gYW5kIGl0cyBwcmljZSIpICsgY29tbW9uX3RoZW1lICsgeGxhYigiSXRlbSBjb25kaXRpb24iKSArIHlsYWIoIlByaWNlIikKYGBgCgpJdCBzZWVtcyBsaWtlIHRoZXJlIGlzIG5vIGNsZWFyIHRyZW5kIGJldHdlZW4gaXRlbSBjb25kaXRpb24gYW5kIGl0cyBwcmljZS4gTW9yZW92ZXIsIGl0IGlzIG5vdCBjbGVhciB3aGV0aGVyIGNvbmRpdGlvbiAxIG1lYW5zIHRoZSBiZXN0IG9yIHRoZSB3b3JzdCBpdGVtIHF1YWxpdHksIGFuZCB0aGlzIGlzIGltcG9zc2libGUgdG8gZGV0ZXJtaW5lIGZyb20gdGhlIGJveHBsb3QgYWJvdmUuIE15IGJlc3QgZ3Vlc3MgaXMgdGhhdCBjb25kaXRpb24gMSBjb3JyZXNwb25kcyB0byB0aGUgaGlnaGVzdCBxdWFsaXR5IGR1ZSB0byB0aGUgbWF4aW11bSB2YWx1ZXMgb2YgbG9nKHByaWNlICsgMSkgYmVpbmcgdGhlIGhpZ2hlc3QuIAoKSXQgaXMgd29ydGggbm90aW5nIHRoYXQgY29uZGl0aW9uIDUgaGFzIHRoZSBoaWdoZXN0IG1lZGlhbiBwcmljZSwgYnV0IHRoaXMgaXMgYSBsZXNzIHNpZ25pZmljYW50IHJlc3VsdCBkdWUgdG8gdmVyeSBzbWFsbCBzYW1wbGUgc2l6ZSBmb3IgdGhhdCBjb25kaXRpb24gY2F0ZWdvcnkuCgojI3NoaXBwaW5nCgpMZXQncyBub3cgaGF2ZSBhIGxvb2sgYXQgdGhlICpzaGlwcGluZyogdmFyaWFibGUuCgpgYGB7cn0KdGFibGUobWVyY2FyaSRzaGlwcGluZykKYGBgCgpUaGUgMCBjYXRlZ29yeSBpcyBkb21pbmFudCBoZXJlLiBXZSBjYW4gbm93IGxvb2sgYXQgaG93ICpzaGlwcGluZyogaXMgcmVhbHRlZCB0byAqcHJpY2UqCgpgYGB7cn0KZ2dwbG90KG1lcmNhcmksIGFlcyh4ID0gYXMuZmFjdG9yKHNoaXBwaW5nKSwgeSA9IGxvZyhwcmljZSArIDEpKSkgKyBnZW9tX2JveHBsb3QoZmlsbCA9ICJkYXJrb3JhbmdlIikgKyBnZ3RpdGxlKCJTaGlwcGluZyB2cyBwcmljZSIpICsgY29tbW9uX3RoZW1lCgpnZ3Bsb3QobWVyY2FyaSwgYWVzKHggPSBsb2cocHJpY2UgKyAxKSwgZmlsbCA9IGZhY3RvcihzaGlwcGluZykpKSArIGdlb21fZGVuc2l0eShhbHBoYSA9IDAuNzUsIGFkanVzdCA9IDIuNSkgKyBjb21tb25fdGhlbWUgKyBnZ3RpdGxlKCJEZW5zaXR5IG9mIHByaWNlIGJ5IHNoaXBwaW5nIGNhdGVnb3J5IikKYGBgCgpJdCBzZWVtcyBsaWtlIHRoZSBtZWRpYW4gaXRlbSBwcmljZSBpcyBoaWdoZXIgd2hlbiAqc2hpcHBpbmcqID0gMC4KCiMjY2F0ZWdvcnlfbmFtZSwgYnJhbmRfbmFtZQoKTGV0J3Mgbm93IHRha2UgYSBjbG9zZXIgbG9vayBhdCAqY2F0ZWdvcnlfbmFtZSogYW5kICpicmFuZF9uYW1lKiwgYm90aCBvZiB3aGljaCBhcmUgdGV4dHVhbCB2YXJpYWJsZXMuIE5vdGUgdGhhdCBjYXRlZ29yeSBhY3R1YWxseSBjb250YWlucyA0IHN1Yi1jYXRlZ29yaWVzLCBzbyB0aGF0IHdlIGNhbiBzcGxpdCB0aGlzIGNvbHVtbiBpbnRvIDQgbmV3IG9uZXMuCgpgYGB7cn0KbmV3Y29scyA8LSBzdHJfc3BsaXRfZml4ZWQobWVyY2FyaSRjYXRlZ29yeV9uYW1lLCAiLyIsIDQpCm1lcmNhcmkgPC0gbWVyY2FyaSAlPiUgbXV0YXRlKGNhdDEgPSBuZXdjb2xzWywgMV0sIGNhdDIgPSBuZXdjb2xzWywgMl0sIGNhdDMgPSBuZXdjb2xzWywgM10sIGNhdDQgPSBuZXdjb2xzWywgNF0pCm1lcmNhcmkgJT4lIHN1bW1hcmlzZShjYXQxX3VuaXF1ZSA9IGxlbmd0aCh1bmlxdWUoY2F0MSkpLCBjYXQyX3VuaXF1ZSA9IGxlbmd0aCh1bmlxdWUoY2F0MikpLCBjYXQzX3VuaXF1ZSA9IGxlbmd0aCh1bmlxdWUoY2F0MykpLCBjYXQ0X3VuaXF1ZSA8LSBsZW5ndGgodW5pcXVlKGNhdDQpKSkKYGBgCgpJdCBzZWVtcyBsaWtlIHRoZSBtb3N0IHVuaXF1ZSBjYXRlZ29yaWVzIGFyZSBpbiB0aGUgM3JkIGNhdGVnb3J5IGxldmVsLiBMZXQncyBub3cgbG9vayBhdCB0aGUgaGllcmFyY2h5IG9mIDFzdCBhbmQgMm5kIGNhdGVnb3JpZXMuCgpgYGB7cn0Kb3B0aW9ucyhyZXByLnBsb3Qud2lkdGg9NywgcmVwci5wbG90LmhlaWdodD03KQptZXJjYXJpICU+JSBncm91cF9ieShjYXQxLCBjYXQyKSAlPiUgY291bnQoKSAlPiUgdW5ncm91cCgpICU+JSBnZ3Bsb3QoYWVzKGFyZWEgPSBuLCBmaWxsID0gY2F0MSwgbGFiZWwgPSBjYXQyLCBzdWJncm91cCA9IGNhdDEpKSArIGdlb21fdHJlZW1hcCgpICsgZ2d0aXRsZSgiSGllcmFyY2h5IG9mIDFzdCBhbmQgMm5kIG9yZGVyIGNhdGVnb3JpZXMiKSArIGdlb21fdHJlZW1hcF9zdWJncm91cF90ZXh0KG1pbi5zaXplID0gMCwgZ3JvdyA9IFQsIGFscGhhID0gMC41LCBjb2xvdXIgPSAiYmxhY2siLCBmb250ZmFjZSA9ICJpdGFsaWMiKSArIGdlb21fdHJlZW1hcF90ZXh0KGNvbG91ciA9ICJ3aGl0ZSIsIHBsYWNlID0gInRvcGxlZnQiLCByZWZsb3cgPSBUKSArIHRoZW1lKGxlZ2VuZC5wb3NpdGlvbiA9ICJudWxsIikKYGBgCgpXb21lbiBhbmQgYmVhdXR5IGFyZSB0aGUgdHdvIG1vc3QgY29tbW9uIG1hanJvIGNhdGVnb3JpZXMsIHNvIHdlIGNhbiBoYXZlIGEgY2xvc2VyIGxvb2sgYXQgMm5kIG9yZGVyIGNhdGVnb3JpZXMgZm9yIHRoZXNlIHR3byBvbmx5LiBTaW5jZSB0aGVyZSBhcmUgYSBsb3Qgb2YgMm5kIG9yZGVyIGNhdGVnb3JpZXMsIHdlIHdpbGwgb25seSBsb29rIGF0IHRoZSB0b3AgMTAgb25lcyAoPiA0MDAwMCBhc3NvY2lhdGVkIGl0ZW1zKS4KCmBgYHtyfQpvcHRpb25zKHJlcHIucGxvdC53aWR0aD03LCByZXByLnBsb3QuaGVpZ2h0PTcpCnN1bW0gPC0gbWVyY2FyaSAlPiUgZmlsdGVyKGNhdDEgPT0gIldvbWVuIiB8IGNhdDEgPT0gIkJlYXV0eSIpICU+JSBjb3VudChjYXQyKSAlPiUgZmlsdGVyKG4gPiA0MDAwMCkKZ2dwbG90KHN1bW0sIGFlcyh4ID0gcmVvcmRlcihjYXQyLCAtbiksIHkgPSBuKSkgKyBnZW9tX2JhcihzdGF0ID0gImlkZW50aXR5IikgKyBnZ3RpdGxlKCIybmQgb3JkZXIgY2F0ZWdvcmllcyBmb3IgJ1dvbWVuJyBhbmQgJ0JlYXV0eScgY2F0ZWdvcmllcyIpICsgdGhlbWUoYXhpcy50ZXh0LnggPSBlbGVtZW50X3RleHQoYW5nbGUgPSA0NSwgaGp1c3QgPSAxKSkgKyB0aGVtZShheGlzLnRleHQueCA9IGVsZW1lbnRfdGV4dChhbmdsZSA9IDQ1KSwgcGxvdC50aXRsZSA9IGVsZW1lbnRfdGV4dChzaXplID0gMTQsIGZhY2UgPSAiYm9sZCIpKSArIHhsYWIoIkNhdGVnb3J5IikgKyB5bGFiKCJDb3VudCIpCmBgYAoKCldlIGNhbiBhbHNvIGhhdmUgYSBsb29rIGF0IHRoZSAybmQgYW5kIDNyZCBvcmRlciBjYXRlZ29yaWVzIGluIGEgc2ltaWxhciB3YXkuCgpgYGB7cn0KbWVyY2FyaSAlPiUgZ3JvdXBfYnkoY2F0MiwgY2F0MykgJT4lIGNvdW50KCkgJT4lIHVuZ3JvdXAoKSAlPiUgZ2dwbG90KGFlcyhhcmVhID0gbiwgZmlsbCA9IGNhdDIsIGxhYmVsID0gY2F0Mywgc3ViZ3JvdXAgPSBjYXQyKSkgKyBnZW9tX3RyZWVtYXAoKSArIGdndGl0bGUoIkhpZXJhcmNoeSBvZiAybmQgYW5kIDNyZCBvcmRlciBjYXRlZ29yaWVzIikgKyBnZW9tX3RyZWVtYXBfc3ViZ3JvdXBfdGV4dChtaW4uc2l6ZSA9IDAsIGdyb3cgPSBULCBhbHBoYSA9IDAuNSwgY29sb3VyID0gImJsYWNrIiwgZm9udGZhY2UgPSAiaXRhbGljIikgKyBnZW9tX3RyZWVtYXBfdGV4dChjb2xvdXIgPSAid2hpdGUiLCBwbGFjZSA9ICJ0b3BsZWZ0IiwgcmVmbG93ID0gVCkgKyB0aGVtZShsZWdlbmQucG9zaXRpb24gPSAibnVsbCIpCmBgYAoKSXQncyBpbnRlcmVzdGluZyB0byBsb29rIGNsb3NlciBhdCB0aGUgaXRlbXMgd2hpY2ggZG9uJ3QgaGF2ZSBhIGJyYW5kIGFzc29jaWF0ZWQgd2l0aCB0aGVtLiBUaGlzIGNvbnN0aXR1dGVzIGEgbGFyZ2UgcHJvcG9ydGlvbiBvZiB0aGUgZGF0YXNldDoKCmBgYHtyfQptZWFuKG1lcmNhcmkkYnJhbmRfbmFtZSA9PSAiIikKYGBgCmBgYHtyfQptZXJjYXJpJGhhc19icmFuZCA8LSBtZXJjYXJpJGJyYW5kX25hbWUgIT0gIiIKbWVyY2FyaSAlPiUgZ2dwbG90KGFlcyh4ID0gcmVvcmRlcihjYXQxLCAtaGFzX2JyYW5kKSwgZmlsbCA9IGhhc19icmFuZCkpICsgZ2VvbV9iYXIocG9zaXRpb24gPSAiZmlsbCIpICsgeGxhYigiQ2F0ZWdvcnkiKSArIHlsYWIoIlByb3BvcnRpb24gb2YgaXRlbXMgd2l0aCBicmFuZCIpICsgZ2d0aXRsZSgiQnJlYWtkb3duIG9mIDFzdCBvcmRlciBjYXRlZ29yaWVzXG5ieSBwcm9wb3J0aW9uIG9mIGl0ZW1zIHdpdGggYnJhbmQgbmFtZSIpICsgdGhlbWUoYXhpcy50ZXh0LnggPSBlbGVtZW50X3RleHQoYW5nbGUgPSAzMCwgaGp1c3QgPSAxKSkKYGBgCiAKV2UgY2FuIHNlZSB0aGF0IHRoZXJlIGFyZSBodWdlIGRpZmZlcmVuY2VzIGluIHByb3BvcnRpb25zIG9mIGl0ZW1zIHdpdGggYSBicmFuZDsgd2hpbGUgb3ZlciA3NSUgb2YgaXRlbXMgaW4gdGhlICpNZW4qIGNhdGVnb3J5IGhhdmUgYSBicmFuZCBuYW1lLCBuZWFybHkgbm8gaXRlbXMgaGF2ZSBvbmUgaW4gdGhlICpIYW5kbWFkZSogY2F0ZWdvcnkuCgpMZXQncyBub3cgbG9vayBhdCB3aGF0IGJyYW5kcyBhcmUgdGhlIG1vc3QgcG9wdWxhci4KCmBgYHtyfQp0b3BfYnJhbmRzIDwtIG1lcmNhcmkgJT4lIGZpbHRlcihoYXNfYnJhbmQgPT0gVCkgJT4lIGNvdW50KGJyYW5kX25hbWUpICU+JSBhcnJhbmdlKGRlc2MobikpICU+JSBoZWFkKDE1KQoKbWVyY2FyaSAlPiUgZmlsdGVyKGJyYW5kX25hbWUgJWluJSB0b3BfYnJhbmRzJGJyYW5kX25hbWUpICU+JSBnZ3Bsb3QoYWVzKHggPSBmYWN0b3IoYnJhbmRfbmFtZSwgbGV2ZWxzID0gdG9wX2JyYW5kcyRicmFuZF9uYW1lKSwgZmlsbCA9IGNhdDEpKSArIGdlb21fYmFyKCkgKyB0aGVtZV9taW5pbWFsKCkgKyB0aGVtZShheGlzLnRleHQueCA9IGVsZW1lbnRfdGV4dChhbmdsZSA9IDMwLCBoanVzdCA9IDEpKSArIHhsYWIoIkJyYW5kIG5hbWUiKSArIGxhYnMoZmlsbCA9ICJDYXRlZ29yeSIpICsgZ2d0aXRsZSgiTW9zdCBwb3B1bGFyIGJyYW5kcyBieSBjYXRlZ29yeSIpCmBgYAoKVGhlIHRvcCBicmFuZHMgYXJlIGNsZWFybHkgZG9taW5hdGVkIGJ5IHRoZSAqV29tZW4qIGNhdGVnb3J5LiBXZSBjYW4gYWxzbyBsb29rIGF0IGhvdyBleHBlbnNpdmUgZWFjaCBicmFuZCBpcy4KCmBgYHtyLCBmaWcud2lkdGg9MTAsIGZpZy5oZWlnaHQ9MTB9Cm9wdGlvbnMocmVwci5wbG90LndpZHRoPTMwLCByZXByLnBsb3QuaGVpZ2h0PTMwKQpicmFuZF9tZWRpYW5fcHJpY2VzIDwtIG1lcmNhcmkgJT4lIGZpbHRlcihoYXNfYnJhbmQgPT0gVCAmIGJyYW5kX25hbWUgJWluJSB0b3BfYnJhbmRzJGJyYW5kX25hbWUpICU+JSBncm91cF9ieShicmFuZF9uYW1lKSAlPiUgc3VtbWFyaXNlKG1lZGlhbihwcmljZSkpCmNvbG5hbWVzKGJyYW5kX21lZGlhbl9wcmljZXMpWzJdIDwtICJtZWRpYW5fcHJpY2UiCmJyYW5kX21lZGlhbl9wcmljZXMgPC0gYnJhbmRfbWVkaWFuX3ByaWNlcyAlPiUgYXJyYW5nZShkZXNjKG1lZGlhbl9wcmljZSkpCgptZXJjYXJpICU+JSBmaWx0ZXIoaGFzX2JyYW5kID09IFQgJiBicmFuZF9uYW1lICVpbiUgYnJhbmRfbWVkaWFuX3ByaWNlcyRicmFuZF9uYW1lKSAlPiUgZ2dwbG90KGFlcyh4ID0gZmFjdG9yKGJyYW5kX25hbWUsIGxldmVscyA9IHJldihicmFuZF9tZWRpYW5fcHJpY2VzJGJyYW5kX25hbWUpKSwgeSA9IHByaWNlLCBmaWxsID0gYXMuZmFjdG9yKHNoaXBwaW5nKSkpICsgZ2VvbV9ib3hwbG90KCkgKyBjb29yZF9mbGlwKCkgKyB4bGFiKCJCcmFuZCBuYW1lIikgKyB5bGFiKCJQcmljZSIpICsgZ2d0aXRsZSgiQnJhbmQgbmFtZSB2cyBwcmljZSIpICsgbGFicyhmaWxsID0gIlNoaXBwaW5nIikgKyBjb21tb25fdGhlbWUKYGBgCgpXZSBjYW4gc2VlIHRoYXQgTWljaGFlbCBLb3JzIGlzIHRoZSBtb3N0IGV4cGVuc2l2ZSBicmFuZCwgd2hpbGUgQXBwbGUgc2VlbXMgdG8gaGF2ZSBhIGhpZ2hseSBsZWZ0LXNrZXdlZCBkaXN0cmlidXRpb24sIHdpdGggYSBsb3Qgb2YgaGlnaGx5LXByaWNlZCBpdGVtcy4gTW9yZW92ZXIsIGl0IHNlZW1zIGxpa2UgdGhlIGJ1eWVycyBwYXkgdGhlIGhpZ2hlc3QgcHJlbWl1bSBmb3Igc2hpcHBpbmcgZm9yIEFwcGxlIHByb2R1Y3RzIHRvby4KCkxldCdzIG5vdyBkbyBhIGxpdHRsZSBhbmFseXNpcyBvZiBpdGVtIGRlc2NyaXB0aW9ucy4KCkZpcnN0LCB3ZSBzaG91bGQgcGVyZm9ybSBzb21lIGJhc2ljIHByZXByb2Nlc3NpbmcgYnkgc2V0dGluZyB0aGUgZGVzY3JpcHRpb24gdG8gIk5BIiB3aGVyZSA9PSAibm8gZGVzY3JpcHRpb24geWV0Ii4gV2Ugd2lsbCBub3QgeWV0IHRyYW5zZm9ybSB0aGUgdGV4dCB0byBsb3dlcmNhc2UgYXMgdGhpcyBwcmV2ZW50cyB0aGUgY29ycHVzKCkgZnVuY3Rpb24gb2YgcGFja2FnZSBxdWFudGVkYSBmcm9tIGNvdW50aW5nIHRoZSBzZW50ZW5jZXMgcHJvcGVybHkuCgpgYGB7cn0KI21lcmNhcmkkaXRlbV9kZXNjcmlwdGlvbiA8LSB0b2xvd2VyKG1lcmNhcmkkaXRlbV9kZXNjcmlwdGlvbikKbWVyY2FyaVttZXJjYXJpJGl0ZW1fZGVzY3JpcHRpb24gPT0gIk5vIGRlc2NyaXB0aW9uIHlldCIsICJpdGVtX2Rlc2NyaXB0aW9uIl0gPSBOQQpgYGAKCkxldCdzIGNvdW50IHRoZSBudW1iZXIgb2YgY2hhcmFjdGVycyBhbmQgcGxvdCBpdCBhZ2FpbnN0IG1lYW4gb2YgbG9nKHByaWNlICsgMSkuCgpgYGB7cn0KbWVyY2FyaSRkZXNjX2xlbiA8LSBuY2hhcihtZXJjYXJpJGl0ZW1fZGVzY3JpcHRpb24pCm1lYW5fbG9nX3ByaWNlIDwtIG1lcmNhcmkgJT4lIGdyb3VwX2J5KGRlc2NfbGVuKSAlPiUgc3VtbWFyaXNlKG1lYW4obG9nKHByaWNlICsgMSkpKQpjb2xuYW1lcyhtZWFuX2xvZ19wcmljZSlbMl0gPC0gIm1lYW5fbG9nX3ByaWNlIgpnZ3Bsb3QobWVhbl9sb2dfcHJpY2UsIGFlcyh4ID0gZGVzY19sZW4sIHkgPSBtZWFuX2xvZ19wcmljZSkpICsgZ2VvbV9wb2ludCgpICsgc3RhdF9zbW9vdGgobWV0aG9kID0gImxvZXNzIikgKyB4bGFiKCJEZXNjcmlwdGlvbiBsZW5ndGgiKSArIHlsYWIoIk1lYW4gbG9nIHByaWNlIikgKyBnZ3RpdGxlKCJNZWFuIGxvZyBwcmljZSB2cyBpdGVtIGRlc2NyaXB0aW9uIGxlbmd0aCIpICsgY29tbW9uX3RoZW1lCmBgYAoKVGhlcmUgc2VlbXMgdG8gYmUgbm8gY2xlYXIgcmVsYXRpb25zaGlwIGJldHdlZW4gZGVzY3JpcHRpb24gbGVuZ3RoIGFuZCBpdGVtIHByaWNlLgoKTGV0J3Mgbm93IGNyZWF0ZSBhIGNvcnB1cyBhbmQgYSBkb2N1bWVudCB0ZXJtIG1hdHJpeCBhbmQgY291bnQgdGhlIG51bWJlciBvZiAxLCAyIGFuZCAzLWdyYW1zLgoKYGBge3IsIGZpZy53aWR0aD0xMH0KIyAxLWdyYW1zCmRlc2NfY29ycHVzIDwtIGNvcnB1cyhtZXJjYXJpJGl0ZW1fZGVzY3JpcHRpb24pCmR0bTEgPC0gZGZtKGRlc2NfY29ycHVzLCBuZ3JhbXMgPSAxLCByZW1vdmUgPSBjKCJybSIsIHN0b3B3b3JkcygiZW5nbGlzaCIpKSwgcmVtb3ZlX3B1bmN0ID0gVCwgcmVtb3ZlX251bWJlcnMgPSBULCBzdGVtID0gVCkKdG9wXzFncmFtcyA8LSBkYXRhLmZyYW1lKHRlcm0gPSBuYW1lcyh0b3BmZWF0dXJlcyhkdG0xLCBuID0gMjApKSwgY291bnQgPSB0b3BmZWF0dXJlcyhkdG0xLCBuID0gMjApKQpwMSA8LSBnZ3Bsb3QodG9wXzFncmFtcywgYWVzKHggPSByZW9yZGVyKHRlcm0sIGNvdW50KSwgeSA9IGNvdW50KSkgKyBnZW9tX2JhcihzdGF0ID0gImlkZW50aXR5IiwgZmlsbCA9ICJzdGVlbGJsdWU0IikgKyB4bGFiKCIxLWdyYW0iKSArIHlsYWIoIkNvdW50IikgKyBnZ3RpdGxlKCJGcmVxdWVuY3kgb2YgMS1ncmFtcyIpICsgY29vcmRfZmxpcCgpICsgY29tbW9uX3RoZW1lCgojIFRha2UgMjAlIG9mIGNvcnB1cyBmb3IgY29tcHV0aW5nIDItZ3JhbXMKZGVzY19jb3JwdXNfMjAgPC0gY29ycHVzX3NhbXBsZShkZXNjX2NvcnB1cywgc2l6ZSA9IGZsb29yKG5kb2MoZGVzY19jb3JwdXMpKjAuMikpCgojIDItZ3JhbXMKZHRtMiA8LSBkZm0oZGVzY19jb3JwdXNfMjAsIG5ncmFtcyA9IDIsIHJlbW92ZSA9IGMoInJtIiwgc3RvcHdvcmRzKCJlbmdsaXNoIikpLCByZW1vdmVfcHVuY3QgPSBULCByZW1vdmVfbnVtYmVycyA9IFQsIGNvbmNhdGVuYXRvciA9ICIgIikKdG9wXzJncmFtcyA8LSBkYXRhLmZyYW1lKHRlcm0gPSBuYW1lcyh0b3BmZWF0dXJlcyhkdG0yLCBuID0gMjApKSwgY291bnQgPSB0b3BmZWF0dXJlcyhkdG0yLCBuID0gMjApKQpwMiA8LSBnZ3Bsb3QodG9wXzJncmFtcywgYWVzKHggPSByZW9yZGVyKHRlcm0sIGNvdW50KSwgeSA9IGNvdW50KSkgKyBnZW9tX2JhcihzdGF0ID0gImlkZW50aXR5IiwgZmlsbCA9ICJkYXJrZ3JlZW4iKSArIHhsYWIoIjItZ3JhbSIpICsgeWxhYigiQ291bnQiKSArIGdndGl0bGUoIkZyZXF1ZW5jeSBvZiAyLWdyYW1zIikgKyBjb29yZF9mbGlwKCkgKyBjb21tb25fdGhlbWUKCgojIDMtZ3JhbXMKZHRtMyA8LSBkZm0oZGVzY19jb3JwdXNfMjAsIG5ncmFtcyA9IDMsIHJlbW92ZSA9IGMoInJtIiwgc3RvcHdvcmRzKCJlbmdsaXNoIikpLCByZW1vdmVfcHVuY3QgPSBULCByZW1vdmVfbnVtYmVycyA9IFQsIGNvbmNhdGVuYXRvciA9ICIgIikKdG9wXzNncmFtcyA8LSBkYXRhLmZyYW1lKHRlcm0gPSBuYW1lcyh0b3BmZWF0dXJlcyhkdG0zLCBuID0gMjApKSwgY291bnQgPSB0b3BmZWF0dXJlcyhkdG0zLCBuID0gMjApKQpwMyA8LSBnZ3Bsb3QodG9wXzNncmFtcywgYWVzKHggPSByZW9yZGVyKHRlcm0sIGNvdW50KSwgeSA9IGNvdW50KSkgKyBnZW9tX2JhcihzdGF0ID0gImlkZW50aXR5IiwgZmlsbCA9ICJkYXJrcmVkIikgKyB4bGFiKCIzLWdyYW0iKSArIHlsYWIoIkNvdW50IikgKyBnZ3RpdGxlKCJGcmVxdWVuY3kgb2YgMy1ncmFtcyIpICsgY29vcmRfZmxpcCgpICsgY29tbW9uX3RoZW1lCgpncmlkLmFycmFuZ2UocDEsIHAyLCBwMywgbnJvdyA9IDEpCmBgYAoKRm9yIDEtZ3JhbXMsIHRoZSBtb3N0IGNvbW1vbiBvbmVzIGFyZSAqbmV3KiBhbmQgKnNpemUqLiBUaGVyZSBpcyBhIHJlbGF0aXZlbHkgc2hhcnAgY291bnQgZHJvcCBmb3IgMi1ncmFtcywgd2hlcmUgKmJyYW5kIG5ldyogaXMgdGhlIG1vc3QgY29tbW9uIGJ5IGZhciwgZm9sbG93ZWQgYnkgcm91Z2hseSAyIHRpbWVzIGxlc3MgY29tbW9uICpmcmVlIHNoaXBwaW5nKi4gV2hlbiBpdCBjb21lcyB0byAzLWdyYW1zLCB0aGVyZSBpcyBubyBtYXJrZWQgc2hhcnAgZHJvcCBpbiBmcmVxdWVuY3ksIGFuZCB0aGUgbW9zdCBjb21tb24gdHJpZ3JhbXMgYXJlICpwcmljZSBpcyBmaXJtKiBhbmQgKm5ldyB3aXRoIHRhZ3MqLg==

Mercari Price Suggestion - Exploratory Analysis

Introduction

Data

Exploratory analysis

item_condition_id

shipping

category_name, brand_name