Evidence 1. R Markdown File

Progress Problem Setup 1

Calling libraries

#Calling libraries

library(units)

## udunits database from /Library/Frameworks/R.framework/Versions/4.3-arm64/Resources/library/units/share/udunits/udunits2.xml

library(visdat)
library(DataExplorer)
library(dplyr)

## 
## Attaching package: 'dplyr'

## The following objects are masked from 'package:stats':
## 
##     filter, lag

## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union

library(janitor)

## 
## Attaching package: 'janitor'

## The following objects are masked from 'package:stats':
## 
##     chisq.test, fisher.test

library(tidyverse)

## ── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
## ✔ forcats   1.0.0     ✔ readr     2.1.5
## ✔ ggplot2   3.5.0     ✔ stringr   1.5.1
## ✔ lubridate 1.9.3     ✔ tibble    3.2.1
## ✔ purrr     1.0.2     ✔ tidyr     1.3.1

## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag()    masks stats::lag()
## ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors

library(stringr)
library(tidyr)
library(readr)
library(ggplot2)

Read file

movies<- read.csv("/Users/anapaualvear/Desktop/r business analytics/movies_metadata.csv")

Cleaning Data

Treating NA’s

# Finding how many NA are in the data base
sum(is.na(movies))

## [1] 281

A total of 281 NAs have been found in the database, and to know how to treat them, we will first identify which columns they come from and how many there are per column.

Treating NA’s by column

# Search in each column how many NAs exist to see what type of elimination to apply
sapply(movies, function(x) sum(is.na(x)))

##                 adult belongs_to_collection                budget 
##                     0                     0                     0 
##                genres              homepage                    id 
##                     0                     0                     0 
##               imdb_id     original_language        original_title 
##                     0                     0                     0 
##              overview            popularity           poster_path 
##                     0                     0                     0 
##  production_companies  production_countries          release_date 
##                     0                     0                     0 
##               revenue               runtime      spoken_languages 
##                     6                   263                     0 
##                status               tagline                 title 
##                     0                     0                     0 
##                 video          vote_average            vote_count 
##                     0                     6                     6

6 NA have been found in the “Revenue” column, 263 in “runtime”, 6 in “Vote Avarage”, and 6 in “Vote Count”. Now we will remove them by column individually

Runtime

# Cleaning and summary of column "runtime"
movies2 <- movies

movies2$runtime[is.na(movies2$runtime)] <- mean(movies2$runtime, na.rm=TRUE)
summary(movies2$runtime)

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    0.00   85.00   95.00   94.13  107.00 1256.00

Revenue

# Cleaning and summary of column "revenue"
movies3 <- movies2

movies3$revenue[is.na(movies3$revenue)] <- mean(movies3$revenue, na.rm=TRUE)
summary(movies3$revenue)

##      Min.   1st Qu.    Median      Mean   3rd Qu.      Max. 
## 0.000e+00 0.000e+00 0.000e+00 1.121e+07 0.000e+00 2.788e+09

Vote Count

# Cleaning and summary of column "vote count"
movies4 <- movies3

movies4$vote_count[is.na(movies4$vote_count)] <- mean(movies4$vote_count, na.rm=TRUE)
summary(movies4$vote_count)

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##     0.0     3.0    10.0   109.9    34.0 14075.0

Vote Avarage

# Cleaning and summary of column "vote average"
movies_wo_na <- movies4

movies_wo_na$vote_average[is.na(movies_wo_na$vote_average)] <- mean(movies_wo_na$vote_average, na.rm=TRUE)
summary(movies_wo_na$vote_average)

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   0.000   5.000   6.000   5.618   6.800  10.000

# Verify the NA were eliminated
sum(is.na(movies_wo_na))

## [1] 0

Reasoning

The method of elimination used for the NAs was by taking the average, which was decided for two reasons.
+ Because in the analysis of the columns it was possible to obtain that the values that contained NA were numeric and integers runtime, vote average, vote count, revenue.
+ The missing values are important and it is desired to preserve the general structure of the data.

Treating Duplicates

# Check how many information are totally duplicated
sum(duplicated(movies_wo_na))

## [1] 17

In the database we have found 17 duplicate values that have to be remove.

Eliminating duplicates

# Eliminate information that is totally duplicated
movies_wo_dup <- movies_wo_na
movies_wo_dup <- distinct(movies_wo_dup)

# Check if duplicate information is eliminated
sum(duplicated(movies_wo_dup))

## [1] 0

Reasoning

In this example the duplicates were eliminated given that it would be the same movie otherwise. As for the partially duplicated data, it was found that “popularity” was the differing variable and, for now, the decision made was to keep those with the lower rating given the nature of movie reviews skewing to the lower side.

Separating Text by column

Genres

# Splitting each string into a character vector, returns a df

# Use a regular expression to match the genre names
genre_pattern <- "(?<=name': ')[^']*(?=')"

# Apply the extraction to the entire column and store the result in a new object
genre_data <- lapply(movies_wo_dup$genres, function(x) {
  genres <- str_extract_all(x, genre_pattern)[[1]]
  split_genres <- strsplit(genres, ", ")
  unlist(split_genres)
})

# Calculate the maximum number of genres a movie can have
max_genre <- max(sapply(genre_data, length))

# Convert the list to a data frame
genre_df <- do.call(rbind, lapply(genre_data, function(x) {
  tmp <- rep(NA, max_genre)
  tmp[seq_along(x)] <- x
  as.data.frame(t(tmp))
}))

# Rename the columns
names(genre_df) <- paste0("genre", seq_len(ncol(genre_df)))

# Join the new genre data frame with the original data frame
movies_wo_dup <- cbind(movies_wo_dup, genre_df)

# Delete the genres column
movies_w_genres <- subset(movies_wo_dup, select = -genres)

Production Companies

# Feature to clear production company names
clean_production_companies <- function(companies) {
  # Apply regular expression to extract company name
  cleaned_names <- str_extract(companies, "'name': '([^']+)'")
  # Delete the extra part
  cleaned_names <- gsub("'name': '", "", cleaned_names)
  cleaned_names <- gsub("'", "", cleaned_names)
  return(cleaned_names)
}

# Apply the function to the production_companies column and store the results in a new column
movies_w_genres$Clean_production_companies <- clean_production_companies(movies_w_genres$production_companies)

# Delete the production companies column
movies_w_prodcom <- subset(movies_w_genres, select = -production_companies)

Production Countries

# Function to clear the names of the countries of production
clean_production_countries <- function(countries) {
  # Apply regular expression to extract country name
  cleaned_names <- str_extract(countries, "'name': '([^']+)'")
  # Delete the extra part
  cleaned_names <- gsub("'name': '", "", cleaned_names)
  cleaned_names <- gsub("'", "", cleaned_names)
  return(cleaned_names)
}

# Apply the function to the production_countries column and store the results in a new column
movies_w_prodcom$Clean_production_countries <- clean_production_countries(movies_w_prodcom$production_countries)

# Delete the production companies column
movies_w_prodcoun <- subset(movies_w_prodcom, select = -production_countries)

# Function to clear the names of the countries of production
clean_production_countries <- function(countries) {
  # Apply regular expression to extract country name
  cleaned_names <- str_extract(countries, "'name': '([^']+)'")
  # Delete the extra part
  cleaned_names <- gsub("'name': '", "", cleaned_names)
  cleaned_names <- gsub("'", "", cleaned_names)
  return(cleaned_names)
}

# Apply the function to the production_countries column and store the results in a new column
movies_w_prodcom$Clean_production_countries <- clean_production_countries(movies_w_prodcom$production_countries)

# Delete the production companies column
movies_w_prodcoun <- subset(movies_w_prodcom, select = -production_countries)

Spoken Language

# Use a regular expression to match the language names
language_pattern <- "(?<=name': ')[^']*(?=')"

# Apply the extraction to the entire column and store the result in a new object
language_data <- lapply(movies_w_prodcoun$spoken_languages, function(x) {
  languages <- str_extract_all(x, language_pattern)[[1]]
  split_languages <- strsplit(languages, ", ")
  unlist(split_languages)
})

# Calculate the maximum number of languages a movie can have
max_language <- max(sapply(language_data, length))

# Convert the list to a data frame
language_df <- do.call(rbind, lapply(language_data, function(x) {
  tmp <- rep(NA, max_language)
  tmp[seq_along(x)] <- x
  as.data.frame(t(tmp))
}))

# Rename the columns
names(language_df) <- paste("spoken_lang", seq_len(ncol(language_df)), sep = "_")

# Join the new language data frame with the original data frame
movies_w_lang <- cbind(movies_w_prodcoun, language_df)

# Eliminate original column
movies_w_lang$spoken_languages <- NULL

Belongs to Collection

# Function to separate the 'belongs_to_collection' column
separate_belongs_to_collection <- function(movies_w_lang) {
  # Create a new DataFrame to perform separation
  collection_data <- movies_w_lang

  # Apply regular expression to extract collection name
  collection_names <- str_extract(collection_data$belongs_to_collection, "'name': '([^']+)'")

  # Delete the extra part
  collection_names <- gsub("'name': '", "", collection_names)
  collection_names <- gsub("'", "", collection_names)

  # Create a new column in the new DataFrame with the extracted collection names
  collection_data$Collection <- collection_names

  # Remove the original 'belongs_to_collection' column from the new DataFrame
  collection_data$belongs_to_collection <- NULL

  return(collection_data)
}

# Create a new DataFrame for separation
collection_data <- movies_w_lang

# Apply the function to the new DataFrame
collection_data <- separate_belongs_to_collection(collection_data)

Runtime

# Runtime histogram
histogram_runtime <- ggplot(collection_data, aes(x = runtime)) +
  geom_histogram(fill = "skyblue", color = "black") +
  labs(title = "Histogram of Runtime")

# Display histogram 
print(histogram_runtime)

## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.

Histogram of Runtime: Suggests that most movies have a shorter runtime, with an average of 94.1281 minutes; with only few movies having exceptionally long runtimes, like 1,256 minutes. Besides, the presence of a movie with runtime of 0 minutes should be investigated as it could be an error or missing data.

Revenue

# Revenue histogram
histogram_revenue <- ggplot(collection_data, aes(x = revenue)) +
  geom_histogram(fill = "lightgreen", color = "black") +
  labs(title = "Histogram of Revenue")

# Display histogram 
print(histogram_revenue)

## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.

Histogram of Revenue: It also indicates that most movies have relatively lower revenues compared to a few blockbuster movies with very high revenues. There is a significant gap between majority of revenue values and outliers.

Vote Count

# Vote Count histogram
histogram_vote_count <- ggplot(collection_data, aes(x = vote_count)) +
  geom_histogram(fill = "lightpink", color = "black") +
  labs(title = "Histogram of Vote Count")

# Display histogram 
print(histogram_vote_count)

## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.

Histogram of Vote Count: It shows the distribution of “Vote Count”. The majority of movies in the dataset received a relatively low number of votes, with a long tail indicating a few movies recieving significantly higher numbers of votes; so there may be a considerable gap between outliers.

vis_miss(slice_sample(collection_data))

This function function reveals that 58.3% of the data is missing. This suggests that there is an amount of missing information within the dataset, meaning the analysis and interpretation can be challenging, as it may lead to biased results or incomplete insights.

Vote Avarage

# Vote Average histogram
histogram_vote_average <- ggplot(collection_data, aes(x = vote_average)) +
  geom_histogram(fill = "lightyellow", color = "black") +
  labs(title = "Histogram of Vote Average")

# Display histogram 
print(histogram_vote_average)

## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.

Histogram Vote Average: It shows a relatively symmetrical distribution around the average vote of 5.6, with values ranging form 0 to 10. A spike in the distribution might occur around whole numbers due to the nature of voting systems.

Now that we identified certain outliers, we can consider various approaches to handle them like deleting them, treating them separately or transforming data.The best approach depends on the nature of the data and the context of our analysis.

Progress Problem Setup 2

Factor Levels

# Identify categorical variables and convert them to factors
cols_to_factor <- c("adult", paste0("genre", 1:8), "Clean_production_companies", 
                    "Clean_production_countries", paste0("spoken_lang_", 1:18))

# Convert columns to factors
collection_data[cols_to_factor] <- lapply(collection_data[cols_to_factor], factor)
head(cols_to_factor)

## [1] "adult"  "genre1" "genre2" "genre3" "genre4" "genre5"

Adressing factor levels becomes important when dealing with categorical variables that have specific order associated with their levels; for example: many statistical functions in R treat factors differently than character vectors, like in regression analysis that requieres accurate factor levels; besides, incorrect factor levels can lead to misleading visual representations of data.

Values that don’t belong in the factor

# Replace unusual entries in the adult column with "False"
collection_data$adult[grep("written by|bikini contest|casino connected", tolower(collection_data$adult))] <- "False"

# Recalculate the frequency of each category in the adult column and update the data frame
adult_freq <-as.data.frame(table(collection_data$adult))

# Filter the rows that have a frequency greater than 0
adult_freq_filtered <- adult_freq[adult_freq$Freq > 0, ]

# Show the updated categories and their frequencies
print(adult_freq)

##                                                                                                                             Var1
## 1                                                                                                             - Written by Ørnås
## 2  Avalanche Sharks tells the story of a bikini contest that turns into a horrifying affair when it is hit by a shark avalanche.
## 3                  Rune Balot goes to a casino connected to the October corporation to try to wrap up her case once and for all.
## 4                                                                                                                          False
## 5                                                                                                                           True
##    Freq
## 1     0
## 2     0
## 3     0
## 4 45440
## 5     9

# Merge collection_data with adult_freq_filtered based on the 'Var1' column
collection_data <- merge(collection_data, adult_freq_filtered, by.x = "adult", by.y = "Var1", all.x = TRUE)

# Remove the 'Freq' column (since it's not needed)
collection_data <- collection_data[, -ncol(collection_data)]

In the “adult” column, there were 3 rows that did not respect the TRUE and FALSE format, so it was decided to eliminate those 3 rows to maintain consistency.

The sames goes for the original language column, which instead of an abbreviation with characters, there are some rows with integers. While also, adding a threshold for those movies whose original language has a frequency less than 10, and change it to the abbreviation as “other”, to simplify and consolidate the data.

# Create a dataframe with the frequency table of original languages
org_lang_freq <- as.data.frame(table(collection_data$original_language))
#see the average
summary(org_lang_freq$Freq)

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##     1.0     2.0    10.0   488.7    78.0 32259.0

# Find rows with frequency less than a threshold (e.g., 50) and combine them into 'other'
threshold <- 10
other_freq <- sum(org_lang_freq$Freq[org_lang_freq$Freq < threshold])
org_lang_freq$Var1[org_lang_freq$Freq < threshold] <- "other"

## Warning in `[<-.factor`(`*tmp*`, org_lang_freq$Freq < threshold, value =
## structure(c(1L, : invalid factor level, NA generated

org_lang_freq$Freq[org_lang_freq$Freq < threshold] <- other_freq

# Remove duplicates caused by combining into 'other'
org_lang_freq <- org_lang_freq[!duplicated(org_lang_freq$Var1), ]

# Print the modified dataframe
head(org_lang_freq)

##    Var1 Freq
## 1         11
## 2  <NA>  113
## 5    ab   10
## 8    ar   39
## 10   bg   10
## 12   bn   29

Checking categories / Collapsing categories

library(forcats)
# Categories with less frequency
other_categories = c("Carousel Productions", "Aniplex", "Odyssey Media")

# Select it as other
collection_data <- collection_data %>%
  mutate(genre1 = as.factor(genre1),
         genre1 = fct_collapse(genre1, other = other_categories))

# Languages with less frequency
other_categories = c("Pulser Productions", "GoHands", "Vision View Entertainment")

# Select it as other
collection_data <- collection_data %>%
  mutate(genre2 = as.factor(genre2),
         genre2 = fct_collapse(genre2, other = other_categories))

# Languages with less frequency
other_categories = c("Telescene Film Group Productions", "Rogue State", "BROSTA TV")

# Select it as other
collection_data <- collection_data %>%
  mutate(genre3 = as.factor(genre3),
         genre3 = fct_collapse(genre3, other = other_categories))

The list of less frequent categories were defined in the three main movie genre columns (“genre1”, “genre2”, and “genre3”), in order to group them under the label “other,” thus achieving the simplification and consolidation of the information. This helps streamline the data and avoid cluttering analysis with overly specific categories.

Cleaning of text data

clean_revenue <- function(revenue) {
  # Format entries with commas and add money symbol
  formatted_revenue <- paste0("$", format(revenue, big.mark = ",", scientific = FALSE))
  return(formatted_revenue)
}

# Apply the function to the revenue column and store the results in a new column
collection_data$Clean_revenue <- clean_revenue(collection_data$revenue)

# Function to clean the budget
clean_budget <- function(budget) {
  # Format budget with commas and add money symbol
  formatted_budget <- paste0("$", format(budget, big.mark = ",", scientific = FALSE))
  return(formatted_budget)
}

# Apply the function to the budget column and store the results in a new column
collection_data$Clean_budget <- clean_budget(collection_data$budget)

# Remove the previous budget column
collection_data <- subset(collection_data, select = -c(budget))

# Convert the "popularity" column to numeric
collection_data$popularity <- as.numeric(collection_data$popularity)

## Warning: NAs introduced by coercion

# Round popularity to whole numbers
collection_data$round_popularity <- round(collection_data$popularity)

# Remove the previous popularity column
collection_data <- subset(collection_data, select = -c(popularity))

Functions were applied to clean and format revenue, budget and popularity columns, adding currency symbols and commas for better readability. Besides, converted the “popularity” column to numeric format and rounded it to whole numbers for easier interpretation.

Conclusion

As for the univariate distributions, budget, popularity, Vote count and revenue have low frequencies so the “success” movies make the minority which hold into question the possibility of a prediction model. Run time is 100 minutes for most and Vote Average follows a normal distribution with an avg of 6-7. None of the others follow a normal distribution.

As for what variables are most correlated to revenue, here is what we found. Strongest: budget and vote count; 2nd level: popularity, genre1_adventure and genre2_action; 3rd level: genre1_animation and genre2_fantasy.

There is a positive correlation between vote count, budget and popularity to revenue. No clear trend with runtime and vote average.

Progress Problem Setup 3

Unit Conversion

# Check if runtime column is already assigned units
if (!inherits(collection_data$runtime, "units")) {
  # Convert runtime column to numeric and then to minutes with units
  collection_data$runtime <- as.numeric(collection_data$runtime)
  collection_data$runtime <- set_units(collection_data$runtime, "minutes")
}

# Create a new column called 'num_genres' that counts the non-missing genre and spoken lang columns
collection_data$num_genres <- rowSums(!is.na(collection_data[, paste0("genre", 1:8)]))

collection_data <- collection_data %>%
  mutate(num_spoken_languages = rowSums(!is.na(select(., starts_with("spoken_lang")))))

Conclusion

These code allows us to ensure consistent units for runtime and calculating the count of genres and spoken languages so the dataset becomes more standardized. The unit conversion ensures that the ‘runtime’ column is uniformly represented in minutes. It checks if the ‘runtime’ column is already assigned units. If not, it converts the ‘runtime’ column to numeric and then assigns units to represent time in minutes. Last the genre and spoken language counts code, adds two new columns to the dataset. ‘num_genres’: This column counts the number of non-missing genre columns for each movie. ‘num_spoken_languages’: This column counts the number of non-missing spoken language columns for each movie.

Progress Problem Setup 4

Tables with 1 or 2 variables 4

# Create a backup df
copy_data <- collection_data

Revenue

# Define the revenue categories
revenue_bins <- c(0, 100000000, 500000000, 1000000000, 2000000000, 3000000000)
revenue_labels <- c('<100M', '100M-500M', '500M-1B', '1B-2B', '2B-3B')


# Create the 'revenue_group' column
copy_data$revenue_group <- cut(copy_data$revenue, breaks = revenue_bins, labels = revenue_labels, right = FALSE)

table(copy_data$revenue_group)

## 
##     <100M 100M-500M   500M-1B     1B-2B     2B-3B 
##     44076      1203       141        27         2

table(copy_data$revenue_group, copy_data$genre1)

##            
##             Action Adventure Animation other Comedy Crime Documentary Drama
##   <100M       4184      1309      1039     3   8581  1639        3412 11751
##   100M-500M    251       156        59     0    230    45           2   202
##   500M-1B       40        42        23     0      6     0           0     5
##   1B-2B         10         6         3     0      0     0           0     2
##   2B-3B          2         0         0     0      0     0           0     0
##            
##             Family Fantasy Foreign History Horror Music Mystery Romance
##   <100M        495     647     118     272   2567   479     544    1162
##   100M-500M     21      49       0       7     52     8       9      28
##   500M-1B        4       7       0       0      0     0       1       1
##   1B-2B          4       0       0       0      0     0       0       0
##   2B-3B          0       0       0       0      0     0       0       0
##            
##             Science Fiction Thriller TV Movie   War Western
##   <100M                 607     1616      390   374     446
##   100M-500M              29       46        0     4       4
##   500M-1B                 9        1        0     1       1
##   1B-2B                   2        0        0     0       0
##   2B-3B                   0        0        0     0       0

Lower grossing films tend to have movies from a wide array of genres, but for 500M-1B to 2B-3B are most concentrated in action.

Production Companies

# Calculate the frequencies of each production company
company_frequencies <- copy_data %>%
  count(Clean_production_companies) %>%
  arrange(desc(n))  # Sort in descending order of frequency

# Select the top 10 production companies
top_10_companies <- head(company_frequencies, 10)

top_10_companies

##                Clean_production_companies     n
## 1                                    <NA> 11934
## 2                      Paramount Pictures   998
## 3               Metro-Goldwyn-Mayer (MGM)   878
## 4  Twentieth Century Fox Film Corporation   780
## 5                            Warner Bros.   757
## 6                      Universal Pictures   754
## 7                       Columbia Pictures   429
## 8           Columbia Pictures Corporation   401
## 9                      RKO Radio Pictures   290
## 10                         United Artists   272

# Calculate the count of each company
company_counts <- table(copy_data$Clean_production_companies)

# Sort the companies by count in descending order and select the top five
top_companies <- names(sort(company_counts, decreasing = TRUE)[1:8])

# Filter the dataset to include only the top five most important companies
filtered_data <- copy_data[collection_data$Clean_production_companies %in% top_companies, ]

# Create the bar plot
ggplot(filtered_data, aes(x = Clean_production_companies)) +
  geom_bar() +
  theme(axis.text.x = element_text(angle = 90, vjust = 0.5, hjust=1))

This bar graph analyzes the “Clean_production_companies” variable and shows us the 8 most important results to be able to identify which companies are making the most movies. It allows us to understand which companies have the most extensive presence in terms of movie production.

GGPlot Structures

Density Plot

# Calculate the count of each country
country_counts <- table(collection_data$Clean_production_countries)

# Sort the countries by count in descending order and select the top five
top_countries <- names(sort(country_counts, decreasing = TRUE)[1:8])

# Filter the dataset to include only the top five most important countries
filtered_data <- collection_data[collection_data$Clean_production_countries %in% top_countries, ]

# Create the density plot
ggplot(filtered_data, aes(x = Clean_production_countries)) +
  geom_density() +
  theme(axis.text.x = element_text(angle = 90, vjust = 0.5, hjust=1))

This density plot analyzes the “Clean_production_countries” variable and shows us the 8 most important results to be able to identify which countries are where the most movies are being produced. We gain a deeper understanding of the geographical landscape of the film industry represented by the dataset.

Correlation Plot

# Load the corrplot package
library(corrplot)

## corrplot 0.92 loaded

# Extract numeric columns for correlation analysis
numeric_data <- copy_data[, sapply(copy_data, is.numeric)]

# Calculate the correlation matrix
correlation_matrix <- cor(numeric_data)

# Create the corrplot with the correlation matrix
corrplot(correlation_matrix, method = "color")

This shows the relationships between numerical variables within the dataset copy_data by visualizing their correlations. The correlation plot offers a comprehensive overview of the interdependencies among variables.

Bar Graph

popularity_summary <- aggregate(round_popularity ~ genre2, data = collection_data, FUN = mean)

ggplot(data = popularity_summary, aes(x = genre2, y = round_popularity)) +
  geom_bar(stat = "identity", fill = "skyblue") +
  labs(title = "Average Popularity by Genre", x = "Genre", y = "Average Popularity") +
  theme(axis.text.x = element_text(angle = 90, vjust = 0.5, hjust=1))

What can be interpreted in the bar graph is that there are 3 genres that have the highest popularity among the others, these are Adventure in first place, Animation in second place and Fantasy in third place, the others have similar and persistent amounts.

Tables and Graphs for Categorical and Numerical variables

Frequency table for a categorical variable

# Frequency table for a categorical variable
genre_freq <- table(collection_data$genre1)
head(genre_freq)

## 
##    Action Adventure Animation     other    Comedy     Crime 
##      4487      1513      1124         3      8817      1684

This table proved a summary of the counts of different genres in the dataset. We can now understand the distribution of movies across different genres. For example, there are in total 4,487 movies that are set in the action genre, 1,513 for adventure, 1,124 in animation, 8,817 in comedy, 1,684 in crime, and finally 3 in other genre.

Bar chart for genre frequency

ggplot(data = collection_data, aes(x = genre1)) +
  geom_bar() +
  labs(title = "Frequency of Genres") +
  theme_minimal() +
  theme(axis.text.x = element_text(angle = 90, vjust = 0.5, hjust = 1))

Visualizes the frequency of genres in the data set. It gives a clear visual representation of how many movies belong to each genre, helping to identify the most common and least common genres.

Analyzing Multiple Variables Together

Stacked bar chart for genre vs revenue

# Graficar
ggplot(data = collection_data, aes(x = genre1, y = revenue)) +
  geom_point(aes(color = genre1)) +
  labs(title = "Genre vs Revenue") +
  theme_minimal() +
  theme(legend.position = "bottom") +
  scale_x_discrete(drop = FALSE)

This is a visual representation of the relationship between movie genres and revenue. Each point on the plot corresponds to a specific movie genre, with the position along the y-axis indicating the revenue generated by movies belonging to that genre. We can gain insights into which genres tend to generate higher or lower revenues, for example, “Action” is the genre with the highest revenue.

Word Clouds

# Load libraries
library("tm")

## Loading required package: NLP

## 
## Attaching package: 'NLP'

## The following object is masked from 'package:ggplot2':
## 
##     annotate

library("SnowballC")
library("wordcloud")

## Loading required package: RColorBrewer

library("RColorBrewer")

Titles

# nos dice las peliculas que mas ganaron dinero
# Define los intervalos de ingresos
revenue_bins <- c(500000000, 1000000000, 2000000000, 3000000000)

# Filtra los datos de colección basados en los intervalos de ingresos
profit_data <- collection_data %>% 
  filter(revenue >= revenue_bins[1] & revenue < revenue_bins[2] |
           revenue >= revenue_bins[2] & revenue < revenue_bins[3] |
           revenue >= revenue_bins[3] & revenue < revenue_bins[4])

#We need to convert the text to a corpus

docs <- Corpus(VectorSource(profit_data$original_title))

#General text cleaning

# Convert the text to lower case
docs <- tm_map(docs, content_transformer(tolower))

## Warning in tm_map.SimpleCorpus(docs, content_transformer(tolower)):
## transformation drops documents

# Remove numbers
docs <- tm_map(docs, removeNumbers)

## Warning in tm_map.SimpleCorpus(docs, removeNumbers): transformation drops
## documents

# Remove english common stopwords
docs <- tm_map(docs, removeWords, stopwords("english"))

## Warning in tm_map.SimpleCorpus(docs, removeWords, stopwords("english")):
## transformation drops documents

# Remove your own stop word
# specify your stopwords as a character vector
docs <- tm_map(docs, removeWords, c("blabla1", "blabla2"))

## Warning in tm_map.SimpleCorpus(docs, removeWords, c("blabla1", "blabla2")):
## transformation drops documents

# Remove punctuations
docs <- tm_map(docs, removePunctuation)

## Warning in tm_map.SimpleCorpus(docs, removePunctuation): transformation drops
## documents

# Eliminate extra white spaces
docs <- tm_map(docs, stripWhitespace)

## Warning in tm_map.SimpleCorpus(docs, stripWhitespace): transformation drops
## documents

#Term-document matrix. Document matrix is a table containing the frequency of the words.

dtm <- TermDocumentMatrix(docs)
m <- as.matrix(dtm)
v <- sort(rowSums(m),decreasing=TRUE)
d <- data.frame(word = names(v),freq=v)
#head(d, 100)

set.seed(1234)
wordcloud(words = d$word, freq = d$freq, min.freq = 5,
          max.words=Inf, random.order=T, rot.per=0.5, 
          colors=brewer.pal(8, "Dark2"))

#https://cran.r-project.org/web/packages/wordcloud/wordcloud.pdf

The trend for the most profitable titles is to be a part of a known franchise like “Pirates of the Caribbean”, “Star Wars”, “Spiderman”, “Harry Potter”, “Transformers”, etc.

Progress Problem Setup 5

Descriptive Measures

copy_data <- collection_data

copy_data$Clean_budget_numeric <- as.numeric(gsub("\\$", "", copy_data$Clean_budget))

## Warning: NAs introduced by coercion

# Create measure for profit (ganancia o perdida)
copy_data <- copy_data %>%
        mutate(profit = revenue - Clean_budget_numeric)

revenue_grouped <- copy_data %>%
  group_by(revenue) %>%
  summarize(mean(profit, na.rm = TRUE),
            sd(profit, na.rm = TRUE),
            median(profit, na.rm = TRUE),
            quantile(profit, (.90), na.rm = TRUE),
            n())

revenue_grouped

## # A tibble: 6,864 × 6
##    revenue mean(profit, na.rm = …¹ sd(profit, na.rm = T…² median(profit, na.rm…³
##      <dbl>                   <dbl>                  <dbl>                  <dbl>
##  1       0              -650401.              4340513.                       0  
##  2       1                  -49.6                 171.                       1  
##  3       2                    1.67                  0.577                    2  
##  4       3              -148886.               263412.                       2  
##  5       4                  -91.5                 166.                     -13.5
##  6       5                    2.2                   3.42                     4  
##  7       6             -5201150.              1695421.                -5201150. 
##  8       7              -499995.               999999.                       3.5
##  9       8                  -19.2                  57.5                      8  
## 10       9                    9                    NA                        9  
## # ℹ 6,854 more rows
## # ℹ abbreviated names: ¹`mean(profit, na.rm = TRUE)`,
## #   ²`sd(profit, na.rm = TRUE)`, ³`median(profit, na.rm = TRUE)`
## # ℹ 2 more variables: `quantile(profit, (0.9), na.rm = TRUE)` <dbl>,
## #   `n()` <int>

summary(copy_data$profit)

##       Min.    1st Qu.     Median       Mean    3rd Qu.       Max.       NA's 
## -165710090          0          0    6987363          0 2550965087          3

Shape Measures

collection_data %>%
  ggplot(aes(x = genre1, fill = runtime)) +
  geom_density(alpha = 0.2) +   labs(title = "Density in genre1 and popularity", x = "genre1", y = "runtime - hours") +
  theme(axis.text.x = element_text(angle = 90, vjust = 0.5, hjust=1))

In this graph we can see that the density using the “genre1” and “runtime_hours” variables behaves in a right skewed form, showing us the movie genres that use the most hours and those that use the least.

Outliers

ggplot(collection_data, aes(y = runtime)) +
  geom_boxplot()

## Warning: The `scale_name` argument of `continuous_scale()` is deprecated as of ggplot2
## 3.5.0.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.

Here we can see that most of the values are concentrated from the value 600 onwards, therefore all values above 10 are considered outliers in the “runtime_hours” variable.

Plotting without outliers

collection_data$runtime_hours <- as.numeric(collection_data$runtime)

filtered_data <- collection_data %>%
  filter(runtime_hours <= 10)

#Create the density plot with the filtered data
filtered_data %>%
  ggplot(aes(x = genre1, fill = runtime)) +
  geom_density(alpha = 0.2) +
  labs(title = "Density in genre1 and runtime - hours", x = "genre1", y = "runtime") +
  theme(axis.text.x = element_text(angle = 90, vjust = 0.5, hjust = 1))

We can see the result is similiar even withouth the outliers, the variables still behaving in a right skewed form.

Correlation

Budget to Revenue

ggplot(copy_data, aes(y = revenue, x = Clean_budget)) +  geom_point() + geom_smooth(method = "lm", se = TRUE)

## `geom_smooth()` using formula = 'y ~ x'

There is a weak positive linear correlation between the budget and renenue of a movie.

ggplot(copy_data, 
       aes(x = cut(Clean_budget_numeric, breaks = 5), y = revenue)) + 
  geom_boxplot()

We can visualize the distribution of revenue across different intervals of the Clean_budget_numeric variable.

Number of title letters to profit

# Create measure for character number
copy_data <- copy_data %>%
        mutate(title_num = nchar(original_title))

ggplot(copy_data, aes(y = profit, x = title_num)) +  geom_point() + stat_smooth(method = "lm", formula = y ~ x + I(x^2), size = 1)

There is a non existent relationship between character number and the profit of a movie. So the hypothesis of it being a quadratic correlation is false.

ggplot(copy_data, 
       aes(x = title_num, y = cut(profit, breaks = 5))) + 
  geom_boxplot()

However, the breaks allows us to see that for lower profits there is a greater number of outliers with high character counts, while those in the highest profit bracket have low IQR range and that it is situated with a low character count.

Normal distribution probabilities

# Load packages
library("e1071") #for skewness measure

Profit

copy_data %>%
  ggplot(aes(x = profit)) +
  geom_density()

## Warning: Removed 3 rows containing non-finite outside the scale range
## (`stat_density()`).

#Logarithmic transformation 

log_data <- copy_data %>%
  mutate(log_prof = log(profit))

## Warning: There was 1 warning in `mutate()`.
## ℹ In argument: `log_prof = log(profit)`.
## Caused by warning in `log()`:
## ! NaNs produced

# Convert into a left-skewed distribution

log_data %>%
  ggplot(aes(x = log_prof)) +
  geom_density()

log_data %>%
  summarize(mean(profit, na.rm = TRUE),
            sd(profit, na.rm = TRUE),
            IQR(profit, na.rm = TRUE),
            sum(profit))

##   mean(profit, na.rm = TRUE) sd(profit, na.rm = TRUE) IQR(profit, na.rm = TRUE)
## 1                    6987363                 52149123                         0
##   sum(profit)
## 1          NA

Conclusion

The distribution of profits was visualized using a density plot and a logarithmic transformation was applied to achieve a left-skewed distribution. Summary statistics were computed for the transformed profit variable, including mean, standard deviation, interquartile range, and total profit sum. Probabilities were calculated to determine the likelihood of profits exceeding specific thresholds based on the log-transformed profit distribution.

The analysis also involved creating a new column called ‘profit’ and calculating summary statistics within revenue groups. A binary column was introduced to indicate whether a movie’s production country falls within North America, and summary statistics were computed based on movie geographical origin. The exploration of runtime characteristics involved density plots and boxplots. A scatter plot was used to examine the correlation between budget and revenue, and boxplot analysis was conducted to compare revenue distributions across budget categories. The relationship between the number of title letters and movie profit was explored using scatter plots and boxplots. A faceted scatter plot was used to analyze the relationships between profit, title letters, and revenue brackets.

The distribution of profits was visualized using a density plot and summary statistics were computed to gain a deeper understanding of its distribution characteristics. Finally, probabilities were calculated to determine the likelihood of profits exceeding specific thresholds.

Overall, these analyses provide insights into the distribution, central tendency, shape, outliers, correlations, and probabilities related to various variables in the movie dataset, helping to understand key patterns and relationships within the data.

Linear regression

# Convert variables into correct ones
collection_data$revenue <- as.numeric(as.character(collection_data$revenue)) 

collection_data$release_date <- as.Date(as.character(collection_data$release_date))

collection_data$runtime <- as.numeric(as.character(collection_data$runtime))

collection_data$vote_average <- as.numeric(as.character(collection_data$vote_average))

collection_data$vote_count <- as.numeric(as.character(collection_data$vote_count))

collection_data$round_popularity <- as.numeric(as.character(collection_data$round_popularity))

collection_data$num_spoken_languages <- as.numeric(as.character(collection_data$num_spoken_languages))

collection_data$num_genres <- as.numeric(as.character(collection_data$num_genres))

collection_data$Clean_budget <- as.numeric(as.character(collection_data$Clean_budget))

## Warning: NAs introduced by coercion

regression <- lm(revenue ~  release_date + runtime + vote_average + vote_count + round_popularity + num_spoken_languages, data = collection_data)
summary(regression)

## 
## Call:
## lm(formula = revenue ~ release_date + runtime + vote_average + 
##     vote_count + round_popularity + num_spoken_languages, data = collection_data)
## 
## Residuals:
##        Min         1Q     Median         3Q        Max 
## -925289146   -2715159     157493    1986071 1414896099 
## 
## Coefficients:
##                        Estimate Std. Error t value Pr(>|t|)    
## (Intercept)           945290.45  683783.35   1.382 0.166843    
## release_date             -32.14      20.20  -1.591 0.111659    
## runtime                17442.15    4722.49   3.693 0.000222 ***
## vote_average         -842682.47   94121.83  -8.953  < 2e-16 ***
## vote_count            100983.16     431.15 234.217  < 2e-16 ***
## round_popularity      823160.60   35612.85  23.114  < 2e-16 ***
## num_spoken_languages  119760.66  244145.49   0.491 0.623761    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 37340000 on 45352 degrees of freedom
##   (90 observations deleted due to missingness)
## Multiple R-squared:  0.6639, Adjusted R-squared:  0.6638 
## F-statistic: 1.493e+04 on 6 and 45352 DF,  p-value: < 2.2e-16

The results first show the variables that most affect the obtaining of revenue in films. These variables are: + Runtime + Vote Average + Vote Count +Round Popularity

In addition, we obtained an adjusted R squared with a value of 0.6638, indicating that approximately 66.38% of the variability in the dependent variable, in this case the revenue variable, can be explained by the independent variables included in the regression model, especially by the variables I mentioned before.

# Adjust the regression for greater precision
adjusted_regression <- lm(revenue ~ runtime + vote_average + vote_count + round_popularity, data = collection_data)
summary(adjusted_regression)

## 
## Call:
## lm(formula = revenue ~ runtime + vote_average + vote_count + 
##     round_popularity, data = collection_data)
## 
## Residuals:
##        Min         1Q     Median         3Q        Max 
## -925000790   -2604782     175898    2009199 1415655991 
## 
## Coefficients:
##                   Estimate Std. Error t value Pr(>|t|)    
## (Intercept)       799240.7   648741.5   1.232 0.217960    
## runtime            17197.5     4658.3   3.692 0.000223 ***
## vote_average     -832503.6    93038.9  -8.948  < 2e-16 ***
## vote_count        100961.4      430.4 234.593  < 2e-16 ***
## round_popularity  819845.1    35323.3  23.210  < 2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 37310000 on 45438 degrees of freedom
##   (6 observations deleted due to missingness)
## Multiple R-squared:  0.6639, Adjusted R-squared:  0.6638 
## F-statistic: 2.243e+04 on 4 and 45438 DF,  p-value: < 2.2e-16

# Predictive model
predictive_model <- data.frame(runtime=94, vote_average=6, vote_count=110, round_popularity=3)
predict(adjusted_regression, predictive_model)

##        1 
## 10986075

The model is using the input values of “runtime”, “vote average”, “votecount”, and “round popularity” to predict the revenue of a movie.The predicted revenue of approximately $10,986,075 is what the model estimates based on these input values.

This scenario was generated with an accuracy of 66.38% according to the adjusted R squared and a reliability of 95%.

Individual functions

Correlation between Runtime and Revenue

# Load necessary libraries
library(ggplot2)

colnames(collection_data)

##  [1] "adult"                      "homepage"                  
##  [3] "id"                         "imdb_id"                   
##  [5] "original_language"          "original_title"            
##  [7] "overview"                   "poster_path"               
##  [9] "release_date"               "revenue"                   
## [11] "runtime"                    "status"                    
## [13] "tagline"                    "title"                     
## [15] "video"                      "vote_average"              
## [17] "vote_count"                 "genre1"                    
## [19] "genre2"                     "genre3"                    
## [21] "genre4"                     "genre5"                    
## [23] "genre6"                     "genre7"                    
## [25] "genre8"                     "Clean_production_companies"
## [27] "Clean_production_countries" "spoken_lang_1"             
## [29] "spoken_lang_2"              "spoken_lang_3"             
## [31] "spoken_lang_4"              "spoken_lang_5"             
## [33] "spoken_lang_6"              "spoken_lang_7"             
## [35] "spoken_lang_8"              "spoken_lang_9"             
## [37] "spoken_lang_10"             "spoken_lang_11"            
## [39] "spoken_lang_12"             "spoken_lang_13"            
## [41] "spoken_lang_14"             "spoken_lang_15"            
## [43] "spoken_lang_16"             "spoken_lang_17"            
## [45] "spoken_lang_18"             "Collection"                
## [47] "Clean_revenue"              "Clean_budget"              
## [49] "round_popularity"           "num_genres"                
## [51] "num_spoken_languages"       "runtime_hours"

# Plotting the correlation between runtime and revenue
ggplot(collection_data, aes(x = runtime, y = revenue)) +
  geom_point() +
  geom_smooth(method = "lm", se = FALSE) +
  labs(title = "Correlation between Runtime and Revenue",
       x = "Runtime",
       y = "Revenue") +
  theme_minimal()

## `geom_smooth()` using formula = 'y ~ x'

Statistical analysis that explores the relationship between certain variables and movie success, in this case movies runtimes and the revenue done. This graph shows a positive correlation indicating that longer movies tend to generate higher revenue.

arules and apriori

# Load necessary libraries
library(arules)

## Loading required package: Matrix

## 
## Attaching package: 'Matrix'

## The following objects are masked from 'package:tidyr':
## 
##     expand, pack, unpack

## 
## Attaching package: 'arules'

## The following object is masked from 'package:tm':
## 
##     inspect

## The following object is masked from 'package:dplyr':
## 
##     recode

## The following objects are masked from 'package:base':
## 
##     abbreviate, write

# Data preparation
# Assume we have a movie dataset with attributes including release_date and success metrics (e.g., revenue)
# Convert release_date into categorical variables representing seasons or holidays
# For example, create binary variables for seasons: Spring, Summer, Fall, Winter

# Frequent itemset generation
frequent_itemsets <- apriori(copy_data, parameter = list(support = 0.01, minlen = 2))

## Warning: Column(s) 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 46,
## 47, 48, 49, 50, 51, 52, 53, 54 not logical or factor. Applying default
## discretization (see '? discretizeDF').

## Warning in discretize(x = c(373554033, 262797249, 0, 81452156, 76578911, : The calculated breaks are: 0, 0, 0, 2787965087
##   Only unique breaks are used reducing the number of intervals. Look at ? discretize for details.

## Warning in discretize(x = c(`1` = 1, `2` = 2, `3` = 1, `4` = 1, `5` = 1, : The calculated breaks are: 0, 1, 1, 18
##   Only unique breaks are used reducing the number of intervals. Look at ? discretize for details.

## Warning in discretize(x = c(3e+07, 6.5e+07, 0, 1.6e+07, 0, 6e+07, 5.8e+07, : The calculated breaks are: 0, 0, 0, 3.8e+08
##   Only unique breaks are used reducing the number of intervals. Look at ? discretize for details.

## Warning in discretize(x = c(343554033, 197797249, 0, 65452156, 76578911, : The calculated breaks are: -165710090, 0, 0, 2550965087
##   Only unique breaks are used reducing the number of intervals. Look at ? discretize for details.

## Apriori
## 
## Parameter specification:
##  confidence minval smax arem  aval originalSupport maxtime support minlen
##         0.8    0.1    1 none FALSE            TRUE       5    0.01      2
##  maxlen target  ext
##      10  rules TRUE
## 
## Algorithmic control:
##  filter tree heap memopt load sort verbose
##     0.1 TRUE TRUE  FALSE TRUE    2    TRUE
## 
## Absolute minimum support count: 454 
## 
## set item appearances ...[0 item(s)] done [0.00s].
## set transactions ...[332200 item(s), 45449 transaction(s)] done [0.49s].
## sorting and recoding items ... [115 item(s)] done [0.02s].
## creating transaction tree ... done [0.01s].
## checking subsets of size 1 2 3 4 5 6 7

## Warning in apriori(copy_data, parameter = list(support = 0.01, minlen = 2)):
## Mining stopped (time limit reached). Only patterns up to a length of 7
## returned!

##  done [10.33s].
## writing ... [8634150 rule(s)] done [0.40s].
## creating S4 object  ... done [2.12s].

# Rule generation
association_rules <- apriori(copy_data, parameter = list(support = 0.01, confidence = 0.5))

## Warning: Column(s) 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 46,
## 47, 48, 49, 50, 51, 52, 53, 54 not logical or factor. Applying default
## discretization (see '? discretizeDF').

## Warning in discretize(x = c(373554033, 262797249, 0, 81452156, 76578911, : The calculated breaks are: 0, 0, 0, 2787965087
##   Only unique breaks are used reducing the number of intervals. Look at ? discretize for details.

## Warning in discretize(x = c(`1` = 1, `2` = 2, `3` = 1, `4` = 1, `5` = 1, : The calculated breaks are: 0, 1, 1, 18
##   Only unique breaks are used reducing the number of intervals. Look at ? discretize for details.

## Warning in discretize(x = c(3e+07, 6.5e+07, 0, 1.6e+07, 0, 6e+07, 5.8e+07, : The calculated breaks are: 0, 0, 0, 3.8e+08
##   Only unique breaks are used reducing the number of intervals. Look at ? discretize for details.

## Warning in discretize(x = c(343554033, 197797249, 0, 65452156, 76578911, : The calculated breaks are: -165710090, 0, 0, 2550965087
##   Only unique breaks are used reducing the number of intervals. Look at ? discretize for details.

## Apriori
## 
## Parameter specification:
##  confidence minval smax arem  aval originalSupport maxtime support minlen
##         0.5    0.1    1 none FALSE            TRUE       5    0.01      1
##  maxlen target  ext
##      10  rules TRUE
## 
## Algorithmic control:
##  filter tree heap memopt load sort verbose
##     0.1 TRUE TRUE  FALSE TRUE    2    TRUE
## 
## Absolute minimum support count: 454 
## 
## set item appearances ...[0 item(s)] done [0.00s].
## set transactions ...[332200 item(s), 45449 transaction(s)] done [0.36s].
## sorting and recoding items ... [115 item(s)] done [0.02s].
## creating transaction tree ... done [0.01s].
## checking subsets of size 1 2 3 4 5 6 7

## Warning in apriori(copy_data, parameter = list(support = 0.01, confidence =
## 0.5)): Mining stopped (time limit reached). Only patterns up to a length of 7
## returned!

##  done [10.60s].
## writing ... [11336013 rule(s)] done [0.50s].
## creating S4 object  ... done [1.56s].

# Rule evaluation
summary(association_rules)

## set of 11336013 rules
## 
## rule length distribution (lhs + rhs):sizes
##       1       2       3       4       5       6       7 
##      14    1536   25154  193425  919086 3015594 7181204 
## 
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   1.000   6.000   7.000   6.511   7.000   7.000 
## 
## summary of quality measures:
##     support          confidence        coverage            lift        
##  Min.   :0.01001   Min.   :0.5000   Min.   :0.01001   Min.   : 0.5541  
##  1st Qu.:0.01322   1st Qu.:0.8111   1st Qu.:0.01503   1st Qu.: 1.0000  
##  Median :0.01938   Median :0.9688   Median :0.02251   Median : 1.0063  
##  Mean   :0.03391   Mean   :0.8890   Mean   :0.03931   Mean   : 1.3514  
##  3rd Qu.:0.03595   3rd Qu.:1.0000   3rd Qu.:0.04200   3rd Qu.: 1.1592  
##  Max.   :1.00000   Max.   :1.0000   Max.   :1.00000   Max.   :49.4778  
##      count      
##  Min.   :  455  
##  1st Qu.:  601  
##  Median :  881  
##  Mean   : 1541  
##  3rd Qu.: 1634  
##  Max.   :45449  
## 
## mining info:
##       data ntransactions support confidence
##  copy_data         45449    0.01        0.5
##                                                                           call
##  apriori(data = copy_data, parameter = list(support = 0.01, confidence = 0.5))

Association Rule Mining is a technique that helps us find the patterns in our movie dataset that might contribute to a movie’s success. This technique finds relationship among large sets of data items. For this problem setup, we use this technique to uncover patterns in release dates, such as seasons or holidays, that are associated with successful movie releases. Using the arules package in R to perform association rule mining on our movie dataset and the apriori function generate frequent itemsets from our dataset, then create a summary to see the outcomes.

Lubridate

# Load necessary libraries
library(lubridate)

# Assume 'collection_data' is your movie dataset with a 'release_date' column

# Convert 'release_date' to Date format
collection_data$release_date <- as.Date(collection_data$release_date)

# Extract month from release_date
collection_data$release_month <- month(collection_data$release_date)

# Create binary variables for seasons
collection_data$Winter <- ifelse(collection_data$release_month %in% c(12, 1, 2), 1, 0)
collection_data$Spring <- ifelse(collection_data$release_month %in% c(3, 4, 5), 1, 0)
collection_data$Summer <- ifelse(collection_data$release_month %in% c(6, 7, 8), 1, 0)
collection_data$Fall <- ifelse(collection_data$release_month %in% c(9, 10, 11), 1, 0)

# Check the first few rows to verify the new variables
head(collection_data[, c("release_date", "release_month", "Winter", "Spring", "Summer", "Fall")])

##   release_date release_month Winter Spring Summer Fall
## 1   1995-10-30            10      0      0      0    1
## 2   1995-12-15            12      1      0      0    0
## 3   1995-12-22            12      1      0      0    0
## 4   1995-12-22            12      1      0      0    0
## 5   1995-02-10             2      1      0      0    0
## 6   1995-12-15            12      1      0      0    0

Finally using the lubridate library we created variables to give each movie’s release date a season of the year, and see whether a movie was released in a particular season or not.

References

GeeksforGeeks. (2018, September 13). Association Rule. GeeksforGeeks; GeeksforGeeks. https://www.geeksforgeeks.org/association-rule/

LS0tCnRpdGxlOiAiRXZpZGVuY2UiCmF1dGhvcjogIkFuYSBQYXVsYSBBbHZlYXIgQ2FudMO6IgpkYXRlOiAiMjAyNC0wNS0wMiIKb3V0cHV0OiAKICBodG1sX2RvY3VtZW50OgogICAgdG9jOiBUUlVFCiAgICB0b2NfZmxvYXQ6IFRSVUUKICAgIGNvZGVfZG93bmxvYWQ6IFRSVUUKICAgIHRoZW1lOiBjb3NtbwotLS0KIyA8c3BhbiBzdHlsZSA9ICJjb2xvcjogIzZFOEIzRDsiPioqRXZpZGVuY2UgMS4gUiBNYXJrZG93biBGaWxlKio8L3NwYW4+CiMgPHNwYW4gc3R5bGUgPSAiY29sb3I6ICM2RThCM0Q7Ij4qUHJvZ3Jlc3MgUHJvYmxlbSBTZXR1cCAxKjwvc3Bhbj4KIyMgPHNwYW4gc3R5bGUgPSAiY29sb3I6ICM1MjhCOEI7Ij5DYWxsaW5nIGxpYnJhcmllczwvc3Bhbj4KYGBge3J9CiNDYWxsaW5nIGxpYnJhcmllcwoKbGlicmFyeSh1bml0cykKbGlicmFyeSh2aXNkYXQpCmxpYnJhcnkoRGF0YUV4cGxvcmVyKQpsaWJyYXJ5KGRwbHlyKQpsaWJyYXJ5KGphbml0b3IpCmxpYnJhcnkodGlkeXZlcnNlKQpsaWJyYXJ5KHN0cmluZ3IpCmxpYnJhcnkodGlkeXIpCmxpYnJhcnkocmVhZHIpCmxpYnJhcnkoZ2dwbG90MikKYGBgCgojIyA8c3BhbiBzdHlsZSA9ICJjb2xvcjogIzUyOEI4QjsiPlJlYWQgZmlsZTwvc3Bhbj4KYGBge3J9Cm1vdmllczwtIHJlYWQuY3N2KCIvVXNlcnMvYW5hcGF1YWx2ZWFyL0Rlc2t0b3AvciBidXNpbmVzcyBhbmFseXRpY3MvbW92aWVzX21ldGFkYXRhLmNzdiIpCmBgYAoKIyMgPHNwYW4gc3R5bGUgPSAiY29sb3I6ICM1MjhCOEI7Ij5DbGVhbmluZyBEYXRhPC9zcGFuPgojIyMgPHNwYW4gc3R5bGUgPSAiY29sb3I6ICM3OUNEQ0Q7Ij5UcmVhdGluZyBOQSdzPC9zcGFuPgpgYGB7cn0KIyBGaW5kaW5nIGhvdyBtYW55IE5BIGFyZSBpbiB0aGUgZGF0YSBiYXNlCnN1bShpcy5uYShtb3ZpZXMpKQpgYGAKCkEgdG90YWwgb2YgMjgxIE5BcyBoYXZlIGJlZW4gZm91bmQgaW4gdGhlIGRhdGFiYXNlLCBhbmQgdG8ga25vdyBob3cgdG8gdHJlYXQgdGhlbSwgd2Ugd2lsbCBmaXJzdCBpZGVudGlmeSB3aGljaCBjb2x1bW5zIHRoZXkgY29tZSBmcm9tIGFuZCBob3cgbWFueSB0aGVyZSBhcmUgcGVyIGNvbHVtbi4KCiMjIyMgPHNwYW4gc3R5bGUgPSAiY29sb3I6ICMwMDhCOEI7Ij5UcmVhdGluZyBOQSdzIGJ5IGNvbHVtbjwvc3Bhbj4KYGBge3J9CiMgU2VhcmNoIGluIGVhY2ggY29sdW1uIGhvdyBtYW55IE5BcyBleGlzdCB0byBzZWUgd2hhdCB0eXBlIG9mIGVsaW1pbmF0aW9uIHRvIGFwcGx5CnNhcHBseShtb3ZpZXMsIGZ1bmN0aW9uKHgpIHN1bShpcy5uYSh4KSkpCmBgYAoKNiBOQSBoYXZlIGJlZW4gZm91bmQgaW4gdGhlICJSZXZlbnVlIiBjb2x1bW4sIDI2MyBpbiAicnVudGltZSIsIDYgaW4gIlZvdGUgQXZhcmFnZSIsIGFuZCA2IGluICJWb3RlIENvdW50Ii4gTm93IHdlIHdpbGwgcmVtb3ZlIHRoZW0gYnkgY29sdW1uIGluZGl2aWR1YWxseQoKIyMjIyMgPHNwYW4gc3R5bGUgPSAiY29sb3I6ICMwMENEQ0Q7Ij4qKlJ1bnRpbWUqKjwvc3Bhbj4KYGBge3J9CiMgQ2xlYW5pbmcgYW5kIHN1bW1hcnkgb2YgY29sdW1uICJydW50aW1lIgptb3ZpZXMyIDwtIG1vdmllcwoKbW92aWVzMiRydW50aW1lW2lzLm5hKG1vdmllczIkcnVudGltZSldIDwtIG1lYW4obW92aWVzMiRydW50aW1lLCBuYS5ybT1UUlVFKQpzdW1tYXJ5KG1vdmllczIkcnVudGltZSkKYGBgCgojIyMjIyA8c3BhbiBzdHlsZSA9ICJjb2xvcjogIzAwQ0RDRDsiPioqUmV2ZW51ZSoqPC9zcGFuPgpgYGB7cn0KIyBDbGVhbmluZyBhbmQgc3VtbWFyeSBvZiBjb2x1bW4gInJldmVudWUiCm1vdmllczMgPC0gbW92aWVzMgoKbW92aWVzMyRyZXZlbnVlW2lzLm5hKG1vdmllczMkcmV2ZW51ZSldIDwtIG1lYW4obW92aWVzMyRyZXZlbnVlLCBuYS5ybT1UUlVFKQpzdW1tYXJ5KG1vdmllczMkcmV2ZW51ZSkKYGBgCgojIyMjIyA8c3BhbiBzdHlsZSA9ICJjb2xvcjogIzAwQ0RDRDsiPioqVm90ZSBDb3VudCoqPC9zcGFuPgpgYGB7cn0KIyBDbGVhbmluZyBhbmQgc3VtbWFyeSBvZiBjb2x1bW4gInZvdGUgY291bnQiCm1vdmllczQgPC0gbW92aWVzMwoKbW92aWVzNCR2b3RlX2NvdW50W2lzLm5hKG1vdmllczQkdm90ZV9jb3VudCldIDwtIG1lYW4obW92aWVzNCR2b3RlX2NvdW50LCBuYS5ybT1UUlVFKQpzdW1tYXJ5KG1vdmllczQkdm90ZV9jb3VudCkKYGBgCgojIyMjIyA8c3BhbiBzdHlsZSA9ICJjb2xvcjogIzAwQ0RDRDsiPioqVm90ZSBBdmFyYWdlKio8L3NwYW4+CmBgYHtyfQojIENsZWFuaW5nIGFuZCBzdW1tYXJ5IG9mIGNvbHVtbiAidm90ZSBhdmVyYWdlIgptb3ZpZXNfd29fbmEgPC0gbW92aWVzNAoKbW92aWVzX3dvX25hJHZvdGVfYXZlcmFnZVtpcy5uYShtb3ZpZXNfd29fbmEkdm90ZV9hdmVyYWdlKV0gPC0gbWVhbihtb3ZpZXNfd29fbmEkdm90ZV9hdmVyYWdlLCBuYS5ybT1UUlVFKQpzdW1tYXJ5KG1vdmllc193b19uYSR2b3RlX2F2ZXJhZ2UpCmBgYAoKYGBge3J9CiMgVmVyaWZ5IHRoZSBOQSB3ZXJlIGVsaW1pbmF0ZWQKc3VtKGlzLm5hKG1vdmllc193b19uYSkpCmBgYAoKIyMjIyMgPHNwYW4gc3R5bGUgPSAiY29sb3I6ICMwMENEQ0Q7Ij4qKlJlYXNvbmluZyoqPC9zcGFuPgpUaGUgbWV0aG9kIG9mIGVsaW1pbmF0aW9uIHVzZWQgZm9yIHRoZSBOQXMgd2FzIGJ5ICoqdGFraW5nIHRoZSBhdmVyYWdlKiosIHdoaWNoIHdhcyBkZWNpZGVkIGZvciB0d28gcmVhc29ucy4gIAorIEJlY2F1c2UgaW4gdGhlIGFuYWx5c2lzIG9mIHRoZSBjb2x1bW5zIGl0IHdhcyBwb3NzaWJsZSB0byBvYnRhaW4gdGhhdCB0aGUgdmFsdWVzIHRoYXQgY29udGFpbmVkIE5BIHdlcmUgbnVtZXJpYyBhbmQgaW50ZWdlcnMgcnVudGltZSwgdm90ZSBhdmVyYWdlLCB2b3RlIGNvdW50LCByZXZlbnVlLiAgCisgVGhlIG1pc3NpbmcgdmFsdWVzIGFyZSBpbXBvcnRhbnQgYW5kIGl0IGlzIGRlc2lyZWQgdG8gcHJlc2VydmUgdGhlIGdlbmVyYWwgc3RydWN0dXJlIG9mIHRoZSBkYXRhLiAKCiMjIyA8c3BhbiBzdHlsZSA9ICJjb2xvcjogIzc5Q0RDRDsiPlRyZWF0aW5nIER1cGxpY2F0ZXM8L3NwYW4+CmBgYHtyfQojIENoZWNrIGhvdyBtYW55IGluZm9ybWF0aW9uIGFyZSB0b3RhbGx5IGR1cGxpY2F0ZWQKc3VtKGR1cGxpY2F0ZWQobW92aWVzX3dvX25hKSkKYGBgCkluIHRoZSBkYXRhYmFzZSB3ZSBoYXZlIGZvdW5kIDE3IGR1cGxpY2F0ZSB2YWx1ZXMgdGhhdCBoYXZlIHRvIGJlIHJlbW92ZS4gCgojIyMjIDxzcGFuIHN0eWxlID0gImNvbG9yOiAjMDA4QjhCOyI+RWxpbWluYXRpbmcgZHVwbGljYXRlczwvc3Bhbj4KYGBge3J9CiMgRWxpbWluYXRlIGluZm9ybWF0aW9uIHRoYXQgaXMgdG90YWxseSBkdXBsaWNhdGVkCm1vdmllc193b19kdXAgPC0gbW92aWVzX3dvX25hCm1vdmllc193b19kdXAgPC0gZGlzdGluY3QobW92aWVzX3dvX2R1cCkKYGBgCgpgYGB7cn0KIyBDaGVjayBpZiBkdXBsaWNhdGUgaW5mb3JtYXRpb24gaXMgZWxpbWluYXRlZApzdW0oZHVwbGljYXRlZChtb3ZpZXNfd29fZHVwKSkKYGBgCgojIyMjIDxzcGFuIHN0eWxlID0gImNvbG9yOiAjMDA4QjhCOyI+UmVhc29uaW5nPC9zcGFuPgoKSW4gdGhpcyBleGFtcGxlIHRoZSBkdXBsaWNhdGVzIHdlcmUgZWxpbWluYXRlZCBnaXZlbiB0aGF0IGl0IHdvdWxkIGJlIHRoZSBzYW1lIG1vdmllIG90aGVyd2lzZS4gQXMgZm9yIHRoZSBwYXJ0aWFsbHkgZHVwbGljYXRlZCBkYXRhLCBpdCB3YXMgZm91bmQgdGhhdCAicG9wdWxhcml0eSIgd2FzIHRoZSBkaWZmZXJpbmcgdmFyaWFibGUgYW5kLCBmb3Igbm93LCB0aGUgZGVjaXNpb24gbWFkZSB3YXMgdG8ga2VlcCB0aG9zZSB3aXRoIHRoZSBsb3dlciByYXRpbmcgZ2l2ZW4gdGhlIG5hdHVyZSBvZiBtb3ZpZSByZXZpZXdzIHNrZXdpbmcgdG8gdGhlIGxvd2VyIHNpZGUuCgojIyMgPHNwYW4gc3R5bGUgPSAiY29sb3I6ICM3OUNEQ0Q7Ij5TZXBhcmF0aW5nIFRleHQgYnkgY29sdW1uPC9zcGFuPgojIyMjIDxzcGFuIHN0eWxlID0gImNvbG9yOiAjMDA4QjhCOyI+R2VucmVzPC9zcGFuPgoKYGBge3J9CiMgU3BsaXR0aW5nIGVhY2ggc3RyaW5nIGludG8gYSBjaGFyYWN0ZXIgdmVjdG9yLCByZXR1cm5zIGEgZGYKCiMgVXNlIGEgcmVndWxhciBleHByZXNzaW9uIHRvIG1hdGNoIHRoZSBnZW5yZSBuYW1lcwpnZW5yZV9wYXR0ZXJuIDwtICIoPzw9bmFtZSc6ICcpW14nXSooPz0nKSIKCiMgQXBwbHkgdGhlIGV4dHJhY3Rpb24gdG8gdGhlIGVudGlyZSBjb2x1bW4gYW5kIHN0b3JlIHRoZSByZXN1bHQgaW4gYSBuZXcgb2JqZWN0CmdlbnJlX2RhdGEgPC0gbGFwcGx5KG1vdmllc193b19kdXAkZ2VucmVzLCBmdW5jdGlvbih4KSB7CiAgZ2VucmVzIDwtIHN0cl9leHRyYWN0X2FsbCh4LCBnZW5yZV9wYXR0ZXJuKVtbMV1dCiAgc3BsaXRfZ2VucmVzIDwtIHN0cnNwbGl0KGdlbnJlcywgIiwgIikKICB1bmxpc3Qoc3BsaXRfZ2VucmVzKQp9KQpgYGAKCmBgYHtyfQojIENhbGN1bGF0ZSB0aGUgbWF4aW11bSBudW1iZXIgb2YgZ2VucmVzIGEgbW92aWUgY2FuIGhhdmUKbWF4X2dlbnJlIDwtIG1heChzYXBwbHkoZ2VucmVfZGF0YSwgbGVuZ3RoKSkKCiMgQ29udmVydCB0aGUgbGlzdCB0byBhIGRhdGEgZnJhbWUKZ2VucmVfZGYgPC0gZG8uY2FsbChyYmluZCwgbGFwcGx5KGdlbnJlX2RhdGEsIGZ1bmN0aW9uKHgpIHsKICB0bXAgPC0gcmVwKE5BLCBtYXhfZ2VucmUpCiAgdG1wW3NlcV9hbG9uZyh4KV0gPC0geAogIGFzLmRhdGEuZnJhbWUodCh0bXApKQp9KSkKCiMgUmVuYW1lIHRoZSBjb2x1bW5zCm5hbWVzKGdlbnJlX2RmKSA8LSBwYXN0ZTAoImdlbnJlIiwgc2VxX2xlbihuY29sKGdlbnJlX2RmKSkpCmBgYAoKYGBge3J9CiMgSm9pbiB0aGUgbmV3IGdlbnJlIGRhdGEgZnJhbWUgd2l0aCB0aGUgb3JpZ2luYWwgZGF0YSBmcmFtZQptb3ZpZXNfd29fZHVwIDwtIGNiaW5kKG1vdmllc193b19kdXAsIGdlbnJlX2RmKQoKIyBEZWxldGUgdGhlIGdlbnJlcyBjb2x1bW4KbW92aWVzX3dfZ2VucmVzIDwtIHN1YnNldChtb3ZpZXNfd29fZHVwLCBzZWxlY3QgPSAtZ2VucmVzKQpgYGAKCiMjIyMgPHNwYW4gc3R5bGUgPSAiY29sb3I6ICMwMDhCOEI7Ij5Qcm9kdWN0aW9uIENvbXBhbmllczwvc3Bhbj4KYGBge3J9CiMgRmVhdHVyZSB0byBjbGVhciBwcm9kdWN0aW9uIGNvbXBhbnkgbmFtZXMKY2xlYW5fcHJvZHVjdGlvbl9jb21wYW5pZXMgPC0gZnVuY3Rpb24oY29tcGFuaWVzKSB7CiAgIyBBcHBseSByZWd1bGFyIGV4cHJlc3Npb24gdG8gZXh0cmFjdCBjb21wYW55IG5hbWUKICBjbGVhbmVkX25hbWVzIDwtIHN0cl9leHRyYWN0KGNvbXBhbmllcywgIiduYW1lJzogJyhbXiddKyknIikKICAjIERlbGV0ZSB0aGUgZXh0cmEgcGFydAogIGNsZWFuZWRfbmFtZXMgPC0gZ3N1YigiJ25hbWUnOiAnIiwgIiIsIGNsZWFuZWRfbmFtZXMpCiAgY2xlYW5lZF9uYW1lcyA8LSBnc3ViKCInIiwgIiIsIGNsZWFuZWRfbmFtZXMpCiAgcmV0dXJuKGNsZWFuZWRfbmFtZXMpCn0KCiMgQXBwbHkgdGhlIGZ1bmN0aW9uIHRvIHRoZSBwcm9kdWN0aW9uX2NvbXBhbmllcyBjb2x1bW4gYW5kIHN0b3JlIHRoZSByZXN1bHRzIGluIGEgbmV3IGNvbHVtbgptb3ZpZXNfd19nZW5yZXMkQ2xlYW5fcHJvZHVjdGlvbl9jb21wYW5pZXMgPC0gY2xlYW5fcHJvZHVjdGlvbl9jb21wYW5pZXMobW92aWVzX3dfZ2VucmVzJHByb2R1Y3Rpb25fY29tcGFuaWVzKQoKIyBEZWxldGUgdGhlIHByb2R1Y3Rpb24gY29tcGFuaWVzIGNvbHVtbgptb3ZpZXNfd19wcm9kY29tIDwtIHN1YnNldChtb3ZpZXNfd19nZW5yZXMsIHNlbGVjdCA9IC1wcm9kdWN0aW9uX2NvbXBhbmllcykKYGBgCgojIyMjIDxzcGFuIHN0eWxlID0gImNvbG9yOiAjMDA4QjhCOyI+UHJvZHVjdGlvbiBDb3VudHJpZXM8L3NwYW4+CmBgYHtyfQojIEZ1bmN0aW9uIHRvIGNsZWFyIHRoZSBuYW1lcyBvZiB0aGUgY291bnRyaWVzIG9mIHByb2R1Y3Rpb24KY2xlYW5fcHJvZHVjdGlvbl9jb3VudHJpZXMgPC0gZnVuY3Rpb24oY291bnRyaWVzKSB7CiAgIyBBcHBseSByZWd1bGFyIGV4cHJlc3Npb24gdG8gZXh0cmFjdCBjb3VudHJ5IG5hbWUKICBjbGVhbmVkX25hbWVzIDwtIHN0cl9leHRyYWN0KGNvdW50cmllcywgIiduYW1lJzogJyhbXiddKyknIikKICAjIERlbGV0ZSB0aGUgZXh0cmEgcGFydAogIGNsZWFuZWRfbmFtZXMgPC0gZ3N1YigiJ25hbWUnOiAnIiwgIiIsIGNsZWFuZWRfbmFtZXMpCiAgY2xlYW5lZF9uYW1lcyA8LSBnc3ViKCInIiwgIiIsIGNsZWFuZWRfbmFtZXMpCiAgcmV0dXJuKGNsZWFuZWRfbmFtZXMpCn0KCiMgQXBwbHkgdGhlIGZ1bmN0aW9uIHRvIHRoZSBwcm9kdWN0aW9uX2NvdW50cmllcyBjb2x1bW4gYW5kIHN0b3JlIHRoZSByZXN1bHRzIGluIGEgbmV3IGNvbHVtbgptb3ZpZXNfd19wcm9kY29tJENsZWFuX3Byb2R1Y3Rpb25fY291bnRyaWVzIDwtIGNsZWFuX3Byb2R1Y3Rpb25fY291bnRyaWVzKG1vdmllc193X3Byb2Rjb20kcHJvZHVjdGlvbl9jb3VudHJpZXMpCgojIERlbGV0ZSB0aGUgcHJvZHVjdGlvbiBjb21wYW5pZXMgY29sdW1uCm1vdmllc193X3Byb2Rjb3VuIDwtIHN1YnNldChtb3ZpZXNfd19wcm9kY29tLCBzZWxlY3QgPSAtcHJvZHVjdGlvbl9jb3VudHJpZXMpCmBgYAoKYGBge3J9CiMgRnVuY3Rpb24gdG8gY2xlYXIgdGhlIG5hbWVzIG9mIHRoZSBjb3VudHJpZXMgb2YgcHJvZHVjdGlvbgpjbGVhbl9wcm9kdWN0aW9uX2NvdW50cmllcyA8LSBmdW5jdGlvbihjb3VudHJpZXMpIHsKICAjIEFwcGx5IHJlZ3VsYXIgZXhwcmVzc2lvbiB0byBleHRyYWN0IGNvdW50cnkgbmFtZQogIGNsZWFuZWRfbmFtZXMgPC0gc3RyX2V4dHJhY3QoY291bnRyaWVzLCAiJ25hbWUnOiAnKFteJ10rKSciKQogICMgRGVsZXRlIHRoZSBleHRyYSBwYXJ0CiAgY2xlYW5lZF9uYW1lcyA8LSBnc3ViKCInbmFtZSc6ICciLCAiIiwgY2xlYW5lZF9uYW1lcykKICBjbGVhbmVkX25hbWVzIDwtIGdzdWIoIiciLCAiIiwgY2xlYW5lZF9uYW1lcykKICByZXR1cm4oY2xlYW5lZF9uYW1lcykKfQoKIyBBcHBseSB0aGUgZnVuY3Rpb24gdG8gdGhlIHByb2R1Y3Rpb25fY291bnRyaWVzIGNvbHVtbiBhbmQgc3RvcmUgdGhlIHJlc3VsdHMgaW4gYSBuZXcgY29sdW1uCm1vdmllc193X3Byb2Rjb20kQ2xlYW5fcHJvZHVjdGlvbl9jb3VudHJpZXMgPC0gY2xlYW5fcHJvZHVjdGlvbl9jb3VudHJpZXMobW92aWVzX3dfcHJvZGNvbSRwcm9kdWN0aW9uX2NvdW50cmllcykKCiMgRGVsZXRlIHRoZSBwcm9kdWN0aW9uIGNvbXBhbmllcyBjb2x1bW4KbW92aWVzX3dfcHJvZGNvdW4gPC0gc3Vic2V0KG1vdmllc193X3Byb2Rjb20sIHNlbGVjdCA9IC1wcm9kdWN0aW9uX2NvdW50cmllcykKYGBgCgoKIyMjIyA8c3BhbiBzdHlsZSA9ICJjb2xvcjogIzAwOEI4QjsiPlNwb2tlbiBMYW5ndWFnZTwvc3Bhbj4KYGBge3J9CiMgVXNlIGEgcmVndWxhciBleHByZXNzaW9uIHRvIG1hdGNoIHRoZSBsYW5ndWFnZSBuYW1lcwpsYW5ndWFnZV9wYXR0ZXJuIDwtICIoPzw9bmFtZSc6ICcpW14nXSooPz0nKSIKCiMgQXBwbHkgdGhlIGV4dHJhY3Rpb24gdG8gdGhlIGVudGlyZSBjb2x1bW4gYW5kIHN0b3JlIHRoZSByZXN1bHQgaW4gYSBuZXcgb2JqZWN0Cmxhbmd1YWdlX2RhdGEgPC0gbGFwcGx5KG1vdmllc193X3Byb2Rjb3VuJHNwb2tlbl9sYW5ndWFnZXMsIGZ1bmN0aW9uKHgpIHsKICBsYW5ndWFnZXMgPC0gc3RyX2V4dHJhY3RfYWxsKHgsIGxhbmd1YWdlX3BhdHRlcm4pW1sxXV0KICBzcGxpdF9sYW5ndWFnZXMgPC0gc3Ryc3BsaXQobGFuZ3VhZ2VzLCAiLCAiKQogIHVubGlzdChzcGxpdF9sYW5ndWFnZXMpCn0pCmBgYAoKYGBge3J9CiMgQ2FsY3VsYXRlIHRoZSBtYXhpbXVtIG51bWJlciBvZiBsYW5ndWFnZXMgYSBtb3ZpZSBjYW4gaGF2ZQptYXhfbGFuZ3VhZ2UgPC0gbWF4KHNhcHBseShsYW5ndWFnZV9kYXRhLCBsZW5ndGgpKQoKIyBDb252ZXJ0IHRoZSBsaXN0IHRvIGEgZGF0YSBmcmFtZQpsYW5ndWFnZV9kZiA8LSBkby5jYWxsKHJiaW5kLCBsYXBwbHkobGFuZ3VhZ2VfZGF0YSwgZnVuY3Rpb24oeCkgewogIHRtcCA8LSByZXAoTkEsIG1heF9sYW5ndWFnZSkKICB0bXBbc2VxX2Fsb25nKHgpXSA8LSB4CiAgYXMuZGF0YS5mcmFtZSh0KHRtcCkpCn0pKQoKIyBSZW5hbWUgdGhlIGNvbHVtbnMKbmFtZXMobGFuZ3VhZ2VfZGYpIDwtIHBhc3RlKCJzcG9rZW5fbGFuZyIsIHNlcV9sZW4obmNvbChsYW5ndWFnZV9kZikpLCBzZXAgPSAiXyIpCmBgYAoKYGBge3J9CiMgSm9pbiB0aGUgbmV3IGxhbmd1YWdlIGRhdGEgZnJhbWUgd2l0aCB0aGUgb3JpZ2luYWwgZGF0YSBmcmFtZQptb3ZpZXNfd19sYW5nIDwtIGNiaW5kKG1vdmllc193X3Byb2Rjb3VuLCBsYW5ndWFnZV9kZikKCiMgRWxpbWluYXRlIG9yaWdpbmFsIGNvbHVtbgptb3ZpZXNfd19sYW5nJHNwb2tlbl9sYW5ndWFnZXMgPC0gTlVMTApgYGAKCiMjIyMgPHNwYW4gc3R5bGUgPSAiY29sb3I6ICMwMDhCOEI7Ij5CZWxvbmdzIHRvIENvbGxlY3Rpb248L3NwYW4+CmBgYHtyfQojIEZ1bmN0aW9uIHRvIHNlcGFyYXRlIHRoZSAnYmVsb25nc190b19jb2xsZWN0aW9uJyBjb2x1bW4Kc2VwYXJhdGVfYmVsb25nc190b19jb2xsZWN0aW9uIDwtIGZ1bmN0aW9uKG1vdmllc193X2xhbmcpIHsKICAjIENyZWF0ZSBhIG5ldyBEYXRhRnJhbWUgdG8gcGVyZm9ybSBzZXBhcmF0aW9uCiAgY29sbGVjdGlvbl9kYXRhIDwtIG1vdmllc193X2xhbmcKCiAgIyBBcHBseSByZWd1bGFyIGV4cHJlc3Npb24gdG8gZXh0cmFjdCBjb2xsZWN0aW9uIG5hbWUKICBjb2xsZWN0aW9uX25hbWVzIDwtIHN0cl9leHRyYWN0KGNvbGxlY3Rpb25fZGF0YSRiZWxvbmdzX3RvX2NvbGxlY3Rpb24sICInbmFtZSc6ICcoW14nXSspJyIpCgogICMgRGVsZXRlIHRoZSBleHRyYSBwYXJ0CiAgY29sbGVjdGlvbl9uYW1lcyA8LSBnc3ViKCInbmFtZSc6ICciLCAiIiwgY29sbGVjdGlvbl9uYW1lcykKICBjb2xsZWN0aW9uX25hbWVzIDwtIGdzdWIoIiciLCAiIiwgY29sbGVjdGlvbl9uYW1lcykKCiAgIyBDcmVhdGUgYSBuZXcgY29sdW1uIGluIHRoZSBuZXcgRGF0YUZyYW1lIHdpdGggdGhlIGV4dHJhY3RlZCBjb2xsZWN0aW9uIG5hbWVzCiAgY29sbGVjdGlvbl9kYXRhJENvbGxlY3Rpb24gPC0gY29sbGVjdGlvbl9uYW1lcwoKICAjIFJlbW92ZSB0aGUgb3JpZ2luYWwgJ2JlbG9uZ3NfdG9fY29sbGVjdGlvbicgY29sdW1uIGZyb20gdGhlIG5ldyBEYXRhRnJhbWUKICBjb2xsZWN0aW9uX2RhdGEkYmVsb25nc190b19jb2xsZWN0aW9uIDwtIE5VTEwKCiAgcmV0dXJuKGNvbGxlY3Rpb25fZGF0YSkKfQoKIyBDcmVhdGUgYSBuZXcgRGF0YUZyYW1lIGZvciBzZXBhcmF0aW9uCmNvbGxlY3Rpb25fZGF0YSA8LSBtb3ZpZXNfd19sYW5nCgojIEFwcGx5IHRoZSBmdW5jdGlvbiB0byB0aGUgbmV3IERhdGFGcmFtZQpjb2xsZWN0aW9uX2RhdGEgPC0gc2VwYXJhdGVfYmVsb25nc190b19jb2xsZWN0aW9uKGNvbGxlY3Rpb25fZGF0YSkKYGBgCgojIyMgPHNwYW4gc3R5bGUgPSAiY29sb3I6ICMwMDhCOEI7Ij5SdW50aW1lPC9zcGFuPgpgYGB7ciB3YXJuaW5nPUZBTFNFfQojIFJ1bnRpbWUgaGlzdG9ncmFtCmhpc3RvZ3JhbV9ydW50aW1lIDwtIGdncGxvdChjb2xsZWN0aW9uX2RhdGEsIGFlcyh4ID0gcnVudGltZSkpICsKICBnZW9tX2hpc3RvZ3JhbShmaWxsID0gInNreWJsdWUiLCBjb2xvciA9ICJibGFjayIpICsKICBsYWJzKHRpdGxlID0gIkhpc3RvZ3JhbSBvZiBSdW50aW1lIikKCiMgRGlzcGxheSBoaXN0b2dyYW0gCnByaW50KGhpc3RvZ3JhbV9ydW50aW1lKQpgYGAKCkhpc3RvZ3JhbSBvZiBSdW50aW1lOiBTdWdnZXN0cyB0aGF0IG1vc3QgbW92aWVzIGhhdmUgYSBzaG9ydGVyIHJ1bnRpbWUsIHdpdGggYW4gYXZlcmFnZSBvZiA5NC4xMjgxIG1pbnV0ZXM7IHdpdGggb25seSBmZXcgbW92aWVzIGhhdmluZyBleGNlcHRpb25hbGx5IGxvbmcgcnVudGltZXMsIGxpa2UgMSwyNTYgbWludXRlcy4gQmVzaWRlcywgdGhlIHByZXNlbmNlIG9mIGEgbW92aWUgd2l0aCBydW50aW1lIG9mIDAgbWludXRlcyBzaG91bGQgYmUgaW52ZXN0aWdhdGVkIGFzIGl0IGNvdWxkIGJlIGFuIGVycm9yIG9yIG1pc3NpbmcgZGF0YS4KCiMjIyA8c3BhbiBzdHlsZSA9ICJjb2xvcjogIzAwOEI4QjsiPlJldmVudWU8L3NwYW4+CmBgYHtyIHdhcm5pbmc9RkFMU0V9CiMgUmV2ZW51ZSBoaXN0b2dyYW0KaGlzdG9ncmFtX3JldmVudWUgPC0gZ2dwbG90KGNvbGxlY3Rpb25fZGF0YSwgYWVzKHggPSByZXZlbnVlKSkgKwogIGdlb21faGlzdG9ncmFtKGZpbGwgPSAibGlnaHRncmVlbiIsIGNvbG9yID0gImJsYWNrIikgKwogIGxhYnModGl0bGUgPSAiSGlzdG9ncmFtIG9mIFJldmVudWUiKQoKIyBEaXNwbGF5IGhpc3RvZ3JhbSAKcHJpbnQoaGlzdG9ncmFtX3JldmVudWUpCmBgYApIaXN0b2dyYW0gb2YgUmV2ZW51ZTogSXQgYWxzbyBpbmRpY2F0ZXMgdGhhdCBtb3N0IG1vdmllcyBoYXZlIHJlbGF0aXZlbHkgbG93ZXIgcmV2ZW51ZXMgY29tcGFyZWQgdG8gYSBmZXcgYmxvY2tidXN0ZXIgbW92aWVzIHdpdGggdmVyeSBoaWdoIHJldmVudWVzLiBUaGVyZSBpcyBhIHNpZ25pZmljYW50IGdhcCBiZXR3ZWVuIG1ham9yaXR5IG9mIHJldmVudWUgdmFsdWVzIGFuZCBvdXRsaWVycy4gCgojIyMgPHNwYW4gc3R5bGUgPSAiY29sb3I6ICMwMDhCOEI7Ij5Wb3RlIENvdW50PC9zcGFuPgpgYGB7ciB3YXJuaW5nPUZBTFNFfQojIFZvdGUgQ291bnQgaGlzdG9ncmFtCmhpc3RvZ3JhbV92b3RlX2NvdW50IDwtIGdncGxvdChjb2xsZWN0aW9uX2RhdGEsIGFlcyh4ID0gdm90ZV9jb3VudCkpICsKICBnZW9tX2hpc3RvZ3JhbShmaWxsID0gImxpZ2h0cGluayIsIGNvbG9yID0gImJsYWNrIikgKwogIGxhYnModGl0bGUgPSAiSGlzdG9ncmFtIG9mIFZvdGUgQ291bnQiKQoKIyBEaXNwbGF5IGhpc3RvZ3JhbSAKcHJpbnQoaGlzdG9ncmFtX3ZvdGVfY291bnQpCmBgYAoKSGlzdG9ncmFtIG9mIFZvdGUgQ291bnQ6IEl0IHNob3dzIHRoZSBkaXN0cmlidXRpb24gb2YgIlZvdGUgQ291bnQiLiBUaGUgbWFqb3JpdHkgb2YgbW92aWVzIGluIHRoZSBkYXRhc2V0IHJlY2VpdmVkIGEgcmVsYXRpdmVseSBsb3cgbnVtYmVyIG9mIHZvdGVzLCB3aXRoIGEgbG9uZyB0YWlsIGluZGljYXRpbmcgYSBmZXcgbW92aWVzIHJlY2lldmluZyBzaWduaWZpY2FudGx5IGhpZ2hlciBudW1iZXJzIG9mIHZvdGVzOyBzbyB0aGVyZSBtYXkgYmUgYSBjb25zaWRlcmFibGUgZ2FwIGJldHdlZW4gb3V0bGllcnMuIAoKYGBge3J9CnZpc19taXNzKHNsaWNlX3NhbXBsZShjb2xsZWN0aW9uX2RhdGEpKQpgYGAKVGhpcyBmdW5jdGlvbiBmdW5jdGlvbiByZXZlYWxzIHRoYXQgNTguMyUgb2YgdGhlIGRhdGEgaXMgbWlzc2luZy4gVGhpcyBzdWdnZXN0cyB0aGF0IHRoZXJlIGlzIGFuIGFtb3VudCBvZiBtaXNzaW5nIGluZm9ybWF0aW9uIHdpdGhpbiB0aGUgZGF0YXNldCwgbWVhbmluZyB0aGUgYW5hbHlzaXMgYW5kIGludGVycHJldGF0aW9uIGNhbiBiZSBjaGFsbGVuZ2luZywgYXMgaXQgbWF5IGxlYWQgdG8gYmlhc2VkIHJlc3VsdHMgb3IgaW5jb21wbGV0ZSBpbnNpZ2h0cy4KCiMjIyA8c3BhbiBzdHlsZSA9ICJjb2xvcjogIzAwOEI4QjsiPlZvdGUgQXZhcmFnZTwvc3Bhbj4KYGBge3Igd2FybmluZz1GQUxTRX0KIyBWb3RlIEF2ZXJhZ2UgaGlzdG9ncmFtCmhpc3RvZ3JhbV92b3RlX2F2ZXJhZ2UgPC0gZ2dwbG90KGNvbGxlY3Rpb25fZGF0YSwgYWVzKHggPSB2b3RlX2F2ZXJhZ2UpKSArCiAgZ2VvbV9oaXN0b2dyYW0oZmlsbCA9ICJsaWdodHllbGxvdyIsIGNvbG9yID0gImJsYWNrIikgKwogIGxhYnModGl0bGUgPSAiSGlzdG9ncmFtIG9mIFZvdGUgQXZlcmFnZSIpCgojIERpc3BsYXkgaGlzdG9ncmFtIApwcmludChoaXN0b2dyYW1fdm90ZV9hdmVyYWdlKQpgYGAKCkhpc3RvZ3JhbSBWb3RlIEF2ZXJhZ2U6IEl0IHNob3dzIGEgcmVsYXRpdmVseSBzeW1tZXRyaWNhbCBkaXN0cmlidXRpb24gYXJvdW5kIHRoZSBhdmVyYWdlIHZvdGUgb2YgNS42LCB3aXRoIHZhbHVlcyByYW5naW5nIGZvcm0gMCB0byAxMC4gQSBzcGlrZSBpbiB0aGUgZGlzdHJpYnV0aW9uIG1pZ2h0IG9jY3VyIGFyb3VuZCB3aG9sZSBudW1iZXJzIGR1ZSB0byB0aGUgbmF0dXJlIG9mIHZvdGluZyBzeXN0ZW1zLiAKCk5vdyB0aGF0IHdlIGlkZW50aWZpZWQgY2VydGFpbiBvdXRsaWVycywgd2UgY2FuIGNvbnNpZGVyIHZhcmlvdXMgYXBwcm9hY2hlcyB0byBoYW5kbGUgdGhlbSBsaWtlIGRlbGV0aW5nIHRoZW0sIHRyZWF0aW5nIHRoZW0gc2VwYXJhdGVseSBvciB0cmFuc2Zvcm1pbmcgZGF0YS5UaGUgYmVzdCBhcHByb2FjaCBkZXBlbmRzIG9uIHRoZSBuYXR1cmUgb2YgdGhlIGRhdGEgYW5kIHRoZSBjb250ZXh0IG9mIG91ciBhbmFseXNpcy4gCgojIDxzcGFuIHN0eWxlID0gImNvbG9yOiAjNkU4QjNEOyI+KlByb2dyZXNzIFByb2JsZW0gU2V0dXAgMio8L3NwYW4+CiMjIDxzcGFuIHN0eWxlID0gImNvbG9yOiAjNTI4QjhCOyI+RmFjdG9yIExldmVsczwvc3Bhbj4KYGBge3J9CiMgSWRlbnRpZnkgY2F0ZWdvcmljYWwgdmFyaWFibGVzIGFuZCBjb252ZXJ0IHRoZW0gdG8gZmFjdG9ycwpjb2xzX3RvX2ZhY3RvciA8LSBjKCJhZHVsdCIsIHBhc3RlMCgiZ2VucmUiLCAxOjgpLCAiQ2xlYW5fcHJvZHVjdGlvbl9jb21wYW5pZXMiLCAKICAgICAgICAgICAgICAgICAgICAiQ2xlYW5fcHJvZHVjdGlvbl9jb3VudHJpZXMiLCBwYXN0ZTAoInNwb2tlbl9sYW5nXyIsIDE6MTgpKQoKIyBDb252ZXJ0IGNvbHVtbnMgdG8gZmFjdG9ycwpjb2xsZWN0aW9uX2RhdGFbY29sc190b19mYWN0b3JdIDwtIGxhcHBseShjb2xsZWN0aW9uX2RhdGFbY29sc190b19mYWN0b3JdLCBmYWN0b3IpCmhlYWQoY29sc190b19mYWN0b3IpCmBgYAoKQWRyZXNzaW5nIGZhY3RvciBsZXZlbHMgYmVjb21lcyBpbXBvcnRhbnQgd2hlbiBkZWFsaW5nIHdpdGggY2F0ZWdvcmljYWwgdmFyaWFibGVzIHRoYXQgaGF2ZSBzcGVjaWZpYyBvcmRlciBhc3NvY2lhdGVkIHdpdGggdGhlaXIgbGV2ZWxzOyBmb3IgZXhhbXBsZTogbWFueSBzdGF0aXN0aWNhbCBmdW5jdGlvbnMgaW4gUiB0cmVhdCBmYWN0b3JzIGRpZmZlcmVudGx5IHRoYW4gY2hhcmFjdGVyIHZlY3RvcnMsIGxpa2UgaW4gcmVncmVzc2lvbiBhbmFseXNpcyB0aGF0IHJlcXVpZXJlcyBhY2N1cmF0ZSBmYWN0b3IgbGV2ZWxzOyBiZXNpZGVzLCBpbmNvcnJlY3QgZmFjdG9yIGxldmVscyBjYW4gbGVhZCB0byBtaXNsZWFkaW5nIHZpc3VhbCByZXByZXNlbnRhdGlvbnMgb2YgZGF0YS4KCiMjIyA8c3BhbiBzdHlsZSA9ICJjb2xvcjogIzc5Q0RDRDsiPlZhbHVlcyB0aGF0IGRvbid0IGJlbG9uZyBpbiB0aGUgZmFjdG9yPC9zcGFuPgpgYGB7cn0KIyBSZXBsYWNlIHVudXN1YWwgZW50cmllcyBpbiB0aGUgYWR1bHQgY29sdW1uIHdpdGggIkZhbHNlIgpjb2xsZWN0aW9uX2RhdGEkYWR1bHRbZ3JlcCgid3JpdHRlbiBieXxiaWtpbmkgY29udGVzdHxjYXNpbm8gY29ubmVjdGVkIiwgdG9sb3dlcihjb2xsZWN0aW9uX2RhdGEkYWR1bHQpKV0gPC0gIkZhbHNlIgoKIyBSZWNhbGN1bGF0ZSB0aGUgZnJlcXVlbmN5IG9mIGVhY2ggY2F0ZWdvcnkgaW4gdGhlIGFkdWx0IGNvbHVtbiBhbmQgdXBkYXRlIHRoZSBkYXRhIGZyYW1lCmFkdWx0X2ZyZXEgPC1hcy5kYXRhLmZyYW1lKHRhYmxlKGNvbGxlY3Rpb25fZGF0YSRhZHVsdCkpCgojIEZpbHRlciB0aGUgcm93cyB0aGF0IGhhdmUgYSBmcmVxdWVuY3kgZ3JlYXRlciB0aGFuIDAKYWR1bHRfZnJlcV9maWx0ZXJlZCA8LSBhZHVsdF9mcmVxW2FkdWx0X2ZyZXEkRnJlcSA+IDAsIF0KCiMgU2hvdyB0aGUgdXBkYXRlZCBjYXRlZ29yaWVzIGFuZCB0aGVpciBmcmVxdWVuY2llcwpwcmludChhZHVsdF9mcmVxKQoKIyBNZXJnZSBjb2xsZWN0aW9uX2RhdGEgd2l0aCBhZHVsdF9mcmVxX2ZpbHRlcmVkIGJhc2VkIG9uIHRoZSAnVmFyMScgY29sdW1uCmNvbGxlY3Rpb25fZGF0YSA8LSBtZXJnZShjb2xsZWN0aW9uX2RhdGEsIGFkdWx0X2ZyZXFfZmlsdGVyZWQsIGJ5LnggPSAiYWR1bHQiLCBieS55ID0gIlZhcjEiLCBhbGwueCA9IFRSVUUpCgojIFJlbW92ZSB0aGUgJ0ZyZXEnIGNvbHVtbiAoc2luY2UgaXQncyBub3QgbmVlZGVkKQpjb2xsZWN0aW9uX2RhdGEgPC0gY29sbGVjdGlvbl9kYXRhWywgLW5jb2woY29sbGVjdGlvbl9kYXRhKV0KCmBgYAoKSW4gdGhlIOKAnGFkdWx04oCdIGNvbHVtbiwgdGhlcmUgd2VyZSAzIHJvd3MgdGhhdCBkaWQgbm90IHJlc3BlY3QgdGhlIFRSVUUgYW5kIEZBTFNFIGZvcm1hdCwgc28gaXQgd2FzIGRlY2lkZWQgdG8gZWxpbWluYXRlIHRob3NlIDMgcm93cyB0byBtYWludGFpbiBjb25zaXN0ZW5jeS4KClRoZSBzYW1lcyBnb2VzIGZvciB0aGUgb3JpZ2luYWwgbGFuZ3VhZ2UgY29sdW1uLCB3aGljaCBpbnN0ZWFkIG9mIGFuIGFiYnJldmlhdGlvbiB3aXRoIGNoYXJhY3RlcnMsIHRoZXJlIGFyZSBzb21lIHJvd3Mgd2l0aCBpbnRlZ2Vycy4gV2hpbGUgYWxzbywgYWRkaW5nIGEgdGhyZXNob2xkIGZvciB0aG9zZSBtb3ZpZXMgd2hvc2Ugb3JpZ2luYWwgbGFuZ3VhZ2UgaGFzIGEgZnJlcXVlbmN5IGxlc3MgdGhhbiAxMCwgYW5kIGNoYW5nZSBpdCB0byB0aGUgYWJicmV2aWF0aW9uIGFzICJvdGhlciIsIHRvIHNpbXBsaWZ5IGFuZCBjb25zb2xpZGF0ZSB0aGUgZGF0YS4gCgpgYGB7cn0KIyBDcmVhdGUgYSBkYXRhZnJhbWUgd2l0aCB0aGUgZnJlcXVlbmN5IHRhYmxlIG9mIG9yaWdpbmFsIGxhbmd1YWdlcwpvcmdfbGFuZ19mcmVxIDwtIGFzLmRhdGEuZnJhbWUodGFibGUoY29sbGVjdGlvbl9kYXRhJG9yaWdpbmFsX2xhbmd1YWdlKSkKI3NlZSB0aGUgYXZlcmFnZQpzdW1tYXJ5KG9yZ19sYW5nX2ZyZXEkRnJlcSkKIyBGaW5kIHJvd3Mgd2l0aCBmcmVxdWVuY3kgbGVzcyB0aGFuIGEgdGhyZXNob2xkIChlLmcuLCA1MCkgYW5kIGNvbWJpbmUgdGhlbSBpbnRvICdvdGhlcicKdGhyZXNob2xkIDwtIDEwCm90aGVyX2ZyZXEgPC0gc3VtKG9yZ19sYW5nX2ZyZXEkRnJlcVtvcmdfbGFuZ19mcmVxJEZyZXEgPCB0aHJlc2hvbGRdKQpvcmdfbGFuZ19mcmVxJFZhcjFbb3JnX2xhbmdfZnJlcSRGcmVxIDwgdGhyZXNob2xkXSA8LSAib3RoZXIiCm9yZ19sYW5nX2ZyZXEkRnJlcVtvcmdfbGFuZ19mcmVxJEZyZXEgPCB0aHJlc2hvbGRdIDwtIG90aGVyX2ZyZXEKCiMgUmVtb3ZlIGR1cGxpY2F0ZXMgY2F1c2VkIGJ5IGNvbWJpbmluZyBpbnRvICdvdGhlcicKb3JnX2xhbmdfZnJlcSA8LSBvcmdfbGFuZ19mcmVxWyFkdXBsaWNhdGVkKG9yZ19sYW5nX2ZyZXEkVmFyMSksIF0KCiMgUHJpbnQgdGhlIG1vZGlmaWVkIGRhdGFmcmFtZQpoZWFkKG9yZ19sYW5nX2ZyZXEpCmBgYAoKIyMgPHNwYW4gc3R5bGUgPSAiY29sb3I6ICM1MjhCOEI7Ij5DaGVja2luZyBjYXRlZ29yaWVzIC8gQ29sbGFwc2luZyBjYXRlZ29yaWVzPC9zcGFuPgoKYGBge3J9CmxpYnJhcnkoZm9yY2F0cykKIyBDYXRlZ29yaWVzIHdpdGggbGVzcyBmcmVxdWVuY3kKb3RoZXJfY2F0ZWdvcmllcyA9IGMoIkNhcm91c2VsIFByb2R1Y3Rpb25zIiwgIkFuaXBsZXgiLCAiT2R5c3NleSBNZWRpYSIpCgojIFNlbGVjdCBpdCBhcyBvdGhlcgpjb2xsZWN0aW9uX2RhdGEgPC0gY29sbGVjdGlvbl9kYXRhICU+JQogIG11dGF0ZShnZW5yZTEgPSBhcy5mYWN0b3IoZ2VucmUxKSwKICAgICAgICAgZ2VucmUxID0gZmN0X2NvbGxhcHNlKGdlbnJlMSwgb3RoZXIgPSBvdGhlcl9jYXRlZ29yaWVzKSkKYGBgCgpgYGB7cn0KIyBMYW5ndWFnZXMgd2l0aCBsZXNzIGZyZXF1ZW5jeQpvdGhlcl9jYXRlZ29yaWVzID0gYygiUHVsc2VyIFByb2R1Y3Rpb25zIiwgIkdvSGFuZHMiLCAiVmlzaW9uIFZpZXcgRW50ZXJ0YWlubWVudCIpCgojIFNlbGVjdCBpdCBhcyBvdGhlcgpjb2xsZWN0aW9uX2RhdGEgPC0gY29sbGVjdGlvbl9kYXRhICU+JQogIG11dGF0ZShnZW5yZTIgPSBhcy5mYWN0b3IoZ2VucmUyKSwKICAgICAgICAgZ2VucmUyID0gZmN0X2NvbGxhcHNlKGdlbnJlMiwgb3RoZXIgPSBvdGhlcl9jYXRlZ29yaWVzKSkKYGBgCgpgYGB7cn0KIyBMYW5ndWFnZXMgd2l0aCBsZXNzIGZyZXF1ZW5jeQpvdGhlcl9jYXRlZ29yaWVzID0gYygiVGVsZXNjZW5lIEZpbG0gR3JvdXAgUHJvZHVjdGlvbnMiLCAiUm9ndWUgU3RhdGUiLCAiQlJPU1RBIFRWIikKCiMgU2VsZWN0IGl0IGFzIG90aGVyCmNvbGxlY3Rpb25fZGF0YSA8LSBjb2xsZWN0aW9uX2RhdGEgJT4lCiAgbXV0YXRlKGdlbnJlMyA9IGFzLmZhY3RvcihnZW5yZTMpLAogICAgICAgICBnZW5yZTMgPSBmY3RfY29sbGFwc2UoZ2VucmUzLCBvdGhlciA9IG90aGVyX2NhdGVnb3JpZXMpKQpgYGAKClRoZSBsaXN0IG9mIGxlc3MgZnJlcXVlbnQgY2F0ZWdvcmllcyB3ZXJlIGRlZmluZWQgaW4gdGhlIHRocmVlIG1haW4gbW92aWUgZ2VucmUgY29sdW1ucyAoImdlbnJlMSIsICJnZW5yZTIiLCBhbmQgImdlbnJlMyIpLCBpbiBvcmRlciB0byBncm91cCB0aGVtIHVuZGVyIHRoZSBsYWJlbCAib3RoZXIsIiB0aHVzIGFjaGlldmluZyB0aGUgc2ltcGxpZmljYXRpb24gYW5kIGNvbnNvbGlkYXRpb24gb2YgdGhlIGluZm9ybWF0aW9uLiBUaGlzIGhlbHBzIHN0cmVhbWxpbmUgdGhlIGRhdGEgYW5kIGF2b2lkIGNsdXR0ZXJpbmcgYW5hbHlzaXMgd2l0aCBvdmVybHkgc3BlY2lmaWMgY2F0ZWdvcmllcy4gCgojIyA8c3BhbiBzdHlsZSA9ICJjb2xvcjogIzUyOEI4QjsiPkNsZWFuaW5nIG9mIHRleHQgZGF0YTwvc3Bhbj4KCmBgYHtyfQpjbGVhbl9yZXZlbnVlIDwtIGZ1bmN0aW9uKHJldmVudWUpIHsKICAjIEZvcm1hdCBlbnRyaWVzIHdpdGggY29tbWFzIGFuZCBhZGQgbW9uZXkgc3ltYm9sCiAgZm9ybWF0dGVkX3JldmVudWUgPC0gcGFzdGUwKCIkIiwgZm9ybWF0KHJldmVudWUsIGJpZy5tYXJrID0gIiwiLCBzY2llbnRpZmljID0gRkFMU0UpKQogIHJldHVybihmb3JtYXR0ZWRfcmV2ZW51ZSkKfQoKIyBBcHBseSB0aGUgZnVuY3Rpb24gdG8gdGhlIHJldmVudWUgY29sdW1uIGFuZCBzdG9yZSB0aGUgcmVzdWx0cyBpbiBhIG5ldyBjb2x1bW4KY29sbGVjdGlvbl9kYXRhJENsZWFuX3JldmVudWUgPC0gY2xlYW5fcmV2ZW51ZShjb2xsZWN0aW9uX2RhdGEkcmV2ZW51ZSkKCmBgYAoKYGBge3J9CiMgRnVuY3Rpb24gdG8gY2xlYW4gdGhlIGJ1ZGdldApjbGVhbl9idWRnZXQgPC0gZnVuY3Rpb24oYnVkZ2V0KSB7CiAgIyBGb3JtYXQgYnVkZ2V0IHdpdGggY29tbWFzIGFuZCBhZGQgbW9uZXkgc3ltYm9sCiAgZm9ybWF0dGVkX2J1ZGdldCA8LSBwYXN0ZTAoIiQiLCBmb3JtYXQoYnVkZ2V0LCBiaWcubWFyayA9ICIsIiwgc2NpZW50aWZpYyA9IEZBTFNFKSkKICByZXR1cm4oZm9ybWF0dGVkX2J1ZGdldCkKfQoKIyBBcHBseSB0aGUgZnVuY3Rpb24gdG8gdGhlIGJ1ZGdldCBjb2x1bW4gYW5kIHN0b3JlIHRoZSByZXN1bHRzIGluIGEgbmV3IGNvbHVtbgpjb2xsZWN0aW9uX2RhdGEkQ2xlYW5fYnVkZ2V0IDwtIGNsZWFuX2J1ZGdldChjb2xsZWN0aW9uX2RhdGEkYnVkZ2V0KQoKIyBSZW1vdmUgdGhlIHByZXZpb3VzIGJ1ZGdldCBjb2x1bW4KY29sbGVjdGlvbl9kYXRhIDwtIHN1YnNldChjb2xsZWN0aW9uX2RhdGEsIHNlbGVjdCA9IC1jKGJ1ZGdldCkpCmBgYAoKYGBge3J9CiMgQ29udmVydCB0aGUgInBvcHVsYXJpdHkiIGNvbHVtbiB0byBudW1lcmljCmNvbGxlY3Rpb25fZGF0YSRwb3B1bGFyaXR5IDwtIGFzLm51bWVyaWMoY29sbGVjdGlvbl9kYXRhJHBvcHVsYXJpdHkpCgojIFJvdW5kIHBvcHVsYXJpdHkgdG8gd2hvbGUgbnVtYmVycwpjb2xsZWN0aW9uX2RhdGEkcm91bmRfcG9wdWxhcml0eSA8LSByb3VuZChjb2xsZWN0aW9uX2RhdGEkcG9wdWxhcml0eSkKCiMgUmVtb3ZlIHRoZSBwcmV2aW91cyBwb3B1bGFyaXR5IGNvbHVtbgpjb2xsZWN0aW9uX2RhdGEgPC0gc3Vic2V0KGNvbGxlY3Rpb25fZGF0YSwgc2VsZWN0ID0gLWMocG9wdWxhcml0eSkpCgpgYGAKCkZ1bmN0aW9ucyB3ZXJlIGFwcGxpZWQgdG8gY2xlYW4gYW5kIGZvcm1hdCByZXZlbnVlLCBidWRnZXQgYW5kIHBvcHVsYXJpdHkgY29sdW1ucywgYWRkaW5nIGN1cnJlbmN5IHN5bWJvbHMgYW5kIGNvbW1hcyBmb3IgYmV0dGVyIHJlYWRhYmlsaXR5LiBCZXNpZGVzLCBjb252ZXJ0ZWQgdGhlICJwb3B1bGFyaXR5IiBjb2x1bW4gdG8gbnVtZXJpYyBmb3JtYXQgYW5kIHJvdW5kZWQgaXQgdG8gd2hvbGUgbnVtYmVycyBmb3IgZWFzaWVyIGludGVycHJldGF0aW9uLiAKCiMjIDxzcGFuIHN0eWxlID0gImNvbG9yOiAjNTI4QjhCOyI+Q29uY2x1c2lvbjwvc3Bhbj4KCkFzIGZvciB0aGUgdW5pdmFyaWF0ZSBkaXN0cmlidXRpb25zLCAqYnVkZ2V0KiwgKnBvcHVsYXJpdHkqLCAqVm90ZSBjb3VudCogYW5kICpyZXZlbnVlKiBoYXZlIGxvdyBmcmVxdWVuY2llcyBzbyB0aGUgInN1Y2Nlc3MiIG1vdmllcyBtYWtlIHRoZSBtaW5vcml0eSB3aGljaCBob2xkIGludG8gcXVlc3Rpb24gdGhlIHBvc3NpYmlsaXR5IG9mIGEgcHJlZGljdGlvbiBtb2RlbC4gKlJ1biB0aW1lKiBpcyAxMDAgbWludXRlcyBmb3IgbW9zdCBhbmQgKlZvdGUgQXZlcmFnZSogZm9sbG93cyBhIG5vcm1hbCBkaXN0cmlidXRpb24gd2l0aCBhbiBhdmcgb2YgNi03LiBOb25lIG9mIHRoZSBvdGhlcnMgZm9sbG93IGEgbm9ybWFsIGRpc3RyaWJ1dGlvbi4KCkFzIGZvciB3aGF0IHZhcmlhYmxlcyBhcmUgbW9zdCBjb3JyZWxhdGVkIHRvIHJldmVudWUsIGhlcmUgaXMgd2hhdCB3ZSBmb3VuZC4gU3Ryb25nZXN0OiBidWRnZXQgYW5kIHZvdGUgY291bnQ7IDJuZCBsZXZlbDogcG9wdWxhcml0eSwgZ2VucmUxX2FkdmVudHVyZSBhbmQgZ2VucmUyX2FjdGlvbjsgM3JkIGxldmVsOiBnZW5yZTFfYW5pbWF0aW9uIGFuZCBnZW5yZTJfZmFudGFzeS4KClRoZXJlIGlzIGEgcG9zaXRpdmUgY29ycmVsYXRpb24gYmV0d2VlbiB2b3RlIGNvdW50LCBidWRnZXQgYW5kIHBvcHVsYXJpdHkgdG8gcmV2ZW51ZS4gTm8gY2xlYXIgdHJlbmQgd2l0aCBydW50aW1lIGFuZCB2b3RlIGF2ZXJhZ2UuCgoKIyA8c3BhbiBzdHlsZSA9ICJjb2xvcjogIzZFOEIzRDsiPipQcm9ncmVzcyBQcm9ibGVtIFNldHVwIDMqPC9zcGFuPgoKIyMgPHNwYW4gc3R5bGUgPSAiY29sb3I6ICM1MjhCOEI7Ij5Vbml0IENvbnZlcnNpb248L3NwYW4+CmBgYHtyfQojIENoZWNrIGlmIHJ1bnRpbWUgY29sdW1uIGlzIGFscmVhZHkgYXNzaWduZWQgdW5pdHMKaWYgKCFpbmhlcml0cyhjb2xsZWN0aW9uX2RhdGEkcnVudGltZSwgInVuaXRzIikpIHsKICAjIENvbnZlcnQgcnVudGltZSBjb2x1bW4gdG8gbnVtZXJpYyBhbmQgdGhlbiB0byBtaW51dGVzIHdpdGggdW5pdHMKICBjb2xsZWN0aW9uX2RhdGEkcnVudGltZSA8LSBhcy5udW1lcmljKGNvbGxlY3Rpb25fZGF0YSRydW50aW1lKQogIGNvbGxlY3Rpb25fZGF0YSRydW50aW1lIDwtIHNldF91bml0cyhjb2xsZWN0aW9uX2RhdGEkcnVudGltZSwgIm1pbnV0ZXMiKQp9CgpgYGAKCgpgYGB7cn0KIyBDcmVhdGUgYSBuZXcgY29sdW1uIGNhbGxlZCAnbnVtX2dlbnJlcycgdGhhdCBjb3VudHMgdGhlIG5vbi1taXNzaW5nIGdlbnJlIGFuZCBzcG9rZW4gbGFuZyBjb2x1bW5zCmNvbGxlY3Rpb25fZGF0YSRudW1fZ2VucmVzIDwtIHJvd1N1bXMoIWlzLm5hKGNvbGxlY3Rpb25fZGF0YVssIHBhc3RlMCgiZ2VucmUiLCAxOjgpXSkpCgpjb2xsZWN0aW9uX2RhdGEgPC0gY29sbGVjdGlvbl9kYXRhICU+JQogIG11dGF0ZShudW1fc3Bva2VuX2xhbmd1YWdlcyA9IHJvd1N1bXMoIWlzLm5hKHNlbGVjdCguLCBzdGFydHNfd2l0aCgic3Bva2VuX2xhbmciKSkpKSkKYGBgCgoKIyMgPHNwYW4gc3R5bGUgPSAiY29sb3I6ICM1MjhCOEI7Ij5Db25jbHVzaW9uPC9zcGFuPgoKVGhlc2UgY29kZSBhbGxvd3MgdXMgdG8gZW5zdXJlIGNvbnNpc3RlbnQgdW5pdHMgZm9yIHJ1bnRpbWUgYW5kIGNhbGN1bGF0aW5nIHRoZSBjb3VudCBvZiBnZW5yZXMgYW5kIHNwb2tlbiBsYW5ndWFnZXMgc28gdGhlIGRhdGFzZXQgYmVjb21lcyBtb3JlIHN0YW5kYXJkaXplZC4gVGhlIHVuaXQgY29udmVyc2lvbiBlbnN1cmVzIHRoYXQgdGhlICdydW50aW1lJyBjb2x1bW4gaXMgdW5pZm9ybWx5IHJlcHJlc2VudGVkIGluIG1pbnV0ZXMuIEl0IGNoZWNrcyBpZiB0aGUgJ3J1bnRpbWUnIGNvbHVtbiBpcyBhbHJlYWR5IGFzc2lnbmVkIHVuaXRzLiBJZiBub3QsIGl0IGNvbnZlcnRzIHRoZSAncnVudGltZScgY29sdW1uIHRvIG51bWVyaWMgYW5kIHRoZW4gYXNzaWducyB1bml0cyB0byByZXByZXNlbnQgdGltZSBpbiBtaW51dGVzLiBMYXN0IHRoZSBnZW5yZSBhbmQgc3Bva2VuIGxhbmd1YWdlIGNvdW50cyBjb2RlLCBhZGRzIHR3byBuZXcgY29sdW1ucyB0byB0aGUgZGF0YXNldC4KJ251bV9nZW5yZXMnOiBUaGlzIGNvbHVtbiBjb3VudHMgdGhlIG51bWJlciBvZiBub24tbWlzc2luZyBnZW5yZSBjb2x1bW5zIGZvciBlYWNoIG1vdmllLgonbnVtX3Nwb2tlbl9sYW5ndWFnZXMnOiBUaGlzIGNvbHVtbiBjb3VudHMgdGhlIG51bWJlciBvZiBub24tbWlzc2luZyBzcG9rZW4gbGFuZ3VhZ2UgY29sdW1ucyBmb3IgZWFjaCBtb3ZpZS4KCiMgPHNwYW4gc3R5bGUgPSAiY29sb3I6ICM2RThCM0Q7Ij4qUHJvZ3Jlc3MgUHJvYmxlbSBTZXR1cCA0Kjwvc3Bhbj4KCiMjIDxzcGFuIHN0eWxlID0gImNvbG9yOiAjNTI4QjhCOyI+VGFibGVzIHdpdGggMSBvciAyIHZhcmlhYmxlcyA0PC9zcGFuPgoKYGBge3J9CiMgQ3JlYXRlIGEgYmFja3VwIGRmCmNvcHlfZGF0YSA8LSBjb2xsZWN0aW9uX2RhdGEKYGBgCgojIyMgPHNwYW4gc3R5bGUgPSAiY29sb3I6ICM3OUNEQ0Q7Ij5SZXZlbnVlPC9zcGFuPgoKYGBge3J9CiMgRGVmaW5lIHRoZSByZXZlbnVlIGNhdGVnb3JpZXMKcmV2ZW51ZV9iaW5zIDwtIGMoMCwgMTAwMDAwMDAwLCA1MDAwMDAwMDAsIDEwMDAwMDAwMDAsIDIwMDAwMDAwMDAsIDMwMDAwMDAwMDApCnJldmVudWVfbGFiZWxzIDwtIGMoJzwxMDBNJywgJzEwME0tNTAwTScsICc1MDBNLTFCJywgJzFCLTJCJywgJzJCLTNCJykKCgojIENyZWF0ZSB0aGUgJ3JldmVudWVfZ3JvdXAnIGNvbHVtbgpjb3B5X2RhdGEkcmV2ZW51ZV9ncm91cCA8LSBjdXQoY29weV9kYXRhJHJldmVudWUsIGJyZWFrcyA9IHJldmVudWVfYmlucywgbGFiZWxzID0gcmV2ZW51ZV9sYWJlbHMsIHJpZ2h0ID0gRkFMU0UpCmBgYAoKYGBge3J9CnRhYmxlKGNvcHlfZGF0YSRyZXZlbnVlX2dyb3VwKQpgYGAKCgpgYGB7cn0KdGFibGUoY29weV9kYXRhJHJldmVudWVfZ3JvdXAsIGNvcHlfZGF0YSRnZW5yZTEpCmBgYApMb3dlciBncm9zc2luZyBmaWxtcyB0ZW5kIHRvIGhhdmUgbW92aWVzIGZyb20gYSB3aWRlIGFycmF5IG9mIGdlbnJlcywgYnV0IGZvciA1MDBNLTFCIHRvIDJCLTNCIGFyZSBtb3N0IGNvbmNlbnRyYXRlZCBpbiBhY3Rpb24uCgoKCiMjIyA8c3BhbiBzdHlsZSA9ICJjb2xvcjogIzc5Q0RDRDsiPlByb2R1Y3Rpb24gQ29tcGFuaWVzPC9zcGFuPgoKYGBge3J9CiMgQ2FsY3VsYXRlIHRoZSBmcmVxdWVuY2llcyBvZiBlYWNoIHByb2R1Y3Rpb24gY29tcGFueQpjb21wYW55X2ZyZXF1ZW5jaWVzIDwtIGNvcHlfZGF0YSAlPiUKICBjb3VudChDbGVhbl9wcm9kdWN0aW9uX2NvbXBhbmllcykgJT4lCiAgYXJyYW5nZShkZXNjKG4pKSAgIyBTb3J0IGluIGRlc2NlbmRpbmcgb3JkZXIgb2YgZnJlcXVlbmN5CgojIFNlbGVjdCB0aGUgdG9wIDEwIHByb2R1Y3Rpb24gY29tcGFuaWVzCnRvcF8xMF9jb21wYW5pZXMgPC0gaGVhZChjb21wYW55X2ZyZXF1ZW5jaWVzLCAxMCkKCnRvcF8xMF9jb21wYW5pZXMKYGBgCmBgYHtyfQojIENhbGN1bGF0ZSB0aGUgY291bnQgb2YgZWFjaCBjb21wYW55CmNvbXBhbnlfY291bnRzIDwtIHRhYmxlKGNvcHlfZGF0YSRDbGVhbl9wcm9kdWN0aW9uX2NvbXBhbmllcykKCiMgU29ydCB0aGUgY29tcGFuaWVzIGJ5IGNvdW50IGluIGRlc2NlbmRpbmcgb3JkZXIgYW5kIHNlbGVjdCB0aGUgdG9wIGZpdmUKdG9wX2NvbXBhbmllcyA8LSBuYW1lcyhzb3J0KGNvbXBhbnlfY291bnRzLCBkZWNyZWFzaW5nID0gVFJVRSlbMTo4XSkKCiMgRmlsdGVyIHRoZSBkYXRhc2V0IHRvIGluY2x1ZGUgb25seSB0aGUgdG9wIGZpdmUgbW9zdCBpbXBvcnRhbnQgY29tcGFuaWVzCmZpbHRlcmVkX2RhdGEgPC0gY29weV9kYXRhW2NvbGxlY3Rpb25fZGF0YSRDbGVhbl9wcm9kdWN0aW9uX2NvbXBhbmllcyAlaW4lIHRvcF9jb21wYW5pZXMsIF0KCiMgQ3JlYXRlIHRoZSBiYXIgcGxvdApnZ3Bsb3QoZmlsdGVyZWRfZGF0YSwgYWVzKHggPSBDbGVhbl9wcm9kdWN0aW9uX2NvbXBhbmllcykpICsKICBnZW9tX2JhcigpICsKICB0aGVtZShheGlzLnRleHQueCA9IGVsZW1lbnRfdGV4dChhbmdsZSA9IDkwLCB2anVzdCA9IDAuNSwgaGp1c3Q9MSkpCmBgYApUaGlzIGJhciBncmFwaCBhbmFseXplcyB0aGUgIkNsZWFuX3Byb2R1Y3Rpb25fY29tcGFuaWVzIiB2YXJpYWJsZSBhbmQgc2hvd3MgdXMgdGhlIDggbW9zdCBpbXBvcnRhbnQgcmVzdWx0cyB0byBiZSBhYmxlIHRvIGlkZW50aWZ5IHdoaWNoIGNvbXBhbmllcyBhcmUgbWFraW5nIHRoZSBtb3N0IG1vdmllcy4gSXQgYWxsb3dzIHVzIHRvIHVuZGVyc3RhbmQgd2hpY2ggY29tcGFuaWVzIGhhdmUgdGhlIG1vc3QgZXh0ZW5zaXZlIHByZXNlbmNlIGluIHRlcm1zIG9mIG1vdmllIHByb2R1Y3Rpb24uCgojIyA8c3BhbiBzdHlsZSA9ICJjb2xvcjogIzUyOEI4QjsiPkdHUGxvdCBTdHJ1Y3R1cmVzPC9zcGFuPgoKIyMjIDxzcGFuIHN0eWxlID0gImNvbG9yOiAjNzlDRENEOyI+RGVuc2l0eSBQbG90PC9zcGFuPgoKYGBge3J9CiMgQ2FsY3VsYXRlIHRoZSBjb3VudCBvZiBlYWNoIGNvdW50cnkKY291bnRyeV9jb3VudHMgPC0gdGFibGUoY29sbGVjdGlvbl9kYXRhJENsZWFuX3Byb2R1Y3Rpb25fY291bnRyaWVzKQoKIyBTb3J0IHRoZSBjb3VudHJpZXMgYnkgY291bnQgaW4gZGVzY2VuZGluZyBvcmRlciBhbmQgc2VsZWN0IHRoZSB0b3AgZml2ZQp0b3BfY291bnRyaWVzIDwtIG5hbWVzKHNvcnQoY291bnRyeV9jb3VudHMsIGRlY3JlYXNpbmcgPSBUUlVFKVsxOjhdKQoKIyBGaWx0ZXIgdGhlIGRhdGFzZXQgdG8gaW5jbHVkZSBvbmx5IHRoZSB0b3AgZml2ZSBtb3N0IGltcG9ydGFudCBjb3VudHJpZXMKZmlsdGVyZWRfZGF0YSA8LSBjb2xsZWN0aW9uX2RhdGFbY29sbGVjdGlvbl9kYXRhJENsZWFuX3Byb2R1Y3Rpb25fY291bnRyaWVzICVpbiUgdG9wX2NvdW50cmllcywgXQoKIyBDcmVhdGUgdGhlIGRlbnNpdHkgcGxvdApnZ3Bsb3QoZmlsdGVyZWRfZGF0YSwgYWVzKHggPSBDbGVhbl9wcm9kdWN0aW9uX2NvdW50cmllcykpICsKICBnZW9tX2RlbnNpdHkoKSArCiAgdGhlbWUoYXhpcy50ZXh0LnggPSBlbGVtZW50X3RleHQoYW5nbGUgPSA5MCwgdmp1c3QgPSAwLjUsIGhqdXN0PTEpKQpgYGAKVGhpcyBkZW5zaXR5IHBsb3QgYW5hbHl6ZXMgdGhlICJDbGVhbl9wcm9kdWN0aW9uX2NvdW50cmllcyIgdmFyaWFibGUgYW5kIHNob3dzIHVzIHRoZSA4IG1vc3QgaW1wb3J0YW50IHJlc3VsdHMgdG8gYmUgYWJsZSB0byBpZGVudGlmeSB3aGljaCBjb3VudHJpZXMgYXJlIHdoZXJlIHRoZSBtb3N0IG1vdmllcyBhcmUgYmVpbmcgcHJvZHVjZWQuIFdlIGdhaW4gYSBkZWVwZXIgdW5kZXJzdGFuZGluZyBvZiB0aGUgZ2VvZ3JhcGhpY2FsIGxhbmRzY2FwZSBvZiB0aGUgZmlsbSBpbmR1c3RyeSByZXByZXNlbnRlZCBieSB0aGUgZGF0YXNldC4KCiMjIyA8c3BhbiBzdHlsZSA9ICJjb2xvcjogIzc5Q0RDRDsiPkNvcnJlbGF0aW9uIFBsb3Q8L3NwYW4+CmBgYHtyfQojIExvYWQgdGhlIGNvcnJwbG90IHBhY2thZ2UKbGlicmFyeShjb3JycGxvdCkKCiMgRXh0cmFjdCBudW1lcmljIGNvbHVtbnMgZm9yIGNvcnJlbGF0aW9uIGFuYWx5c2lzCm51bWVyaWNfZGF0YSA8LSBjb3B5X2RhdGFbLCBzYXBwbHkoY29weV9kYXRhLCBpcy5udW1lcmljKV0KCiMgQ2FsY3VsYXRlIHRoZSBjb3JyZWxhdGlvbiBtYXRyaXgKY29ycmVsYXRpb25fbWF0cml4IDwtIGNvcihudW1lcmljX2RhdGEpCgojIENyZWF0ZSB0aGUgY29ycnBsb3Qgd2l0aCB0aGUgY29ycmVsYXRpb24gbWF0cml4CmNvcnJwbG90KGNvcnJlbGF0aW9uX21hdHJpeCwgbWV0aG9kID0gImNvbG9yIikKYGBgClRoaXMgc2hvd3MgdGhlIHJlbGF0aW9uc2hpcHMgYmV0d2VlbiBudW1lcmljYWwgdmFyaWFibGVzIHdpdGhpbiB0aGUgZGF0YXNldCBjb3B5X2RhdGEgYnkgdmlzdWFsaXppbmcgdGhlaXIgY29ycmVsYXRpb25zLiBUaGUgY29ycmVsYXRpb24gcGxvdCBvZmZlcnMgYSBjb21wcmVoZW5zaXZlIG92ZXJ2aWV3IG9mIHRoZSBpbnRlcmRlcGVuZGVuY2llcyBhbW9uZyB2YXJpYWJsZXMuCgojIyMgPHNwYW4gc3R5bGUgPSAiY29sb3I6ICM3OUNEQ0Q7Ij5CYXIgR3JhcGg8L3NwYW4+CmBgYHtyfQoKcG9wdWxhcml0eV9zdW1tYXJ5IDwtIGFnZ3JlZ2F0ZShyb3VuZF9wb3B1bGFyaXR5IH4gZ2VucmUyLCBkYXRhID0gY29sbGVjdGlvbl9kYXRhLCBGVU4gPSBtZWFuKQoKZ2dwbG90KGRhdGEgPSBwb3B1bGFyaXR5X3N1bW1hcnksIGFlcyh4ID0gZ2VucmUyLCB5ID0gcm91bmRfcG9wdWxhcml0eSkpICsKICBnZW9tX2JhcihzdGF0ID0gImlkZW50aXR5IiwgZmlsbCA9ICJza3libHVlIikgKwogIGxhYnModGl0bGUgPSAiQXZlcmFnZSBQb3B1bGFyaXR5IGJ5IEdlbnJlIiwgeCA9ICJHZW5yZSIsIHkgPSAiQXZlcmFnZSBQb3B1bGFyaXR5IikgKwogIHRoZW1lKGF4aXMudGV4dC54ID0gZWxlbWVudF90ZXh0KGFuZ2xlID0gOTAsIHZqdXN0ID0gMC41LCBoanVzdD0xKSkKCmBgYApXaGF0IGNhbiBiZSBpbnRlcnByZXRlZCBpbiB0aGUgYmFyIGdyYXBoIGlzIHRoYXQgdGhlcmUgYXJlIDMgZ2VucmVzIHRoYXQgaGF2ZSB0aGUgaGlnaGVzdCBwb3B1bGFyaXR5IGFtb25nIHRoZSBvdGhlcnMsIHRoZXNlIGFyZSBBZHZlbnR1cmUgaW4gZmlyc3QgcGxhY2UsIEFuaW1hdGlvbiBpbiBzZWNvbmQgcGxhY2UgYW5kIEZhbnRhc3kgaW4gdGhpcmQgcGxhY2UsIHRoZSBvdGhlcnMgaGF2ZSBzaW1pbGFyIGFuZCBwZXJzaXN0ZW50IGFtb3VudHMuCgojIyA8c3BhbiBzdHlsZSA9ICJjb2xvcjogIzUyOEI4QjsiPlRhYmxlcyBhbmQgR3JhcGhzIGZvciBDYXRlZ29yaWNhbCBhbmQgTnVtZXJpY2FsIHZhcmlhYmxlczwvc3Bhbj4KCiMjIyA8c3BhbiBzdHlsZSA9ICJjb2xvcjogIzc5Q0RDRDsiPkZyZXF1ZW5jeSB0YWJsZSBmb3IgYSBjYXRlZ29yaWNhbCB2YXJpYWJsZTwvc3Bhbj4KYGBge3J9CiMgRnJlcXVlbmN5IHRhYmxlIGZvciBhIGNhdGVnb3JpY2FsIHZhcmlhYmxlCmdlbnJlX2ZyZXEgPC0gdGFibGUoY29sbGVjdGlvbl9kYXRhJGdlbnJlMSkKaGVhZChnZW5yZV9mcmVxKQpgYGAKClRoaXMgdGFibGUgcHJvdmVkIGEgc3VtbWFyeSBvZiB0aGUgY291bnRzIG9mIGRpZmZlcmVudCBnZW5yZXMgaW4gdGhlIGRhdGFzZXQuIFdlIGNhbiBub3cgdW5kZXJzdGFuZCB0aGUgZGlzdHJpYnV0aW9uIG9mIG1vdmllcyBhY3Jvc3MgZGlmZmVyZW50IGdlbnJlcy4gRm9yIGV4YW1wbGUsIHRoZXJlIGFyZSBpbiB0b3RhbCA0LDQ4NyBtb3ZpZXMgdGhhdCBhcmUgc2V0IGluIHRoZSBhY3Rpb24gZ2VucmUsIDEsNTEzIGZvciBhZHZlbnR1cmUsIDEsMTI0IGluIGFuaW1hdGlvbiwgOCw4MTcgaW4gY29tZWR5LCAxLDY4NCBpbiBjcmltZSwgYW5kIGZpbmFsbHkgMyBpbiBvdGhlciBnZW5yZS4gCgojIyMgPHNwYW4gc3R5bGUgPSAiY29sb3I6ICM3OUNEQ0Q7Ij5CYXIgY2hhcnQgZm9yIGdlbnJlIGZyZXF1ZW5jeTwvc3Bhbj4KYGBge3J9CmdncGxvdChkYXRhID0gY29sbGVjdGlvbl9kYXRhLCBhZXMoeCA9IGdlbnJlMSkpICsKICBnZW9tX2JhcigpICsKICBsYWJzKHRpdGxlID0gIkZyZXF1ZW5jeSBvZiBHZW5yZXMiKSArCiAgdGhlbWVfbWluaW1hbCgpICsKICB0aGVtZShheGlzLnRleHQueCA9IGVsZW1lbnRfdGV4dChhbmdsZSA9IDkwLCB2anVzdCA9IDAuNSwgaGp1c3QgPSAxKSkKCmBgYAoKVmlzdWFsaXplcyB0aGUgZnJlcXVlbmN5IG9mIGdlbnJlcyBpbiB0aGUgZGF0YSBzZXQuIEl0IGdpdmVzIGEgY2xlYXIgdmlzdWFsIHJlcHJlc2VudGF0aW9uIG9mIGhvdyBtYW55IG1vdmllcyBiZWxvbmcgdG8gZWFjaCBnZW5yZSwgaGVscGluZyB0byBpZGVudGlmeSB0aGUgbW9zdCBjb21tb24gYW5kIGxlYXN0IGNvbW1vbiBnZW5yZXMuCgojIyA8c3BhbiBzdHlsZSA9ICJjb2xvcjogIzUyOEI4QjsiPkFuYWx5emluZyBNdWx0aXBsZSBWYXJpYWJsZXMgVG9nZXRoZXI8L3NwYW4+CgojIyMgPHNwYW4gc3R5bGUgPSAiY29sb3I6ICM3OUNEQ0Q7Ij5TdGFja2VkIGJhciBjaGFydCBmb3IgZ2VucmUgdnMgcmV2ZW51ZTwvc3Bhbj4KYGBge3J9CiMgR3JhZmljYXIKZ2dwbG90KGRhdGEgPSBjb2xsZWN0aW9uX2RhdGEsIGFlcyh4ID0gZ2VucmUxLCB5ID0gcmV2ZW51ZSkpICsKICBnZW9tX3BvaW50KGFlcyhjb2xvciA9IGdlbnJlMSkpICsKICBsYWJzKHRpdGxlID0gIkdlbnJlIHZzIFJldmVudWUiKSArCiAgdGhlbWVfbWluaW1hbCgpICsKICB0aGVtZShsZWdlbmQucG9zaXRpb24gPSAiYm90dG9tIikgKwogIHNjYWxlX3hfZGlzY3JldGUoZHJvcCA9IEZBTFNFKSAgCmBgYApUaGlzIGlzIGEgdmlzdWFsIHJlcHJlc2VudGF0aW9uIG9mIHRoZSByZWxhdGlvbnNoaXAgYmV0d2VlbiBtb3ZpZSBnZW5yZXMgYW5kIHJldmVudWUuIEVhY2ggcG9pbnQgb24gdGhlIHBsb3QgY29ycmVzcG9uZHMgdG8gYSBzcGVjaWZpYyBtb3ZpZSBnZW5yZSwgd2l0aCB0aGUgcG9zaXRpb24gYWxvbmcgdGhlIHktYXhpcyBpbmRpY2F0aW5nIHRoZSByZXZlbnVlIGdlbmVyYXRlZCBieSBtb3ZpZXMgYmVsb25naW5nIHRvIHRoYXQgZ2VucmUuIFdlIGNhbiBnYWluIGluc2lnaHRzIGludG8gd2hpY2ggZ2VucmVzIHRlbmQgdG8gZ2VuZXJhdGUgaGlnaGVyIG9yIGxvd2VyIHJldmVudWVzLCBmb3IgZXhhbXBsZSwgIkFjdGlvbiIgaXMgdGhlIGdlbnJlIHdpdGggdGhlIGhpZ2hlc3QgcmV2ZW51ZS4KCiMjIyA8c3BhbiBzdHlsZSA9ICJjb2xvcjogIzc5Q0RDRDsiPldvcmQgQ2xvdWRzPC9zcGFuPgoKYGBge3J9CiMgTG9hZCBsaWJyYXJpZXMKbGlicmFyeSgidG0iKSAKbGlicmFyeSgiU25vd2JhbGxDIikKbGlicmFyeSgid29yZGNsb3VkIikKbGlicmFyeSgiUkNvbG9yQnJld2VyIikKYGBgCgojIyMgPHNwYW4gc3R5bGUgPSAiY29sb3I6ICM3OUNEQ0Q7Ij5UaXRsZXM8L3NwYW4+CgpgYGB7cn0KIyBub3MgZGljZSBsYXMgcGVsaWN1bGFzIHF1ZSBtYXMgZ2FuYXJvbiBkaW5lcm8KIyBEZWZpbmUgbG9zIGludGVydmFsb3MgZGUgaW5ncmVzb3MKcmV2ZW51ZV9iaW5zIDwtIGMoNTAwMDAwMDAwLCAxMDAwMDAwMDAwLCAyMDAwMDAwMDAwLCAzMDAwMDAwMDAwKQoKIyBGaWx0cmEgbG9zIGRhdG9zIGRlIGNvbGVjY2nDs24gYmFzYWRvcyBlbiBsb3MgaW50ZXJ2YWxvcyBkZSBpbmdyZXNvcwpwcm9maXRfZGF0YSA8LSBjb2xsZWN0aW9uX2RhdGEgJT4lIAogIGZpbHRlcihyZXZlbnVlID49IHJldmVudWVfYmluc1sxXSAmIHJldmVudWUgPCByZXZlbnVlX2JpbnNbMl0gfAogICAgICAgICAgIHJldmVudWUgPj0gcmV2ZW51ZV9iaW5zWzJdICYgcmV2ZW51ZSA8IHJldmVudWVfYmluc1szXSB8CiAgICAgICAgICAgcmV2ZW51ZSA+PSByZXZlbnVlX2JpbnNbM10gJiByZXZlbnVlIDwgcmV2ZW51ZV9iaW5zWzRdKQoKYGBgCgoKYGBge3J9CiNXZSBuZWVkIHRvIGNvbnZlcnQgdGhlIHRleHQgdG8gYSBjb3JwdXMKCmRvY3MgPC0gQ29ycHVzKFZlY3RvclNvdXJjZShwcm9maXRfZGF0YSRvcmlnaW5hbF90aXRsZSkpCmBgYAoKYGBge3J9CiNHZW5lcmFsIHRleHQgY2xlYW5pbmcKCiMgQ29udmVydCB0aGUgdGV4dCB0byBsb3dlciBjYXNlCmRvY3MgPC0gdG1fbWFwKGRvY3MsIGNvbnRlbnRfdHJhbnNmb3JtZXIodG9sb3dlcikpCiMgUmVtb3ZlIG51bWJlcnMKZG9jcyA8LSB0bV9tYXAoZG9jcywgcmVtb3ZlTnVtYmVycykKIyBSZW1vdmUgZW5nbGlzaCBjb21tb24gc3RvcHdvcmRzCmRvY3MgPC0gdG1fbWFwKGRvY3MsIHJlbW92ZVdvcmRzLCBzdG9wd29yZHMoImVuZ2xpc2giKSkKIyBSZW1vdmUgeW91ciBvd24gc3RvcCB3b3JkCiMgc3BlY2lmeSB5b3VyIHN0b3B3b3JkcyBhcyBhIGNoYXJhY3RlciB2ZWN0b3IKZG9jcyA8LSB0bV9tYXAoZG9jcywgcmVtb3ZlV29yZHMsIGMoImJsYWJsYTEiLCAiYmxhYmxhMiIpKSAKIyBSZW1vdmUgcHVuY3R1YXRpb25zCmRvY3MgPC0gdG1fbWFwKGRvY3MsIHJlbW92ZVB1bmN0dWF0aW9uKQojIEVsaW1pbmF0ZSBleHRyYSB3aGl0ZSBzcGFjZXMKZG9jcyA8LSB0bV9tYXAoZG9jcywgc3RyaXBXaGl0ZXNwYWNlKSAKYGBgCgpgYGB7cn0KI1Rlcm0tZG9jdW1lbnQgbWF0cml4LiBEb2N1bWVudCBtYXRyaXggaXMgYSB0YWJsZSBjb250YWluaW5nIHRoZSBmcmVxdWVuY3kgb2YgdGhlIHdvcmRzLgoKZHRtIDwtIFRlcm1Eb2N1bWVudE1hdHJpeChkb2NzKQptIDwtIGFzLm1hdHJpeChkdG0pCnYgPC0gc29ydChyb3dTdW1zKG0pLGRlY3JlYXNpbmc9VFJVRSkKZCA8LSBkYXRhLmZyYW1lKHdvcmQgPSBuYW1lcyh2KSxmcmVxPXYpCiNoZWFkKGQsIDEwMCkKCmBgYAoKYGBge3Igd2FybmluZz1GQUxTRX0Kc2V0LnNlZWQoMTIzNCkKd29yZGNsb3VkKHdvcmRzID0gZCR3b3JkLCBmcmVxID0gZCRmcmVxLCBtaW4uZnJlcSA9IDUsCiAgICAgICAgICBtYXgud29yZHM9SW5mLCByYW5kb20ub3JkZXI9VCwgcm90LnBlcj0wLjUsIAogICAgICAgICAgY29sb3JzPWJyZXdlci5wYWwoOCwgIkRhcmsyIikpCgojaHR0cHM6Ly9jcmFuLnItcHJvamVjdC5vcmcvd2ViL3BhY2thZ2VzL3dvcmRjbG91ZC93b3JkY2xvdWQucGRmCmBgYApUaGUgdHJlbmQgZm9yIHRoZSBtb3N0IHByb2ZpdGFibGUgdGl0bGVzIGlzIHRvIGJlIGEgcGFydCBvZiBhIGtub3duIGZyYW5jaGlzZSBsaWtlICJQaXJhdGVzIG9mIHRoZSBDYXJpYmJlYW4iLCAiU3RhciBXYXJzIiwgIlNwaWRlcm1hbiIsICJIYXJyeSBQb3R0ZXIiLCAiVHJhbnNmb3JtZXJzIiwgZXRjLgoKIyA8c3BhbiBzdHlsZSA9ICJjb2xvcjogIzZFOEIzRDsiPipQcm9ncmVzcyBQcm9ibGVtIFNldHVwIDUqPC9zcGFuPgojIyA8c3BhbiBzdHlsZSA9ICJjb2xvcjogIzUyOEI4QjsiPkRlc2NyaXB0aXZlIE1lYXN1cmVzPC9zcGFuPgoKYGBge3J9CmNvcHlfZGF0YSA8LSBjb2xsZWN0aW9uX2RhdGEKCmNvcHlfZGF0YSRDbGVhbl9idWRnZXRfbnVtZXJpYyA8LSBhcy5udW1lcmljKGdzdWIoIlxcJCIsICIiLCBjb3B5X2RhdGEkQ2xlYW5fYnVkZ2V0KSkKCmBgYAoKYGBge3J9CiMgQ3JlYXRlIG1lYXN1cmUgZm9yIHByb2ZpdCAoZ2FuYW5jaWEgbyBwZXJkaWRhKQpjb3B5X2RhdGEgPC0gY29weV9kYXRhICU+JQogICAgICAgIG11dGF0ZShwcm9maXQgPSByZXZlbnVlIC0gQ2xlYW5fYnVkZ2V0X251bWVyaWMpCmBgYAoKYGBge3J9CnJldmVudWVfZ3JvdXBlZCA8LSBjb3B5X2RhdGEgJT4lCiAgZ3JvdXBfYnkocmV2ZW51ZSkgJT4lCiAgc3VtbWFyaXplKG1lYW4ocHJvZml0LCBuYS5ybSA9IFRSVUUpLAogICAgICAgICAgICBzZChwcm9maXQsIG5hLnJtID0gVFJVRSksCiAgICAgICAgICAgIG1lZGlhbihwcm9maXQsIG5hLnJtID0gVFJVRSksCiAgICAgICAgICAgIHF1YW50aWxlKHByb2ZpdCwgKC45MCksIG5hLnJtID0gVFJVRSksCiAgICAgICAgICAgIG4oKSkKCnJldmVudWVfZ3JvdXBlZApgYGAKCmBgYHtyfQpzdW1tYXJ5KGNvcHlfZGF0YSRwcm9maXQpCmBgYAoKCiMjIDxzcGFuIHN0eWxlID0gImNvbG9yOiAjNTI4QjhCOyI+U2hhcGUgTWVhc3VyZXM8L3NwYW4+CmBgYHtyIHdhcm5pbmc9RkFMU0V9CmNvbGxlY3Rpb25fZGF0YSAlPiUKICBnZ3Bsb3QoYWVzKHggPSBnZW5yZTEsIGZpbGwgPSBydW50aW1lKSkgKwogIGdlb21fZGVuc2l0eShhbHBoYSA9IDAuMikgKyAgIGxhYnModGl0bGUgPSAiRGVuc2l0eSBpbiBnZW5yZTEgYW5kIHBvcHVsYXJpdHkiLCB4ID0gImdlbnJlMSIsIHkgPSAicnVudGltZSAtIGhvdXJzIikgKwogIHRoZW1lKGF4aXMudGV4dC54ID0gZWxlbWVudF90ZXh0KGFuZ2xlID0gOTAsIHZqdXN0ID0gMC41LCBoanVzdD0xKSkKYGBgCkluIHRoaXMgZ3JhcGggd2UgY2FuIHNlZSB0aGF0IHRoZSBkZW5zaXR5IHVzaW5nIHRoZSAiZ2VucmUxIiBhbmQgInJ1bnRpbWVfaG91cnMiIHZhcmlhYmxlcyBiZWhhdmVzIGluIGEgcmlnaHQgc2tld2VkIGZvcm0sIHNob3dpbmcgdXMgdGhlIG1vdmllIGdlbnJlcyB0aGF0IHVzZSB0aGUgbW9zdCBob3VycyBhbmQgdGhvc2UgdGhhdCB1c2UgdGhlIGxlYXN0LgoKIyMgPHNwYW4gc3R5bGUgPSAiY29sb3I6ICM1MjhCOEI7Ij5PdXRsaWVyczwvc3Bhbj4KCmBgYHtyfQpnZ3Bsb3QoY29sbGVjdGlvbl9kYXRhLCBhZXMoeSA9IHJ1bnRpbWUpKSArCiAgZ2VvbV9ib3hwbG90KCkKYGBgCkhlcmUgd2UgY2FuIHNlZSB0aGF0IG1vc3Qgb2YgdGhlIHZhbHVlcyBhcmUgY29uY2VudHJhdGVkIGZyb20gdGhlIHZhbHVlIDYwMCBvbndhcmRzLCB0aGVyZWZvcmUgYWxsIHZhbHVlcyBhYm92ZSAxMCBhcmUgY29uc2lkZXJlZCBvdXRsaWVycyBpbiB0aGUgInJ1bnRpbWVfaG91cnMiIHZhcmlhYmxlLgoKIyMgPHNwYW4gc3R5bGUgPSAiY29sb3I6ICM1MjhCOEI7Ij5QbG90dGluZyB3aXRob3V0IG91dGxpZXJzPC9zcGFuPgoKYGBge3Igd2FybmluZz1GQUxTRX0KY29sbGVjdGlvbl9kYXRhJHJ1bnRpbWVfaG91cnMgPC0gYXMubnVtZXJpYyhjb2xsZWN0aW9uX2RhdGEkcnVudGltZSkKCmZpbHRlcmVkX2RhdGEgPC0gY29sbGVjdGlvbl9kYXRhICU+JQogIGZpbHRlcihydW50aW1lX2hvdXJzIDw9IDEwKQoKI0NyZWF0ZSB0aGUgZGVuc2l0eSBwbG90IHdpdGggdGhlIGZpbHRlcmVkIGRhdGEKZmlsdGVyZWRfZGF0YSAlPiUKICBnZ3Bsb3QoYWVzKHggPSBnZW5yZTEsIGZpbGwgPSBydW50aW1lKSkgKwogIGdlb21fZGVuc2l0eShhbHBoYSA9IDAuMikgKwogIGxhYnModGl0bGUgPSAiRGVuc2l0eSBpbiBnZW5yZTEgYW5kIHJ1bnRpbWUgLSBob3VycyIsIHggPSAiZ2VucmUxIiwgeSA9ICJydW50aW1lIikgKwogIHRoZW1lKGF4aXMudGV4dC54ID0gZWxlbWVudF90ZXh0KGFuZ2xlID0gOTAsIHZqdXN0ID0gMC41LCBoanVzdCA9IDEpKQpgYGAKV2UgY2FuIHNlZSB0aGUgcmVzdWx0IGlzIHNpbWlsaWFyIGV2ZW4gd2l0aG91dGggdGhlIG91dGxpZXJzLCB0aGUgdmFyaWFibGVzIHN0aWxsIGJlaGF2aW5nIGluIGEgcmlnaHQgc2tld2VkIGZvcm0uCgojIyA8c3BhbiBzdHlsZSA9ICJjb2xvcjogIzUyOEI4QjsiPkNvcnJlbGF0aW9uPC9zcGFuPgoKIyMjIDxzcGFuIHN0eWxlID0gImNvbG9yOiAjNzlDRENEOyI+QnVkZ2V0IHRvIFJldmVudWU8L3NwYW4+CmBgYHtyfQpnZ3Bsb3QoY29weV9kYXRhLCBhZXMoeSA9IHJldmVudWUsIHggPSBDbGVhbl9idWRnZXQpKSArICBnZW9tX3BvaW50KCkgKyBnZW9tX3Ntb290aChtZXRob2QgPSAibG0iLCBzZSA9IFRSVUUpCmBgYApUaGVyZSBpcyBhIHdlYWsgcG9zaXRpdmUgbGluZWFyIGNvcnJlbGF0aW9uIGJldHdlZW4gdGhlIGJ1ZGdldCBhbmQgcmVuZW51ZSBvZiBhIG1vdmllLgoKYGBge3J9CmdncGxvdChjb3B5X2RhdGEsIAogICAgICAgYWVzKHggPSBjdXQoQ2xlYW5fYnVkZ2V0X251bWVyaWMsIGJyZWFrcyA9IDUpLCB5ID0gcmV2ZW51ZSkpICsgCiAgZ2VvbV9ib3hwbG90KCkKYGBgCldlIGNhbiB2aXN1YWxpemUgdGhlIGRpc3RyaWJ1dGlvbiBvZiByZXZlbnVlIGFjcm9zcyBkaWZmZXJlbnQgaW50ZXJ2YWxzIG9mIHRoZSBDbGVhbl9idWRnZXRfbnVtZXJpYyB2YXJpYWJsZS4gCgojIyMgPHNwYW4gc3R5bGUgPSAiY29sb3I6ICM3OUNEQ0Q7Ij5OdW1iZXIgb2YgdGl0bGUgbGV0dGVycyB0byBwcm9maXQ8L3NwYW4+CgpgYGB7cn0KIyBDcmVhdGUgbWVhc3VyZSBmb3IgY2hhcmFjdGVyIG51bWJlcgpjb3B5X2RhdGEgPC0gY29weV9kYXRhICU+JQogICAgICAgIG11dGF0ZSh0aXRsZV9udW0gPSBuY2hhcihvcmlnaW5hbF90aXRsZSkpCmBgYAoKYGBge3Igd2FybmluZz1GQUxTRX0KZ2dwbG90KGNvcHlfZGF0YSwgYWVzKHkgPSBwcm9maXQsIHggPSB0aXRsZV9udW0pKSArICBnZW9tX3BvaW50KCkgKyBzdGF0X3Ntb290aChtZXRob2QgPSAibG0iLCBmb3JtdWxhID0geSB+IHggKyBJKHheMiksIHNpemUgPSAxKQoKYGBgClRoZXJlIGlzIGEgbm9uIGV4aXN0ZW50IHJlbGF0aW9uc2hpcCBiZXR3ZWVuIGNoYXJhY3RlciBudW1iZXIgYW5kIHRoZSBwcm9maXQgb2YgYSBtb3ZpZS4gU28gdGhlIGh5cG90aGVzaXMgb2YgaXQgYmVpbmcgYSBxdWFkcmF0aWMgY29ycmVsYXRpb24gaXMgZmFsc2UuCgpgYGB7cn0KZ2dwbG90KGNvcHlfZGF0YSwgCiAgICAgICBhZXMoeCA9IHRpdGxlX251bSwgeSA9IGN1dChwcm9maXQsIGJyZWFrcyA9IDUpKSkgKyAKICBnZW9tX2JveHBsb3QoKQpgYGAKSG93ZXZlciwgdGhlIGJyZWFrcyBhbGxvd3MgdXMgdG8gc2VlIHRoYXQgZm9yIGxvd2VyIHByb2ZpdHMgdGhlcmUgaXMgYSBncmVhdGVyIG51bWJlciBvZiBvdXRsaWVycyB3aXRoIGhpZ2ggY2hhcmFjdGVyIGNvdW50cywgd2hpbGUgdGhvc2UgaW4gdGhlIGhpZ2hlc3QgcHJvZml0IGJyYWNrZXQgaGF2ZSBsb3cgSVFSIHJhbmdlIGFuZCB0aGF0IGl0IGlzIHNpdHVhdGVkIHdpdGggYSBsb3cgY2hhcmFjdGVyIGNvdW50LgoKCiMjIDxzcGFuIHN0eWxlID0gImNvbG9yOiAjNTI4QjhCOyI+Tm9ybWFsIGRpc3RyaWJ1dGlvbiBwcm9iYWJpbGl0aWVzPC9zcGFuPgpgYGB7cn0KIyBMb2FkIHBhY2thZ2VzCmxpYnJhcnkoImUxMDcxIikgI2ZvciBza2V3bmVzcyBtZWFzdXJlCmBgYAoKIyMjIDxzcGFuIHN0eWxlID0gImNvbG9yOiAjNzlDRENEOyI+UHJvZml0PC9zcGFuPgpgYGB7cn0KCmNvcHlfZGF0YSAlPiUKICBnZ3Bsb3QoYWVzKHggPSBwcm9maXQpKSArCiAgZ2VvbV9kZW5zaXR5KCkKYGBgCgoKYGBge3J9CiNMb2dhcml0aG1pYyB0cmFuc2Zvcm1hdGlvbiAKCmxvZ19kYXRhIDwtIGNvcHlfZGF0YSAlPiUKICBtdXRhdGUobG9nX3Byb2YgPSBsb2cocHJvZml0KSkKYGBgCgpgYGB7ciB3YXJuaW5nPUZBTFNFfQojIENvbnZlcnQgaW50byBhIGxlZnQtc2tld2VkIGRpc3RyaWJ1dGlvbgoKbG9nX2RhdGEgJT4lCiAgZ2dwbG90KGFlcyh4ID0gbG9nX3Byb2YpKSArCiAgZ2VvbV9kZW5zaXR5KCkKYGBgCgpgYGB7cn0KbG9nX2RhdGEgJT4lCiAgc3VtbWFyaXplKG1lYW4ocHJvZml0LCBuYS5ybSA9IFRSVUUpLAogICAgICAgICAgICBzZChwcm9maXQsIG5hLnJtID0gVFJVRSksCiAgICAgICAgICAgIElRUihwcm9maXQsIG5hLnJtID0gVFJVRSksCiAgICAgICAgICAgIHN1bShwcm9maXQpKQpgYGAKCiMjIDxzcGFuIHN0eWxlID0gImNvbG9yOiAjNTI4QjhCOyI+Q29uY2x1c2lvbjwvc3Bhbj4KVGhlIGRpc3RyaWJ1dGlvbiBvZiBwcm9maXRzIHdhcyB2aXN1YWxpemVkIHVzaW5nIGEgZGVuc2l0eSBwbG90IGFuZCBhIGxvZ2FyaXRobWljIHRyYW5zZm9ybWF0aW9uIHdhcyBhcHBsaWVkIHRvIGFjaGlldmUgYSBsZWZ0LXNrZXdlZCBkaXN0cmlidXRpb24uIFN1bW1hcnkgc3RhdGlzdGljcyB3ZXJlIGNvbXB1dGVkIGZvciB0aGUgdHJhbnNmb3JtZWQgcHJvZml0IHZhcmlhYmxlLCBpbmNsdWRpbmcgbWVhbiwgc3RhbmRhcmQgZGV2aWF0aW9uLCBpbnRlcnF1YXJ0aWxlIHJhbmdlLCBhbmQgdG90YWwgcHJvZml0IHN1bS4gUHJvYmFiaWxpdGllcyB3ZXJlIGNhbGN1bGF0ZWQgdG8gZGV0ZXJtaW5lIHRoZSBsaWtlbGlob29kIG9mIHByb2ZpdHMgZXhjZWVkaW5nIHNwZWNpZmljIHRocmVzaG9sZHMgYmFzZWQgb24gdGhlIGxvZy10cmFuc2Zvcm1lZCBwcm9maXQgZGlzdHJpYnV0aW9uLiAKClRoZSBhbmFseXNpcyBhbHNvIGludm9sdmVkIGNyZWF0aW5nIGEgbmV3IGNvbHVtbiBjYWxsZWQgJ3Byb2ZpdCcgYW5kIGNhbGN1bGF0aW5nIHN1bW1hcnkgc3RhdGlzdGljcyB3aXRoaW4gcmV2ZW51ZSBncm91cHMuIEEgYmluYXJ5IGNvbHVtbiB3YXMgaW50cm9kdWNlZCB0byBpbmRpY2F0ZSB3aGV0aGVyIGEgbW92aWUncyBwcm9kdWN0aW9uIGNvdW50cnkgZmFsbHMgd2l0aGluIE5vcnRoIEFtZXJpY2EsIGFuZCBzdW1tYXJ5IHN0YXRpc3RpY3Mgd2VyZSBjb21wdXRlZCBiYXNlZCBvbiBtb3ZpZSBnZW9ncmFwaGljYWwgb3JpZ2luLiBUaGUgZXhwbG9yYXRpb24gb2YgcnVudGltZSBjaGFyYWN0ZXJpc3RpY3MgaW52b2x2ZWQgZGVuc2l0eSBwbG90cyBhbmQgYm94cGxvdHMuIEEgc2NhdHRlciBwbG90IHdhcyB1c2VkIHRvIGV4YW1pbmUgdGhlIGNvcnJlbGF0aW9uIGJldHdlZW4gYnVkZ2V0IGFuZCByZXZlbnVlLCBhbmQgYm94cGxvdCBhbmFseXNpcyB3YXMgY29uZHVjdGVkIHRvIGNvbXBhcmUgcmV2ZW51ZSBkaXN0cmlidXRpb25zIGFjcm9zcyBidWRnZXQgY2F0ZWdvcmllcy4gVGhlIHJlbGF0aW9uc2hpcCBiZXR3ZWVuIHRoZSBudW1iZXIgb2YgdGl0bGUgbGV0dGVycyBhbmQgbW92aWUgcHJvZml0IHdhcyBleHBsb3JlZCB1c2luZyBzY2F0dGVyIHBsb3RzIGFuZCBib3hwbG90cy4gQSBmYWNldGVkIHNjYXR0ZXIgcGxvdCB3YXMgdXNlZCB0byBhbmFseXplIHRoZSByZWxhdGlvbnNoaXBzIGJldHdlZW4gcHJvZml0LCB0aXRsZSBsZXR0ZXJzLCBhbmQgcmV2ZW51ZSBicmFja2V0cy4gIAoKVGhlIGRpc3RyaWJ1dGlvbiBvZiBwcm9maXRzIHdhcyB2aXN1YWxpemVkIHVzaW5nIGEgZGVuc2l0eSBwbG90IGFuZCBzdW1tYXJ5IHN0YXRpc3RpY3Mgd2VyZSBjb21wdXRlZCB0byBnYWluIGEgZGVlcGVyIHVuZGVyc3RhbmRpbmcgb2YgaXRzIGRpc3RyaWJ1dGlvbiBjaGFyYWN0ZXJpc3RpY3MuIEZpbmFsbHksIHByb2JhYmlsaXRpZXMgd2VyZSBjYWxjdWxhdGVkIHRvIGRldGVybWluZSB0aGUgbGlrZWxpaG9vZCBvZiBwcm9maXRzIGV4Y2VlZGluZyBzcGVjaWZpYyB0aHJlc2hvbGRzLgoKT3ZlcmFsbCwgdGhlc2UgYW5hbHlzZXMgcHJvdmlkZSBpbnNpZ2h0cyBpbnRvIHRoZSBkaXN0cmlidXRpb24sIGNlbnRyYWwgdGVuZGVuY3ksIHNoYXBlLCBvdXRsaWVycywgY29ycmVsYXRpb25zLCBhbmQgcHJvYmFiaWxpdGllcyByZWxhdGVkIHRvIHZhcmlvdXMgdmFyaWFibGVzIGluIHRoZSBtb3ZpZSBkYXRhc2V0LCBoZWxwaW5nIHRvIHVuZGVyc3RhbmQga2V5IHBhdHRlcm5zIGFuZCByZWxhdGlvbnNoaXBzIHdpdGhpbiB0aGUgZGF0YS4KCiMjIDxzcGFuIHN0eWxlID0gImNvbG9yOiAjNTI4QjhCOyI+TGluZWFyIHJlZ3Jlc3Npb248L3NwYW4+CmBgYHtyfQojIENvbnZlcnQgdmFyaWFibGVzIGludG8gY29ycmVjdCBvbmVzCmNvbGxlY3Rpb25fZGF0YSRyZXZlbnVlIDwtIGFzLm51bWVyaWMoYXMuY2hhcmFjdGVyKGNvbGxlY3Rpb25fZGF0YSRyZXZlbnVlKSkgCgpjb2xsZWN0aW9uX2RhdGEkcmVsZWFzZV9kYXRlIDwtIGFzLkRhdGUoYXMuY2hhcmFjdGVyKGNvbGxlY3Rpb25fZGF0YSRyZWxlYXNlX2RhdGUpKQoKY29sbGVjdGlvbl9kYXRhJHJ1bnRpbWUgPC0gYXMubnVtZXJpYyhhcy5jaGFyYWN0ZXIoY29sbGVjdGlvbl9kYXRhJHJ1bnRpbWUpKQoKY29sbGVjdGlvbl9kYXRhJHZvdGVfYXZlcmFnZSA8LSBhcy5udW1lcmljKGFzLmNoYXJhY3Rlcihjb2xsZWN0aW9uX2RhdGEkdm90ZV9hdmVyYWdlKSkKCmNvbGxlY3Rpb25fZGF0YSR2b3RlX2NvdW50IDwtIGFzLm51bWVyaWMoYXMuY2hhcmFjdGVyKGNvbGxlY3Rpb25fZGF0YSR2b3RlX2NvdW50KSkKCmNvbGxlY3Rpb25fZGF0YSRyb3VuZF9wb3B1bGFyaXR5IDwtIGFzLm51bWVyaWMoYXMuY2hhcmFjdGVyKGNvbGxlY3Rpb25fZGF0YSRyb3VuZF9wb3B1bGFyaXR5KSkKCmNvbGxlY3Rpb25fZGF0YSRudW1fc3Bva2VuX2xhbmd1YWdlcyA8LSBhcy5udW1lcmljKGFzLmNoYXJhY3Rlcihjb2xsZWN0aW9uX2RhdGEkbnVtX3Nwb2tlbl9sYW5ndWFnZXMpKQoKY29sbGVjdGlvbl9kYXRhJG51bV9nZW5yZXMgPC0gYXMubnVtZXJpYyhhcy5jaGFyYWN0ZXIoY29sbGVjdGlvbl9kYXRhJG51bV9nZW5yZXMpKQoKY29sbGVjdGlvbl9kYXRhJENsZWFuX2J1ZGdldCA8LSBhcy5udW1lcmljKGFzLmNoYXJhY3Rlcihjb2xsZWN0aW9uX2RhdGEkQ2xlYW5fYnVkZ2V0KSkKYGBgCgpgYGB7cn0KcmVncmVzc2lvbiA8LSBsbShyZXZlbnVlIH4gIHJlbGVhc2VfZGF0ZSArIHJ1bnRpbWUgKyB2b3RlX2F2ZXJhZ2UgKyB2b3RlX2NvdW50ICsgcm91bmRfcG9wdWxhcml0eSArIG51bV9zcG9rZW5fbGFuZ3VhZ2VzLCBkYXRhID0gY29sbGVjdGlvbl9kYXRhKQpzdW1tYXJ5KHJlZ3Jlc3Npb24pCmBgYAoKVGhlIHJlc3VsdHMgZmlyc3Qgc2hvdyB0aGUgdmFyaWFibGVzIHRoYXQgbW9zdCBhZmZlY3QgdGhlIG9idGFpbmluZyBvZiByZXZlbnVlIGluIGZpbG1zLiBUaGVzZSB2YXJpYWJsZXMgYXJlOgorIFJ1bnRpbWUKKyBWb3RlIEF2ZXJhZ2UKKyBWb3RlIENvdW50CitSb3VuZCBQb3B1bGFyaXR5CgpJbiBhZGRpdGlvbiwgd2Ugb2J0YWluZWQgYW4gYWRqdXN0ZWQgUiBzcXVhcmVkIHdpdGggYSB2YWx1ZSBvZiAwLjY2MzgsIGluZGljYXRpbmcgdGhhdCBhcHByb3hpbWF0ZWx5IDY2LjM4JSBvZiB0aGUgdmFyaWFiaWxpdHkgaW4gdGhlIGRlcGVuZGVudCB2YXJpYWJsZSwgaW4gdGhpcyBjYXNlIHRoZSByZXZlbnVlIHZhcmlhYmxlLCBjYW4gYmUgZXhwbGFpbmVkIGJ5IHRoZSBpbmRlcGVuZGVudCB2YXJpYWJsZXMgaW5jbHVkZWQgaW4gdGhlIHJlZ3Jlc3Npb24gbW9kZWwsIGVzcGVjaWFsbHkgYnkgdGhlIHZhcmlhYmxlcyBJIG1lbnRpb25lZCBiZWZvcmUuCgpgYGB7cn0KIyBBZGp1c3QgdGhlIHJlZ3Jlc3Npb24gZm9yIGdyZWF0ZXIgcHJlY2lzaW9uCmFkanVzdGVkX3JlZ3Jlc3Npb24gPC0gbG0ocmV2ZW51ZSB+IHJ1bnRpbWUgKyB2b3RlX2F2ZXJhZ2UgKyB2b3RlX2NvdW50ICsgcm91bmRfcG9wdWxhcml0eSwgZGF0YSA9IGNvbGxlY3Rpb25fZGF0YSkKc3VtbWFyeShhZGp1c3RlZF9yZWdyZXNzaW9uKQpgYGAKCmBgYHtyfQojIFByZWRpY3RpdmUgbW9kZWwKcHJlZGljdGl2ZV9tb2RlbCA8LSBkYXRhLmZyYW1lKHJ1bnRpbWU9OTQsIHZvdGVfYXZlcmFnZT02LCB2b3RlX2NvdW50PTExMCwgcm91bmRfcG9wdWxhcml0eT0zKQpwcmVkaWN0KGFkanVzdGVkX3JlZ3Jlc3Npb24sIHByZWRpY3RpdmVfbW9kZWwpCmBgYAoKVGhlIG1vZGVsIGlzIHVzaW5nIHRoZSBpbnB1dCB2YWx1ZXMgb2YgInJ1bnRpbWUiLCAidm90ZSBhdmVyYWdlIiwgInZvdGVjb3VudCIsIGFuZCAicm91bmQgcG9wdWxhcml0eSIgdG8gcHJlZGljdCB0aGUgcmV2ZW51ZSBvZiBhIG1vdmllLlRoZSBwcmVkaWN0ZWQgcmV2ZW51ZSBvZiBhcHByb3hpbWF0ZWx5ICQxMCw5ODYsMDc1IGlzIHdoYXQgdGhlIG1vZGVsIGVzdGltYXRlcyBiYXNlZCBvbiB0aGVzZSBpbnB1dCB2YWx1ZXMuCgpUaGlzIHNjZW5hcmlvIHdhcyBnZW5lcmF0ZWQgd2l0aCBhbiBhY2N1cmFjeSBvZiAqNjYuMzglKiBhY2NvcmRpbmcgdG8gdGhlIGFkanVzdGVkIFIgc3F1YXJlZCBhbmQgYSByZWxpYWJpbGl0eSBvZiA5NSUuCgojIDxzcGFuIHN0eWxlID0gImNvbG9yOiAjNkU4QjNEOyI+KkluZGl2aWR1YWwgZnVuY3Rpb25zKjwvc3Bhbj4KCiMjIDxzcGFuIHN0eWxlID0gImNvbG9yOiAjNTI4QjhCOyI+Q29ycmVsYXRpb24gYmV0d2VlbiBSdW50aW1lIGFuZCBSZXZlbnVlPC9zcGFuPgoKYGBge3J9CiMgTG9hZCBuZWNlc3NhcnkgbGlicmFyaWVzCmxpYnJhcnkoZ2dwbG90MikKCmNvbG5hbWVzKGNvbGxlY3Rpb25fZGF0YSkKCiMgUGxvdHRpbmcgdGhlIGNvcnJlbGF0aW9uIGJldHdlZW4gcnVudGltZSBhbmQgcmV2ZW51ZQpnZ3Bsb3QoY29sbGVjdGlvbl9kYXRhLCBhZXMoeCA9IHJ1bnRpbWUsIHkgPSByZXZlbnVlKSkgKwogIGdlb21fcG9pbnQoKSArCiAgZ2VvbV9zbW9vdGgobWV0aG9kID0gImxtIiwgc2UgPSBGQUxTRSkgKwogIGxhYnModGl0bGUgPSAiQ29ycmVsYXRpb24gYmV0d2VlbiBSdW50aW1lIGFuZCBSZXZlbnVlIiwKICAgICAgIHggPSAiUnVudGltZSIsCiAgICAgICB5ID0gIlJldmVudWUiKSArCiAgdGhlbWVfbWluaW1hbCgpCmBgYAoKU3RhdGlzdGljYWwgYW5hbHlzaXMgdGhhdCBleHBsb3JlcyB0aGUgcmVsYXRpb25zaGlwIGJldHdlZW4gY2VydGFpbiB2YXJpYWJsZXMgYW5kIG1vdmllIHN1Y2Nlc3MsIGluIHRoaXMgY2FzZSBtb3ZpZXMgcnVudGltZXMgYW5kIHRoZSByZXZlbnVlIGRvbmUuIFRoaXMgZ3JhcGggc2hvd3MgYSBwb3NpdGl2ZSBjb3JyZWxhdGlvbiBpbmRpY2F0aW5nIHRoYXQgbG9uZ2VyIG1vdmllcyB0ZW5kIHRvIGdlbmVyYXRlIGhpZ2hlciByZXZlbnVlLiAKCiMjIDxzcGFuIHN0eWxlID0gImNvbG9yOiAjNTI4QjhCOyI+YXJ1bGVzIGFuZCBhcHJpb3JpPC9zcGFuPgoKYGBge3J9CiMgTG9hZCBuZWNlc3NhcnkgbGlicmFyaWVzCmxpYnJhcnkoYXJ1bGVzKQoKIyBEYXRhIHByZXBhcmF0aW9uCiMgQXNzdW1lIHdlIGhhdmUgYSBtb3ZpZSBkYXRhc2V0IHdpdGggYXR0cmlidXRlcyBpbmNsdWRpbmcgcmVsZWFzZV9kYXRlIGFuZCBzdWNjZXNzIG1ldHJpY3MgKGUuZy4sIHJldmVudWUpCiMgQ29udmVydCByZWxlYXNlX2RhdGUgaW50byBjYXRlZ29yaWNhbCB2YXJpYWJsZXMgcmVwcmVzZW50aW5nIHNlYXNvbnMgb3IgaG9saWRheXMKIyBGb3IgZXhhbXBsZSwgY3JlYXRlIGJpbmFyeSB2YXJpYWJsZXMgZm9yIHNlYXNvbnM6IFNwcmluZywgU3VtbWVyLCBGYWxsLCBXaW50ZXIKCiMgRnJlcXVlbnQgaXRlbXNldCBnZW5lcmF0aW9uCmZyZXF1ZW50X2l0ZW1zZXRzIDwtIGFwcmlvcmkoY29weV9kYXRhLCBwYXJhbWV0ZXIgPSBsaXN0KHN1cHBvcnQgPSAwLjAxLCBtaW5sZW4gPSAyKSkKCiMgUnVsZSBnZW5lcmF0aW9uCmFzc29jaWF0aW9uX3J1bGVzIDwtIGFwcmlvcmkoY29weV9kYXRhLCBwYXJhbWV0ZXIgPSBsaXN0KHN1cHBvcnQgPSAwLjAxLCBjb25maWRlbmNlID0gMC41KSkKCiMgUnVsZSBldmFsdWF0aW9uCnN1bW1hcnkoYXNzb2NpYXRpb25fcnVsZXMpCgpgYGAKCkFzc29jaWF0aW9uIFJ1bGUgTWluaW5nIGlzIGEgdGVjaG5pcXVlIHRoYXQgaGVscHMgdXMgZmluZCB0aGUgcGF0dGVybnMgaW4gb3VyIG1vdmllIGRhdGFzZXQgdGhhdCBtaWdodCBjb250cmlidXRlIHRvIGEgbW92aWUncyBzdWNjZXNzLiBUaGlzIHRlY2huaXF1ZSBmaW5kcyByZWxhdGlvbnNoaXAgYW1vbmcgbGFyZ2Ugc2V0cyBvZiBkYXRhIGl0ZW1zLiBGb3IgdGhpcyBwcm9ibGVtIHNldHVwLCB3ZSB1c2UgdGhpcyB0ZWNobmlxdWUgdG8gdW5jb3ZlciBwYXR0ZXJucyBpbiByZWxlYXNlIGRhdGVzLCBzdWNoIGFzIHNlYXNvbnMgb3IgaG9saWRheXMsIHRoYXQgYXJlIGFzc29jaWF0ZWQgd2l0aCBzdWNjZXNzZnVsIG1vdmllIHJlbGVhc2VzLiAKVXNpbmcgdGhlIGFydWxlcyBwYWNrYWdlIGluIFIgdG8gcGVyZm9ybSBhc3NvY2lhdGlvbiBydWxlIG1pbmluZyBvbiBvdXIgbW92aWUgZGF0YXNldCBhbmQgdGhlIGFwcmlvcmkgZnVuY3Rpb24gZ2VuZXJhdGUgZnJlcXVlbnQgaXRlbXNldHMgZnJvbSBvdXIgZGF0YXNldCwgdGhlbiBjcmVhdGUgYSBzdW1tYXJ5IHRvIHNlZSB0aGUgb3V0Y29tZXMuIAoKIyMgPHNwYW4gc3R5bGUgPSAiY29sb3I6ICM1MjhCOEI7Ij5MdWJyaWRhdGU8L3NwYW4+CgpgYGB7cn0KIyBMb2FkIG5lY2Vzc2FyeSBsaWJyYXJpZXMKbGlicmFyeShsdWJyaWRhdGUpCgojIEFzc3VtZSAnY29sbGVjdGlvbl9kYXRhJyBpcyB5b3VyIG1vdmllIGRhdGFzZXQgd2l0aCBhICdyZWxlYXNlX2RhdGUnIGNvbHVtbgoKIyBDb252ZXJ0ICdyZWxlYXNlX2RhdGUnIHRvIERhdGUgZm9ybWF0CmNvbGxlY3Rpb25fZGF0YSRyZWxlYXNlX2RhdGUgPC0gYXMuRGF0ZShjb2xsZWN0aW9uX2RhdGEkcmVsZWFzZV9kYXRlKQoKIyBFeHRyYWN0IG1vbnRoIGZyb20gcmVsZWFzZV9kYXRlCmNvbGxlY3Rpb25fZGF0YSRyZWxlYXNlX21vbnRoIDwtIG1vbnRoKGNvbGxlY3Rpb25fZGF0YSRyZWxlYXNlX2RhdGUpCgojIENyZWF0ZSBiaW5hcnkgdmFyaWFibGVzIGZvciBzZWFzb25zCmNvbGxlY3Rpb25fZGF0YSRXaW50ZXIgPC0gaWZlbHNlKGNvbGxlY3Rpb25fZGF0YSRyZWxlYXNlX21vbnRoICVpbiUgYygxMiwgMSwgMiksIDEsIDApCmNvbGxlY3Rpb25fZGF0YSRTcHJpbmcgPC0gaWZlbHNlKGNvbGxlY3Rpb25fZGF0YSRyZWxlYXNlX21vbnRoICVpbiUgYygzLCA0LCA1KSwgMSwgMCkKY29sbGVjdGlvbl9kYXRhJFN1bW1lciA8LSBpZmVsc2UoY29sbGVjdGlvbl9kYXRhJHJlbGVhc2VfbW9udGggJWluJSBjKDYsIDcsIDgpLCAxLCAwKQpjb2xsZWN0aW9uX2RhdGEkRmFsbCA8LSBpZmVsc2UoY29sbGVjdGlvbl9kYXRhJHJlbGVhc2VfbW9udGggJWluJSBjKDksIDEwLCAxMSksIDEsIDApCgojIENoZWNrIHRoZSBmaXJzdCBmZXcgcm93cyB0byB2ZXJpZnkgdGhlIG5ldyB2YXJpYWJsZXMKaGVhZChjb2xsZWN0aW9uX2RhdGFbLCBjKCJyZWxlYXNlX2RhdGUiLCAicmVsZWFzZV9tb250aCIsICJXaW50ZXIiLCAiU3ByaW5nIiwgIlN1bW1lciIsICJGYWxsIildKQoKYGBgCgpGaW5hbGx5IHVzaW5nIHRoZSBsdWJyaWRhdGUgbGlicmFyeSB3ZSBjcmVhdGVkIHZhcmlhYmxlcyB0byBnaXZlIGVhY2ggbW92aWUncyByZWxlYXNlIGRhdGUgYSBzZWFzb24gb2YgdGhlIHllYXIsIGFuZCBzZWUgd2hldGhlciBhIG1vdmllIHdhcyByZWxlYXNlZCBpbiBhIHBhcnRpY3VsYXIgc2Vhc29uIG9yIG5vdC4gCgojIyA8c3BhbiBzdHlsZSA9ICJjb2xvcjogIzUyOEI4QjsiPlJlZmVyZW5jZXM8L3NwYW4+CkdlZWtzZm9yR2Vla3MuICgyMDE4LCBTZXB0ZW1iZXIgMTMpLiBBc3NvY2lhdGlvbiBSdWxlLiBHZWVrc2ZvckdlZWtzOyBHZWVrc2ZvckdlZWtzLiBodHRwczovL3d3dy5nZWVrc2ZvcmdlZWtzLm9yZy9hc3NvY2lhdGlvbi1ydWxlLw==

Evidence

Ana Paula Alvear Cantú

2024-05-02

Evidence 1. R Markdown File

Progress Problem Setup 1

Calling libraries

Read file

Cleaning Data

Treating NA’s

Treating NA’s by column

Runtime

Revenue

Vote Count

Vote Avarage

Reasoning

Treating Duplicates

Eliminating duplicates

Reasoning

Separating Text by column

Genres

Production Companies

Production Countries

Spoken Language

Belongs to Collection

Runtime

Revenue

Vote Count

Vote Avarage

Progress Problem Setup 2

Factor Levels

Values that don’t belong in the factor

Checking categories / Collapsing categories

Cleaning of text data

Conclusion

Progress Problem Setup 3

Unit Conversion

Conclusion

Progress Problem Setup 4

Tables with 1 or 2 variables 4

Revenue

Production Companies

GGPlot Structures

Density Plot

Correlation Plot

Bar Graph

Tables and Graphs for Categorical and Numerical variables

Frequency table for a categorical variable

Bar chart for genre frequency

Analyzing Multiple Variables Together

Stacked bar chart for genre vs revenue

Word Clouds

Titles

Progress Problem Setup 5

Descriptive Measures

Shape Measures

Outliers

Plotting without outliers

Correlation

Budget to Revenue

Number of title letters to profit

Normal distribution probabilities

Profit

Conclusion

Linear regression

Individual functions

Correlation between Runtime and Revenue

arules and apriori

Lubridate

References