Descriptive Statistics

Data

In our example this week, we are going to use the fake data - about real estates in Wroclaw - prices by districts, size of apartments and many more.

Preprocessing

As you can see, not all formats of our variables are adapted. We need to prepare appropriate formats of our variables according to their measurement scale and future application.

apartments$district<-as.factor(apartments$district)
apartments$building_type<-as.factor(apartments$building_type)
apartments$rooms<-factor(apartments$rooms,ordered=TRUE)
attach(apartments)
apartments$price_PLN<-as.numeric(apartments$price_PLN)
apartments$price_EUR<-as.numeric(apartments$price_EUR)

Frequency Tables

In the first step of our analysis, we will group our data into a simple frequency table.

First, let’s look at the distribution of housing prices in our sample and verify tabular validity using the TAI measure:

Ok, it looks quite ugly, so let’s wrap it up using the ‘kable’ package:

Apartments in Wroclaw - prices in kPLN

	x	Freq	Percent	Valid Percent	Cumulative Percent
Valid	350-450 kPLN	9	4.5	4.5	4.5
	450-550 kPLN	21	10.5	10.5	15.0
	550-650 kPLN	33	16.5	16.5	31.5
	650-750 kPLN	36	18.0	18.0	49.5
	750-850 kPLN	31	15.5	15.5	65.0
	850-950 kPLN	36	18.0	18.0	83.0
	950-1050 kPLN	21	10.5	10.5	93.5
	1050-1150 kPLN	10	5.0	5.0	98.5
	1150-1250 kPLN	2	1.0	1.0	99.5
	1250-1350 kPLN	1	0.5	0.5	100.0
	Total	200	100.0	100.0
Missing	<blank>	0	0.0
	<NA>	0	0.0
	Total	200	100.0

##        # classes  Goodness of fit Tabular accuracy 
##       10.0000000        0.9780872        0.8508467

As we can see - the TAI index is quite high. 0.85 means that we can accept the proposed construction of the frequency table.

Basic plots

In this section, we should represent our data using basic (pre-installed in R) graphics. Select the most appropriate graphs depending on the scale of the selected variables. Explore the heterogeneity of the distribution by presenting the data by group (e.g., by neighborhood, building type, etc.). Don’t forget about main titles, labels and legends. Read more about graphical parameters here.

Note that the echo = FALSE parameter has been added to the code snippet to prevent printing the R code that generated the graph.

ggplot2 plots

Now, let’s use the ggplot2 and ggpubr libraries to plot.

Ggplot2 allows you to show the average value for each group using the stat_summary() function. You no longer need to calculate average values before creating a graph!

RainCloud Plot

Faceting

Faceting generates small multiples, each showing a different subset of the data. They are a powerful tool for exploratory data analysis: you can quickly compare patterns in different parts of the data and see if they are the same or different. Read more here.

Univariate Statistics

Before automatically reporting the full summary table of descriptive statistics, this time your goal is to measure the central tendency of the price distribution. Compare the mean, median, and mode along with positional measures - quantiles - by district and building type or number of rooms in the apartment.

    mean(price_PLN)

## [1] 760035

    median(price_PLN)

## [1] 755719.5

    sd(price_PLN) #standard deviation

## [1] 186099.8

    var(price_PLN) #variance

## [1] 34633125960

    coeff_var<-sd(price_PLN)/mean(price_PLN) #coefficient of variability %
    coeff_var

## [1] 0.2448568

    IQR(price_PLN)# difference between quartiles =Q3-Q1

##      75% 
## 282686.5

    sx<-IQR(price_PLN)/2  #interquartile deviation
    coeff_varx<-sx/median(price_PLN) #IQR coefficient of variability %
    coeff_varx

##       75% 
## 0.1870314

    min(price_PLN)

## [1] 359769

    max(price_PLN)

## [1] 1277691

    quantile(price_PLN,probs=c(0,0.1,0.25,0.5,0.75,0.95,1),na.rm=TRUE)

##        0%       10%       25%       50%       75%       95%      100% 
##  359769.0  518806.8  619073.8  755719.5  901760.2 1054250.8 1277691.0

Ok, we have calculated all of the basic summary statistics above. Let’s wrap them up together now.

rooms	boxplot	histogram	line1	line2	points1
1
2
3
4

Summary tables

Ok, now we will finally summarize the basic measures of central tendency for prices by district/building type using the ‘kable’ package. Feel free to customize your final report. See some hints here.

gtsummary

We can calculate easily descriptive statistics also using gtsummary package:

apartments %>%
  select(price_PLN,rooms) %>%
  tbl_summary(label= price_PLN ~ "Price",digits=c(price_PLN)~2,by=rooms,type = all_continuous() ~ "continuous2", statistic = all_continuous() ~ c("{N_nonmiss}", "{median} ({p25}, {p75})", "{min}, {max}"),missing = "no")

Characteristic	1, N = 44	2, N = 50	3, N = 58	4, N = 48
Price
N	44.00	50.00	58.00	48.00
Median (IQR)	520,507.00 (479,684.75, 555,024.75)	677,260.00 (634,757.25, 717,728.50)	846,303.50 (769,683.75, 901,078.75)	964,338.50 (909,371.50, 1,050,976.75)
Range	359,769.00, 657,146.00	590,286.00, 888,634.00	632,770.00, 965,829.00	736,669.00, 1,277,691.00

dfSummary

dfSummary() creates a summary table with statistics, frequencies and graphs for all variables in a data frame. The information displayed is type-specific (character, factor, numeric, date) and also varies according to the number of distinct values.

When using dfSummary() in R Markdown documents, it is generally a good idea to exclude a column or two to avoid margin overflow. Since the Valid and Missing columns are redundant, we can drop either one of them.

dfSummary(apartments,
          plain.ascii  = FALSE, 
          style        = "grid", 
          graph.magnif = 0.75, 
          valid.col    = FALSE,
          tmp.img.dir  = "/tmp")

## temporary images written to 'C:\tmp'

Data Frame Summary

apartments

Dimensions: 200 x 6
Duplicates: 0

No	Variable	Stats / Values	Freqs (% of Valid)
1	price_PLN [numeric]	Mean (sd) : 760035 (186099.8) min < med < max: 359769 < 755719.5 < 1277691 IQR (CV) : 282686.5 (0.2)	200 distinct values
2	price_EUR [numeric]	Mean (sd) : 175934 (43078.6) min < med < max: 83280 < 174935 < 295762 IQR (CV) : 65436.2 (0.2)	200 distinct values
3	rooms [ordered, factor]	1. 1 2. 2 3. 3 4. 4	44 (22.0%) 50 (25.0%) 58 (29.0%) 48 (24.0%)
4	size [numeric]	Mean (sd) : 46.2 (20.1) min < med < max: 17 < 43.7 < 87.7 IQR (CV) : 30.2 (0.4)	162 distinct values
5	district [factor]	1. Biskupin 2. Krzyki 3. Srodmiescie	65 (32.5%) 79 (39.5%) 56 (28.0%)
6	building_type [factor]	1. kamienica 2. niski blok 3. wiezowiec	61 (30.5%) 63 (31.5%) 76 (38.0%)

To produce optimal results, summarytools has its own version of the base by() function. It’s called stby(), and we use it exactly as we would by():

(stats_by_rooms <- stby(data      = apartments, INDICES   = apartments$rooms, FUN       = descr, stats     = "common", transpose = TRUE))

## Non-numerical variable(s) ignored: rooms, district, building_type

Descriptive Statistics
apartments
Group: rooms = 1
N: 44

	Mean	Std.Dev	Min	Median	Max	N.Valid	Pct.Valid
price_EUR	119332.95	15497.90	83280.00	120488.00	152117.00	44.00	100.00
price_PLN	515518.05	66951.03	359769.00	520507.00	657146.00	44.00	100.00
size	19.28	1.46	17.00	19.10	21.90	44.00	100.00

Group: rooms = 2
N: 50

	Mean	Std.Dev	Min	Median	Max	N.Valid	Pct.Valid
price_EUR	158233.22	15063.13	136640.00	156773.00	205702.00	50.00	100.00
price_PLN	683567.70	65072.66	590286.00	677260.00	888634.00	50.00	100.00
size	36.80	4.46	29.60	35.95	43.70	50.00	100.00

Group: rooms = 3
N: 58

	Mean	Std.Dev	Min	Median	Max	N.Valid	Pct.Valid
price_EUR	192987.55	20125.88	146475.00	195904.00	223572.00	58.00	100.00
price_PLN	833706.02	86943.90	632770.00	846303.50	965829.00	58.00	100.00
size	53.33	7.21	41.20	53.45	65.20	58.00	100.00

Group: rooms = 4
N: 48

	Mean	Std.Dev	Min	Median	Max	N.Valid	Pct.Valid
price_EUR	225650.42	26347.03	170525.00	223226.50	295762.00	48.00	100.00
price_PLN	974809.96	113819.21	736669.00	964338.50	1277691.00	48.00	100.00
size	72.05	10.18	53.30	70.85	87.70	48.00	100.00

Tidy Tables

When generating freq() or descr() tables, it is possible to turn the results into “tidy” tables with the use of the tb() function (think of tb as a diminutive for tibble). For example:

apartments %>%
  descr(stats = "common") %>%
  tb()

## # A tibble: 3 × 8
##   variable      mean       sd    min      med       max n.valid pct.valid
##   <chr>        <dbl>    <dbl>  <dbl>    <dbl>     <dbl>   <dbl>     <dbl>
## 1 price_EUR 175934.   43079.   83280 174935    295762       200       100
## 2 price_PLN 760035.  186100.  359769 755720.  1277691       200       100
## 3 size          46.2     20.1     17     43.7      87.7     200       100

Here are some examples showing how lists created using stby() or group_by() can be transformed into tidy tibbles.

grouped_descr <- stby(data    = apartments,INDICES = apartments$rooms, FUN     = descr, stats   = "common")

grouped_descr %>% tb()

## # A tibble: 12 × 9
##    rooms variable      mean        sd      min      med    max n.valid pct.valid
##    <fct> <chr>        <dbl>     <dbl>    <dbl>    <dbl>  <dbl>   <dbl>     <dbl>
##  1 1     price_EUR 119333.   15498.    83280   120488   1.52e5      44       100
##  2 1     price_PLN 515518.   66951.   359769   520507   6.57e5      44       100
##  3 1     size          19.3      1.46     17       19.1 2.19e1      44       100
##  4 2     price_EUR 158233.   15063.   136640   156773   2.06e5      50       100
##  5 2     price_PLN 683568.   65073.   590286   677260   8.89e5      50       100
##  6 2     size          36.8      4.46     29.6     36.0 4.37e1      50       100
##  7 3     price_EUR 192988.   20126.   146475   195904   2.24e5      58       100
##  8 3     price_PLN 833706.   86944.   632770   846304.  9.66e5      58       100
##  9 3     size          53.3      7.21     41.2     53.4 6.52e1      58       100
## 10 4     price_EUR 225650.   26347.   170525   223226.  2.96e5      48       100
## 11 4     price_PLN 974810.  113819.   736669   964338.  1.28e6      48       100
## 12 4     size          72.0     10.2      53.3     70.8 8.77e1      48       100

A Bridge to Other Packages

stby(data    = apartments, 
     INDICES = apartments$rooms, 
     FUN     = descr, 
     stats   = "fivenum") %>%
  tb(order = 3) %>%
  kable(format = "html", digits = 2) %>%
  collapse_rows(columns = 1, valign = "top")

variable	rooms	min	q1	med	q3	max
price_EUR	1	83280.0	110881.0	120488.00	128568.00	152117.0
	2	136640.0	146754.0	156773.00	166259.00	205702.0
	3	146475.0	177478.0	195904.00	208599.00	223572.0
	4	170525.0	209827.5	223226.50	243300.00	295762.0
price_PLN	1	359769.0	479005.5	520507.00	555411.50	657146.0
	2	590286.0	633978.0	677260.00	718237.00	888634.0
	3	632770.0	766707.0	846303.50	901149.00	965829.0
	4	736669.0	906455.0	964338.50	1051055.50	1277691.0
size	1	17.0	18.1	19.10	20.60	21.9
	2	29.6	32.9	35.95	40.50	43.7
	3	41.2	47.9	53.45	59.70	65.2
	4	53.3	64.2	70.85	82.15	87.7

Your turn!

Your task this week is to: prepare your own descriptive analysis for the “CreditCard” dataset (AER package). It is a cross-sectional dataframe on the credit history for a sample of applicants for a type of credit card.

Are the yearly incomes (in USD 10,000), credit card expenditures, age, ratio of monthly credit card expenditure to yearly income - significantly different for applicants for customers with different credit risk (“card” variable - factor)?

Prepare a professional data visualizations, descriptive statistics’ tables and interpret them.

# this analysis shows us that credit risk differs in terms of age, income etc. for example most the highest density of credit risk is within 25 to 35 years. By looking at these graphs we can make a conclusions.

library(AER)
library(dplyr)
library(scales)

## 
## Dołączanie pakietu: 'scales'

## Następujące obiekty zostały zakryte z 'package:psych':
## 
##     alpha, rescale

## Następujący obiekt został zakryty z 'package:desctable':
## 
##     percent

## Następujący obiekt został zakryty z 'package:purrr':
## 
##     discard

## Następujący obiekt został zakryty z 'package:readr':
## 
##     col_factor

## Następujący obiekt został zakryty z 'package:arsenal':
## 
##     ordinal

library(ggplot2)
library(ggdist)

data(CreditCard)

head(CreditCard)

##   card reports      age income       share expenditure owner selfemp dependents
## 1  yes       0 37.66667 4.5200 0.033269910  124.983300   yes      no          3
## 2  yes       0 33.25000 2.4200 0.005216942    9.854167    no      no          3
## 3  yes       0 33.66667 4.5000 0.004155556   15.000000   yes      no          4
## 4  yes       0 30.50000 2.5400 0.065213780  137.869200    no      no          0
## 5  yes       0 32.16667 9.7867 0.067050590  546.503300   yes      no          2
## 6  yes       0 23.25000 2.5000 0.044438400   91.996670    no      no          0
##   months majorcards active
## 1     54          1     12
## 2     34          1     13
## 3     58          1      5
## 4     25          1      7
## 5     64          1      5
## 6     54          1      1

summary(CreditCard)

##   card         reports             age              income      
##  no : 296   Min.   : 0.0000   Min.   : 0.1667   Min.   : 0.210  
##  yes:1023   1st Qu.: 0.0000   1st Qu.:25.4167   1st Qu.: 2.244  
##             Median : 0.0000   Median :31.2500   Median : 2.900  
##             Mean   : 0.4564   Mean   :33.2131   Mean   : 3.365  
##             3rd Qu.: 0.0000   3rd Qu.:39.4167   3rd Qu.: 4.000  
##             Max.   :14.0000   Max.   :83.5000   Max.   :13.500  
##      share            expenditure       owner     selfemp      dependents    
##  Min.   :0.0001091   Min.   :   0.000   no :738   no :1228   Min.   :0.0000  
##  1st Qu.:0.0023159   1st Qu.:   4.583   yes:581   yes:  91   1st Qu.:0.0000  
##  Median :0.0388272   Median : 101.298                        Median :1.0000  
##  Mean   :0.0687322   Mean   : 185.057                        Mean   :0.9939  
##  3rd Qu.:0.0936168   3rd Qu.: 249.036                        3rd Qu.:2.0000  
##  Max.   :0.9063205   Max.   :3099.505                        Max.   :6.0000  
##      months         majorcards         active      
##  Min.   :  0.00   Min.   :0.0000   Min.   : 0.000  
##  1st Qu.: 12.00   1st Qu.:1.0000   1st Qu.: 2.000  
##  Median : 30.00   Median :1.0000   Median : 6.000  
##  Mean   : 55.27   Mean   :0.8173   Mean   : 6.997  
##  3rd Qu.: 72.00   3rd Qu.:1.0000   3rd Qu.:11.000  
##  Max.   :540.00   Max.   :1.0000   Max.   :46.000

summary_table <- CreditCard %>%
  group_by(card) %>%
  summarise(
    mean_income = mean(income),
    mean_expenditure = mean(expenditure),
    median_age = median(age),
    median_ratio = median(expenditure / income)
  )

levels <- c("poor", "fair", "good", "excellent")

summary_table_formatted <- summary_table %>%
  mutate(
    mean_income = scales::dollar(mean_income * 10000, prefix = "$"),
    mean_expenditure = scales::dollar(mean_expenditure, prefix = "$"),
    median_age = paste0(round(median_age, 2), " years"),
    median_ratio = scales::percent(median_ratio / 100)
  )

kable(summary_table_formatted, align = "c", caption = "Summary Statistics by Credit Risk")

Summary Statistics by Credit Risk
card	mean_income	mean_expenditure	median_age	median_ratio
no	$30,685.09	$0.00	31.83 years	0%
yes	$34,512.73	$238.60	31.08 years	50%

ggplot(CreditCard, aes(x = income, fill = card)) +
  geom_histogram(binwidth = 2, position = "identity", alpha = 0.7) +
  labs(title = "Distribution of Income by Credit Risk",
       x = "Income (in USD 10,000)",
       y = "Frequency") +
  theme_minimal() +
  facet_wrap(~ card)

ggplot(CreditCard, aes(x = card, y = income, fill = card)) +
  geom_violin(trim = FALSE, alpha = 0.7) +
  geom_point(aes(y = income, color = card), position = position_jitterdodge(dodge.width = 0.75, jitter.height = 0), size = 0.5, alpha = 0.7) +
  labs(title = "Rain Cloud Plot of Income by Credit Risk",
       x = "Credit Risk",
       y = "Income (in USD 10,000)",
       fill = "Credit Risk") +
  theme_minimal() +
  scale_fill_manual(values = c("poor" = "red", "fair" = "orange", "good" = "green", "excellent" = "blue")) +
  scale_color_manual(values = c("poor" = "red", "fair" = "orange", "good" = "green", "excellent" = "blue")) +
  guides(fill = FALSE) +
  geom_point(aes(y = income, color = card), position = position_jitterdodge(dodge.width = 0.75, jitter.height = 0), size = 0.5, alpha = 0.7)

## Warning: The `<scale>` argument of `guides()` cannot be `FALSE`. Use "none" instead as
## of ggplot2 3.3.4.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.

## Warning: No shared levels found between `names(values)` of the manual scale and the
## data's colour values.

## Warning: No shared levels found between `names(values)` of the manual scale and the
## data's fill values.
## No shared levels found between `names(values)` of the manual scale and the
## data's fill values.

## Warning: No shared levels found between `names(values)` of the manual scale and the
## data's colour values.

## Warning: No shared levels found between `names(values)` of the manual scale and the
## data's fill values.

## Warning: No shared levels found between `names(values)` of the manual scale and the
## data's colour values.

ggplot(CreditCard, aes(x = card, y = income, fill = card)) +
  geom_boxplot() +
  geom_jitter(width = 0.2, alpha = 0.7) +
  labs(title = "Boxplot with Jitter of Income by Credit Risk",
       x = "Credit Risk",
       y = "Income (in USD 10,000)",
       fill = "Credit Risk") +
  theme_minimal()

ggplot(CreditCard, aes(x = card, y = age, fill = card)) +
  geom_violin(trim = FALSE, alpha = 0.7) +
  labs(title = "Violin Plot of Age by Credit Risk",
       x = "Credit Risk",
       y = "Age",
       fill = "Credit Risk") +
  theme_minimal()

income_test <- t.test(income ~ card, data = CreditCard)
expenditure_test <- t.test(expenditure ~ card, data = CreditCard)
age_test <- t.test(age ~ card, data = CreditCard)
ratio_test <- t.test(expenditure / income ~ card, data = CreditCard)

print(income_test)

## 
##  Welch Two Sample t-test
## 
## data:  income by card
## t = -3.5441, df = 501.36, p-value = 0.0004308
## alternative hypothesis: true difference in means between group no and group yes is not equal to 0
## 95 percent confidence interval:
##  -0.5949520 -0.1705758
## sample estimates:
##  mean in group no mean in group yes 
##          3.068509          3.451273

print(expenditure_test)

## 
##  Welch Two Sample t-test
## 
## data:  expenditure by card
## t = -26.525, df = 1022, p-value < 2.2e-16
## alternative hypothesis: true difference in means between group no and group yes is not equal to 0
## 95 percent confidence interval:
##  -256.2538 -220.9510
## sample estimates:
##  mean in group no mean in group yes 
##            0.0000          238.6024

print(age_test)

## 
##  Welch Two Sample t-test
## 
## data:  age by card
## t = -0.019794, df = 490.24, p-value = 0.9842
## alternative hypothesis: true difference in means between group no and group yes is not equal to 0
## 95 percent confidence interval:
##  -1.308120  1.282026
## sample estimates:
##  mean in group no mean in group yes 
##          33.20298          33.21603

print(ratio_test)

## 
##  Welch Two Sample t-test
## 
## data:  expenditure/income by card
## t = -28.513, df = 1022, p-value < 2.2e-16
## alternative hypothesis: true difference in means between group no and group yes is not equal to 0
## 95 percent confidence interval:
##  -78.70527 -68.56985
## sample estimates:
##  mean in group no mean in group yes 
##           0.00000          73.63756

LS0tDQp0aXRsZTogJ0Rlc2NyaXB0aXZlIFN0YXRpc3RpY3MnDQpzdWJ0aXRsZTogJ1VuaXZhcmlhdGUgU3RhdGlzdGljcycNCmRhdGU6ICJgciBTeXMuRGF0ZSgpYCINCmF1dGhvcjogIlp1emFubmEgV2FyY2hvxYIsIFBpb3RyIENoZXJlaywgTWFrc3ltaWxpYW4gS2FtacWEc2tpIg0Kb3V0cHV0Og0KICBodG1sX2RvY3VtZW50OiANCiAgICB0aGVtZTogY2VydWxlYW4NCiAgICBoaWdobGlnaHQ6IHRleHRtYXRlDQogICAgZm9udHNpemU6IDhwdA0KICAgIHRvYzogeWVzDQogICAgY29kZV9kb3dubG9hZDogeWVzDQogICAgdG9jX2Zsb2F0Og0KICAgICAgY29sbGFwc2VkOiBubw0KICAgIGRmX3ByaW50OiBkZWZhdWx0DQogICAgdG9jX2RlcHRoOiA1DQplZGl0b3Jfb3B0aW9uczogDQogIG1hcmtkb3duOiANCiAgICB3cmFwOiA3Mg0KLS0tDQoNCmBgYHtyIHNldHVwMSwgaW5jbHVkZT1GQUxTRX0NCmtuaXRyOjpvcHRzX2NodW5rJHNldChlY2hvID0gVFJVRSkNCm9wdGlvbnMocXdyYXBzMl9tYXJrdXAgPSAibWFya2Rvd24iKQ0KbGlicmFyeShxd3JhcHMyKQ0KbGlicmFyeShhcnNlbmFsKQ0KbGlicmFyeShlMTA3MSkNCmxpYnJhcnkoaGF2ZW4pDQpsaWJyYXJ5KHBhcGVSKQ0KbGlicmFyeShkcGx5cikNCmxpYnJhcnkodGlkeXZlcnNlKQ0KbGlicmFyeShrYWJsZUV4dHJhKQ0KbGlicmFyeShzdW1tYXJ5dG9vbHMpDQpsaWJyYXJ5KGNsYXNzSW50KQ0KbGlicmFyeShwYXN0ZWNzKQ0KbGlicmFyeShyZXBvcnR0b29scykNCmxpYnJhcnkoZGVzY3RhYmxlKQ0KbGlicmFyeShwc3ljaCkNCmxpYnJhcnkoZnJlcXVlbmN5KQ0KbGlicmFyeShnZ3B1YnIpDQpsaWJyYXJ5KGdnZm9yY2UpDQpsaWJyYXJ5KGdnZGlzdCkNCmxpYnJhcnkoZ2doYWx2ZXMpDQpsaWJyYXJ5KGd0c3VtbWFyeSkNCmxpYnJhcnkoQUVSKQ0KZG93bmxvYWQuZmlsZSgiaHR0cHM6Ly9naXRodWIuY29tL2tmbGlzaWtvd3NraS9kcy9ibG9iL21hc3Rlci9kYXRhX2FwYXJ0bWVudHMuY3N2P3Jhdz10cnVlIiwgZGVzdGZpbGUgPSJtaWVzemthbmlhLmNzdiIsbW9kZT0id2IiKQ0KYXBhcnRtZW50cyA8LSByZWFkLmNzdigibWllc3prYW5pYS5jc3YiLHNlcD0iOyIsZGVjPSIsIikNCmBgYA0KDQojIyBEYXRhDQoNCkluIG91ciBleGFtcGxlIHRoaXMgd2Vlaywgd2UgYXJlIGdvaW5nIHRvIHVzZSB0aGUgZmFrZSBkYXRhIC0gYWJvdXQgcmVhbA0KZXN0YXRlcyBpbiBXcm9jbGF3IC0gcHJpY2VzIGJ5IGRpc3RyaWN0cywgc2l6ZSBvZiBhcGFydG1lbnRzIGFuZCBtYW55DQptb3JlLg0KDQojIyMgUHJlcHJvY2Vzc2luZw0KDQpBcyB5b3UgY2FuIHNlZSwgbm90IGFsbCBmb3JtYXRzIG9mIG91ciB2YXJpYWJsZXMgYXJlIGFkYXB0ZWQuIFdlIG5lZWQgdG8NCnByZXBhcmUgYXBwcm9wcmlhdGUgZm9ybWF0cyBvZiBvdXIgdmFyaWFibGVzIGFjY29yZGluZyB0byB0aGVpcg0KbWVhc3VyZW1lbnQgc2NhbGUgYW5kIGZ1dHVyZSBhcHBsaWNhdGlvbi4NCg0KYGBge3Igd3JhbmdsaW5nLCBpbmNsdWRlPVRSVUV9DQphcGFydG1lbnRzJGRpc3RyaWN0PC1hcy5mYWN0b3IoYXBhcnRtZW50cyRkaXN0cmljdCkNCmFwYXJ0bWVudHMkYnVpbGRpbmdfdHlwZTwtYXMuZmFjdG9yKGFwYXJ0bWVudHMkYnVpbGRpbmdfdHlwZSkNCmFwYXJ0bWVudHMkcm9vbXM8LWZhY3RvcihhcGFydG1lbnRzJHJvb21zLG9yZGVyZWQ9VFJVRSkNCmF0dGFjaChhcGFydG1lbnRzKQ0KYXBhcnRtZW50cyRwcmljZV9QTE48LWFzLm51bWVyaWMoYXBhcnRtZW50cyRwcmljZV9QTE4pDQphcGFydG1lbnRzJHByaWNlX0VVUjwtYXMubnVtZXJpYyhhcGFydG1lbnRzJHByaWNlX0VVUikNCmBgYA0KDQojIyBGcmVxdWVuY3kgVGFibGVzDQoNCkluIHRoZSBmaXJzdCBzdGVwIG9mIG91ciBhbmFseXNpcywgd2Ugd2lsbCBncm91cCBvdXIgZGF0YSBpbnRvIGEgc2ltcGxlDQpmcmVxdWVuY3kgdGFibGUuDQoNCkZpcnN0LCBsZXQncyBsb29rIGF0IHRoZSBkaXN0cmlidXRpb24gb2YgaG91c2luZyBwcmljZXMgaW4gb3VyIHNhbXBsZQ0KYW5kIHZlcmlmeSB0YWJ1bGFyIHZhbGlkaXR5IHVzaW5nIHRoZSBUQUkgbWVhc3VyZToNCg0KYGBge3IgdGFibGUsIG1lc3NhZ2U9RkFMU0UsIHdhcm5pbmc9RkFMU0UsIGluY2x1ZGU9RkFMU0UsIHBhZ2VkLnByaW50PUZBTFNFfQ0KZXR5a2lldHk8LWMoIjM1MC00NTAga1BMTiIsIjQ1MC01NTAga1BMTiIsIjU1MC02NTAga1BMTiIsIjY1MC03NTAga1BMTiIsIjc1MC04NTAga1BMTiIsIjg1MC05NTAga1BMTiIsIjk1MC0xMDUwIGtQTE4iLCIxMDUwLTExNTAga1BMTiIsIjExNTAtMTI1MCBrUExOIiwiMTI1MC0xMzUwIGtQTE4iKQ0KbGltaXRzPC1jdXQoYXBhcnRtZW50cyRwcmljZV9QTE4sc2VxKDM1MDAwMCwxMzUwMDAwLGJ5PTEwMDAwMCksbGFiZWxzPWV0eWtpZXR5KQ0KdGFiZWxhMTwtZnJlcShsaW1pdHMsdHlwZT0iaHRtbCIpDQpgYGANCg0KT2ssIGl0IGxvb2tzIHF1aXRlIHVnbHksIHNvIGxldCdzIHdyYXAgaXQgdXAgdXNpbmcgdGhlICdrYWJsZScgcGFja2FnZToNCg0KYGBge3IgdGFpLCBlY2hvPUZBTFNFfQ0Ka2JsKHRhYmVsYTEsY2FwdGlvbiA9ICJBcGFydG1lbnRzIGluIFdyb2NsYXcgLSBwcmljZXMgaW4ga1BMTiIpICU+JQ0KICAgIGthYmxlX21hdGVyaWFsKGMoInN0cmlwZWQiLCAiaG92ZXIiKSkNCnRhYjE8LWNsYXNzSW50ZXJ2YWxzKGFwYXJ0bWVudHMkcHJpY2VfUExOLG49MTAsc3R5bGU9ImZpeGVkIixmaXhlZEJyZWFrcz1zZXEoMzUwMDAwLDEzNTAwMDAsYnk9MTAwMDAwKSkNCmplbmtzLnRlc3RzKHRhYjEpDQpgYGANCg0KQXMgd2UgY2FuIHNlZSAtIHRoZSBUQUkgaW5kZXggaXMgcXVpdGUgaGlnaC4gMC44NSBtZWFucyB0aGF0IHdlIGNhbg0KYWNjZXB0IHRoZSBwcm9wb3NlZCBjb25zdHJ1Y3Rpb24gb2YgdGhlIGZyZXF1ZW5jeSB0YWJsZS4NCg0KIyMgQmFzaWMgcGxvdHMNCg0KSW4gdGhpcyBzZWN0aW9uLCB3ZSBzaG91bGQgcmVwcmVzZW50IG91ciBkYXRhIHVzaW5nIGJhc2ljIChwcmUtaW5zdGFsbGVkDQppbiBSKSBncmFwaGljcy4gU2VsZWN0IHRoZSBtb3N0IGFwcHJvcHJpYXRlIGdyYXBocyBkZXBlbmRpbmcgb24gdGhlDQpzY2FsZSBvZiB0aGUgc2VsZWN0ZWQgdmFyaWFibGVzLiBFeHBsb3JlIHRoZSBoZXRlcm9nZW5laXR5IG9mIHRoZQ0KZGlzdHJpYnV0aW9uIGJ5IHByZXNlbnRpbmcgdGhlIGRhdGEgYnkgZ3JvdXAgKGUuZy4sIGJ5IG5laWdoYm9yaG9vZCwNCmJ1aWxkaW5nIHR5cGUsIGV0Yy4pLiBEb24ndCBmb3JnZXQgYWJvdXQgbWFpbiB0aXRsZXMsIGxhYmVscyBhbmQNCmxlZ2VuZHMuIFJlYWQgbW9yZSBhYm91dCBncmFwaGljYWwgcGFyYW1ldGVycw0KW2hlcmVdKGh0dHA6Ly93d3cuc3RoZGEuY29tL2VuZ2xpc2gvd2lraS9ncmFwaGljYWwtcGFyYW1ldGVycykuDQoNCmBgYHtyIGhpc3RvZ3JhbSwgZWNobz1GQUxTRX0NCmhpc3QocHJpY2VfUExOLCBicmVha3M9IkZEIiwgY29sPSJncmVlbiIsIHByb2JhYmlsaXR5ID0gVFJVRSwNCiAgICAgbWFpbj0iUHJpY2VzIGluIFBMTiAtIFdyb2NsYXciKQ0KbGluZXMoZGVuc2l0eShwcmljZV9QTE5bZGlzdHJpY3Q9PSJLcnp5a2kiXSksY29sPTIpDQpsaW5lcyhkZW5zaXR5KHByaWNlX1BMTltkaXN0cmljdD09IkJpc2t1cGluIl0pLGNvbD0zKQ0KbGluZXMoZGVuc2l0eShwcmljZV9QTE5bZGlzdHJpY3Q9PSJTcm9kbWllc2NpZSJdKSxjb2w9NCkNCmxlZ2VuZCgidG9wcmlnaHQiLCBsZWdlbmQ9YygiS3J6eWtpIiwgIkJpc2t1cGluIiwgIlNyb2RtaWVzY2llIiksDQogICAgICAgY29sPWMoMiwzLDQpLCBsdHk9MToyLCBob3Jpej1GQUxTRSwgYm94Lmx0eT0wLCBjZXg9MC44KQ0KDQpgYGANCg0KTm90ZSB0aGF0IHRoZSBgZWNobyA9IEZBTFNFYCBwYXJhbWV0ZXIgaGFzIGJlZW4gYWRkZWQgdG8gdGhlIGNvZGUNCnNuaXBwZXQgdG8gcHJldmVudCBwcmludGluZyB0aGUgUiBjb2RlIHRoYXQgZ2VuZXJhdGVkIHRoZSBncmFwaC4NCg0KYGBge3IgYm94cGxvdCwgZWNobz1GQUxTRX0NCmJveHBsb3QocHJpY2VfUExOfmRpc3RyaWN0KQ0KYGBgDQoNCiMjIGdncGxvdDIgcGxvdHMNCg0KTm93LCBsZXQncyB1c2UgdGhlICoqKmdncGxvdDIqKiogYW5kICoqKmdncHVicioqKiBsaWJyYXJpZXMgdG8gcGxvdC4NCg0KYGBge3IgaGlzdG9ncmFtMiwgZWNobz1GQUxTRX0NCiMgRGVuc2l0eSBwbG90IG9mICJwcmljZV9QTE4iDQojOjo6Ojo6Ojo6Ojo6Ojo6Ojo6Ojo6Ojo6Ojo6Ojo6Ojo6Ojo6OjoNCmRlbnNpdHkucCA8LSBnZ2RlbnNpdHkoYXBhcnRtZW50cywgeCA9ICJwcmljZV9QTE4iLCANCiAgICAgICAgICAgICAgICAgICAgICAgZmlsbCA9ICJkaXN0cmljdCIsIHBhbGV0dGUgPSAiamNvIikrDQogIHN0YXRfb3ZlcmxheV9ub3JtYWxfZGVuc2l0eShjb2xvciA9ICJyZWQiLCBsaW5ldHlwZSA9ICJkYXNoZWQiKQ0KDQojIERyYXcgdGhlIHN1bW1hcnkgdGFibGUgb2YgcHJpY2VfUExODQojOjo6Ojo6Ojo6Ojo6Ojo6Ojo6Ojo6Ojo6Ojo6Ojo6Ojo6Ojo6OjoNCiMgQ29tcHV0ZSBkZXNjcmlwdGl2ZSBzdGF0aXN0aWNzIGJ5IGdyb3Vwcw0Kc3RhYmxlIDwtIGRlc2Nfc3RhdGJ5KGFwYXJ0bWVudHMsIG1lYXN1cmUudmFyID0gInByaWNlX1BMTiIsDQogICAgICAgICAgICAgICAgICAgICAgZ3JwcyA9ICJkaXN0cmljdCIpDQpzdGFibGUgPC0gc3RhYmxlWywgYygiZGlzdHJpY3QiLCAibGVuZ3RoIiwgIm1lYW4iLCAic2QiKV0NCiMgU3VtbWFyeSB0YWJsZSBwbG90LCBtZWRpdW0gb3JhbmdlIHRoZW1lDQpzdGFibGUucCA8LSBnZ3RleHR0YWJsZShzdGFibGUsIHJvd3MgPSBOVUxMLCANCiAgICAgICAgICAgICAgICAgICAgICAgIHRoZW1lID0gdHRoZW1lKCJtT3JhbmdlIikpDQojIERyYXcgdGV4dA0KIzo6Ojo6Ojo6Ojo6Ojo6Ojo6Ojo6Ojo6Ojo6Ojo6Ojo6Ojo6Ojo6DQp0ZXh0IDwtIHBhc3RlKCJQcmljZSBwZXIgYXBhcnRtZW50IGJ5IDMgZGlzdHJpY3RzIC0gV3JvY2xhdy4iLA0KICAgICAgICAgICAgICAiUmFuZG9tIHNhbXBsZSBvZiAyMDAgYXBhcnRtZW50cy4iLA0KICAgICAgICAgICAgICAgc2VwID0gIiAiKQ0KdGV4dC5wIDwtIGdncGFyYWdyYXBoKHRleHQgPSB0ZXh0LCBmYWNlID0gIml0YWxpYyIsIHNpemUgPSAxMSwgY29sb3IgPSAiYmxhY2siKQ0KIyBBcnJhbmdlIHRoZSBwbG90cyBvbiB0aGUgc2FtZSBwYWdlDQpnZ2FycmFuZ2UoZGVuc2l0eS5wLCBzdGFibGUucCwgdGV4dC5wLCANCiAgICAgICAgICBuY29sID0gMSwgbnJvdyA9IDMsDQogICAgICAgICAgaGVpZ2h0cyA9IGMoMSwgMC41LCAwLjMpKQ0KYGBgDQoNCkdncGxvdDIgYWxsb3dzIHlvdSB0byBzaG93IHRoZSBhdmVyYWdlIHZhbHVlIGZvciBlYWNoIGdyb3VwIHVzaW5nIHRoZQ0KKipzdGF0X3N1bW1hcnkoKSoqIGZ1bmN0aW9uLiBZb3Ugbm8gbG9uZ2VyIG5lZWQgdG8gY2FsY3VsYXRlIGF2ZXJhZ2UNCnZhbHVlcyBiZWZvcmUgY3JlYXRpbmcgYSBncmFwaCENCg0KYGBge3IgYm94cGxvdDIsIGVjaG89RkFMU0V9DQpnZ3Bsb3QoYXBhcnRtZW50cywgYWVzKHg9ZGlzdHJpY3QsIHk9cHJpY2VfUExOKSkgKw0KICAgIGdlb21fYm94cGxvdChhbHBoYT0wLjcpICsNCiAgICBzdGF0X3N1bW1hcnkoZnVuPSJtZWFuIiwgZ2VvbT0icG9pbnQiLCBzaGFwZT0yMCwgc2l6ZT01LCBjb2xvcj0icmVkIiwgZmlsbD0icmVkIikgKw0KIGdlb21faml0dGVyKCkgKw0KICAgIGZhY2V0X2dyaWQofmJ1aWxkaW5nX3R5cGUpICsNCiAgICBzY2FsZV9maWxsX2JyZXdlcihwYWxldHRlPSJTZXQxIikNCg0KYGBgDQoNCiMjIyBSYWluQ2xvdWQgUGxvdA0KDQpgYGB7ciBlY2hvPUZBTFNFLCBtZXNzYWdlPUZBTFNFLCB3YXJuaW5nPUZBTFNFfQ0KYXBhcnRtZW50cyAlPiUgDQogIGZpbHRlcihyb29tcyAlaW4lIGMoMSwgMiwgMywgNCkpICU+JSANCiAgZ2dwbG90KGFlcyh4ID0gZmFjdG9yKHJvb21zKSwgeSA9IHByaWNlX1BMTiwgZmlsbCA9IGZhY3Rvcihyb29tcykpKSArDQogIA0KICAjIGFkZCBoYWxmLXZpb2xpbiBmcm9tIHtnZ2Rpc3R9IHBhY2thZ2UNCiAgc3RhdF9oYWxmZXllKA0KICAgICMgYWRqdXN0IGJhbmR3aWR0aA0KICAgIGFkanVzdCA9IDAuNSwNCiAgICAjIG1vdmUgdG8gdGhlIHJpZ2h0DQogICAganVzdGlmaWNhdGlvbiA9IC0wLjIsDQogICAgIyByZW1vdmUgdGhlIHNsdWIgaW50ZXJ2YWwNCiAgICAud2lkdGggPSAwLA0KICAgIHBvaW50X2NvbG91ciA9IE5BDQogICkgKw0KICBnZW9tX2JveHBsb3QoDQogICAgd2lkdGggPSAwLjEyLA0KICAgICMgcmVtb3Zpbmcgb3V0bGllcnMNCiAgICBvdXRsaWVyLmNvbG9yID0gTkEsDQogICAgYWxwaGEgPSAwLjUNCiAgKSArDQogIHN0YXRfZG90cygNCiAgICAjIHBsb3Rpbmcgb24gbGVmdCBzaWRlDQogICAgc2lkZSA9ICJsZWZ0IiwNCiAgICAjIGFkanVzdGluZyBwb3NpdGlvbg0KICAgIGp1c3RpZmljYXRpb24gPSAxLjEsDQogICAgIyBhZGp1c3QgZ3JvdXBpbmcgKGJpbm5pbmcpIG9mIG9ic2VydmF0aW9ucw0KICAgIGJpbndpZHRoID0gMC4yNQ0KICApICsNCiMgVGhlbWVzIGFuZCBMYWJlbHMNCiAgbGFicygNCiAgICB0aXRsZSA9ICJSYWluQ2xvdWQgUGxvdCIsDQogICAgeCA9ICJOby4gb2Ygcm9vbXMiLA0KICAgIHkgPSAiUHJpY2VzIGluIFBMTiIsDQogICAgZmlsbCA9ICJyb29tcyINCiAgKSArDQogIGNvb3JkX2ZsaXAoKQ0KYGBgDQoNCiMjIyBGYWNldGluZw0KDQpGYWNldGluZyBnZW5lcmF0ZXMgc21hbGwgbXVsdGlwbGVzLCBlYWNoIHNob3dpbmcgYSBkaWZmZXJlbnQgc3Vic2V0IG9mDQp0aGUgZGF0YS4gVGhleSBhcmUgYSBwb3dlcmZ1bCB0b29sIGZvciBleHBsb3JhdG9yeSBkYXRhIGFuYWx5c2lzOiB5b3UNCmNhbiBxdWlja2x5IGNvbXBhcmUgcGF0dGVybnMgaW4gZGlmZmVyZW50IHBhcnRzIG9mIHRoZSBkYXRhIGFuZCBzZWUgaWYNCnRoZXkgYXJlIHRoZSBzYW1lIG9yIGRpZmZlcmVudC4gUmVhZCBtb3JlDQpbaGVyZV0oaHR0cHM6Ly9nZ3Bsb3QyLWJvb2sub3JnL2ZhY2V0Lmh0bWwpLg0KDQpgYGB7ciBmYWNldDEsIGVjaG89RkFMU0V9DQpwbG90MSA8LSBnZ3Bsb3QoYXBhcnRtZW50cywgYWVzKHByaWNlX1BMTiwgcm9vbXMpKSArIA0KICBnZW9tX2FibGluZSgpICsNCiAgZ2VvbV9qaXR0ZXIod2lkdGggPSAwLjEsIGhlaWdodCA9IDAuMSkgDQpwbG90MSArIGZhY2V0X3dyYXAofmRpc3RyaWN0KQ0KYGBgDQoNCiMjIFVuaXZhcmlhdGUgU3RhdGlzdGljcw0KDQpCZWZvcmUgYXV0b21hdGljYWxseSByZXBvcnRpbmcgdGhlIGZ1bGwgc3VtbWFyeSB0YWJsZSBvZiBkZXNjcmlwdGl2ZQ0Kc3RhdGlzdGljcywgdGhpcyB0aW1lIHlvdXIgZ29hbCBpcyB0byBtZWFzdXJlIHRoZSBjZW50cmFsIHRlbmRlbmN5IG9mDQp0aGUgcHJpY2UgZGlzdHJpYnV0aW9uLiBDb21wYXJlIHRoZSBtZWFuLCBtZWRpYW4sIGFuZCBtb2RlIGFsb25nIHdpdGgNCnBvc2l0aW9uYWwgbWVhc3VyZXMgLSBxdWFudGlsZXMgLSBieSBkaXN0cmljdCBhbmQgYnVpbGRpbmcgdHlwZSBvcg0KbnVtYmVyIG9mIHJvb21zIGluIHRoZSBhcGFydG1lbnQuDQoNCmBgYHtyfQ0KICAgIG1lYW4ocHJpY2VfUExOKQ0KICAgIG1lZGlhbihwcmljZV9QTE4pDQogICAgc2QocHJpY2VfUExOKSAjc3RhbmRhcmQgZGV2aWF0aW9uDQogICAgdmFyKHByaWNlX1BMTikgI3ZhcmlhbmNlDQogICAgY29lZmZfdmFyPC1zZChwcmljZV9QTE4pL21lYW4ocHJpY2VfUExOKSAjY29lZmZpY2llbnQgb2YgdmFyaWFiaWxpdHkgJQ0KICAgIGNvZWZmX3Zhcg0KICAgIElRUihwcmljZV9QTE4pIyBkaWZmZXJlbmNlIGJldHdlZW4gcXVhcnRpbGVzID1RMy1RMSANCiAgICBzeDwtSVFSKHByaWNlX1BMTikvMiAgI2ludGVycXVhcnRpbGUgZGV2aWF0aW9uDQogICAgY29lZmZfdmFyeDwtc3gvbWVkaWFuKHByaWNlX1BMTikgI0lRUiBjb2VmZmljaWVudCBvZiB2YXJpYWJpbGl0eSAlDQogICAgY29lZmZfdmFyeA0KICAgIG1pbihwcmljZV9QTE4pDQogICAgbWF4KHByaWNlX1BMTikNCiAgICBxdWFudGlsZShwcmljZV9QTE4scHJvYnM9YygwLDAuMSwwLjI1LDAuNSwwLjc1LDAuOTUsMSksbmEucm09VFJVRSkNCmBgYA0KDQpPaywgd2UgaGF2ZSBjYWxjdWxhdGVkIGFsbCBvZiB0aGUgYmFzaWMgc3VtbWFyeSBzdGF0aXN0aWNzIGFib3ZlLiBMZXQncw0Kd3JhcCB0aGVtIHVwIHRvZ2V0aGVyIG5vdy4NCg0KYGBge3Iga2FibGVfcmVwb3J0LCBlY2hvPUZBTFNFfQ0KYXBhcnRtZW50c19saXN0IDwtIHNwbGl0KGFwYXJ0bWVudHMkcHJpY2VfUExOLCBhcGFydG1lbnRzJHJvb21zKQ0KaW5saW5lX3Bsb3QgPC0gZGF0YS5mcmFtZShyb29tcyA9IGMoMSwgMiwgMywgNCksIGJveHBsb3QgPSAiIiwgaGlzdG9ncmFtID0gIiIsDQogICAgICAgICAgICAgICAgICAgICAgICAgIGxpbmUxID0gIiIsIGxpbmUyID0gIiIsIHBvaW50czEgPSAiIikNCmlubGluZV9wbG90ICU+JQ0KICBrYmwoYm9va3RhYnMgPSBUUlVFKSAlPiUNCiAga2FibGVfcGFwZXIoZnVsbF93aWR0aCA9IEZBTFNFKSAlPiUNCiAgY29sdW1uX3NwZWMoMiwgaW1hZ2UgPSBzcGVjX2JveHBsb3QoYXBhcnRtZW50c19saXN0KSkgJT4lDQogIGNvbHVtbl9zcGVjKDMsIGltYWdlID0gc3BlY19oaXN0KGFwYXJ0bWVudHNfbGlzdCkpICU+JQ0KICBjb2x1bW5fc3BlYyg0LCBpbWFnZSA9IHNwZWNfcGxvdChhcGFydG1lbnRzX2xpc3QsIHNhbWVfbGltID0gVFJVRSkpICU+JQ0KICBjb2x1bW5fc3BlYyg1LCBpbWFnZSA9IHNwZWNfcGxvdChhcGFydG1lbnRzX2xpc3QsIHNhbWVfbGltID0gRkFMU0UpKSAlPiUNCiAgY29sdW1uX3NwZWMoNiwgaW1hZ2UgPSBzcGVjX3Bsb3QoYXBhcnRtZW50c19saXN0LCB0eXBlID0gInAiKSkNCg0KYGBgDQoNCiMjIyBTdW1tYXJ5IHRhYmxlcw0KDQpPaywgbm93IHdlIHdpbGwgZmluYWxseSBzdW1tYXJpemUgdGhlIGJhc2ljIG1lYXN1cmVzIG9mIGNlbnRyYWwgdGVuZGVuY3kNCmZvciBwcmljZXMgYnkgZGlzdHJpY3QvYnVpbGRpbmcgdHlwZSB1c2luZyB0aGUgJyoqKmthYmxlKioqJyBwYWNrYWdlLg0KRmVlbCBmcmVlIHRvIGN1c3RvbWl6ZSB5b3VyIGZpbmFsIHJlcG9ydC4gU2VlIHNvbWUgaGludHMNCltoZXJlXShodHRwczovL2NyYW4uci1wcm9qZWN0Lm9yZy93ZWIvcGFja2FnZXMvcXdyYXBzMi92aWduZXR0ZXMvc3VtbWFyeS1zdGF0aXN0aWNzLmh0bWwpLg0KDQpgYGB7ciBrYWJsZV9yZXBvcnQyLCBlY2hvPUZBTFNFLCBtZXNzYWdlPUZBTFNFLCB3YXJuaW5nPUZBTFNFfQ0KDQpgYGANCg0KIyMjIGd0c3VtbWFyeQ0KDQpXZSBjYW4gY2FsY3VsYXRlIGVhc2lseSBkZXNjcmlwdGl2ZSBzdGF0aXN0aWNzIGFsc28gdXNpbmcgZ3RzdW1tYXJ5DQpwYWNrYWdlOg0KDQpgYGB7cn0NCmFwYXJ0bWVudHMgJT4lDQogIHNlbGVjdChwcmljZV9QTE4scm9vbXMpICU+JQ0KICB0Ymxfc3VtbWFyeShsYWJlbD0gcHJpY2VfUExOIH4gIlByaWNlIixkaWdpdHM9YyhwcmljZV9QTE4pfjIsYnk9cm9vbXMsdHlwZSA9IGFsbF9jb250aW51b3VzKCkgfiAiY29udGludW91czIiLCBzdGF0aXN0aWMgPSBhbGxfY29udGludW91cygpIH4gYygie05fbm9ubWlzc30iLCAie21lZGlhbn0gKHtwMjV9LCB7cDc1fSkiLCAie21pbn0sIHttYXh9IiksbWlzc2luZyA9ICJubyIpDQpgYGANCg0KIyMjIGRmU3VtbWFyeQ0KDQpkZlN1bW1hcnkoKSBjcmVhdGVzIGEgc3VtbWFyeSB0YWJsZSB3aXRoIHN0YXRpc3RpY3MsIGZyZXF1ZW5jaWVzIGFuZA0KZ3JhcGhzIGZvciBhbGwgdmFyaWFibGVzIGluIGEgZGF0YSBmcmFtZS4gVGhlIGluZm9ybWF0aW9uIGRpc3BsYXllZCBpcw0KdHlwZS1zcGVjaWZpYyAoY2hhcmFjdGVyLCBmYWN0b3IsIG51bWVyaWMsIGRhdGUpIGFuZCBhbHNvIHZhcmllcw0KYWNjb3JkaW5nIHRvIHRoZSBudW1iZXIgb2YgZGlzdGluY3QgdmFsdWVzLg0KDQpXaGVuIHVzaW5nIGRmU3VtbWFyeSgpIGluIFIgTWFya2Rvd24gZG9jdW1lbnRzLCBpdCBpcyBnZW5lcmFsbHkgYSBnb29kDQppZGVhIHRvIGV4Y2x1ZGUgYSBjb2x1bW4gb3IgdHdvIHRvIGF2b2lkIG1hcmdpbiBvdmVyZmxvdy4gU2luY2UgdGhlDQpWYWxpZCBhbmQgTWlzc2luZyBjb2x1bW5zIGFyZSByZWR1bmRhbnQsIHdlIGNhbiBkcm9wIGVpdGhlciBvbmUgb2YgdGhlbS4NCg0KYGBge3Igd2FybmluZz1GQUxTRSwgcmVzdWx0cz0iYXNpcyJ9DQpkZlN1bW1hcnkoYXBhcnRtZW50cywNCiAgICAgICAgICBwbGFpbi5hc2NpaSAgPSBGQUxTRSwgDQogICAgICAgICAgc3R5bGUgICAgICAgID0gImdyaWQiLCANCiAgICAgICAgICBncmFwaC5tYWduaWYgPSAwLjc1LCANCiAgICAgICAgICB2YWxpZC5jb2wgICAgPSBGQUxTRSwNCiAgICAgICAgICB0bXAuaW1nLmRpciAgPSAiL3RtcCIpDQpgYGANCg0KVG8gcHJvZHVjZSBvcHRpbWFsIHJlc3VsdHMsIHN1bW1hcnl0b29scyBoYXMgaXRzIG93biB2ZXJzaW9uIG9mIHRoZSBiYXNlDQpieSgpIGZ1bmN0aW9uLiBJdCdzIGNhbGxlZCBzdGJ5KCksIGFuZCB3ZSB1c2UgaXQgZXhhY3RseSBhcyB3ZSB3b3VsZA0KYnkoKToNCg0KYGBge3IgcmVzdWx0cz0iYXNpcyIsIHdhcm5pbmc9RkFMU0V9DQooc3RhdHNfYnlfcm9vbXMgPC0gc3RieShkYXRhICAgICAgPSBhcGFydG1lbnRzLCBJTkRJQ0VTICAgPSBhcGFydG1lbnRzJHJvb21zLCBGVU4gICAgICAgPSBkZXNjciwgc3RhdHMgICAgID0gImNvbW1vbiIsIHRyYW5zcG9zZSA9IFRSVUUpKQ0KYGBgDQoNCiMjIyBUaWR5IFRhYmxlcw0KDQpXaGVuIGdlbmVyYXRpbmcgZnJlcSgpIG9yIGRlc2NyKCkgdGFibGVzLCBpdCBpcyBwb3NzaWJsZSB0byB0dXJuIHRoZQ0KcmVzdWx0cyBpbnRvICJ0aWR5IiB0YWJsZXMgd2l0aCB0aGUgdXNlIG9mIHRoZSB0YigpIGZ1bmN0aW9uICh0aGluayBvZg0KdGIgYXMgYSBkaW1pbnV0aXZlIGZvciB0aWJibGUpLiBGb3IgZXhhbXBsZToNCg0KYGBge3J9DQphcGFydG1lbnRzICU+JQ0KICBkZXNjcihzdGF0cyA9ICJjb21tb24iKSAlPiUNCiAgdGIoKQ0KYGBgDQoNCkhlcmUgYXJlIHNvbWUgZXhhbXBsZXMgc2hvd2luZyBob3cgbGlzdHMgY3JlYXRlZCB1c2luZyBzdGJ5KCkgb3INCmdyb3VwX2J5KCkgY2FuIGJlIHRyYW5zZm9ybWVkIGludG8gdGlkeSB0aWJibGVzLg0KDQpgYGB7cn0NCmdyb3VwZWRfZGVzY3IgPC0gc3RieShkYXRhICAgID0gYXBhcnRtZW50cyxJTkRJQ0VTID0gYXBhcnRtZW50cyRyb29tcywgRlVOICAgICA9IGRlc2NyLCBzdGF0cyAgID0gImNvbW1vbiIpDQoNCmdyb3VwZWRfZGVzY3IgJT4lIHRiKCkNCmBgYA0KDQojIyMgQSBCcmlkZ2UgdG8gT3RoZXIgUGFja2FnZXMNCg0KYGBge3J9DQpzdGJ5KGRhdGEgICAgPSBhcGFydG1lbnRzLCANCiAgICAgSU5ESUNFUyA9IGFwYXJ0bWVudHMkcm9vbXMsIA0KICAgICBGVU4gICAgID0gZGVzY3IsIA0KICAgICBzdGF0cyAgID0gImZpdmVudW0iKSAlPiUNCiAgdGIob3JkZXIgPSAzKSAlPiUNCiAga2FibGUoZm9ybWF0ID0gImh0bWwiLCBkaWdpdHMgPSAyKSAlPiUNCiAgY29sbGFwc2Vfcm93cyhjb2x1bW5zID0gMSwgdmFsaWduID0gInRvcCIpDQpgYGANCg0KIyMgWW91ciB0dXJuIQ0KDQpZb3VyIHRhc2sgdGhpcyB3ZWVrIGlzIHRvOiBwcmVwYXJlIHlvdXIgb3duIGRlc2NyaXB0aXZlIGFuYWx5c2lzIGZvciB0aGUNCiJDcmVkaXRDYXJkIiBkYXRhc2V0IChBRVIgcGFja2FnZSkuIEl0IGlzIGEgY3Jvc3Mtc2VjdGlvbmFsIGRhdGFmcmFtZSBvbg0KdGhlIGNyZWRpdCBoaXN0b3J5IGZvciBhIHNhbXBsZSBvZiBhcHBsaWNhbnRzIGZvciBhIHR5cGUgb2YgY3JlZGl0IGNhcmQuDQoNCmBgYHtyIGluY2x1ZGU9RkFMU0V9DQpkYXRhKENyZWRpdENhcmQpDQojP0NyZWRpdENhcmQgIHJlYWQgZGVzY3JpcHRpb24gZmlyc3QNCmBgYA0KDQpBcmUgdGhlIHllYXJseSBpbmNvbWVzIChpbiBVU0QgMTAsMDAwKSwgY3JlZGl0IGNhcmQgZXhwZW5kaXR1cmVzLCBhZ2UsDQpyYXRpbyBvZiBtb250aGx5IGNyZWRpdCBjYXJkIGV4cGVuZGl0dXJlIHRvIHllYXJseSBpbmNvbWUgLQ0Kc2lnbmlmaWNhbnRseSBkaWZmZXJlbnQgZm9yIGFwcGxpY2FudHMgZm9yIGN1c3RvbWVycyB3aXRoIGRpZmZlcmVudA0KY3JlZGl0IHJpc2sgKCJjYXJkIiB2YXJpYWJsZSAtIGZhY3Rvcik/DQoNClByZXBhcmUgYSBwcm9mZXNzaW9uYWwgZGF0YSB2aXN1YWxpemF0aW9ucywgZGVzY3JpcHRpdmUgc3RhdGlzdGljcycNCnRhYmxlcyBhbmQgaW50ZXJwcmV0IHRoZW0uDQoNCmBgYHtyIG15X3N1bW1hcnlfdGFibGV9DQojIHRoaXMgYW5hbHlzaXMgc2hvd3MgdXMgdGhhdCBjcmVkaXQgcmlzayBkaWZmZXJzIGluIHRlcm1zIG9mIGFnZSwgaW5jb21lIGV0Yy4gZm9yIGV4YW1wbGUgbW9zdCB0aGUgaGlnaGVzdCBkZW5zaXR5IG9mIGNyZWRpdCByaXNrIGlzIHdpdGhpbiAyNSB0byAzNSB5ZWFycy4gQnkgbG9va2luZyBhdCB0aGVzZSBncmFwaHMgd2UgY2FuIG1ha2UgYSBjb25jbHVzaW9ucy4NCg0KbGlicmFyeShBRVIpDQpsaWJyYXJ5KGRwbHlyKQ0KbGlicmFyeShzY2FsZXMpDQpsaWJyYXJ5KGdncGxvdDIpDQpsaWJyYXJ5KGdnZGlzdCkNCg0KZGF0YShDcmVkaXRDYXJkKQ0KDQpoZWFkKENyZWRpdENhcmQpDQoNCnN1bW1hcnkoQ3JlZGl0Q2FyZCkNCg0Kc3VtbWFyeV90YWJsZSA8LSBDcmVkaXRDYXJkICU+JQ0KICBncm91cF9ieShjYXJkKSAlPiUNCiAgc3VtbWFyaXNlKA0KICAgIG1lYW5faW5jb21lID0gbWVhbihpbmNvbWUpLA0KICAgIG1lYW5fZXhwZW5kaXR1cmUgPSBtZWFuKGV4cGVuZGl0dXJlKSwNCiAgICBtZWRpYW5fYWdlID0gbWVkaWFuKGFnZSksDQogICAgbWVkaWFuX3JhdGlvID0gbWVkaWFuKGV4cGVuZGl0dXJlIC8gaW5jb21lKQ0KICApDQoNCmxldmVscyA8LSBjKCJwb29yIiwgImZhaXIiLCAiZ29vZCIsICJleGNlbGxlbnQiKQ0KDQpzdW1tYXJ5X3RhYmxlX2Zvcm1hdHRlZCA8LSBzdW1tYXJ5X3RhYmxlICU+JQ0KICBtdXRhdGUoDQogICAgbWVhbl9pbmNvbWUgPSBzY2FsZXM6OmRvbGxhcihtZWFuX2luY29tZSAqIDEwMDAwLCBwcmVmaXggPSAiJCIpLA0KICAgIG1lYW5fZXhwZW5kaXR1cmUgPSBzY2FsZXM6OmRvbGxhcihtZWFuX2V4cGVuZGl0dXJlLCBwcmVmaXggPSAiJCIpLA0KICAgIG1lZGlhbl9hZ2UgPSBwYXN0ZTAocm91bmQobWVkaWFuX2FnZSwgMiksICIgeWVhcnMiKSwNCiAgICBtZWRpYW5fcmF0aW8gPSBzY2FsZXM6OnBlcmNlbnQobWVkaWFuX3JhdGlvIC8gMTAwKQ0KICApDQoNCmthYmxlKHN1bW1hcnlfdGFibGVfZm9ybWF0dGVkLCBhbGlnbiA9ICJjIiwgY2FwdGlvbiA9ICJTdW1tYXJ5IFN0YXRpc3RpY3MgYnkgQ3JlZGl0IFJpc2siKQ0KDQpnZ3Bsb3QoQ3JlZGl0Q2FyZCwgYWVzKHggPSBpbmNvbWUsIGZpbGwgPSBjYXJkKSkgKw0KICBnZW9tX2hpc3RvZ3JhbShiaW53aWR0aCA9IDIsIHBvc2l0aW9uID0gImlkZW50aXR5IiwgYWxwaGEgPSAwLjcpICsNCiAgbGFicyh0aXRsZSA9ICJEaXN0cmlidXRpb24gb2YgSW5jb21lIGJ5IENyZWRpdCBSaXNrIiwNCiAgICAgICB4ID0gIkluY29tZSAoaW4gVVNEIDEwLDAwMCkiLA0KICAgICAgIHkgPSAiRnJlcXVlbmN5IikgKw0KICB0aGVtZV9taW5pbWFsKCkgKw0KICBmYWNldF93cmFwKH4gY2FyZCkNCg0KZ2dwbG90KENyZWRpdENhcmQsIGFlcyh4ID0gY2FyZCwgeSA9IGluY29tZSwgZmlsbCA9IGNhcmQpKSArDQogIGdlb21fdmlvbGluKHRyaW0gPSBGQUxTRSwgYWxwaGEgPSAwLjcpICsNCiAgZ2VvbV9wb2ludChhZXMoeSA9IGluY29tZSwgY29sb3IgPSBjYXJkKSwgcG9zaXRpb24gPSBwb3NpdGlvbl9qaXR0ZXJkb2RnZShkb2RnZS53aWR0aCA9IDAuNzUsIGppdHRlci5oZWlnaHQgPSAwKSwgc2l6ZSA9IDAuNSwgYWxwaGEgPSAwLjcpICsNCiAgbGFicyh0aXRsZSA9ICJSYWluIENsb3VkIFBsb3Qgb2YgSW5jb21lIGJ5IENyZWRpdCBSaXNrIiwNCiAgICAgICB4ID0gIkNyZWRpdCBSaXNrIiwNCiAgICAgICB5ID0gIkluY29tZSAoaW4gVVNEIDEwLDAwMCkiLA0KICAgICAgIGZpbGwgPSAiQ3JlZGl0IFJpc2siKSArDQogIHRoZW1lX21pbmltYWwoKSArDQogIHNjYWxlX2ZpbGxfbWFudWFsKHZhbHVlcyA9IGMoInBvb3IiID0gInJlZCIsICJmYWlyIiA9ICJvcmFuZ2UiLCAiZ29vZCIgPSAiZ3JlZW4iLCAiZXhjZWxsZW50IiA9ICJibHVlIikpICsNCiAgc2NhbGVfY29sb3JfbWFudWFsKHZhbHVlcyA9IGMoInBvb3IiID0gInJlZCIsICJmYWlyIiA9ICJvcmFuZ2UiLCAiZ29vZCIgPSAiZ3JlZW4iLCAiZXhjZWxsZW50IiA9ICJibHVlIikpICsNCiAgZ3VpZGVzKGZpbGwgPSBGQUxTRSkgKw0KICBnZW9tX3BvaW50KGFlcyh5ID0gaW5jb21lLCBjb2xvciA9IGNhcmQpLCBwb3NpdGlvbiA9IHBvc2l0aW9uX2ppdHRlcmRvZGdlKGRvZGdlLndpZHRoID0gMC43NSwgaml0dGVyLmhlaWdodCA9IDApLCBzaXplID0gMC41LCBhbHBoYSA9IDAuNykNCg0KZ2dwbG90KENyZWRpdENhcmQsIGFlcyh4ID0gY2FyZCwgeSA9IGluY29tZSwgZmlsbCA9IGNhcmQpKSArDQogIGdlb21fYm94cGxvdCgpICsNCiAgZ2VvbV9qaXR0ZXIod2lkdGggPSAwLjIsIGFscGhhID0gMC43KSArDQogIGxhYnModGl0bGUgPSAiQm94cGxvdCB3aXRoIEppdHRlciBvZiBJbmNvbWUgYnkgQ3JlZGl0IFJpc2siLA0KICAgICAgIHggPSAiQ3JlZGl0IFJpc2siLA0KICAgICAgIHkgPSAiSW5jb21lIChpbiBVU0QgMTAsMDAwKSIsDQogICAgICAgZmlsbCA9ICJDcmVkaXQgUmlzayIpICsNCiAgdGhlbWVfbWluaW1hbCgpDQoNCmdncGxvdChDcmVkaXRDYXJkLCBhZXMoeCA9IGNhcmQsIHkgPSBhZ2UsIGZpbGwgPSBjYXJkKSkgKw0KICBnZW9tX3Zpb2xpbih0cmltID0gRkFMU0UsIGFscGhhID0gMC43KSArDQogIGxhYnModGl0bGUgPSAiVmlvbGluIFBsb3Qgb2YgQWdlIGJ5IENyZWRpdCBSaXNrIiwNCiAgICAgICB4ID0gIkNyZWRpdCBSaXNrIiwNCiAgICAgICB5ID0gIkFnZSIsDQogICAgICAgZmlsbCA9ICJDcmVkaXQgUmlzayIpICsNCiAgdGhlbWVfbWluaW1hbCgpDQoNCmluY29tZV90ZXN0IDwtIHQudGVzdChpbmNvbWUgfiBjYXJkLCBkYXRhID0gQ3JlZGl0Q2FyZCkNCmV4cGVuZGl0dXJlX3Rlc3QgPC0gdC50ZXN0KGV4cGVuZGl0dXJlIH4gY2FyZCwgZGF0YSA9IENyZWRpdENhcmQpDQphZ2VfdGVzdCA8LSB0LnRlc3QoYWdlIH4gY2FyZCwgZGF0YSA9IENyZWRpdENhcmQpDQpyYXRpb190ZXN0IDwtIHQudGVzdChleHBlbmRpdHVyZSAvIGluY29tZSB+IGNhcmQsIGRhdGEgPSBDcmVkaXRDYXJkKQ0KDQpwcmludChpbmNvbWVfdGVzdCkNCg0KcHJpbnQoZXhwZW5kaXR1cmVfdGVzdCkNCg0KcHJpbnQoYWdlX3Rlc3QpDQoNCnByaW50KHJhdGlvX3Rlc3QpDQpgYGANCg==

Descriptive Statistics

Univariate Statistics

Zuzanna Warchoł, Piotr Cherek, Maksymilian Kamiński

2024-04-24

Data

Preprocessing

Frequency Tables

Basic plots

ggplot2 plots

RainCloud Plot

Faceting

Univariate Statistics

Summary tables

gtsummary

dfSummary

Data Frame Summary

apartments

Tidy Tables

A Bridge to Other Packages

Your turn!