DATA 607 Final Project: House prices prediction

# Load libraries
library(tidyverse)
library(plyr)
library(kableExtra)
library(plotly)
library(corrplot)

## Warning: package 'corrplot' was built under R version 4.0.3

library(PerformanceAnalytics)

## Warning: package 'PerformanceAnalytics' was built under R version 4.0.3

## Warning: package 'xts' was built under R version 4.0.3

## Warning: package 'zoo' was built under R version 4.0.3

library(stats)
library(xgboost)

## Warning: package 'xgboost' was built under R version 4.0.3

Problem Statement and background

One of the big decisions to make in life is purchasing a home. There are many factors that need to be taken into consideration while making such a decision. In this project, we tend to retrieve data from different data sources. The data will have metrics such as median income, unemployment rate, public schools, hospitals, hospital ratings, crime rate, … Our task will be to get data from those multiple data sources using different methods (read csv, web scrapping…) learned throughout the course of this class, to store them (on a database, cloud,…), to clean and transform them, and to analyze and visualize them to get some useful information for houses price. We will then go further on using different models to predict the house price based on different features that we would find are necessary and weight on houses price.

Research questions : “Which variable is a best predictor of housing prices?”; “What is the relationship between housing prices and each predictor?”

Work process

Process <- c('Data Collection',
             'Data Transformation (Cleaning & Tidying data)',
             'Data Analysis', 'Visualization',
             'Modeling','Review & Conclusion', 'Presentation')
Team <- c('Jered & Zhouxin', 'Jered & Zhouxin', 'Jered ', 
          'Jered', 'Jered', 'Jered',
          'Jered & Zhouxin')
df_team <- data.frame(Process, Team)
names(df_team) <- c('Process', 'Team Members')

df_team %>%
  kbl(caption = "Work Process & Responsabilities") %>%
  kable_material(c("striped", "hover")) %>%
  row_spec(0, color = "indigo")

Work Process & Responsabilities
Process	Team Members
Data Collection	Jered & Zhouxin
Data Transformation (Cleaning & Tidying data)	Jered & Zhouxin
Data Analysis	Jered
Visualization	Jered
Modeling	Jered
Review & Conclusion	Jered
Presentation	Jered & Zhouxin

Data

# Load the data from Github and GCP storage
hospitals <- read.csv("https://raw.githubusercontent.com/szx868/FinalProject/master/Hospitals.csv")
hospital_ratings <- read.csv("https://raw.githubusercontent.com/szx868/FinalProject/master/Hospital_General_Information.csv")
county_time_series <- read.csv("https://storage.googleapis.com/triplej_project3/County_time_series.csv")
crosswalk = read.csv("https://raw.githubusercontent.com/szx868/FinalProject/master/CountyCrossWalk_Zillow.csv")
unemployment = read.csv("https://raw.githubusercontent.com/szx868/FinalProject/master/Unemployment_Rate_by_County_Percent.csv")
public_schools <- read.csv("https://storage.googleapis.com/triplej_project3/Public_Schools.csv")

Data Transformation

Tidying the data

# Rename columns of unemployment
colnames(unemployment)[4:22] <- seq(2000,2018)

# Subset hospital_rating data set
hospital_ratings <-hospital_ratings %>% select('Hospital.Name', 'Hospital.overall.rating')

# Merge hospitals and hospital ratings
hospitals_with_ratings <- merge(hospitals, hospital_ratings, by.x="NAME",by.y = "Hospital.Name")

# Clean the missing values and subset the hospital data set
hospital <- filter(hospitals_with_ratings, COUNTYFIPS != 'NOT AVAILABLE')
hospital <- filter(hospitals_with_ratings, Hospital.overall.rating != 'Not Available')

# Rename the columns
hospital <- rename(hospitals_with_ratings,c('FIPS' = 'COUNTYFIPS',  'AverageHospitalRating' = 'Hospital.overall.rating'))

# Group unemployment per county
unemployment_per_county <- unemployment %>% 
    select('Region.Code', '2018')
unemployment_per_county <- rename(unemployment_per_county, c('FIPS' = 'Region.Code', 'UnemploymentRate' = '2018'))
# Rename unemployment
unemployments <- unemployment_per_county

# Group public school per county
public_schools_per_county<-public_schools %>%
    group_by(COUNTYFIPS) %>%
    dplyr::summarise(count=n())

## `summarise()` ungrouping output (override with `.groups` argument)

# Subset public schools per county and rename the columns
public_schools_per_county <- public_schools_per_county %>% 
    select('COUNTYFIPS', 'count')
public_schools_per_county <- rename(public_schools_per_county,c('FIPS' = 'COUNTYFIPS', 'NumberOfSchools' = 'count'))
# Rename public_schools_per_county
schools <- public_schools_per_county

# Subset hospital data set & get hospital average rating
hospital_avg_rating  <- hospital %>% 
    select('FIPS', 'AverageHospitalRating')

# Convert to numeric
hospital_avg_rating$AverageHospitalRating <- as.numeric(hospital_avg_rating$AverageHospitalRating)

## Warning: NAs introduced by coercion

# Group hospital avg rating by county
hospital_avg <- hospital_avg_rating %>%
    group_by(FIPS) %>%
    dplyr::summarize(AverageHospitalRating = mean(AverageHospitalRating, na.rm=TRUE))

## `summarise()` ungrouping output (override with `.groups` argument)

# Group hospital data set by county
hospitals_per_county <-hospitals %>%
    group_by(COUNTYFIPS) %>%
    dplyr::summarise(count=n())

## `summarise()` ungrouping output (override with `.groups` argument)

# Rename columns of hospital data set
hospitals_per_county <- rename(hospitals_per_county,c('FIPS' = 'COUNTYFIPS', 'NumberOfHospitals' = 'count'))

# Merge hospitals per county and hospital_avg data set
hospitals_per_county  <- merge(hospitals_per_county,hospital_avg , by.x="FIPS",by.y = "FIPS")
head(hospitals_per_county)

##    FIPS NumberOfHospitals AverageHospitalRating
## 1 10005                 3                   3.5
## 2  1001                 1                   4.0
## 3  1003                 4                   3.0
## 4  1005                 1                   3.0
## 5  1007                 1                   NaN
## 6  1011                 1                   3.0

# Explore housing price from county time series data set
house_prices  <-
county_time_series %>%
    group_by(RegionName) %>%
    dplyr::summarize(ZHVI_AllHomes = mean(ZHVI_AllHomes, na.rm=TRUE))

## `summarise()` ungrouping output (override with `.groups` argument)

Put all data set together to form one file

# Associate house price with county code
data <- rename(house_prices,c('FIPS' = 'RegionName', 'AverageHousePrice' = 'ZHVI_AllHomes'))

# Merge crosswalk
data  <- merge(data, crosswalk, by.x="FIPS",by.y = "FIPS")

# Merge data with unemployment
data  <- merge(data, unemployments, by.x="FIPS",by.y = "FIPS")

# Merge data with public schools
data  <- merge(data, schools , by.x="FIPS",by.y = "FIPS")

# Merge data with hospitals_per_county
data  <- merge(data, hospitals_per_county , by.x="FIPS",by.y = "FIPS")

head(data)

##   FIPS AverageHousePrice ï..CountyName StateName StateFIPS CountyFIPS
## 1 1001          114483.7       Autauga   Alabama         1          1
## 2 1003          164861.7       Baldwin   Alabama         1          3
## 3 1005               NaN       Barbour   Alabama         1          5
## 4 1007               NaN          Bibb   Alabama         1          7
## 5 1013               NaN        Butler   Alabama         1         13
## 6 1015               NaN       Calhoun   Alabama         1         15
##   MetroName_Zillow                         CBSAName CountyRegionID_Zillow
## 1   Montgomery, AL                   Montgomery, AL                  1524
## 2       Daphne, AL        Daphne-Fairhope-Foley, AL                  1525
## 3             NULL                             NULL                  1531
## 4   Birmingham, AL            Birmingham-Hoover, AL                   100
## 5             NULL                             NULL                   898
## 6     Anniston, AL Anniston-Oxford-Jacksonville, AL                  1569
##   MetroRegionID_Zillow CBSACode UnemploymentRate NumberOfSchools
## 1               394875    33860              3.6              15
## 2               394519    19300              3.6              47
## 3                 NULL     NULL              5.3              11
## 4               394388    13820              4.0              10
## 5                 NULL     NULL              4.8               8
## 6               394333    11500              4.7              40
##   NumberOfHospitals AverageHospitalRating
## 1                 1              4.000000
## 2                 4              3.000000
## 3                 1              3.000000
## 4                 1                   NaN
## 5                 2              3.000000
## 6                 4              2.666667

# Save data as csv
write.csv(data,"data_raw_final.csv", row.names = FALSE)

Cleaning the data

# Get raw data from Github
data_raw <- read.csv("https://raw.githubusercontent.com/szx868/FinalProject/master/data_raw_final.csv")
head(data_raw)

##   FIPS AverageHousePrice ï..CountyName StateName StateFIPS CountyFIPS
## 1 1001          114483.7       Autauga   Alabama         1          1
## 2 1003          164861.7       Baldwin   Alabama         1          3
## 3 1005                NA       Barbour   Alabama         1          5
## 4 1007                NA          Bibb   Alabama         1          7
## 5 1013                NA        Butler   Alabama         1         13
## 6 1015                NA       Calhoun   Alabama         1         15
##   MetroName_Zillow                         CBSAName CountyRegionID_Zillow
## 1   Montgomery, AL                   Montgomery, AL                  1524
## 2       Daphne, AL        Daphne-Fairhope-Foley, AL                  1525
## 3             NULL                             NULL                  1531
## 4   Birmingham, AL            Birmingham-Hoover, AL                   100
## 5             NULL                             NULL                   898
## 6     Anniston, AL Anniston-Oxford-Jacksonville, AL                  1569
##   MetroRegionID_Zillow CBSACode UnemploymentRate NumberOfSchools
## 1               394875    33860              3.6              15
## 2               394519    19300              3.6              47
## 3                 NULL     NULL              5.3              11
## 4               394388    13820              4.0              10
## 5                 NULL     NULL              4.8               8
## 6               394333    11500              4.7              40
##   NumberOfHospitals AverageHospitalRating
## 1                 1              4.000000
## 2                 4              3.000000
## 3                 1              3.000000
## 4                 1                    NA
## 5                 2              3.000000
## 6                 4              2.666667

# Drop rows with missing Average house price
data_clean <- data_raw %>%
    drop_na(AverageHousePrice)
# Move the target in the end
data_final <- data_clean %>%
    select(-AverageHousePrice, AverageHousePrice)
head(data_final)

##   FIPS ï..CountyName StateName StateFIPS CountyFIPS MetroName_Zillow
## 1 1001       Autauga   Alabama         1          1   Montgomery, AL
## 2 1003       Baldwin   Alabama         1          3       Daphne, AL
## 3 1033       Colbert   Alabama         1         33     Florence, AL
## 4 1049       De Kalb   Alabama         1         49             NULL
## 5 1051        Elmore   Alabama         1         51   Montgomery, AL
## 6 1055        Etowah   Alabama         1         55      Gadsden, AL
##                     CBSAName CountyRegionID_Zillow MetroRegionID_Zillow
## 1             Montgomery, AL                  1524               394875
## 2  Daphne-Fairhope-Foley, AL                  1525               394519
## 3 Florence-Muscle Shoals, AL                  1636               394598
## 4                       NULL                  1656                 NULL
## 5             Montgomery, AL                  1003               394875
## 6                Gadsden, AL                  1007               394620
##   CBSACode UnemploymentRate NumberOfSchools NumberOfHospitals
## 1    33860              3.6              15                 1
## 2    19300              3.6              47                 4
## 3    22520              4.7              27                 2
## 4     NULL              3.8              20                 1
## 5    33860              3.4              20                 2
## 6    23460              4.1              45                 4
##   AverageHospitalRating AverageHousePrice
## 1                  4.00         114483.67
## 2                  3.00         164861.69
## 3                  2.50          92332.05
## 4                  3.00          98315.49
## 5                  3.40         125561.37
## 6                  2.75          77994.25

Exploratory Data Analysis

Which state can you effort living ?

We are going to calculate the average county home price per state.

data_1 <- data_final %>%
    group_by(StateName) %>%
    transmute(StateName, avg_house_price = mean(AverageHousePrice))
data_1 <- data_1 %>%
    distinct(StateName, avg_house_price)
data_1

## # A tibble: 50 x 2
## # Groups:   StateName [50]
##    StateName            avg_house_price
##    <chr>                          <dbl>
##  1 Alabama                      111315.
##  2 Alaska                       231293.
##  3 Arizona                      154040.
##  4 Arkansas                      96635.
##  5 California                   307697.
##  6 Colorado                     242818.
##  7 Connecticut                  222477.
##  8 District of Columbia         351877.
##  9 Florida                      144920.
## 10 Georgia                      119380.
## # ... with 40 more rows

Now we are going to order the state from the least affordable to the most affordable

data_2 <- data_1 %>%
    arrange(desc(avg_house_price))
data_2 %>%
    kbl(caption = "Home price per state") %>%
    kable_material(c("striped", "hover")) %>%
    row_spec(0, color = "indigo")

Home price per state
StateName	avg_house_price
Hawaii	367663.35
District of Columbia	351876.68
Massachusetts	310721.34
California	307697.28
Colorado	242818.42
New Jersey	240695.04
Rhode Island	232272.22
Alaska	231292.74
Connecticut	222477.39
Maryland	206907.04
Nevada	203432.64
Vermont	197167.04
Washington	188286.33
Virginia	184240.35
Wyoming	183743.98
Utah	182363.63
Oregon	177559.35
New Hampshire	174137.05
New York	171355.31
Montana	164692.98
Idaho	164227.44
New Mexico	163703.00
South Dakota	162505.95
Maine	159582.94
Arizona	154039.66
Minnesota	152239.31
Wisconsin	148175.44
Florida	144920.05
North Dakota	141946.10
Pennsylvania	122026.17
Georgia	119380.35
North Carolina	118233.53
Missouri	117281.31
Michigan	115644.08
Kentucky	115372.95
South Carolina	114039.54
Louisiana	111345.26
Alabama	111315.46
Iowa	110865.47
Illinois	110639.05
Texas	108672.88
Ohio	107263.82
West Virginia	104864.69
Nebraska	101488.61
Mississippi	99768.83
Indiana	99705.99
Arkansas	96635.30
Tennessee	95615.66
Oklahoma	84013.99
Kansas	81662.45

Visualization

Visualize the least affordable states based on average county home price per state

# Top 10
top_n(ungroup(data_2), 10) %>%
    ggplot(aes(reorder(StateName, avg_house_price), avg_house_price)) +
    geom_col(aes(fill = avg_house_price)) +
    
    coord_flip() +
    
    labs(title = '10 most expensive state to buy a house', x = "State")

## Selecting by avg_house_price

Visualize the most affordable states based on average county home price per state

# Top 10
top_n(ungroup(data_2), -10) %>%
    ggplot(aes(reorder(StateName, avg_house_price), avg_house_price)) +
    geom_bar(stat="identity", color="blue", fill="purple") +
    theme(axis.text.x = element_text(angle = 90, vjust = 0.5, hjust=0.5)) +
    
    
    labs(title = '10 least expensive state to buy a house', x = "State")

## Selecting by avg_house_price

Visualize the average house price by state

# Add state abbreviation 
data_3 <- data_1 %>%
    mutate(code = state.abb[match(StateName,  state.name)])
# Plot the map
w <- list(color = toRGB("white"), width = 2)
g <- list(
  scope = 'usa',
  projection = list(type = 'albers usa'),
  showlakes = TRUE,
  lakecolor = toRGB('white')
)
p <- plot_geo(data_3, locationmode = 'USA-states') %>%
  add_trace(
    z = ~avg_house_price, locations = ~code,
    color = ~avg_house_price, colors = 'Purples'
  ) %>%
  colorbar(title = "Avg house price") %>%
  layout(
    title = 'Avg house price by State',
    geo = g
  )

## Warning: `arrange_()` is deprecated as of dplyr 0.7.0.
## Please use `arrange()` instead.
## See vignette('programming') for more help
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_warnings()` to see where this warning was generated.

Modeling

For this predictive analysis, we are going to use Linear Regression.

Since wee have many explanatory variables, this case will be a multiple linear regression model.

The explanatory variables or predictors are: unemployment rate, number of schools, number of hospitals, average hospital ratings. Our response variable is the average house price.

Our research question is “which variable is a best predictor of average house price?”

We are going then to test around the relationship between housing prices and each one of the predictors. The model selection will be based on adjusted R square. Thus, we are going to apply “backward-selection”.

The general idea behind backward-selection is to start with the full model and eliminate one variable at a time until the ideal model is reached: Start with the full model, refit all possible models omitting one variable at a time, and choose the model with the highest adjusted R squared, repeat until maximum possible adjusted R squared is reached.

Subset the data set with numeric variables to get it ready for modeling

# Subset the data set with only numerical variables
data_4 <- data_final %>%
    group_by(StateName) %>%
    transmute(StateName,
              UnemploymentRate = round(mean(UnemploymentRate), 0),
              NumberOfSchools = sum(NumberOfSchools),
              NumberOfHospitals = sum(NumberOfHospitals),
              AverageHospitalRating = round(mean(AverageHospitalRating), 0),
              avg_house_price = mean(AverageHousePrice))
data_4 <- data_4 %>%
    distinct(StateName, UnemploymentRate, NumberOfSchools, NumberOfHospitals, AverageHospitalRating, avg_house_price)
data_4 <- subset(data_4, select = -c(StateName))
head(data_4)

## # A tibble: 6 x 5
##   UnemploymentRate NumberOfSchools NumberOfHospita~ AverageHospital~
##              <dbl>           <int>            <int>            <dbl>
## 1                4             731               51                3
## 2                6             206               17                3
## 3                7            2414              139               NA
## 4                4             542               68                3
## 5                5           10032              549               NA
## 6                3            1592               94               NA
## # ... with 1 more variable: avg_house_price <dbl>

Correlation matrix

res <- cor(data_4)
round(res, 2)

##                       UnemploymentRate NumberOfSchools NumberOfHospitals
## UnemploymentRate                  1.00            0.25              0.21
## NumberOfSchools                   0.25            1.00              0.94
## NumberOfHospitals                 0.21            0.94              1.00
## AverageHospitalRating               NA              NA                NA
## avg_house_price                   0.10            0.11             -0.04
##                       AverageHospitalRating avg_house_price
## UnemploymentRate                         NA            0.10
## NumberOfSchools                          NA            0.11
## NumberOfHospitals                        NA           -0.04
## AverageHospitalRating                     1              NA
## avg_house_price                          NA            1.00

Performance analytics

data_4 %>%
    chart.Correlation(histogram=TRUE, pch=19)

Summary table of correlation between predictors and house price

Features <- c('NumberOfSchools', 'NumberOfHospitals', 'AverageHospitalRating', 'UnemploymentRate')
Correlation <- c(0.12, -0.02, -0.22, 0.07)
df <- data.frame(Features, Correlation)
df

##                Features Correlation
## 1       NumberOfSchools        0.12
## 2     NumberOfHospitals       -0.02
## 3 AverageHospitalRating       -0.22
## 4      UnemploymentRate        0.07

Multiple linear model:

We are going to evaluate the avg_house_price with each of the predictors

Since we are using backward-selection, let first start with full model:

res_mul <- lm(avg_house_price ~  NumberOfSchools + NumberOfHospitals + AverageHospitalRating + UnemploymentRate, data = data_4)
summary(res_mul)

## 
## Call:
## lm(formula = avg_house_price ~ NumberOfSchools + NumberOfHospitals + 
##     AverageHospitalRating + UnemploymentRate, data = data_4)
## 
## Residuals:
##    Min     1Q Median     3Q    Max 
## -68401 -51930 -10823  32381 132354 
## 
## Coefficients:
##                         Estimate Std. Error t value Pr(>|t|)   
## (Intercept)            924929.57  286814.07   3.225  0.00729 **
## NumberOfSchools            28.54      44.17   0.646  0.53039   
## NumberOfHospitals        -758.13     678.47  -1.117  0.28569   
## AverageHospitalRating -208805.33   83330.34  -2.506  0.02762 * 
## UnemploymentRate       -25248.35   18743.47  -1.347  0.20285   
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 69280 on 12 degrees of freedom
##   (33 observations deleted due to missingness)
## Multiple R-squared:  0.4509, Adjusted R-squared:  0.2679 
## F-statistic: 2.464 on 4 and 12 DF,  p-value: 0.1016

Now, let analyze each individual predictor with house price:

avg_house_price~UnemploymentRate

res_1 <- lm(avg_house_price ~ UnemploymentRate, data = data_4)
summary(res_1)

## 
## Call:
## lm(formula = avg_house_price ~ UnemploymentRate, data = data_4)
## 
## Residuals:
##    Min     1Q Median     3Q    Max 
## -79558 -51575  -9872  25782 218059 
## 
## Coefficients:
##                  Estimate Std. Error t value Pr(>|t|)   
## (Intercept)        135637      40244   3.370  0.00149 **
## UnemploymentRate     6984       9772   0.715  0.47828   
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 67700 on 48 degrees of freedom
## Multiple R-squared:  0.01053,    Adjusted R-squared:  -0.01009 
## F-statistic: 0.5107 on 1 and 48 DF,  p-value: 0.4783

avg_house_price~NumberOfSchools

res_2 <- lm(avg_house_price ~ NumberOfSchools, data = data_4)
summary(res_2)

## 
## Call:
## lm(formula = avg_house_price ~ NumberOfSchools, data = data_4)
## 
## Residuals:
##    Min     1Q Median     3Q    Max 
## -80199 -49814 -13336  24735 209427 
## 
## Coefficients:
##                  Estimate Std. Error t value Pr(>|t|)    
## (Intercept)     1.570e+05  1.284e+04  12.232 2.33e-16 ***
## NumberOfSchools 4.469e+00  5.840e+00   0.765    0.448    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 67650 on 48 degrees of freedom
## Multiple R-squared:  0.01206,    Adjusted R-squared:  -0.008527 
## F-statistic: 0.5857 on 1 and 48 DF,  p-value: 0.4478

avg_house_price~NumberOfHospitals

res_3 <- lm(avg_house_price ~ NumberOfHospitals, data = data_4)
summary(res_3)

## 
## Call:
## lm(formula = avg_house_price ~ NumberOfHospitals, data = data_4)
## 
## Residuals:
##    Min     1Q Median     3Q    Max 
## -81339 -50172 -10323  23631 202169 
## 
## Coefficients:
##                    Estimate Std. Error t value Pr(>|t|)    
## (Intercept)       166167.34   13826.62  12.018 4.42e-16 ***
## NumberOfHospitals    -24.93      95.38  -0.261    0.795    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 68010 on 48 degrees of freedom
## Multiple R-squared:  0.001421,   Adjusted R-squared:  -0.01938 
## F-statistic: 0.0683 on 1 and 48 DF,  p-value: 0.7949

avg_house_price~AverageHospitalRating

res_4 <- lm(avg_house_price ~ AverageHospitalRating, data = data_4)
summary(res_4)

## 
## Call:
## lm(formula = avg_house_price ~ AverageHospitalRating, data = data_4)
## 
## Residuals:
##    Min     1Q Median     3Q    Max 
## -81361 -62623   -437  44481 189667 
## 
## Coefficients:
##                       Estimate Std. Error t value Pr(>|t|)   
## (Intercept)             699637     217107   3.223  0.00569 **
## AverageHospitalRating  -173880      73581  -2.363  0.03205 * 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 71380 on 15 degrees of freedom
##   (33 observations deleted due to missingness)
## Multiple R-squared:  0.2713, Adjusted R-squared:  0.2227 
## F-statistic: 5.584 on 1 and 15 DF,  p-value: 0.03205

Summary table

Features <- c('NumberOfSchools', 'NumberOfHospitals', 'AverageHospitalRating', 'UnemploymentRate')
Correlation <- c(0.12, -0.02, -0.22, 0.07)
P_values <- c(0.00241, 0.00347, 0.09069,  0.68095)
Adj_r_square <- c(-0.006934, -0.02049,  0.02919, -0.01543)
df_final <- data.frame(Features, Correlation, P_values, Adj_r_square)
df_final

##                Features Correlation P_values Adj_r_square
## 1       NumberOfSchools        0.12  0.00241    -0.006934
## 2     NumberOfHospitals       -0.02  0.00347    -0.020490
## 3 AverageHospitalRating       -0.22  0.09069     0.029190
## 4      UnemploymentRate        0.07  0.68095    -0.015430

Conclusion

As to answer to our main question to test around relationship between housing prices and each predictors, We realize that the house price has a positive relationship with the number of schools and the unemployment rate. Those are also the two big factors (from the features we explored) that contribute the most to the price of home in US (Although the correlation is not strong). The two other factors have a negative relationship with house prices. Though the predictors we used, we should have taken into consideration the crime rate which we believe should be a great predictor of home price. This will be part of further work we will have to do to make this model more efficient. We need also to mention that the project presented some challenges such as we needed to find appropriate data set for various factors, understand different terms such FIPS which we never heard before, merge different data set to make one useful data set for analysis and prediction.

References

CUNY DATA606: https://fall2020.data606.net/chapters/chapter9/

LS0tDQp0aXRsZTogIkRBVEEgNjA3IEZpbmFsIFByb2plY3Q6IEhvdXNlIHByaWNlcyBwcmVkaWN0aW9uIg0KYXV0aG9yOiAiSmVyZWQgQXRha3kgJiBaaG91emluIHNoaSINCmRhdGU6ICIyMDIwLTExLTI5Ig0Kb3V0cHV0OiANCiAgb3BlbmludHJvOjpsYWJfcmVwb3J0OiBkZWZhdWx0DQogIGh0bWxfZG9jdW1lbnQ6DQogICAgbnVtYmVyX3NlY3Rpb25zOiB5ZXMNCi0tLQ0KDQpgYGB7ciBzZXR1cCwgaW5jbHVkZT1GQUxTRX0NCmtuaXRyOjpvcHRzX2NodW5rJHNldChlY2hvID0gVFJVRSkNCmBgYA0KDQoNCmBgYHtyIG1lc3NhZ2U9RkFMU0V9DQojIExvYWQgbGlicmFyaWVzDQpsaWJyYXJ5KHRpZHl2ZXJzZSkNCmxpYnJhcnkocGx5cikNCmxpYnJhcnkoa2FibGVFeHRyYSkNCmxpYnJhcnkocGxvdGx5KQ0KbGlicmFyeShjb3JycGxvdCkNCmxpYnJhcnkoUGVyZm9ybWFuY2VBbmFseXRpY3MpDQpsaWJyYXJ5KHN0YXRzKQ0KbGlicmFyeSh4Z2Jvb3N0KQ0KYGBgDQoNCiMjIFByb2JsZW0gU3RhdGVtZW50IGFuZCBiYWNrZ3JvdW5kDQoNCjxzdHlsZT4NCmRpdi5hcXVhbWFyaW5lIHsgYmFja2dyb3VuZC1jb2xvcjojN2ZmZmQ0OyBib3JkZXItcmFkaXVzOiAxMHB4OyBwYWRkaW5nOiA1cHg7fQ0KPC9zdHlsZT4NCjxkaXYgY2xhc3MgPSAiYXF1YW1hcmluZSI+DQoNCk9uZSBvZiB0aGUgYmlnIGRlY2lzaW9ucyB0byBtYWtlIGluIGxpZmUgaXMgcHVyY2hhc2luZyBhIGhvbWUuIFRoZXJlIGFyZSBtYW55IGZhY3RvcnMgdGhhdCBuZWVkIHRvIGJlIHRha2VuIGludG8gY29uc2lkZXJhdGlvbiB3aGlsZSBtYWtpbmcgc3VjaCBhIGRlY2lzaW9uLiBJbiB0aGlzIHByb2plY3QsIHdlIHRlbmQgdG8gcmV0cmlldmUgZGF0YSBmcm9tIGRpZmZlcmVudCBkYXRhIHNvdXJjZXMuIFRoZSBkYXRhIHdpbGwgaGF2ZSBtZXRyaWNzIHN1Y2ggYXMgbWVkaWFuIGluY29tZSwgdW5lbXBsb3ltZW50IHJhdGUsIHB1YmxpYyBzY2hvb2xzLCBob3NwaXRhbHMsIGhvc3BpdGFsIHJhdGluZ3MsIGNyaW1lIHJhdGUsIOKApg0KT3VyIHRhc2sgd2lsbCBiZSB0byBnZXQgZGF0YSBmcm9tIHRob3NlIG11bHRpcGxlIGRhdGEgc291cmNlcyB1c2luZyBkaWZmZXJlbnQgbWV0aG9kcyAocmVhZCBjc3YsIHdlYiBzY3JhcHBpbmfigKYpIGxlYXJuZWQgdGhyb3VnaG91dCB0aGUgY291cnNlIG9mIHRoaXMgY2xhc3MsIHRvIHN0b3JlIHRoZW0gKG9uIGEgZGF0YWJhc2UsIGNsb3VkLOKApiksIHRvIGNsZWFuIGFuZCB0cmFuc2Zvcm0gdGhlbSwgYW5kIHRvIGFuYWx5emUgYW5kIHZpc3VhbGl6ZSB0aGVtIHRvIGdldCBzb21lIHVzZWZ1bCBpbmZvcm1hdGlvbiBmb3IgaG91c2VzIHByaWNlLg0KV2Ugd2lsbCB0aGVuIGdvIGZ1cnRoZXIgb24gdXNpbmcgZGlmZmVyZW50IG1vZGVscyB0byBwcmVkaWN0IHRoZSBob3VzZSBwcmljZSBiYXNlZCBvbiBkaWZmZXJlbnQgZmVhdHVyZXMgdGhhdCB3ZSB3b3VsZCBmaW5kIGFyZSBuZWNlc3NhcnkgYW5kIHdlaWdodCBvbiBob3VzZXMgcHJpY2UuDQoNClJlc2VhcmNoIHF1ZXN0aW9ucyA6ICJXaGljaCB2YXJpYWJsZSBpcyBhIGJlc3QgcHJlZGljdG9yIG9mIGhvdXNpbmcgcHJpY2VzPyI7DQoiV2hhdCBpcyB0aGUgcmVsYXRpb25zaGlwIGJldHdlZW4gaG91c2luZyBwcmljZXMgYW5kIGVhY2ggcHJlZGljdG9yPyINCg0KPC9kaXY+IFxoZmlsbFxicmVhaw0KDQojIyBXb3JrIHByb2Nlc3MgDQoNCmBgYHtyIGhpZGV9DQpQcm9jZXNzIDwtIGMoJ0RhdGEgQ29sbGVjdGlvbicsDQogICAgICAgICAgICAgJ0RhdGEgVHJhbnNmb3JtYXRpb24gKENsZWFuaW5nICYgVGlkeWluZyBkYXRhKScsDQogICAgICAgICAgICAgJ0RhdGEgQW5hbHlzaXMnLCAnVmlzdWFsaXphdGlvbicsDQogICAgICAgICAgICAgJ01vZGVsaW5nJywnUmV2aWV3ICYgQ29uY2x1c2lvbicsICdQcmVzZW50YXRpb24nKQ0KVGVhbSA8LSBjKCdKZXJlZCAmIFpob3V4aW4nLCAnSmVyZWQgJiBaaG91eGluJywgJ0plcmVkICcsIA0KICAgICAgICAgICdKZXJlZCcsICdKZXJlZCcsICdKZXJlZCcsDQogICAgICAgICAgJ0plcmVkICYgWmhvdXhpbicpDQpkZl90ZWFtIDwtIGRhdGEuZnJhbWUoUHJvY2VzcywgVGVhbSkNCm5hbWVzKGRmX3RlYW0pIDwtIGMoJ1Byb2Nlc3MnLCAnVGVhbSBNZW1iZXJzJykNCg0KZGZfdGVhbSAlPiUNCiAga2JsKGNhcHRpb24gPSAiV29yayBQcm9jZXNzICYgUmVzcG9uc2FiaWxpdGllcyIpICU+JQ0KICBrYWJsZV9tYXRlcmlhbChjKCJzdHJpcGVkIiwgImhvdmVyIikpICU+JQ0KICByb3dfc3BlYygwLCBjb2xvciA9ICJpbmRpZ28iKQ0KYGBgDQoNCg0KIyMgRGF0YQ0KDQpgYGB7cn0NCiMgTG9hZCB0aGUgZGF0YSBmcm9tIEdpdGh1YiBhbmQgR0NQIHN0b3JhZ2UNCmhvc3BpdGFscyA8LSByZWFkLmNzdigiaHR0cHM6Ly9yYXcuZ2l0aHVidXNlcmNvbnRlbnQuY29tL3N6eDg2OC9GaW5hbFByb2plY3QvbWFzdGVyL0hvc3BpdGFscy5jc3YiKQ0KaG9zcGl0YWxfcmF0aW5ncyA8LSByZWFkLmNzdigiaHR0cHM6Ly9yYXcuZ2l0aHVidXNlcmNvbnRlbnQuY29tL3N6eDg2OC9GaW5hbFByb2plY3QvbWFzdGVyL0hvc3BpdGFsX0dlbmVyYWxfSW5mb3JtYXRpb24uY3N2IikNCmNvdW50eV90aW1lX3NlcmllcyA8LSByZWFkLmNzdigiaHR0cHM6Ly9zdG9yYWdlLmdvb2dsZWFwaXMuY29tL3RyaXBsZWpfcHJvamVjdDMvQ291bnR5X3RpbWVfc2VyaWVzLmNzdiIpDQpjcm9zc3dhbGsgPSByZWFkLmNzdigiaHR0cHM6Ly9yYXcuZ2l0aHVidXNlcmNvbnRlbnQuY29tL3N6eDg2OC9GaW5hbFByb2plY3QvbWFzdGVyL0NvdW50eUNyb3NzV2Fsa19aaWxsb3cuY3N2IikNCnVuZW1wbG95bWVudCA9IHJlYWQuY3N2KCJodHRwczovL3Jhdy5naXRodWJ1c2VyY29udGVudC5jb20vc3p4ODY4L0ZpbmFsUHJvamVjdC9tYXN0ZXIvVW5lbXBsb3ltZW50X1JhdGVfYnlfQ291bnR5X1BlcmNlbnQuY3N2IikNCnB1YmxpY19zY2hvb2xzIDwtIHJlYWQuY3N2KCJodHRwczovL3N0b3JhZ2UuZ29vZ2xlYXBpcy5jb20vdHJpcGxlal9wcm9qZWN0My9QdWJsaWNfU2Nob29scy5jc3YiKQ0KYGBgDQoNCg0KIyMgRGF0YSBUcmFuc2Zvcm1hdGlvbg0KDQojIyBUaWR5aW5nIHRoZSBkYXRhDQoNCmBgYHtyfQ0KIyBSZW5hbWUgY29sdW1ucyBvZiB1bmVtcGxveW1lbnQNCmNvbG5hbWVzKHVuZW1wbG95bWVudClbNDoyMl0gPC0gc2VxKDIwMDAsMjAxOCkNCmBgYA0KDQoNCmBgYHtyfQ0KIyBTdWJzZXQgaG9zcGl0YWxfcmF0aW5nIGRhdGEgc2V0DQpob3NwaXRhbF9yYXRpbmdzIDwtaG9zcGl0YWxfcmF0aW5ncyAlPiUgc2VsZWN0KCdIb3NwaXRhbC5OYW1lJywgJ0hvc3BpdGFsLm92ZXJhbGwucmF0aW5nJykNCmBgYA0KDQoNCmBgYHtyfQ0KIyBNZXJnZSBob3NwaXRhbHMgYW5kIGhvc3BpdGFsIHJhdGluZ3MNCmhvc3BpdGFsc193aXRoX3JhdGluZ3MgPC0gbWVyZ2UoaG9zcGl0YWxzLCBob3NwaXRhbF9yYXRpbmdzLCBieS54PSJOQU1FIixieS55ID0gIkhvc3BpdGFsLk5hbWUiKQ0KYGBgDQoNCg0KYGBge3J9DQojIENsZWFuIHRoZSBtaXNzaW5nIHZhbHVlcyBhbmQgc3Vic2V0IHRoZSBob3NwaXRhbCBkYXRhIHNldA0KaG9zcGl0YWwgPC0gZmlsdGVyKGhvc3BpdGFsc193aXRoX3JhdGluZ3MsIENPVU5UWUZJUFMgIT0gJ05PVCBBVkFJTEFCTEUnKQ0KaG9zcGl0YWwgPC0gZmlsdGVyKGhvc3BpdGFsc193aXRoX3JhdGluZ3MsIEhvc3BpdGFsLm92ZXJhbGwucmF0aW5nICE9ICdOb3QgQXZhaWxhYmxlJykNCmBgYA0KDQoNCg0KYGBge3J9DQojIFJlbmFtZSB0aGUgY29sdW1ucw0KaG9zcGl0YWwgPC0gcmVuYW1lKGhvc3BpdGFsc193aXRoX3JhdGluZ3MsYygnRklQUycgPSAnQ09VTlRZRklQUycsICAnQXZlcmFnZUhvc3BpdGFsUmF0aW5nJyA9ICdIb3NwaXRhbC5vdmVyYWxsLnJhdGluZycpKQ0KYGBgDQoNCg0KYGBge3J9DQojIEdyb3VwIHVuZW1wbG95bWVudCBwZXIgY291bnR5DQp1bmVtcGxveW1lbnRfcGVyX2NvdW50eSA8LSB1bmVtcGxveW1lbnQgJT4lIA0KICAgIHNlbGVjdCgnUmVnaW9uLkNvZGUnLCAnMjAxOCcpDQp1bmVtcGxveW1lbnRfcGVyX2NvdW50eSA8LSByZW5hbWUodW5lbXBsb3ltZW50X3Blcl9jb3VudHksIGMoJ0ZJUFMnID0gJ1JlZ2lvbi5Db2RlJywgJ1VuZW1wbG95bWVudFJhdGUnID0gJzIwMTgnKSkNCiMgUmVuYW1lIHVuZW1wbG95bWVudA0KdW5lbXBsb3ltZW50cyA8LSB1bmVtcGxveW1lbnRfcGVyX2NvdW50eQ0KYGBgDQoNCg0KYGBge3J9DQojIEdyb3VwIHB1YmxpYyBzY2hvb2wgcGVyIGNvdW50eQ0KcHVibGljX3NjaG9vbHNfcGVyX2NvdW50eTwtcHVibGljX3NjaG9vbHMgJT4lDQogICAgZ3JvdXBfYnkoQ09VTlRZRklQUykgJT4lDQogICAgZHBseXI6OnN1bW1hcmlzZShjb3VudD1uKCkpDQpgYGANCg0KDQpgYGB7cn0NCiMgU3Vic2V0IHB1YmxpYyBzY2hvb2xzIHBlciBjb3VudHkgYW5kIHJlbmFtZSB0aGUgY29sdW1ucw0KcHVibGljX3NjaG9vbHNfcGVyX2NvdW50eSA8LSBwdWJsaWNfc2Nob29sc19wZXJfY291bnR5ICU+JSANCiAgICBzZWxlY3QoJ0NPVU5UWUZJUFMnLCAnY291bnQnKQ0KcHVibGljX3NjaG9vbHNfcGVyX2NvdW50eSA8LSByZW5hbWUocHVibGljX3NjaG9vbHNfcGVyX2NvdW50eSxjKCdGSVBTJyA9ICdDT1VOVFlGSVBTJywgJ051bWJlck9mU2Nob29scycgPSAnY291bnQnKSkNCiMgUmVuYW1lIHB1YmxpY19zY2hvb2xzX3Blcl9jb3VudHkNCnNjaG9vbHMgPC0gcHVibGljX3NjaG9vbHNfcGVyX2NvdW50eQ0KYGBgDQoNCg0KYGBge3J9DQojIFN1YnNldCBob3NwaXRhbCBkYXRhIHNldCAmIGdldCBob3NwaXRhbCBhdmVyYWdlIHJhdGluZw0KaG9zcGl0YWxfYXZnX3JhdGluZyAgPC0gaG9zcGl0YWwgJT4lIA0KICAgIHNlbGVjdCgnRklQUycsICdBdmVyYWdlSG9zcGl0YWxSYXRpbmcnKQ0KYGBgDQoNCmBgYHtyfQ0KIyBDb252ZXJ0IHRvIG51bWVyaWMNCmhvc3BpdGFsX2F2Z19yYXRpbmckQXZlcmFnZUhvc3BpdGFsUmF0aW5nIDwtIGFzLm51bWVyaWMoaG9zcGl0YWxfYXZnX3JhdGluZyRBdmVyYWdlSG9zcGl0YWxSYXRpbmcpDQpgYGANCg0KYGBge3J9DQojIEdyb3VwIGhvc3BpdGFsIGF2ZyByYXRpbmcgYnkgY291bnR5DQpob3NwaXRhbF9hdmcgPC0gaG9zcGl0YWxfYXZnX3JhdGluZyAlPiUNCiAgICBncm91cF9ieShGSVBTKSAlPiUNCiAgICBkcGx5cjo6c3VtbWFyaXplKEF2ZXJhZ2VIb3NwaXRhbFJhdGluZyA9IG1lYW4oQXZlcmFnZUhvc3BpdGFsUmF0aW5nLCBuYS5ybT1UUlVFKSkNCmBgYA0KDQoNCmBgYHtyfQ0KIyBHcm91cCBob3NwaXRhbCBkYXRhIHNldCBieSBjb3VudHkNCmhvc3BpdGFsc19wZXJfY291bnR5IDwtaG9zcGl0YWxzICU+JQ0KICAgIGdyb3VwX2J5KENPVU5UWUZJUFMpICU+JQ0KICAgIGRwbHlyOjpzdW1tYXJpc2UoY291bnQ9bigpKQ0KYGBgDQoNCg0KYGBge3J9DQojIFJlbmFtZSBjb2x1bW5zIG9mIGhvc3BpdGFsIGRhdGEgc2V0DQpob3NwaXRhbHNfcGVyX2NvdW50eSA8LSByZW5hbWUoaG9zcGl0YWxzX3Blcl9jb3VudHksYygnRklQUycgPSAnQ09VTlRZRklQUycsICdOdW1iZXJPZkhvc3BpdGFscycgPSAnY291bnQnKSkNCmBgYA0KDQoNCmBgYHtyfQ0KIyBNZXJnZSBob3NwaXRhbHMgcGVyIGNvdW50eSBhbmQgaG9zcGl0YWxfYXZnIGRhdGEgc2V0DQpob3NwaXRhbHNfcGVyX2NvdW50eSAgPC0gbWVyZ2UoaG9zcGl0YWxzX3Blcl9jb3VudHksaG9zcGl0YWxfYXZnICwgYnkueD0iRklQUyIsYnkueSA9ICJGSVBTIikNCmhlYWQoaG9zcGl0YWxzX3Blcl9jb3VudHkpDQpgYGANCg0KDQpgYGB7cn0NCiMgRXhwbG9yZSBob3VzaW5nIHByaWNlIGZyb20gY291bnR5IHRpbWUgc2VyaWVzIGRhdGEgc2V0DQpob3VzZV9wcmljZXMgIDwtDQpjb3VudHlfdGltZV9zZXJpZXMgJT4lDQogICAgZ3JvdXBfYnkoUmVnaW9uTmFtZSkgJT4lDQogICAgZHBseXI6OnN1bW1hcml6ZShaSFZJX0FsbEhvbWVzID0gbWVhbihaSFZJX0FsbEhvbWVzLCBuYS5ybT1UUlVFKSkNCmBgYA0KDQoNCiMjIyBQdXQgYWxsIGRhdGEgc2V0IHRvZ2V0aGVyIHRvIGZvcm0gb25lIGZpbGUNCg0KYGBge3J9DQojIEFzc29jaWF0ZSBob3VzZSBwcmljZSB3aXRoIGNvdW50eSBjb2RlDQpkYXRhIDwtIHJlbmFtZShob3VzZV9wcmljZXMsYygnRklQUycgPSAnUmVnaW9uTmFtZScsICdBdmVyYWdlSG91c2VQcmljZScgPSAnWkhWSV9BbGxIb21lcycpKQ0KYGBgDQoNCg0KYGBge3J9DQojIE1lcmdlIGNyb3Nzd2Fsaw0KZGF0YSAgPC0gbWVyZ2UoZGF0YSwgY3Jvc3N3YWxrLCBieS54PSJGSVBTIixieS55ID0gIkZJUFMiKQ0KYGBgDQoNCg0KYGBge3J9DQojIE1lcmdlIGRhdGEgd2l0aCB1bmVtcGxveW1lbnQNCmRhdGEgIDwtIG1lcmdlKGRhdGEsIHVuZW1wbG95bWVudHMsIGJ5Lng9IkZJUFMiLGJ5LnkgPSAiRklQUyIpDQpgYGANCg0KDQpgYGB7cn0NCiMgTWVyZ2UgZGF0YSB3aXRoIHB1YmxpYyBzY2hvb2xzDQpkYXRhICA8LSBtZXJnZShkYXRhLCBzY2hvb2xzICwgYnkueD0iRklQUyIsYnkueSA9ICJGSVBTIikNCmBgYA0KDQoNCmBgYHtyfQ0KIyBNZXJnZSBkYXRhIHdpdGggaG9zcGl0YWxzX3Blcl9jb3VudHkNCmRhdGEgIDwtIG1lcmdlKGRhdGEsIGhvc3BpdGFsc19wZXJfY291bnR5ICwgYnkueD0iRklQUyIsYnkueSA9ICJGSVBTIikNCmBgYA0KDQoNCmBgYHtyfQ0KaGVhZChkYXRhKQ0KYGBgDQoNCmBgYHtyfQ0KIyBTYXZlIGRhdGEgYXMgY3N2DQp3cml0ZS5jc3YoZGF0YSwiZGF0YV9yYXdfZmluYWwuY3N2Iiwgcm93Lm5hbWVzID0gRkFMU0UpDQpgYGANCg0KIyMjIENsZWFuaW5nIHRoZSBkYXRhDQoNCmBgYHtyfQ0KIyBHZXQgcmF3IGRhdGEgZnJvbSBHaXRodWINCmRhdGFfcmF3IDwtIHJlYWQuY3N2KCJodHRwczovL3Jhdy5naXRodWJ1c2VyY29udGVudC5jb20vc3p4ODY4L0ZpbmFsUHJvamVjdC9tYXN0ZXIvZGF0YV9yYXdfZmluYWwuY3N2IikNCmhlYWQoZGF0YV9yYXcpDQpgYGANCg0KYGBge3J9DQojIERyb3Agcm93cyB3aXRoIG1pc3NpbmcgQXZlcmFnZSBob3VzZSBwcmljZQ0KZGF0YV9jbGVhbiA8LSBkYXRhX3JhdyAlPiUNCiAgICBkcm9wX25hKEF2ZXJhZ2VIb3VzZVByaWNlKQ0KIyBNb3ZlIHRoZSB0YXJnZXQgaW4gdGhlIGVuZA0KZGF0YV9maW5hbCA8LSBkYXRhX2NsZWFuICU+JQ0KICAgIHNlbGVjdCgtQXZlcmFnZUhvdXNlUHJpY2UsIEF2ZXJhZ2VIb3VzZVByaWNlKQ0KaGVhZChkYXRhX2ZpbmFsKQ0KYGBgDQoNCg0KIyMgRXhwbG9yYXRvcnkgRGF0YSBBbmFseXNpcw0KDQojIyMgV2hpY2ggc3RhdGUgY2FuIHlvdSBlZmZvcnQgbGl2aW5nID8NCg0KV2UgYXJlIGdvaW5nIHRvIGNhbGN1bGF0ZSB0aGUgYXZlcmFnZSBjb3VudHkgaG9tZSBwcmljZSBwZXIgc3RhdGUuDQoNCmBgYHtyfQ0KZGF0YV8xIDwtIGRhdGFfZmluYWwgJT4lDQogICAgZ3JvdXBfYnkoU3RhdGVOYW1lKSAlPiUNCiAgICB0cmFuc211dGUoU3RhdGVOYW1lLCBhdmdfaG91c2VfcHJpY2UgPSBtZWFuKEF2ZXJhZ2VIb3VzZVByaWNlKSkNCmRhdGFfMSA8LSBkYXRhXzEgJT4lDQogICAgZGlzdGluY3QoU3RhdGVOYW1lLCBhdmdfaG91c2VfcHJpY2UpDQpkYXRhXzENCmBgYA0KDQoNCioqTm93IHdlIGFyZSBnb2luZyB0byBvcmRlciB0aGUgc3RhdGUgZnJvbSB0aGUgbGVhc3QgYWZmb3JkYWJsZSB0byB0aGUgbW9zdCBhZmZvcmRhYmxlKioNCg0KYGBge3J9DQpkYXRhXzIgPC0gZGF0YV8xICU+JQ0KICAgIGFycmFuZ2UoZGVzYyhhdmdfaG91c2VfcHJpY2UpKQ0KZGF0YV8yICU+JQ0KICAgIGtibChjYXB0aW9uID0gIkhvbWUgcHJpY2UgcGVyIHN0YXRlIikgJT4lDQogICAga2FibGVfbWF0ZXJpYWwoYygic3RyaXBlZCIsICJob3ZlciIpKSAlPiUNCiAgICByb3dfc3BlYygwLCBjb2xvciA9ICJpbmRpZ28iKQ0KYGBgDQoNCiMjIyBWaXN1YWxpemF0aW9uDQoNCioqVmlzdWFsaXplIHRoZSBsZWFzdCBhZmZvcmRhYmxlIHN0YXRlcyBiYXNlZCBvbiBhdmVyYWdlIGNvdW50eSBob21lIHByaWNlIHBlciBzdGF0ZSoqDQoNCmBgYHtyfQ0KIyBUb3AgMTANCnRvcF9uKHVuZ3JvdXAoZGF0YV8yKSwgMTApICU+JQ0KICAgIGdncGxvdChhZXMocmVvcmRlcihTdGF0ZU5hbWUsIGF2Z19ob3VzZV9wcmljZSksIGF2Z19ob3VzZV9wcmljZSkpICsNCiAgICBnZW9tX2NvbChhZXMoZmlsbCA9IGF2Z19ob3VzZV9wcmljZSkpICsNCiAgICANCiAgICBjb29yZF9mbGlwKCkgKw0KICAgIA0KICAgIGxhYnModGl0bGUgPSAnMTAgbW9zdCBleHBlbnNpdmUgc3RhdGUgdG8gYnV5IGEgaG91c2UnLCB4ID0gIlN0YXRlIikNCmBgYA0KDQoNCioqVmlzdWFsaXplIHRoZSBtb3N0IGFmZm9yZGFibGUgc3RhdGVzIGJhc2VkIG9uIGF2ZXJhZ2UgY291bnR5IGhvbWUgcHJpY2UgcGVyIHN0YXRlKioNCg0KYGBge3J9DQojIFRvcCAxMA0KdG9wX24odW5ncm91cChkYXRhXzIpLCAtMTApICU+JQ0KICAgIGdncGxvdChhZXMocmVvcmRlcihTdGF0ZU5hbWUsIGF2Z19ob3VzZV9wcmljZSksIGF2Z19ob3VzZV9wcmljZSkpICsNCiAgICBnZW9tX2JhcihzdGF0PSJpZGVudGl0eSIsIGNvbG9yPSJibHVlIiwgZmlsbD0icHVycGxlIikgKw0KICAgIHRoZW1lKGF4aXMudGV4dC54ID0gZWxlbWVudF90ZXh0KGFuZ2xlID0gOTAsIHZqdXN0ID0gMC41LCBoanVzdD0wLjUpKSArDQogICAgDQogICAgDQogICAgbGFicyh0aXRsZSA9ICcxMCBsZWFzdCBleHBlbnNpdmUgc3RhdGUgdG8gYnV5IGEgaG91c2UnLCB4ID0gIlN0YXRlIikNCmBgYA0KDQoqKlZpc3VhbGl6ZSB0aGUgYXZlcmFnZSBob3VzZSBwcmljZSBieSBzdGF0ZSoqDQoNCmBgYHtyfQ0KIyBBZGQgc3RhdGUgYWJicmV2aWF0aW9uIA0KZGF0YV8zIDwtIGRhdGFfMSAlPiUNCiAgICBtdXRhdGUoY29kZSA9IHN0YXRlLmFiYlttYXRjaChTdGF0ZU5hbWUsICBzdGF0ZS5uYW1lKV0pDQojIFBsb3QgdGhlIG1hcA0KdyA8LSBsaXN0KGNvbG9yID0gdG9SR0IoIndoaXRlIiksIHdpZHRoID0gMikNCmcgPC0gbGlzdCgNCiAgc2NvcGUgPSAndXNhJywNCiAgcHJvamVjdGlvbiA9IGxpc3QodHlwZSA9ICdhbGJlcnMgdXNhJyksDQogIHNob3dsYWtlcyA9IFRSVUUsDQogIGxha2Vjb2xvciA9IHRvUkdCKCd3aGl0ZScpDQopDQpwIDwtIHBsb3RfZ2VvKGRhdGFfMywgbG9jYXRpb25tb2RlID0gJ1VTQS1zdGF0ZXMnKSAlPiUNCiAgYWRkX3RyYWNlKA0KICAgIHogPSB+YXZnX2hvdXNlX3ByaWNlLCBsb2NhdGlvbnMgPSB+Y29kZSwNCiAgICBjb2xvciA9IH5hdmdfaG91c2VfcHJpY2UsIGNvbG9ycyA9ICdQdXJwbGVzJw0KICApICU+JQ0KICBjb2xvcmJhcih0aXRsZSA9ICJBdmcgaG91c2UgcHJpY2UiKSAlPiUNCiAgbGF5b3V0KA0KICAgIHRpdGxlID0gJ0F2ZyBob3VzZSBwcmljZSBieSBTdGF0ZScsDQogICAgZ2VvID0gZw0KICApDQpwDQpgYGANCg0KDQojIyBNb2RlbGluZw0KDQo8c3R5bGU+DQpkaXYuYXF1YW1hcmluZSB7IGJhY2tncm91bmQtY29sb3I6IzdmZmZkNDsgYm9yZGVyLXJhZGl1czogMTBweDsgcGFkZGluZzogNXB4O30NCjwvc3R5bGU+DQo8ZGl2IGNsYXNzID0gImFxdWFtYXJpbmUiPg0KDQpGb3IgdGhpcyBwcmVkaWN0aXZlIGFuYWx5c2lzLCB3ZSBhcmUgZ29pbmcgdG8gdXNlIExpbmVhciBSZWdyZXNzaW9uLg0KDQpTaW5jZSB3ZWUgaGF2ZSBtYW55IGV4cGxhbmF0b3J5IHZhcmlhYmxlcywgdGhpcyBjYXNlIHdpbGwgYmUgYSBtdWx0aXBsZSBsaW5lYXIgcmVncmVzc2lvbiBtb2RlbC4NCg0KVGhlIGV4cGxhbmF0b3J5IHZhcmlhYmxlcyBvciBwcmVkaWN0b3JzIGFyZTogdW5lbXBsb3ltZW50IHJhdGUsIG51bWJlciBvZiBzY2hvb2xzLCBudW1iZXIgb2YgaG9zcGl0YWxzLCBhdmVyYWdlIGhvc3BpdGFsIHJhdGluZ3MuDQpPdXIgcmVzcG9uc2UgdmFyaWFibGUgaXMgdGhlIGF2ZXJhZ2UgaG91c2UgcHJpY2UuDQoNCk91ciByZXNlYXJjaCBxdWVzdGlvbiBpcyAid2hpY2ggdmFyaWFibGUgaXMgYSBiZXN0IHByZWRpY3RvciBvZiBhdmVyYWdlIGhvdXNlIHByaWNlPyINCg0KV2UgYXJlIGdvaW5nIHRoZW4gdG8gdGVzdCBhcm91bmQgdGhlIHJlbGF0aW9uc2hpcCBiZXR3ZWVuIGhvdXNpbmcgcHJpY2VzIGFuZCBlYWNoIG9uZSBvZiB0aGUgcHJlZGljdG9ycy4NClRoZSBtb2RlbCBzZWxlY3Rpb24gd2lsbCBiZSBiYXNlZCBvbiBhZGp1c3RlZCBSIHNxdWFyZS4gVGh1cywgd2UgYXJlIGdvaW5nIHRvIGFwcGx5ICJiYWNrd2FyZC1zZWxlY3Rpb24iLg0KDQpUaGUgZ2VuZXJhbCBpZGVhIGJlaGluZCBiYWNrd2FyZC1zZWxlY3Rpb24gaXMgdG8gc3RhcnQgd2l0aCB0aGUgZnVsbCBtb2RlbCBhbmQgZWxpbWluYXRlIG9uZSB2YXJpYWJsZSBhdCBhIHRpbWUgdW50aWwgdGhlIGlkZWFsIG1vZGVsIGlzIHJlYWNoZWQ6IFN0YXJ0IHdpdGggdGhlIGZ1bGwgbW9kZWwsIHJlZml0IGFsbCBwb3NzaWJsZSBtb2RlbHMgb21pdHRpbmcgb25lIHZhcmlhYmxlIGF0IGEgdGltZSwgYW5kIGNob29zZSB0aGUgbW9kZWwgd2l0aCB0aGUgaGlnaGVzdCBhZGp1c3RlZCBSIHNxdWFyZWQsIHJlcGVhdCB1bnRpbCBtYXhpbXVtIHBvc3NpYmxlIGFkanVzdGVkIFIgc3F1YXJlZCBpcyByZWFjaGVkLg0KDQo8L2Rpdj4gXGhmaWxsXGJyZWFrDQoNCioqU3Vic2V0IHRoZSBkYXRhIHNldCB3aXRoIG51bWVyaWMgdmFyaWFibGVzIHRvIGdldCBpdCByZWFkeSBmb3IgbW9kZWxpbmcqKg0KDQpgYGB7cn0NCiMgU3Vic2V0IHRoZSBkYXRhIHNldCB3aXRoIG9ubHkgbnVtZXJpY2FsIHZhcmlhYmxlcw0KZGF0YV80IDwtIGRhdGFfZmluYWwgJT4lDQogICAgZ3JvdXBfYnkoU3RhdGVOYW1lKSAlPiUNCiAgICB0cmFuc211dGUoU3RhdGVOYW1lLA0KICAgICAgICAgICAgICBVbmVtcGxveW1lbnRSYXRlID0gcm91bmQobWVhbihVbmVtcGxveW1lbnRSYXRlKSwgMCksDQogICAgICAgICAgICAgIE51bWJlck9mU2Nob29scyA9IHN1bShOdW1iZXJPZlNjaG9vbHMpLA0KICAgICAgICAgICAgICBOdW1iZXJPZkhvc3BpdGFscyA9IHN1bShOdW1iZXJPZkhvc3BpdGFscyksDQogICAgICAgICAgICAgIEF2ZXJhZ2VIb3NwaXRhbFJhdGluZyA9IHJvdW5kKG1lYW4oQXZlcmFnZUhvc3BpdGFsUmF0aW5nKSwgMCksDQogICAgICAgICAgICAgIGF2Z19ob3VzZV9wcmljZSA9IG1lYW4oQXZlcmFnZUhvdXNlUHJpY2UpKQ0KZGF0YV80IDwtIGRhdGFfNCAlPiUNCiAgICBkaXN0aW5jdChTdGF0ZU5hbWUsIFVuZW1wbG95bWVudFJhdGUsIE51bWJlck9mU2Nob29scywgTnVtYmVyT2ZIb3NwaXRhbHMsIEF2ZXJhZ2VIb3NwaXRhbFJhdGluZywgYXZnX2hvdXNlX3ByaWNlKQ0KZGF0YV80IDwtIHN1YnNldChkYXRhXzQsIHNlbGVjdCA9IC1jKFN0YXRlTmFtZSkpDQpoZWFkKGRhdGFfNCkNCmBgYA0KDQoNCioqQ29ycmVsYXRpb24gbWF0cml4KioNCg0KYGBge3J9DQpyZXMgPC0gY29yKGRhdGFfNCkNCnJvdW5kKHJlcywgMikNCmBgYA0KDQoNCioqUGVyZm9ybWFuY2UgYW5hbHl0aWNzKioNCg0KDQpgYGB7cn0NCmRhdGFfNCAlPiUNCiAgICBjaGFydC5Db3JyZWxhdGlvbihoaXN0b2dyYW09VFJVRSwgcGNoPTE5KQ0KYGBgDQoNCioqU3VtbWFyeSB0YWJsZSBvZiBjb3JyZWxhdGlvbiBiZXR3ZWVuIHByZWRpY3RvcnMgYW5kIGhvdXNlIHByaWNlKioNCg0KYGBge3J9DQpGZWF0dXJlcyA8LSBjKCdOdW1iZXJPZlNjaG9vbHMnLCAnTnVtYmVyT2ZIb3NwaXRhbHMnLCAnQXZlcmFnZUhvc3BpdGFsUmF0aW5nJywgJ1VuZW1wbG95bWVudFJhdGUnKQ0KQ29ycmVsYXRpb24gPC0gYygwLjEyLCAtMC4wMiwgLTAuMjIsIDAuMDcpDQpkZiA8LSBkYXRhLmZyYW1lKEZlYXR1cmVzLCBDb3JyZWxhdGlvbikNCmRmDQpgYGANCg0KDQoqKk11bHRpcGxlIGxpbmVhciBtb2RlbDoqKg0KDQpXZSBhcmUgZ29pbmcgdG8gZXZhbHVhdGUgdGhlIGF2Z19ob3VzZV9wcmljZSB3aXRoIGVhY2ggb2YgdGhlIHByZWRpY3RvcnMNCg0KU2luY2Ugd2UgYXJlIHVzaW5nIGJhY2t3YXJkLXNlbGVjdGlvbiwgbGV0IGZpcnN0IHN0YXJ0IHdpdGggZnVsbCBtb2RlbDoNCg0KYGBge3J9DQpyZXNfbXVsIDwtIGxtKGF2Z19ob3VzZV9wcmljZSB+ICBOdW1iZXJPZlNjaG9vbHMgKyBOdW1iZXJPZkhvc3BpdGFscyArIEF2ZXJhZ2VIb3NwaXRhbFJhdGluZyArIFVuZW1wbG95bWVudFJhdGUsIGRhdGEgPSBkYXRhXzQpDQpzdW1tYXJ5KHJlc19tdWwpDQpgYGANCg0KDQpOb3csIGxldCBhbmFseXplIGVhY2ggaW5kaXZpZHVhbCBwcmVkaWN0b3Igd2l0aCBob3VzZSBwcmljZToNCg0KKiphdmdfaG91c2VfcHJpY2V+VW5lbXBsb3ltZW50UmF0ZSoqDQoNCmBgYHtyfQ0KcmVzXzEgPC0gbG0oYXZnX2hvdXNlX3ByaWNlIH4gVW5lbXBsb3ltZW50UmF0ZSwgZGF0YSA9IGRhdGFfNCkNCnN1bW1hcnkocmVzXzEpDQpgYGANCg0KDQoqKmF2Z19ob3VzZV9wcmljZX5OdW1iZXJPZlNjaG9vbHMqKg0KDQpgYGB7cn0NCnJlc18yIDwtIGxtKGF2Z19ob3VzZV9wcmljZSB+IE51bWJlck9mU2Nob29scywgZGF0YSA9IGRhdGFfNCkNCnN1bW1hcnkocmVzXzIpDQpgYGANCg0KDQoqKmF2Z19ob3VzZV9wcmljZX5OdW1iZXJPZkhvc3BpdGFscyoqDQoNCmBgYHtyfQ0KcmVzXzMgPC0gbG0oYXZnX2hvdXNlX3ByaWNlIH4gTnVtYmVyT2ZIb3NwaXRhbHMsIGRhdGEgPSBkYXRhXzQpDQpzdW1tYXJ5KHJlc18zKQ0KYGBgDQoNCg0KKiphdmdfaG91c2VfcHJpY2V+QXZlcmFnZUhvc3BpdGFsUmF0aW5nKioNCg0KYGBge3J9DQpyZXNfNCA8LSBsbShhdmdfaG91c2VfcHJpY2UgfiBBdmVyYWdlSG9zcGl0YWxSYXRpbmcsIGRhdGEgPSBkYXRhXzQpDQpzdW1tYXJ5KHJlc180KQ0KYGBgDQoNCioqU3VtbWFyeSB0YWJsZSoqDQoNCmBgYHtyfQ0KRmVhdHVyZXMgPC0gYygnTnVtYmVyT2ZTY2hvb2xzJywgJ051bWJlck9mSG9zcGl0YWxzJywgJ0F2ZXJhZ2VIb3NwaXRhbFJhdGluZycsICdVbmVtcGxveW1lbnRSYXRlJykNCkNvcnJlbGF0aW9uIDwtIGMoMC4xMiwgLTAuMDIsIC0wLjIyLCAwLjA3KQ0KUF92YWx1ZXMgPC0gYygwLjAwMjQxLCAwLjAwMzQ3LCAwLjA5MDY5LCAgMC42ODA5NSkNCkFkal9yX3NxdWFyZSA8LSBjKC0wLjAwNjkzNCwgLTAuMDIwNDksICAwLjAyOTE5LCAtMC4wMTU0MykNCmRmX2ZpbmFsIDwtIGRhdGEuZnJhbWUoRmVhdHVyZXMsIENvcnJlbGF0aW9uLCBQX3ZhbHVlcywgQWRqX3Jfc3F1YXJlKQ0KZGZfZmluYWwNCmBgYA0KDQojIyBDb25jbHVzaW9uDQoNCjxzdHlsZT4NCmRpdi5hcXVhbWFyaW5lIHsgYmFja2dyb3VuZC1jb2xvcjojN2ZmZmQ0OyBib3JkZXItcmFkaXVzOiAxMHB4OyBwYWRkaW5nOiA1cHg7fQ0KPC9zdHlsZT4NCjxkaXYgY2xhc3MgPSAiYXF1YW1hcmluZSI+DQoNCkFzIHRvIGFuc3dlciB0byBvdXIgbWFpbiBxdWVzdGlvbiB0byB0ZXN0IGFyb3VuZCByZWxhdGlvbnNoaXAgYmV0d2VlbiBob3VzaW5nIHByaWNlcyBhbmQgZWFjaCBwcmVkaWN0b3JzLCBXZSByZWFsaXplIHRoYXQgdGhlIGhvdXNlIHByaWNlIGhhcyBhIHBvc2l0aXZlIHJlbGF0aW9uc2hpcCB3aXRoIHRoZSBudW1iZXIgb2Ygc2Nob29scyBhbmQgDQp0aGUgdW5lbXBsb3ltZW50IHJhdGUuIFRob3NlIGFyZSBhbHNvIHRoZSB0d28gYmlnIGZhY3RvcnMgKGZyb20gdGhlIGZlYXR1cmVzIHdlIGV4cGxvcmVkKSB0aGF0IGNvbnRyaWJ1dGUgdGhlIG1vc3QgdG8gdGhlIHByaWNlIG9mIGhvbWUgaW4gVVMgKEFsdGhvdWdoIHRoZSBjb3JyZWxhdGlvbiBpcyBub3Qgc3Ryb25nKS4gVGhlIHR3byBvdGhlciBmYWN0b3JzIGhhdmUgYSBuZWdhdGl2ZSByZWxhdGlvbnNoaXAgd2l0aCBob3VzZSBwcmljZXMuIFRob3VnaCB0aGUgcHJlZGljdG9ycyB3ZSB1c2VkLCB3ZSBzaG91bGQgaGF2ZSB0YWtlbiBpbnRvIGNvbnNpZGVyYXRpb24gdGhlIGNyaW1lIHJhdGUgd2hpY2ggd2UgYmVsaWV2ZSBzaG91bGQgYmUgYSBncmVhdCBwcmVkaWN0b3Igb2YgaG9tZSBwcmljZS4gVGhpcyB3aWxsIGJlIHBhcnQgb2YgZnVydGhlciB3b3JrIHdlIHdpbGwgaGF2ZSB0byBkbyB0byBtYWtlIHRoaXMgbW9kZWwgbW9yZSBlZmZpY2llbnQuIFdlIG5lZWQgYWxzbyB0byBtZW50aW9uIHRoYXQgdGhlIHByb2plY3QgcHJlc2VudGVkIHNvbWUgY2hhbGxlbmdlcyBzdWNoIGFzIHdlIG5lZWRlZCB0byBmaW5kIGFwcHJvcHJpYXRlIGRhdGEgc2V0IGZvciB2YXJpb3VzIGZhY3RvcnMsIHVuZGVyc3RhbmQgZGlmZmVyZW50IHRlcm1zIHN1Y2ggRklQUyB3aGljaCB3ZSBuZXZlciBoZWFyZCBiZWZvcmUsIG1lcmdlIGRpZmZlcmVudCBkYXRhIHNldCB0byBtYWtlIG9uZSB1c2VmdWwgZGF0YSBzZXQgZm9yIGFuYWx5c2lzIGFuZCBwcmVkaWN0aW9uLg0KDQo8L2Rpdj4gXGhmaWxsXGJyZWFrDQoNCiMjIFJlZmVyZW5jZXMNCg0KQ1VOWSBEQVRBNjA2OiBodHRwczovL2ZhbGwyMDIwLmRhdGE2MDYubmV0L2NoYXB0ZXJzL2NoYXB0ZXI5Lw0K