Introduction

Growing up in Iceland, I have been exposed to a lot of earthquakes in my life. Iceland is sitting between two tectonic plates. The Eurasian plate and the North American plate. The boundary between those plates is a Divergent Plate Boundary and their biggest characteristics are volcanoes. When the magma is creeping upwards, there are cracks in the ground that cause earthquakes. I have always been fascinated with earthquakes and thought this would be a great opportunity to explore the topic and enhance my education on it.

Problem Statement

Scientists have never been able to predict an earthquake, but with the evolution of technology the seismatic tools are advanced enough to detect seismic waves, calculate the maximum expected shaking and send alerts to near area to warn of any damage. This advancement is very important as it has saved a lot of lives over the past years. The problems that we will be researching is what factors can affect the magnitude of an earthquake event?

The Data

The dataset, retrieved Kaggle.com, contains 1000 rows and 19 columns before modification. The data spans from January 1st, 1995 to January 1st, 2023.

Raw Data

earthquake_df = read.csv("earthquake_1995-2023.csv")
attach(earthquake_df)
str(earthquake_df)

## 'data.frame':    1000 obs. of  19 variables:
##  $ title    : chr  "M 6.5 - 42 km W of Sola, Vanuatu" "M 6.5 - 43 km S of Intipucá, El Salvador" "M 6.6 - 25 km ESE of Loncopué, Argentina" "M 7.2 - 98 km S of Sand Point, Alaska" ...
##  $ magnitude: num  6.5 6.5 6.6 7.2 7.3 6.6 6.9 7.2 6.6 7.1 ...
##  $ date_time: chr  "16-08-2023 12:47" "19-07-2023 00:22" "17-07-2023 03:05" "16-07-2023 06:48" ...
##  $ cdi      : int  7 8 7 6 0 5 4 8 6 3 ...
##  $ mmi      : int  4 6 5 6 5 4 4 6 6 4 ...
##  $ alert    : chr  "green" "yellow" "green" "green" ...
##  $ tsunami  : int  0 0 0 1 1 1 1 1 1 1 ...
##  $ sig      : int  657 775 899 860 820 802 741 804 733 777 ...
##  $ net      : chr  "us" "us" "us" "us" ...
##  $ nst      : int  114 92 70 173 79 95 136 85 50 98 ...
##  $ dmin     : num  7.177 0.679 1.634 0.907 0.879 ...
##  $ gap      : num  25 40 28 36 173 ...
##  $ magType  : chr  "mww" "mww" "mww" "mww" ...
##  $ depth    : num  193 69.7 171.4 32.6 21 ...
##  $ latitude : num  -13.9 12.8 -38.2 54.4 54.5 ...
##  $ longitude: num  167.2 -88.1 -70.4 -160.7 -160.8 ...
##  $ location : chr  "Sola, Vanuatu" "Intipucá, El Salvador" "Loncopué, Argentina" "Sand Point, Alaska" ...
##  $ continent: chr  "" "" "South America" "" ...
##  $ country  : chr  "Vanuatu" "" "Argentina" "" ...

Data Preperation

For a further analysis, it could be beneficial to use the date or the time. So we will seperate date_time column into two columns called ‘time’ and ‘date’.
The type of these columns have been converted into a factor
1. alert
2. tsunami
3. magType

# Converting tsunami to a factor variable
earthquake_df$tsunami = as.factor(earthquake_df$tsunami)
# Converting alert to a factor variable
earthquake_df$alert = as.factor(earthquake_df$alert)
# Converting magType to a factor variable
earthquake_df$magType = as.factor(earthquake_df$magType)
# Splitting time_date into two seperate columns called date
earthquake_df$time <- sapply(strsplit(as.character(earthquake_df$date_time), " "), "[[", 2)
earthquake_df$date <- sapply(strsplit(as.character(earthquake_df$date_time), " "), "[[", 1)
# Converting the date column into a date variable
earthquake_df$date = as.Date(earthquake_df$date, format = "%d-%m-%Y")
# removing the time_date variable
# removing location due to having longitude and latitude
# removing continent due to having too many null variables
# removing title due to being unnecessary
earthquake_df = earthquake_df[,c(-1, -3, -17, -18)]

str(earthquake_df)

## 'data.frame':    1000 obs. of  17 variables:
##  $ magnitude: num  6.5 6.5 6.6 7.2 7.3 6.6 6.9 7.2 6.6 7.1 ...
##  $ cdi      : int  7 8 7 6 0 5 4 8 6 3 ...
##  $ mmi      : int  4 6 5 6 5 4 4 6 6 4 ...
##  $ alert    : Factor w/ 5 levels "","green","orange",..: 2 5 2 2 1 2 2 2 2 2 ...
##  $ tsunami  : Factor w/ 2 levels "0","1": 1 1 1 2 2 2 2 2 2 2 ...
##  $ sig      : int  657 775 899 860 820 802 741 804 733 777 ...
##  $ net      : chr  "us" "us" "us" "us" ...
##  $ nst      : int  114 92 70 173 79 95 136 85 50 98 ...
##  $ dmin     : num  7.177 0.679 1.634 0.907 0.879 ...
##  $ gap      : num  25 40 28 36 173 ...
##  $ magType  : Factor w/ 9 levels "mb","md","Mi",..: 9 9 9 9 3 9 9 9 9 9 ...
##  $ depth    : num  193 69.7 171.4 32.6 21 ...
##  $ latitude : num  -13.9 12.8 -38.2 54.4 54.5 ...
##  $ longitude: num  167.2 -88.1 -70.4 -160.7 -160.8 ...
##  $ country  : chr  "Vanuatu" "" "Argentina" "" ...
##  $ time     : chr  "12:47" "00:22" "03:05" "06:48" ...
##  $ date     : Date, format: "2023-08-16" "2023-07-19" ...

Deleted columns
1. Title - unnecessary information
2. Location - unnecessary since we have the coordinates
3. continent - contains too many missing values
After modification, the dataset contains 17 columns.

Column Description

Des <- data.frame(
  Column = c("Magnitude","CDI", "MMI", "Alert", "Tsunami", "Sig", "Net", "Nst", "Dmin", "Gap", 
             "MagType", "Depth", "Latitude/Longitude", "Country", "Time", "Date"),
  Type = c("Num","Int", "Int", "Factor", "Factor", "Int", "Chr", "Int", "Num", "Num", 
             "Factor", "Num", "Num", "Chr", "Chr", "Date"),
  Description = c(
    "The Magnitude in Richter Scale of the Event",
    "Community Decimal Intensity) Maximum reported intensity for the event range",
    "(Modified Mercalli Intensity) Maximum estimated instrumental intensity for the event",
    "Alert level, Green - Yellow - Orange - Red",
    "'1' for events in oceanic area, '0' otherwise",
    "Significance of event, calculated from the magnitude, maximum mmi, felt reports and estimated impact",
    "ID of a data contributer",
    "Total number of seismic stations used to determine events location",
    "Horizontal distance from the epicenter to the nearest station",
    "The largest azimuthal gap between azimuthally adjacent stations",
    "The method/algorithm used to calculate the magnitude of the event",
    "The depth of the start of the earthquake",
    "Coordinate system of the location of the event",
    "Affected country",
    "Time of the event",
    "Date of the event"))

datatable(Des, rownames = FALSE, caption = 'Column Description', options = list(theme = 'bootstrap'))

In the further research, magnitude and depth will be used as the response variables
Before any modelling, the data is split into train and test data with the ratio of 1:4

# Splitting the data into train and test
set.seed(1)
train = sample(1:nrow(earthquake_df), 750)
earthquake_train = earthquake_df[train,]
earthquake_test = earthquake_df[-train,]

tsunami_train = earthquake_df$tsunami[train]
tsunami_test = earthquake_df$tsunami[-train]

Exploratory Data Analysis

Summary

# Summary statistics
summary(earthquake_df[, c("magnitude", "cdi", "mmi", "sig", "nst", "dmin", "gap", "depth")])

##    magnitude         cdi             mmi              sig        
##  Min.   :6.50   Min.   :0.000   Min.   : 1.000   Min.   : 650.0  
##  1st Qu.:6.60   1st Qu.:0.000   1st Qu.: 5.000   1st Qu.: 691.0  
##  Median :6.80   Median :4.000   Median : 6.000   Median : 744.0  
##  Mean   :6.94   Mean   :3.605   Mean   : 6.027   Mean   : 847.9  
##  3rd Qu.:7.10   3rd Qu.:7.000   3rd Qu.: 7.000   3rd Qu.: 874.2  
##  Max.   :9.10   Max.   :9.000   Max.   :10.000   Max.   :2910.0  
##       nst             dmin             gap             depth       
##  Min.   :  0.0   Min.   : 0.000   Min.   :  0.00   Min.   :  2.70  
##  1st Qu.:  0.0   1st Qu.: 0.000   1st Qu.:  0.00   1st Qu.: 16.00  
##  Median :  0.0   Median : 0.000   Median : 18.00   Median : 29.00  
##  Mean   :193.9   Mean   : 1.125   Mean   : 20.93   Mean   : 74.61  
##  3rd Qu.:403.0   3rd Qu.: 1.549   3rd Qu.: 27.00   3rd Qu.: 55.00  
##  Max.   :934.0   Max.   :17.654   Max.   :239.00   Max.   :670.81

The recorded earthquakes in this dataset have the magnitudes ranging from 6.50 to 9.10. One interesting observation from this dataset is the mean magnitude, which is very close to the minimum value. This suggests that there are relatively few earthquake with a magnitude exceeding 8 and 9. Additional observations that are interesting to look at the variance of the dept, ranging from 2 to 670. In the upcoming research, exploring this variable and test if it has impact on earthquake magnitude could be an interesting topic.

Plots

# Distribution of Magnitude
ggplot(earthquake_df, aes(x = magnitude)) +
  geom_histogram(binwidth = 0.5, fill = "skyblue", color = "black") +
  labs(title = "Distribution of Earthquake Magnitudes", x = "Magnitude (Richter Scale)", y = "Frequency") +
  theme_ipsum()

This plot shows the distribution of the earthquake magnitudes and as mentioned above, it shows that as the magnitude increases, the frequency decreases as well. That examination strengthens our observation from earlier.

# Frequency over time
ggplot(earthquake_df, aes(x = date, fill= 'skyblue')) +
  geom_histogram(binwidth = 30, fill = "skyblue", color = "black") +
  labs(title = "Earthquake Frequency Over Time",
       x = "Date",
       y = "Frequency") +
  theme_ipsum()

One interesting factor in this plot is the frequency of events every 5 years. It seems to increase a lot and then go back down. However, around the years between 2012 and 2018 they seem to increase by a severe amount. That leads to speculations on if there was something specific happening in the world those years that made the frequency exceed?
Since we have the latitude and longitude coordinates, we are able to mark the exact location of the earthquakes on a world map.

# Geographical distribution

# Making the map
my_map <- leaflet(data = earthquake_df) %>%
  addTiles() %>%
  setView(lng = mean(earthquake_df$longitude), lat = mean(earthquake_df$latitude), zoom = 1)

# Adding the earthquakes
my_map <- my_map %>%
  addCircleMarkers(
    lng = ~longitude,
    lat = ~latitude,
    radius = 5,
    color = ~colorNumeric(palette = "RdYlBu", domain = earthquake_df$magnitude)(magnitude),
    popup = ~as.character(magnitude)
  )

my_map

From looking at the map, you can roughly see the outlines of the tectonic plates. As said earlier, characteristics of plate boundaries are earthquakes. Many of the earthquakes in the data are marked around the Pacific Plate. The plate forms a convergent boundary which has a characteristics of earthquakes.

Correlation

# Correlation matrix
cor_matrix <- cor(earthquake_df[, c("magnitude", "cdi", "mmi", "sig", "nst", "dmin", "gap", "depth", "latitude", "longitude")])
corrplot::corrplot(cor_matrix, method = "color")

Looking at the correlation matrix, it is interesting to see the upper left corner where magnitude, cdi, mmi and sig have the highest correlation. For further research, it would be interesting at looking the linear relationships between those variables.

Modelling

Magnitude and Significance

Graphical Analysis

# Plot of linear relationship between Magnitude and Significance
ggplot(earthquake_df, aes(x = magnitude, y = sig, color = tsunami)) +
  geom_point(alpha = 0.7, size = 3) +
  geom_smooth(method = "lm", se = FALSE, color = 'red') +
  scale_color_manual(values = c("0" = "skyblue", "1" = "pink"), name = "Tsunami") +
  labs(
    title = "The Linear Relationship between Magnitude and Significance",
    x = "Magnitude (Richter Scale)",
    y = "Significance"
  ) +
  theme_ipsum()

## `geom_smooth()` using formula = 'y ~ x'

earthquake_tsunami_1 <- subset(earthquake_df, tsunami == "1")
earthquake_tsunami_0 <- subset(earthquake_df, tsunami == "0")

tsunamiPlot <- ggplot(earthquake_tsunami_1, aes(x = magnitude, y = sig)) +
  geom_point(alpha = 0.7, size = 3, color = 'pink') +
  geom_smooth(method = "lm", se = FALSE, color = 'red') +
  labs(
    subtitle = "Scatter Plot of earthquakes in oceanic region",
    x = "Magnitude",
    y = "Significance"
  ) +
  theme_ipsum()

NontsunamiPlot <- ggplot(earthquake_tsunami_0, aes(x = magnitude, y = sig)) +
  geom_point(alpha = 0.7, size = 3, color = 'skyblue') +
  geom_smooth(method = "lm", se = FALSE, color = 'blue') +
  labs(
    subtitle = "Scatter Plot of earthquakes on land",
    x = "Magnitude",
    y = "Significance"
  ) +
  theme_ipsum()

plot <- ggarrange(NontsunamiPlot, tsunamiPlot,
                  common.legend = FALSE,
                  ncol = 2, nrow = 1, legend = "bottom")

## `geom_smooth()` using formula = 'y ~ x'
## `geom_smooth()` using formula = 'y ~ x'

annotate_figure(plot, top = text_grob("Magnitude and Significance", 
               color = "black", face = "bold", size = 16))

The plots above shows the linear relationship between the significance of the earthquake and the magnitude (Richter Scale). As you can tell by the linear line is that they have a positive linear relationship. As the magnitude increases, the more significant of an event it. The Tsunami was added as a color in the first plot to see if it was correlated with the two variables. As seen on the plot it does not make a visible pattern which indicates that there is not a correlation with the tsunami so the data was split into two, separated by the tsunami and a graph was made from that. On the second plot, you can see the linear line on the left plot has a higher slope than the one on the right. That indicates that earthquakes on lant that have a high magnitude are more significant than the ones that happen in oceanic region.

Testing - Polynomial Regression

poly_mag_fit = lm(magnitude ~ poly(sig, 5), data = earthquake_train)
summary(poly_mag_fit)

## 
## Call:
## lm(formula = magnitude ~ poly(sig, 5), data = earthquake_train)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -1.00949 -0.07219  0.02281  0.07926  1.80233 
## 
## Coefficients:
##               Estimate Std. Error t value Pr(>|t|)    
## (Intercept)    6.94599    0.01061 654.408  < 2e-16 ***
## poly(sig, 5)1  5.86109    0.29068  20.163  < 2e-16 ***
## poly(sig, 5)2 -4.66295    0.29068 -16.041  < 2e-16 ***
## poly(sig, 5)3  3.85688    0.29068  13.268  < 2e-16 ***
## poly(sig, 5)4 -2.88756    0.29068  -9.934  < 2e-16 ***
## poly(sig, 5)5  1.46511    0.29068   5.040 5.84e-07 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.2907 on 744 degrees of freedom
## Multiple R-squared:  0.5644, Adjusted R-squared:  0.5615 
## F-statistic: 192.8 on 5 and 744 DF,  p-value: < 2.2e-16

After a variance of testing linear regression with different variables and different length of polynomials, the best results came from a polynomial of 5 with the significance. All of the polynomial variables are statistically significant with a p-value threshold of 0.05. It had a residual standard error of .29 which is fairly low and an R-squared of .56 which is suggest that the model is a reasonable fit. This testings shows that there is statistical evidence that there is a correlation

siglims <- range(sig)
sig.grid <- seq(from = siglims[1], to = siglims[2])
preds <- predict(poly_mag_fit, newdata = list(sig = sig.grid), se = TRUE)
se.bands <- cbind(preds$fit + 2 * preds$se.fit, preds$fit - 2 * preds$se.fit)  # Standard error

#par(mfrow = c(1, 2), mar = c(4.5, 4.5, 1, 1), oma = c(0, 0, 4, 0))
plot(1, type = 'n', xlim = siglims, ylim = range(magnitude), xlab = 'Sig', ylab = 'Magnitude')
points(sig, magnitude, cex = 0.5, col = 'darkgrey')
title('Degree-5 Polynomial', outer = FALSE)
lines(sig.grid, preds$fit, lwd = 2, col = 'blue')
matlines(sig.grid, se.bands, lwd = 1, col = 'blue', lty = 3)

The plot above shows the standard error line of the model.

The Probability of a Tsunami

After completing the exploratory data analysis and the testing above, there was one other factor that was interesting to test: can er predict the probability of a tsunami given other factors.

Graphical Analysis

ggplot(earthquake_df, aes(x = factor(tsunami), fill = tsunami)) +
  geom_bar() +
  labs(title = "Tsunami Occurrences", x = "Tsunami", y = "Frequency") +
  scale_x_discrete(labels = c("No", "Yes")) +
  scale_fill_manual(values = c("lightblue", "lightcoral"), 
                    name = "Eartquake",
                    labels = c("On Land", "In Oceanic Area")) +
  theme_minimal()

According to the bar plot, about 2/3 of the earthquakes in the data happen on land and 1/3 of the earthquakes in the data happens in oceanic area

Training and testing - Logistic Regression

The training of the logistic regression model with tsunami as the response variable

# training the model
logistic_model <- glm(tsunami ~ magnitude + depth + alert, data = earthquake_train, family = "binomial")
summary(logistic_model)

## 
## Call:
## glm(formula = tsunami ~ magnitude + depth + alert, family = "binomial", 
##     data = earthquake_train)
## 
## Deviance Residuals: 
##     Min       1Q   Median       3Q      Max  
## -2.1205  -0.1655  -0.1360   0.7093   3.3330  
## 
## Coefficients:
##               Estimate Std. Error z value Pr(>|z|)    
## (Intercept) -9.2708149  2.3084839  -4.016 5.92e-05 ***
## magnitude    0.6980946  0.3166913   2.204   0.0275 *  
## depth       -0.0015013  0.0007288  -2.060   0.0394 *  
## alertgreen   5.7206859  0.4883374  11.715  < 2e-16 ***
## alertorange  4.7547915  0.6720129   7.075 1.49e-12 ***
## alertred     4.0431907  0.7617617   5.308 1.11e-07 ***
## alertyellow  5.0614129  0.5648841   8.960  < 2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## (Dispersion parameter for binomial family taken to be 1)
## 
##     Null deviance: 941.81  on 749  degrees of freedom
## Residual deviance: 436.23  on 743  degrees of freedom
## AIC: 450.23
## 
## Number of Fisher Scoring iterations: 7

After a variable of testing, we came to the conclusion that the best predictor variables are magnitude, depth and alert. They are all statistically significant with a p-value threshold of 0.05. Since alert is a categorical variable there are 5 different equation that come out of the model to predict a tsunami. Each one represents one of the 5 factor levels of the alert variable:
Green:
1. Tsunami = - 9.3 + 0.7 * magn - 0.001 * depth + 5.72
Yellow:
1. Tsunami = - 9.3 + 0.7 * magn - 0.001 * depth + 5.06
Orange:
1. Tsunami = - 9.3 + 0.7 * magn - 0.001 * depth + 4.75
Red:
1. Tsunami = - 9.3 + 0.7 * magn - 0.001 * depth + 4.04
Empty:
1. Tsunami = - 9.3 + 0.7 * magn - 0.001 * depth
However to calculate the probability of a tsunami we fill the equation above into the following equation:
- P(Tsunami) = 1 / 1 + exp(- (equation))
The equation indicates that the higher the magnitude of the earthquake, the more likely it is to be a tsunami.
Now it is time to test the model

# Testing the model
logistic_prob = predict(logistic_model, earthquake_test, type = 'response')
logistic_pred = rep('0', 250)
logistic_pred[logistic_prob>0.5] = '1'

# confusion matrix
table(logistic_pred, tsunami_test)

##              tsunami_test
## logistic_pred   0   1
##             0 132   1
##             1  34  83

# Testing the Matrix
accuracy = mean(logistic_pred==tsunami_test)
precision = 131 /(131 + 83)

# Printing the Results
cat("Accuracy: ", accuracy, "\n",
"Precision: ", precision, "\n")

## Accuracy:  0.86 
##  Precision:  0.6121495

The above results show the confusion matrix of the logistic model. From the results the accuracy and precision are calculated.
Accuracy
1. The accuracy of the testing model is 86% which is a good percentage.
Precision
1. It measures the percentage of the items that the system detected positive. It is 61%, that is a fairly good percentage that indicates the consistency of the model.

Conclusion

In an earthquake event, the higher the magnitude is, the more significant the event is.
According to this data, the earthquakes on land intend to be higher in magnitude than the ones that happen in oceanic area (tsunami).
With a 86% accuracy, the probability of an event is a tsunami can be calculated with the above equation.
The higher the value of a magnitude, the higher the probability that the event is a tsunami

LS0tCnRpdGxlOiBFeHBsb3JpbmcgRWFydGhxdWFrZSBwYXR0ZXJucyBmcm9tIDE5OTUtMjAyMwphdXRob3I6IEJyeW5oaWxkdXIgVHJhdXN0YWTDs3R0aXIKZGF0ZTogIkRlY2VtYmVyIDExdGgsIDIwMjMiCm91dHB1dDoKICBodG1sX2RvY3VtZW50OgogICAgY29kZV9mb2xkaW5nOiBoaWRlCiAgICB0aGVtZTogZmxhdGx5CiAgICBoaWdobGlnaHQ6IHplbmJ1cm4KICAgIHRvYzogeWVzCiAgICB0b2NfZmxvYXQ6IHllcwogICAgZGZfcHJpbnQ6IHBhZ2VkCiAgICBjb2RlX2Rvd25sb2FkOiB5ZXMKICBwZGZfZG9jdW1lbnQ6CiAgICB0b2M6IHllcwotLS0KIApgYGB7ciBzZXR1cCwgaW5jbHVkZT1GQUxTRX0Ka25pdHI6Om9wdHNfY2h1bmskc2V0KGVjaG8gPSBUUlVFLCB3YXJuaW5nID0gRkFMU0UpCgpsaWJyYXJ5KFNsZXV0aDMpCmxpYnJhcnkoc3RhdHMpCmxpYnJhcnkodGlkeXZlcnNlKQpsaWJyYXJ5KGRhdGEudGFibGUpCmxpYnJhcnkoZHBseXIpCmxpYnJhcnkodGlkeXIpCmxpYnJhcnkoUkNvbG9yQnJld2VyKQpsaWJyYXJ5KGdncmlkZ2VzKQpsaWJyYXJ5KGdncGxvdDIpCmxpYnJhcnkodmlyaWRpcykKbGlicmFyeShocmJydGhlbWVzKQpsaWJyYXJ5KG1vc2FpYykKbGlicmFyeShHR2FsbHkpICMgZ2dwYWlycwpsaWJyYXJ5KElTTFIpCmxpYnJhcnkoRFQpCmxpYnJhcnkoZ21vZGVscykKbGlicmFyeShnZ3RoZW1lcykKbGlicmFyeShtdWx0Y29tcCkKbGlicmFyeShkZXZ0b29scykKbGlicmFyeShnZ3B1YnIpCmxpYnJhcnkoTUFTUykKbGlicmFyeShsZWFwcykKbGlicmFyeShvbHNycikKbGlicmFyeShjYXIpCmxpYnJhcnkocGF0Y2h3b3JrKSAjTWFrZXMgbXVsdGlwbGUgZ3JhcGhzIGJlIGluIG9uZSBieSBhL2IKbGlicmFyeShwbG90bHkpICMgTWFrZXMgaXQgcG9zc2libGUgdG8gaW50ZXJhY3Qgd2l0aCAzRCBncmFwaHMKbGlicmFyeShsZWFmbGV0KSAjIGNyZWF0ZXMgYSBtYXAgY2VudGVyZWQgYXJvdW5kIHRoZSBtZWFuIGNvb3JkaW5hdGVzCmxpYnJhcnkocmFzdGVyKSAjIGlzIG5lZWRlZCBmb3IgbGVhZmxldApsaWJyYXJ5KHRlcnJhKSAgIyBpcyBuZWVkZWQgZm9yIGxlYWZsZXQKYGBgCgojICoqSW50cm9kdWN0aW9uKioKCiogR3Jvd2luZyB1cCBpbiBJY2VsYW5kLCBJIGhhdmUgYmVlbiBleHBvc2VkIHRvIGEgbG90IG9mIGVhcnRocXVha2VzIGluIG15IGxpZmUuIEljZWxhbmQgaXMgc2l0dGluZyBiZXR3ZWVuIHR3byB0ZWN0b25pYyBwbGF0ZXMuIFRoZSBFdXJhc2lhbiBwbGF0ZSBhbmQgdGhlIE5vcnRoIEFtZXJpY2FuIHBsYXRlLiBUaGUgYm91bmRhcnkgYmV0d2VlbiB0aG9zZSBwbGF0ZXMgaXMgYSBEaXZlcmdlbnQgUGxhdGUgQm91bmRhcnkgYW5kIHRoZWlyIGJpZ2dlc3QgY2hhcmFjdGVyaXN0aWNzIGFyZSB2b2xjYW5vZXMuIFdoZW4gdGhlIG1hZ21hIGlzIGNyZWVwaW5nIHVwd2FyZHMsIHRoZXJlIGFyZSBjcmFja3MgaW4gdGhlIGdyb3VuZCB0aGF0IGNhdXNlIGVhcnRocXVha2VzLiBJIGhhdmUgYWx3YXlzIGJlZW4gZmFzY2luYXRlZCB3aXRoIGVhcnRocXVha2VzIGFuZCB0aG91Z2h0IHRoaXMgd291bGQgYmUgYSBncmVhdCBvcHBvcnR1bml0eSB0byBleHBsb3JlIHRoZSB0b3BpYyBhbmQgZW5oYW5jZSBteSBlZHVjYXRpb24gb24gaXQuIAoKCiMgKipQcm9ibGVtIFN0YXRlbWVudCoqCgoqIFNjaWVudGlzdHMgaGF2ZSBuZXZlciBiZWVuIGFibGUgdG8gcHJlZGljdCBhbiBlYXJ0aHF1YWtlLCBidXQgd2l0aCB0aGUgZXZvbHV0aW9uIG9mIHRlY2hub2xvZ3kgdGhlIHNlaXNtYXRpYyB0b29scyBhcmUgYWR2YW5jZWQgZW5vdWdoIHRvIGRldGVjdCBzZWlzbWljIHdhdmVzLCBjYWxjdWxhdGUgdGhlIG1heGltdW0gZXhwZWN0ZWQgc2hha2luZyBhbmQgc2VuZCBhbGVydHMgdG8gbmVhciBhcmVhIHRvIHdhcm4gb2YgYW55IGRhbWFnZS4gVGhpcyBhZHZhbmNlbWVudCBpcyB2ZXJ5IGltcG9ydGFudCBhcyBpdCBoYXMgc2F2ZWQgYSBsb3Qgb2YgbGl2ZXMgb3ZlciB0aGUgcGFzdCB5ZWFycy4gVGhlIHByb2JsZW1zIHRoYXQgd2Ugd2lsbCBiZSByZXNlYXJjaGluZyBpcyB3aGF0IGZhY3RvcnMgY2FuIGFmZmVjdCB0aGUgbWFnbml0dWRlIG9mIGFuIGVhcnRocXVha2UgZXZlbnQ/CgoKIyAqKlRoZSBEYXRhKioKCiogVGhlIGRhdGFzZXQsIHJldHJpZXZlZCBLYWdnbGUuY29tLCBjb250YWlucyAxMDAwIHJvd3MgYW5kIDE5IGNvbHVtbnMgYmVmb3JlIG1vZGlmaWNhdGlvbi4gVGhlIGRhdGEgc3BhbnMgZnJvbSBKYW51YXJ5IDFzdCwgMTk5NSB0byBKYW51YXJ5IDFzdCwgMjAyMy4gCgojIyBSYXcgRGF0YQoKCmBgYHtyfQplYXJ0aHF1YWtlX2RmID0gcmVhZC5jc3YoImVhcnRocXVha2VfMTk5NS0yMDIzLmNzdiIpCmF0dGFjaChlYXJ0aHF1YWtlX2RmKQpzdHIoZWFydGhxdWFrZV9kZikKYGBgCgoKIyMgRGF0YSBQcmVwZXJhdGlvbgoKLSBGb3IgYSBmdXJ0aGVyIGFuYWx5c2lzLCBpdCBjb3VsZCBiZSBiZW5lZmljaWFsIHRvIHVzZSB0aGUgZGF0ZSBvciB0aGUgdGltZS4gU28gd2Ugd2lsbCBzZXBlcmF0ZSBkYXRlX3RpbWUgY29sdW1uIGludG8gdHdvIGNvbHVtbnMgY2FsbGVkICd0aW1lJyBhbmQgJ2RhdGUnLgotIFRoZSB0eXBlIG9mIHRoZXNlIGNvbHVtbnMgaGF2ZSBiZWVuIGNvbnZlcnRlZCBpbnRvIGEgZmFjdG9yCiAgMS4gYWxlcnQKICAyLiB0c3VuYW1pCiAgMy4gbWFnVHlwZQoKYGBge3J9CiMgQ29udmVydGluZyB0c3VuYW1pIHRvIGEgZmFjdG9yIHZhcmlhYmxlCmVhcnRocXVha2VfZGYkdHN1bmFtaSA9IGFzLmZhY3RvcihlYXJ0aHF1YWtlX2RmJHRzdW5hbWkpCiMgQ29udmVydGluZyBhbGVydCB0byBhIGZhY3RvciB2YXJpYWJsZQplYXJ0aHF1YWtlX2RmJGFsZXJ0ID0gYXMuZmFjdG9yKGVhcnRocXVha2VfZGYkYWxlcnQpCiMgQ29udmVydGluZyBtYWdUeXBlIHRvIGEgZmFjdG9yIHZhcmlhYmxlCmVhcnRocXVha2VfZGYkbWFnVHlwZSA9IGFzLmZhY3RvcihlYXJ0aHF1YWtlX2RmJG1hZ1R5cGUpCiMgU3BsaXR0aW5nIHRpbWVfZGF0ZSBpbnRvIHR3byBzZXBlcmF0ZSBjb2x1bW5zIGNhbGxlZCBkYXRlCmVhcnRocXVha2VfZGYkdGltZSA8LSBzYXBwbHkoc3Ryc3BsaXQoYXMuY2hhcmFjdGVyKGVhcnRocXVha2VfZGYkZGF0ZV90aW1lKSwgIiAiKSwgIltbIiwgMikKZWFydGhxdWFrZV9kZiRkYXRlIDwtIHNhcHBseShzdHJzcGxpdChhcy5jaGFyYWN0ZXIoZWFydGhxdWFrZV9kZiRkYXRlX3RpbWUpLCAiICIpLCAiW1siLCAxKQojIENvbnZlcnRpbmcgdGhlIGRhdGUgY29sdW1uIGludG8gYSBkYXRlIHZhcmlhYmxlCmVhcnRocXVha2VfZGYkZGF0ZSA9IGFzLkRhdGUoZWFydGhxdWFrZV9kZiRkYXRlLCBmb3JtYXQgPSAiJWQtJW0tJVkiKQojIHJlbW92aW5nIHRoZSB0aW1lX2RhdGUgdmFyaWFibGUKIyByZW1vdmluZyBsb2NhdGlvbiBkdWUgdG8gaGF2aW5nIGxvbmdpdHVkZSBhbmQgbGF0aXR1ZGUKIyByZW1vdmluZyBjb250aW5lbnQgZHVlIHRvIGhhdmluZyB0b28gbWFueSBudWxsIHZhcmlhYmxlcwojIHJlbW92aW5nIHRpdGxlIGR1ZSB0byBiZWluZyB1bm5lY2Vzc2FyeQplYXJ0aHF1YWtlX2RmID0gZWFydGhxdWFrZV9kZlssYygtMSwgLTMsIC0xNywgLTE4KV0KCnN0cihlYXJ0aHF1YWtlX2RmKQpgYGAKCi0gRGVsZXRlZCBjb2x1bW5zCiAgMS4gVGl0bGUgLSB1bm5lY2Vzc2FyeSBpbmZvcm1hdGlvbgogIDIuIExvY2F0aW9uIC0gdW5uZWNlc3Nhcnkgc2luY2Ugd2UgaGF2ZSB0aGUgY29vcmRpbmF0ZXMKICAzLiBjb250aW5lbnQgLSBjb250YWlucyB0b28gbWFueSBtaXNzaW5nIHZhbHVlcwotIEFmdGVyIG1vZGlmaWNhdGlvbiwgdGhlIGRhdGFzZXQgY29udGFpbnMgMTcgY29sdW1ucy4KCiMjIENvbHVtbiBEZXNjcmlwdGlvbgoKCmBgYHtyfQpEZXMgPC0gZGF0YS5mcmFtZSgKICBDb2x1bW4gPSBjKCJNYWduaXR1ZGUiLCJDREkiLCAiTU1JIiwgIkFsZXJ0IiwgIlRzdW5hbWkiLCAiU2lnIiwgIk5ldCIsICJOc3QiLCAiRG1pbiIsICJHYXAiLCAKICAgICAgICAgICAgICJNYWdUeXBlIiwgIkRlcHRoIiwgIkxhdGl0dWRlL0xvbmdpdHVkZSIsICJDb3VudHJ5IiwgIlRpbWUiLCAiRGF0ZSIpLAogIFR5cGUgPSBjKCJOdW0iLCJJbnQiLCAiSW50IiwgIkZhY3RvciIsICJGYWN0b3IiLCAiSW50IiwgIkNociIsICJJbnQiLCAiTnVtIiwgIk51bSIsIAogICAgICAgICAgICAgIkZhY3RvciIsICJOdW0iLCAiTnVtIiwgIkNociIsICJDaHIiLCAiRGF0ZSIpLAogIERlc2NyaXB0aW9uID0gYygKICAgICJUaGUgTWFnbml0dWRlIGluIFJpY2h0ZXIgU2NhbGUgb2YgdGhlIEV2ZW50IiwKICAgICJDb21tdW5pdHkgRGVjaW1hbCBJbnRlbnNpdHkpIE1heGltdW0gcmVwb3J0ZWQgaW50ZW5zaXR5IGZvciB0aGUgZXZlbnQgcmFuZ2UiLAogICAgIihNb2RpZmllZCBNZXJjYWxsaSBJbnRlbnNpdHkpIE1heGltdW0gZXN0aW1hdGVkIGluc3RydW1lbnRhbCBpbnRlbnNpdHkgZm9yIHRoZSBldmVudCIsCiAgICAiQWxlcnQgbGV2ZWwsIEdyZWVuIC0gWWVsbG93IC0gT3JhbmdlIC0gUmVkIiwKICAgICInMScgZm9yIGV2ZW50cyBpbiBvY2VhbmljIGFyZWEsICcwJyBvdGhlcndpc2UiLAogICAgIlNpZ25pZmljYW5jZSBvZiBldmVudCwgY2FsY3VsYXRlZCBmcm9tIHRoZSBtYWduaXR1ZGUsIG1heGltdW0gbW1pLCBmZWx0IHJlcG9ydHMgYW5kIGVzdGltYXRlZCBpbXBhY3QiLAogICAgIklEIG9mIGEgZGF0YSBjb250cmlidXRlciIsCiAgICAiVG90YWwgbnVtYmVyIG9mIHNlaXNtaWMgc3RhdGlvbnMgdXNlZCB0byBkZXRlcm1pbmUgZXZlbnRzIGxvY2F0aW9uIiwKICAgICJIb3Jpem9udGFsIGRpc3RhbmNlIGZyb20gdGhlIGVwaWNlbnRlciB0byB0aGUgbmVhcmVzdCBzdGF0aW9uIiwKICAgICJUaGUgbGFyZ2VzdCBhemltdXRoYWwgZ2FwIGJldHdlZW4gYXppbXV0aGFsbHkgYWRqYWNlbnQgc3RhdGlvbnMiLAogICAgIlRoZSBtZXRob2QvYWxnb3JpdGhtIHVzZWQgdG8gY2FsY3VsYXRlIHRoZSBtYWduaXR1ZGUgb2YgdGhlIGV2ZW50IiwKICAgICJUaGUgZGVwdGggb2YgdGhlIHN0YXJ0IG9mIHRoZSBlYXJ0aHF1YWtlIiwKICAgICJDb29yZGluYXRlIHN5c3RlbSBvZiB0aGUgbG9jYXRpb24gb2YgdGhlIGV2ZW50IiwKICAgICJBZmZlY3RlZCBjb3VudHJ5IiwKICAgICJUaW1lIG9mIHRoZSBldmVudCIsCiAgICAiRGF0ZSBvZiB0aGUgZXZlbnQiKSkKCmRhdGF0YWJsZShEZXMsIHJvd25hbWVzID0gRkFMU0UsIGNhcHRpb24gPSAnQ29sdW1uIERlc2NyaXB0aW9uJywgb3B0aW9ucyA9IGxpc3QodGhlbWUgPSAnYm9vdHN0cmFwJykpCmBgYAoKLSBJbiB0aGUgZnVydGhlciByZXNlYXJjaCwgbWFnbml0dWRlIGFuZCBkZXB0aCB3aWxsIGJlIHVzZWQgYXMgdGhlIHJlc3BvbnNlIHZhcmlhYmxlcwoKLSBCZWZvcmUgYW55IG1vZGVsbGluZywgdGhlIGRhdGEgaXMgc3BsaXQgaW50byB0cmFpbiBhbmQgdGVzdCBkYXRhIHdpdGggdGhlIHJhdGlvIG9mIDE6NAoKYGBge3J9CiMgU3BsaXR0aW5nIHRoZSBkYXRhIGludG8gdHJhaW4gYW5kIHRlc3QKc2V0LnNlZWQoMSkKdHJhaW4gPSBzYW1wbGUoMTpucm93KGVhcnRocXVha2VfZGYpLCA3NTApCmVhcnRocXVha2VfdHJhaW4gPSBlYXJ0aHF1YWtlX2RmW3RyYWluLF0KZWFydGhxdWFrZV90ZXN0ID0gZWFydGhxdWFrZV9kZlstdHJhaW4sXQoKdHN1bmFtaV90cmFpbiA9IGVhcnRocXVha2VfZGYkdHN1bmFtaVt0cmFpbl0KdHN1bmFtaV90ZXN0ID0gZWFydGhxdWFrZV9kZiR0c3VuYW1pWy10cmFpbl0KYGBgCgojICoqRXhwbG9yYXRvcnkgRGF0YSBBbmFseXNpcyoqCgojIyBTdW1tYXJ5CgpgYGB7cn0KIyBTdW1tYXJ5IHN0YXRpc3RpY3MKc3VtbWFyeShlYXJ0aHF1YWtlX2RmWywgYygibWFnbml0dWRlIiwgImNkaSIsICJtbWkiLCAic2lnIiwgIm5zdCIsICJkbWluIiwgImdhcCIsICJkZXB0aCIpXSkKCmBgYAoKKiBUaGUgcmVjb3JkZWQgZWFydGhxdWFrZXMgaW4gdGhpcyBkYXRhc2V0IGhhdmUgdGhlIG1hZ25pdHVkZXMgcmFuZ2luZyBmcm9tIDYuNTAgdG8gOS4xMC4gT25lIGludGVyZXN0aW5nIG9ic2VydmF0aW9uIGZyb20gdGhpcyBkYXRhc2V0IGlzIHRoZSBtZWFuIG1hZ25pdHVkZSwgd2hpY2ggaXMgdmVyeSBjbG9zZSB0byB0aGUgbWluaW11bSB2YWx1ZS4gVGhpcyBzdWdnZXN0cyB0aGF0IHRoZXJlIGFyZSByZWxhdGl2ZWx5IGZldyBlYXJ0aHF1YWtlIHdpdGggYSBtYWduaXR1ZGUgZXhjZWVkaW5nIDggYW5kIDkuIEFkZGl0aW9uYWwgb2JzZXJ2YXRpb25zIHRoYXQgYXJlIGludGVyZXN0aW5nIHRvIGxvb2sgYXQgdGhlIHZhcmlhbmNlIG9mIHRoZSBkZXB0LCByYW5naW5nIGZyb20gMiB0byA2NzAuIEluIHRoZSB1cGNvbWluZyByZXNlYXJjaCwgZXhwbG9yaW5nIHRoaXMgdmFyaWFibGUgYW5kIHRlc3QgaWYgaXQgaGFzIGltcGFjdCBvbiBlYXJ0aHF1YWtlIG1hZ25pdHVkZSBjb3VsZCBiZSBhbiBpbnRlcmVzdGluZyB0b3BpYy4KCgojIyBQbG90cwoKYGBge3J9CiMgRGlzdHJpYnV0aW9uIG9mIE1hZ25pdHVkZQpnZ3Bsb3QoZWFydGhxdWFrZV9kZiwgYWVzKHggPSBtYWduaXR1ZGUpKSArCiAgZ2VvbV9oaXN0b2dyYW0oYmlud2lkdGggPSAwLjUsIGZpbGwgPSAic2t5Ymx1ZSIsIGNvbG9yID0gImJsYWNrIikgKwogIGxhYnModGl0bGUgPSAiRGlzdHJpYnV0aW9uIG9mIEVhcnRocXVha2UgTWFnbml0dWRlcyIsIHggPSAiTWFnbml0dWRlIChSaWNodGVyIFNjYWxlKSIsIHkgPSAiRnJlcXVlbmN5IikgKwogIHRoZW1lX2lwc3VtKCkKYGBgCgoqIFRoaXMgcGxvdCBzaG93cyB0aGUgZGlzdHJpYnV0aW9uIG9mIHRoZSBlYXJ0aHF1YWtlIG1hZ25pdHVkZXMgYW5kIGFzIG1lbnRpb25lZCBhYm92ZSwgaXQgc2hvd3MgdGhhdCBhcyB0aGUgbWFnbml0dWRlIGluY3JlYXNlcywgdGhlIGZyZXF1ZW5jeSBkZWNyZWFzZXMgYXMgd2VsbC4gVGhhdCBleGFtaW5hdGlvbiBzdHJlbmd0aGVucyBvdXIgb2JzZXJ2YXRpb24gZnJvbSBlYXJsaWVyLgoKYGBge3J9CiMgRnJlcXVlbmN5IG92ZXIgdGltZQpnZ3Bsb3QoZWFydGhxdWFrZV9kZiwgYWVzKHggPSBkYXRlLCBmaWxsPSAnc2t5Ymx1ZScpKSArCiAgZ2VvbV9oaXN0b2dyYW0oYmlud2lkdGggPSAzMCwgZmlsbCA9ICJza3libHVlIiwgY29sb3IgPSAiYmxhY2siKSArCiAgbGFicyh0aXRsZSA9ICJFYXJ0aHF1YWtlIEZyZXF1ZW5jeSBPdmVyIFRpbWUiLAogICAgICAgeCA9ICJEYXRlIiwKICAgICAgIHkgPSAiRnJlcXVlbmN5IikgKwogIHRoZW1lX2lwc3VtKCkKYGBgCgoqIE9uZSBpbnRlcmVzdGluZyBmYWN0b3IgaW4gdGhpcyBwbG90IGlzIHRoZSBmcmVxdWVuY3kgb2YgZXZlbnRzIGV2ZXJ5IDUgeWVhcnMuIEl0IHNlZW1zIHRvIGluY3JlYXNlIGEgbG90IGFuZCB0aGVuIGdvIGJhY2sgZG93bi4gSG93ZXZlciwgYXJvdW5kIHRoZSB5ZWFycyBiZXR3ZWVuIDIwMTIgYW5kIDIwMTggdGhleSBzZWVtIHRvIGluY3JlYXNlIGJ5IGEgc2V2ZXJlIGFtb3VudC4gVGhhdCBsZWFkcyB0byBzcGVjdWxhdGlvbnMgb24gaWYgdGhlcmUgd2FzIHNvbWV0aGluZyBzcGVjaWZpYyBoYXBwZW5pbmcgaW4gdGhlIHdvcmxkIHRob3NlIHllYXJzIHRoYXQgbWFkZSB0aGUgZnJlcXVlbmN5IGV4Y2VlZD8KCgoqIFNpbmNlIHdlIGhhdmUgdGhlIGxhdGl0dWRlIGFuZCBsb25naXR1ZGUgY29vcmRpbmF0ZXMsIHdlIGFyZSBhYmxlIHRvIG1hcmsgdGhlIGV4YWN0IGxvY2F0aW9uIG9mIHRoZSBlYXJ0aHF1YWtlcyBvbiBhIHdvcmxkIG1hcC4KCmBgYHtyfQojIEdlb2dyYXBoaWNhbCBkaXN0cmlidXRpb24KCiMgTWFraW5nIHRoZSBtYXAKbXlfbWFwIDwtIGxlYWZsZXQoZGF0YSA9IGVhcnRocXVha2VfZGYpICU+JQogIGFkZFRpbGVzKCkgJT4lCiAgc2V0VmlldyhsbmcgPSBtZWFuKGVhcnRocXVha2VfZGYkbG9uZ2l0dWRlKSwgbGF0ID0gbWVhbihlYXJ0aHF1YWtlX2RmJGxhdGl0dWRlKSwgem9vbSA9IDEpCgojIEFkZGluZyB0aGUgZWFydGhxdWFrZXMKbXlfbWFwIDwtIG15X21hcCAlPiUKICBhZGRDaXJjbGVNYXJrZXJzKAogICAgbG5nID0gfmxvbmdpdHVkZSwKICAgIGxhdCA9IH5sYXRpdHVkZSwKICAgIHJhZGl1cyA9IDUsCiAgICBjb2xvciA9IH5jb2xvck51bWVyaWMocGFsZXR0ZSA9ICJSZFlsQnUiLCBkb21haW4gPSBlYXJ0aHF1YWtlX2RmJG1hZ25pdHVkZSkobWFnbml0dWRlKSwKICAgIHBvcHVwID0gfmFzLmNoYXJhY3RlcihtYWduaXR1ZGUpCiAgKQoKbXlfbWFwCgpgYGAKCiogRnJvbSBsb29raW5nIGF0IHRoZSBtYXAsIHlvdSBjYW4gcm91Z2hseSBzZWUgdGhlIG91dGxpbmVzIG9mIHRoZSB0ZWN0b25pYyBwbGF0ZXMuIEFzIHNhaWQgZWFybGllciwgY2hhcmFjdGVyaXN0aWNzIG9mIHBsYXRlIGJvdW5kYXJpZXMgYXJlIGVhcnRocXVha2VzLiBNYW55IG9mIHRoZSBlYXJ0aHF1YWtlcyBpbiB0aGUgZGF0YSBhcmUgbWFya2VkIGFyb3VuZCB0aGUgUGFjaWZpYyBQbGF0ZS4gVGhlIHBsYXRlIGZvcm1zIGEgY29udmVyZ2VudCBib3VuZGFyeSB3aGljaCBoYXMgYSBjaGFyYWN0ZXJpc3RpY3Mgb2YgZWFydGhxdWFrZXMuIAoKIyMgQ29ycmVsYXRpb24KCmBgYHtyfQojIENvcnJlbGF0aW9uIG1hdHJpeApjb3JfbWF0cml4IDwtIGNvcihlYXJ0aHF1YWtlX2RmWywgYygibWFnbml0dWRlIiwgImNkaSIsICJtbWkiLCAic2lnIiwgIm5zdCIsICJkbWluIiwgImdhcCIsICJkZXB0aCIsICJsYXRpdHVkZSIsICJsb25naXR1ZGUiKV0pCmNvcnJwbG90Ojpjb3JycGxvdChjb3JfbWF0cml4LCBtZXRob2QgPSAiY29sb3IiKQpgYGAKCiogTG9va2luZyBhdCB0aGUgY29ycmVsYXRpb24gbWF0cml4LCBpdCBpcyBpbnRlcmVzdGluZyB0byBzZWUgdGhlIHVwcGVyIGxlZnQgY29ybmVyIHdoZXJlIG1hZ25pdHVkZSwgY2RpLCBtbWkgYW5kIHNpZyBoYXZlIHRoZSBoaWdoZXN0IGNvcnJlbGF0aW9uLiBGb3IgZnVydGhlciByZXNlYXJjaCwgaXQgd291bGQgYmUgaW50ZXJlc3RpbmcgYXQgbG9va2luZyB0aGUgbGluZWFyIHJlbGF0aW9uc2hpcHMgYmV0d2VlbiB0aG9zZSB2YXJpYWJsZXMuIAoKCgojICoqTW9kZWxsaW5nKioKCiMjICoqTWFnbml0dWRlIGFuZCBTaWduaWZpY2FuY2UqKgoKIyMjIEdyYXBoaWNhbCBBbmFseXNpcwoKYGBge3J9CiMgUGxvdCBvZiBsaW5lYXIgcmVsYXRpb25zaGlwIGJldHdlZW4gTWFnbml0dWRlIGFuZCBTaWduaWZpY2FuY2UKZ2dwbG90KGVhcnRocXVha2VfZGYsIGFlcyh4ID0gbWFnbml0dWRlLCB5ID0gc2lnLCBjb2xvciA9IHRzdW5hbWkpKSArCiAgZ2VvbV9wb2ludChhbHBoYSA9IDAuNywgc2l6ZSA9IDMpICsKICBnZW9tX3Ntb290aChtZXRob2QgPSAibG0iLCBzZSA9IEZBTFNFLCBjb2xvciA9ICdyZWQnKSArCiAgc2NhbGVfY29sb3JfbWFudWFsKHZhbHVlcyA9IGMoIjAiID0gInNreWJsdWUiLCAiMSIgPSAicGluayIpLCBuYW1lID0gIlRzdW5hbWkiKSArCiAgbGFicygKICAgIHRpdGxlID0gIlRoZSBMaW5lYXIgUmVsYXRpb25zaGlwIGJldHdlZW4gTWFnbml0dWRlIGFuZCBTaWduaWZpY2FuY2UiLAogICAgeCA9ICJNYWduaXR1ZGUgKFJpY2h0ZXIgU2NhbGUpIiwKICAgIHkgPSAiU2lnbmlmaWNhbmNlIgogICkgKwogIHRoZW1lX2lwc3VtKCkKYGBgCgpgYGB7cn0KZWFydGhxdWFrZV90c3VuYW1pXzEgPC0gc3Vic2V0KGVhcnRocXVha2VfZGYsIHRzdW5hbWkgPT0gIjEiKQplYXJ0aHF1YWtlX3RzdW5hbWlfMCA8LSBzdWJzZXQoZWFydGhxdWFrZV9kZiwgdHN1bmFtaSA9PSAiMCIpCgp0c3VuYW1pUGxvdCA8LSBnZ3Bsb3QoZWFydGhxdWFrZV90c3VuYW1pXzEsIGFlcyh4ID0gbWFnbml0dWRlLCB5ID0gc2lnKSkgKwogIGdlb21fcG9pbnQoYWxwaGEgPSAwLjcsIHNpemUgPSAzLCBjb2xvciA9ICdwaW5rJykgKwogIGdlb21fc21vb3RoKG1ldGhvZCA9ICJsbSIsIHNlID0gRkFMU0UsIGNvbG9yID0gJ3JlZCcpICsKICBsYWJzKAogICAgc3VidGl0bGUgPSAiU2NhdHRlciBQbG90IG9mIGVhcnRocXVha2VzIGluIG9jZWFuaWMgcmVnaW9uIiwKICAgIHggPSAiTWFnbml0dWRlIiwKICAgIHkgPSAiU2lnbmlmaWNhbmNlIgogICkgKwogIHRoZW1lX2lwc3VtKCkKCk5vbnRzdW5hbWlQbG90IDwtIGdncGxvdChlYXJ0aHF1YWtlX3RzdW5hbWlfMCwgYWVzKHggPSBtYWduaXR1ZGUsIHkgPSBzaWcpKSArCiAgZ2VvbV9wb2ludChhbHBoYSA9IDAuNywgc2l6ZSA9IDMsIGNvbG9yID0gJ3NreWJsdWUnKSArCiAgZ2VvbV9zbW9vdGgobWV0aG9kID0gImxtIiwgc2UgPSBGQUxTRSwgY29sb3IgPSAnYmx1ZScpICsKICBsYWJzKAogICAgc3VidGl0bGUgPSAiU2NhdHRlciBQbG90IG9mIGVhcnRocXVha2VzIG9uIGxhbmQiLAogICAgeCA9ICJNYWduaXR1ZGUiLAogICAgeSA9ICJTaWduaWZpY2FuY2UiCiAgKSArCiAgdGhlbWVfaXBzdW0oKQoKcGxvdCA8LSBnZ2FycmFuZ2UoTm9udHN1bmFtaVBsb3QsIHRzdW5hbWlQbG90LAogICAgICAgICAgICAgICAgICBjb21tb24ubGVnZW5kID0gRkFMU0UsCiAgICAgICAgICAgICAgICAgIG5jb2wgPSAyLCBucm93ID0gMSwgbGVnZW5kID0gImJvdHRvbSIpCgphbm5vdGF0ZV9maWd1cmUocGxvdCwgdG9wID0gdGV4dF9ncm9iKCJNYWduaXR1ZGUgYW5kIFNpZ25pZmljYW5jZSIsIAogICAgICAgICAgICAgICBjb2xvciA9ICJibGFjayIsIGZhY2UgPSAiYm9sZCIsIHNpemUgPSAxNikpCmBgYAoKKiBUaGUgcGxvdHMgYWJvdmUgc2hvd3MgdGhlIGxpbmVhciByZWxhdGlvbnNoaXAgYmV0d2VlbiB0aGUgc2lnbmlmaWNhbmNlIG9mIHRoZSBlYXJ0aHF1YWtlIGFuZCB0aGUgbWFnbml0dWRlIChSaWNodGVyIFNjYWxlKS4gQXMgeW91IGNhbiB0ZWxsIGJ5IHRoZSBsaW5lYXIgbGluZSBpcyB0aGF0IHRoZXkgaGF2ZSBhIHBvc2l0aXZlIGxpbmVhciByZWxhdGlvbnNoaXAuIEFzIHRoZSBtYWduaXR1ZGUgaW5jcmVhc2VzLCB0aGUgbW9yZSBzaWduaWZpY2FudCBvZiBhbiBldmVudCBpdC4gVGhlIFRzdW5hbWkgd2FzIGFkZGVkIGFzIGEgY29sb3IgaW4gdGhlIGZpcnN0IHBsb3QgdG8gc2VlIGlmIGl0IHdhcyBjb3JyZWxhdGVkIHdpdGggdGhlIHR3byB2YXJpYWJsZXMuIEFzIHNlZW4gb24gdGhlIHBsb3QgaXQgZG9lcyBub3QgbWFrZSBhIHZpc2libGUgcGF0dGVybiB3aGljaCBpbmRpY2F0ZXMgdGhhdCB0aGVyZSBpcyBub3QgYSBjb3JyZWxhdGlvbiB3aXRoIHRoZSB0c3VuYW1pIHNvIHRoZSBkYXRhIHdhcyBzcGxpdCBpbnRvIHR3bywgc2VwYXJhdGVkIGJ5IHRoZSB0c3VuYW1pIGFuZCBhIGdyYXBoIHdhcyBtYWRlIGZyb20gdGhhdC4gT24gdGhlIHNlY29uZCBwbG90LCB5b3UgY2FuIHNlZSB0aGUgbGluZWFyIGxpbmUgb24gdGhlIGxlZnQgcGxvdCBoYXMgYSBoaWdoZXIgc2xvcGUgdGhhbiB0aGUgb25lIG9uIHRoZSByaWdodC4gVGhhdCBpbmRpY2F0ZXMgdGhhdCBlYXJ0aHF1YWtlcyBvbiBsYW50IHRoYXQgaGF2ZSBhIGhpZ2ggbWFnbml0dWRlIGFyZSBtb3JlIHNpZ25pZmljYW50IHRoYW4gdGhlIG9uZXMgdGhhdCBoYXBwZW4gaW4gb2NlYW5pYyByZWdpb24uCgoKIyMjIFRlc3RpbmcgLSBQb2x5bm9taWFsIFJlZ3Jlc3Npb24KCgpgYGB7cn0KcG9seV9tYWdfZml0ID0gbG0obWFnbml0dWRlIH4gcG9seShzaWcsIDUpLCBkYXRhID0gZWFydGhxdWFrZV90cmFpbikKc3VtbWFyeShwb2x5X21hZ19maXQpCmBgYAoKLSBBZnRlciBhIHZhcmlhbmNlIG9mIHRlc3RpbmcgbGluZWFyIHJlZ3Jlc3Npb24gd2l0aCBkaWZmZXJlbnQgdmFyaWFibGVzIGFuZCBkaWZmZXJlbnQgbGVuZ3RoIG9mIHBvbHlub21pYWxzLCB0aGUgYmVzdCByZXN1bHRzIGNhbWUgZnJvbSBhIHBvbHlub21pYWwgb2YgNSB3aXRoIHRoZSBzaWduaWZpY2FuY2UuIEFsbCBvZiB0aGUgcG9seW5vbWlhbCB2YXJpYWJsZXMgYXJlIHN0YXRpc3RpY2FsbHkgc2lnbmlmaWNhbnQgd2l0aCBhIHAtdmFsdWUgdGhyZXNob2xkIG9mIDAuMDUuIEl0IGhhZCBhIHJlc2lkdWFsIHN0YW5kYXJkIGVycm9yIG9mIC4yOSB3aGljaCBpcyBmYWlybHkgbG93IGFuZCBhbiBSLXNxdWFyZWQgb2YgLjU2IHdoaWNoIGlzIHN1Z2dlc3QgdGhhdCB0aGUgbW9kZWwgaXMgYSByZWFzb25hYmxlIGZpdC4gVGhpcyB0ZXN0aW5ncyBzaG93cyB0aGF0IHRoZXJlIGlzIHN0YXRpc3RpY2FsIGV2aWRlbmNlIHRoYXQgdGhlcmUgaXMgYSBjb3JyZWxhdGlvbgoKCmBgYHtyfQpzaWdsaW1zIDwtIHJhbmdlKHNpZykKc2lnLmdyaWQgPC0gc2VxKGZyb20gPSBzaWdsaW1zWzFdLCB0byA9IHNpZ2xpbXNbMl0pCnByZWRzIDwtIHByZWRpY3QocG9seV9tYWdfZml0LCBuZXdkYXRhID0gbGlzdChzaWcgPSBzaWcuZ3JpZCksIHNlID0gVFJVRSkKc2UuYmFuZHMgPC0gY2JpbmQocHJlZHMkZml0ICsgMiAqIHByZWRzJHNlLmZpdCwgcHJlZHMkZml0IC0gMiAqIHByZWRzJHNlLmZpdCkgICMgU3RhbmRhcmQgZXJyb3IKCiNwYXIobWZyb3cgPSBjKDEsIDIpLCBtYXIgPSBjKDQuNSwgNC41LCAxLCAxKSwgb21hID0gYygwLCAwLCA0LCAwKSkKcGxvdCgxLCB0eXBlID0gJ24nLCB4bGltID0gc2lnbGltcywgeWxpbSA9IHJhbmdlKG1hZ25pdHVkZSksIHhsYWIgPSAnU2lnJywgeWxhYiA9ICdNYWduaXR1ZGUnKQpwb2ludHMoc2lnLCBtYWduaXR1ZGUsIGNleCA9IDAuNSwgY29sID0gJ2RhcmtncmV5JykKdGl0bGUoJ0RlZ3JlZS01IFBvbHlub21pYWwnLCBvdXRlciA9IEZBTFNFKQpsaW5lcyhzaWcuZ3JpZCwgcHJlZHMkZml0LCBsd2QgPSAyLCBjb2wgPSAnYmx1ZScpCm1hdGxpbmVzKHNpZy5ncmlkLCBzZS5iYW5kcywgbHdkID0gMSwgY29sID0gJ2JsdWUnLCBsdHkgPSAzKQpgYGAKCi0gVGhlIHBsb3QgYWJvdmUgc2hvd3MgdGhlIHN0YW5kYXJkIGVycm9yIGxpbmUgb2YgdGhlIG1vZGVsLgoKCgojIyAqKlRoZSBQcm9iYWJpbGl0eSBvZiBhIFRzdW5hbWkqKgoKKiBBZnRlciBjb21wbGV0aW5nIHRoZSBleHBsb3JhdG9yeSBkYXRhIGFuYWx5c2lzIGFuZCB0aGUgdGVzdGluZyBhYm92ZSwgdGhlcmUgd2FzIG9uZSBvdGhlciBmYWN0b3IgdGhhdCB3YXMgaW50ZXJlc3RpbmcgdG8gdGVzdDogY2FuIGVyIHByZWRpY3QgdGhlIHByb2JhYmlsaXR5IG9mIGEgdHN1bmFtaSBnaXZlbiBvdGhlciBmYWN0b3JzLgoKIyMjIEdyYXBoaWNhbCBBbmFseXNpcwoKYGBge3J9CmdncGxvdChlYXJ0aHF1YWtlX2RmLCBhZXMoeCA9IGZhY3Rvcih0c3VuYW1pKSwgZmlsbCA9IHRzdW5hbWkpKSArCiAgZ2VvbV9iYXIoKSArCiAgbGFicyh0aXRsZSA9ICJUc3VuYW1pIE9jY3VycmVuY2VzIiwgeCA9ICJUc3VuYW1pIiwgeSA9ICJGcmVxdWVuY3kiKSArCiAgc2NhbGVfeF9kaXNjcmV0ZShsYWJlbHMgPSBjKCJObyIsICJZZXMiKSkgKwogIHNjYWxlX2ZpbGxfbWFudWFsKHZhbHVlcyA9IGMoImxpZ2h0Ymx1ZSIsICJsaWdodGNvcmFsIiksIAogICAgICAgICAgICAgICAgICAgIG5hbWUgPSAiRWFydHF1YWtlIiwKICAgICAgICAgICAgICAgICAgICBsYWJlbHMgPSBjKCJPbiBMYW5kIiwgIkluIE9jZWFuaWMgQXJlYSIpKSArCiAgdGhlbWVfbWluaW1hbCgpCmBgYAoKKiBBY2NvcmRpbmcgdG8gdGhlIGJhciBwbG90LCBhYm91dCAyLzMgb2YgdGhlIGVhcnRocXVha2VzIGluIHRoZSBkYXRhIGhhcHBlbiBvbiBsYW5kIGFuZCAxLzMgb2YgdGhlIGVhcnRocXVha2VzIGluIHRoZSBkYXRhIGhhcHBlbnMgaW4gb2NlYW5pYyBhcmVhCgoKIyMjIFRyYWluaW5nIGFuZCB0ZXN0aW5nIC0gTG9naXN0aWMgUmVncmVzc2lvbgoKKiBUaGUgdHJhaW5pbmcgb2YgdGhlIGxvZ2lzdGljIHJlZ3Jlc3Npb24gbW9kZWwgd2l0aCB0c3VuYW1pIGFzIHRoZSByZXNwb25zZSB2YXJpYWJsZQoKYGBge3J9CiMgdHJhaW5pbmcgdGhlIG1vZGVsCmxvZ2lzdGljX21vZGVsIDwtIGdsbSh0c3VuYW1pIH4gbWFnbml0dWRlICsgZGVwdGggKyBhbGVydCwgZGF0YSA9IGVhcnRocXVha2VfdHJhaW4sIGZhbWlseSA9ICJiaW5vbWlhbCIpCnN1bW1hcnkobG9naXN0aWNfbW9kZWwpCgpgYGAKCiogQWZ0ZXIgYSB2YXJpYWJsZSBvZiB0ZXN0aW5nLCB3ZSBjYW1lIHRvIHRoZSBjb25jbHVzaW9uIHRoYXQgdGhlIGJlc3QgcHJlZGljdG9yIHZhcmlhYmxlcyBhcmUgbWFnbml0dWRlLCBkZXB0aCBhbmQgYWxlcnQuIFRoZXkgYXJlIGFsbCBzdGF0aXN0aWNhbGx5IHNpZ25pZmljYW50IHdpdGggYSBwLXZhbHVlIHRocmVzaG9sZCBvZiAwLjA1LiBTaW5jZSBhbGVydCBpcyBhIGNhdGVnb3JpY2FsIHZhcmlhYmxlIHRoZXJlIGFyZSA1IGRpZmZlcmVudCBlcXVhdGlvbiB0aGF0IGNvbWUgb3V0IG9mIHRoZSBtb2RlbCB0byBwcmVkaWN0IGEgdHN1bmFtaS4gRWFjaCBvbmUgcmVwcmVzZW50cyBvbmUgb2YgdGhlIDUgZmFjdG9yIGxldmVscyBvZiB0aGUgYWxlcnQgdmFyaWFibGU6CgorIEdyZWVuOgogIDEuIFRzdW5hbWkgPSAtIDkuMyArIDAuNyAqIG1hZ24gLSAwLjAwMSAqIGRlcHRoICsgNS43MgorIFllbGxvdzoKICAxLiBUc3VuYW1pID0gLSA5LjMgKyAwLjcgKiBtYWduIC0gMC4wMDEgKiBkZXB0aCArIDUuMDYKKyBPcmFuZ2U6CiAgMS4gVHN1bmFtaSA9IC0gOS4zICsgMC43ICogbWFnbiAtIDAuMDAxICogZGVwdGggKyA0Ljc1CisgUmVkOgogIDEuIFRzdW5hbWkgPSAtIDkuMyArIDAuNyAqIG1hZ24gLSAwLjAwMSAqIGRlcHRoICsgNC4wNAorIEVtcHR5OgogIDEuIFRzdW5hbWkgPSAtIDkuMyArIDAuNyAqIG1hZ24gLSAwLjAwMSAqIGRlcHRoIAogIAotIEhvd2V2ZXIgdG8gY2FsY3VsYXRlIHRoZSBwcm9iYWJpbGl0eSBvZiBhIHRzdW5hbWkgd2UgZmlsbCB0aGUgZXF1YXRpb24gYWJvdmUgaW50byB0aGUgZm9sbG93aW5nIGVxdWF0aW9uOgogICsgUChUc3VuYW1pKSA9ICAxIC8gMSArIGV4cCgtIChlcXVhdGlvbikpCgoqIFRoZSBlcXVhdGlvbiBpbmRpY2F0ZXMgdGhhdCB0aGUgaGlnaGVyIHRoZSBtYWduaXR1ZGUgb2YgdGhlIGVhcnRocXVha2UsIHRoZSBtb3JlIGxpa2VseSBpdCBpcyB0byBiZSBhIHRzdW5hbWkuIAoKKiBOb3cgaXQgaXMgdGltZSB0byB0ZXN0IHRoZSBtb2RlbAoKYGBge3J9CiMgVGVzdGluZyB0aGUgbW9kZWwKbG9naXN0aWNfcHJvYiA9IHByZWRpY3QobG9naXN0aWNfbW9kZWwsIGVhcnRocXVha2VfdGVzdCwgdHlwZSA9ICdyZXNwb25zZScpCmxvZ2lzdGljX3ByZWQgPSByZXAoJzAnLCAyNTApCmxvZ2lzdGljX3ByZWRbbG9naXN0aWNfcHJvYj4wLjVdID0gJzEnCgojIGNvbmZ1c2lvbiBtYXRyaXgKdGFibGUobG9naXN0aWNfcHJlZCwgdHN1bmFtaV90ZXN0KQoKIyBUZXN0aW5nIHRoZSBNYXRyaXgKYWNjdXJhY3kgPSBtZWFuKGxvZ2lzdGljX3ByZWQ9PXRzdW5hbWlfdGVzdCkKcHJlY2lzaW9uID0gMTMxIC8oMTMxICsgODMpCgojIFByaW50aW5nIHRoZSBSZXN1bHRzCmNhdCgiQWNjdXJhY3k6ICIsIGFjY3VyYWN5LCAiXG4iLAoiUHJlY2lzaW9uOiAiLCBwcmVjaXNpb24sICJcbiIpCmBgYAoKKiBUaGUgYWJvdmUgcmVzdWx0cyBzaG93IHRoZSBjb25mdXNpb24gbWF0cml4IG9mIHRoZSBsb2dpc3RpYyBtb2RlbC4gRnJvbSB0aGUgcmVzdWx0cyB0aGUgYWNjdXJhY3kgYW5kIHByZWNpc2lvbiBhcmUgY2FsY3VsYXRlZC4KCisgQWNjdXJhY3kKICAxLiBUaGUgYWNjdXJhY3kgb2YgdGhlIHRlc3RpbmcgbW9kZWwgaXMgODYlIHdoaWNoIGlzIGEgZ29vZCBwZXJjZW50YWdlLgorIFByZWNpc2lvbgogIDEuIEl0IG1lYXN1cmVzIHRoZSBwZXJjZW50YWdlIG9mIHRoZSBpdGVtcyB0aGF0IHRoZSBzeXN0ZW0gZGV0ZWN0ZWQgcG9zaXRpdmUuIEl0IGlzIDYxJSwgdGhhdCBpcyBhIGZhaXJseSBnb29kIHBlcmNlbnRhZ2UgdGhhdCBpbmRpY2F0ZXMgdGhlIGNvbnNpc3RlbmN5IG9mIHRoZSBtb2RlbC4gCgoKIyAqKkNvbmNsdXNpb24qKgoKMS4gSW4gYW4gZWFydGhxdWFrZSBldmVudCwgdGhlIGhpZ2hlciB0aGUgbWFnbml0dWRlIGlzLCB0aGUgbW9yZSBzaWduaWZpY2FudCB0aGUgZXZlbnQgaXMuIAoyLiBBY2NvcmRpbmcgdG8gdGhpcyBkYXRhLCB0aGUgZWFydGhxdWFrZXMgb24gbGFuZCBpbnRlbmQgdG8gYmUgaGlnaGVyIGluIG1hZ25pdHVkZSB0aGFuIHRoZSBvbmVzIHRoYXQgaGFwcGVuIGluIG9jZWFuaWMgYXJlYSAodHN1bmFtaSkuCjMuIFdpdGggYSA4NiUgYWNjdXJhY3ksIHRoZSBwcm9iYWJpbGl0eSBvZiBhbiBldmVudCBpcyBhIHRzdW5hbWkgY2FuIGJlIGNhbGN1bGF0ZWQgd2l0aCB0aGUgYWJvdmUgZXF1YXRpb24uCjQuIFRoZSBoaWdoZXIgdGhlIHZhbHVlIG9mIGEgbWFnbml0dWRlLCB0aGUgaGlnaGVyIHRoZSBwcm9iYWJpbGl0eSB0aGF0IHRoZSBldmVudCBpcyBhIHRzdW5hbWkK

Exploring Earthquake patterns from 1995-2023

Brynhildur Traustadóttir

December 11th, 2023

Introduction

Problem Statement

The Data

Raw Data

Data Preperation

Column Description

Exploratory Data Analysis

Summary

Plots

Correlation

Modelling

Magnitude and Significance

Graphical Analysis

Testing - Polynomial Regression

The Probability of a Tsunami

Graphical Analysis

Training and testing - Logistic Regression

Conclusion