AS1-1 An Analytical Detective

Section 1 - Loading the Data

1.1

How many rows of data (observations) are in this dataset?

Sys.setlocale("LC_ALL","C")

[1] "C"

D = read.csv("data/mvtWeek1.csv")
nrow(D)

[1] 191641

1.2

How many variables are in this dataset?

ncol(D)

[1] 11

1.3

Using the “max” function, what is the maximum value of the variable “ID”?

which.max(D$ID)

[1] 18134

D$ID[18134]

[1] 9181151

1.4

What is the minimum value of the variable “Beat”?

which.min(D$Beat)

[1] 4756

D$Beat[4756]

[1] 111

1.5

How many observations have value TRUE in the Arrest variable (this is the number of crimes for which an arrest was made)?

K =table(D$Arrest)
K[2]

 TRUE 
15536

1.6

How many observations have a LocationDescription value of ALLEY?

sum(D$LocationDescription==c("ALLEY"))

[1] 2308

Section 2 - Understanding Dates in R

In many datasets, like this one, you have a date field. Unfortunately, R does not automatically recognize entries that look like dates. We need to use a function in R to extract the date and time. Take a look at the first entry of Date (remember to use square brackets when looking at a certain entry of a variable).

2.1

In what format are the entries in the variable Date?

Month/Day/Year Hour:Minute
Day/Month/Year Hour:Minute
Hour:Minute Month/Day/Year
Hour:Minute Day/Month/Year

D$Date[1]

[1] "2012-12-31"

# Month/Day/Year Hour:Minute

2.2

Now, let’s convert these characters into a Date object in R. In your R console, type

DateConvert = as.Date(strptime(mvt$Date, "%m/%d/%y %H:%M"))

This converts the variable “Date” into a Date object in R. Take a look at the variable DateConvert using the summary function.

What is the month and year of the median date in our dataset? Enter your answer as “Month Year”, without the quotes. (Ex: if the answer was 2008-03-28, you would give the answer “March 2008”, without the quotes.)

 DateConvert = as.Date(strptime(D$Date, "%m/%d/%y %H:%M"))
summary(DateConvert)

        Min.      1st Qu.       Median         Mean      3rd Qu.         Max. 
"2001-01-01" "2003-07-10" "2006-05-21" "2006-08-23" "2009-10-24" "2012-12-31"

median(DateConvert)

[1] "2006-05-21"

2.3

Now, let’s extract the month and the day of the week, and add these variables to our data frame mvt. We can do this with two simple functions. Type the following commands in R:

mvt$Month = months(DateConvert)

mvt$Weekday = weekdays(DateConvert)

This creates two new variables in our data frame, Month and Weekday, and sets them equal to the month and weekday values that we can extract from the Date object. Lastly, replace the old Date variable with DateConvert by typing:

mvt$Date = DateConvert

Using the table command, answer the following questions.

In which month did the fewest motor vehicle thefts occur?

D$Month = months(DateConvert)
D$Weekday = weekdays(DateConvert)
D$Date = DateConvert
sort(table(D$Month))


 February     April     March      June       May   January September  November  December    August      July   October 
    13511     15280     15758     16002     16035     16047     16060     16063     16426     16572     16801     17086

2.4

On which weekday did the most motor vehicle thefts occur?

sort(table(D$Weekday),TRUE)


   Friday Wednesday    Monday  Thursday  Saturday   Tuesday    Sunday 
    29284     27416     27397     27319     27118     26791     26316

2.5

Each observation in the dataset represents a motor vehicle theft, and the Arrest variable indicates whether an arrest was later made for this theft. Which month has the largest number of motor vehicle thefts for which an arrest was made?

table(D$Arrest,D$Month)

       
         一月  七月  九月  二月  八月 十一月 十二月  十月  三月
  FALSE 14612 15477 14812 12273 15243  14807  15029 15744 14460
  TRUE   1435  1324  1248  1238  1329   1256   1397  1342  1298
       
         五月  六月  四月
  FALSE 14848 14772 14028
  TRUE   1187  1230  1252

Section 3 - Visualizing Crime Trends

3.1

Now, let’s make some plots to help us better understand how crime has changed over time in Chicago. Throughout this problem, and in general, you can save your plot to a file. For more information, this website very clearly explains the process.

First, let’s make a histogram of the variable Date. We’ll add an extra argument, to specify the number of bars we want in our histogram. In your R console, type

hist(mvt$Date, breaks=100)

Looking at the histogram, answer the following questions.

In general, does it look like crime increases or decreases from 2002 - 2012?

Increases
Decreases

# Decreases

In general, does it look like crime increases or decreases from 2005 - 2008?

Increases
Decreases

# Decreases

3.2

Now, let’s see how arrests have changed over time. Create a boxplot of the variable “Date”, sorted by the variable “Arrest” (if you are not familiar with boxplots and would like to learn more, check out this tutorial). In a boxplot, the bold horizontal line is the median value of the data, the box shows the range of values between the first quartile and third quartile, and the whiskers (the dotted lines extending outside the box) show the minimum and maximum values, excluding any outliers (which are plotted as circles). Outliers are defined by first computing the difference between the first and third quartile values, or the height of the box. This number is called the Inter-Quartile Range (IQR). Any point that is greater than the third quartile plus the IQR or less than the first quartile minus the IQR is considered an outlier.

Does it look like there were more crimes for which arrests were made in the first half of the time period or the second half of the time period? (Note that the time period is from 2001 to 2012, so the middle of the time period is the beginning of 2007.)

First half
Second half

3.3

Let’s investigate this further. Use the table function for the next few questions.

For what proportion of motor vehicle thefts in 2001 was an arrest made?

Note: in this question and many others in the course, we are asking for an answer as a proportion. Therefore, your answer should take a value between 0 and 1.

sum(D$Year==2001 & D$Arrest=="TRUE") /sum(D$Year==2001)

[1] 0.1041173

3.4

For what proportion of motor vehicle thefts in 2007 was an arrest made?

sum(D$Year==2007 & D$Arrest=="TRUE") /sum(D$Year==2007)

[1] 0.08487395

3.5

For what proportion of motor vehicle thefts in 2012 was an arrest made?

sum(D$Year==2012 & D$Arrest=="TRUE") /sum(D$Year==2012)

[1] 0.03902924

Since there may still be open investigations for recent crimes, this could explain the trend we are seeing in the data. There could also be other factors at play, and this trend should be investigated further. However, since we don’t know when the arrests were actually made, our detective work in this area has reached a dead end.

Section 4 - Popular Locations

4.1

Analyzing this data could be useful to the Chicago Police Department when deciding where to allocate resources. If they want to increase the number of arrests that are made for motor vehicle thefts, where should they focus their efforts?

We want to find the top five locations where motor vehicle thefts occur. If you create a table of the LocationDescription variable, it is unfortunately very hard to read since there are 78 different locations in the data set. By using the sort function, we can view this same table, but sorted by the number of observations in each category. In your R console, type:

sort(table(mvt$LocationDescription))

Which locations are the top five locations for motor vehicle thefts, excluding the “Other” category? You should select 5 of the following options.

Bank
Gas Station
Hotel/Motel
Street
Car Wash
Restaurant
Parking Lot/Garage (Non-Residential)
Alley
Driveway (Residential)
Vacant Lot/Land

sort(table(D$LocationDescription),decreasing= TRUE)


                                         STREET                  PARKING LOT/GARAGE(NON.RESID.)                                           OTHER 
                                         156564                                           14852                                            4573 
                                          ALLEY                                     GAS STATION                          DRIVEWAY - RESIDENTIAL 
                                           2308                                            2111                                            1675 
                  RESIDENTIAL YARD (FRONT/BACK)                                       RESIDENCE                                RESIDENCE-GARAGE 
                                           1536                                            1302                                            1176 
                                VACANT LOT/LAND                          VEHICLE NON-COMMERCIAL                                        SIDEWALK 
                                            985                                             817                                             462 
                        CHA PARKING LOT/GROUNDS                                AIRPORT/AIRCRAFT                 POLICE FACILITY/VEH PARKING LOT 
                                            405                                             363                                             266 
                                  PARK PROPERTY                         SCHOOL, PUBLIC, GROUNDS                                       APARTMENT 
                                            255                                             206                                             184 
                           SPORTS ARENA/STADIUM                     CTA GARAGE / OTHER PROPERTY                    COMMERCIAL / BUSINESS OFFICE 
                                            166                                             148                                             126 
                                    HOTEL/MOTEL                        SCHOOL, PUBLIC, BUILDING                       HOSPITAL BUILDING/GROUNDS 
                                            124                                             114                                             101 
                             GROCERY FOOD STORE               CHURCH/SYNAGOGUE/PLACE OF WORSHIP                                      RESTAURANT 
                                             80                                              56                                              49 
                   GOVERNMENT BUILDING/PROPERTY                      COLLEGE/UNIVERSITY GROUNDS                                        CAR WASH 
                                             48                                              47                                              44 
                              CONSTRUCTION SITE                              SMALL RETAIL STORE               OTHER RAILROAD PROP / TRAIN DEPOT 
                                             35                                              33                                              28 
             AIRPORT EXTERIOR - NON-SECURE AREA                        SCHOOL, PRIVATE, GROUNDS                              VEHICLE-COMMERCIAL 
                                             24                                              23                                              23 
                               DEPARTMENT STORE                              HIGHWAY/EXPRESSWAY                    NURSING HOME/RETIREMENT HOME 
                                             22                                              22                                              21 
                                        TAXICAB                             MOVIE HOUSE/THEATER                         RESIDENCE PORCH/HALLWAY 
                                             21                                              18                                              18 
                                  BAR OR TAVERN                                       WAREHOUSE                  FACTORY/MANUFACTURING BUILDING 
                                             17                                              17                                              16 
                      SCHOOL, PRIVATE, BUILDING                             TAVERN/LIQUOR STORE                             AIRPORT PARKING LOT 
                                             14                                              14                                              11 
                  AIRPORT VENDING ESTABLISHMENT                                   ATHLETIC CLUB                                      DRUG STORE 
                                             10                                               9                                               8 
                OTHER COMMERCIAL TRANSPORTATION                                            BANK                               CONVENIENCE STORE 
                                              8                                               7                                               7 
                                FOREST PRESERVE  AIRPORT TERMINAL UPPER LEVEL - NON-SECURE AREA                                   CHA APARTMENT 
                                              6                                               5                                               5 
                                DAY CARE CENTER                                    FIRE STATION                              ABANDONED BUILDING 
                                              5                                               5                                               4 
AIRPORT BUILDING NON-TERMINAL - NON-SECURE AREA                                      BARBERSHOP                  LAKEFRONT/WATERFRONT/RIVERBANK 
                                              4                                               4                                               4 
                                        LIBRARY                                SAVINGS AND LOAN                                   BOWLING ALLEY 
                                              4                                               4                                               3 
                                 CLEANING STORE                           MEDICAL/DENTAL OFFICE                                          BRIDGE 
                                              3                                               3                                               2 
              COLLEGE/UNIVERSITY RESIDENCE HALL                               CURRENCY EXCHANGE     AIRPORT BUILDING NON-TERMINAL - SECURE AREA 
                                              2                                               2                                               1 
                 AIRPORT EXTERIOR - SECURE AREA                                 ANIMAL HOSPITAL                                 APPLIANCE STORE 
                                              1                                               1                                               1 
                                      CTA TRAIN                         JAIL / LOCK-UP FACILITY                                       NEWSSTAND 
                                              1                                               1                                               1

# Street,Parking Lot/Garage (Non-Residential),Alley,Gas Station,Driveway (Residential)

4.2

Create a subset of your data, only taking observations for which the theft happened in one of these five locations, and call this new data set “Top5”. To do this, you can use the | symbol. In lecture, we used the & symbol to use two criteria to make a subset of the data. To only take observations that have a certain value in one variable or the other, the | character can be used in place of the & symbol. This is also called a logical “or” operation.

Alternately, you could create five different subsets, and then merge them together into one data frame using rbind.

How many observations are in Top5?

nrow(TOP5)

[1] 177510

4.3

R will remember the other categories of the LocationDescription variable from the original dataset, so running table(Top5$LocationDescription) will have a lot of unnecessary output. To make our tables a bit nicer to read, we can refresh this factor variable. In your R console, type:

Top5$LocationDescription = factor(Top5$LocationDescription)

If you run the str or table function on Top5 now, you should see that LocationDescription now only has 5 values, as we expect.

Use the Top5 data frame to answer the remaining questions.

One of the locations has a much higher arrest rate than the other locations. Which is it? Please enter the text in exactly the same way as how it looks in the answer options for Problem 4.1.

e=(table(TOP5$LocationDescription, TOP5$Arrest))
ALLEY=(e[1,2])/(e[1,1]+e[1,2])
DRIVEWAY_RESIDENTIAL=(e[2,2])/(e[2,1]+e[2,2])
GAS_STATION=(e[3,2])/(e[3,1]+e[3,2])
PARKING_LOT=(e[4,2])/(e[4,1]+e[4,2])
STREET=(e[5,2])/(e[5,1]+e[5,2])
max(c(ALLEY,DRIVEWAY_RESIDENTIAL,GAS_STATION,PARKING_LOT,STREET))

[1] 0.2079583

which.max((c(ALLEY,DRIVEWAY_RESIDENTIAL,GAS_STATION,PARKING_LOT,STREET)))

[1] 3

4.4

On which day of the week do the most motor vehicle thefts at gas stations happen? (Monday~Sunday)

sort(table(TOP5$LocationDescription,TOP5$Weekday)[3,],TRUE)

 Saturday    Sunday    Friday  Thursday    Monday Wednesday   Tuesday 
      338       336       332       282       280       273       270

#Saturday

4.5

On which day of the week do the fewest motor vehicle thefts in residential driveways happen?(Monday~Sunday)

sort(table(TOP5$LocationDescription,TOP5$Weekday)[2,],FALSE)

 Saturday    Sunday Wednesday   Tuesday    Monday    Friday  Thursday 
      202       221       234       243       255       257       263

#Saturday

LS0tDQp0aXRsZTogIkFTMS0xIEFuIEFuYWx5dGljYWwgRGV0ZWN0aXZlIg0KYXV0aG9yOiAiPOeOi+asoz4gPE0wNjQxMTEwMzk+Ig0Kb3V0cHV0OiBodG1sX25vdGVib29rDQotLS0NCg0KLSAtIC0gDQoNCiMjIyBTZWN0aW9uIDEgLSBMb2FkaW5nIHRoZSBEYXRhDQoNCiMjIyMgMS4xIA0KSG93IG1hbnkgcm93cyBvZiBkYXRhIChvYnNlcnZhdGlvbnMpIGFyZSBpbiB0aGlzIGRhdGFzZXQ/DQoNCmBgYHtyfQ0KU3lzLnNldGxvY2FsZSgiTENfQUxMIiwiQyIpDQpEID0gcmVhZC5jc3YoImRhdGEvbXZ0V2VlazEuY3N2IikNCm5yb3coRCkNCmBgYA0KDQoNCiMjIyMgMS4yIA0KSG93IG1hbnkgdmFyaWFibGVzIGFyZSBpbiB0aGlzIGRhdGFzZXQ/DQpgYGB7cn0NCm5jb2woRCkNCmBgYA0KDQoNCiMjIyMgMS4zIA0KVXNpbmcgdGhlICJtYXgiIGZ1bmN0aW9uLCB3aGF0IGlzIHRoZSBtYXhpbXVtIHZhbHVlIG9mIHRoZSB2YXJpYWJsZSAiSUQiPw0KDQpgYGB7cn0NCndoaWNoLm1heChEJElEKQ0KRCRJRFsxODEzNF0NCg0KYGBgDQoNCiMjIyMgMS40IA0KV2hhdCBpcyB0aGUgbWluaW11bSB2YWx1ZSBvZiB0aGUgdmFyaWFibGUgIkJlYXQiPw0KYGBge3J9DQp3aGljaC5taW4oRCRCZWF0KQ0KRCRCZWF0WzQ3NTZdDQpgYGANCg0KIyMjIyAxLjUgDQpIb3cgbWFueSBvYnNlcnZhdGlvbnMgaGF2ZSB2YWx1ZSBUUlVFIGluIHRoZSBBcnJlc3QgdmFyaWFibGUgKHRoaXMgaXMgdGhlIG51bWJlciBvZiBjcmltZXMgZm9yIHdoaWNoIGFuIGFycmVzdCB3YXMgbWFkZSk/DQoNCmBgYHtyfQ0KSyA9dGFibGUoRCRBcnJlc3QpDQpLWzJdDQpgYGANCg0KIyMjIyAxLjYgDQpIb3cgbWFueSBvYnNlcnZhdGlvbnMgaGF2ZSBhIExvY2F0aW9uRGVzY3JpcHRpb24gdmFsdWUgb2YgQUxMRVk/DQoNCmBgYHtyfQ0Kc3VtKEQkTG9jYXRpb25EZXNjcmlwdGlvbj09YygiQUxMRVkiKSkNCmBgYA0KDQojIyMgU2VjdGlvbiAyIC0gVW5kZXJzdGFuZGluZyBEYXRlcyBpbiBSDQoNCg0KSW4gbWFueSBkYXRhc2V0cywgbGlrZSB0aGlzIG9uZSwgeW91IGhhdmUgYSBkYXRlIGZpZWxkLiBVbmZvcnR1bmF0ZWx5LCBSIGRvZXMgbm90IGF1dG9tYXRpY2FsbHkgcmVjb2duaXplIGVudHJpZXMgdGhhdCBsb29rIGxpa2UgZGF0ZXMuIFdlIG5lZWQgdG8gdXNlIGEgZnVuY3Rpb24gaW4gUiB0byBleHRyYWN0IHRoZSBkYXRlIGFuZCB0aW1lLiBUYWtlIGEgbG9vayBhdCB0aGUgZmlyc3QgZW50cnkgb2YgRGF0ZSAocmVtZW1iZXIgdG8gdXNlIHNxdWFyZSBicmFja2V0cyB3aGVuIGxvb2tpbmcgYXQgYSBjZXJ0YWluIGVudHJ5IG9mIGEgdmFyaWFibGUpLg0KDQojIyMjIDIuMSANCkluIHdoYXQgZm9ybWF0IGFyZSB0aGUgZW50cmllcyBpbiB0aGUgdmFyaWFibGUgRGF0ZT8NCg0KKyBNb250aC9EYXkvWWVhciBIb3VyOk1pbnV0ZQ0KKyBEYXkvTW9udGgvWWVhciBIb3VyOk1pbnV0ZQ0KKyBIb3VyOk1pbnV0ZSBNb250aC9EYXkvWWVhcg0KKyBIb3VyOk1pbnV0ZSBEYXkvTW9udGgvWWVhcg0KDQpgYGB7cn0NCkQkRGF0ZVsxXQ0KDQojIE1vbnRoL0RheS9ZZWFyIEhvdXI6TWludXRlDQpgYGANCg0KIyMjIyAyLjIgDQoNCk5vdywgbGV0J3MgY29udmVydCB0aGVzZSBjaGFyYWN0ZXJzIGludG8gYSBEYXRlIG9iamVjdCBpbiBSLiBJbiB5b3VyIFIgY29uc29sZSwgdHlwZQ0KDQogICAgRGF0ZUNvbnZlcnQgPSBhcy5EYXRlKHN0cnB0aW1lKG12dCREYXRlLCAiJW0vJWQvJXkgJUg6JU0iKSkNCg0KVGhpcyBjb252ZXJ0cyB0aGUgdmFyaWFibGUgIkRhdGUiIGludG8gYSBEYXRlIG9iamVjdCBpbiBSLiBUYWtlIGEgbG9vayBhdCB0aGUgdmFyaWFibGUgRGF0ZUNvbnZlcnQgdXNpbmcgdGhlIHN1bW1hcnkgZnVuY3Rpb24uDQoNCldoYXQgaXMgdGhlIG1vbnRoIGFuZCB5ZWFyIG9mIHRoZSBtZWRpYW4gZGF0ZSBpbiBvdXIgZGF0YXNldD8gRW50ZXIgeW91ciBhbnN3ZXIgYXMgIk1vbnRoIFllYXIiLCB3aXRob3V0IHRoZSBxdW90ZXMuIChFeDogaWYgdGhlIGFuc3dlciB3YXMgMjAwOC0wMy0yOCwgeW91IHdvdWxkIGdpdmUgdGhlIGFuc3dlciAiTWFyY2ggMjAwOCIsIHdpdGhvdXQgdGhlIHF1b3Rlcy4pDQoNCmBgYHtyfQ0KIERhdGVDb252ZXJ0ID0gYXMuRGF0ZShzdHJwdGltZShEJERhdGUsICIlbS8lZC8leSAlSDolTSIpKQ0Kc3VtbWFyeShEYXRlQ29udmVydCkNCm1lZGlhbihEYXRlQ29udmVydCkNCmBgYA0KDQojIyMjIDIuMw0KTm93LCBsZXQncyBleHRyYWN0IHRoZSBtb250aCBhbmQgdGhlIGRheSBvZiB0aGUgd2VlaywgYW5kIGFkZCB0aGVzZSB2YXJpYWJsZXMgdG8gb3VyIGRhdGEgZnJhbWUgbXZ0LiBXZSBjYW4gZG8gdGhpcyB3aXRoIHR3byBzaW1wbGUgZnVuY3Rpb25zLiBUeXBlIHRoZSBmb2xsb3dpbmcgY29tbWFuZHMgaW4gUjoNCg0KICAgIG12dCRNb250aCA9IG1vbnRocyhEYXRlQ29udmVydCkNCg0KICAgIG12dCRXZWVrZGF5ID0gd2Vla2RheXMoRGF0ZUNvbnZlcnQpDQoNClRoaXMgY3JlYXRlcyB0d28gbmV3IHZhcmlhYmxlcyBpbiBvdXIgZGF0YSBmcmFtZSwgTW9udGggYW5kIFdlZWtkYXksIGFuZCBzZXRzIHRoZW0gZXF1YWwgdG8gdGhlIG1vbnRoIGFuZCB3ZWVrZGF5IHZhbHVlcyB0aGF0IHdlIGNhbiBleHRyYWN0IGZyb20gdGhlIERhdGUgb2JqZWN0LiBMYXN0bHksIHJlcGxhY2UgdGhlIG9sZCBEYXRlIHZhcmlhYmxlIHdpdGggRGF0ZUNvbnZlcnQgYnkgdHlwaW5nOg0KDQogICAgbXZ0JERhdGUgPSBEYXRlQ29udmVydA0KDQpVc2luZyB0aGUgdGFibGUgY29tbWFuZCwgYW5zd2VyIHRoZSBmb2xsb3dpbmcgcXVlc3Rpb25zLg0KDQpJbiB3aGljaCBtb250aCBkaWQgdGhlIGZld2VzdCBtb3RvciB2ZWhpY2xlIHRoZWZ0cyBvY2N1cj8NCg0KYGBge3J9DQpEJE1vbnRoID0gbW9udGhzKERhdGVDb252ZXJ0KQ0KRCRXZWVrZGF5ID0gd2Vla2RheXMoRGF0ZUNvbnZlcnQpDQpEJERhdGUgPSBEYXRlQ29udmVydA0Kc29ydCh0YWJsZShEJE1vbnRoKSkNCmBgYA0KDQojIyMjIDIuNCANCk9uIHdoaWNoIHdlZWtkYXkgZGlkIHRoZSBtb3N0IG1vdG9yIHZlaGljbGUgdGhlZnRzIG9jY3VyPw0KDQpgYGB7cn0NCnNvcnQodGFibGUoRCRXZWVrZGF5KSxUUlVFKQ0KYGBgDQoNCiMjIyMgMi41IA0KRWFjaCBvYnNlcnZhdGlvbiBpbiB0aGUgZGF0YXNldCByZXByZXNlbnRzIGEgbW90b3IgdmVoaWNsZSB0aGVmdCwgYW5kIHRoZSBBcnJlc3QgdmFyaWFibGUgaW5kaWNhdGVzIHdoZXRoZXIgYW4gYXJyZXN0IHdhcyBsYXRlciBtYWRlIGZvciB0aGlzIHRoZWZ0LiBXaGljaCBtb250aCBoYXMgdGhlIGxhcmdlc3QgbnVtYmVyIG9mIG1vdG9yIHZlaGljbGUgdGhlZnRzIGZvciB3aGljaCBhbiBhcnJlc3Qgd2FzIG1hZGU/DQoNCmBgYHtyfQ0KdGFibGUoRCRBcnJlc3QsRCRNb250aCkNCmBgYA0KDQojIyMgU2VjdGlvbiAzIC0gVmlzdWFsaXppbmcgQ3JpbWUgVHJlbmRzDQoNCiMjIyMgMy4xDQoNCk5vdywgbGV0J3MgbWFrZSBzb21lIHBsb3RzIHRvIGhlbHAgdXMgYmV0dGVyIHVuZGVyc3RhbmQgaG93IGNyaW1lIGhhcyBjaGFuZ2VkIG92ZXIgdGltZSBpbiBDaGljYWdvLiBUaHJvdWdob3V0IHRoaXMgcHJvYmxlbSwgYW5kIGluIGdlbmVyYWwsIHlvdSBjYW4gc2F2ZSB5b3VyIHBsb3QgdG8gYSBmaWxlLiBGb3IgbW9yZSBpbmZvcm1hdGlvbiwgdGhpcyB3ZWJzaXRlIHZlcnkgY2xlYXJseSBleHBsYWlucyB0aGUgcHJvY2Vzcy4NCg0KRmlyc3QsIGxldCdzIG1ha2UgYSBoaXN0b2dyYW0gb2YgdGhlIHZhcmlhYmxlIERhdGUuIFdlJ2xsIGFkZCBhbiBleHRyYSBhcmd1bWVudCwgdG8gc3BlY2lmeSB0aGUgbnVtYmVyIG9mIGJhcnMgd2Ugd2FudCBpbiBvdXIgaGlzdG9ncmFtLiBJbiB5b3VyIFIgY29uc29sZSwgdHlwZQ0KDQpoaXN0KG12dCREYXRlLCBicmVha3M9MTAwKQ0KDQpgYGB7cn0NCmhpc3QoRCREYXRlLCBicmVha3M9MTAwKQ0KYGBgDQoNCkxvb2tpbmcgYXQgdGhlIGhpc3RvZ3JhbSwgYW5zd2VyIHRoZSBmb2xsb3dpbmcgcXVlc3Rpb25zLg0KDQpJbiBnZW5lcmFsLCBkb2VzIGl0IGxvb2sgbGlrZSBjcmltZSBpbmNyZWFzZXMgb3IgZGVjcmVhc2VzIGZyb20gMjAwMiAtIDIwMTI/DQoNCisgSW5jcmVhc2VzDQorIERlY3JlYXNlcw0KDQpgYGB7cn0NCiMgRGVjcmVhc2VzDQpgYGANCg0KSW4gZ2VuZXJhbCwgZG9lcyBpdCBsb29rIGxpa2UgY3JpbWUgaW5jcmVhc2VzIG9yIGRlY3JlYXNlcyBmcm9tIDIwMDUgLSAyMDA4Pw0KDQorIEluY3JlYXNlcw0KKyBEZWNyZWFzZXMNCg0KYGBge3J9DQojIERlY3JlYXNlcw0KYGBgDQoNCiMjIyMgMy4yDQpOb3csIGxldCdzIHNlZSBob3cgYXJyZXN0cyBoYXZlIGNoYW5nZWQgb3ZlciB0aW1lLiBDcmVhdGUgYSBib3hwbG90IG9mIHRoZSB2YXJpYWJsZSAiRGF0ZSIsIHNvcnRlZCBieSB0aGUgdmFyaWFibGUgIkFycmVzdCIgKGlmIHlvdSBhcmUgbm90IGZhbWlsaWFyIHdpdGggYm94cGxvdHMgYW5kIHdvdWxkIGxpa2UgdG8gbGVhcm4gbW9yZSwgY2hlY2sgb3V0IHRoaXMgdHV0b3JpYWwpLiBJbiBhIGJveHBsb3QsIHRoZSBib2xkIGhvcml6b250YWwgbGluZSBpcyB0aGUgbWVkaWFuIHZhbHVlIG9mIHRoZSBkYXRhLCB0aGUgYm94IHNob3dzIHRoZSByYW5nZSBvZiB2YWx1ZXMgYmV0d2VlbiB0aGUgZmlyc3QgcXVhcnRpbGUgYW5kIHRoaXJkIHF1YXJ0aWxlLCBhbmQgdGhlIHdoaXNrZXJzICh0aGUgZG90dGVkIGxpbmVzIGV4dGVuZGluZyBvdXRzaWRlIHRoZSBib3gpIHNob3cgdGhlIG1pbmltdW0gYW5kIG1heGltdW0gdmFsdWVzLCBleGNsdWRpbmcgYW55IG91dGxpZXJzICh3aGljaCBhcmUgcGxvdHRlZCBhcyBjaXJjbGVzKS4gT3V0bGllcnMgYXJlIGRlZmluZWQgYnkgZmlyc3QgY29tcHV0aW5nIHRoZSBkaWZmZXJlbmNlIGJldHdlZW4gdGhlIGZpcnN0IGFuZCB0aGlyZCBxdWFydGlsZSB2YWx1ZXMsIG9yIHRoZSBoZWlnaHQgb2YgdGhlIGJveC4gVGhpcyBudW1iZXIgaXMgY2FsbGVkIHRoZSBJbnRlci1RdWFydGlsZSBSYW5nZSAoSVFSKS4gQW55IHBvaW50IHRoYXQgaXMgZ3JlYXRlciB0aGFuIHRoZSB0aGlyZCBxdWFydGlsZSBwbHVzIHRoZSBJUVIgb3IgbGVzcyB0aGFuIHRoZSBmaXJzdCBxdWFydGlsZSBtaW51cyB0aGUgSVFSIGlzIGNvbnNpZGVyZWQgYW4gb3V0bGllci4NCg0KRG9lcyBpdCBsb29rIGxpa2UgdGhlcmUgd2VyZSBtb3JlIGNyaW1lcyBmb3Igd2hpY2ggYXJyZXN0cyB3ZXJlIG1hZGUgaW4gdGhlIGZpcnN0IGhhbGYgb2YgdGhlIHRpbWUgcGVyaW9kIG9yIHRoZSBzZWNvbmQgaGFsZiBvZiB0aGUgdGltZSBwZXJpb2Q/IChOb3RlIHRoYXQgdGhlIHRpbWUgcGVyaW9kIGlzIGZyb20gMjAwMSB0byAyMDEyLCBzbyB0aGUgbWlkZGxlIG9mIHRoZSB0aW1lIHBlcmlvZCBpcyB0aGUgYmVnaW5uaW5nIG9mIDIwMDcuKQ0KDQorIEZpcnN0IGhhbGYNCisgU2Vjb25kIGhhbGYNCg0KYGBge3J9DQpib3hwbG90KEQkRGF0ZSxEJEFycmVzdCkNCiMgRmlyc3QgaGFsZg0KYGBgDQoNCg0KIyMjIyAzLjMNCkxldCdzIGludmVzdGlnYXRlIHRoaXMgZnVydGhlci4gVXNlIHRoZSB0YWJsZSBmdW5jdGlvbiBmb3IgdGhlIG5leHQgZmV3IHF1ZXN0aW9ucy4NCg0KRm9yIHdoYXQgcHJvcG9ydGlvbiBvZiBtb3RvciB2ZWhpY2xlIHRoZWZ0cyBpbiAyMDAxIHdhcyBhbiBhcnJlc3QgbWFkZT8NCg0KTm90ZTogaW4gdGhpcyBxdWVzdGlvbiBhbmQgbWFueSBvdGhlcnMgaW4gdGhlIGNvdXJzZSwgd2UgYXJlIGFza2luZyBmb3IgYW4gYW5zd2VyIGFzIGEgcHJvcG9ydGlvbi4gVGhlcmVmb3JlLCB5b3VyIGFuc3dlciBzaG91bGQgdGFrZSBhIHZhbHVlIGJldHdlZW4gMCBhbmQgMS4NCg0KYGBge3J9DQoNCnN1bShEJFllYXI9PTIwMDEgJiBEJEFycmVzdD09IlRSVUUiKSAvc3VtKEQkWWVhcj09MjAwMSkNCmBgYA0KDQojIyMjIDMuNA0KRm9yIHdoYXQgcHJvcG9ydGlvbiBvZiBtb3RvciB2ZWhpY2xlIHRoZWZ0cyBpbiAyMDA3IHdhcyBhbiBhcnJlc3QgbWFkZT8NCg0KYGBge3J9DQpzdW0oRCRZZWFyPT0yMDA3ICYgRCRBcnJlc3Q9PSJUUlVFIikgL3N1bShEJFllYXI9PTIwMDcpDQpgYGANCg0KIyMjIyAzLjUNCkZvciB3aGF0IHByb3BvcnRpb24gb2YgbW90b3IgdmVoaWNsZSB0aGVmdHMgaW4gMjAxMiB3YXMgYW4gYXJyZXN0IG1hZGU/DQoNCmBgYHtyfQ0Kc3VtKEQkWWVhcj09MjAxMiAmIEQkQXJyZXN0PT0iVFJVRSIpIC9zdW0oRCRZZWFyPT0yMDEyKQ0KYGBgDQoNClNpbmNlIHRoZXJlIG1heSBzdGlsbCBiZSBvcGVuIGludmVzdGlnYXRpb25zIGZvciByZWNlbnQgY3JpbWVzLCB0aGlzIGNvdWxkIGV4cGxhaW4gdGhlIHRyZW5kIHdlIGFyZSBzZWVpbmcgaW4gdGhlIGRhdGEuIFRoZXJlIGNvdWxkIGFsc28gYmUgb3RoZXIgZmFjdG9ycyBhdCBwbGF5LCBhbmQgdGhpcyB0cmVuZCBzaG91bGQgYmUgaW52ZXN0aWdhdGVkIGZ1cnRoZXIuIEhvd2V2ZXIsIHNpbmNlIHdlIGRvbid0IGtub3cgd2hlbiB0aGUgYXJyZXN0cyB3ZXJlIGFjdHVhbGx5IG1hZGUsIG91ciBkZXRlY3RpdmUgd29yayBpbiB0aGlzIGFyZWEgaGFzIHJlYWNoZWQgYSBkZWFkIGVuZC4NCg0KIyMjIFNlY3Rpb24gNCAtIFBvcHVsYXIgTG9jYXRpb25zDQoNCiMjIyMgNC4xDQpBbmFseXppbmcgdGhpcyBkYXRhIGNvdWxkIGJlIHVzZWZ1bCB0byB0aGUgQ2hpY2FnbyBQb2xpY2UgRGVwYXJ0bWVudCB3aGVuIGRlY2lkaW5nIHdoZXJlIHRvIGFsbG9jYXRlIHJlc291cmNlcy4gSWYgdGhleSB3YW50IHRvIGluY3JlYXNlIHRoZSBudW1iZXIgb2YgYXJyZXN0cyB0aGF0IGFyZSBtYWRlIGZvciBtb3RvciB2ZWhpY2xlIHRoZWZ0cywgd2hlcmUgc2hvdWxkIHRoZXkgZm9jdXMgdGhlaXIgZWZmb3J0cz8NCg0KV2Ugd2FudCB0byBmaW5kIHRoZSB0b3AgZml2ZSBsb2NhdGlvbnMgd2hlcmUgbW90b3IgdmVoaWNsZSB0aGVmdHMgb2NjdXIuIElmIHlvdSBjcmVhdGUgYSB0YWJsZSBvZiB0aGUgTG9jYXRpb25EZXNjcmlwdGlvbiB2YXJpYWJsZSwgaXQgaXMgdW5mb3J0dW5hdGVseSB2ZXJ5IGhhcmQgdG8gcmVhZCBzaW5jZSB0aGVyZSBhcmUgNzggZGlmZmVyZW50IGxvY2F0aW9ucyBpbiB0aGUgZGF0YSBzZXQuIEJ5IHVzaW5nIHRoZSBzb3J0IGZ1bmN0aW9uLCB3ZSBjYW4gdmlldyB0aGlzIHNhbWUgdGFibGUsIGJ1dCBzb3J0ZWQgYnkgdGhlIG51bWJlciBvZiBvYnNlcnZhdGlvbnMgaW4gZWFjaCBjYXRlZ29yeS4gSW4geW91ciBSIGNvbnNvbGUsIHR5cGU6DQoNCiAgICBzb3J0KHRhYmxlKG12dCRMb2NhdGlvbkRlc2NyaXB0aW9uKSkNCg0KV2hpY2ggbG9jYXRpb25zIGFyZSB0aGUgdG9wIGZpdmUgbG9jYXRpb25zIGZvciBtb3RvciB2ZWhpY2xlIHRoZWZ0cywgZXhjbHVkaW5nIHRoZSAiT3RoZXIiIGNhdGVnb3J5PyBZb3Ugc2hvdWxkIHNlbGVjdCA1IG9mIHRoZSBmb2xsb3dpbmcgb3B0aW9ucy4NCg0KKyBCYW5rDQorIEdhcyBTdGF0aW9uDQorIEhvdGVsL01vdGVsDQorIFN0cmVldA0KKyBDYXIgV2FzaA0KKyBSZXN0YXVyYW50DQorIFBhcmtpbmcgTG90L0dhcmFnZSAoTm9uLVJlc2lkZW50aWFsKQ0KKyBBbGxleQ0KKyBEcml2ZXdheSAoUmVzaWRlbnRpYWwpDQorIFZhY2FudCBMb3QvTGFuZA0KDQpgYGB7cn0NCg0Kc29ydCh0YWJsZShEJExvY2F0aW9uRGVzY3JpcHRpb24pLGRlY3JlYXNpbmc9IFRSVUUpDQojIFN0cmVldCxQYXJraW5nIExvdC9HYXJhZ2UgKE5vbi1SZXNpZGVudGlhbCksQWxsZXksR2FzIFN0YXRpb24sRHJpdmV3YXkgKFJlc2lkZW50aWFsKQ0KYGBgDQoNCiMjIyMgNC4yIA0KQ3JlYXRlIGEgc3Vic2V0IG9mIHlvdXIgZGF0YSwgb25seSB0YWtpbmcgb2JzZXJ2YXRpb25zIGZvciB3aGljaCB0aGUgdGhlZnQgaGFwcGVuZWQgaW4gb25lIG9mIHRoZXNlIGZpdmUgbG9jYXRpb25zLCBhbmQgY2FsbCB0aGlzIG5ldyBkYXRhIHNldCAiVG9wNSIuIFRvIGRvIHRoaXMsIHlvdSBjYW4gdXNlIHRoZSB8IHN5bWJvbC4gSW4gbGVjdHVyZSwgd2UgdXNlZCB0aGUgJiBzeW1ib2wgdG8gdXNlIHR3byBjcml0ZXJpYSB0byBtYWtlIGEgc3Vic2V0IG9mIHRoZSBkYXRhLiBUbyBvbmx5IHRha2Ugb2JzZXJ2YXRpb25zIHRoYXQgaGF2ZSBhIGNlcnRhaW4gdmFsdWUgaW4gb25lIHZhcmlhYmxlIG9yIHRoZSBvdGhlciwgdGhlIHwgY2hhcmFjdGVyIGNhbiBiZSB1c2VkIGluIHBsYWNlIG9mIHRoZSAmIHN5bWJvbC4gVGhpcyBpcyBhbHNvIGNhbGxlZCBhIGxvZ2ljYWwgIm9yIiBvcGVyYXRpb24uDQoNCkFsdGVybmF0ZWx5LCB5b3UgY291bGQgY3JlYXRlIGZpdmUgZGlmZmVyZW50IHN1YnNldHMsIGFuZCB0aGVuIG1lcmdlIHRoZW0gdG9nZXRoZXIgaW50byBvbmUgZGF0YSBmcmFtZSB1c2luZyByYmluZC4NCg0KSG93IG1hbnkgb2JzZXJ2YXRpb25zIGFyZSBpbiBUb3A1Pw0KDQpgYGB7cn0NClRPUGxvY2F0aW9uPSBjKCJTVFJFRVQiLCJQQVJLSU5HIExPVC9HQVJBR0UoTk9OLlJFU0lELikiLCJHQVMgU1RBVElPTiIsIkFMTEVZIiwiRFJJVkVXQVkgLSBSRVNJREVOVElBTCIpDQpUT1A1PXN1YnNldChELExvY2F0aW9uRGVzY3JpcHRpb24gJWluJSBUT1Bsb2NhdGlvbikNCm5yb3coVE9QNSkNCmBgYA0KDQojIyMjIDQuMw0KUiB3aWxsIHJlbWVtYmVyIHRoZSBvdGhlciBjYXRlZ29yaWVzIG9mIHRoZSBMb2NhdGlvbkRlc2NyaXB0aW9uIHZhcmlhYmxlIGZyb20gdGhlIG9yaWdpbmFsIGRhdGFzZXQsIHNvIHJ1bm5pbmcgdGFibGUoVG9wNSRMb2NhdGlvbkRlc2NyaXB0aW9uKSB3aWxsIGhhdmUgYSBsb3Qgb2YgdW5uZWNlc3Nhcnkgb3V0cHV0LiBUbyBtYWtlIG91ciB0YWJsZXMgYSBiaXQgbmljZXIgdG8gcmVhZCwgd2UgY2FuIHJlZnJlc2ggdGhpcyBmYWN0b3IgdmFyaWFibGUuIEluIHlvdXIgUiBjb25zb2xlLCB0eXBlOg0KDQogICAgVG9wNSRMb2NhdGlvbkRlc2NyaXB0aW9uID0gZmFjdG9yKFRvcDUkTG9jYXRpb25EZXNjcmlwdGlvbikNCg0KSWYgeW91IHJ1biB0aGUgc3RyIG9yIHRhYmxlIGZ1bmN0aW9uIG9uIFRvcDUgbm93LCB5b3Ugc2hvdWxkIHNlZSB0aGF0IExvY2F0aW9uRGVzY3JpcHRpb24gbm93IG9ubHkgaGFzIDUgdmFsdWVzLCBhcyB3ZSBleHBlY3QuDQoNClVzZSB0aGUgVG9wNSBkYXRhIGZyYW1lIHRvIGFuc3dlciB0aGUgcmVtYWluaW5nIHF1ZXN0aW9ucy4NCg0KT25lIG9mIHRoZSBsb2NhdGlvbnMgaGFzIGEgbXVjaCBoaWdoZXIgYXJyZXN0IHJhdGUgdGhhbiB0aGUgb3RoZXIgbG9jYXRpb25zLiBXaGljaCBpcyBpdD8gUGxlYXNlIGVudGVyIHRoZSB0ZXh0IGluIGV4YWN0bHkgdGhlIHNhbWUgd2F5IGFzIGhvdyBpdCBsb29rcyBpbiB0aGUgYW5zd2VyIG9wdGlvbnMgZm9yIFByb2JsZW0gNC4xLg0KDQpgYGB7cn0NClRPUDUkTG9jYXRpb25EZXNjcmlwdGlvbiA9IGZhY3RvcihUT1A1JExvY2F0aW9uRGVzY3JpcHRpb24pDQpzdHIoVE9QNSkNCnRhcHBseShhcy5udW1lcmljKFRPUDUkQXJyZXN0PT0iVFJVRSIpLFRPUDUkTG9jYXRpb25EZXNjcmlwdGlvbixzdW0pDQplPSh0YWJsZShUT1A1JExvY2F0aW9uRGVzY3JpcHRpb24sIFRPUDUkQXJyZXN0KSkNCg0KQUxMRVk9KGVbMSwyXSkvKGVbMSwxXStlWzEsMl0pDQpEUklWRVdBWV9SRVNJREVOVElBTD0oZVsyLDJdKS8oZVsyLDFdK2VbMiwyXSkNCkdBU19TVEFUSU9OPShlWzMsMl0pLyhlWzMsMV0rZVszLDJdKQ0KUEFSS0lOR19MT1Q9KGVbNCwyXSkvKGVbNCwxXStlWzQsMl0pDQpTVFJFRVQ9KGVbNSwyXSkvKGVbNSwxXStlWzUsMl0pDQptYXgoYyhBTExFWSxEUklWRVdBWV9SRVNJREVOVElBTCxHQVNfU1RBVElPTixQQVJLSU5HX0xPVCxTVFJFRVQpKQ0Kd2hpY2gubWF4KChjKEFMTEVZLERSSVZFV0FZX1JFU0lERU5USUFMLEdBU19TVEFUSU9OLFBBUktJTkdfTE9ULFNUUkVFVCkpKQ0KI0dBUyBTVEFUSU9ODQpgYGANCg0KDQojIyMjIDQuNCANCk9uIHdoaWNoIGRheSBvZiB0aGUgd2VlayBkbyB0aGUgbW9zdCBtb3RvciB2ZWhpY2xlIHRoZWZ0cyBhdCBnYXMgc3RhdGlvbnMgaGFwcGVuPw0KKE1vbmRheX5TdW5kYXkpDQoNCmBgYHtyfQ0KDQpzb3J0KHRhYmxlKFRPUDUkTG9jYXRpb25EZXNjcmlwdGlvbixUT1A1JFdlZWtkYXkpWzMsXSxUUlVFKQ0KI1NhdHVyZGF5DQpgYGANCg0KIyMjIyA0LjUNCk9uIHdoaWNoIGRheSBvZiB0aGUgd2VlayBkbyB0aGUgZmV3ZXN0IG1vdG9yIHZlaGljbGUgdGhlZnRzIGluIHJlc2lkZW50aWFsIGRyaXZld2F5cyBoYXBwZW4/KE1vbmRheX5TdW5kYXkpDQoNCmBgYHtyfQ0KDQpzb3J0KHRhYmxlKFRPUDUkTG9jYXRpb25EZXNjcmlwdGlvbixUT1A1JFdlZWtkYXkpWzIsXSxGQUxTRSkNCiNTYXR1cmRheQ0KYGBgDQoNCg0KDQoNCg0K

AS1-1 An Analytical Detective

<王欣>

Section 1 - Loading the Data

1.1

1.2

1.3

1.4

1.5

1.6

Section 2 - Understanding Dates in R

2.1

2.2

2.3

2.4

2.5

Section 3 - Visualizing Crime Trends

3.1

3.2

3.3

3.4

3.5

Section 4 - Popular Locations

4.1

4.2

4.3

4.4

4.5