library(stringr)
library(dplyr)
## Warning: package 'dplyr' was built under R version 4.0.2
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
setwd("E:/Personal/especializacion/ciencia de datos/curso3/semana4/")
The American Community Survey distributes downloadable data about United States communities. Download the 2006 microdata survey about housing for the state of Idaho using download.file() from here:
https://d396qusza40orc.cloudfront.net/getdata%2Fdata%2Fss06hid.csv
and load the data into R. The code book, describing the variable names is here:
https://d396qusza40orc.cloudfront.net/getdata%2Fdata%2FPUMSDataDict06.pdf
Apply strsplit() to split all the names of the data frame on the characters “wgtp”. What is the value of the 123 element of the resulting list?
a “w” “15”
b “wgtp” “15”
c "" “15”
d “15”
fileUrl <- "https://d396qusza40orc.cloudfront.net/getdata%2Fdata%2Fss06hid.csv"
download.file(url = fileUrl, destfile = "data.csv", method = "curl")
data <- read.table("data.csv", header = TRUE, sep = ",")
#head(data)
#strsplit(names(data), split = "wgtp")
strsplit(names(data), split = "wgtp")[123]
## [[1]]
## [1] "" "15"
Load the Gross Domestic Product data for the 190 ranked countries in this data set:
https://d396qusza40orc.cloudfront.net/getdata%2Fdata%2FGDP.csv
Remove the commas from the GDP numbers in millions of dollars and average them. What is the average?
Original data sources:
http://data.worldbank.org/data-catalog/GDP-ranking-table
A 381668.9
B 377652.4
C 387854.4
D 293700.3
fileUrlGdp <- "https://d396qusza40orc.cloudfront.net/getdata%2Fdata%2FGDP.csv"
download.file(url = fileUrlGdp, destfile = "datagdp.csv")
data <- read.csv("datagdp.csv", skip=4,nrows = 190,stringsAsFactors = FALSE)
#head(data,n = 30)
clean <- gsub(",","",data[,5] )
length(clean)
## [1] 190
as.numeric ( clean )
## [1] 16244600 8227103 5959718 3428131 2612878 2471784 2252664 2014775
## [9] 2014670 1841710 1821424 1532408 1322965 1178126 1129598 878043
## [17] 789257 770555 711050 631173 523806 514060 499667 489795
## [25] 483262 475502 394708 384313 381286 369606 365966 348595
## [33] 314887 305033 274701 269869 263259 262832 262597 258217
## [41] 250182 249099 247546 225143 212274 210771 210280 205789
## [49] 203790 203521 196446 192711 176309 171476 167347 160913
## [57] 155820 124600 116355 114147 101496 95982 91149 84040
## [65] 73672 69972 68234 66605 63267 59423 59228 59047
## [73] 58769 55178 51113 50972 50234 49920 45662 45279
## [81] 45104 43582 42945 42344 41605 40711 40697 37489
## [89] 36253 35646 35164 31015 29044 28373 28242 27035
## [97] 25502 25322 24680 23864 23320 22767 22390 20678
## [105] 20497 19881 18963 18434 18377 17697 17466 17204
## [113] 16954 15747 15654 14755 14504 14244 14046 14038
## [121] 13678 13579 13072 12887 12648 10507 10486 10441
## [129] 10308 10271 10220 9975 9951 9802 9613 9418
## [137] 8722 8149 7843 7557 7253 7103 6972 6773
## [145] 6475 6445 6075 5632 5474 5012 4373 4264
## [153] 4225 4199 3908 3814 3796 3744 3092 2851
## [161] 2584 2472 2448 2222 2184 1827 1780 1734
## [169] 1493 1293 1239 1134 1129 1008 917 822
## [177] 787 767 767 713 684 596 480 472
## [185] 326 263 228 182 175 40
mean( as.numeric ( clean[1:215]) , na.rm = TRUE)
## [1] 377652.4
In the data set from Question 2 what is a regular expression that would allow you to count the number of countries whose name begins with “United”? Assume that the variable with the country names in it is named countryNames. How many countries begin with United?
A grep("*United",countryNames), 2
B grep(“United$”,countryNames), 3
C grep(“^United”,countryNames), 3
D grep("*United",countryNames), 5
fileUrlGdp <- "https://d396qusza40orc.cloudfront.net/getdata%2Fdata%2FGDP.csv"
download.file(url = fileUrlGdp, destfile = "datagdp.csv")
data <- read.csv("datagdp.csv", skip=4,nrows = 200,stringsAsFactors = FALSE)
colnames(data)<-c(X="CountryCode", X.1="Rank", X.3= "CountryName",X.4="GDP")
data
## CountryCode Rank CountryName GDP NA NA
## 1 USA 1 NA United States 16,244,600
## 2 CHN 2 NA China 8,227,103
## 3 JPN 3 NA Japan 5,959,718
## 4 DEU 4 NA Germany 3,428,131
## 5 FRA 5 NA France 2,612,878
## 6 GBR 6 NA United Kingdom 2,471,784
## 7 BRA 7 NA Brazil 2,252,664
## 8 RUS 8 NA Russian Federation 2,014,775
## 9 ITA 9 NA Italy 2,014,670
## 10 IND 10 NA India 1,841,710
## 11 CAN 11 NA Canada 1,821,424
## 12 AUS 12 NA Australia 1,532,408
## 13 ESP 13 NA Spain 1,322,965
## 14 MEX 14 NA Mexico 1,178,126
## 15 KOR 15 NA Korea, Rep. 1,129,598
## 16 IDN 16 NA Indonesia 878,043
## 17 TUR 17 NA Turkey 789,257
## 18 NLD 18 NA Netherlands 770,555
## 19 SAU 19 NA Saudi Arabia 711,050
## 20 CHE 20 NA Switzerland 631,173
## 21 SWE 21 NA Sweden 523,806
## 22 IRN 22 NA Iran, Islamic Rep. 514,060
## 23 NOR 23 NA Norway 499,667
## 24 POL 24 NA Poland 489,795
## 25 BEL 25 NA Belgium 483,262
## 26 ARG 26 NA Argentina 475,502
## 27 AUT 27 NA Austria 394,708
## 28 ZAF 28 NA South Africa 384,313
## 29 VEN 29 NA Venezuela, RB 381,286
## 30 COL 30 NA Colombia 369,606
## 31 THA 31 NA Thailand 365,966
## 32 ARE 32 NA United Arab Emirates 348,595
## 33 DNK 33 NA Denmark 314,887
## 34 MYS 34 NA Malaysia 305,033
## 35 SGP 35 NA Singapore 274,701
## 36 CHL 36 NA Chile 269,869
## 37 HKG 37 NA Hong Kong SAR, China 263,259
## 38 EGY 38 NA Egypt, Arab Rep. 262,832
## 39 NGA 39 NA Nigeria 262,597
## 40 ISR 40 NA Israel 258,217
## 41 PHL 41 NA Philippines 250,182
## 42 GRC 42 NA Greece 249,099
## 43 FIN 43 NA Finland 247,546
## 44 PAK 44 NA Pakistan 225,143
## 45 PRT 45 NA Portugal 212,274
## 46 IRL 46 NA Ireland 210,771
## 47 IRQ 47 NA Iraq 210,280
## 48 DZA 48 NA Algeria 205,789
## 49 PER 49 NA Peru 203,790
## 50 KAZ 50 NA Kazakhstan 203,521
## 51 CZE 51 NA Czech Republic 196,446
## 52 ROM 52 NA Romania 192,711
## 53 UKR 53 NA Ukraine 176,309
## 54 QAT 54 NA Qatar 171,476
## 55 NZL 55 NA New Zealand 167,347
## 56 KWT 56 NA Kuwait 160,913
## 57 VNM 57 NA Vietnam 155,820
## 58 HUN 58 NA Hungary 124,600
## 59 BGD 59 NA Bangladesh 116,355
## 60 AGO 60 NA Angola 114,147
## 61 PRI 61 NA Puerto Rico 101,496
## 62 MAR 62 NA Morocco 95,982 a
## 63 SVK 63 NA Slovak Republic 91,149
## 64 ECU 64 NA Ecuador 84,040
## 65 SYR 65 NA Syrian Arab Republic 73,672
## 66 OMN 66 NA Oman 69,972
## 67 CUB 67 NA Cuba 68,234
## 68 AZE 68 NA Azerbaijan 66,605
## 69 BLR 69 NA Belarus 63,267
## 70 LKA 70 NA Sri Lanka 59,423
## 71 HRV 71 NA Croatia 59,228
## 72 DOM 72 NA Dominican Republic 59,047
## 73 SDN 73 NA Sudan 58,769 b
## 74 LUX 74 NA Luxembourg 55,178
## 75 UZB 75 NA Uzbekistan 51,113
## 76 BGR 76 NA Bulgaria 50,972
## 77 GTM 77 NA Guatemala 50,234
## 78 URY 78 NA Uruguay 49,920
## 79 TUN 79 NA Tunisia 45,662
## 80 SVN 80 NA Slovenia 45,279
## 81 CRI 81 NA Costa Rica 45,104
## 82 MAC 82 NA Macao SAR, China 43,582
## 83 LBN 83 NA Lebanon 42,945
## 84 LTU 84 NA Lithuania 42,344
## 85 ETH 85 NA Ethiopia 41,605
## 86 GHA 86 NA Ghana 40,711
## 87 KEN 87 NA Kenya 40,697
## 88 SRB 88 NA Serbia 37,489
## 89 PAN 89 NA Panama 36,253
## 90 YEM 90 NA Yemen, Rep. 35,646
## 91 TKM 91 NA Turkmenistan 35,164
## 92 JOR 92 NA Jordan 31,015
## 93 BHR 93 NA Bahrain 29,044
## 94 LVA 94 NA Latvia 28,373
## 95 TZA 95 NA Tanzania 28,242 c
## 96 BOL 96 NA Bolivia 27,035
## 97 PRY 97 NA Paraguay 25,502
## 98 CMR 98 NA Cameroon 25,322
## 99 CIV 99 NA Côte d'Ivoire 24,680
## 100 SLV 100 NA El Salvador 23,864
## 101 TTO 101 NA Trinidad and Tobago 23,320
## 102 CYP 102 NA Cyprus 22,767 d
## 103 EST 103 NA Estonia 22,390
## 104 ZMB 104 NA Zambia 20,678
## 105 AFG 105 NA Afghanistan 20,497
## 106 UGA 106 NA Uganda 19,881
## 107 NPL 107 NA Nepal 18,963
## 108 HND 108 NA Honduras 18,434
## 109 GAB 109 NA Gabon 18,377
## 110 GNQ 110 NA Equatorial Guinea 17,697
## 111 BIH 111 NA Bosnia and Herzegovina 17,466
## 112 ZAR 112 NA Congo, Dem. Rep. 17,204
## 113 BRN 113 NA Brunei Darussalam 16,954
## 114 GEO 114 NA Georgia 15,747 e
## 115 PNG 115 NA Papua New Guinea 15,654
## 116 JAM 116 NA Jamaica 14,755
## 117 BWA 117 NA Botswana 14,504
## 118 MOZ 118 NA Mozambique 14,244
## 119 SEN 119 NA Senegal 14,046
## 120 KHM 120 NA Cambodia 14,038
## 121 COG 121 NA Congo, Rep. 13,678
## 122 ISL 122 NA Iceland 13,579
## 123 NAM 123 NA Namibia 13,072
## 124 TCD 124 NA Chad 12,887
## 125 ALB 125 NA Albania 12,648
## 126 NIC 126 NA Nicaragua 10,507
## 127 MUS 127 NA Mauritius 10,486
## 128 BFA 128 NA Burkina Faso 10,441
## 129 MLI 129 NA Mali 10,308
## 130 MNG 130 NA Mongolia 10,271
## 131 SSD 131 NA South Sudan 10,220
## 132 MDG 132 NA Madagascar 9,975
## 133 ARM 133 NA Armenia 9,951
## 134 ZWE 134 NA Zimbabwe 9,802
## 135 MKD 135 NA Macedonia, FYR 9,613
## 136 LAO 136 NA Lao PDR 9,418
## 137 MLT 137 NA Malta 8,722
## 138 BHS 138 NA Bahamas, The 8,149
## 139 HTI 139 NA Haiti 7,843
## 140 BEN 140 NA Benin 7,557
## 141 MDA 141 NA Moldova 7,253 f
## 142 RWA 142 NA Rwanda 7,103
## 143 TJK 143 NA Tajikistan 6,972
## 144 NER 144 NA Niger 6,773
## 145 KGZ 145 NA Kyrgyz Republic 6,475
## 146 KSV 146 NA Kosovo 6,445
## 147 MCO 147 NA Monaco 6,075
## 148 GIN 148 NA Guinea 5,632
## 149 BMU 149 NA Bermuda 5,474
## 150 SUR 150 NA Suriname 5,012
## 151 MNE 151 NA Montenegro 4,373
## 152 MWI 152 NA Malawi 4,264
## 153 BRB 153 NA Barbados 4,225
## 154 MRT 154 NA Mauritania 4,199
## 155 FJI 155 NA Fiji 3,908
## 156 TGO 156 NA Togo 3,814
## 157 SLE 157 NA Sierra Leone 3,796
## 158 SWZ 158 NA Swaziland 3,744
## 159 ERI 159 NA Eritrea 3,092
## 160 GUY 160 NA Guyana 2,851
## 161 ABW 161 NA Aruba 2,584
## 162 BDI 162 NA Burundi 2,472
## 163 LSO 163 NA Lesotho 2,448
## 164 MDV 164 NA Maldives 2,222
## 165 CAF 165 NA Central African Republic 2,184
## 166 CPV 166 NA Cape Verde 1,827
## 167 BTN 167 NA Bhutan 1,780
## 168 LBR 168 NA Liberia 1,734
## 169 BLZ 169 NA Belize 1,493
## 170 TMP 170 NA Timor-Leste 1,293
## 171 LCA 171 NA St. Lucia 1,239
## 172 ATG 172 NA Antigua and Barbuda 1,134
## 173 SYC 173 NA Seychelles 1,129
## 174 SLB 174 NA Solomon Islands 1,008
## 175 GMB 175 NA Gambia, The 917
## 176 GNB 176 NA Guinea-Bissau 822
## 177 VUT 177 NA Vanuatu 787
## 178 GRD 178 NA Grenada 767
## 179 KNA 178 NA St. Kitts and Nevis 767
## 180 VCT 180 NA St. Vincent and the Grenadines 713
## 181 WSM 181 NA Samoa 684
## 182 COM 182 NA Comoros 596
## 183 DMA 183 NA Dominica 480
## 184 TON 184 NA Tonga 472
## 185 FSM 185 NA Micronesia, Fed. Sts. 326
## 186 STP 186 NA São Tomé and Principe 263
## 187 PLW 187 NA Palau 228
## 188 MHL 188 NA Marshall Islands 182
## 189 KIR 189 NA Kiribati 175
## 190 TUV 190 NA Tuvalu 40
## 191 NA NA
## 192 ASM NA NA American Samoa ..
## 193 ADO NA NA Andorra ..
## 194 CYM NA NA Cayman Islands ..
## 195 CHI NA NA Channel Islands ..
## 196 CUW NA NA Curaçao ..
## 197 DJI NA NA Djibouti
## 198 FRO NA NA Faeroe Islands ..
## 199 PYF NA NA French Polynesia ..
## 200 GRL NA NA Greenland ..
## NA NA NA NA
## 1 NA NA NA NA
## 2 NA NA NA NA
## 3 NA NA NA NA
## 4 NA NA NA NA
## 5 NA NA NA NA
## 6 NA NA NA NA
## 7 NA NA NA NA
## 8 NA NA NA NA
## 9 NA NA NA NA
## 10 NA NA NA NA
## 11 NA NA NA NA
## 12 NA NA NA NA
## 13 NA NA NA NA
## 14 NA NA NA NA
## 15 NA NA NA NA
## 16 NA NA NA NA
## 17 NA NA NA NA
## 18 NA NA NA NA
## 19 NA NA NA NA
## 20 NA NA NA NA
## 21 NA NA NA NA
## 22 NA NA NA NA
## 23 NA NA NA NA
## 24 NA NA NA NA
## 25 NA NA NA NA
## 26 NA NA NA NA
## 27 NA NA NA NA
## 28 NA NA NA NA
## 29 NA NA NA NA
## 30 NA NA NA NA
## 31 NA NA NA NA
## 32 NA NA NA NA
## 33 NA NA NA NA
## 34 NA NA NA NA
## 35 NA NA NA NA
## 36 NA NA NA NA
## 37 NA NA NA NA
## 38 NA NA NA NA
## 39 NA NA NA NA
## 40 NA NA NA NA
## 41 NA NA NA NA
## 42 NA NA NA NA
## 43 NA NA NA NA
## 44 NA NA NA NA
## 45 NA NA NA NA
## 46 NA NA NA NA
## 47 NA NA NA NA
## 48 NA NA NA NA
## 49 NA NA NA NA
## 50 NA NA NA NA
## 51 NA NA NA NA
## 52 NA NA NA NA
## 53 NA NA NA NA
## 54 NA NA NA NA
## 55 NA NA NA NA
## 56 NA NA NA NA
## 57 NA NA NA NA
## 58 NA NA NA NA
## 59 NA NA NA NA
## 60 NA NA NA NA
## 61 NA NA NA NA
## 62 NA NA NA NA
## 63 NA NA NA NA
## 64 NA NA NA NA
## 65 NA NA NA NA
## 66 NA NA NA NA
## 67 NA NA NA NA
## 68 NA NA NA NA
## 69 NA NA NA NA
## 70 NA NA NA NA
## 71 NA NA NA NA
## 72 NA NA NA NA
## 73 NA NA NA NA
## 74 NA NA NA NA
## 75 NA NA NA NA
## 76 NA NA NA NA
## 77 NA NA NA NA
## 78 NA NA NA NA
## 79 NA NA NA NA
## 80 NA NA NA NA
## 81 NA NA NA NA
## 82 NA NA NA NA
## 83 NA NA NA NA
## 84 NA NA NA NA
## 85 NA NA NA NA
## 86 NA NA NA NA
## 87 NA NA NA NA
## 88 NA NA NA NA
## 89 NA NA NA NA
## 90 NA NA NA NA
## 91 NA NA NA NA
## 92 NA NA NA NA
## 93 NA NA NA NA
## 94 NA NA NA NA
## 95 NA NA NA NA
## 96 NA NA NA NA
## 97 NA NA NA NA
## 98 NA NA NA NA
## 99 NA NA NA NA
## 100 NA NA NA NA
## 101 NA NA NA NA
## 102 NA NA NA NA
## 103 NA NA NA NA
## 104 NA NA NA NA
## 105 NA NA NA NA
## 106 NA NA NA NA
## 107 NA NA NA NA
## 108 NA NA NA NA
## 109 NA NA NA NA
## 110 NA NA NA NA
## 111 NA NA NA NA
## 112 NA NA NA NA
## 113 NA NA NA NA
## 114 NA NA NA NA
## 115 NA NA NA NA
## 116 NA NA NA NA
## 117 NA NA NA NA
## 118 NA NA NA NA
## 119 NA NA NA NA
## 120 NA NA NA NA
## 121 NA NA NA NA
## 122 NA NA NA NA
## 123 NA NA NA NA
## 124 NA NA NA NA
## 125 NA NA NA NA
## 126 NA NA NA NA
## 127 NA NA NA NA
## 128 NA NA NA NA
## 129 NA NA NA NA
## 130 NA NA NA NA
## 131 NA NA NA NA
## 132 NA NA NA NA
## 133 NA NA NA NA
## 134 NA NA NA NA
## 135 NA NA NA NA
## 136 NA NA NA NA
## 137 NA NA NA NA
## 138 NA NA NA NA
## 139 NA NA NA NA
## 140 NA NA NA NA
## 141 NA NA NA NA
## 142 NA NA NA NA
## 143 NA NA NA NA
## 144 NA NA NA NA
## 145 NA NA NA NA
## 146 NA NA NA NA
## 147 NA NA NA NA
## 148 NA NA NA NA
## 149 NA NA NA NA
## 150 NA NA NA NA
## 151 NA NA NA NA
## 152 NA NA NA NA
## 153 NA NA NA NA
## 154 NA NA NA NA
## 155 NA NA NA NA
## 156 NA NA NA NA
## 157 NA NA NA NA
## 158 NA NA NA NA
## 159 NA NA NA NA
## 160 NA NA NA NA
## 161 NA NA NA NA
## 162 NA NA NA NA
## 163 NA NA NA NA
## 164 NA NA NA NA
## 165 NA NA NA NA
## 166 NA NA NA NA
## 167 NA NA NA NA
## 168 NA NA NA NA
## 169 NA NA NA NA
## 170 NA NA NA NA
## 171 NA NA NA NA
## 172 NA NA NA NA
## 173 NA NA NA NA
## 174 NA NA NA NA
## 175 NA NA NA NA
## 176 NA NA NA NA
## 177 NA NA NA NA
## 178 NA NA NA NA
## 179 NA NA NA NA
## 180 NA NA NA NA
## 181 NA NA NA NA
## 182 NA NA NA NA
## 183 NA NA NA NA
## 184 NA NA NA NA
## 185 NA NA NA NA
## 186 NA NA NA NA
## 187 NA NA NA NA
## 188 NA NA NA NA
## 189 NA NA NA NA
## 190 NA NA NA NA
## 191 NA NA NA NA
## 192 NA NA NA NA
## 193 NA NA NA NA
## 194 NA NA NA NA
## 195 NA NA NA NA
## 196 NA NA NA NA
## 197 NA NA NA NA
## 198 NA NA NA NA
## 199 NA NA NA NA
## 200 NA NA NA NA
isUnited <- grepl("^United", data$CountryName)
isUnited
## [1] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [13] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [25] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [37] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [49] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [61] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [73] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [85] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [97] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [109] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [121] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [133] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [145] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [157] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [169] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [181] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [193] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
summary( isUnited )
## Mode FALSE
## logical 200
Load the Gross Domestic Product data for the 190 ranked countries in this data set:
https://d396qusza40orc.cloudfront.net/getdata%2Fdata%2FGDP.csv
Load the educational data from this data set:
https://d396qusza40orc.cloudfront.net/getdata%2Fdata%2FEDSTATS_Country.csv
Match the data based on the country shortcode. Of the countries for which the end of the fiscal year is available, how many end in June?
Original data sources:
http://data.worldbank.org/data-catalog/GDP-ranking-table
http://data.worldbank.org/data-catalog/ed-stats
8
7
13
16
fileUrl1 <- "https://d396qusza40orc.cloudfront.net/getdata%2Fdata%2FGDP.csv"
fileUrl2 <- "https://d396qusza40orc.cloudfront.net/getdata%2Fdata%2FEDSTATS_Country.csv"
download.file(fileUrl1, destfile = "GDP.csv", method = "curl")
download.file(fileUrl2, destfile = "edu.csv", method = "curl")
gdpdata <- read.csv("GDP.csv", skip = 4, nrows = 190)
edudata <- read.csv("edu.csv")
#View(gdpdata)
#View(edudata)
mergeData <- merge(gdpdata, edudata, by.x = "X", by.y = "CountryCode")
#View(mergeData)
june <- grep('[Ff]iscal [Yy]ear(.*)[Jj]une 30', mergeData$Special.Notes)
length(june)
## [1] 13
You can use the quantmod (http://www.quantmod.com/) package to get historical stock prices for publicly traded companies on the NASDAQ and NYSE. Use the following code to download data on Amazon’s stock price and get the times the data was sampled.
library(quantmod)
## Loading required package: xts
## Loading required package: zoo
##
## Attaching package: 'zoo'
## The following objects are masked from 'package:base':
##
## as.Date, as.Date.numeric
##
## Attaching package: 'xts'
## The following objects are masked from 'package:dplyr':
##
## first, last
## Loading required package: TTR
## Registered S3 method overwritten by 'quantmod':
## method from
## as.zoo.data.frame zoo
## Version 0.4-0 included new data defaults. See ?getSymbols.
amzn = getSymbols("AMZN",auto.assign=FALSE)
## 'getSymbols' currently uses auto.assign=TRUE by default, but will
## use auto.assign=FALSE in 0.5-0. You will still be able to use
## 'loadSymbols' to automatically load data. getOption("getSymbols.env")
## and getOption("getSymbols.auto.assign") will still be checked for
## alternate defaults.
##
## This message is shown once per session and may be disabled by setting
## options("getSymbols.warning4.0"=FALSE). See ?getSymbols for details.
#head(amzn)
sampleTimes = index(amzn)
How many values were collected in 2012? How many values were collected on Mondays in 2012?
year2012 <- grepl('2012-*', sampleTimes)
sampleTimes2012 <- subset(sampleTimes, year2012)
day <- format(sampleTimes2012, '%A')
table(year2012)
## year2012
## FALSE TRUE
## 3194 250
table(day)
## day
## jueves lunes martes miércoles viernes
## 51 47 50 51 51