library(stringr)
library(dplyr)
## Warning: package 'dplyr' was built under R version 4.0.2
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
setwd("E:/Personal/especializacion/ciencia de datos/curso3/semana4/")

PUNTO 1

The American Community Survey distributes downloadable data about United States communities. Download the 2006 microdata survey about housing for the state of Idaho using download.file() from here:

https://d396qusza40orc.cloudfront.net/getdata%2Fdata%2Fss06hid.csv

and load the data into R. The code book, describing the variable names is here:

https://d396qusza40orc.cloudfront.net/getdata%2Fdata%2FPUMSDataDict06.pdf

Apply strsplit() to split all the names of the data frame on the characters “wgtp”. What is the value of the 123 element of the resulting list?

a “w” “15”

b “wgtp” “15”

c "" “15”

d “15”

fileUrl <- "https://d396qusza40orc.cloudfront.net/getdata%2Fdata%2Fss06hid.csv"
download.file(url = fileUrl, destfile = "data.csv", method = "curl")
data <- read.table("data.csv", header = TRUE, sep = ",")
#head(data)
#strsplit(names(data), split = "wgtp")
strsplit(names(data), split = "wgtp")[123]
## [[1]]
## [1] ""   "15"

Punto 2

Load the Gross Domestic Product data for the 190 ranked countries in this data set:

https://d396qusza40orc.cloudfront.net/getdata%2Fdata%2FGDP.csv

Remove the commas from the GDP numbers in millions of dollars and average them. What is the average?

Original data sources:

http://data.worldbank.org/data-catalog/GDP-ranking-table

A 381668.9

B 377652.4

C 387854.4

D 293700.3

fileUrlGdp <- "https://d396qusza40orc.cloudfront.net/getdata%2Fdata%2FGDP.csv"
download.file(url = fileUrlGdp, destfile = "datagdp.csv")
data <- read.csv("datagdp.csv", skip=4,nrows = 190,stringsAsFactors = FALSE)
#head(data,n = 30)
clean <- gsub(",","",data[,5]  )
length(clean)
## [1] 190
as.numeric (  clean ) 
##   [1] 16244600  8227103  5959718  3428131  2612878  2471784  2252664  2014775
##   [9]  2014670  1841710  1821424  1532408  1322965  1178126  1129598   878043
##  [17]   789257   770555   711050   631173   523806   514060   499667   489795
##  [25]   483262   475502   394708   384313   381286   369606   365966   348595
##  [33]   314887   305033   274701   269869   263259   262832   262597   258217
##  [41]   250182   249099   247546   225143   212274   210771   210280   205789
##  [49]   203790   203521   196446   192711   176309   171476   167347   160913
##  [57]   155820   124600   116355   114147   101496    95982    91149    84040
##  [65]    73672    69972    68234    66605    63267    59423    59228    59047
##  [73]    58769    55178    51113    50972    50234    49920    45662    45279
##  [81]    45104    43582    42945    42344    41605    40711    40697    37489
##  [89]    36253    35646    35164    31015    29044    28373    28242    27035
##  [97]    25502    25322    24680    23864    23320    22767    22390    20678
## [105]    20497    19881    18963    18434    18377    17697    17466    17204
## [113]    16954    15747    15654    14755    14504    14244    14046    14038
## [121]    13678    13579    13072    12887    12648    10507    10486    10441
## [129]    10308    10271    10220     9975     9951     9802     9613     9418
## [137]     8722     8149     7843     7557     7253     7103     6972     6773
## [145]     6475     6445     6075     5632     5474     5012     4373     4264
## [153]     4225     4199     3908     3814     3796     3744     3092     2851
## [161]     2584     2472     2448     2222     2184     1827     1780     1734
## [169]     1493     1293     1239     1134     1129     1008      917      822
## [177]      787      767      767      713      684      596      480      472
## [185]      326      263      228      182      175       40
mean( as.numeric ( clean[1:215])   , na.rm = TRUE)
## [1] 377652.4

Punto 3

In the data set from Question 2 what is a regular expression that would allow you to count the number of countries whose name begins with “United”? Assume that the variable with the country names in it is named countryNames. How many countries begin with United?

A grep("*United",countryNames), 2

B grep(“United$”,countryNames), 3

C grep(“^United”,countryNames), 3

D grep("*United",countryNames), 5

fileUrlGdp <- "https://d396qusza40orc.cloudfront.net/getdata%2Fdata%2FGDP.csv"
download.file(url = fileUrlGdp, destfile = "datagdp.csv")
data <- read.csv("datagdp.csv", skip=4,nrows = 200,stringsAsFactors = FALSE)

colnames(data)<-c(X="CountryCode", X.1="Rank", X.3= "CountryName",X.4="GDP")
data
##     CountryCode Rank CountryName                            GDP           NA NA
## 1           USA    1          NA                  United States  16,244,600    
## 2           CHN    2          NA                          China   8,227,103    
## 3           JPN    3          NA                          Japan   5,959,718    
## 4           DEU    4          NA                        Germany   3,428,131    
## 5           FRA    5          NA                         France   2,612,878    
## 6           GBR    6          NA                 United Kingdom   2,471,784    
## 7           BRA    7          NA                         Brazil   2,252,664    
## 8           RUS    8          NA             Russian Federation   2,014,775    
## 9           ITA    9          NA                          Italy   2,014,670    
## 10          IND   10          NA                          India   1,841,710    
## 11          CAN   11          NA                         Canada   1,821,424    
## 12          AUS   12          NA                      Australia   1,532,408    
## 13          ESP   13          NA                          Spain   1,322,965    
## 14          MEX   14          NA                         Mexico   1,178,126    
## 15          KOR   15          NA                    Korea, Rep.   1,129,598    
## 16          IDN   16          NA                      Indonesia     878,043    
## 17          TUR   17          NA                         Turkey     789,257    
## 18          NLD   18          NA                    Netherlands     770,555    
## 19          SAU   19          NA                   Saudi Arabia     711,050    
## 20          CHE   20          NA                    Switzerland     631,173    
## 21          SWE   21          NA                         Sweden     523,806    
## 22          IRN   22          NA             Iran, Islamic Rep.     514,060    
## 23          NOR   23          NA                         Norway     499,667    
## 24          POL   24          NA                         Poland     489,795    
## 25          BEL   25          NA                        Belgium     483,262    
## 26          ARG   26          NA                      Argentina     475,502    
## 27          AUT   27          NA                        Austria     394,708    
## 28          ZAF   28          NA                   South Africa     384,313    
## 29          VEN   29          NA                  Venezuela, RB     381,286    
## 30          COL   30          NA                       Colombia     369,606    
## 31          THA   31          NA                       Thailand     365,966    
## 32          ARE   32          NA           United Arab Emirates     348,595    
## 33          DNK   33          NA                        Denmark     314,887    
## 34          MYS   34          NA                       Malaysia     305,033    
## 35          SGP   35          NA                      Singapore     274,701    
## 36          CHL   36          NA                          Chile     269,869    
## 37          HKG   37          NA           Hong Kong SAR, China     263,259    
## 38          EGY   38          NA               Egypt, Arab Rep.     262,832    
## 39          NGA   39          NA                        Nigeria     262,597    
## 40          ISR   40          NA                         Israel     258,217    
## 41          PHL   41          NA                    Philippines     250,182    
## 42          GRC   42          NA                         Greece     249,099    
## 43          FIN   43          NA                        Finland     247,546    
## 44          PAK   44          NA                       Pakistan     225,143    
## 45          PRT   45          NA                       Portugal     212,274    
## 46          IRL   46          NA                        Ireland     210,771    
## 47          IRQ   47          NA                           Iraq     210,280    
## 48          DZA   48          NA                        Algeria     205,789    
## 49          PER   49          NA                           Peru     203,790    
## 50          KAZ   50          NA                     Kazakhstan     203,521    
## 51          CZE   51          NA                 Czech Republic     196,446    
## 52          ROM   52          NA                        Romania     192,711    
## 53          UKR   53          NA                        Ukraine     176,309    
## 54          QAT   54          NA                          Qatar     171,476    
## 55          NZL   55          NA                    New Zealand     167,347    
## 56          KWT   56          NA                         Kuwait     160,913    
## 57          VNM   57          NA                        Vietnam     155,820    
## 58          HUN   58          NA                        Hungary     124,600    
## 59          BGD   59          NA                     Bangladesh     116,355    
## 60          AGO   60          NA                         Angola     114,147    
## 61          PRI   61          NA                    Puerto Rico     101,496    
## 62          MAR   62          NA                        Morocco      95,982   a
## 63          SVK   63          NA                Slovak Republic      91,149    
## 64          ECU   64          NA                        Ecuador      84,040    
## 65          SYR   65          NA           Syrian Arab Republic      73,672    
## 66          OMN   66          NA                           Oman      69,972    
## 67          CUB   67          NA                           Cuba      68,234    
## 68          AZE   68          NA                     Azerbaijan      66,605    
## 69          BLR   69          NA                        Belarus      63,267    
## 70          LKA   70          NA                      Sri Lanka      59,423    
## 71          HRV   71          NA                        Croatia      59,228    
## 72          DOM   72          NA             Dominican Republic      59,047    
## 73          SDN   73          NA                          Sudan      58,769   b
## 74          LUX   74          NA                     Luxembourg      55,178    
## 75          UZB   75          NA                     Uzbekistan      51,113    
## 76          BGR   76          NA                       Bulgaria      50,972    
## 77          GTM   77          NA                      Guatemala      50,234    
## 78          URY   78          NA                        Uruguay      49,920    
## 79          TUN   79          NA                        Tunisia      45,662    
## 80          SVN   80          NA                       Slovenia      45,279    
## 81          CRI   81          NA                     Costa Rica      45,104    
## 82          MAC   82          NA               Macao SAR, China      43,582    
## 83          LBN   83          NA                        Lebanon      42,945    
## 84          LTU   84          NA                      Lithuania      42,344    
## 85          ETH   85          NA                       Ethiopia      41,605    
## 86          GHA   86          NA                          Ghana      40,711    
## 87          KEN   87          NA                          Kenya      40,697    
## 88          SRB   88          NA                         Serbia      37,489    
## 89          PAN   89          NA                         Panama      36,253    
## 90          YEM   90          NA                    Yemen, Rep.      35,646    
## 91          TKM   91          NA                   Turkmenistan      35,164    
## 92          JOR   92          NA                         Jordan      31,015    
## 93          BHR   93          NA                        Bahrain      29,044    
## 94          LVA   94          NA                         Latvia      28,373    
## 95          TZA   95          NA                       Tanzania      28,242   c
## 96          BOL   96          NA                        Bolivia      27,035    
## 97          PRY   97          NA                       Paraguay      25,502    
## 98          CMR   98          NA                       Cameroon      25,322    
## 99          CIV   99          NA                  Côte d'Ivoire      24,680    
## 100         SLV  100          NA                    El Salvador      23,864    
## 101         TTO  101          NA            Trinidad and Tobago      23,320    
## 102         CYP  102          NA                         Cyprus      22,767   d
## 103         EST  103          NA                        Estonia      22,390    
## 104         ZMB  104          NA                         Zambia      20,678    
## 105         AFG  105          NA                    Afghanistan      20,497    
## 106         UGA  106          NA                         Uganda      19,881    
## 107         NPL  107          NA                          Nepal      18,963    
## 108         HND  108          NA                       Honduras      18,434    
## 109         GAB  109          NA                          Gabon      18,377    
## 110         GNQ  110          NA              Equatorial Guinea      17,697    
## 111         BIH  111          NA         Bosnia and Herzegovina      17,466    
## 112         ZAR  112          NA               Congo, Dem. Rep.      17,204    
## 113         BRN  113          NA              Brunei Darussalam      16,954    
## 114         GEO  114          NA                        Georgia      15,747   e
## 115         PNG  115          NA               Papua New Guinea      15,654    
## 116         JAM  116          NA                        Jamaica      14,755    
## 117         BWA  117          NA                       Botswana      14,504    
## 118         MOZ  118          NA                     Mozambique      14,244    
## 119         SEN  119          NA                        Senegal      14,046    
## 120         KHM  120          NA                       Cambodia      14,038    
## 121         COG  121          NA                    Congo, Rep.      13,678    
## 122         ISL  122          NA                        Iceland      13,579    
## 123         NAM  123          NA                        Namibia      13,072    
## 124         TCD  124          NA                           Chad      12,887    
## 125         ALB  125          NA                        Albania      12,648    
## 126         NIC  126          NA                      Nicaragua      10,507    
## 127         MUS  127          NA                      Mauritius      10,486    
## 128         BFA  128          NA                   Burkina Faso      10,441    
## 129         MLI  129          NA                           Mali      10,308    
## 130         MNG  130          NA                       Mongolia      10,271    
## 131         SSD  131          NA                    South Sudan      10,220    
## 132         MDG  132          NA                     Madagascar       9,975    
## 133         ARM  133          NA                        Armenia       9,951    
## 134         ZWE  134          NA                       Zimbabwe       9,802    
## 135         MKD  135          NA                 Macedonia, FYR       9,613    
## 136         LAO  136          NA                        Lao PDR       9,418    
## 137         MLT  137          NA                          Malta       8,722    
## 138         BHS  138          NA                   Bahamas, The       8,149    
## 139         HTI  139          NA                          Haiti       7,843    
## 140         BEN  140          NA                          Benin       7,557    
## 141         MDA  141          NA                        Moldova       7,253   f
## 142         RWA  142          NA                         Rwanda       7,103    
## 143         TJK  143          NA                     Tajikistan       6,972    
## 144         NER  144          NA                          Niger       6,773    
## 145         KGZ  145          NA                Kyrgyz Republic       6,475    
## 146         KSV  146          NA                         Kosovo       6,445    
## 147         MCO  147          NA                         Monaco       6,075    
## 148         GIN  148          NA                         Guinea       5,632    
## 149         BMU  149          NA                        Bermuda       5,474    
## 150         SUR  150          NA                       Suriname       5,012    
## 151         MNE  151          NA                     Montenegro       4,373    
## 152         MWI  152          NA                         Malawi       4,264    
## 153         BRB  153          NA                       Barbados       4,225    
## 154         MRT  154          NA                     Mauritania       4,199    
## 155         FJI  155          NA                           Fiji       3,908    
## 156         TGO  156          NA                           Togo       3,814    
## 157         SLE  157          NA                   Sierra Leone       3,796    
## 158         SWZ  158          NA                      Swaziland       3,744    
## 159         ERI  159          NA                        Eritrea       3,092    
## 160         GUY  160          NA                         Guyana       2,851    
## 161         ABW  161          NA                          Aruba       2,584    
## 162         BDI  162          NA                        Burundi       2,472    
## 163         LSO  163          NA                        Lesotho       2,448    
## 164         MDV  164          NA                       Maldives       2,222    
## 165         CAF  165          NA       Central African Republic       2,184    
## 166         CPV  166          NA                     Cape Verde       1,827    
## 167         BTN  167          NA                         Bhutan       1,780    
## 168         LBR  168          NA                        Liberia       1,734    
## 169         BLZ  169          NA                         Belize       1,493    
## 170         TMP  170          NA                    Timor-Leste       1,293    
## 171         LCA  171          NA                      St. Lucia       1,239    
## 172         ATG  172          NA            Antigua and Barbuda       1,134    
## 173         SYC  173          NA                     Seychelles       1,129    
## 174         SLB  174          NA                Solomon Islands       1,008    
## 175         GMB  175          NA                    Gambia, The         917    
## 176         GNB  176          NA                  Guinea-Bissau         822    
## 177         VUT  177          NA                        Vanuatu         787    
## 178         GRD  178          NA                        Grenada         767    
## 179         KNA  178          NA            St. Kitts and Nevis         767    
## 180         VCT  180          NA St. Vincent and the Grenadines         713    
## 181         WSM  181          NA                          Samoa         684    
## 182         COM  182          NA                        Comoros         596    
## 183         DMA  183          NA                       Dominica         480    
## 184         TON  184          NA                          Tonga         472    
## 185         FSM  185          NA          Micronesia, Fed. Sts.         326    
## 186         STP  186          NA          São Tomé and Principe         263    
## 187         PLW  187          NA                          Palau         228    
## 188         MHL  188          NA               Marshall Islands         182    
## 189         KIR  189          NA                       Kiribati         175    
## 190         TUV  190          NA                         Tuvalu          40    
## 191               NA          NA                                               
## 192         ASM   NA          NA                 American Samoa           ..   
## 193         ADO   NA          NA                        Andorra           ..   
## 194         CYM   NA          NA                 Cayman Islands           ..   
## 195         CHI   NA          NA                Channel Islands           ..   
## 196         CUW   NA          NA                        Curaçao           ..   
## 197         DJI   NA          NA                       Djibouti                
## 198         FRO   NA          NA                 Faeroe Islands           ..   
## 199         PYF   NA          NA               French Polynesia           ..   
## 200         GRL   NA          NA                      Greenland           ..   
##     NA NA NA NA
## 1   NA NA NA NA
## 2   NA NA NA NA
## 3   NA NA NA NA
## 4   NA NA NA NA
## 5   NA NA NA NA
## 6   NA NA NA NA
## 7   NA NA NA NA
## 8   NA NA NA NA
## 9   NA NA NA NA
## 10  NA NA NA NA
## 11  NA NA NA NA
## 12  NA NA NA NA
## 13  NA NA NA NA
## 14  NA NA NA NA
## 15  NA NA NA NA
## 16  NA NA NA NA
## 17  NA NA NA NA
## 18  NA NA NA NA
## 19  NA NA NA NA
## 20  NA NA NA NA
## 21  NA NA NA NA
## 22  NA NA NA NA
## 23  NA NA NA NA
## 24  NA NA NA NA
## 25  NA NA NA NA
## 26  NA NA NA NA
## 27  NA NA NA NA
## 28  NA NA NA NA
## 29  NA NA NA NA
## 30  NA NA NA NA
## 31  NA NA NA NA
## 32  NA NA NA NA
## 33  NA NA NA NA
## 34  NA NA NA NA
## 35  NA NA NA NA
## 36  NA NA NA NA
## 37  NA NA NA NA
## 38  NA NA NA NA
## 39  NA NA NA NA
## 40  NA NA NA NA
## 41  NA NA NA NA
## 42  NA NA NA NA
## 43  NA NA NA NA
## 44  NA NA NA NA
## 45  NA NA NA NA
## 46  NA NA NA NA
## 47  NA NA NA NA
## 48  NA NA NA NA
## 49  NA NA NA NA
## 50  NA NA NA NA
## 51  NA NA NA NA
## 52  NA NA NA NA
## 53  NA NA NA NA
## 54  NA NA NA NA
## 55  NA NA NA NA
## 56  NA NA NA NA
## 57  NA NA NA NA
## 58  NA NA NA NA
## 59  NA NA NA NA
## 60  NA NA NA NA
## 61  NA NA NA NA
## 62  NA NA NA NA
## 63  NA NA NA NA
## 64  NA NA NA NA
## 65  NA NA NA NA
## 66  NA NA NA NA
## 67  NA NA NA NA
## 68  NA NA NA NA
## 69  NA NA NA NA
## 70  NA NA NA NA
## 71  NA NA NA NA
## 72  NA NA NA NA
## 73  NA NA NA NA
## 74  NA NA NA NA
## 75  NA NA NA NA
## 76  NA NA NA NA
## 77  NA NA NA NA
## 78  NA NA NA NA
## 79  NA NA NA NA
## 80  NA NA NA NA
## 81  NA NA NA NA
## 82  NA NA NA NA
## 83  NA NA NA NA
## 84  NA NA NA NA
## 85  NA NA NA NA
## 86  NA NA NA NA
## 87  NA NA NA NA
## 88  NA NA NA NA
## 89  NA NA NA NA
## 90  NA NA NA NA
## 91  NA NA NA NA
## 92  NA NA NA NA
## 93  NA NA NA NA
## 94  NA NA NA NA
## 95  NA NA NA NA
## 96  NA NA NA NA
## 97  NA NA NA NA
## 98  NA NA NA NA
## 99  NA NA NA NA
## 100 NA NA NA NA
## 101 NA NA NA NA
## 102 NA NA NA NA
## 103 NA NA NA NA
## 104 NA NA NA NA
## 105 NA NA NA NA
## 106 NA NA NA NA
## 107 NA NA NA NA
## 108 NA NA NA NA
## 109 NA NA NA NA
## 110 NA NA NA NA
## 111 NA NA NA NA
## 112 NA NA NA NA
## 113 NA NA NA NA
## 114 NA NA NA NA
## 115 NA NA NA NA
## 116 NA NA NA NA
## 117 NA NA NA NA
## 118 NA NA NA NA
## 119 NA NA NA NA
## 120 NA NA NA NA
## 121 NA NA NA NA
## 122 NA NA NA NA
## 123 NA NA NA NA
## 124 NA NA NA NA
## 125 NA NA NA NA
## 126 NA NA NA NA
## 127 NA NA NA NA
## 128 NA NA NA NA
## 129 NA NA NA NA
## 130 NA NA NA NA
## 131 NA NA NA NA
## 132 NA NA NA NA
## 133 NA NA NA NA
## 134 NA NA NA NA
## 135 NA NA NA NA
## 136 NA NA NA NA
## 137 NA NA NA NA
## 138 NA NA NA NA
## 139 NA NA NA NA
## 140 NA NA NA NA
## 141 NA NA NA NA
## 142 NA NA NA NA
## 143 NA NA NA NA
## 144 NA NA NA NA
## 145 NA NA NA NA
## 146 NA NA NA NA
## 147 NA NA NA NA
## 148 NA NA NA NA
## 149 NA NA NA NA
## 150 NA NA NA NA
## 151 NA NA NA NA
## 152 NA NA NA NA
## 153 NA NA NA NA
## 154 NA NA NA NA
## 155 NA NA NA NA
## 156 NA NA NA NA
## 157 NA NA NA NA
## 158 NA NA NA NA
## 159 NA NA NA NA
## 160 NA NA NA NA
## 161 NA NA NA NA
## 162 NA NA NA NA
## 163 NA NA NA NA
## 164 NA NA NA NA
## 165 NA NA NA NA
## 166 NA NA NA NA
## 167 NA NA NA NA
## 168 NA NA NA NA
## 169 NA NA NA NA
## 170 NA NA NA NA
## 171 NA NA NA NA
## 172 NA NA NA NA
## 173 NA NA NA NA
## 174 NA NA NA NA
## 175 NA NA NA NA
## 176 NA NA NA NA
## 177 NA NA NA NA
## 178 NA NA NA NA
## 179 NA NA NA NA
## 180 NA NA NA NA
## 181 NA NA NA NA
## 182 NA NA NA NA
## 183 NA NA NA NA
## 184 NA NA NA NA
## 185 NA NA NA NA
## 186 NA NA NA NA
## 187 NA NA NA NA
## 188 NA NA NA NA
## 189 NA NA NA NA
## 190 NA NA NA NA
## 191 NA NA NA NA
## 192 NA NA NA NA
## 193 NA NA NA NA
## 194 NA NA NA NA
## 195 NA NA NA NA
## 196 NA NA NA NA
## 197 NA NA NA NA
## 198 NA NA NA NA
## 199 NA NA NA NA
## 200 NA NA NA NA
isUnited <- grepl("^United", data$CountryName)
isUnited
##   [1] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
##  [13] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
##  [25] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
##  [37] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
##  [49] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
##  [61] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
##  [73] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
##  [85] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
##  [97] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [109] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [121] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [133] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [145] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [157] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [169] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [181] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [193] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
summary( isUnited )
##    Mode   FALSE 
## logical     200

Punto 4

Load the Gross Domestic Product data for the 190 ranked countries in this data set:

https://d396qusza40orc.cloudfront.net/getdata%2Fdata%2FGDP.csv

Load the educational data from this data set:

https://d396qusza40orc.cloudfront.net/getdata%2Fdata%2FEDSTATS_Country.csv

Match the data based on the country shortcode. Of the countries for which the end of the fiscal year is available, how many end in June?

Original data sources:

http://data.worldbank.org/data-catalog/GDP-ranking-table

http://data.worldbank.org/data-catalog/ed-stats

8

7

13

16

fileUrl1 <- "https://d396qusza40orc.cloudfront.net/getdata%2Fdata%2FGDP.csv"
fileUrl2 <- "https://d396qusza40orc.cloudfront.net/getdata%2Fdata%2FEDSTATS_Country.csv"
download.file(fileUrl1, destfile = "GDP.csv", method = "curl")
download.file(fileUrl2, destfile = "edu.csv", method = "curl")
gdpdata <- read.csv("GDP.csv", skip = 4, nrows = 190)
edudata <- read.csv("edu.csv")
#View(gdpdata)
#View(edudata)
mergeData <- merge(gdpdata, edudata, by.x = "X", by.y = "CountryCode")
#View(mergeData)
june <- grep('[Ff]iscal [Yy]ear(.*)[Jj]une 30', mergeData$Special.Notes)
length(june)
## [1] 13

Punto 5

You can use the quantmod (http://www.quantmod.com/) package to get historical stock prices for publicly traded companies on the NASDAQ and NYSE. Use the following code to download data on Amazon’s stock price and get the times the data was sampled.

library(quantmod)
## Loading required package: xts
## Loading required package: zoo
## 
## Attaching package: 'zoo'
## The following objects are masked from 'package:base':
## 
##     as.Date, as.Date.numeric
## 
## Attaching package: 'xts'
## The following objects are masked from 'package:dplyr':
## 
##     first, last
## Loading required package: TTR
## Registered S3 method overwritten by 'quantmod':
##   method            from
##   as.zoo.data.frame zoo
## Version 0.4-0 included new data defaults. See ?getSymbols.
amzn = getSymbols("AMZN",auto.assign=FALSE)
## 'getSymbols' currently uses auto.assign=TRUE by default, but will
## use auto.assign=FALSE in 0.5-0. You will still be able to use
## 'loadSymbols' to automatically load data. getOption("getSymbols.env")
## and getOption("getSymbols.auto.assign") will still be checked for
## alternate defaults.
## 
## This message is shown once per session and may be disabled by setting 
## options("getSymbols.warning4.0"=FALSE). See ?getSymbols for details.
#head(amzn)
sampleTimes = index(amzn)

How many values were collected in 2012? How many values were collected on Mondays in 2012?

year2012 <- grepl('2012-*', sampleTimes)
sampleTimes2012 <- subset(sampleTimes, year2012)
day <- format(sampleTimes2012, '%A')
table(year2012)
## year2012
## FALSE  TRUE 
##  3194   250
table(day)
## day
##    jueves     lunes    martes miércoles   viernes 
##        51        47        50        51        51