This is an R Markdown document. Markdown is a simple formatting syntax for authoring HTML, PDF, and MS Word documents. For more details on using R Markdown see http://rmarkdown.rstudio.com.
When you click the Knit button a document will be generated that includes both content as well as the output of any embedded R code chunks within the document. You can embed an R code chunk like this:
file_path <- "pwt1001 (1).xlsx"
pwt_data <- read_excel("C:\\Users\\HP\\Downloads\\pwt and rscript data\\pwt1001 (1).xlsx")
str(pwt_data)
## tibble [12,810 × 52] (S3: tbl_df/tbl/data.frame)
## $ countrycode : chr [1:12810] "ABW" "ABW" "ABW" "ABW" ...
## $ country : chr [1:12810] "Aruba" "Aruba" "Aruba" "Aruba" ...
## $ currency_unit: chr [1:12810] "Aruban Guilder" "Aruban Guilder" "Aruban Guilder" "Aruban Guilder" ...
## $ year : num [1:12810] 1950 1951 1952 1953 1954 ...
## $ rgdpe : num [1:12810] NA NA NA NA NA NA NA NA NA NA ...
## $ rgdpo : num [1:12810] NA NA NA NA NA NA NA NA NA NA ...
## $ pop : num [1:12810] NA NA NA NA NA NA NA NA NA NA ...
## $ emp : num [1:12810] NA NA NA NA NA NA NA NA NA NA ...
## $ avh : num [1:12810] NA NA NA NA NA NA NA NA NA NA ...
## $ hc : num [1:12810] NA NA NA NA NA NA NA NA NA NA ...
## $ ccon : num [1:12810] NA NA NA NA NA NA NA NA NA NA ...
## $ cda : num [1:12810] NA NA NA NA NA NA NA NA NA NA ...
## $ cgdpe : num [1:12810] NA NA NA NA NA NA NA NA NA NA ...
## $ cgdpo : num [1:12810] NA NA NA NA NA NA NA NA NA NA ...
## $ cn : num [1:12810] NA NA NA NA NA NA NA NA NA NA ...
## $ ck : num [1:12810] NA NA NA NA NA NA NA NA NA NA ...
## $ ctfp : num [1:12810] NA NA NA NA NA NA NA NA NA NA ...
## $ cwtfp : num [1:12810] NA NA NA NA NA NA NA NA NA NA ...
## $ rgdpna : num [1:12810] NA NA NA NA NA NA NA NA NA NA ...
## $ rconna : num [1:12810] NA NA NA NA NA NA NA NA NA NA ...
## $ rdana : num [1:12810] NA NA NA NA NA NA NA NA NA NA ...
## $ rnna : num [1:12810] NA NA NA NA NA NA NA NA NA NA ...
## $ rkna : num [1:12810] NA NA NA NA NA NA NA NA NA NA ...
## $ rtfpna : num [1:12810] NA NA NA NA NA NA NA NA NA NA ...
## $ rwtfpna : num [1:12810] NA NA NA NA NA NA NA NA NA NA ...
## $ labsh : num [1:12810] NA NA NA NA NA NA NA NA NA NA ...
## $ irr : num [1:12810] NA NA NA NA NA NA NA NA NA NA ...
## $ delta : num [1:12810] NA NA NA NA NA NA NA NA NA NA ...
## $ xr : num [1:12810] NA NA NA NA NA NA NA NA NA NA ...
## $ pl_con : num [1:12810] NA NA NA NA NA NA NA NA NA NA ...
## $ pl_da : num [1:12810] NA NA NA NA NA NA NA NA NA NA ...
## $ pl_gdpo : num [1:12810] NA NA NA NA NA NA NA NA NA NA ...
## $ i_cig : chr [1:12810] NA NA NA NA ...
## $ i_xm : chr [1:12810] NA NA NA NA ...
## $ i_xr : chr [1:12810] NA NA NA NA ...
## $ i_outlier : chr [1:12810] NA NA NA NA ...
## $ i_irr : chr [1:12810] NA NA NA NA ...
## $ cor_exp : num [1:12810] NA NA NA NA NA NA NA NA NA NA ...
## $ statcap : num [1:12810] NA NA NA NA NA NA NA NA NA NA ...
## $ csh_c : num [1:12810] NA NA NA NA NA NA NA NA NA NA ...
## $ csh_i : num [1:12810] NA NA NA NA NA NA NA NA NA NA ...
## $ csh_g : num [1:12810] NA NA NA NA NA NA NA NA NA NA ...
## $ csh_x : num [1:12810] NA NA NA NA NA NA NA NA NA NA ...
## $ csh_m : num [1:12810] NA NA NA NA NA NA NA NA NA NA ...
## $ csh_r : num [1:12810] NA NA NA NA NA NA NA NA NA NA ...
## $ pl_c : num [1:12810] NA NA NA NA NA NA NA NA NA NA ...
## $ pl_i : num [1:12810] NA NA NA NA NA NA NA NA NA NA ...
## $ pl_g : num [1:12810] NA NA NA NA NA NA NA NA NA NA ...
## $ pl_x : num [1:12810] NA NA NA NA NA NA NA NA NA NA ...
## $ pl_m : num [1:12810] NA NA NA NA NA NA NA NA NA NA ...
## $ pl_n : num [1:12810] NA NA NA NA NA NA NA NA NA NA ...
## $ pl_k : num [1:12810] NA NA NA NA NA NA NA NA NA NA ...
View(pwt_data)
selected_data <- pwt_data %>%
select(country, year, rgdpe, pop, emp, avh) %>% # Select columns of interest
filter(year >= 2000) %>% # Filter for years >= 2000
mutate(gdp_per_capita = rgdpe / pop) # Create GDP per capita
# Preview the cleaned data
head(selected_data)
## # A tibble: 6 × 7
## country year rgdpe pop emp avh gdp_per_capita
## <chr> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 Aruba 2000 4031. 0.0909 0.0419 NA 44370.
## 2 Aruba 2001 4123. 0.0929 0.0428 NA 44382.
## 3 Aruba 2002 4102. 0.0950 0.0437 NA 43179.
## 4 Aruba 2003 4209. 0.0970 0.0446 NA 43386.
## 5 Aruba 2004 4549. 0.0987 0.0454 NA 46072.
## 6 Aruba 2005 4706. 0.100 0.0459 NA 47044.
## # A tibble: 10 × 3
## country avg_gdp_per_capita avg_employment
## <chr> <dbl> <dbl>
## 1 Qatar 111235. 1.14
## 2 Luxembourg 93299. 0.354
## 3 United Arab Emirates 84560. 4.19
## 4 China, Macao SAR 81777. 0.307
## 5 Brunei Darussalam 74332. 0.176
## 6 Cayman Islands 73263. 0.0367
## 7 Singapore 69965. 2.99
## 8 Bermuda 66480. 0.0363
## 9 Kuwait 64140. 1.64
## 10 Switzerland 59542. 4.43
You can also embed plots, for example:
## Warning: Using `size` aesthetic for lines was deprecated in ggplot2 3.4.0.
## ℹ Please use `linewidth` instead.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.
Note that the
echo = FALSE
parameter was added to the code
chunk to prevent printing of the R code that generated the plot.