File dữ liệu này sẽ cho ta biết dữ liệu về số lượng dân số theo độ tuổi của một số quốc gia từ 0 cho đến già hơn 100 tuổi vào năm 1950-2021
Gán file “population-and-demography” vào trong R
library(xlsx)
q <- read.xlsx("D:/T.LONG/population-and-demography (1).xlsx", sheetIndex = 1, header = 1) # đọc file excel và gán vào object q
Cho biết độ dài của bộ dữ liệu
length(q)
## [1] 24
Độ dài của bộ dữ liệu còn có thể hiểu được là số cột của nó, ở đây ta thể thấy được bộ dữ liệu này có số cột là 24
Cho biết số hàng và số cột
dim(q)
## [1] 18288 24
Hàm lệnh dim này giống hàm length ở việc cho ra số cột của bộ dữ liệu tuy nhiên kèm thêm đó là số quan sát của bộ dữ liệu, ở đây ta có 18288 quan sát
Cho biết tên các cột
names(q)
## [1] "Country"
## [2] "Year"
## [3] "Population"
## [4] "Population.of.children.under.the.age.of.1"
## [5] "Population.of.children.under.the.age.of.5"
## [6] "Population.of.children.under.the.age.of.15"
## [7] "Population.under.the.age.of.25"
## [8] "Population.aged.15.to.64.years"
## [9] "Population.older.than.15.years"
## [10] "Population.older.than.18.years"
## [11] "Population.at.age.1"
## [12] "Population.aged.1.to.4.years"
## [13] "Population.aged.5.to.9.years"
## [14] "Population.aged.10.to.14.years"
## [15] "Population.aged.15.to.19.years"
## [16] "Population.aged.20.to.29.years"
## [17] "Population.aged.30.to.39.years"
## [18] "Population.aged.40.to.49.years"
## [19] "Population.aged.50.to.59.years"
## [20] "Population.aged.60.to.69.years"
## [21] "Population.aged.70.to.79.years"
## [22] "Population.aged.80.to.89.years"
## [23] "Population.aged.90.to.99.years"
## [24] "Population.older.than.100.years"
Ở đây ta thấy được tên của từng cột của bảng dữ liệu. Giải thích như sau:
-Country: Tên quốc gia
-Year: Năm quan sát
Dùng lệnh str để xem cấu trúc của dữ liệu như thế nào
str(q)
## 'data.frame': 18288 obs. of 24 variables:
## $ Country : chr "Afghanistan" "Afghanistan" "Afghanistan" "Afghanistan" ...
## $ Year : num 1950 1951 1952 1953 1954 ...
## $ Population : num 7480464 7571542 7667534 7764549 7864289 ...
## $ Population.of.children.under.the.age.of.1 : num 301735 299368 305393 311574 317584 ...
## $ Population.of.children.under.the.age.of.5 : num 1248282 1246857 1248220 1254725 1267817 ...
## $ Population.of.children.under.the.age.of.15: num 3068855 3105444 3145070 3186382 3231060 ...
## $ Population.under.the.age.of.25 : num 4494349 4552138 4613604 4676232 4741371 ...
## $ Population.aged.15.to.64.years : num 4198587 4250002 4303436 4356242 4408474 ...
## $ Population.older.than.15.years : num 4411609 4466098 4522464 4578167 4633229 ...
## $ Population.older.than.18.years : num 3946595 3993640 4041439 4088379 4136116 ...
## $ Population.at.age.1 : num 258652 254304 252906 258717 264765 ...
## $ Population.aged.1.to.4.years : num 946547 947489 942827 943151 950233 ...
## $ Population.aged.5.to.9.years : num 966210 991791 1017993 1039950 1055592 ...
## $ Population.aged.10.to.14.years : num 854363 866796 878857 891707 907651 ...
## $ Population.aged.15.to.19.years : num 757113 768616 781411 794308 806216 ...
## $ Population.aged.20.to.29.years : num 1241348 1260904 1280288 1298803 1316768 ...
## $ Population.aged.30.to.39.years : num 909953 922765 935638 948321 961484 ...
## $ Population.aged.40.to.49.years : num 661807 667015 672491 678064 684153 ...
## $ Population.aged.50.to.59.years : num 467170 468881 470898 472969 475117 ...
## $ Population.aged.60.to.69.years : num 271905 273286 274852 276577 278210 ...
## $ Population.aged.70.to.79.years : num 92691 94358 96026 97705 99298 ...
## $ Population.aged.80.to.89.years : num 9499 10155 10721 11254 11793 ...
## $ Population.aged.90.to.99.years : num 123 118 139 166 190 210 233 255 277 307 ...
## $ Population.older.than.100.years : num 0 0 0 0 0 0 0 0 0 0 ...
Ở đây ta thấy được bộ dữ liệu là data frame với 18288 quan sát và 24 cột
Bảng này cũng cho ta 3 cột với cột thứ nhất chỉ tên cột thứ hai chỉ kiểu biến và thứ ba là các quan sát.
Một số giải thích:
“chr”: kí tự
“nu”: số thực
“int”: số nguyên
Ngoài ra, ta cũng có thể coi thêm 1 số thông tin khác với lệnh skim
library(skimr)
skim(q)
Name | q |
Number of rows | 18288 |
Number of columns | 24 |
_______________________ | |
Column type frequency: | |
character | 1 |
numeric | 23 |
________________________ | |
Group variables | None |
Variable type: character
skim_variable | n_missing | complete_rate | min | max | empty | n_unique | whitespace |
---|---|---|---|---|---|---|---|
Country | 0 | 1 | 4 | 59 | 0 | 254 | 0 |
Variable type: numeric
skim_variable | n_missing | complete_rate | mean | sd | p0 | p25 | p50 | p75 | p100 | hist |
---|---|---|---|---|---|---|---|---|---|---|
Year | 0 | 1 | 1985.50 | 20.78 | 1950 | 1967.75 | 1985.5 | 2003.25 | 2021 | ▇▇▇▇▇ |
Population | 0 | 1 | 126470436.62 | 588851230.77 | 1363 | 291591.50 | 3833997.5 | 16785463.50 | 7909295000 | ▇▁▁▁▁ |
Population.of.children.under.the.age.of.1 | 0 | 1 | 3133496.86 | 14167006.03 | 25 | 6663.75 | 88352.0 | 463000.50 | 139783730 | ▇▁▁▁▁ |
Population.of.children.under.the.age.of.5 | 0 | 1 | 14825709.57 | 67384368.62 | 136 | 31995.25 | 423784.5 | 2160046.50 | 690360700 | ▇▁▁▁▁ |
Population.of.children.under.the.age.of.15 | 0 | 1 | 41095227.11 | 188416973.54 | 416 | 89541.50 | 1186121.5 | 5905944.75 | 2015023400 | ▇▁▁▁▁ |
Population.under.the.age.of.25 | 0 | 1 | 63762600.31 | 294251869.66 | 623 | 139541.50 | 1843099.5 | 9025129.75 | 3239281000 | ▇▁▁▁▁ |
Population.aged.15.to.64.years | 0 | 1 | 77429505.08 | 367651914.71 | 748 | 170263.50 | 2246772.0 | 9641250.00 | 5132999000 | ▇▁▁▁▁ |
Population.older.than.15.years | 0 | 1 | 85372101.76 | 404866940.61 | 849 | 186716.00 | 2482104.0 | 10354345.50 | 5893678600 | ▇▁▁▁▁ |
Population.older.than.18.years | 0 | 1 | 78196242.04 | 372017010.49 | 752 | 166417.50 | 2238130.5 | 9239904.00 | 5516283000 | ▇▁▁▁▁ |
Population.at.age.1 | 0 | 1 | 3011212.81 | 13661998.41 | 26 | 6473.75 | 85824.0 | 440787.50 | 138478740 | ▇▁▁▁▁ |
Population.aged.1.to.4.years | 0 | 1 | 11692212.72 | 53238243.89 | 101 | 25269.25 | 334454.0 | 1697850.75 | 550970400 | ▇▁▁▁▁ |
Population.aged.5.to.9.years | 0 | 1 | 13598575.21 | 62534310.11 | 138 | 29406.25 | 392220.5 | 1947260.75 | 683611800 | ▇▁▁▁▁ |
Population.aged.10.to.14.years | 0 | 1 | 12670942.28 | 58775457.46 | 73 | 27879.50 | 363895.5 | 1796754.00 | 659934300 | ▇▁▁▁▁ |
Population.aged.15.to.19.years | 0 | 1 | 11782258.92 | 55126036.18 | 110 | 26296.50 | 336969.5 | 1626210.75 | 623576060 | ▇▁▁▁▁ |
Population.aged.20.to.29.years | 0 | 1 | 20872880.04 | 98860990.50 | 158 | 45050.75 | 609723.5 | 2758738.50 | 1210493200 | ▇▁▁▁▁ |
Population.aged.30.to.39.years | 0 | 1 | 17158704.11 | 82404600.95 | 137 | 36608.25 | 486290.5 | 2113149.00 | 1165207300 | ▇▁▁▁▁ |
Population.aged.40.to.49.years | 0 | 1 | 13622138.99 | 66008221.21 | 119 | 27440.25 | 364712.5 | 1556334.00 | 976407200 | ▇▁▁▁▁ |
Population.aged.50.to.59.years | 0 | 1 | 10177069.11 | 49288480.77 | 95 | 19649.75 | 264781.5 | 1203386.00 | 851356900 | ▇▁▁▁▁ |
Population.aged.60.to.69.years | 0 | 1 | 6801756.84 | 32712918.99 | 64 | 12603.00 | 168417.5 | 845242.75 | 598067140 | ▇▁▁▁▁ |
Population.aged.70.to.79.years | 0 | 1 | 3618710.03 | 17491538.61 | 31 | 6221.00 | 81824.0 | 436710.00 | 330491170 | ▇▁▁▁▁ |
Population.aged.80.to.89.years | 0 | 1 | 1195799.30 | 6238308.33 | 6 | 1818.75 | 20269.5 | 133380.50 | 131835590 | ▇▁▁▁▁ |
Population.aged.90.to.99.years | 0 | 1 | 142784.38 | 853350.39 | 0 | 154.75 | 1468.5 | 12499.00 | 22223974 | ▇▁▁▁▁ |
Population.older.than.100.years | 0 | 1 | 3107.72 | 20951.57 | 0 | 0.00 | 13.0 | 163.00 | 593166 | ▇▁▁▁▁ |
Ngoài những thông tin đã biết, lệnh skim còn cho 1 số thông tin khác như:
Không có dữ liệu bị miss
Chuỗi ký tự ngắn nhất trên 1 ô dữ liệu là 4
Chuỗi ký tự dài nhất trên 1 ô dữ liệu là 59
Có 254 giá trị duy nhất, có nghĩa là dataset này thống kê dữ liệu dựa trên 254 quốc gia riêng biệt
Với các biến dữ liệu số, ta có thể xem được các giá trị như sau:
n_missing: số ô dữ liệu bị miss ( 0 )
complete_rate: tỷ lệ ô có dữ liệu ( 1 )
mean: trung bình
sd: độ lệch chuẩn là đại lượng để đo lường mức độ phân tán của dữ liệu
p0: giá trị nhỏ nhất
p25: Phân vị thứ nhất cho biết có 25% giá trị nằm dưới và 75% giá trị nằm trên p25
p50: Phân vị thứ hai cũng chính là trung vị, cho biết 50% giá trị nằm dưới và 50% giá trị nằm trên p50
p75: phân vị thứ ba cho biết có 75% giá trị nằm dưới và 25% giá trị nằm trên p75
p100: giá trị lớn nhất
hist: biểu đồ Histogram
Ta chọn 5 quốc gia:
Dominica
Jamaica
Puerto Rico
Vietnam
Zimbabwe
5 độ tuổi:
Population.aged.15.to.19.years: Dân số có độ tuổi từ 15 đến 19
Population.aged.20.to.29.years: Dân số có độ tuổi từ 20 đến 29
Population.aged.30.to.39.years: Dân số có độ tuổi từ 30 đến 39
Population.aged.40.to.49.years: Dân số có độ tuổi từ 40 đến 49
Population.aged.50.to.59.years: Dân số có độ tuổi từ 50 đến 59
Là một đảo quốc và là quốc gia không có biên giới trong vùng biển Caribe, phía cực nam Quần đảo Leeward.
Đầu tiên ta kiểm tra những thông tin cơ bản của quốc gia này
Ta xem có bao nhiêu quan sát của Dominica trong bộ dữ liệu:
Do <- q
Do1 <- ifelse(Do$Country == 'Dominica', 'Dominica', 'Nước khác')
table(Do1)
## Do1
## Dominica Nước khác
## 72 18216
Ta thấy có 72 quan sát của Dominica
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
Do2 <- q %>% filter(Country=='Dominica') %>% select(Country,Year,Population,Population.aged.20.to.29.years,Population.aged.15.to.19.years,Population.aged.30.to.39.years,Population.aged.40.to.49.years,Population.aged.50.to.59.years)
Do2
## Country Year Population Population.aged.20.to.29.years
## 1 Dominica 1950 50208 6887
## 2 Dominica 1951 50384 6740
## 3 Dominica 1952 50567 6619
## 4 Dominica 1953 50834 6545
## 5 Dominica 1954 51234 6542
## 6 Dominica 1955 51918 6693
## 7 Dominica 1956 52974 6977
## 8 Dominica 1957 54337 7293
## 9 Dominica 1958 55992 7597
## 10 Dominica 1959 57839 7850
## 11 Dominica 1960 59396 7995
## 12 Dominica 1961 60416 8024
## 13 Dominica 1962 61244 7983
## 14 Dominica 1963 62051 7906
## 15 Dominica 1964 62863 7815
## 16 Dominica 1965 63756 7735
## 17 Dominica 1966 64740 7692
## 18 Dominica 1967 65781 7708
## 19 Dominica 1968 66883 7772
## 20 Dominica 1969 68025 7888
## 21 Dominica 1970 68913 8143
## 22 Dominica 1971 69446 8519
## 23 Dominica 1972 69890 8905
## 24 Dominica 1973 70352 9268
## 25 Dominica 1974 70840 9615
## 26 Dominica 1975 71319 9945
## 27 Dominica 1976 71766 10265
## 28 Dominica 1977 72161 10579
## 29 Dominica 1978 72498 10891
## 30 Dominica 1979 72788 11214
## 31 Dominica 1980 73000 11543
## 32 Dominica 1981 72949 11936
## 33 Dominica 1982 72650 12368
## 34 Dominica 1983 72290 12740
## 35 Dominica 1984 71957 13048
## 36 Dominica 1985 71613 13270
## 37 Dominica 1986 71233 13400
## 38 Dominica 1987 70824 13436
## 39 Dominica 1988 70408 13350
## 40 Dominica 1989 69996 13116
## 41 Dominica 1990 69501 12791
## 42 Dominica 1991 69170 12666
## 43 Dominica 1992 69135 12832
## 44 Dominica 1993 69196 12960
## 45 Dominica 1994 69219 12869
## 46 Dominica 1995 69224 12592
## 47 Dominica 1996 69182 12183
## 48 Dominica 1997 69096 11682
## 49 Dominica 1998 68957 11112
## 50 Dominica 1999 68713 10502
## 51 Dominica 2000 68365 9910
## 52 Dominica 2001 68171 9526
## 53 Dominica 2002 68281 9467
## 54 Dominica 2003 68457 9586
## 55 Dominica 2004 68591 9766
## 56 Dominica 2005 68686 9972
## 57 Dominica 2006 68761 10183
## 58 Dominica 2007 68789 10360
## 59 Dominica 2008 68794 10498
## 60 Dominica 2009 68805 10595
## 61 Dominica 2010 68775 10640
## 62 Dominica 2011 68758 10784
## 63 Dominica 2012 68908 11078
## 64 Dominica 2013 68839 11256
## 65 Dominica 2014 69388 11707
## 66 Dominica 2015 70027 12156
## 67 Dominica 2016 70098 12286
## 68 Dominica 2017 70422 12502
## 69 Dominica 2018 70840 12679
## 70 Dominica 2019 71446 12867
## 71 Dominica 2020 72011 13012
## 72 Dominica 2021 72435 13014
## Population.aged.15.to.19.years Population.aged.30.to.39.years
## 1 4347 5864
## 2 4514 5962
## 3 4723 6022
## 4 4955 6046
## 5 5185 6029
## 6 5364 5954
## 7 5457 5831
## 8 5474 5700
## 9 5437 5592
## 10 5367 5532
## 11 5336 5521
## 12 5390 5544
## 13 5502 5582
## 14 5641 5629
## 15 5793 5677
## 16 5940 5710
## 17 6069 5712
## 18 6200 5663
## 19 6355 5555
## 20 6565 5376
## 21 6834 5227
## 22 7140 5182
## 23 7458 5192
## 24 7772 5239
## 25 8066 5327
## 26 8320 5459
## 27 8530 5622
## 28 8712 5798
## 29 8872 5966
## 30 9027 6106
## 31 9203 6219
## 32 9351 6337
## 33 9423 6514
## 34 9414 6728
## 35 9312 6959
## 36 9123 7208
## 37 8886 7444
## 38 8626 7637
## 39 8355 7815
## 40 8059 8002
## 41 7677 8178
## 42 7226 8380
## 43 6763 8614
## 44 6338 8889
## 45 6016 9220
## 46 5831 9559
## 47 5777 9857
## 48 5834 10113
## 49 5981 10306
## 50 6173 10422
## 51 6366 10473
## 52 6507 10492
## 53 6539 10502
## 54 6457 10481
## 55 6329 10398
## 56 6212 10237
## 57 6159 10007
## 58 6184 9737
## 59 6255 9451
## 60 6313 9183
## 61 6317 8963
## 62 6273 8828
## 63 6207 8813
## 64 6006 8844
## 65 6038 9039
## 66 6116 9299
## 67 5990 9512
## 68 5947 9784
## 69 5891 10081
## 70 5857 10403
## 71 5779 10720
## 72 5647 11032
## Population.aged.40.to.49.years Population.aged.50.to.59.years
## 1 3633 2600
## 2 3712 2617
## 3 3793 2645
## 4 3895 2687
## 5 4024 2732
## 6 4253 2857
## 7 4546 3068
## 8 4795 3297
## 9 4963 3552
## 10 5044 3825
## 11 5064 4039
## 12 5069 4151
## 13 5078 4220
## 14 5083 4270
## 15 5077 4301
## 16 5052 4318
## 17 5014 4341
## 18 4961 4364
## 19 4903 4391
## 20 4846 4423
## 21 4805 4469
## 22 4797 4514
## 23 4809 4542
## 24 4827 4548
## 25 4850 4529
## 26 4867 4492
## 27 4864 4448
## 28 4844 4397
## 29 4817 4359
## 30 4784 4342
## 31 4755 4335
## 32 4744 4350
## 33 4759 4389
## 34 4792 4417
## 35 4830 4441
## 36 4865 4453
## 37 4915 4442
## 38 4993 4425
## 39 5069 4394
## 40 5158 4348
## 41 5262 4267
## 42 5357 4225
## 43 5487 4284
## 44 5668 4365
## 45 5873 4412
## 46 6096 4446
## 47 6322 4502
## 48 6540 4575
## 49 6792 4652
## 50 7079 4738
## 51 7368 4843
## 52 7655 4962
## 53 7944 5118
## 54 8221 5303
## 55 8488 5490
## 56 8743 5689
## 57 8972 5900
## 58 9174 6118
## 59 9344 6345
## 60 9482 6594
## 61 9598 6844
## 62 9709 7085
## 63 9823 7320
## 64 9854 7552
## 65 9880 7778
## 66 9830 8023
## 67 9638 8281
## 68 9453 8506
## 69 9264 8718
## 70 9100 8906
## 71 8966 9083
## 72 8876 9244
Ở bảng trên ta thấy được các thông tin về các nhóm tuổi và các năm tương ứng mà chúng ta đã chọn ra để phân tích ở trên của Dominica
Jamaica (là một quốc đảo, có chiều dài 234 kilômét (145 dặm) và chiều rộng 80 kilômét (50 dặm) với diện tích 11.100 km² Đầu tiên ta kiểm tra những thông tin cơ bản của quốc gia này
Ta xem có bao nhiêu quan sát của Jamaica trong bộ dữ liệu:
Ja <- q
Ja1 <- ifelse(Ja$Country == 'Jamaica', 'Jamaica', 'Nước khác')
table(Ja1)
## Ja1
## Jamaica Nước khác
## 72 18216
Ta thấy có 72 quan sát của Jamaica
library(dplyr)
Ja2 <- q %>% filter(Country=='Jamaica') %>% select(Country,Year,Population,Population.aged.20.to.29.years,Population.aged.15.to.19.years,Population.aged.30.to.39.years,Population.aged.40.to.49.years,Population.aged.50.to.59.years)
Ja2
## Country Year Population Population.aged.20.to.29.years
## 1 Jamaica 1950 1407472 232256
## 2 Jamaica 1951 1448405 240461
## 3 Jamaica 1952 1482284 246274
## 4 Jamaica 1953 1509999 249601
## 5 Jamaica 1954 1533225 250174
## 6 Jamaica 1955 1552891 248169
## 7 Jamaica 1956 1570058 244265
## 8 Jamaica 1957 1586415 239227
## 9 Jamaica 1958 1603780 233818
## 10 Jamaica 1959 1622048 228594
## 11 Jamaica 1960 1642331 225722
## 12 Jamaica 1961 1663763 225145
## 13 Jamaica 1962 1683763 224917
## 14 Jamaica 1963 1703872 225268
## 15 Jamaica 1964 1725189 226533
## 16 Jamaica 1965 1746983 228570
## 17 Jamaica 1966 1768803 231001
## 18 Jamaica 1967 1790590 233607
## 19 Jamaica 1968 1812219 236004
## 20 Jamaica 1969 1834620 237416
## 21 Jamaica 1970 1859094 239752
## 22 Jamaica 1971 1886154 244576
## 23 Jamaica 1972 1915306 250137
## 24 Jamaica 1973 1945324 256155
## 25 Jamaica 1974 1974883 263302
## 26 Jamaica 1975 2003102 271565
## 27 Jamaica 1976 2029490 281119
## 28 Jamaica 1977 2054929 292360
## 29 Jamaica 1978 2080487 305881
## 30 Jamaica 1979 2106939 321820
## 31 Jamaica 1980 2135548 339415
## 32 Jamaica 1981 2166671 356323
## 33 Jamaica 1982 2199604 371556
## 34 Jamaica 1983 2232789 385949
## 35 Jamaica 1984 2264104 399579
## 36 Jamaica 1985 2292036 412041
## 37 Jamaica 1986 2315874 422642
## 38 Jamaica 1987 2336242 431088
## 39 Jamaica 1988 2354813 437138
## 40 Jamaica 1989 2373368 441801
## 41 Jamaica 1990 2392035 444566
## 42 Jamaica 1991 2411869 446741
## 43 Jamaica 1992 2434580 449913
## 44 Jamaica 1993 2459064 452299
## 45 Jamaica 1994 2484186 453191
## 46 Jamaica 1995 2509369 452888
## 47 Jamaica 1996 2532895 451727
## 48 Jamaica 1997 2554952 450769
## 49 Jamaica 1998 2576569 451038
## 50 Jamaica 1999 2596276 452409
## 51 Jamaica 2000 2612203 455230
## 52 Jamaica 2001 2625410 459227
## 53 Jamaica 2002 2638248 464035
## 54 Jamaica 2003 2651034 469950
## 55 Jamaica 2004 2664027 477013
## 56 Jamaica 2005 2676868 484969
## 57 Jamaica 2006 2689658 493687
## 58 Jamaica 2007 2701222 502117
## 59 Jamaica 2008 2711378 509417
## 60 Jamaica 2009 2722405 515868
## 61 Jamaica 2010 2733904 520489
## 62 Jamaica 2011 2746169 524276
## 63 Jamaica 2012 2759819 528964
## 64 Jamaica 2013 2773134 533741
## 65 Jamaica 2014 2784542 537836
## 66 Jamaica 2015 2794455 540703
## 67 Jamaica 2016 2802699 540721
## 68 Jamaica 2017 2808388 538516
## 69 Jamaica 2018 2811842 535689
## 70 Jamaica 2019 2813776 531000
## 71 Jamaica 2020 2820438 525656
## 72 Jamaica 2021 2827701 518812
## Population.aged.15.to.19.years Population.aged.30.to.39.years
## 1 144263 203900
## 2 147094 208137
## 3 147400 209671
## 4 146193 208888
## 5 144900 206422
## 6 144231 202744
## 7 144338 197983
## 8 145460 192306
## 9 147516 186181
## 10 150128 180162
## 11 152314 175634
## 12 153611 172819
## 13 154256 170724
## 14 154161 169073
## 15 152847 167296
## 16 152237 165152
## 17 154010 162895
## 18 156899 160760
## 19 161165 158975
## 20 168329 157806
## 21 176759 157578
## 22 183950 159185
## 23 191623 162367
## 24 201078 166316
## 25 210475 171378
## 26 220268 177403
## 27 229264 183947
## 28 234909 190634
## 29 238433 196859
## 30 242154 201569
## 31 245393 206306
## 32 248725 212589
## 33 254032 218958
## 34 259670 224807
## 35 263713 230782
## 36 265417 237370
## 37 265350 244767
## 38 264026 253482
## 39 261868 264249
## 40 259235 277229
## 41 256500 291633
## 42 253351 305160
## 43 251307 316090
## 44 251468 325743
## 45 253029 335518
## 46 256172 345263
## 47 260993 354512
## 48 266372 362800
## 49 271524 369342
## 50 276556 374580
## 51 280999 377714
## 52 284586 379941
## 53 287323 383660
## 54 289070 387170
## 55 289792 388995
## 56 288737 389430
## 57 287098 388804
## 58 286750 388247
## 59 287365 388911
## 60 288515 390863
## 61 290542 394643
## 62 290668 400056
## 63 287588 406706
## 64 283158 414695
## 65 276560 423894
## 66 266545 433980
## 67 256129 444781
## 68 247192 455260
## 69 238584 464539
## 70 232002 472696
## 71 229435 479828
## 72 229360 486223
## Population.aged.40.to.49.years Population.aged.50.to.59.years
## 1 150528 90402
## 2 155729 95430
## 3 160076 100601
## 4 163633 105661
## 5 166503 110237
## 6 168709 114157
## 7 170312 117474
## 8 171551 120248
## 9 172314 122677
## 10 172080 125000
## 11 170861 127273
## 12 168787 129381
## 13 165730 131305
## 14 162017 133105
## 15 158125 134810
## 16 154292 136322
## 17 150456 137644
## 18 146488 138868
## 19 142550 139730
## 20 139061 139817
## 21 136247 139042
## 22 134907 137756
## 23 135102 135970
## 24 135847 133684
## 25 136580 131322
## 26 137112 129116
## 27 137677 127013
## 28 138474 124895
## 29 139671 122894
## 30 141415 121363
## 31 143871 120434
## 32 146927 120204
## 33 150413 120752
## 34 154248 121690
## 35 158659 122409
## 36 163683 122773
## 37 168881 123002
## 38 173953 123312
## 39 178415 123912
## 40 181280 124971
## 41 184070 126665
## 42 188244 128843
## 43 192030 131283
## 44 195392 134178
## 45 199545 137923
## 46 204705 142414
## 47 211185 147248
## 48 219383 152062
## 49 229757 156256
## 50 242179 158805
## 51 255735 161141
## 52 268131 164648
## 53 278540 167979
## 54 288384 171196
## 55 298254 175163
## 56 307997 180095
## 57 317173 186259
## 58 325370 194054
## 59 331914 203936
## 60 337339 215782
## 61 340960 228868
## 62 343969 241095
## 63 348643 251579
## 64 353242 261590
## 65 356234 271605
## 66 357800 281370
## 67 358255 290432
## 68 358751 298466
## 69 360405 304886
## 70 363197 310137
## 71 368053 313779
## 72 374404 316631
Ở bảng trên ta thấy được các thông tin về các nhóm tuổi và các năm tương ứng mà chúng ta đã chọn ra để phân tích ở trên của Jamaica
Puerto Rico nằm trên đường giáp ranh giữa hai địa mảng lớn là địa mảng Bắc Mỹ và địa mảng Caribbean
Đầu tiên ta kiểm tra những thông tin cơ bản của quốc gia này
Ta xem có bao nhiêu quan sát của Puerto Rico trong bộ dữ liệu:
Pu <- q
Pu1 <- ifelse(Pu$Country == 'Puerto Rico', 'Puerto Rico', 'Nước khác')
table(Pu1)
## Pu1
## Nước khác Puerto Rico
## 18216 72
Ta thấy có 72 quan sát của Puerto Rico
library(dplyr)
Pu2 <- q %>% filter(Country=='Puerto Rico') %>% select(Country,Year,Population,Population.aged.20.to.29.years,Population.aged.15.to.19.years,Population.aged.30.to.39.years,Population.aged.40.to.49.years,Population.aged.50.to.59.years)
Pu2
## Country Year Population Population.aged.20.to.29.years
## 1 Puerto Rico 1950 2229747 354546
## 2 Puerto Rico 1951 2250412 353188
## 3 Puerto Rico 1952 2269210 351355
## 4 Puerto Rico 1953 2284819 347049
## 5 Puerto Rico 1954 2298020 340924
## 6 Puerto Rico 1955 2309785 334534
## 7 Puerto Rico 1956 2320575 328371
## 8 Puerto Rico 1957 2329617 322005
## 9 Puerto Rico 1958 2336800 315641
## 10 Puerto Rico 1959 2343695 309978
## 11 Puerto Rico 1960 2365078 312324
## 12 Puerto Rico 1961 2404222 324947
## 13 Puerto Rico 1962 2446295 340832
## 14 Puerto Rico 1963 2486864 356690
## 15 Puerto Rico 1964 2526157 371247
## 16 Puerto Rico 1965 2564282 384002
## 17 Puerto Rico 1966 2601200 394790
## 18 Puerto Rico 1967 2636742 403116
## 19 Puerto Rico 1968 2670535 408680
## 20 Puerto Rico 1969 2701799 411977
## 21 Puerto Rico 1970 2737624 420587
## 22 Puerto Rico 1971 2782015 437012
## 23 Puerto Rico 1972 2829188 454203
## 24 Puerto Rico 1973 2876680 469432
## 25 Puerto Rico 1974 2924359 482423
## 26 Puerto Rico 1975 2972272 492668
## 27 Puerto Rico 1976 3020463 499669
## 28 Puerto Rico 1977 3068873 503587
## 29 Puerto Rico 1978 3117176 505639
## 30 Puerto Rico 1979 3166209 505242
## 31 Puerto Rico 1980 3214573 508775
## 32 Puerto Rico 1981 3259448 520075
## 33 Puerto Rico 1982 3301072 533355
## 34 Puerto Rico 1983 3339378 546305
## 35 Puerto Rico 1984 3374438 557119
## 36 Puerto Rico 1985 3406278 564493
## 37 Puerto Rico 1986 3434975 567800
## 38 Puerto Rico 1987 3461929 567172
## 39 Puerto Rico 1988 3487969 565645
## 40 Puerto Rico 1989 3513738 562458
## 41 Puerto Rico 1990 3543785 562035
## 42 Puerto Rico 1991 3578449 568582
## 43 Puerto Rico 1992 3612634 575139
## 44 Puerto Rico 1993 3645019 577740
## 45 Puerto Rico 1994 3675747 576341
## 46 Puerto Rico 1995 3704948 573281
## 47 Puerto Rico 1996 3732817 571351
## 48 Puerto Rico 1997 3759526 571359
## 49 Puerto Rico 1998 3785240 572510
## 50 Puerto Rico 1999 3810114 573607
## 51 Puerto Rico 2000 3827104 573365
## 52 Puerto Rico 2001 3832138 571718
## 53 Puerto Rico 2002 3830775 569074
## 54 Puerto Rico 2003 3825629 565201
## 55 Puerto Rico 2004 3817033 559376
## 56 Puerto Rico 2005 3805560 550664
## 57 Puerto Rico 2006 3791559 539636
## 58 Puerto Rico 2007 3775446 527972
## 59 Puerto Rico 2008 3757617 517629
## 60 Puerto Rico 2009 3738934 509758
## 61 Puerto Rico 2010 3717920 503604
## 62 Puerto Rico 2011 3691615 497231
## 63 Puerto Rico 2012 3657989 489602
## 64 Puerto Rico 2013 3615028 480349
## 65 Puerto Rico 2014 3560008 468149
## 66 Puerto Rico 2015 3497335 453771
## 67 Puerto Rico 2016 3432745 438486
## 68 Puerto Rico 2017 3366407 422395
## 69 Puerto Rico 2018 3319269 413218
## 70 Puerto Rico 2019 3292888 410113
## 71 Puerto Rico 2020 3271570 406709
## 72 Puerto Rico 2021 3256030 403674
## Population.aged.15.to.19.years Population.aged.30.to.39.years
## 1 217545 262008
## 2 216783 263132
## 3 217074 265154
## 4 218019 267136
## 5 219359 268763
## 6 220620 269745
## 7 222485 269978
## 8 226513 269012
## 9 233495 266121
## 10 242939 260944
## 11 253850 256943
## 12 264274 256571
## 13 271771 257982
## 14 275555 260673
## 15 276483 264826
## 16 275818 270031
## 17 274795 275869
## 18 275017 282089
## 19 277646 288386
## 20 282809 294424
## 21 289055 300857
## 22 294400 308717
## 23 298313 317988
## 24 300900 328710
## 25 302378 340762
## 26 303629 353473
## 27 305100 367305
## 28 308108 382983
## 29 314499 398292
## 30 323661 412477
## 31 331384 425214
## 32 334690 434881
## 33 332985 442943
## 34 327362 450777
## 35 320626 458297
## 36 315387 465640
## 37 313656 472432
## 38 315226 477419
## 39 318534 481921
## 40 322804 487049
## 41 324796 492351
## 42 322631 497997
## 43 320583 504253
## 44 320348 511618
## 45 321436 519476
## 46 322566 526822
## 47 321735 531942
## 48 319007 534273
## 49 315475 535198
## 50 311599 535113
## 51 306086 533472
## 52 298770 531073
## 53 291593 527814
## 54 286199 521922
## 55 283594 514194
## 56 283700 507538
## 57 285294 503275
## 58 287005 500396
## 59 287640 497355
## 60 286057 492940
## 61 281423 488002
## 62 274628 482679
## 63 266802 475732
## 64 257983 466723
## 65 247861 454635
## 66 236810 440019
## 67 225403 424161
## 68 213573 407867
## 69 204202 395663
## 70 197330 388239
## 71 190961 382633
## 72 185373 378713
## Population.aged.40.to.49.years Population.aged.50.to.59.years
## 1 174778 118295
## 2 179540 121255
## 3 185119 124512
## 4 190890 127429
## 5 196440 129948
## 6 201340 132119
## 7 205468 134073
## 8 208884 136098
## 9 211662 138549
## 10 213808 141503
## 11 216437 146178
## 12 219759 153098
## 13 222570 160882
## 14 224769 168503
## 15 226760 175366
## 16 228906 181253
## 17 231342 186108
## 18 234084 189856
## 19 237281 192485
## 20 241167 194121
## 21 246385 196483
## 22 252529 200700
## 23 258524 205877
## 24 263998 211434
## 25 268929 216952
## 26 274385 222499
## 27 280645 228579
## 28 287024 234883
## 29 294105 240573
## 30 302990 245201
## 31 311676 249383
## 32 319763 253864
## 33 328838 258820
## 34 338896 263456
## 35 350018 267354
## 36 360788 272407
## 37 372309 278824
## 38 386292 284206
## 39 399592 288689
## 40 411148 295594
## 41 422628 303916
## 42 433382 311934
## 43 442507 321389
## 44 450772 332024
## 45 458631 343591
## 46 465442 355190
## 47 471188 367038
## 48 475732 380551
## 49 480222 393441
## 50 484852 405872
## 51 489365 418527
## 52 494093 428120
## 53 497996 435655
## 54 501545 443137
## 55 504997 449889
## 56 506900 454790
## 57 505977 457696
## 58 502725 459484
## 59 498464 460729
## 60 493841 462211
## 61 489765 464466
## 62 485959 467420
## 63 480878 470492
## 64 473927 473557
## 65 465471 476276
## 66 456746 477937
## 67 448962 477959
## 68 442449 476252
## 69 438076 472699
## 70 435107 468011
## 71 431698 463152
## 72 427758 458120
Ở bảng trên ta thấy được các thông tin về các nhóm tuổi và các năm tương ứng mà chúng ta đã chọn ra để phân tích ở trên của Puerto Rico
Việt Nam, quốc hiệu là Cộng hòa xã hội chủ nghĩa Việt Nam, là một quốc gia nằm ở cực Đông của bán đảo Đông Dương thuộc khu vực Đông Nam Á, giáp với Lào, Campuchia, Trung Quốc, biển Đông và vịnh Thái Lan.
Đầu tiên ta kiểm tra những thông tin cơ bản của quốc gia này
Ta xem có bao nhiêu quan sát của Vietnam trong bộ dữ liệu:
Vie <- q
Vie1 <- ifelse(Vie$Country == 'Vietnam', 'Vietnam', 'Nước khác')
table(Vie1)
## Vie1
## Nước khác Vietnam
## 18216 72
Ta thấy có 72 quan sát của Vietnam
library(dplyr)
Vie2 <- q %>% filter(Country=='Vietnam') %>% select(Country,Year,Population,Population.aged.20.to.29.years,Population.aged.15.to.19.years,Population.aged.30.to.39.years,Population.aged.40.to.49.years,Population.aged.50.to.59.years)
Vie2
## Country Year Population Population.aged.20.to.29.years
## 1 Vietnam 1950 25109200 4228608
## 2 Vietnam 1951 25627542 4284578
## 3 Vietnam 1952 26189598 4347634
## 4 Vietnam 1953 26820860 4413656
## 5 Vietnam 1954 27507460 4478421
## 6 Vietnam 1955 28263032 4537822
## 7 Vietnam 1956 29035684 4589387
## 8 Vietnam 1957 29884094 4633013
## 9 Vietnam 1958 30804086 4665492
## 10 Vietnam 1959 31750430 4680875
## 11 Vietnam 1960 32718462 4679971
## 12 Vietnam 1961 33621980 4663310
## 13 Vietnam 1962 34533890 4630429
## 14 Vietnam 1963 35526730 4591136
## 15 Vietnam 1964 36509172 4564732
## 16 Vietnam 1965 37466076 4564461
## 17 Vietnam 1966 38388220 4593591
## 18 Vietnam 1967 39282564 4655214
## 19 Vietnam 1968 40145292 4757907
## 20 Vietnam 1969 41015868 4974511
## 21 Vietnam 1970 41928850 5287348
## 22 Vietnam 1971 42916624 5590149
## 23 Vietnam 1972 43906020 5925347
## 24 Vietnam 1973 44891290 6298859
## 25 Vietnam 1974 45898700 6703900
## 26 Vietnam 1975 46969616 7148419
## 27 Vietnam 1976 48163580 7599916
## 28 Vietnam 1977 49418144 8114904
## 29 Vietnam 1978 50701460 8661920
## 30 Vietnam 1979 51831390 9074741
## 31 Vietnam 1980 52968270 9403469
## 32 Vietnam 1981 54280400 9718330
## 33 Vietnam 1982 55632150 9994489
## 34 Vietnam 1983 57011452 10293297
## 35 Vietnam 1984 58406864 10550498
## 36 Vietnam 1985 59811316 10748959
## 37 Vietnam 1986 61221108 10919485
## 38 Vietnam 1987 62630788 11007210
## 39 Vietnam 1988 64037520 11055749
## 40 Vietnam 1989 65466360 11127401
## 41 Vietnam 1990 66912616 11221194
## 42 Vietnam 1991 68358824 11425176
## 43 Vietnam 1992 69788750 11683841
## 44 Vietnam 1993 71176410 11921787
## 45 Vietnam 1994 72501090 12190125
## 46 Vietnam 1995 73759110 12501285
## 47 Vietnam 1996 74946456 12874449
## 48 Vietnam 1997 76058600 13290383
## 49 Vietnam 1998 77128424 13719862
## 50 Vietnam 1999 78123710 14127501
## 51 Vietnam 2000 79001144 14483125
## 52 Vietnam 2001 79817770 14790633
## 53 Vietnam 2002 80642300 15055157
## 54 Vietnam 2003 81475816 15263316
## 55 Vietnam 2004 82311230 15439871
## 56 Vietnam 2005 83142100 15600101
## 57 Vietnam 2006 83951800 15734694
## 58 Vietnam 2007 84762270 15844888
## 59 Vietnam 2008 85597230 15929809
## 60 Vietnam 2009 86482920 16016362
## 61 Vietnam 2010 87411016 16125880
## 62 Vietnam 2011 88349100 16239842
## 63 Vietnam 2012 89301330 16338180
## 64 Vietnam 2013 90267736 16406260
## 65 Vietnam 2014 91235500 16422823
## 66 Vietnam 2015 92191400 16362801
## 67 Vietnam 2016 93126530 16216320
## 68 Vietnam 2017 94033050 16004474
## 69 Vietnam 2018 94914330 15745344
## 70 Vietnam 2019 95776710 15447534
## 71 Vietnam 2020 96648680 15132400
## 72 Vietnam 2021 97468024 14810058
## Population.aged.15.to.19.years Population.aged.30.to.39.years
## 1 2520831 3480061
## 2 2514515 3510682
## 3 2477906 3542143
## 4 2422031 3575197
## 5 2370026 3614493
## 6 2333806 3663009
## 7 2310952 3716655
## 8 2303150 3770499
## 9 2312032 3825775
## 10 2336180 3887300
## 11 2375595 3955237
## 12 2432875 4029754
## 13 2508801 4110729
## 14 2615429 4192339
## 15 2824673 4264754
## 16 3113790 4322404
## 17 3360191 4368657
## 18 3628244 4406008
## 19 3922401 4427032
## 20 4149713 4428996
## 21 4327044 4417502
## 22 4535875 4400077
## 23 4769814 4364367
## 24 5000759 4314331
## 25 5212147 4278407
## 26 5408296 4275473
## 27 5548309 4311713
## 28 5630308 4386708
## 29 5735233 4506596
## 30 5748179 4705389
## 31 5713870 4989755
## 32 5776660 5274604
## 33 5817548 5600389
## 34 5793231 5984794
## 35 5802093 6406070
## 36 5859131 6855435
## 37 5981180 7291566
## 38 6174145 7775236
## 39 6409913 8287381
## 40 6650967 8719480
## 41 6883516 9080899
## 42 7099992 9399182
## 43 7285388 9680632
## 44 7438247 9983995
## 45 7591611 10247121
## 46 7761291 10458895
## 47 7943003 10650927
## 48 8137527 10764501
## 49 8328885 10843522
## 50 8499611 10931973
## 51 8598936 11035917
## 52 8620240 11255188
## 53 8607017 11526185
## 54 8575405 11775393
## 55 8541516 12049616
## 56 8516735 12350213
## 57 8504375 12692924
## 58 8496772 13065748
## 59 8473485 13434835
## 60 8423706 13781134
## 61 8312253 14103368
## 62 8102562 14399487
## 63 7822469 14659212
## 64 7515494 14867750
## 65 7227021 15050539
## 66 7012758 15223423
## 67 6893662 15376688
## 68 6858329 15511445
## 69 6879217 15626364
## 70 6930338 15732903
## 71 6979806 15847733
## 72 6997474 15962702
## Population.aged.40.to.49.years Population.aged.50.to.59.years
## 1 2887635 2027414
## 2 2910623 2090768
## 3 2932277 2161456
## 4 2953504 2233977
## 5 2978188 2301165
## 6 3009256 2361891
## 7 3044178 2416007
## 8 3082202 2461250
## 9 3123587 2499226
## 10 3166527 2534451
## 11 3210504 2569326
## 12 3255648 2603473
## 13 3301435 2636530
## 14 3346913 2667416
## 15 3392972 2697597
## 16 3441197 2728653
## 17 3490924 2759807
## 18 3539584 2792318
## 19 3584625 2822786
## 20 3633042 2852356
## 21 3689066 2884841
## 22 3754954 2920323
## 23 3823491 2953484
## 24 3889530 2986186
## 25 3949769 3022684
## 26 4003212 3067218
## 27 4055956 3122159
## 28 4104964 3179010
## 29 4143612 3236800
## 30 4163837 3304538
## 31 4167614 3378675
## 32 4154958 3453974
## 33 4126740 3536115
## 34 4093679 3620819
## 35 4073881 3698769
## 36 4078126 3764267
## 37 4108620 3819795
## 38 4168974 3867082
## 39 4272184 3902947
## 40 4482873 3922288
## 41 4781283 3926017
## 42 5060571 3915427
## 43 5380916 3890544
## 44 5759005 3861570
## 45 6174067 3845774
## 46 6619993 3853960
## 47 7057245 3888394
## 48 7542248 3951369
## 49 8056799 4056220
## 50 8487473 4262844
## 51 8856379 4559352
## 52 9195945 4845764
## 53 9498569 5173482
## 54 9821538 5558154
## 55 10103190 5979029
## 56 10326976 6427257
## 57 10521194 6863313
## 58 10633723 7343225
## 59 10705341 7848062
## 60 10786032 8271998
## 61 10876158 8621912
## 62 11068033 8923685
## 63 11311595 9187888
## 64 11536289 9472047
## 65 11787149 9716620
## 66 12065256 9905848
## 67 12386335 10067191
## 68 12738946 10153174
## 69 13090386 10204143
## 70 13424379 10273025
## 71 13741951 10364929
## 72 14035108 10554365
Ở bảng trên ta thấy được các thông tin về các nhóm tuổi và các năm tương ứng mà chúng ta đã chọn ra để phân tích ở trên của Vietnam
Zimbabwe là một quốc gia không giáp biển nằm ở phía nam lục địa Phi, bị kẹp giữa hai con sông Zambize và Limpopo.
Đầu tiên ta kiểm tra những thông tin cơ bản của quốc gia này
Ta xem có bao nhiêu quan sát của Zimbabwe trong bộ dữ liệu:
Zim <- q
Zim1 <- ifelse(Zim$Country == 'Zimbabwe', 'Zimbabwe', 'Nước khác')
table(Zim1)
## Zim1
## Nước khác Zimbabwe
## 18216 72
Ta thấy có 72 quan sát của Zimbabwe
library(dplyr)
Zim2 <- q %>% filter(Country=='Zimbabwe') %>% select(Country,Year,Population,Population.aged.20.to.29.years,Population.aged.15.to.19.years,Population.aged.30.to.39.years,Population.aged.40.to.49.years,Population.aged.50.to.59.years)
Zim2
## Country Year Population Population.aged.20.to.29.years
## 1 Zimbabwe 1950 2791336 443624
## 2 Zimbabwe 1951 2881722 452908
## 3 Zimbabwe 1952 2973720 463510
## 4 Zimbabwe 1953 3067904 474889
## 5 Zimbabwe 1954 3164515 486056
## 6 Zimbabwe 1955 3263631 496779
## 7 Zimbabwe 1956 3365481 507091
## 8 Zimbabwe 1957 3470499 516796
## 9 Zimbabwe 1958 3578808 526650
## 10 Zimbabwe 1959 3690646 538095
## 11 Zimbabwe 1960 3806312 551538
## 12 Zimbabwe 1961 3925958 566496
## 13 Zimbabwe 1962 4049778 583020
## 14 Zimbabwe 1963 4177936 601217
## 15 Zimbabwe 1964 4310332 620572
## 16 Zimbabwe 1965 4447152 640247
## 17 Zimbabwe 1966 4588526 659674
## 18 Zimbabwe 1967 4734700 678094
## 19 Zimbabwe 1968 4886355 693974
## 20 Zimbabwe 1969 5044170 719333
## 21 Zimbabwe 1970 5202923 754321
## 22 Zimbabwe 1971 5363424 788360
## 23 Zimbabwe 1972 5532846 823771
## 24 Zimbabwe 1973 5712708 860471
## 25 Zimbabwe 1974 5903535 898810
## 26 Zimbabwe 1975 6097086 935776
## 27 Zimbabwe 1976 6288395 970232
## 28 Zimbabwe 1977 6453047 992727
## 29 Zimbabwe 1978 6549350 985813
## 30 Zimbabwe 1979 6655837 975398
## 31 Zimbabwe 1980 7049931 1086409
## 32 Zimbabwe 1981 7506528 1217513
## 33 Zimbabwe 1982 7803863 1267210
## 34 Zimbabwe 1983 8106359 1302141
## 35 Zimbabwe 1984 8398574 1329293
## 36 Zimbabwe 1985 8690516 1371343
## 37 Zimbabwe 1986 8983048 1418330
## 38 Zimbabwe 1987 9277484 1445115
## 39 Zimbabwe 1988 9568745 1454028
## 40 Zimbabwe 1989 9846352 1494859
## 41 Zimbabwe 1990 10113899 1564069
## 42 Zimbabwe 1991 10377817 1642709
## 43 Zimbabwe 1992 10641504 1704611
## 44 Zimbabwe 1993 10794921 1739783
## 45 Zimbabwe 1994 10858598 1784590
## 46 Zimbabwe 1995 10994044 1861297
## 47 Zimbabwe 1996 11178171 1957515
## 48 Zimbabwe 1997 11362406 2051553
## 49 Zimbabwe 1998 11548365 2140997
## 50 Zimbabwe 1999 11716452 2218487
## 51 Zimbabwe 2000 11834679 2281479
## 52 Zimbabwe 2001 11910981 2343307
## 53 Zimbabwe 2002 11984643 2410372
## 54 Zimbabwe 2003 12075835 2472868
## 55 Zimbabwe 2004 12160885 2514921
## 56 Zimbabwe 2005 12224758 2532241
## 57 Zimbabwe 2006 12330490 2553585
## 58 Zimbabwe 2007 12450566 2565910
## 59 Zimbabwe 2008 12550353 2551770
## 60 Zimbabwe 2009 12679812 2530393
## 61 Zimbabwe 2010 12839774 2497805
## 62 Zimbabwe 2011 13025789 2450082
## 63 Zimbabwe 2012 13265331 2411708
## 64 Zimbabwe 2013 13555420 2392891
## 65 Zimbabwe 2014 13855758 2381208
## 66 Zimbabwe 2015 14154937 2378487
## 67 Zimbabwe 2016 14452705 2390834
## 68 Zimbabwe 2017 14751101 2422873
## 69 Zimbabwe 2018 15052191 2474502
## 70 Zimbabwe 2019 15354606 2546398
## 71 Zimbabwe 2020 15669663 2640150
## 72 Zimbabwe 2021 15993525 2749147
## Population.aged.15.to.19.years Population.aged.30.to.39.years
## 1 277021 332573
## 2 282771 340720
## 3 288957 347770
## 4 295904 353958
## 5 304128 359770
## 6 313520 365549
## 7 323824 371075
## 8 335278 376399
## 9 347683 381912
## 10 360074 388061
## 11 371782 395048
## 12 382491 403039
## 13 391169 412258
## 14 396336 422219
## 15 411004 431958
## 16 439098 441237
## 17 469908 450053
## 18 503347 458222
## 19 540860 466500
## 20 569949 476302
## 21 584699 485750
## 22 596335 494369
## 23 608819 504604
## 24 622472 516820
## 25 637762 530907
## 26 653007 543936
## 27 667451 554145
## 28 674907 553414
## 29 664190 526637
## 30 657253 508861
## 31 730724 590718
## 32 821159 694158
## 33 866690 748533
## 34 909322 796769
## 35 948746 837938
## 36 990844 881279
## 37 1031859 923741
## 38 1067388 956651
## 39 1101138 980106
## 40 1145736 1000018
## 41 1198186 1014562
## 42 1251971 1029384
## 43 1299021 1036687
## 44 1327241 1022106
## 45 1346756 1001969
## 46 1383093 1003168
## 47 1440830 1022279
## 48 1505994 1047880
## 49 1571752 1079658
## 50 1629398 1112689
## 51 1660173 1139807
## 52 1656029 1160691
## 53 1628241 1185023
## 54 1584979 1219451
## 55 1528294 1258588
## 56 1468533 1297812
## 57 1427398 1347284
## 58 1400666 1398567
## 59 1379165 1441326
## 60 1371508 1483814
## 61 1373274 1533175
## 62 1384039 1597855
## 63 1412148 1677633
## 64 1456881 1764416
## 65 1512159 1846360
## 66 1575411 1917413
## 67 1637915 1975539
## 68 1690993 2021973
## 69 1732035 2058928
## 70 1759205 2085636
## 71 1776240 2101852
## 72 1787185 2104434
## Population.aged.40.to.49.years Population.aged.50.to.59.years
## 1 226500 162774
## 2 230389 165924
## 3 234138 169082
## 4 238202 172239
## 5 243372 175356
## 6 249782 178398
## 7 257548 181436
## 8 266724 184546
## 9 276539 187692
## 10 285836 190869
## 11 294032 194205
## 12 301220 197594
## 13 307396 200869
## 14 312790 204441
## 15 317849 209001
## 16 322885 214660
## 17 327686 221531
## 18 332288 229627
## 19 337052 238261
## 20 342383 246400
## 21 349271 255904
## 22 357648 266583
## 23 366703 275770
## 24 375971 283626
## 25 384631 290575
## 26 392611 298287
## 27 399703 306946
## 28 405578 320140
## 29 410319 344232
## 30 412944 364802
## 31 412415 336506
## 32 416898 305146
## 33 429048 308627
## 34 444938 316309
## 35 463489 327127
## 36 482715 335790
## 37 503250 344197
## 38 526062 355946
## 39 548539 370731
## 40 576309 381545
## 41 612311 389922
## 42 648122 398715
## 43 684183 411872
## 44 714672 426427
## 45 736036 437375
## 46 753160 447123
## 47 766501 455428
## 48 776850 462303
## 49 785383 466020
## 50 782214 474714
## 51 765929 490421
## 52 744552 503470
## 53 723327 514418
## 54 705095 527353
## 55 689015 542324
## 56 677808 556664
## 57 673279 565453
## 58 675418 571978
## 59 683789 580590
## 60 699413 582897
## 61 722535 578715
## 62 753573 574890
## 63 792769 569692
## 64 840376 563027
## 65 895661 558417
## 66 956820 557618
## 67 1021953 561630
## 68 1088878 570769
## 69 1155537 585529
## 70 1220993 606266
## 71 1291333 631541
## 72 1371770 658660
Ở bảng trên ta thấy được các thông tin về các nhóm tuổi và các năm tương ứng mà chúng ta đã chọn ra để phân tích ở trên của Zimbabwe
Để so sánh, xếp hạng và đánh giá giá trị sản xuất nông nghiệp của các quốc gia
Sử dụng giá trị trung bình để so sánh giá trị giữa các quốc gia
Đây là bộ dữ liệu về giá trị sản xuất của 4 sản phẩm cà phê, gạo, đường, thịt heo của 4 quốc gia có nền nông nghiệp tiên tiến và Việt Nam: Việt Nam, Mỹ, Trung Quốc, Đức, Nhật Bản từ năm 2000 đến năm 2021. Bộ dữ liệu được lấy từ Faostat. Đơn vị của giá trị sản xuất là 1000 USD
Sau đây ta sẽ tiến hành đọc dữ liệu và xem dữ liệu có những gì
# Lệnh đọc dữ liệu với file dữ liệu là csv
agr <- read.xlsx("D:/T.LONG/FAOSTAT_data_en_1-27-2024-4.xlsx", sheetIndex = 1, header = 1)
Ta sẽ dùng lệnh str để xem cấu trúc của dữ liệu
# Lệnh cho biết cấu trúc của bộ dữ liệu
str(agr)
## 'data.frame': 274 obs. of 14 variables:
## $ Domain.Code : chr "QV" "QV" "QV" "QV" ...
## $ Domain : chr "Value of Agricultural Production" "Value of Agricultural Production" "Value of Agricultural Production" "Value of Agricultural Production" ...
## $ Area.Code..M49. : num 159 159 159 159 159 159 159 159 159 159 ...
## $ Area : chr "China" "China" "China" "China" ...
## $ Element.Code : num 57 57 57 57 57 57 57 57 57 57 ...
## $ Element : chr "Gross Production Value (current thousand US$)" "Gross Production Value (current thousand US$)" "Gross Production Value (current thousand US$)" "Gross Production Value (current thousand US$)" ...
## $ Item.Code..CPC. : chr "01610" "01610" "01610" "01610" ...
## $ Item : chr "Coffee, green" "Coffee, green" "Coffee, green" "Coffee, green" ...
## $ Year.Code : num 2010 2011 2012 2013 2000 ...
## $ Year : num 2010 2011 2012 2013 2000 ...
## $ Unit : chr "1000 USD" "1000 USD" "1000 USD" "1000 USD" ...
## $ Value : num 160283 239316 357327 307350 42206142 ...
## $ Flag : chr "E" "E" "E" "E" ...
## $ Flag.Description: chr "Estimated value" "Estimated value" "Estimated value" "Estimated value" ...
Ta sẽ giải thích kết quả mà câu lệnh đã trả:
sum(is.na(agr))
## [1] 0
Với kết quả trên thì bộ dữ liệu không có giá trị thiếu
Ở bộ dữ liệu trên ta chỉ cần lấy các biến như: Tên quốc gia, năm quan sát, tên sản phẩm, giá trị sản phẩm. Ta sẽ dùng package tidyverse để thực hiện các thao tác về sau
# Lệnh chọn ra biến cần thiết
library(tidyverse)
## ── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
## ✔ forcats 1.0.0 ✔ readr 2.1.5
## ✔ ggplot2 3.4.4 ✔ stringr 1.5.1
## ✔ lubridate 1.9.3 ✔ tibble 3.2.1
## ✔ purrr 1.0.2 ✔ tidyr 1.3.0
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag() masks stats::lag()
## ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors
agr1 <- agr %>% select(Area,Year,Item,Value)
Bộ dữ liệu đang có dạng là long table ta sẽ chuyển dữ liệu về wide table để tiện cho việc phân tích. Ta chuyển các giá trị ở cột Item thành cột và có giá trị là Value
agr1 <- agr1 %>% spread(key = Item, value = Value)
names(agr1)
## [1] "Area"
## [2] "Year"
## [3] "Coffee, green"
## [4] "Meat of pig with the bone, fresh or chilled"
## [5] "Rice"
## [6] "Sugar cane"
Ta sẽ tiến hành đổi tên các biến để dễ dàng thao tác hơn
# Lệnh đổi tên các cột
agr1 <- agr1 %>% rename(Quốc_gia=Area,
Năm=Year,
Cà_phê="Coffee, green",
Thịt_heo="Meat of pig with the bone, fresh or chilled",
Gạo="Rice",
Đường= "Sugar cane")
Ta sẽ nhóm các năm thành thập niên rùi gán nhãn cho chúng, sẽ có 2 thập niên là 2000s ứng từ năm 2000 đến năm 2009 và 2010s ứng từ năm 2010 đến năm 2021. Ta sẽ dùng lệnh case_match để thực hiện việc gán nhãn
agr1$TNiên <- agr1$Năm %>% case_match(2000:2009 ~ "2000s",
2010:2021 ~ "2010s")
Ta tiếp tực tạo bảng tần số theo biến TNiên và biến Item của bộ dữ liệu gốc. Và dùng package DT để tạo ra 1 bảng có tên cột và tên của bảng
agr$TNiên <- agr$Year %>% case_match(2000:2009 ~ "2000s",
2010:2021 ~ "2010s")
ts <- agr %>% group_by(TNiên,Item) %>% summarise(n=n())
## `summarise()` has grouped output by 'TNiên'. You can override using the
## `.groups` argument.
library(DT)
datatable(ts, rownames = F,colnames = c("Thập niên","Sản phẩm","Tần số"),
caption = "Bảng 1: Bảng tần số theo thập niên và sản phẩm")
Ta sẽ giải thích kết quả trên:
Ta sẽ tiến hành tính giá trị sản xuất trung bình sản phẩm mỗi quốc gia. Ta sẽ dùng lệnh across lồng vào summarise để tính trung bình nhiều biến.
gttb <- agr1 %>% group_by(Quốc_gia) %>% summarise(across(c("Cà_phê","Thịt_heo",
"Gạo","Đường"),~mean(.x,na.rm = TRUE)))
datatable(gttb, rownames = F,colnames = c("Quốc gia",
"Cà phê",
"Thịt heo",
"Gạo",
"Đường"),
caption = "Bảng 2: Bảng giá trị trung bình của các sản phẩm")
Thông qua kết quả trên cho ta thấy được Trung Quốc mạnh về phần nông nghiệp hơn Mỹ, Việt Nam cũng có sự cạnh tranh về nông nghiệp với các nước đang có nền công nghiệp tiên tiến. Đánh giá trên là khách quan có thể xảy ra sai sót vì sau khi chuyển sau long table đã có dữ liệu bị thiếu, đây là hạn chế của bộ dữ liệu này.