1. Tóm tắt bộ dữ liệu

  • Ước tính dân số thế giới của Cục điều tra dân số Hoa Kỳ vào tháng 6 năm 2019 cho thấy dân số toàn cầu hiện tại là 7.577.130.400 người trên trái đất, vượt xa dân số thế giới 7,2 tỷ người năm 2015.

  • Sự gia tăng dân số này sẽ bị ảnh hưởng đáng kể bởi chín quốc gia cụ thể có xu hướng đóng góp vào tăng trưởng dân số nhanh hơn so với các quốc gia khác. Các quốc gia này bao gồThế giới đang phải đối mặt với quá trình già hóa dân số, điều này ảnh hưởng đáng kể đến khả năng duy trì tỷ lệ hỗ trợ dân số. Một kết quả quan trọng từ năm 2017 là hầu hết các quốc gia trên thế giới sẽ đối mặt với sự tăng trưởng đáng kể trong nhóm tuổi từ 60 trở lên. Điều này đặt áp lực lớn lên nhóm tuổi trẻ vì dân số người cao tuổi trở nên quá lớn mà không có đủ số lượng sinh để duy trì tỷ lệ hỗ trợ khỏe mạnh.

Chi tiết các biến có trong bộ dữ liệu:

Bộ dữ liệu có 234 quan sát và 15 biến

  • CCA3 : Mã quốc gia/vùng lãnh thổ gồm 3 chữ số

  • Name : Tên quốc gia/vùng lãnh thổ

  • 2022 : Dân số của Quốc gia/Vùng lãnh thổ vào năm 2022.

  • 2020 : Dân số của Quốc gia/Vùng lãnh thổ vào năm 2020.

  • 2015 : Dân số của Quốc gia/Vùng lãnh thổ vào năm 2015.

  • 2010 : Dân số của Quốc gia/Vùng lãnh thổ vào năm 2010.

  • 2000 : Dân số của Quốc gia/Vùng lãnh thổ vào năm 2000.

  • 1990 : Dân số của Quốc gia/Vùng lãnh thổ vào năm 1990.

  • 1980 : Dân số của Quốc gia/Vùng lãnh thổ vào năm 1980.

  • 1970 : Dân số của Quốc gia/Vùng lãnh thổ vào năm 1970.

  • Area (km²) : Diện tích của Quốc gia/Vùng lãnh thổ tính bằng km vuông.

  • Density (per km²) : Mật độ dân số trên km vuông.

  • Growth Rate : Tỷ lệ tăng trưởng dân số theo quốc gia/vùng lãnh thổ.

  • World Population Percentage : Tỷ lệ dân số theo từng quốc gia/vùng lãnh thổ.

  • Rank : Xếp hạng theo dân số

d <- read.csv("D:/Ngôn Ngữ Lập Trình/Nhiệm vụ 5/World Population Live Dataset.csv")
dim(d)
## [1] 234  15

2. Biểu đồ

2.1. Biểu đồ cột dân số 10 nước đứng top 10

d1 <- d[d$Rank <= 10,]
d1 %>% ggplot(aes(x = Name, y = X2022)) +
  geom_bar(stat = "identity", fill = "pink") +
  geom_text(aes(label = round(X2022)), vjust = 2, color = 'white')+
  labs(title = "Biểu đồ dân số năm 2022",x = "Nước",y = "Số dân")

  • China có số dân cao nhất năm 2022 là 1425887 triệu người.

  • India có số dân cao thứ 2 là 1417173 triệu người

  • Mexico có số dân thấp nhất là 127504 triệu người.

2.2. Mật độ dân số của các quốc gia thuộc top 10

d1 %>% ggplot(aes(x = Name, y = Density..per.km..,fill = Name))+ 
  geom_bar(stat = "identity") +
  labs(x = "Quốc gia", y = "Mật độ dân số", title = "Mật độ dân số của các quốc gia hàng đầu") +
  geom_text(aes(label = round(Density..per.km..,3)), vjust = 2, color = 'red')+
  theme(axis.text.x = element_text(angle = 45, hjust = 1))

  • Bangladesh có mật độ dân số khoảng 1160 người/km vuông, mật độ dân số cao.

  • Ngược lại, Russia lại có mật đô dân số thấp khoảng 8 người/km vuông.

  • Trong 2 nước có dân số đông, India lại có mật độ dân số cao hơn China khoảng 2.9 lần.

2.3: Tỷ lệ tăng trưởng dân số của các quốc gia

d1 %>%ggplot(aes(x = Name, y = GrowthRate, fill = Name)) +
  geom_bar(stat = "identity") +
  labs(x = "Quốc gia", y = "Tỷ lệ tăng trưởng dân số", title = "Tỷ lệ tăng trưởng dân số của các quốc gia ") +
  geom_text(aes(label = round(GrowthRate,3)), vjust = 2, color = 'red')+
  theme(axis.text.x = element_text(angle = 45, hjust = 1))

  • Tỷ lệ tăng trường các nước không có sự biến động nhiều. Trong đó, biểu đồ dự báo Nigeria và Pakistan sẽ có mức độ tăng trưởng cao hơn so với các nước còn lại là 1.02.

2.4.Phần trăm dân số thế giới của các quốc gia

d1 %>% ggplot( aes(x = Name, y = World.Population.Percentage, fill = Name)) +
  geom_bar(stat = "identity") +
  labs(x = "Quốc gia", y = "Phần trăm dân số thế giới", title = "Phần trăm dân số thế giới của các quốc gia ") +
  theme(axis.text.x = element_text(angle = 45, hjust = 1))

  • Phần trăm dân số thế giới của United States cao nhất so với các nước khoảng 4.24%. Sau đó là Indonesia khoảng 3.45%. Ngược lại Mexico có phần trăm dân số thấp nhất khoảng 1.6%.

2.5.Diện tích của các quốc gia

d1 %>%ggplot(aes(x = Name, y = Area..km.., fill = Name)) +
  geom_bar(stat = "identity") +
  labs(x = "Quốc gia", y = "Diện tích (km²)", title = "Diện tích của các quốc gia ") +
   geom_text(aes(label = round(Area..km..,3)), vjust = 2, color = 'black')+
  theme(axis.text.x = element_text(angle = 45, hjust = 1))

  • Trung Quốc (China): Diện tích là 9.706.961 km².

  • Ấn Độ (India): Diện tích là 3.287.590 km².

  • Hoa Kỳ (United States): Diện tích là 9.372.610 km².

  • Indonesia: Diện tích là 1.904.569 km².

  • Pakistan: Diện tích là 881.912 km².

  • Nigeria: Diện tích là 923.768 km².

  • Brazil: Diện tích là 8.515.767 km².

  • Bangladesh: Diện tích là 147.570 km².

  • Nga (Russia): Diện tích là 17.098.242 km².

  • Mexico : Diện tích là 964.375 km².

2.6.Biểu đồ cho diện tích một số quốc gia ở ĐNÁ

d3 <- d%>% filter(Name %in% c('Indonesia','Philippines','Vietnam','Thailand', 'Myanmar','Laos','Singapore','Brunei'))
d3 %>% ggplot(aes(x = " ", y = Area..km.., fill = Name)) +
  geom_bar(stat = "identity") +
  coord_polar("y",) +
  labs(title = "Biểu đồ diện tích một số nước ĐNÁ",fill = "Quốc gia",x = NULL, y = NULL) +
  theme_minimal() +
  geom_text(aes(label = paste0(round(Area..km.. / sum(Area..km..) * 100, 1), "%")),position = position_stack(vjust = 0.5),size = 4)

  • Indonesia có diện tích cao nhất so với các nước khác trong khu vực.

  • Trong khi đó, Brunei có diện tích thấp nhất.

  • Vietnam có diện tích là 8.3%

2.7. Biểu đồ mật độ dân số của một số quốc gia thuộc ĐNÁ

d3 %>% ggplot(aes(x = "", y = Density..per.km.., fill = Name)) +
  geom_bar(stat = "identity") +
  coord_polar("y", start = 0) +
  labs(title = "Biểu đồ mật độ dân số của một số nước ĐNÁ",fill = "Quốc gia",x = NULL, y = NULL) +
  theme_minimal() +
  geom_text(aes(label = paste0(round(Density..per.km.. / sum(Density..per.km..) * 100, 1), "%")),
            position = position_stack(vjust = 0.5),
            size = 4)

  • Mật độ dân số của Singapore là cao nhất 88.4%

2.8. Biểu đồ Histogram Population_2022

d %>% ggplot(aes(x = X2022)) +
  geom_histogram(binwidth = 10000, fill = 'lightgreen',color='black') +
  labs(title = "Histogram of Population 2022",x = "Population",y = "Frequency")

2.9. Biểu đồ Density Population_2022

d %>% ggplot(aes(x = X2022)) +
  geom_density(fill = 'lightblue')+
   labs(title = "Density of Population 2022",x = "Population",y = "Frequency")

  • Dân số năm 2022 của các nước có sự biến động mạnh.

2.10. Biểu đồ Histogram Area

d %>% ggplot(aes(x = Area..km..)) +
  geom_histogram(binwidth = 500000, fill = "lightgreen", color = "black") +
  labs(title = "Histogram of Area", x = "Area (km²)",y = "Frequency")

2.11. Biểu đồ Density Area

d %>% ggplot(aes(x = Area..km..)) +
  geom_density(fill = 'lightblue')+
   labs(title = "Density of Area",x = "Area (km²)",y = "Frequency")

  • Diện tích các nước có sự chênh lệch lớn do đó dựa vào số dân và diện tích ta có thể thấy được mật độ dân số các nước đều có sự khác biệt rõ ràng và từ đó có thể suy đoán rằng dân số các nước ở những năm 2023,2024 và về sau nữa đều sẽ tăng trưởng mạnh nhưng diện tích không đổi do đó mật độ dân số ngày một đông. Trong khi đó điều kiện y tế phát triển số người lớn tuổi cao, nguy cơ già hóa dân số toàn cầu.

2.12. Biểu đồ Histogram Density

d %>% ggplot( aes(x = Density..per.km..)) +
  geom_histogram(binwidth = 100, fill = "red", color = "black") +
  labs(title = "Histogram of Density",
       x = "Density (per km²)",
       y = "Frequency")

  • Mật độ dân số các nước đều có sự chênh lệch và mật độ ở các nước đứng đầu danh sách đều dày đặc.

2.13. Biểu đồ scatterplot cho dữ liệu Population_2022 và Area

d %>% ggplot(aes(x = X2022, y = Area..km..)) +
  geom_point(color = "purple") +
  labs(title = "Scatterplot of Population 2022 and Area",
       x = "Population",
       y = "Area (km²)")

  • Biểu đồ scatterplot cho dữ liệu Population_2022 và Area cho thấy mối quan hệ giữa dân số và diện tích của các quốc gia trong bộ dữ liệu.

  • Nhìn vào biểu đồ, chúng ta có thể thấy rằng các điểm dữ liệu được phân tán trên không gian biểu đồ một cách ngẫu nhiên. Điều này cho thấy không có một mẫu quy luật rõ ràng về mối quan hệ giữa dân số và diện tích.

  • Tuy nhiên, chúng ta có thể nhận thấy rằng có một số quốc gia có diện tích nhỏ và dân số lớn, trong khi một số quốc gia khác có diện tích lớn nhưng dân số thấp hơn. Điều này cho thấy rằng không chỉ diện tích mà còn các yếu tố khác có thể ảnh hưởng đến mật độ dân số của mỗi quốc gia.

2.14. Biểu đồ scatterplot cho dữ liệu Population_2022 và Density

d %>% ggplot(aes(x = X2022, y = Density..per.km..)) +
  geom_point(color = "green") +
  labs(title = "Scatterplot of Population 2022 and Density",
       x = "Population",
       y = "Density (per km²)")

  • Biểu đồ scatterplot cho dữ liệu Population_2022 và Density thể hiện mối quan hệ giữa dân số và mật độ dân số của các quốc gia trong bộ dữ liệu.

  • Có một số quốc gia có dân số lớn và mật độ dân số cao, trong khi một số quốc gia khác có dân số lớn nhưng mật độ dân số thấp hơn. Điều này chỉ ra rằng mật độ dân số không chỉ phụ thuộc vào dân số mà còn phụ thuộc vào các yếu tố khác như diện tích.

2.15. Biểu đồ scatterplot cho dữ liệu Area và Density

d %>% ggplot(aes(x = Area..km.., y = Density..per.km..)) +
  geom_point(color = "red") +
  labs(title = "Scatterplot of Area and Density",
       x = "Area (km²)",
       y = "Density (per km²)")

  • Chúng ta có thể nhận thấy một số quốc gia có diện tích nhỏ và mật độ dân số cao, trong khi một số quốc gia khác có diện tích lớn nhưng mật độ dân số thấp hơn. Điều này cho thấy rằng mật độ dân số không chỉ phụ thuộc vào diện tích mà còn phụ thuộc vào các yếu tố khác như dân số và các yếu tố địa lý khác.

  • Ngoài ra, biểu đồ cũng cho thấy rằng có một số quốc gia có mật độ dân số rất cao với diện tích nhỏ, trong khi có một số quốc gia khác có diện tích lớn nhưng mật độ dân số thấp hơn. Điều này có thể chỉ ra sự khác biệt về sự phân bố dân số và diện tích giữa các quốc gia.

  • Tuy nhiên, để hiểu rõ hơn về mối quan hệ giữa diện tích và mật độ dân số, cần xem xét thêm các yếu tố khác như dân số, cơ cấu dân số, và các yếu tố kinh tế, xã hội khác của từng quốc gia. Điều này giúp ta có cái nhìn tổng quan và chi tiết hơn về mối quan hệ này trong bộ dữ liệu.

2.16. Biểu đồ đường thể hiện mật độ dân số của các quốc gia ĐNÁ

d3 %>% ggplot( aes(x = Name, y = Density..per.km..)) +
  geom_line() +
  geom_point() +
  labs(title = "Population Density of Countries", x = "Country", y = "Density (per km²)") +
  theme_minimal()

  • Nhìn vào biểu đồ, chúng ta có thể thấy rằng Philippines có mật độ dân số cao nhất, tiếp theo là Vietnam và Indonesia. Thái Lan và Myanmar có mật độ dân số thấp hơn so với các quốc gia khác trong số này.

  • Biểu đồ sử dụng các điểm để biểu thị dữ liệu từng quốc gia cụ thể, trong khi đường thẳng nối các điểm giúp chúng ta nhìn thấy xu hướng tổng quan của mật độ dân số.

2.17. Biểu đồ cột đối chiếu diện tích các quốc gia ĐNÁ

d3 %>% ggplot(aes(x = Name, y = Area..km..)) +
  geom_bar(stat = "identity", fill = "steelblue") +
  labs(title = "Comparison of Country Areas", x = "Country", y = "Area (km²)") +
  theme_minimal()

  • Qua biểu đồ, chúng ta có thể nhìn thấy rằng Indonesia có diện tích lớn nhất trong số các quốc gia được so sánh, tiếp theo là Myanmar, Thailand, Philippines và Vietnam.

2.18. Biểu đồ cột thể hiện tỷ lệ tăng trưởng dân số của các quốc gia ĐNÁ

d3 %>% ggplot(aes(x = Name, y = GrowthRate)) +
  geom_bar(stat = "identity", fill = "steelblue") +
  labs(title = "Population Growth Rate of Countries", x = "Country", y = "Growth Rate") +
  theme_minimal()

  • Dựa vào biểu đồ, chúng ta có thể nhận thấy rằng Indonesia, Philippines và Vietnam có tỷ lệ tăng trưởng dân số cao nhất trong số các quốc gia được so sánh. Thái Lan và Myanmar có tỷ lệ tăng trưởng dân số thấp hơn so với các quốc gia khác trong nhóm này.

2.19. Biểu đồ cột thể hiện tỉ lệ dân số của các quốc gia ĐNÁ

d3 %>% ggplot(aes(x = Name, y = World.Population.Percentage)) +
  geom_bar(stat = "identity", fill = "steelblue") +
  labs(title = "World Population Percentage Rank of Countries", x = "Country", y = "Rank") +
  theme_minimal()

  • Dựa vào biểu đồ, chúng ta có thể nhìn thấy rằng Indonesia có dân số chiếm phần trăm lớn nhất trên thế giới trong số các quốc gia được so sánh. Philippines và Vietnam cũng có dân số chiếm phần trăm khá cao. Brunei và Singapore có dân số chiếm phần trăm thấp hơn so với các quốc gia khác trong nhóm này.

2.20. Biểu đồ cột thể hiện diện tích và mật độ dân số của các quốc gia ĐNÁ

d3 %>% ggplot(aes(x = Name)) +
  geom_col(aes(y = Area..km..), fill = "steelblue", width = 0.4, position = "dodge") +
  geom_line(aes(y = Density..per.km.. * 5000), color = "red", size = 1, group = 1) +
  labs(title = "Comparison of Area and Population Density", x = "Country", y = "Area / Density") +
  scale_y_continuous(sec.axis = sec_axis(~./5000, name = "Density (per km²)")) +
  theme_minimal() +
  theme(axis.text.x = element_text(angle = 45, hjust = 1))

  • Dựa vào biểu đồ, chúng ta có thể thấy rằng Indonesia có diện tích lớn nhất trong số các quốc gia được so sánh, trong khi Philippines có mật độ dân số cao nhất. Vietnam và Thailand có diện tích tương đối lớn, nhưng mật độ dân số thấp hơn so với Indonesia và Philippines. Myanmar có diện tích và mật độ dân số thấp nhất trong số các quốc gia này.
