Pengerjaan dan visualisasi data kepengangguran di Dunia

Inputasi Data dan melihat susunan data

library(readr)
datakuis <- read_csv("/Users/pramudityadevanantagmail.com/Downloads/dataset_unemployment_2025_multicountry.csv")
## Rows: 30 Columns: 11
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ","
## chr (2): continent, country
## dbl (9): year, unemployment_rate, youth_unemployment, gdp_per_capita, inflat...
## 
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
datakuis 
## # A tibble: 30 × 11
##    continent country    year unemployment_rate youth_unemployment gdp_per_capita
##    <chr>     <chr>     <dbl>             <dbl>              <dbl>          <dbl>
##  1 Asia      Indonesia  2025               5                 12.5           5200
##  2 Asia      Malaysia   2025               3.2                9            13200
##  3 Asia      Thailand   2025               1                  4.2           8100
##  4 Asia      Philippi…  2025               5.5               13.5           4200
##  5 Asia      Vietnam    2025               2.5                7.5           4500
##  6 Asia      India      2025               6.8               18             3000
##  7 Asia      China      2025               4                 11            13000
##  8 Europe    Germany    2025               3                  6.5          48000
##  9 Europe    France     2025               7.5               16            42000
## 10 Europe    Italy      2025               8.5               20            35000
## # ℹ 20 more rows
## # ℹ 5 more variables: inflation <dbl>, labor_force_participation <dbl>,
## #   population <dbl>, education_index <dbl>, informal_employment <dbl>
## spc_tbl_ [30 × 11] (S3: spec_tbl_df/tbl_df/tbl/data.frame)
##  $ continent                : chr [1:30] "Asia" "Asia" "Asia" "Asia" ...
##  $ country                  : chr [1:30] "Indonesia" "Malaysia" "Thailand" "Philippines" ...
##  $ year                     : num [1:30] 2025 2025 2025 2025 2025 ...
##  $ unemployment_rate        : num [1:30] 5 3.2 1 5.5 2.5 6.8 4 3 7.5 8.5 ...
##  $ youth_unemployment       : num [1:30] 12.5 9 4.2 13.5 7.5 18 11 6.5 16 20 ...
##  $ gdp_per_capita           : num [1:30] 5200 13200 8100 4200 4500 3000 13000 48000 42000 35000 ...
##  $ inflation                : num [1:30] 2.8 2.5 2 3.2 2.6 4.5 2.3 2.2 2.5 2.7 ...
##  $ labor_force_participation: num [1:30] 69 70 71.5 66.5 72 65 67.5 75 71 69 ...
##  $ population               : num [1:30] 288 35.5 73 115 99 1410 1420 84 65 60 ...
##  $ education_index          : num [1:30] 0.71 0.81 0.77 0.69 0.75 0.64 0.78 0.88 0.87 0.85 ...
##  $ informal_employment      : num [1:30] 54 30 46 57 52 75 40 15 18 22 ...
##  - attr(*, "spec")=
##   .. cols(
##   ..   continent = col_character(),
##   ..   country = col_character(),
##   ..   year = col_double(),
##   ..   unemployment_rate = col_double(),
##   ..   youth_unemployment = col_double(),
##   ..   gdp_per_capita = col_double(),
##   ..   inflation = col_double(),
##   ..   labor_force_participation = col_double(),
##   ..   population = col_double(),
##   ..   education_index = col_double(),
##   ..   informal_employment = col_double()
##   .. )
##  - attr(*, "problems")=<externalptr>
plot(datakuis$unemployment_rate, datakuis$education_index, type = "p", 
     main = "Bukti Hubungan Pendidikan dengan Pengangguran",
     xlab = "Tingkat Pengangguran",
     ylab = "Indeks Pendidikan")

Kesimpulan

grafik diatas membuktikan adanya hubungan antara pendidikan dengan tingkat pengangguran.

dapat dilihat bahwa dengan semakin tingginya tingkat pengangguran dipengaruhi oleh rendahnya indeks pendidikan namun, semakin tingginya indeks pendidikan dapat membantu mengurangi dalam tingginya tingkat pengangguran.

Melakukan Visualisasi

xyplot(population~youth_unemployment, groups = continent, data = datakuis)

1. Scatterplot
digunakan untuk melihat hubungan antara variabel yang ada dengan tetap memperhatikan setiap karakteristik variabel yang berbeda-beda

xyplot(population~youth_unemployment| factor(continent), data = datakuis,groups = country,
       panel = function(x,y){
         panel.lmline(x,y)
         panel.abline(v = 20, lty = "dashed")
         panel.text(19.5, 500, "batas kedewasaan", adj = c(1,0), cex = 0.7)
       })

### Kesimpulan

berdasarkan pernyataan masyarakat secara umum bahwa umur legalitas dan dapat diterimanya seseorang bekerja secara global adalah pada umur 18 tahun maka ini memnunjukkan suatu kekhawatiran baru dimana :
1. Pada Asia kita dapat melihat bahwa banyak anak underage yang sudah bekerja pada kisaran umur 18 kebawah hingga 5 tahun yang membuat ini menjadi sedikit lebih prihatin
2. Pada America menunjukkan bahwa tingkat pengangguran menurun di mulai dari umur 20 yang menunjukkan pemerintah dapat menangani pengangguran di masa remaja dan dapat memanfaatkan ketersediaan SDM yang ada
3. Pada Africa justru sebaliknya dia memiliki nilai kenaikan akan tetapi tidak setinggi Asia yang mungkin bisa dipengaruhi seberapa banyak masyarakat secara keseluruhan dari Africa itu sendiri
4. Benua Eropa memiliki nilai yang paling baik dimana kenaikan dan kelonjakan tidak cukup terasa baik pada umur berapapun dan melihat dari jumlah masyarakat yang cukup padat ini bisa diartikan bahwa ketenagakerjaan eropa sudah sangat mumpuni dan mampu memanfaatkan SDM yang ada dengan baik
5. Benua Oceania memiliki nilai yang sama baiknya namun berdasarkan tingkat kependudukan yang tidak cukup tinggi maka kita bisa simpulkan bahwa sebagai benua yang dihuni oleh negara berkembang, oceania sudah cukup baik.

xyplot(unemployment_rate~education_index | factor(continent), data = datakuis, groups = country)

ggplot(data = datakuis,mapping =  aes(x =youth_unemployment, fill = continent))+
  geom_bar()

Kesimpulan

ini menunjukkan bahwa pada tingkat umur yang rendah Asia dan Amerika stabil mengalami kebutuhan lapangan pekerjaan yang dimaan bisa kita lihat mulai dari angka 5 di sumbu X yang terwakili oleh Asia dan juga pada setelah legalitas pada umur 20 amerika memiliki jumlah pengangguran yang masih bernilai

ggplot(datakuis, aes(x = continent))+
  geom_boxplot(aes(y=informal_employment, fill = continent))

### Kesimpulan

berdasarkan boxplot diatas, kita dapat melihat perbedaan antara negara maju dan negara berkembang dari segi kesiapannya tenaga kerja di sektor informal: 1. Pada negara berkembang seperti Oceania umumnya menunjukkan adanya jarak yang besar dimana antara negara negara didalamnya sehingga menunjukkan bahwa negara yang berada pada Benua Oceania masih sangat berkembang.
2. Jika kita melirik kepada Asia, Asia memiliki rata rata tenaga kerja informal di angka 50 hingga 60% akan tetapi jarak antara Q1 dengan mean masih menunjukkan adanya negara yang tidak terlalu besar dari tenaga kerja informal.
3. Pada Amerika kita cukup melihat bahwa sektor tenaga kerja informal cukup tinggi sehingga ini memiliki kesesuaian dengan tabel sebelumnya. Pada Eropa menunjukkan bahwa negara ini tidak terlalu banyak dari segi sektor tenaga kerja informal dikarenakan kultur yang sangat kuat dengan teknikal yang mungkin mempengaruhi dari benua tersebut.
4. Afrika Cenderung memiliki tenaga kerja yang cukup banyak pada sektor ini dikarenakan kentalnya adat dan budaya serta persebaran dari sektor ini cukup menjamah ke segala penjuru negara didalamnya

ggplot(datakuis, aes(x = continent))+
  geom_boxplot(aes(y=unemployment_rate, fill = continent))

Kesimpulan

melihat dari boxplot tingkat pengangguran dengan benuanya, kita bisa melihat bahwa afrika menduduki peringkat pertama dengan rata rata di angka 7.40 dan memiliki banyak negara didalamnya dengan pengangguran diatas rata rata. America memiliki 5.5 hingga 6 persen tingkat pengangguran dengan persebaran yang cukup merata di negara didalamnya. Asia dengan banyaknya negara didalamnya memiliki rata rata sejumlah 3.75-4 dengan persebaran yang sangat baik dan merata yang mengindikasikan bahwa hampir seluruh negara didalaam asia merupakan negara berpopulasi yang memiliki pengangguran. Untuk Eropa, rata-rata yang dapat kita lihat adalah sejumlah 5.0-6.25 dimana persebarannya sangat beraneka ragam yang mungkin diakibatkan oleh ketersediaan beberapa negara dalam mengatasi pengangguran ini. Pada Oceania secara mengejutkan dapat kita lihat bahwa dengan rata rata yang cukup tinggi diantara kisaran 5 - 6.25 kita dapatkan sebagian besar negara didalamnya memiliki pengangguran dibawah rata rata. Hasil boxplot ini cukup berbanding dengan pemaparan scatterplot sebelumnya yang telah kita lakukan.

bwplot(unemployment_rate~education_index | country, data = subset(datakuis, continent=="Asia"))
plotting dengan menggunakan bw

plotting dengan menggunakan bw