Agustus 2023

Angkatan Kerja Nasional (Sakernas) 2023 adalah survei yang dilakukan oleh Badan Pusat Statistik (BPS) Indonesia untuk mengumpulkan data mengenai ketenagakerjaan di Indonesia. Tujuan utama dari survei ini adalah untuk menyediakan data yang akurat dan komprehensif tentang berbagai aspek ketenagakerjaan di Indonesia, termasuk tingkat partisipasi angkatan kerja, tingkat pengangguran, jenis pekerjaan, upah, jam kerja, serta karakteristik demografis pekerja seperti usia, jenis kelamin, dan tingkat pendidikan.

Analisis data  survei ini menggunakan materi dari: Introduction to SAS. UCLA: Statistical Consulting Group. from https://stats.oarc.ucla.edu/sas/modules/introduction-to-the-features-of-sas/ (accessed August 22, 2021).

Mengunduh dan menginstal paket

Anda hanya perlu menjalankan perintah install.packages berikut sekali saja. Biarkan perintah ini tetap ada di file R script Anda, namun tambahkan simbol # di depan setiap baris untuk mengomentarinya.

# install.packages("survey")
# install.packages("dplr")
# install.packages("jtools")

Setelah paket diunduh, paket tersebut perlu dimuat. Ini perlu dilakukan pada awal setiap sesi R.

library(survey)
library(dplyr)
library(jtools)

Membaca data ke dalam R

Data Sakernas Agustus 2023 didistribusikan dalam format csv (sakernas_agt_2023_15.csv). Anda dapat menggunakan read.csv() untuk membaca data ke dalam R. Perintahnya akan terlihat seperti ini:

data <- read.csv("sakernas_agt_2023_15.csv")

Memeriksa data yang diimpor dengan menggunakan fungsi head(data)

head(data)

Variabel

Kita akan menggunakan beberapa variabel berbeda dalam contoh analisis ini. Di bawah adalah ringkasan singkat Beberapa variabel yang akan dianalisis termasuk di dalamnya memuat informasi observasi yang mencakup nilai yang benar-benar hilang serta nilai yang ditolak dan tidak diketahui.

K4 - Jenis Kelamin, rentang nilai: 1=Laki-laki 2=Perempuan; tidak ada pengamatan hilang

K5 - Kewarganegaraan, rentang nilai: 1=WNI 2=WNA, tidak ada pengamatan hilang

K9 - Umur, rentang nilai: 15 - 98, tidak ada pengamatan hilang

R6A - Pendidikan tertinggi ditamatkan, rentang nilai: 1=Tidak/belum tamat SD 2=SD/MI/SDLB/Paket A 3=SMP/MTs/SMPLB/Paket B 4=SMA/MA/SMLB/Paket C 5=SMK 6=MAK 7=Diploma I/II/III 8=Diploma IV 9=S1 10=S2 11=S2 Terapan 12=S3, tidak ada pengamatan hilang

R6B_P - Penyelenggara pendidikan, rentang nilai: 1=Negeri 2=Swasta 3=Kedinasan 4=Tidak Tahu, 448593 pengamatan hilang

R9A - bekerja paling sedikit satu jam, rentang nilai: 1=Ya 2=Tidak, tidak ada pengamatan hilang

R18B - jumlah jam kerja biasanya dalam seminggu di pekerjaan atau kegiatan usaha, rentang nilai: 0 - 98

R28A - Seminggu terakhir memiliki lebih dari 1 pekerjaan, rentang nilai: 1=Ya 2=Tidak, 250560 pengamatan hilang

R28C - Jumlah jam kerja biasanya seluruh pekerjaan dalam seminggu, rentang nilai: 0 - 98 (nilai akan sama dengan R18B jikq hanya memiliki satu pekerjaan)

Fungsi svydesign

Sebelum kita memulai analisis, kita perlu menggunakan fungsi svydesign dari paket “survei” yang ditulis oleh Thomas Lumley. Fungsi svydesign memberi tahu R tentang elemen desain dalam survei. Setelah perintah ini dikeluarkan, yang perlu Anda lakukan untuk analisis Anda adalah menggunakan objek yang berisi informasi ini di setiap perintah. Data Sakernas Agustus 20223 dirilis dengan bobot sampel (WIGHTR), variabel PSU (PSU), dan variabel strata (STRATA). Fungsi svydesign terlihat seperti ini:

survey_design <- svydesign(
  id = ~PSU,
  weights = ~WEIGHTR,
  strata = ~STRATA,
  nest = T,
  data = data
)

survey_design
Stratified 1 - level Cluster Sampling design (with replacement)
With (9112) clusters.
svydesign(id = ~PSU, weights = ~WEIGHTR, strata = ~STRATA, nest = T, 
    data = data)

Kita bisa mendapatkan informasi tambahan tentang sampel, seperti jumlah PSU per strata, dengan menggunakan fungsi summary.

summary(survey_design)
Stratified 1 - level Cluster Sampling design (with replacement)
With (9112) clusters.
svydesign(id = ~PSU, weights = ~WEIGHTR, strata = ~STRATA, nest = T, 
    data = data)
Probabilities:
     Min.   1st Qu.    Median      Mean   3rd Qu.      Max. 
0.0001431 0.0028011 0.0059880 0.0093957 0.0113636 0.3333333 
Stratum Sizes: 
           11101 11102 11201 11202 11301 11302 11401 11402 11501 11502 11601 11602 11701 11702 11801 11802 11901 11902
obs          226   883   467   780   488  1024   447   911   384  1163   448   907   453   835   962   865   436  1035
           12001 12002 12101 12102 12201 12202 12301 12302 12401 12402 12501 12502 12601 12602 12701 12702 12801 12802
obs          583   934   493  2466   733  2173   343  2184  1119  1874   545  2151   379  2087  1164  1606  1225  1500
           12901 12902 13001 13002 13101 13102 13201 13202 13301 13302 13401 13402 13501 13502 13601 13602 13701 13702
obs          500  1170   234  1065   622  1923  2248  1422  1280  2107   447  2460   573  2190   777  1747   909  1799
           13801 13802 13901 13902 14001 14002 14101 14102 14201 14202 14301 14302 14401 14402 14501 14502 14601 14602
obs         1075  2002  1098  1847   445  2278  1064  3416  1579  2907   895  2264   574  2249   784  1936   768   968
           14701 14702 14801 14802 14901 14902 15001 15002 15101 15102 15201 15202 15301 15302 15401 15402 15501 15502
obs          436  1082   777   784   539  1085   536   774   423   957   390  1149   345   994   325  1143   620   915
           15601 15602 15701 15702 15801 15802 15901 15902 16101 16102 16201 16202 16301 16302 16401 16402 16501 16502
obs          178  1177   437   947   241  1305   581   954   579   959   305  1373   460  1249   407  1068   159  1292
           16601 16602 16701 16702 16801 16802 16901 16902 17001 17002 17101 17102 17201 17202 17301 17302 17401 17402
obs          287  1327   629  1149   202  1305   318  1336   443  1063   740  2047  1053  1636   472  2174   136  1061
           17501 17502 17601 17602 17701 17702 17801 17802 17901 17902 18101 18102 18201 18202 18301 18302 18401 18402
obs          104  1146   178  1149   182   976   321   962   312   958  1519  1250  1178  1401  2347   789  1667  1456
           18501 18502 18601 18602 18701 18702 18801 18802 18901 18902 19001 19002 19101 19102 19201 19202 19301 19302
obs          946  2020   561  1021   125  1367   437   973   421  1045   840   638  2243  1788  2527  1549  1944  2191
           19401 19402 19501 19502 19601 19602 19701 19702 19801 19802 20101 20102 20201 20301 20302 20401 20402 20501
obs         1914   782  2562   967  2147   583  1041   289   501   912  1720   114  1150   768   457  1096    24  1240
           20601 20602 20701 20702 21101 21102 21201 21202 21301 21302 21401 21402 21501 21502 22101 22201 22202 23101
obs         1143   128   934   347  2572   633   847   445  1611   964   442   756   365   644  1736   769   387  2008
           23201 23202 23301 23302 23401 23402 24101 24102 25101 25201 26101 28101 28102 28201 28202 31101 32101 32102
obs          999   318   716   602  1209   266  1524    65  1881  1397  1470  1678    69  1408    44   870  2398   144
           32201 32202 32301 32302 32401 32402 32501 32502 32601 32602 32701 32702 32801 32802 32901 32902 33001 33002
obs         1166   841  1155   679  2138    95  1494   636  1005   752  1092   525  1202   440  1832   115  1179   562
           33101 33102 33201 33202 33301 33302 33401 33402 33501 33502 33601 33602 33701 33702 33801 33802 33901 33902
obs         2501  1160  2810   939  2482  1258  2342  1289  2602  1198  2763  1211  2534  1114  1862  1487  1135   704
           34001 34002 34101 34102 34201 34202 34301 34302 34401 34402 34501 34502 34601 34602 34701 34702 34801 34802
obs         1574   239  2635   730  2529  1279  2111  1472  2828   782   764  1084   516  1145   639   962  1112   724
           34901 34902 35001 35002 35101 35102 35201 35202 35301 35302 35401 35402 35501 35502 35601 35602 35701 35702
obs         1570   153  1525   329  1715  1851  2188  1602  1685  1941  2486  1114  2194  1523  2708  1030  2940  1125
           35801 35802 35901 35902 36001 36002 36101 36102 36201 36202 36301 36302 36401 36402 36501 36502 36601 36602
obs         2383  1135  3027  1180  1243   612  1537  1770  1552  1702  3201   867  2689  1184  2131    48  1613   245
           36701 36702 36801 36802 36901 36902 37001 37002 37101 37102 37201 37202 37301 37302 37401 37402 37501 37502
obs         1535   330  1101   665   976   657   998   745   600  1025   682  1203   817   980   827  1043  1588   422
           37601 37602 37701 37702 37801 37802 37901 37902 38101 38201 38301 38401 38501 39101 39201 39301 39401 39501
obs          807   822   660   966   968   739   496  1173  2012  2084  1563  2044  1927  1750  1427  2013  1418  2217
           39601 39701 39801 39802 39901 39902 40101 40201 40301 40401 40402 40501 40601 41101 42101 42201 42301 42401
obs         2136  1615  1594    41  1119   189  1106  1580  1388  2019    52  1470  1332  1381  1501  1327  1635  1369
           42501 42601 42701 42801 42901 42902 43101 43201 43301 43302 43401 51101 51102 51201 51202 51301 51302 51401
obs         1449  1261  1399  2294  1291   220  1991  1584  1554    98  1963   979   580   790  1077  1686   180  1768
           51402 51501 51502 51601 51602 51701 51702 51801 51802 52101 52102 52201 52202 52301 52302 52401 52402 52501
obs          366  1070   447   627   989   629   898  1197   518  1269   266   878   663  1177   438   383  1089   368
           52502 52601 52602 52701 52702 52801 52802 53101 53102 53201 53202 53301 53302 53401 53402 53501 53502 53601
obs          977   310  1203   469   783   565   675   217  1189   307  1291   213  1422   172  1299   160  1307   524
           53602 53701 53702 53801 53802 53901 53902 54001 54002 54101 54102 54201 54202 54301 54302 54401 54402 54501
obs          901   332  1099   271   962   301  1142   361  1296   433  1199   171  1130   262  1306   119  1067   144
           54502 54602 54701 54702 54801 54802 54901 54902 55001 55002 55101 55102 58101 59101 59201 59202 60101 60102
obs         1430  1244    55  1636   110  1341    53  1454    82   986   172  1187  1815  1438  1061   233  1576    49
           61101 61102 61201 61202 61301 61302 61401 61402 61501 61502 61601 61602 61701 61702 61801 61802 61901 61902
obs          369  1280   150  1255   263  1344   730   723   312  1232   431  1028   274  1263   316  1041   227  1201
           62001 62002 62101 62102 62201 62202 62301 62302 62401 62402 62501 62502 62601 62602 62701 62702 62801 62802
obs          250  1100  1048  1687  1691  1506   370  1099   389   893   361   852   273   793   344   874   579   684
           62901 62902 63001 63002 63101 63102 63201 63202 63301 63302 63401 63402 63501 63502 63601 63602 63701 63702
obs          294   913   262   992   881  1622   861  1721  1076  1711   424  1039   214  1030   600   702   361   968
           63801 63802 63901 63902 64001 64002 64101 64102 64201 64202 64301 64302 64401 64402 64501 64502 64901 64902
obs          626   760   516   845   968   508   824  1798   362   915   868   791   647   863   659   777   695   679
           65101 65102 65201 65202 65301 65302 65401 65402 68101 68201 68202 69101 69102 70101 70201 71101 71102 71201
obs          492  1630   702   669   271   606   547   803  1651  1294   236  1301   105  1586  1458  1987  1123  2461
           71202 71301 71302 71401 71402 71501 71502 71601 71602 71701 71702 71801 71802 71901 71902 72001 72002 72101
obs          804   406   890  1466   974   268  1046   767   562   225   910   215   863   324   891   165   984  1868
           72102 72201 72202 72301 72302 72401 72402 72501 72502 72601 72602 72701 72702 72801 72802 72901 72902 73001
obs         2055   448  1120   406   664   382  1121   317  1226   445  1025   229  1245   209  1365   265  1115   410
           73002 73101 73102 73201 73202 73301 73302 73401 73402 73501 73502 73601 73602 73701 73702 73801 73802 73901
obs         1048   631  1679   591  2102   582   885   325  1264   627   830  1004   758   426  1023   650   976   528
           73902 74001 74002 74101 74102 74201 74202 74301 74302 74401 74402 74501 74502 74601 74602 74701 74702 74801
obs         1066   462   856   717  2401   888  1883   752  2278   999  1941   611  2289   431  2275   690  2138   279
           74802 74901 74902 75001 75002 75101 75102 75201 75202 75301 75302 75401 75402 75501 75502 75601 75602 76101
obs         2290   182   922    50  1057   390  2198   927  3135   503  2012  1242  1459   921  2994   303  1101   627
           76102 76201 76202 76301 76302 76401 76402 76501 76502 76601 76602 78101 78102 78201 78202 78301 78302 78401
obs          846   725   976   134  1181   474   964   195  1166   144  1147  1481    53  1134   209   915   290  1111
           78402 79101 79102 80101 80102 80201 80202 80301 80302 81101 81102 81201 81202 81301 81302 81401 81402 81501
obs          195  1623    43  1846    27  1239    47  1240   264  1907   945  1546  1206   383  1222   520   814   445
           81502 81601 81602 81701 81702 81801 81802 81901 81902 82101 82102 82201 82202 82301 82302 82401 82402 82501
obs          862   380  1017   169  1201    65  1026    98  1119  1443  1132   199   880   354   803   212  1276   473
           82502 82601 82602 82701 82702 82801 82802 88101 88102 88201 88202 89101 89102 89201 89202 91101 91102 91201
obs         1002   182   958   169   899   155   914  1576   165   712   563  1212   130   462   836   535   679   465
           91202 91301 91302 91401 91402 91501 91502 91601 91602 91701 91702 91801 91802 91901 91902 92001 92002 92101
obs          664   133   976   377   712   819   592   184   883   210  1092   153   922    46   795    11   832    88
           92102 92201 92202 94101 94102 94201 94202 94301 94302 94401 94402 94801 94802 94901 94902 95001 95002 95101
obs          713    30   857   592   759   198   914   671   580   627   585   414   856   625   656    87  1052     9
           95102 95201 95202 95301 95302 95401 95402 95501 95502 95601 95602 95701 95702 95801 95802 95901 95902 96001
obs         1044   806   646   226   782   128  1093   115   868    62  1487    61  1011    20  1107   180   805   153
           96002 96601 96602 96701 96702 96801 96802 96901 96902 97001 97002 97101 97102 97201 97202 97302 97402 97502
obs          874   131   944   284   668    86   793    54  1099    51  1101    27   936    19   807  1341   857   787
           97601 97602 98101 98102 101101 101102
obs           66   914  1307   130   1271    168
 [ reached getOption("max.print") -- omitted 2 rows ]
Data variables:
  [1] "TAHUN"      "WEIGHTR"    "ROWINDEX"   "KODE_PROV"  "KODE_KAB"   "KLAS"       "PSU"        "STRATA"    
  [9] "B2_R1"      "B2_R2"      "K3"         "K4"         "K5"         "K5_KD"      "K6"         "K7"        
 [17] "K8_BLN"     "K8_TH"      "K9"         "R3B"        "R4"         "R5"         "R6A"        "R6B_P"     
 [25] "R6B_KD"     "R6C_BLN"    "R6C_TH"     "R6D"        "R6E"        "R6F"        "R6G1_KD"    "R6G1MTD"   
 [33] "R6G1SB1"    "R6G1SB1KD"  "R6G1SB2"    "R6G1SB3"    "R6G1SB4"    "R6G2_KD"    "R6G2MTD"    "R6G2SB1"   
 [41] "R6G2SB1KD"  "R6G2SB2"    "R6G2SB3"    "R6G2SB4"    "R6G3_KD"    "R6G3MTD"    "R6G3SB1"    "R6G3SB1KD" 
 [49] "R6G3_SB2"   "R6G3_SB3"   "R6G3_SB4"   "R6H"        "R6I"        "R6J"        "R7"         "R7_PROV"   
 [57] "R7_KAB"     "R8A"        "R8B"        "R8C"        "R8D"        "R8E"        "R8F"        "R9A"       
 [65] "R9B"        "R9C"        "R10"        "R11A"       "R11B"       "R11C"       "R11D"       "R13A"      
 [73] "R13B"       "R13C"       "R13C_BLN"   "R13C_TH"    "R14AKATEGO" "R14AKATE_A" "R14BKBJI20" "R14BKBJI19"
 [81] "R15_UANG"   "R15_BRG"    "R16A"       "R16B"       "R17A_BLN"   "R17A_TH"    "R17B"       "R18A_SEN"  
 [89] "R18A_SEL"   "R18A_RAB"   "R18A_KAM"   "R18A_JUM"   "R18A_SAB"   "R18A_MNG"   "R18A_JML"   "R18A_BLT"  
 [97] "R18B"       "R19A1"      "R19A2"      "R19A3"      "R19B"       "R19C1"      "R19C2"      "R19C3"     
[105] "R19C4"      "R19C5"      "R20"        "R21"        "R22A"       "R22B"       "R22B_PROV"  "R22B_KAB"  
[113] "R22C"       "R22D"       "R23A1"      "R23A2"      "R23A3"      "R23A4"      "R23A5"      "R23A6"     
[121] "R23A7"      "R23A8"      "R23B"       "R24A"       "R24B"       "R24C"       "R24D"       "R24E"      
[129] "R24F"       "R24G"       "R24H"       "R24I"       "R25A"       "R25B"       "R26"        "R27A"      
[137] "R27B"       "R27C"       "R28A"       "R28B_SEN"   "R28B_SEL"   "R28B_RAB"   "R28B_KAM"   "R28B_JUM"  
[145] "R28B_SAB"   "R28B_MNG"   "R28B_JML"   "R28B_BLT"   "R28C"       "R29A"       "R29B"       "R29C"      
[153] "R30"        "R31A"       "R31B"       "R32A"       "R32B"       "R33_TH"     "R33_BLN"    "R34A"      
[161] "R34B"       "R34C"       "R34D"       "R34E"       "R34F"       "R35A"       "R35B"       "R35C"      
[169] "R35D"       "R36A"       "R36B"       "R36C"       "R37"        "R38A"       "R38A_BLN"   "R38A_TH"   
[177] "R38B"       "R39A"       "R39B_BLN"   "R39B_TH"    "R40D"       "R41AKATEGO" "R41AKATE_A" "R41BKBJI20"
[185] "R41BKBJI19" "R42"        "R43A"       "R43B"       "R43C"       "R43D"       "R44A"       "R44B"      
[193] "R44C"       "R44D"       "R44E"       "R44F"       "R44G"       "R44H"       "R44I"       "R44J1"     
[201] "R44J2"      "R44J3"      "R44J4"      "R44J5"      "R44J6"      "R44J7"      "R45A"       "R45B"      
[209] "R46"        "R47_BLN"    "R47_TH"     "R49KATEGOR" "R49KATEG_A" "R50KBJI201" "R50KBJI198" "R51"       
[217] "R52"        "R53"        "R54"        "JENISKEGIA"

Statistik deskriptif dengan variabel kontinu

Kita akan mulai dengan sesuatu yang sederhana: menghitung mean dari variabel kontinu. Dalam contoh ini, kami menggunakan variabel K9 yang merupakan usia responden (sakernas_agt_2023_15_ly.csv). Harap dicatat bahwa dokumentasi untuk fungsi svymean, serta fungsi lain yang menyediakan statistik deskriptif, dapat ditemukan di bagian dokumentasi yang disebut surveysummary.

options(survey.lonely.psu = "adjust")
svymean(~K9, survey_design)
     mean     SE
K9 40.249 0.0351

Kita juga bisa mendapatkan simpangan baku dari variabel umur dengan menggunakan fungsi svysd, dari paket jtools.

svysd(~K9, survey_design)
   std. dev.
K9    16.614

Menghitung mean dari R9A yang menyatakan bahwa responden bekerja paling sedikit satu jam dalam seminggu terakhir.

svymean(~R9A, survey_design)
     mean     SE
R9A 1.393 0.0013

Contoh lainnya (R6A: Pendidikan tertinggi ditamatkan)

svymean(~R6A, survey_design)
      mean     SE
R6A 3.5515 0.0097

Mean lebih dari satu variabel dapat diperoleh dengan memberi tanda “+” di antara variabel-variabel tersebut:

svymean(~K9+R9A+R6A, survey_design)
       mean     SE
K9  40.2495 0.0351
R9A  1.3930 0.0013
R6A  3.5515 0.0097

Pada contoh di bawah ini, diperoleh mean, deviasi standar, dan varians untuk variabel R6B_P (Penyelenggara pendidikan dan jurusan pendidikan/bidang studi pada pendidikan tertinggi yang ditamatkan):

svymean(~R6B_P, survey_design)
         mean     SE
R6B_P 0.63107 0.0033
svysd(~R6B_P, survey_design)
      std. dev.
R6B_P     0.805
svyvar(~R6B_P, survey_design)
      variance     SE
R6B_P  0.64818 0.0024

Fungsi cv digunakan untuk mendapatkan koefisien variasi. Koefisien variasi adalah rasio kesalahan standar terhadap rata-rata dikalikan dengan 100%. Ini merupakan indikasi variabilitas relatif terhadap rata-rata populasi dan tidak dipengaruhi oleh unit pengukuran variabel.

cv(svymean(~R6B_P, survey_design))
            R6B_P
R6B_P 0.005235568

Di bawah ini adalah contoh cara mendapatkan efek desain (Deff). Deff adalah rasio dua varian. Pada pembilangnya kita mempunyai estimasi varians dari sampel saat ini (termasuk seluruh elemen desainnya), dan pada penyebutnya kita mempunyai varians dari sampel hipotetis dengan ukuran yang sama yang diambil sebagai SRS (Sampel Acak Sederhana). Dengan kata lain, Deff memberi tahu Anda seberapa efisien sampel Anda dibandingkan dengan SRS berukuran sama. Jika Deff kurang dari 1, sampel Anda lebih efisien dibandingkan SRS; namun umumnya, Deff lebih besar dari 1. Pada contoh di bawah, Deff=12.827. Artinya, sampel yang diambil menggunakan rencana pengambilan sampel saat ini harus berjumlah 13 kali lipat dari jumlah yang diperlukan jika sampel dikumpulkan melalui SRS. Secara spesifik, Deff khusus untuk suatu variabel, sehingga beberapa variabel mungkin memiliki Deff yang lebih besar atau lebih kecil.

svymean(~R6B_P, survey_design, deff = TRUE)
          mean       SE   DEff
R6B_P 0.631069 0.003304 12.827

Kuantil adalah statistik deskriptif yang berguna untuk variabel kontinu, khususnya variabel yang tidak terdistribusi normal.

svyquantile(~R6A, survey_design, c(.25,.5,.75),ci=TRUE)
$R6A
     quantile ci.2.5 ci.97.5        se
0.25        2      2       3 0.2550697
0.5         3      3       4 0.2550697
0.75        4      4       5 0.2550697

attr(,"hasci")
[1] TRUE
attr(,"class")
[1] "newsvyquantile"

Mari kita lihat beberapa statistik deskriptif untuk variabel biner. Kita mulai dengan mendapatkan mean dari variabel K4, yang berkode 1 untuk laki-laki dan 2 untuk perempuan. Mengambil mean suatu variabel yang berkode 1/2 menghasilkan proporsi 2, sehingga mean dari variabel tersebut adalah taksiran proporsi penduduk yang berjenis kelamin perempuan.

svymean(~K4, survey_design)
     mean    SE
K4 1.4969 6e-04

Kita dapat menggunakan fungsi confint untuk mendapatkan interval kepercayaan di sekitar mean ini.

confint(svymean(~K4, survey_design))
      2.5 %   97.5 %
K4 1.495743 1.497961

Namun, komentar di halaman 70 dokumentasi paket survei, kita sebaiknya menggunakan svyciprop daripada confint. Ada beberapa opsi yang dapat diberikan untuk argumen method. Silakan lihat halaman 70-71 dokumentasi. Opsi likelihood menggunakan distribusi chi-kuadrat berskala (Rao-Scott) untuk log likelihood dari distribusi binomial.

svyciprop(~I(K4==2), survey_design, method="likelihood")
                  2.5% 97.5%
I(K4 == 2) 0.497 0.496 0.498
# li adalah kependekan dari likelihood
svyciprop(~I(K4==1), survey_design, method="li")
                  2.5% 97.5%
I(K4 == 1) 0.503 0.502 0.504

Opsi logit cocok dengan model regresi logistik dan menghitung interval tipe Wald pada skala log-odds, yang kemudian diubah menjadi skala probabilitas.

svyciprop(~I(K4==2), survey_design, method="logit")
                  2.5% 97.5%
I(K4 == 2) 0.497 0.496 0.498

Opsi xlogit menggunakan transformasi logit dari mean dan kemudian melakukan transformasi kembali ke skala probabilitas. Tampaknya ini adalah metode yang digunakan oleh SUDAAN dan SPSS COMPLEX SAMPLES.

svyciprop(~I(K4==2), survey_design, method="xlogit")
                  2.5% 97.5%
I(K4 == 2) 0.497 0.496 0.498

Sebagaimana dinyatakan pada halaman 71 dokumentasi, penggunaan opsi mean (disingkat dalam kode di bawah ini), mereproduksi hasil yang diberikan oleh perintah svy: mean Stata.

svyciprop(~I(K4==2), survey_design, method="me", df=degf(survey_design))
                  2.5% 97.5%
I(K4 == 2) 0.497 0.496 0.498

Sebagaimana dinyatakan pada halaman 71 dokumentasi, penggunaan opsi logit (disingkat dalam kode di bawah ini), mereproduksi hasil yang diberikan oleh perintah svy: prop Stata.

svyciprop(~I(K4==2), survey_design, method="lo", df=degf(survey_design))
                  2.5% 97.5%
I(K4 == 2) 0.497 0.496 0.498

Anda juga bisa mendapatkan proporsi 1, seperti yang ditunjukkan di bawah ini.

svyciprop(~I(K4==1), survey_design, method="mean")
                  2.5% 97.5%
I(K4 == 1) 0.503 0.502 0.504

Di bawah ini adalah cara lain untuk mendapatkan proporsi 2. Inti dari contoh ini adalah Anda dapat menggunakan sintaksis jenis ini untuk mendapatkan proporsi level mana pun dari variabel kategori.

svyciprop(~I(K4==2), survey_design, method="mean")
                  2.5% 97.5%
I(K4 == 2) 0.497 0.496 0.498

Terakhir, mari kita lihat cara mendapatkan totalnya dengan menggunakan fungsi svytotal. (K5 Kewarganegaraan 1-WNI 2-WNA)

svytotal(~K5,design = survey_design)
       total      SE
K5 212602475 1669011

Pada contoh berikutnya, kita akan mendapatkan koefisien variasi untuk total ini.

cv(svytotal(~K5,design = survey_design))
            K5
K5 0.007850386

Mari kita dapatkan efek desain secara total.

svytotal(~K5,design = survey_design, deff = TRUE)
       total        SE   DEff
K5 212602475   1669011 663857

Statistik deskriptif untuk variabel kategori

Mari kita lihat beberapa cara untuk mendapatkan statistik deskriptif untuk variabel kategori, baik variabel tersebut biner atau tidak. Kita akan mulai dengan fungsi tabel. Pada contoh di bawah ini, kita mendapatkan frekuensi untuk variabel K4.

svytable(~K4, design = survey_design)
K4
        1         2 
106963005 105624436 

Kita juga dapat menggunakan fungsi tabel untuk mendapatkan tabulasi silang. Kita akan mulai dengan tab silang dua arah.

# 2-arah
svytable(~K4+K5, survey_design)
   K5
K4          1         2
  1 106954660      8345
  2 105617747      6689

Pada contoh berikutnya, kami menggunakan sintaks berbeda untuk melakukan hal yang sama. Perhatikan bahwa keluarannya ditampilkan berbeda, meskipun informasi dalam keluarannya sama.

# 2-arah
svytable(~interaction(K4, K5), design = survey_design)
interaction(K4, K5)
      1.1       2.1       1.2       2.2 
106954660 105617747      8345      6689 

Sekarang mari kita buat tabel tiga arah.

# 3-arah
svytable(~interaction(K4, K5, R6D), design = survey_design)
interaction(K4, K5, R6D)
   1.1.1    2.1.1    1.2.1    2.2.1    1.1.2    2.1.2    1.2.2    2.2.2 
20024101 18121932     2475     2453 86930559 87495815     5870     4236 

Tabel empat arah.

# 4-arah
svytable(~interaction(K4, K5, R6D, R28A), design = survey_design)
interaction(K4, K5, R6D, R28A)
 1.1.1.0  2.1.1.0  1.2.1.0  2.2.1.0  1.1.2.0  2.1.2.0  1.2.2.0  2.2.2.0  1.1.1.1  2.1.1.1  1.2.1.1  2.2.1.1  1.1.2.1 
 3073937  6306438     1013     1697 18649570 44698662     1912     1835  3030861  1573946        0        0 11705460 
 2.1.2.1  1.2.2.1  2.2.2.1  1.1.1.2  2.1.1.2  1.2.1.2  2.2.1.2  1.1.2.2  2.1.2.2  1.2.2.2  2.2.2.2 
 4638383        0      393 13919303 10241548     1462      756 56575529 38158770     3958     2008 

Meskipun bukan statistik deskriptif, mari kita lihat cara mendapatkan uji chi-kuadrat sambil membahas tabel. Tentu saja, hanya tabel dua arah yang dapat ditentukan.

svychisq(~K4+K5, survey_design, statistic="adjWald")

    Design-based Wald test of association

data:  svychisq(~K4 + K5, survey_design, statistic = "adjWald")
F = 0.31065, ndf = 1, ddf = 8332, p-value = 0.5773

Grafik variabel kontinu

Mari kita mulai dengan histogram. Secara default, density ditampilkan pada sumbu y.

svyhist(~R6A, survey_design)

Pengkodean K9

svyhist(~K9, survey_design, probability = FALSE)

Kita juga bisa membuat boxplots.

svyboxplot(~R6B_P~1, survey_design, all.outliers=TRUE)

Kita dapat memecah boxplot dengan variabel kelompok. Variabel kelompok harus berupa faktor.

svyboxplot(~R6B_P~factor(K4), survey_design, all.outliers=TRUE)

Kita bisa membuat diagram batang. Pada contoh di bawah, kami juga memperlihatkan beberapa sintaks yang digunakan untuk analisis subpopulasi.

barplt<-svyby(~R18B+R28C, ~K4, survey_design, na = TRUE, svymean)
barplot(barplt,beside=TRUE,legend=TRUE)

dotchart(barplt)

Kita dapat membuat scatterplot dengan bobot sampling yang sesuai dengan ukuran bubble.

svyplot(~R18B+R28C, survey_design, style="bubble")

Ada berbagai macam plot dengan kepadatan dan kehalusan yang dapat dibuat. Beberapa contohnya ada di bawah.

smth<-svysmooth(~R18B, design=survey_design)
plot(smth)

dens<-svysmooth(~R18B, design=survey_design,bandwidth=30)
plot(dens)

dens1<-svysmooth(~R18B, design=survey_design)
plot(dens1)

