Week 6 - Metode Bootstrap

Pengantar Bootstrapping dalam R

Dalam statistik, kita sering ingin melakukan resampling untuk menguji keakuratan estimasi sampel kita. Ini disebut bootstrapping—sebuah tes yang didasarkan pada pengambilan sampel acak berulang dengan pengembalian (replacement). Dalam pembelajaran kali ini, kita akan: 1. menghasilkan 1000 sampel acak baru dari sebuah vektor (dengan pengembalian), 2. menghitung estimasi tertentu (misalnya, mean, median, dll.) untuk setiap sampel tersebut, dan 3. menghitung standar deviasi dari distribusi estimasi tersebut.

Dataset

Kita akan membuat sebuah vektor berisi angka yang terdistribusi secara normal dengan nama myData.

Membuat Distribusi Normal Acak Menggunakan rnorm()

Fungsi rnorm() memungkinkan kita untuk menghasilkan urutan angka acak dari distribusi normal hipotetis dengan rata-rata (mean) 20 dan standar deviasi 4.5. Di sini, kita memilih untuk menghasilkan 2000 observasi.

set.seed(300) # Setting the seed for replication purposes
myData <- rnorm(2000,20,4.5) # Creating a random normal distribution (n=300, mean=20, sd=4.5)
myData
##    [1] 26.182059 23.879481 22.130701 23.155683 19.617251 27.059160 23.678264
##    [8] 21.776459 25.457143 21.597863 29.973234 19.592568 14.075624 20.299407
##   [15] 22.304777 20.225134 26.603287 14.197158 18.840388 21.318731 18.481609
##   [22] 22.849661 18.590696 20.607019 14.848602 18.598708 21.057088 26.024032
##   [29] 19.552870 24.666047 18.445145 21.633027 16.375393 19.275268 23.535583
##   [36] 21.515529 16.941070 20.084051 19.077397 14.721151 24.015267 16.304690
##   [43] 19.054526 21.760683 25.985724 26.204267 24.389932 22.997494 22.048501
##   [50] 21.132584 24.581264 27.505119 13.133183 20.318049 20.600737 19.752578
##   [57] 16.792054 20.383859 16.823322 16.116385 19.724470 31.252286 22.926507
##   [64] 18.195463 25.864195 16.366706 26.538317 14.501677 19.722406 18.441963
##   [71] 19.857900  9.458769 16.420926 16.724296 19.791322 26.012269 29.379486
##   [78] 19.339673 17.725642 16.299786 22.707572 18.285659 19.458643 19.900532
##   [85] 13.864901 23.165046 22.714336 15.496208 19.421470 20.813186 19.205008
##   [92] 24.794179 23.740173 14.228999 31.585382 26.653975 17.868309 22.289658
##   [99] 21.769176 27.147221 25.324274 21.494702 13.263396 19.523477 17.999560
##  [106] 21.720689 22.537856 19.793030 20.081321 23.290747 18.179978 26.419703
##  [113] 24.954285 17.412226 25.631935 21.616514 11.939568 15.781950 23.892914
##  [120] 16.432150 23.163796 19.954486 18.669080 17.689066 10.596750 20.970042
##  [127] 18.569700 21.903457 11.847849 29.273654 12.523099 19.869942 22.970904
##  [134] 15.609670 18.959668 19.379349 21.922396 28.640823 15.112371 24.078860
##  [141] 23.290102 26.711840 22.416585 22.181761 20.874858 21.375417 20.311089
##  [148] 19.701262 25.524367 18.438978 24.059041 24.295723 24.910343 26.931130
##  [155] 23.559509 25.647690 29.475398 22.143424 23.873855 24.479616 22.629727
##  [162] 19.586859 18.679288 15.662014 14.280793 21.887784 22.607050 11.565486
##  [169] 16.707780 17.828126 26.627614 15.869475 12.799248 16.940249 27.856389
##  [176] 28.430145 20.607648 16.910438 25.558819 12.267187 18.223850 13.219373
##  [183] 21.318938 20.731449 22.775234 16.324885 16.225675 21.526585 22.444664
##  [190] 22.132560 25.563769 16.336703 20.171496 24.516584 28.322991 21.792704
##  [197] 16.505576 15.623823 19.343203 27.185089 24.699542  9.313646 19.222220
##  [204] 28.169564 18.275831 16.409800 15.531785 11.950230 25.272456 16.363944
##  [211] 16.892212 15.595986 22.719524 23.062539 15.865657 21.574941 25.952774
##  [218] 24.461491 21.362804 16.307043 21.204411 17.218632 11.116075 18.061714
##  [225] 17.354862 17.493392 12.134139 18.549068 13.135223 15.141770 17.594603
##  [232] 14.168986 35.768634 26.910691 15.077602 20.680994 11.969586 17.848121
##  [239] 16.244128 16.965587 25.952504 22.462720 10.427352 17.265648 23.328605
##  [246] 27.109307 16.435821 19.604418 23.119565 25.168549 23.525221 27.210285
##  [253] 20.736041 19.950683 23.491537 26.488986 17.650046 25.796613 27.623113
##  [260] 21.011641 20.474046 24.169240 20.952749 14.779677 23.706982 26.427554
##  [267] 18.213938 11.923777 16.568753 19.151638 14.419813 13.853480 24.175867
##  [274] 30.815931 18.827978 15.479740 16.071904 15.738393 23.045338  5.858313
##  [281] 20.636067 20.772737 24.952145 25.737880 14.789501 24.231974 10.617577
##  [288] 17.930609 15.653299 18.059278 23.126495 19.399744 15.524955 13.758565
##  [295] 15.852109 15.092254 18.571578 23.168594 20.684659 12.476500 31.239611
##  [302] 23.549614 13.910001 19.090064 15.594943 15.088693 16.421660 20.853329
##  [309] 18.512187 14.822961 22.691738 30.482944 15.832097 23.412204 22.160114
##  [316] 29.117893 16.701433 21.466508 14.388287 18.014932 18.447588 21.439502
##  [323] 13.343753 19.788246 19.235856 21.907730 26.629587 22.850911 24.127487
##  [330] 16.297824 21.976525 13.452862 17.181825  8.803151 20.874279 22.500485
##  [337] 22.567417 21.857381 16.495743 21.387036 23.507803 29.988294 25.394688
##  [344] 23.562944 17.844502 25.943201 24.714192 16.782103 20.452213 23.044070
##  [351] 15.425971 24.717180 17.476036 14.468792 16.931984 23.122000 14.315020
##  [358] 33.455282 17.870587 19.060121 18.545616 19.389108 19.751335 18.955040
##  [365] 25.154824 18.575391 14.623857 20.868459 23.780894 22.663737 17.361977
##  [372] 18.634805 21.315569 19.142437 26.416564 21.844648 19.859178 17.410707
##  [379] 16.823948 15.533699 12.474563 22.145557 18.636009 23.756211 23.587066
##  [386] 17.700101 22.287652 17.620766 23.841535 13.518177 21.041827 21.165284
##  [393] 19.957775 19.620714 19.368006 18.771295 22.429744 19.256149 31.118081
##  [400] 16.374479 23.229448 21.749697 24.158810 14.234501 22.811352 23.496650
##  [407] 18.944742 23.725631 19.355597 22.209410 22.445225 23.291944 25.659112
##  [414] 15.329921 21.286271 25.407690 25.189868 22.413241 20.748090 18.583210
##  [421] 24.115900 23.538398 24.508634 22.978888 21.736145 24.018350 16.400565
##  [428] 21.782719 23.424375 16.950621 22.791816 16.682178 13.154062 31.082731
##  [435] 25.416383 20.172155 25.140593 19.383208 21.033446 14.839365 15.019718
##  [442] 22.854572 24.144819 17.642090 23.241719 17.572604 15.275978 19.806798
##  [449] 21.452671 19.265346 24.803186 21.363917 22.077111 18.299448 12.590721
##  [456] 10.103851 23.554066 30.335098 19.811380 20.825891 14.138356 18.901738
##  [463] 15.732047 21.142473 17.158962 18.936221 30.835241 24.180243 27.086337
##  [470] 22.433852 19.553976 25.013735 18.950351 18.944949 17.274122 20.572718
##  [477] 25.192038 17.465139 13.614877 21.057644 20.126527 11.243258 20.223649
##  [484] 24.031205 28.034896 21.464011 15.602020 19.862983 20.422767 21.960824
##  [491] 11.524295 16.938740 15.132382 12.008463 14.312744 22.943618 26.557479
##  [498] 18.045725 11.333042 18.773568 17.283220 20.787275 22.605586 18.942306
##  [505] 21.041818 33.044333 16.908663 11.013825 17.636603 18.469638 20.841139
##  [512] 16.594137 26.140599 27.775028 21.739885 16.353750 20.705654 14.358369
##  [519] 16.322773 21.865732 27.418646 18.835266 18.302956 19.342071 19.219094
##  [526] 13.136442 24.224337 19.555354 19.545528 12.076638 23.275950 22.765566
##  [533] 14.628317 17.967708 23.591095 28.257113 19.105272 27.420603 18.177547
##  [540] 27.166662 23.543354 18.765373 25.087153 17.593647 20.830176 18.320141
##  [547] 21.912883 15.098044 18.218238 18.119653 18.202858 20.964405 16.288462
##  [554] 24.516594 12.782725 20.244243 19.284517 17.715738 18.808097 22.896334
##  [561] 19.623477 24.521215 19.404257 21.146795 16.645961 15.698481 25.295396
##  [568] 15.389769 16.726696 22.890434 21.110447 23.935529 19.583282 19.234666
##  [575] 14.800008 20.758187 17.517845 23.389852 13.371137 23.826787 20.527263
##  [582] 16.466486 12.619089 13.556824 18.293215 23.127935 27.461851 24.543841
##  [589] 21.847666 13.850585 16.869167 18.806146 23.094625 20.806359 33.537941
##  [596] 26.365151 22.039023 14.699200 23.878337 14.292680 21.939039 20.143620
##  [603] 17.233416 24.072406 19.988893 17.916743 17.874457 20.920104 23.493713
##  [610] 22.565285 21.960415 21.263573 20.328547 17.728657 23.485323 21.770437
##  [617] 17.515530 17.559141 15.336481 13.332989 20.949316 14.955424 13.990735
##  [624] 22.226946 18.971852 21.023550 10.281302 12.884794 20.308777 21.862034
##  [631] 21.802590 23.357622 22.915871 12.664241 19.881577 22.364744 13.352885
##  [638] 26.263337 15.821923 14.190911 19.802829  9.511770 18.325681 23.854414
##  [645] 21.507959 25.324401 29.551129 20.815755 29.044069 14.378176 27.136205
##  [652] 22.808715 24.796515 19.367315 12.611053 18.517045 25.823729 23.462938
##  [659] 24.369114 18.852557 19.983251 12.825539 13.224452  9.884093 23.986605
##  [666] 27.347727 13.112724 24.539410 17.446364 22.631738 27.475057 20.339913
##  [673] 25.005926  5.725866 27.792370 19.976089 14.525124 13.496238 14.686989
##  [680] 13.787938 21.222748 17.413299 16.379460 20.926740 23.426514 20.570499
##  [687] 18.955221 16.358490 14.518375 18.259032 24.388623 19.851534 24.263795
##  [694] 20.508802 23.490453 23.604823 30.821917 17.112666 28.061796 21.399119
##  [701] 14.020030 24.274097 22.501563 25.554326 22.196572 18.083461 16.777217
##  [708] 18.674679 24.969901 18.065136 19.449191 18.951551 19.938445 19.510714
##  [715] 20.773541 15.515024 20.427010 18.135582 24.499529 17.508473 21.297929
##  [722] 20.155726 14.467671 27.167297 14.100651 19.020739 19.312186 21.922437
##  [729] 23.640933 21.733844 16.119250 15.066110 20.492608 23.020375 15.410172
##  [736] 24.711375 17.860750 15.346812 10.741890 19.069142 12.522312 24.539702
##  [743] 14.646869  9.416764 14.813024 12.845232 16.467858 23.572861 25.800097
##  [750] 21.820436 25.667992 26.197608 24.038487 27.538993 22.547315 11.952797
##  [757] 16.988520 18.787902 13.209896 28.432599 28.028453 30.808149 26.098892
##  [764] 22.991297 23.922824 16.767674 17.977283 13.595873 19.380470 26.705748
##  [771] 18.101553 20.455591 24.288929 16.931702 26.647791 25.410494 23.997661
##  [778] 17.421244 26.228719 23.109662 19.784059 17.952581 12.270345 17.538716
##  [785] 29.667312 17.093947 15.903901 23.668957 15.435916 17.214028 22.676934
##  [792] 23.020585 25.096223 20.082626 26.464926 23.562940 24.843119 20.576021
##  [799] 15.338092 28.320969 22.411083 28.223990 20.562421 18.858559 18.363031
##  [806] 26.450312 21.303342 21.537317 16.635046 21.673814 18.039713 21.881039
##  [813] 17.113420 25.024165 11.845337 18.650689 10.118830 21.959444  8.681325
##  [820] 21.529718 25.752335 21.230174  9.751982 14.911126 18.237127 17.030312
##  [827] 19.890522 24.863057 27.974216 21.425946 20.514155 16.361574 20.319997
##  [834] 27.185150 13.271876 14.142214 20.252794 23.003208 28.642376 20.877704
##  [841] 15.228153 11.268180 18.467995 18.023514 18.167691 21.340486 15.333838
##  [848] 14.088961 26.654086 14.555083 22.274905 19.230557 17.739522 18.583125
##  [855] 15.813182 21.696966 18.387220  7.031953  8.107112 14.981593 19.943263
##  [862] 16.414387 20.193822 22.509161 21.903165 22.206280 13.997343 26.526363
##  [869] 11.120743 16.277740 19.052098 11.281215 20.103059 18.457395 17.030549
##  [876] 20.409316 20.946986 17.771075 27.379922 20.084374 18.348084 13.940797
##  [883] 24.967592 19.002595 20.676713 19.037690 25.295174 19.101042 21.822902
##  [890] 19.627249 21.363231 17.171911 19.277286 20.632275 15.846997 23.912671
##  [897] 16.253786 21.644355 22.282453 21.148580 16.073028 26.069650 18.876024
##  [904] 22.496124 11.921624 19.171535 23.352265 27.650660 19.794169 17.528966
##  [911] 17.735438 23.721708 27.865482 12.705528 12.376427 21.596281 24.607092
##  [918] 23.156100 17.724642 23.755842 17.933704 25.508812 13.435085 20.594686
##  [925] 23.570578 25.453220 22.859667 22.181393 27.228549 23.474136 25.171167
##  [932] 22.200766 23.276904 10.254805 26.452402 15.310472 17.875358 17.429585
##  [939] 17.488716 17.293244 25.927202 17.312178 20.161825 22.786469 16.936501
##  [946] 19.661289 19.350801 19.652278 22.211119 24.637481 22.707270 17.707109
##  [953] 22.297516 23.665854 19.827648 30.449888  9.261875 24.171955 21.526306
##  [960] 11.954958 18.575143 20.301626 18.054489 15.739948 17.543948 21.070879
##  [967] 24.248558 24.757416 27.848944 16.940773 21.047867 16.496940 27.373280
##  [974] 27.349239 19.505707 15.801964 16.965426 27.997669 15.616530 23.152912
##  [981] 13.339988 19.551794 11.449685 26.965451 22.518496 19.506780 16.117447
##  [988] 33.412638 19.459351 29.040467 17.369931 28.415843 21.755615 16.198435
##  [995] 14.215370 22.114178 27.870162 19.226345  7.723106 21.109744 22.878685
## [1002] 16.004407 28.077137 17.810148 15.328933 22.035910 19.666382 19.633252
## [1009] 23.504621 18.890491 23.803194 22.068999 21.020176 24.688764 14.024172
## [1016] 24.153848 18.683322 25.751386 18.032543  6.728599 25.976890 15.178530
## [1023] 23.522414 20.664333 23.749784 21.745180 15.114567 16.250849 14.228400
## [1030] 28.865782 19.248025 18.219085 24.115080 15.599247 18.896991 29.295635
## [1037] 18.878999 16.011812 23.962121 20.051282 16.358784 17.894072 17.110521
## [1044] 22.249007 23.891940 26.217265 13.110837 11.616086 28.573955 14.177176
## [1051] 20.937242 22.775968 28.934162 19.690356 18.791039 19.329685 11.868975
## [1058] 11.699685 18.611315 17.912005 27.920743 23.340212 22.532811 16.556747
## [1065] 25.252174 20.039379 17.088811 20.756690 13.480821 19.878249 19.396469
## [1072] 22.259811 24.591685 24.031272 20.439841 25.658786 14.003746 21.610951
## [1079] 19.876168 17.929194 13.055527 13.572889 23.725548 21.914527 14.397498
## [1086] 17.325354 22.755206 20.557371 20.384968 16.877115 19.246368 19.584673
## [1093] 16.047151 20.512686 11.411733 17.546933 24.635637 18.550429 23.601525
## [1100] 23.253595 25.725843 16.452836 21.638126 25.326507 14.446719 17.498534
## [1107] 20.904143 18.738450 18.097229 20.853129 19.084425 20.201317 21.367185
## [1114] 18.188072 24.751637 25.644739 21.161559 17.242639 25.145532 19.466452
## [1121] 24.065288 15.376006 23.058821 15.445166 20.259937 20.174394 20.379992
## [1128] 17.507372 17.444719 18.001749 21.676598 13.708644 21.175727 26.209733
## [1135] 24.590945 20.278447 17.326132 15.537749 20.626731 18.380763 22.074314
## [1142] 22.080451 27.547697 13.416174 26.341454 23.238910 22.018387 23.429149
## [1149] 25.751340 14.510214 16.322115 21.849074 24.491217 17.307425 19.610694
## [1156] 22.684649 31.909550 22.115321 22.531608 19.456968 17.651862 28.815005
## [1163] 21.679067 13.868458 20.178397 25.213407 23.418461 26.167499 17.215472
## [1170] 21.694328 24.483535 17.470578 22.970786 28.106262 27.757009 15.133802
## [1177] 18.224763 22.353439 27.646690 18.288546 26.332224 21.811150 22.929436
## [1184] 21.771862 26.044170 30.662520 16.682029 20.754196 25.029219 21.608259
## [1191] 14.621970 29.063206 10.753242 13.793826 16.934829 23.422865 16.466630
## [1198] 15.539257 26.478766 12.288623 21.849390 24.237357 24.329803 15.932128
## [1205] 13.626968 15.446094 16.663703 23.544431 19.313127 22.651122 18.271927
## [1212] 20.620251 12.798023 26.980373 20.445428 22.801257 21.309606 20.658216
## [1219] 13.322302 22.459101 11.122034 16.149902 24.274288 19.684219 27.974160
## [1226] 24.912088 14.240261 23.728483 20.888948 21.802699 22.247119 21.969577
## [1233] 31.319205 21.169660 22.516418 24.275091 15.457447 25.592218 19.997103
## [1240] 23.793003 20.230539 22.289911 14.464063 25.188106 20.260246 17.320775
## [1247] 21.618338 22.283118 13.200701 22.684054 28.057134 25.469214 21.349967
## [1254] 10.462941 20.472033 21.370058 20.319335 28.185333 25.156383 19.645484
## [1261] 17.841760 21.856805 20.460022 18.200052 14.233437 15.520727 24.925450
## [1268] 11.833598 17.099245 18.950960 16.762149 15.097300 17.826970 15.082437
## [1275] 26.495731 20.616673 21.134203 15.216928 20.920852 15.918579 25.067160
## [1282] 25.356293 27.226505 17.501344 13.696850 18.012999 26.159082 26.016190
## [1289] 16.706731 21.503012 14.747131 11.498937 29.288596 21.209760 16.597680
## [1296] 15.434332 20.655393 21.426957 16.540275 24.309478 20.114460 22.543073
## [1303] 18.264752 25.017719 21.799838 19.595346 27.920514 16.615727 19.312370
## [1310] 14.755215 23.092414 24.406783 19.507152 18.758139 22.717713 16.913181
## [1317] 21.407778 18.300286 23.180649 18.400034 16.372598 19.509005 20.562543
## [1324] 23.528149 17.599685 21.562239 25.030290 29.964853 20.035889 27.440709
## [1331] 23.443989 21.388689 18.800829 24.406686 21.821980 21.644349 24.238282
## [1338] 15.337022 23.973302 28.762900 18.627642 19.963517 20.523733 17.263334
## [1345] 15.650343 20.554001 22.348874  8.482884 20.744789 20.019935 26.255478
## [1352] 13.261222 15.649215 20.925338 17.818233 22.326517 23.765991 25.265930
## [1359] 17.307355 19.514001 21.556196 19.394347 19.547956 23.041385 25.337086
## [1366] 14.526311 14.099911 24.568013 20.945222 15.878217 15.886022 21.947490
## [1373] 28.131839 19.277900 22.584522 23.410897 24.234029 20.483359 17.036136
## [1380] 20.427509 18.757049 14.080081 20.773321 21.417179 15.797792 21.680847
## [1387] 32.952369 17.885347 16.085595 23.495500 22.624257 25.863633 12.594106
## [1394] 17.855887 22.126372 16.199032 23.347326 23.971684 13.588020 23.086907
## [1401] 20.371040 17.112492 17.662666 17.313193  9.483737 17.077979 27.482547
## [1408] 24.452416 12.327941 16.150276 20.750883 14.568002 21.831827 22.053081
## [1415] 18.692574 16.372076 27.515060 21.606345 14.532894 24.172120 26.632830
## [1422] 25.294476 23.808974 24.187003 27.129839 23.708101 15.557126 16.487241
## [1429] 19.265141 16.298452 27.472596 22.188136 27.892549 22.021532 23.540997
## [1436] 20.985985 21.959757 13.978594 22.755645 22.125386 17.182145 23.796195
## [1443] 20.998514 12.793967 23.237729 17.901152 22.527447 22.241649 21.014059
## [1450] 28.846820 17.135556 17.450433 18.085715 19.356480 31.988632 25.090968
## [1457] 29.858842 11.341890 16.176713 18.458690 23.786738 25.206474 20.296947
## [1464] 23.836355 23.770729 18.491945 16.354802 27.849948 19.899777 26.356731
## [1471] 24.747402 24.081668 22.017858 13.202142 24.619869 26.180719 16.173715
## [1478] 12.691275 23.185877 28.280002 14.052465 23.112990 18.675006 20.826061
## [1485] 19.704459 21.708800 22.400570 13.870411 28.060872 15.029927 21.801843
## [1492] 25.119048 20.337148 27.749278 21.455047 20.307113 19.339852 20.774127
## [1499] 28.696357 18.907045 14.244701 24.351973 14.742912 24.750937 15.332682
## [1506] 23.034158 27.594866 21.276734 28.025148 19.983517 14.883019 20.370464
## [1513] 19.094800 27.110830 18.586576 17.196093 19.601323 21.860328 20.627441
## [1520] 19.054453 26.424449 14.030817 15.458010 12.895522 10.498930 21.542594
## [1527] 19.333081 17.989889 24.213597 25.232614 19.373715 18.451995 22.405795
## [1534] 14.285732 23.704736 23.161648 21.934490 22.207968 20.572672 18.562051
## [1541] 32.359814 21.324534 16.887340 25.976815 23.576492 18.805771 16.830115
## [1548] 22.079853 25.052886 17.259781 23.753178 24.653166 26.655650 22.144827
## [1555] 21.120593 23.411604 21.705769 19.362967 12.148133 22.437892 25.403598
## [1562] 20.678081 20.187564 15.322447 19.605660 15.214392 15.577210 20.638814
## [1569] 21.862844 31.518045 23.381714 23.214944 19.346123 12.630788 16.290182
## [1576]  9.050959 15.467404 12.353587 18.309922 16.462570 19.109355 20.144071
## [1583] 21.921957 16.639196 14.306895 20.458714 16.410072 27.882426 16.350942
## [1590] 30.346596 12.458849 18.288438 22.364206 17.485904 13.702502 15.917248
## [1597] 21.839063 20.440370 17.510386 14.834048 18.518710 18.573546 16.902852
## [1604] 17.885868 17.408210 12.215115 17.788525 13.862015 16.190287 20.478595
## [1611] 14.220486 18.427752 15.010574 14.453278 11.191398 17.781501 16.687008
## [1618] 19.201712 17.566032 28.099098 24.528862 18.890952 27.604704 19.547328
## [1625] 18.958567 22.689087 19.105877 25.351961 15.491445 26.460585 23.790671
## [1632] 15.504305 16.949525 22.675323 26.344112 22.181006 19.457432 22.538824
## [1639] 27.249589 18.220184 31.968291  9.632330 14.799553 24.369131 18.366155
## [1646] 19.900681 11.553433 22.557860 18.235395 13.439549 21.761802 16.057950
## [1653] 24.579343 22.045465 15.552633 24.593165 19.761437 17.868800 24.848619
## [1660] 19.611072 16.746232 25.237225 22.771872 21.900569 26.548708 19.082813
## [1667]  9.342312 23.394798 23.476588 13.162865 11.357036 20.539342 11.730997
## [1674] 17.134234 18.384537 30.851497 19.807433 28.223531 16.384958 22.740787
## [1681] 26.472641 22.000499 21.941976 25.566576 26.803767 22.193988 22.926493
## [1688] 16.772974 32.816611 18.304975 15.270247 22.792223 21.236403 20.898471
## [1695] 23.877372 20.018196 14.362139 14.721403 20.139683 26.066573 14.396742
## [1702] 14.812059 26.037745 20.969625 22.085662 18.881149 29.906303 19.302351
## [1709] 21.722439 25.501202 21.739407 22.119721 28.034580 16.338763 16.407521
## [1716] 20.117792 18.291391 13.184195 20.776175 32.545055 21.591165 27.302825
## [1723] 20.229760  5.164226 21.151608 22.681765 22.384509 28.175712 15.214924
## [1730] 12.770860 26.081313 14.540617 24.722028 25.074972 22.945123 22.152597
## [1737] 15.680228 22.693902 24.374168 17.096556 26.408484 21.772559 25.317100
## [1744] 25.381627 30.751140 21.582015 14.803095 21.574797 22.669725 14.138012
## [1751] 17.866416 13.820284 22.483293 20.099005 28.003867 21.204649 20.603084
## [1758]  9.639786 20.302943 15.833498 14.688521 19.403570 18.138843 26.071408
## [1765] 27.448818 29.430404 22.398789 23.274090 15.716734 16.044524 22.994122
## [1772] 21.276495 21.250044 11.571329 19.086546 26.366027 16.735815 26.469434
## [1779] 16.110623 28.057084  7.656286 14.441179 24.108279 19.727454 22.030500
## [1786] 19.115291 26.970884 24.543878 14.593660 23.844389 21.640205 20.844210
## [1793] 22.607107 17.170946 14.564346 18.686085 31.788198 19.827565 15.221050
## [1800] 21.653763 20.909293 23.328369 14.393363 22.394899 17.249828 20.095300
## [1807] 15.714465 19.316996 23.021923 21.401728 20.459350 19.914774 21.652886
## [1814] 27.269927 15.725644 23.590963 24.806454 19.909403 10.689479 22.448258
## [1821] 22.884008 15.873038 18.703345 15.520258 20.194312  8.339272 16.709326
## [1828] 29.477777 16.813595 17.666818 22.222898 18.354641 25.601826 23.593142
## [1835] 23.294829 18.105758 24.770969 13.155478 24.527629 26.150332 20.838357
## [1842] 17.660791 16.481050 20.798333 22.591042 17.678697 19.825327 16.783792
## [1849] 16.778785 24.842079 24.070499 20.214969 17.334226 19.886988 15.927647
## [1856] 15.311297 14.095842 13.248946 18.720010 21.262447 27.042154 14.431436
## [1863] 24.641483 19.601353 13.670551 11.964039 18.911168 17.033927 19.283305
## [1870] 27.004889 19.253395 22.307222 19.288534 24.100373 13.842369 16.312746
## [1877] 20.996428 28.581659 34.429367 26.376060 19.912655 17.938158 15.173860
## [1884] 22.409416 21.171775 20.505463 13.292533 25.646257 13.550452 19.109936
## [1891] 26.721237 23.135550 16.290805 21.860937 20.889072 28.280430 23.291534
## [1898] 25.577483 14.949981 10.907245 16.577350 16.074224 19.852842 24.761908
## [1905] 15.026261 21.404282 21.949140 14.126499 20.792039 15.129039 21.715313
## [1912] 23.212388 20.052104 16.603217 11.814569 19.076780 24.888597 21.378735
## [1919] 20.400006 15.762426 24.235017 18.446554 20.583171 21.676805 12.027276
## [1926] 19.189705 29.402299 21.904182 24.198032 25.068206 21.231163 21.691263
## [1933] 21.126444 20.990621 11.612202 12.200609 25.945436 19.873818 16.115906
## [1940] 15.411786 28.170287 21.205832 17.456547 12.434411 17.760345 21.100232
## [1947] 23.290259 17.897504 20.781909 30.287227 23.166209 21.806153 15.844174
## [1954] 17.354433 22.902067 18.283871 21.189930 22.889282 17.257296 27.372023
## [1961] 24.440098 18.035632 26.036330 22.470693 17.968487 23.750964 20.752779
## [1968] 23.117997 22.621759 22.239145 26.604758 24.428354 26.434640 10.216840
## [1975] 18.290319 19.601266 18.675425 22.045961 17.276839 15.707073 22.173221
## [1982] 20.756778 19.359507 22.325965 15.606949 20.545710 18.510631 18.263884
## [1989] 18.476644 23.219211 21.524206 19.204385 25.559657 15.181932 18.211092
## [1996] 18.682496 27.377700 12.139080 13.640059 23.307632

Penjelasan:

  1. set.seed(300) digunakan untuk menetapkan seed (angka acak) agar hasil yang dihasilkan oleh fungsi acak (seperti rnorm) dapat direplikasi. Ini memastikan bahwa setiap kali kode dijalankan, hasilnya akan sama.
  2. rnorm(2000, 20, 4.5) menghasilkan 2000 observasi dari distribusi normal dengan mean 20 dan standar deviasi 4.5. Hasilnya disimpan dalam vektor myData.

Melakukan Pemeriksaan Awal (Sanity Checks) pada myData Menggunakan length(), mean(), dan sd()

Untuk memastikan bahwa vektor myData telah dibuat dengan benar, kita memverifikasi bahwa: 1. Terdapat 2000 observasi (menggunakan length()), 2. Nilai rata-rata (mean) mendekati 20 (menggunakan mean()), dan 3. Standar deviasi mendekati 4.5 (menggunakan sd()). Catatan: Kita tidak seharusnya mengharapkan mean dan standar deviasi memiliki nilai yang persis sama dengan yang kita masukkan ke dalam rnorm(), karena ada unsur acak yang terlibat saat menggunakan fungsi ini (rnorm menghasilkan distribusi normal acak di sekitar mean dan standar deviasi yang diberikan)

length(myData) # How many observations?
## [1] 2000

length(myData) menghitung jumlah observasi dalam vektor myData. Harusnya menghasilkan 2000 karena kita membuat 2000 observasi.

mean(myData) # What is the mean?
## [1] 20.25773

mean(myData) menghitung rata-rata dari vektor myData. Harusnya mendekati 20 karena kita menetapkan mean = 20 saat membuat data.

sd(myData) # What is the standard deviation?
## [1] 4.590852

sd(myData) menghitung standar deviasi dari vektor myData. Harusnya mendekati 4.5 karena kita menetapkan standar deviasi = 4.5 saat membuat data.

Membuat Grafik untuk myData

Untuk tujuan visual, berikut adalah grafik dari vektor myData. Garis putus-putus merah menunjukkan nilai mean (20.25773) dari distribusi ini.

# Membuat histogram dari myData
hist(myData, breaks = 30, col = "lightblue", main = "Distribusi myData", xlab = "Nilai", ylab 
= "Frekuensi")

# Menambahkan garis vertikal untuk mean
abline(v = mean(myData), col = "red", lwd = 2, lty = 2)

# Menambahkan legenda
legend("topright", legend = paste("Mean =", round(mean(myData), 5)), col = "red", lty = 2, lwd = 2)

Penjelasan: 1. hist() digunakan untuk membuat histogram dari myData. breaks = 30 menentukan jumlah bin (kelompok) pada histogram. col = “lightblue” memberikan warna biru muda pada histogram. main, xlab, dan ylab masing-masing digunakan untuk judul grafik, label sumbu x, dan label sumbu y.

  1. abline() menambahkan garis vertikal pada nilai mean. v = mean(myData) menentukan posisi garis pada nilai mean. col = “red” memberikan warna merah pada garis. lwd = 2 menentukan ketebalan garis. lty = 2 membuat garis menjadi putus-putus.

  2. legend() menambahkan legenda ke grafik untuk menjelaskan garis merah. Output dari kode ini adalah histogram yang menunjukkan distribusi myData dengan garis merah putusputus yang menandakan nilai mean.

2. Bootstrapping Menggunakan Fungsi Dasar R

Apa itu bootstrapping? Bootstrapping adalah metode untuk memperhitungkan ketidakpastian saat kita mengukur estimasi sampel. Dengan menggunakan pengambilan sampel acak dengan pengembalian (random sampling with replacement), kita menghitung estimasi kita untuk berbagai sampel acak yang diambil dari distribusi asli kita.

Analogi dengan “Mean of Means” pada Dadu Perhatikan kejadian saat menghitung “rata-rata dari rata-rata” (mean of means) untuk lemparan dadu, kita memperkirakan seberapa besar kemungkinan kita akan mengamati estimasi sampel tertentu (misalnya, mean, standar deviasi). Jika kita mengambil sampel ulang secara acak dari distribusi dasar ini dengan penggantian sejumlah besar kali. Alasan kita mengambil sampel ulang dengan penggantian adalah untuk memungkinkan angka-angka tertentu dipilih beberapa kali, yang menciptakan varians yang lebih besar dalam distribusi yang dihasilkan.

Mengapa Menggunakan Pengembalian (Replacement)? Alasan kita menggunakan pengembalian adalah untuk memungkinkan angka tertentu dipilih lebih dari satu kali, yang menciptakan variasi yang lebih besar dalam distribusi yang dihasilkan.

Langkah-langkah Bootstrapping:

  1. Ambil sampel acak dengan pengembalian dari distribusi asli.
  2. Hitung estimasi (misalnya, mean, median, standar deviasi) untuk sampel tersebut.
  3. Ulangi proses ini berkali-kali (misalnya, 1000 kali) untuk menghasilkan distribusi estimasi.
  4. Analisis distribusi estimasi ini untuk memahami variabilitas dan ketidakpastian dari estimasi sampel.

Resampling dari myData Sebanyak 1000 Kali Menggunakan for(i in x)

Secara sederhana, yang kita lakukan di sini adalah menghitung mean dari 1000 sampel yang masing-masing terdiri dari 2000 observasi dari myData menggunakan perulangan for(i in x). Mean dari setiap sampel ini disimpan dalam sebuah vektor (bootstrap.results).

Tujuan:

Kita tertarik untuk mengukur ketidakpastian dalam distribusi estimasi kita (dalam hal ini, mean). Untuk melakukannya, kita menghitung standar deviasi dari setiap mean yang dihitung menggunakan pengambilan sampel acak dengan pengembalian (random sampling with replacement).

set.seed(200) # Setting the seed for replication purposes
sample.size <- 2000 # Sample size
n.samples <- 1000 # Number of bootstrap samples
bootstrap.results <- c() # Creating an empty vector to hold the results
for (i in 1:n.samples)
{
 obs <- sample(1:sample.size, replace=TRUE)
 bootstrap.results[i] <- mean(myData[obs]) # Mean of the bootstrap sample
}

Penjelasan:

- set.seed(200) menetapkan seed untuk replikasi. sample.size <- 2000 menentukan ukuran sampel (sama dengan

- jumlah observasi dalam myData). n.samples <- 1000 menentukan jumlah sampel bootstrap yang akan diambil.

- bootstrap.results <- c() membuat vektor kosong untuk menyimpan hasil bootstrap. - for (i in 1:n.samples) melakukan perulangan sebanyak 1000 kali.

- obs <- sample(1:sample.size, replace=TRUE) mengambil sampel acak dengan pengembalian dari indeks 1 hingga 2000.

- bootstrap.results[i] <- mean(myData[obs]) menghitung mean dari sampel yang diambil dan menyimpannya dalam vektor bootstrap.results.

length(bootstrap.results)
## [1] 1000

length(bootstrap.results) memeriksa panjang vektor bootstrap.results. Harusnya 1000 karena kita mengambil 1000 sampel.

summary(bootstrap.results) # Sanity check
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   19.92   20.19   20.26   20.26   20.33   20.57

summary(bootstrap.results) memberikan ringkasan statistik dari vektor bootstrap.results, termasuk min, max, mean, dan kuartil.

sd(bootstrap.results)
## [1] 0.1021229

sd(bootstrap.results) menghitung standar deviasi dari distribusi mean yang dihasilkan oleh bootstrapping.

par(mfrow=c(2,1), pin=c(5.8,0.98))
hist(bootstrap.results, # Creating an histogram
 col="#d83737", # Changing the color
 xlab="Mean", # Giving a label to the x axis
 main=paste("Means of 1000 bootstrap samples from myData")) # Giving a title to the graph

hist(myData, # Creating an histogram
 col="#37aad8", # Changing the color
 xlab="Value", # Giving a label to the x axis
 main=paste("Distribution of myData")) # Giving a title to the graph

Penjelasan:

- par(mfrow=c(2,1), pin=c(5.8,0.98)) mengatur tata letak plot menjadi 2 baris dan 1 kolom, serta menentukan ukuran plot.

- hist(bootstrap.results, col=“#d83737”, xlab=“Mean”, main=paste(“Means of 1000 bootstrap samples from myData”)) membuat histogram dari distribusi mean hasil bootstrapping.

- hist(myData, col=“#37aad8”, xlab=“Value”, main=paste(“Distribution of myData”)) membuat histogram dari data asli myData.

Pengambilan sampel ulang sebanyak 1000 kali dari proses pembuatan data aktual menggunakan for(i in x)

Demikian pula, kita juga dapat mengambil 1000 sampel acak dari proses pembuatan data asli.

set.seed(200) # Setting the seed for replication purposes
sample.size <- 2000 # Sample size
n.samples <- 1000 # Number of bootstrap samples
bootstrap.results <- c() # Creating an empty vector to hold the results
for (i in 1:n.samples)
{
 bootstrap.results[i] <- mean(rnorm(2000,20,4.5)) # Mean of the bootstrap sample
}

Penjelasan:

- set.seed(200) digunakan untuk menetapkan seed agar hasil yang dihasilkan dapat direplikasi. Ini memastikan bahwa setiap kali kode dijalankan, hasilnya akan sama.

- sample.size <- 2000 menentukan ukuran sampel yang akan dihasilkan setiap kali (dalam hal ini, 2000 observasi).

- n.samples <- 1000 menentukan jumlah sampel bootstrap yang akan diambil (dalam hal ini, 1000 sampel).

- bootstrap.results <- c() membuat vektor kosong untuk menyimpan hasil bootstrap (yaitu mean dari setiap sampel). for (i in 1:n.samples) melakukan perulangan sebanyak 1000 kali.

- Di dalam perulangan, rnorm(2000, 20, 4.5) menghasilkan 2000 observasi dari distribusi normal dengan mean 20 dan standar deviasi 4.5. - mean(rnorm(2000, 20, 4.5)) menghitung mean dari sampel yang baru saja dihasilkan.

- bootstrap.results[i] menyimpan mean tersebut ke dalam vektor bootstrap.results.

length(bootstrap.results)
## [1] 1000

length(bootstrap.results) memeriksa panjang vektor bootstrap.results. Harusnya menghasilkan 1000 karena kita mengambil 1000 sampel bootstrap

summary(bootstrap.results)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   19.64   19.93   20.00   20.00   20.07   20.32

summary(bootstrap.results) memberikan ringkasan statistik dari vektor bootstrap.results, termasuk nilai minimum, kuartil pertama (Q1), median (Q2), mean, kuartil ketiga (Q3), dan nilai maksimum. Ini membantu kita memahami distribusi dari mean yang dihasilkan oleh bootstrapping.

sd(bootstrap.results)
## [1] 0.1041927

sd(bootstrap.results) menghitung standar deviasi dari distribusi mean yang dihasilkan oleh bootstrapping. Standar deviasi ini mengukur variabilitas atau ketidakpastian dari estimasi mean yang kita peroleh melalui bootstrapping.

par(mfrow=c(2,1), pin=c(5.8,0.98))
hist(bootstrap.results, # Creating an histogram
 col="#d83737", # Changing the color
 xlab="Mean", # Giving a label to the x axis
 main=paste("Means of 1000 bootstrap samples from the DGP"))

hist(myData, # Creating an histogram
 col="#37aad8", # Changing the color
 xlab="Value", # Giving a label to the x axis
 main=paste("Distribution of myData"))

Penjelasan:

- par(mfrow=c(2,1), pin=c(5.8,0.98)) mengatur tata letak plot menjadi 2 baris dan 1 kolom, serta menentukan ukuran plot.

- hist(bootstrap.results, col=“#d83737”, xlab=“Mean”, main=paste(“Means of 1000 bootstrap samples from the DGP”)) membuat histogram dari distribusi mean hasil bootstrapping.

- col=“#d83737” memberikan warna merah pada histogram.

- xlab=“Mean” memberikan label “Mean” pada sumbu x.

- main=paste(“Means of 1000 bootstrap samples from the DGP”) memberikan judul grafik.

- hist(myData, col=“#37aad8”, xlab=“Value”, main=paste(“Distribution of myData”)) membuat histogram dari data asli myData.

- col=“#37aad8” memberikan warna biru pada histogram.

- xlab=“Value” memberikan label “Value” pada sumbu x. - main=paste(“Distribution of myData”) memberikan judul grafik

Exercises

  1. Latihan 1 Tetapkan benih Anda pada angka 150. Hasilkan distribusi normal acak dari 1000 observasi, dengan rata-rata 30 dan simpangan baku 2,5. Hitung rata-rata dari 50 sampel dari 1000 observasi dari kumpulan data tersebut. Simpan hasil Anda dalam vektor. Fungsi yang relevan: set.seed(), rnorm(), for(i in x), sample().
  2. Latihan 2 Hasilkan dua histogram untuk menampilkan secara grafis distribusi rata-rata yang diperoleh dalam Latihan 1 serta nilai dari 1000 observasi dalam kumpulan data asli Anda. Gabungkan histogram ini menjadi satu grafik keseluruhan. Fungsi yang relevan: par(), hist().

Latihan 1

set.seed(150)

# 1. Buat data normal acak
data <- rnorm(1000, mean = 30, sd = 2.5)

# 2. Ambil 50 sampel dan hitung rata-ratanya, simpan dalam vektor
mean_samples <- numeric(50)

for(i in 1:50){
  sampel <- sample(data, size = 30, replace = FALSE)
  mean_samples[i] <- mean(sampel)
}

Latihan 2

# 2. Histogram data asli
hist(data, 
     main = "Histogram Data Asli (1000 Observasi)",
     xlab = "Nilai", 
     col = "skyblue", 
     border = "white")

# 3. Histogram rata-rata sampel
hist(mean_samples, 
     main = "Histogram Rata-rata 50 Sampel", 
     xlab = "Rata-rata Sampel", 
     col = "salmon", 
     border = "white")