This is a summary of a set of 1 experiments using a LONI pipeline workflow file that performs 3000 independent jobs, each one with the CBDA-SL and the knockoff filter feature mining strategies. Each experiments has a total of 9000 jobs and is uniquely identified by 6 input arguments: # of jobs [M], % of missing values [misValperc], min [Kcol_min] and max [Kcol_max] % for FSR-Feature Sampling Range, min [Nrow_min] and max [Nrow_max] % for SSR-Subject Sampling Range.
This document has the final results, by experiment. See https://drive.google.com/file/d/0B5sz_T_1CNJQWmlsRTZEcjBEOEk/view?ths=true for some general documentation of the CBDA-SL project and github https://github.com/SOCR/CBDA for some of the code.
Features selected by both the knockoff filter and the CBDA-SL algorithms are shown as spikes in the histograms shown below. I list the top features selected, set to 15 here.
## [1] EXPERIMENT 2
## M misValperc Kcol_min Kcol_max Nrow_min Nrow_max
## 9000 0 5 15 30 60
## M misValperc Kcol_min Kcol_max Nrow_min Nrow_max
## 2 9000 0 5 15 30 60
## [1] "TABLE with CBDA-SL & KNOCKOFF FILTER RESULTS"
## [1] "EXPERIMENT" "2"
## Accuracy Count Density MSE Count Density Knockoff Count Density
## 887 143 0.1568154 387 138 0.1494105 408 109 6.5465465
## 423 141 0.1546222 629 138 0.1494105 859 41 2.4624625
## 783 140 0.1535256 815 133 0.1439971 627 34 2.0420420
## 436 139 0.1524290 60 132 0.1429144 780 33 1.9819820
## 444 138 0.1513324 229 131 0.1418317 887 24 1.4414414
## 627 138 0.1513324 865 131 0.1418317 687 22 1.3213213
## 892 136 0.1491392 164 130 0.1407490 845 21 1.2612613
## 225 134 0.1469459 264 130 0.1407490 139 20 1.2012012
## 346 134 0.1469459 642 130 0.1407490 327 20 1.2012012
## 240 132 0.1447527 719 130 0.1407490 510 19 1.1411411
## 553 130 0.1425595 166 128 0.1385836 68 18 1.0810811
## 467 129 0.1414629 344 128 0.1385836 212 18 1.0810811
## 564 128 0.1403663 427 128 0.1385836 13 17 1.0210210
## 655 128 0.1403663 459 127 0.1375009 444 16 0.9609610
## 879 128 0.1403663 23 126 0.1364183 490 15 0.9009009
##
##
##
##
##
##
## [1] EXPERIMENT 3
## M misValperc Kcol_min Kcol_max Nrow_min Nrow_max
## 9000 0 15 30 30 60
## M misValperc Kcol_min Kcol_max Nrow_min Nrow_max
## 3 9000 0 15 30 30 60
## [1] "TABLE with CBDA-SL & KNOCKOFF FILTER RESULTS"
## [1] "EXPERIMENT" "3"
## Accuracy Count Density MSE Count Density Knockoff Count Density
## 887 293 0.1424231 404 281 0.1341007 780 2 11.764706
## 524 281 0.1365901 748 279 0.1331463 27 1 5.882353
## 261 279 0.1356179 333 273 0.1302829 139 1 5.882353
## 616 272 0.1322153 127 271 0.1293284 227 1 5.882353
## 212 270 0.1312432 760 271 0.1293284 328 1 5.882353
## 423 269 0.1307571 883 271 0.1293284 345 1 5.882353
## 845 269 0.1307571 129 270 0.1288512 446 1 5.882353
## 337 267 0.1297849 545 270 0.1288512 475 1 5.882353
## 824 266 0.1292988 655 270 0.1288512 504 1 5.882353
## 327 264 0.1283266 331 269 0.1283740 585 1 5.882353
## 378 263 0.1278406 818 268 0.1278968 606 1 5.882353
## 892 262 0.1273545 511 265 0.1264651 627 1 5.882353
## 87 261 0.1268684 685 265 0.1264651 700 1 5.882353
## 299 261 0.1268684 66 264 0.1259879 784 1 5.882353
## 746 261 0.1268684 152 264 0.1259879 816 1 5.882353
##
##
##
##
##
##
## [1] EXPERIMENT 4
## M misValperc Kcol_min Kcol_max Nrow_min Nrow_max
## 9000 0 1 5 60 80
## M misValperc Kcol_min Kcol_max Nrow_min Nrow_max
## 4 9000 0 1 5 60 80
## [1] "TABLE with CBDA-SL & KNOCKOFF FILTER RESULTS"
## [1] "EXPERIMENT" "4"
## Accuracy Count Density MSE Count Density Knockoff Count Density
## 887 62 0.2292306 832 55 0.1851415 408 102 10.909091
## 25 60 0.2218361 33 52 0.1750429 859 37 3.957219
## 542 56 0.2070470 457 52 0.1750429 780 34 3.636364
## 137 54 0.1996525 71 51 0.1716767 627 32 3.422460
## 42 53 0.1959552 184 51 0.1716767 872 23 2.459893
## 40 52 0.1922579 486 50 0.1683105 490 21 2.245989
## 872 52 0.1922579 630 50 0.1683105 687 17 1.818182
## 12 51 0.1885607 50 49 0.1649443 712 17 1.818182
## 139 51 0.1885607 63 49 0.1649443 510 15 1.604278
## 261 51 0.1885607 152 49 0.1649443 327 14 1.497326
## 870 51 0.1885607 466 49 0.1649443 13 13 1.390374
## 13 48 0.1774689 496 49 0.1649443 512 13 1.390374
## 650 48 0.1774689 597 49 0.1649443 61 12 1.283422
## 553 47 0.1737716 649 49 0.1649443 139 12 1.283422
## 606 47 0.1737716 703 49 0.1649443 212 12 1.283422
##
##
##
##
##
##
## [1] EXPERIMENT 5
## M misValperc Kcol_min Kcol_max Nrow_min Nrow_max
## 9000 0 5 15 60 80
## M misValperc Kcol_min Kcol_max Nrow_min Nrow_max
## 5 9000 0 5 15 60 80
## [1] "TABLE with CBDA-SL & KNOCKOFF FILTER RESULTS"
## [1] "EXPERIMENT" "5"
## Accuracy Count Density MSE Count Density Knockoff Count Density
## 887 194 0.2039722 140 139 0.1508263 408 236 20.450607
## 423 155 0.1629675 258 137 0.1486561 780 75 6.499133
## 542 155 0.1629675 276 137 0.1486561 627 58 5.025997
## 627 154 0.1619161 154 132 0.1432307 859 48 4.159445
## 348 150 0.1577105 772 132 0.1432307 771 34 2.946274
## 700 150 0.1577105 812 132 0.1432307 687 31 2.686308
## 261 149 0.1566591 330 131 0.1421456 512 25 2.166378
## 714 144 0.1514020 407 131 0.1421456 212 24 2.079723
## 137 143 0.1503506 898 130 0.1410606 490 20 1.733102
## 248 142 0.1492992 177 129 0.1399755 872 20 1.733102
## 570 142 0.1492992 691 129 0.1399755 327 18 1.559792
## 706 141 0.1482478 429 128 0.1388904 346 16 1.386482
## 524 140 0.1471964 593 128 0.1388904 13 13 1.126516
## 845 140 0.1471964 849 128 0.1388904 345 13 1.126516
## 12 138 0.1450936 50 127 0.1378053 510 13 1.126516
##
##
##
##
##
##
## [1] EXPERIMENT 6
## M misValperc Kcol_min Kcol_max Nrow_min Nrow_max
## 9000 0 15 30 60 80
## M misValperc Kcol_min Kcol_max Nrow_min Nrow_max
## 6 9000 0 15 30 60 80
## [1] "TABLE with CBDA-SL & KNOCKOFF FILTER RESULTS"
## [1] "EXPERIMENT" "6"
## Accuracy Count Density MSE Count Density Knockoff Count Density
## 887 314 0.1606015 515 282 0.1357826 408 126 12.524851
## 261 283 0.1447459 199 278 0.1338566 780 56 5.566600
## 408 275 0.1406542 280 274 0.1319306 859 45 4.473161
## 512 274 0.1401427 28 273 0.1314491 627 43 4.274354
## 627 272 0.1391198 668 273 0.1314491 512 23 2.286282
## 524 269 0.1375854 361 272 0.1309676 490 21 2.087475
## 894 265 0.1355395 493 272 0.1309676 510 20 1.988072
## 212 264 0.1350280 111 270 0.1300046 712 20 1.988072
## 709 264 0.1350280 496 268 0.1290416 68 19 1.888668
## 137 263 0.1345165 80 266 0.1280786 616 19 1.888668
## 388 261 0.1334936 365 266 0.1280786 212 18 1.789264
## 892 261 0.1334936 528 266 0.1280786 845 18 1.789264
## 870 258 0.1319592 640 266 0.1280786 771 17 1.689861
## 687 257 0.1314477 35 265 0.1275971 13 15 1.491054
## 327 256 0.1309362 601 265 0.1275971 139 15 1.491054
##
##
##
##
##
##
## [1] EXPERIMENT 7
## M misValperc Kcol_min Kcol_max Nrow_min Nrow_max
## 9000 20 1 5 30 60
## M misValperc Kcol_min Kcol_max Nrow_min Nrow_max
## 7 9000 20 1 5 30 60
## [1] "TABLE with CBDA-SL & KNOCKOFF FILTER RESULTS"
## [1] "EXPERIMENT" "7"
## Accuracy Count Density MSE Count Density Knockoff Count Density
## 887 66 0.2403321 350 51 0.1738775 408 58 5.1601423
## 692 53 0.1929940 365 51 0.1738775 780 25 2.2241993
## 12 50 0.1820698 226 50 0.1704681 512 16 1.4234875
## 212 50 0.1820698 287 50 0.1704681 859 16 1.4234875
## 324 49 0.1784284 336 50 0.1704681 627 14 1.2455516
## 341 48 0.1747870 697 49 0.1670587 771 14 1.2455516
## 446 48 0.1747870 481 48 0.1636494 212 13 1.1565836
## 700 48 0.1747870 614 48 0.1636494 892 13 1.1565836
## 791 47 0.1711456 633 48 0.1636494 490 12 1.0676157
## 245 46 0.1675042 740 48 0.1636494 687 12 1.0676157
## 440 46 0.1675042 193 47 0.1602400 702 12 1.0676157
## 509 46 0.1675042 198 47 0.1602400 712 12 1.0676157
## 553 46 0.1675042 9 46 0.1568307 510 11 0.9786477
## 714 46 0.1675042 246 46 0.1568307 845 11 0.9786477
## 746 46 0.1675042 252 46 0.1568307 872 11 0.9786477
##
##
##
##
##
##
## [1] EXPERIMENT 8
## M misValperc Kcol_min Kcol_max Nrow_min Nrow_max
## 9000 20 5 15 30 60
## M misValperc Kcol_min Kcol_max Nrow_min Nrow_max
## 8 9000 20 5 15 30 60
## [1] "TABLE with CBDA-SL & KNOCKOFF FILTER RESULTS"
## [1] "EXPERIMENT" "8"
## Accuracy Count Density MSE Count Density Knockoff Count Density
## 627 140 0.1527317 361 145 0.1567940 408 95 5.9006211
## 212 135 0.1472770 593 140 0.1513874 780 42 2.6086957
## 261 134 0.1461861 177 134 0.1448993 627 32 1.9875776
## 845 134 0.1461861 36 131 0.1416553 859 32 1.9875776
## 245 133 0.1450951 359 131 0.1416553 388 26 1.6149068
## 512 133 0.1450951 244 130 0.1405740 687 26 1.6149068
## 553 133 0.1450951 760 130 0.1405740 212 22 1.3664596
## 887 133 0.1450951 682 129 0.1394926 490 22 1.3664596
## 337 132 0.1440042 91 128 0.1384113 327 21 1.3043478
## 256 130 0.1418223 568 128 0.1384113 771 20 1.2422360
## 857 129 0.1407314 374 127 0.1373300 68 19 1.1801242
## 180 128 0.1396404 532 127 0.1373300 845 16 0.9937888
## 40 127 0.1385495 740 127 0.1373300 887 16 0.9937888
## 570 127 0.1385495 425 126 0.1362486 139 15 0.9316770
## 12 126 0.1374585 787 126 0.1362486 337 15 0.9316770
##
##
##
##
##
##
## [1] EXPERIMENT 10
## M misValperc Kcol_min Kcol_max Nrow_min Nrow_max
## 9000 20 1 5 60 80
## M misValperc Kcol_min Kcol_max Nrow_min Nrow_max
## 10 9000 20 1 5 60 80
## [1] "TABLE with CBDA-SL & KNOCKOFF FILTER RESULTS"
## [1] "EXPERIMENT" "10"
## Accuracy Count Density MSE Count Density Knockoff Count Density
## 40 62 0.2290866 16 53 0.1764432 408 119 12.740899
## 261 56 0.2069169 437 52 0.1731141 780 43 4.603854
## 512 56 0.2069169 529 52 0.1731141 627 31 3.319058
## 25 55 0.2032220 602 50 0.1664558 859 30 3.211991
## 542 55 0.2032220 148 49 0.1631267 490 23 2.462527
## 887 54 0.1995270 181 49 0.1631267 512 19 2.034261
## 249 53 0.1958321 599 49 0.1631267 327 17 1.820128
## 114 51 0.1884422 601 48 0.1597976 712 16 1.713062
## 553 51 0.1884422 672 48 0.1597976 771 16 1.713062
## 714 51 0.1884422 29 47 0.1564685 13 15 1.605996
## 692 50 0.1847473 69 47 0.1564685 887 15 1.605996
## 732 50 0.1847473 204 47 0.1564685 212 14 1.498929
## 413 49 0.1810523 205 47 0.1564685 510 14 1.498929
## 550 49 0.1810523 340 47 0.1564685 68 13 1.391863
## 499 48 0.1773574 342 47 0.1564685 139 13 1.391863
##
##
##
##
##
##
## [1] EXPERIMENT 11
## M misValperc Kcol_min Kcol_max Nrow_min Nrow_max
## 9000 20 5 15 60 80
## M misValperc Kcol_min Kcol_max Nrow_min Nrow_max
## 11 9000 20 5 15 60 80
## [1] "TABLE with CBDA-SL & KNOCKOFF FILTER RESULTS"
## [1] "EXPERIMENT" "11"
## Accuracy Count Density MSE Count Density Knockoff Count Density
## 423 157 0.1665305 117 148 0.1562335 408 223 19.273984
## 13 150 0.1591056 681 147 0.1551779 780 73 6.309421
## 337 149 0.1580449 853 146 0.1541222 859 68 5.877269
## 627 148 0.1569842 296 136 0.1435659 627 46 3.975799
## 512 147 0.1559235 350 133 0.1403990 212 25 2.160761
## 212 146 0.1548628 899 133 0.1403990 490 24 2.074330
## 590 146 0.1548628 875 132 0.1393434 771 23 1.987900
## 256 143 0.1516807 267 131 0.1382878 512 22 1.901469
## 887 142 0.1506200 495 131 0.1382878 687 22 1.901469
## 700 141 0.1495593 634 131 0.1382878 68 19 1.642178
## 692 140 0.1484986 689 131 0.1382878 13 18 1.555748
## 616 139 0.1474379 208 130 0.1372321 327 17 1.469317
## 137 138 0.1463772 215 130 0.1372321 845 17 1.469317
## 283 136 0.1442558 303 130 0.1372321 692 16 1.382887
## 240 135 0.1431951 393 130 0.1372321 139 15 1.296456
##
##
##
##
##
##
## [1] EXPERIMENT 12
## M misValperc Kcol_min Kcol_max Nrow_min Nrow_max
## 9000 20 15 30 60 80
## M misValperc Kcol_min Kcol_max Nrow_min Nrow_max
## 12 9000 20 15 30 60 80
## [1] "TABLE with CBDA-SL & KNOCKOFF FILTER RESULTS"
## [1] "EXPERIMENT" "12"
## Accuracy Count Density MSE Count Density Knockoff Count Density
## 408 301 0.1521116 209 282 0.1356043 408 114 13.571429
## 887 298 0.1505956 849 280 0.1346426 780 48 5.714286
## 346 284 0.1435206 258 278 0.1336808 859 38 4.523810
## 61 275 0.1389724 519 275 0.1322382 627 31 3.690476
## 520 275 0.1389724 743 274 0.1317574 212 29 3.452381
## 337 273 0.1379617 861 270 0.1298339 490 25 2.976190
## 700 273 0.1379617 643 269 0.1293530 687 24 2.857143
## 423 268 0.1354349 691 269 0.1293530 68 20 2.380952
## 542 268 0.1354349 822 269 0.1293530 771 20 2.380952
## 109 266 0.1344242 195 268 0.1288722 327 17 2.023810
## 627 265 0.1339189 202 267 0.1283913 845 14 1.666667
## 524 263 0.1329082 122 266 0.1279104 380 13 1.547619
## 845 263 0.1329082 455 266 0.1279104 510 13 1.547619
## 512 262 0.1324028 756 266 0.1279104 261 12 1.428571
## 675 260 0.1313921 790 265 0.1274296 139 11 1.309524