Postępowanie w metodach bootstrapowych vs. permutacyjnych.

Metoda bootstrapowa

Na podstawie wylosowanych i zreplikowanych próbek tworzony jest rozkład statystyki testowej i oszacowane zostaje jest p-value.

Metoda permutacyjna

Na podstawie replikowanych próbek w procedurze permutacyjnej konstruuje się nowy rozkład. Nastepnie liczone są średnie, a nastepnie szacowane są różnice miedzy średnimi. Na podstawie ninijeszych różnic wskazywane jest p-value.

Różnice

W przypadku testów permutacyjnych stosowane jest losowanie bezzwrotne, natomiast w przypadku testów bootstrapowych stosowane jest losowanie zwrotne.

Testowanie klasyczne vs. nieklasyczne

W testeach klasycznych pobiera się próbkę tylko 1 raz, natomiast w testach nieklasycznych pobiera się próbki wiele razy. Umożliwia to łatwiejsze wychwycenie zróżnicowania badanej cechy i w związku z tym test bootstrapowy jes mocniejszy.

Przykład 1. Test t-Studenta

Na poczatku wyberamy dane. W naszym przypadku jest to pakiet danych z wynagrodzeniami.

data("Wage")
attach(Wage)

Hipoteza zadania

Czy na wynagrodzenie osób wpływa posiadane przez nich ubezpiecznie zdrowotne? Przeprowdźmy test procedurą bootstrapową testu t-studenta (metodą porównywania dwóch średnich).

wyniki<-boot.t.test(wage~health_ins,R=999,data=Wage)
wyniki
## 
##  Bootstrap Welch Two Sample t-test
## 
## data:  wage by health_ins
## bootstrap p-value < 2.2e-16 
## bootstrap difference of means (SE) = 27.99758 (1.490163) 
## 95 percent bootstrap percentile confidence interval:
##  25.17593 30.96369
## 
## Results without bootstrap:
## t = 18.708, df = 1989.5, p-value < 2.2e-16
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  24.99464 30.84858
## sample estimates:
## mean in group 1. Yes  mean in group 2. No 
##             120.2383              92.3167

Z wyników procedury można odczytać, że należy odrzucić hipotezę H0, mówiącą o tym, że porównywane dwie średnie nie różnią się znacząco od zera. Przyjmujemy hipotezę alternatywną, która mówi o istotnych różnicach w wartościach średnich.

Wizualizacja

Następnie można zwizualizować wyniki stosując procedurę wizualizacji testu na wykres typu wiolinowego.

library(ggstatsplot)
## You can cite this package as:
##      Patil, I. (2021). Visualizations with statistical details: The 'ggstatsplot' approach.
##      Journal of Open Source Software, 6(61), 3167, doi:10.21105/joss.03167
ggbetweenstats(
  data=Wage,
  x=health_ins,
  y=wage,
  nboot=999
)

Wykresy pokazują istotne różnice między średnimi testów. Widzimy, że jeśli ktoś posiada ubezpieczenie, to znacząco więcej zarabia. Ci, którzy nie mają ubezpieczenia średnio zarabiają stotnie mniej.

Przykład 2. Test Chi^2

Ponownie wybieramy pakiet danych z wynagrodzeniami. W tym przypadku badamy zależność statusu posiadania ubezpieczenia od stopnia wykształcenia.

Hipoteza zadania

Badamy zależność statusu posiadania ubezpieczenia od stopnia wykształcenia.

tabelka<-table(health_ins,education)

chisq.test(tabelka,simulate.p.value = TRUE, B = 2000)
## 
##  Pearson's Chi-squared test with simulated p-value (based on 2000
##  replicates)
## 
## data:  tabelka
## X-squared = 141.63, df = NA, p-value = 0.0004998

Na podstawie wyniku przyjmujemy hiotezę alternatywną o niezależności zmiennych, odrzucając hipotezę zerową o zależności zmiennych. Test wskazuje na istotną zależność między posiadaniem posiadania ubezpieczenia a stopniem wykształcenia.

Wizualizacja

Następnie można zwizualizować wyniki na wykresie słupkowym i kołowym.

ggbarstats(
  data=Wage,
  x=education,
  y=health_ins
)
## Warning: There was 1 warning in `mutate()`.
## ℹ In argument: `across(.fns = ~droplevels(as.factor(.x)))`.
## Caused by warning:
## ! Using `across()` without supplying `.cols` was deprecated in dplyr 1.1.0.
## ℹ Please supply `.cols` instead.

ggpiestats(
  data=Wage,
  x=education,
  y=health_ins
)

Z wykresów można odczytać, że wśród osób, które nie posiadają ubezpieczenia jest najwięcej osób z niskim i średnim wykształceniem. Natomiast wśród osób, które posiadają ubezpieczenie znacznie więcej jest osób z wysokim stopniem wykształcenia.

LS0tDQp0aXRsZTogIlJhcG9ydCA3LiINCmF1dGhvcjogIkthdGFyenluYSBMZXdjenVrLCBLb25zdGFuY2phIFBpa3NhLCBKdWxpdXN6IEFsZnV0aCwgUGlvdHIgV2ljaG93c2tpIg0KZGF0ZTogImByIFN5cy5EYXRlKClgIg0Kb3V0cHV0Og0KICBodG1sX2RvY3VtZW50Og0KICAgIHRoZW1lOiBjZXJ1bGVhbg0KICAgIGhpZ2hsaWdodDogdGV4dG1hdGUNCiAgICBmb250c2l6ZTogMTBwdA0KICAgIHRvYzogeWVzDQogICAgY29kZV9kb3dubG9hZDogeWVzDQogICAgdG9jX2Zsb2F0Og0KICAgICAgY29sbGFwc2VkOiBubw0KICAgIGRmX3ByaW50OiBkZWZhdWx0DQogICAgdG9jX2RlcHRoOiA1DQogIHBkZl9kb2N1bWVudDoNCiAgICB0b2M6IHllcw0KICAgIHRvY19kZXB0aDogJzUnDQpzdWJ0aXRsZTogQm9vdHN0cmFwDQplZGl0b3Jfb3B0aW9uczoNCiAgbWFya2Rvd246DQogICAgd3JhcDogNzINCi0tLQ0KDQoNCmBgYHtyLCBtZXNzYWdlPUZBTFNFLCB3YXJuaW5nPUZBTFNFLCBlY2hvPUZBTFNFfQ0KbGlicmFyeShJU0xSKQ0KbGlicmFyeShnbG1uZXQpDQpsaWJyYXJ5KGRwbHlyKQ0KbGlicmFyeSh0aWR5cikNCmxpYnJhcnkoYm9vdCkNCmxpYnJhcnkoYm9vdHN0cmFwKQ0KbGlicmFyeShNS2luZmVyKSANCmBgYA0KDQojIFBvc3TEmXBvd2FuaWUgdyBtZXRvZGFjaCBib290c3RyYXBvd3ljaCB2cy4gcGVybXV0YWN5am55Y2guDQoNCiMjIE1ldG9kYSBib290c3RyYXBvd2ENCk5hIHBvZHN0YXdpZSB3eWxvc293YW55Y2ggaSB6cmVwbGlrb3dhbnljaCBwcsOzYmVrIHR3b3J6b255IGplc3Qgcm96a8WCYWQgc3RhdHlzdHlraSB0ZXN0b3dlaiBpIG9zemFjb3dhbmUgem9zdGFqZSBqZXN0IHAtdmFsdWUuDQoNCiMjIE1ldG9kYSBwZXJtdXRhY3lqbmENCk5hIHBvZHN0YXdpZSByZXBsaWtvd2FueWNoIHByw7NiZWsgdyBwcm9jZWR1cnplIHBlcm11dGFjeWpuZWoga29uc3RydXVqZSBzacSZIG5vd3kgcm96a8WCYWQuIE5hc3RlcG5pZSBsaWN6b25lIHPEhSDFm3JlZG5pZSwgYSBuYXN0ZXBuaWUgc3phY293YW5lIHPEhSByw7PFvG5pY2UgbWllZHp5IMWbcmVkbmltaS4gTmEgcG9kc3Rhd2llIG5pbmlqZXN6eWNoIHLDs8W8bmljIHdza2F6eXdhbmUgamVzdCBwLXZhbHVlLg0KDQojIyBSw7PFvG5pY2UNClcgcHJ6eXBhZGt1IHRlc3TDs3cgcGVybXV0YWN5am55Y2ggc3Rvc293YW5lIGplc3QgbG9zb3dhbmllIGJlenp3cm90bmUsIG5hdG9taWFzdCB3IHByenlwYWRrdSB0ZXN0w7N3IGJvb3RzdHJhcG93eWNoIHN0b3Nvd2FuZSBqZXN0IGxvc293YW5pZSB6d3JvdG5lLg0KDQoNCiMjIFRlc3Rvd2FuaWUga2xhc3ljem5lIHZzLiBuaWVrbGFzeWN6bmUNClcgdGVzdGVhY2gga2xhc3ljem55Y2ggcG9iaWVyYSBzacSZIHByw7Nia8SZIHR5bGtvIDEgcmF6LCBuYXRvbWlhc3QgdyB0ZXN0YWNoIG5pZWtsYXN5Y3pueWNoIHBvYmllcmEgc2nEmSBwcsOzYmtpIHdpZWxlIHJhenkuIFVtb8W8bGl3aWEgdG8gxYJhdHdpZWpzemUgd3ljaHd5Y2VuaWUgenLDs8W8bmljb3dhbmlhIGJhZGFuZWogY2VjaHkgaSB3IHp3acSFemt1IHogdHltIHRlc3QgYm9vdHN0cmFwb3d5IGplcyBtb2NuaWVqc3p5Lg0KDQoNCiMjIFByenlrxYJhZCAxLiBUZXN0IHQtU3R1ZGVudGENCk5hIHBvY3phdGt1IHd5YmVyYW15IGRhbmUuIFcgbmFzenltIHByenlwYWRrdSBqZXN0IHRvIHBha2lldCBkYW55Y2ggeiB3eW5hZ3JvZHplbmlhbWkuDQpgYGB7cn0NCmRhdGEoIldhZ2UiKQ0KYXR0YWNoKFdhZ2UpDQoNCmBgYA0KDQojIyMgSGlwb3RlemEgemFkYW5pYQ0KQ3p5IG5hIHd5bmFncm9kemVuaWUgb3PDs2Igd3DFgnl3YSBwb3NpYWRhbmUgcHJ6ZXogbmljaCB1YmV6cGllY3puaWUgemRyb3dvdG5lPw0KUHJ6ZXByb3dkxbpteSB0ZXN0IHByb2NlZHVyxIUgYm9vdHN0cmFwb3fEhSB0ZXN0dSB0LXN0dWRlbnRhIChtZXRvZMSFIHBvcsOzd255d2FuaWEgZHfDs2NoIMWbcmVkbmljaCkuDQoNCmBgYHtyfQ0Kd3luaWtpPC1ib290LnQudGVzdCh3YWdlfmhlYWx0aF9pbnMsUj05OTksZGF0YT1XYWdlKQ0Kd3luaWtpDQpgYGANClogd3luaWvDs3cgcHJvY2VkdXJ5IG1vxbxuYSBvZGN6eXRhxIcsIMW8ZSBuYWxlxbx5IG9kcnp1Y2nEhyBoaXBvdGV6xJkgSDAsIG3Ds3dpxIVjxIUgbyB0eW0sIMW8ZSBwb3LDs3dueXdhbmUgZHdpZSDFm3JlZG5pZSBuaWUgcsOzxbxuacSFIHNpxJkgem5hY3rEhWNvIG9kIHplcmEuIFByenlqbXVqZW15IGhpcG90ZXrEmSBhbHRlcm5hdHl3bsSFLCBrdMOzcmEgbcOzd2kgbyBpc3RvdG55Y2ggcsOzxbxuaWNhY2ggdyB3YXJ0b8WbY2lhY2ggxZtyZWRuaWNoLg0KDQojIyMgV2l6dWFsaXphY2phDQpOYXN0xJlwbmllIG1vxbxuYSB6d2l6dWFsaXpvd2HEhyB3eW5pa2kgc3Rvc3VqxIVjIHByb2NlZHVyxJkgd2l6dWFsaXphY2ppIHRlc3R1IG5hIHd5a3JlcyB0eXB1IHdpb2xpbm93ZWdvLg0KDQpgYGB7cn0NCg0KbGlicmFyeShnZ3N0YXRzcGxvdCkNCg0KZ2diZXR3ZWVuc3RhdHMoDQogIGRhdGE9V2FnZSwNCiAgeD1oZWFsdGhfaW5zLA0KICB5PXdhZ2UsDQogIG5ib290PTk5OQ0KKQ0KYGBgDQpXeWtyZXN5IHBva2F6dWrEhSBpc3RvdG5lIHLDs8W8bmljZSBtacSZZHp5IMWbcmVkbmltaSB0ZXN0w7N3LiBXaWR6aW15LCDFvGUgamXFm2xpIGt0b8WbIHBvc2lhZGEgdWJlenBpZWN6ZW5pZSwgdG8gem5hY3rEhWNvIHdpxJljZWogemFyYWJpYS4gQ2ksIGt0w7NyenkgbmllIG1hasSFIHViZXpwaWVjemVuaWEgxZtyZWRuaW8gemFyYWJpYWrEhSBzdG90bmllIG1uaWVqLg0KDQojIyBQcnp5a8WCYWQgMi4gVGVzdCBDaGleMg0KUG9ub3duaWUgd3liaWVyYW15IHBha2lldCBkYW55Y2ggeiB3eW5hZ3JvZHplbmlhbWkuIFcgdHltIHByenlwYWRrdSBiYWRhbXkgemFsZcW8bm/Fm8SHIHN0YXR1c3UgcG9zaWFkYW5pYSB1YmV6cGllY3plbmlhIG9kIHN0b3BuaWEgd3lrc3p0YcWCY2VuaWEuDQoNCiMjIyBIaXBvdGV6YSB6YWRhbmlhDQpCYWRhbXkgemFsZcW8bm/Fm8SHIHN0YXR1c3UgcG9zaWFkYW5pYSB1YmV6cGllY3plbmlhIG9kIHN0b3BuaWEgd3lrc3p0YcWCY2VuaWEuDQoNCmBgYHtyfQ0KdGFiZWxrYTwtdGFibGUoaGVhbHRoX2lucyxlZHVjYXRpb24pDQoNCmNoaXNxLnRlc3QodGFiZWxrYSxzaW11bGF0ZS5wLnZhbHVlID0gVFJVRSwgQiA9IDIwMDApDQoNCmBgYA0KTmEgcG9kc3Rhd2llIHd5bmlrdSBwcnp5am11amVteSBoaW90ZXrEmSBhbHRlcm5hdHl3bsSFIG8gbmllemFsZcW8bm/Fm2NpIHptaWVubnljaCwgb2RyenVjYWrEhWMgaGlwb3RlesSZIHplcm93xIUgbyB6YWxlxbxub8WbY2kgem1pZW5ueWNoLiBUZXN0IHdza2F6dWplIG5hIGlzdG90bsSFIHphbGXFvG5vxZvEhyBtacSZZHp5IHBvc2lhZGFuaWVtIHBvc2lhZGFuaWEgdWJlenBpZWN6ZW5pYSBhIHN0b3BuaWVtIHd5a3N6dGHFgmNlbmlhLg0KDQojIyMgV2l6dWFsaXphY2phDQpOYXN0xJlwbmllIG1vxbxuYSB6d2l6dWFsaXpvd2HEhyB3eW5pa2kgbmEgd3lrcmVzaWUgc8WCdXBrb3d5bSBpIGtvxYJvd3ltLiANCg0KDQpgYGB7cn0NCmdnYmFyc3RhdHMoDQogIGRhdGE9V2FnZSwNCiAgeD1lZHVjYXRpb24sDQogIHk9aGVhbHRoX2lucw0KKQ0KDQpnZ3BpZXN0YXRzKA0KICBkYXRhPVdhZ2UsDQogIHg9ZWR1Y2F0aW9uLA0KICB5PWhlYWx0aF9pbnMNCikNCmBgYA0KDQpaIHd5a3Jlc8OzdyBtb8W8bmEgb2Rjenl0YcSHLCDFvGUgd8WbcsOzZCBvc8OzYiwga3TDs3JlIG5pZSBwb3NpYWRhasSFIHViZXpwaWVjemVuaWEgamVzdCBuYWp3acSZY2VqIG9zw7NiIHogbmlza2ltIGkgxZtyZWRuaW0gd3lrc3p0YcWCY2VuaWVtLiBOYXRvbWlhc3Qgd8WbcsOzZCBvc8OzYiwga3TDs3JlIHBvc2lhZGFqxIUgdWJlenBpZWN6ZW5pZSB6bmFjem5pZSB3acSZY2VqIGplc3Qgb3PDs2IgeiB3eXNva2ltIHN0b3BuaWVtIHd5a3N6dGHFgmNlbmlhLg0K