Wstęp
W tym raporcie będziemy analizować testy ANOVA. Jednak będzie to dokonane za pomocą permutacyjnej metody bootstrap. Podejście to pozwala na wielorazowe losowanie danych, dzięki czemu pojawia się prawdopodobieństwo, że dany test wykaże daną wartość. Aby zobaczyć różnice, zostanie przeprowadzone testowanie klasyczne, a następnie botstrapowe.
Dane
Do analizy posłuży zbiór danych ChickenWeight, w którym analizowany będzie wpływ diety na wagę kurczkaów. Są 4 diet i ponad 500 rekordów.
## weight Diet
## 1 42 1
## 2 51 1
## 3 59 1
## 4 64 1
## 5 76 1
## 6 93 1

Rozkład kruczaków pomiędzy diety wygląda tak jak powyżej. Kolejnym krokiem będzie klasyczne testowanie ANOVA.
Klasycznie
Wpierw zbadamy hipotezę o normalności rozkładu każdej z grup kurczaków, które były poddane innej diecie.
##
## Shapiro-Wilk normality test
##
## data: dieta_pierwsza
## W = 0.89336, p-value = 2.211e-11
##
## Shapiro-Wilk normality test
##
## data: dieta_druga
## W = 0.90399, p-value = 3.159e-07
##
## Shapiro-Wilk normality test
##
## data: dieta_trzecia
## W = 0.91646, p-value = 1.509e-06
##
## Shapiro-Wilk normality test
##
## data: dieta_czwarta
## W = 0.95437, p-value = 0.0005195
W przypadku wszystkich grup, nie pochodzą one z populacji o rozkładzie normalnym. Sprawdzimy jednak hipotezę o jednorodności wariancji.
##
## Bartlett test of homogeneity of variances
##
## data: weight by Diet
## Bartlett's K-squared = 29.489, df = 3, p-value = 1.768e-06
Tutaj także trzeba odrzucić hipotezę zerową, co oznacza, że zbiór ten nie ma stałej wariancji. Niemniej można spróbować dokonać testowania ANOVA.
## Analysis of Variance Table
##
## Response: weight
## Df Sum Sq Mean Sq F value Pr(>F)
## Diet 3 155863 51954 10.81 6.433e-07 ***
## Residuals 574 2758693 4806
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Testowanie to wykazuje, że jest istotna zależność pomiędzy dietą, a wagą.
Wykonać można także test sprawdzjący oneway.
##
## One-way analysis of means
##
## data: weight and Diet
## F = 10.81, num df = 3, denom df = 574, p-value = 6.433e-07
On także wykazał taką samą wartość, co test ANOVA.
Następnie możemy obliczyć test Tuskeya HSD jako środek do określenia konkretnych poziomów pojedynczego czynnika istniejącego w tej analizie, które są naprawdę niezależne od siebie i wpływają na analizowaną zmienną.
## Tukey multiple comparisons of means
## 95% family-wise confidence level
##
## Fit: aov(formula = weight ~ Diet)
##
## $Diet
## diff lwr upr p adj
## 2-1 19.971212 -0.2998092 40.24223 0.0552271
## 3-1 40.304545 20.0335241 60.57557 0.0000025
## 4-1 32.617257 12.2353820 52.99913 0.0002501
## 3-2 20.333333 -2.7268370 43.39350 0.1058474
## 4-2 12.646045 -10.5116315 35.80372 0.4954239
## 4-3 -7.687288 -30.8449649 15.47039 0.8277810

Powyższa analiza wskazuje, że w praktyce różnice w relacji do pierwszej diety są najistotniejsze. Tutaj może pojawiać się problem, że istotność tej relacji zanika wraz z różnorodnością diety, co było widoczne nawet na wykresie. Czwarta dieta nie zwiększała bowiem tak dobrze wagi jak trzecia. Warto sprawdzić więc w podejściu bootstrapowym czy test ANOVA w podejściu permutacyjnym da podobne rezlutaty.
Podejście bootstrapowe
Ze względu na dużą liczbę rekordów zostanie podany tylko rezultat tej analizy. Dla Testu F o wadze 1000 rekordów prawdopodobieństwo wyniosło równe 0. Co oznacza, że jest istotna zależność pomiędzy dietą, a wagą. Całość analizy zostanie przedstawiony na histogramie.

Statystyka F dla 1000 rekrordów jest pokazana powyżej. Prawdopodobieństwo, aby przyjąć hipotezę zerową jest minmalne.
Podsumowanie
Test ANOVA boostrapowy ma wartość p = 0 (zero), co wskazuje, że istnieje prawdopodobieństwo = 0, że wynik rozkładu boostrapowego F jest wynikiem wyłącznie randomizacji. Dlatego na podstawie tego wyniku odrzucilibyśmy hipotezę zerową, co prowadziłoby do przekonania, że dieta rzeczywiście miałą wpływ na wagę kurczaków.
Ci0tLQp0aXRsZTogJ05pZWtsYXN5Y3puZSBtZXRvZHkgc3RhdHlzdHlraScKc3VidGl0bGU6ICdUZXN0b3dhbmllIEhpcG90ZXogQU5PVkEgeiBwb2RlasWbY2llbSBib290c3RyYXBvd3ltJwpkYXRlOiAiYHIgU3lzLkRhdGUoKWAiCmF1dGhvcjogIk1hY2llaiBIb3Jpc3pueSIKb3V0cHV0OgogIGh0bWxfZG9jdW1lbnQ6IAogICAgdGhlbWU6IGNlcnVsZWFuCiAgICBoaWdobGlnaHQ6IHRleHRtYXRlCiAgICBmb250c2l6ZTogMTBwdAogICAgdG9jOiB5ZXMKICAgIGNvZGVfZG93bmxvYWQ6IHllcwogICAgdG9jX2Zsb2F0OgogICAgICBjb2xsYXBzZWQ6IG5vCiAgICBkZl9wcmludDogZGVmYXVsdAogICAgdG9jX2RlcHRoOiA1CmVkaXRvcl9vcHRpb25zOiAKICBtYXJrZG93bjogCiAgICB3cmFwOiA3MgotLS0KCmBgYHtyIHNldHVwLCBpbmNsdWRlPUZBTFNFfQprbml0cjo6b3B0c19jaHVuayRzZXQoZWNobyA9IFRSVUUpCmxpYnJhcnkocm1kZm9ybWF0cykKbGlicmFyeSh0aWR5dmVyc2UpCmxpYnJhcnkoZ2dwdWJyKQpsaWJyYXJ5KHJzdGF0aXgpCmxpYnJhcnkoZGF0YXJpdW0pCmxpYnJhcnkoZ2dwbG90MikKYGBgCgojIyBXc3TEmXAKClcgdHltIHJhcG9yY2llIGLEmWR6aWVteSBhbmFsaXpvd2HEhyB0ZXN0eSBBTk9WQS4gSmVkbmFrIGLEmWR6aWUgdG8gZG9rb25hbmUgemEgcG9tb2PEhSBwZXJtdXRhY3lqbmVqIG1ldG9keSBib290c3RyYXAuIFBvZGVqxZtjaWUgdG8gcG96d2FsYSBuYSB3aWVsb3Jhem93ZSBsb3Nvd2FuaWUgZGFueWNoLCBkemnEmWtpIGN6ZW11IHBvamF3aWEgc2nEmSBwcmF3ZG9wb2RvYmllxYRzdHdvLCDFvGUgZGFueSB0ZXN0IHd5a2HFvGUgZGFuxIUgd2FydG/Fm8SHLgpBYnkgem9iYWN6ecSHIHLDs8W8bmljZSwgem9zdGFuaWUgcHJ6ZXByb3dhZHpvbmUgdGVzdG93YW5pZSBrbGFzeWN6bmUsIGEgbmFzdMSZcG5pZSBib3RzdHJhcG93ZS4KCiMjIERhbmUgCgpEbyBhbmFsaXp5IHBvc8WCdcW8eSB6YmnDs3IgZGFueWNoICpDaGlja2VuV2VpZ2h0KiwgdyBrdMOzcnltIGFuYWxpem93YW55IGLEmWR6aWUgd3DFgnl3IGRpZXR5IG5hIHdhZ8SZIGt1cmN6a2HDs3cuIFPEhSA0IGRpZXQgaSBwb25hZCA1MDAgcmVrb3Jkw7N3LgoKYGBge3IgY2FycywgZWNobz1GQUxTRX0KZGF0YSgiQ2hpY2tXZWlnaHQiKQpDaGlja2VuPC1zdWJzZXQoQ2hpY2tXZWlnaHQsIHNlbGVjdCA9ICh3ZWlnaHQpKQpDaGlja2VuJERpZXQ8LUNoaWNrV2VpZ2h0JERpZXQKaGVhZChDaGlja2VuKQoKYnhwPC0gZ2dib3hwbG90KENoaWNrZW4sIHk9IndlaWdodCIsIHg9IkRpZXQiLCBjb2xvciA9IkRpZXQiKSAKYnhwCmBgYAoKUm96a8WCYWQga3J1Y3pha8OzdyBwb21pxJlkenkgZGlldHkgd3lnbMSFZGEgdGFrIGphayBwb3d5xbxlai4gS29sZWpueW0ga3Jva2llbSBixJlkemllIGtsYXN5Y3puZSB0ZXN0b3dhbmllIEFOT1ZBLgoKIyMgS2xhc3ljem5pZQoKV3BpZXJ3IHpiYWRhbXkgaGlwb3RlesSZIG8gbm9ybWFsbm/Fm2NpIHJvemvFgmFkdSBrYcW8ZGVqIHogZ3J1cCBrdXJjemFrw7N3LCBrdMOzcmUgYnnFgnkgcG9kZGFuZSBpbm5laiBkaWVjaWUuCgpgYGB7ciBwcmVzc3VyZSwgZWNobz1GQUxTRSwgd2FybmluZz1GfQphdHRhY2goQ2hpY2tlbikKCmRpZXRhX3BpZXJ3c3phPC1zdWJzZXQod2VpZ2h0LERpZXQ9PScxJykKc2hhcGlyby50ZXN0KGRpZXRhX3BpZXJ3c3phKQpkaWV0YV9kcnVnYTwtc3Vic2V0KHdlaWdodCxEaWV0PT0nMicpCnNoYXBpcm8udGVzdChkaWV0YV9kcnVnYSkKZGlldGFfdHJ6ZWNpYTwtc3Vic2V0KHdlaWdodCxEaWV0PT0nMycpCnNoYXBpcm8udGVzdChkaWV0YV90cnplY2lhKQpkaWV0YV9jendhcnRhPC1zdWJzZXQod2VpZ2h0LERpZXQ9PSc0JykKc2hhcGlyby50ZXN0KGRpZXRhX2N6d2FydGEpCmBgYAoKVyBwcnp5cGFka3Ugd3N6eXN0a2ljaCBncnVwLCBuaWUgcG9jaG9kesSFIG9uZSB6IHBvcHVsYWNqaSBvIHJvemvFgmFkemllIG5vcm1hbG55bS4gU3ByYXdkemlteSBqZWRuYWsgaGlwb3RlesSZIG8gamVkbm9yb2Rub8WbY2kgd2FyaWFuY2ppLgoKYGBge3IgdHJhZCwgZWNobz1GQUxTRX0KYmFydGxldHQudGVzdCh3ZWlnaHQgfiBEaWV0LCBDaGlja2VuKQpgYGAKClR1dGFqIHRha8W8ZSB0cnplYmEgb2RyenVjacSHIGhpcG90ZXrEmSB6ZXJvd8SFLCBjbyBvem5hY3phLCDFvGUgemJpw7NyIHRlbiBuaWUgbWEgc3RhxYJlaiB3YXJpYW5jamkuCk5pZW1uaWVqIG1vxbxuYSBzcHLDs2Jvd2HEhyBkb2tvbmHEhyB0ZXN0b3dhbmlhIEFOT1ZBLgoKCmBgYHtyIHRyYWRlLCBlY2hvPUZBTFNFfQphbm92YShhb3Yod2VpZ2h0IH4gRGlldCwgQ2hpY2tlbikpCmBgYAoKVGVzdG93YW5pZSB0byB3eWthenVqZSwgxbxlIGplc3QgaXN0b3RuYSB6YWxlxbxub8WbxIcgcG9tacSZZHp5IGRpZXTEhSwgYSB3YWfEhS4KCgpXeWtvbmHEhyBtb8W8bmEgdGFrxbxlIHRlc3Qgc3ByYXdkemrEhWN5IG9uZXdheS4KCmBgYHtyIGJvb3RlaywgZWNobz1GQUxTRX0Kb25ld2F5LnRlc3Qod2VpZ2h0fkRpZXQsIHZhci5lcXVhbD1ULCBkYXRhPUNoaWNrZW4pCmBgYAoKT24gdGFrxbxlIHd5a2F6YcWCIHRha8SFIHNhbcSFIHdhcnRvxZvEhywgY28gdGVzdCBBTk9WQS4KCk5hc3TEmXBuaWUgbW/FvGVteSBvYmxpY3p5xIcgdGVzdCBUdXNrZXlhIEhTRCBqYWtvIMWbcm9kZWsgZG8gb2tyZcWbbGVuaWEga29ua3JldG55Y2ggcG96aW9tw7N3IHBvamVkeW5jemVnbyBjenlubmlrYSBpc3RuaWVqxIVjZWdvIHcgdGVqIGFuYWxpemllLCBrdMOzcmUgc8SFIG5hcHJhd2TEmSBuaWV6YWxlxbxuZSBvZCBzaWViaWUgaSB3cMWCeXdhasSFIG5hIGFuYWxpem93YW7EhSB6bWllbm7EhS4KCmBgYHtyIHRyYXJlLCBlY2hvPUZBTFNFfQpwb3N0X21vZGVsMTwtYW92KHdlaWdodCB+IERpZXQpCmVmZWt0X2hzZDwtVHVrZXlIU0QocG9zdF9tb2RlbDEsd2hpY2g9IkRpZXQiKQpwcmludChlZmVrdF9oc2QpCnBsb3QoKGVmZWt0X2hzZCkpCmBgYAoKUG93ecW8c3phIGFuYWxpemEgd3NrYXp1amUsIMW8ZSB3IHByYWt0eWNlIHLDs8W8bmljZSB3IHJlbGFjamkgZG8gcGllcndzemVqIGRpZXR5IHPEhSBuYWppc3RvdG5pZWpzemUuClR1dGFqIG1vxbxlIHBvamF3aWHEhyBzacSZIHByb2JsZW0sIMW8ZSBpc3RvdG5vxZvEhyB0ZWogcmVsYWNqaSB6YW5pa2Egd3JheiB6IHLDs8W8bm9yb2Rub8WbY2nEhSBkaWV0eSwgY28gYnnFgm8gd2lkb2N6bmUgbmF3ZXQgbmEgd3lrcmVzaWUuIEN6d2FydGEgZGlldGEgbmllIHp3acSZa3N6YcWCYSBib3dpZW0gdGFrIGRvYnJ6ZSB3YWdpIGphayB0cnplY2lhLgpXYXJ0byBzcHJhd2R6acSHIHdpxJljIHcgcG9kZWrFm2NpdSBib290c3RyYXBvd3ltIGN6eSB0ZXN0IEFOT1ZBIHcgcG9kZWrFm2NpdSBwZXJtdXRhY3lqbnltIGRhIHBvZG9ibmUgcmV6bHV0YXR5LgoKIyMgUG9kZWrFm2NpZSBib290c3RyYXBvd2UKClplIHd6Z2zEmWR1IG5hIGR1xbzEhSBsaWN6YsSZIHJla29yZMOzdyB6b3N0YW5pZSBwb2RhbnkgdHlsa28gcmV6dWx0YXQgdGVqIGFuYWxpenkuCkRsYSBUZXN0dSBGIG8gd2FkemUgMTAwMCByZWtvcmTDs3cgcHJhd2RvcG9kb2JpZcWEc3R3byB3eW5pb3PFgm8gcsOzd25lIDAuIENvIG96bmFjemEsIMW8ZSBqZXN0IGlzdG90bmEgemFsZcW8bm/Fm8SHIHBvbWnEmWR6eSBkaWV0xIUsIGEgd2FnxIUuIENhxYJvxZvEhyBhbmFsaXp5IHpvc3RhbmllIHByemVkc3Rhd2lvbnkgbmEgaGlzdG9ncmFtaWUuCgpgYGB7ciBib290LCBlY2hvPUZBTFNFLHJlc3VsdHM9Rn0KbGlicmFyeShsbWJvb3QpCmQ8LUFOT1ZBLmJvb3Qod2VpZ2h0fkRpZXQsIGRhdGE9Q2hpY2tlbikKCmBgYAoKYGBge3IgYm90cm8sIGVjaG89Rn0KcGFyKG1mcm93PWMoMSwxKSkKaGlzdChkJGJvb3RGU3RhdHMsIHlsaW09YygwLDEpLCB4bGltPWMoMCw4KSwgcHJvYj1ULCBtYWluID0gIkhpc3RvZ3JhbSByb3prZMWCYWR1IEYgYm9vc3RyYXBvd2VnbyIpCng9c2VxKC4yNSw2LC4yNSkKcG9pbnRzKHgseT1kZih4LDMsMzU3NCksdHlwZT0iYiIsY29sPSJyZWQiKSAgI1RoZSBGLWRpc3RyaWJ1dGlvbgpgYGAKClN0YXR5c3R5a2EgRiBkbGEgMTAwMCByZWtyb3Jkw7N3IGplc3QgcG9rYXphbmEgcG93ecW8ZWouIFByYXdkb3BvZG9iaWXFhHN0d28sIGFieSBwcnp5asSFxIcgaGlwb3RlesSZIHplcm93xIUgamVzdCBtaW5tYWxuZS4gCgojIyBQb2RzdW1vd2FuaWUKClRlc3QgQU5PVkEgYm9vc3RyYXBvd3kgbWEgd2FydG/Fm8SHIHAgPSAwICh6ZXJvKSwgY28gd3NrYXp1amUsIMW8ZSBpc3RuaWVqZSBwcmF3ZG9wb2RvYmllxYRzdHdvID0gMCwgxbxlIHd5bmlrIHJvemvFgmFkdSBib29zdHJhcG93ZWdvIEYgamVzdCB3eW5pa2llbSB3ecWCxIVjem5pZSByYW5kb21pemFjamkuIERsYXRlZ28gbmEgcG9kc3Rhd2llIHRlZ28gd3luaWt1IG9kcnp1Y2lsaWJ5xZtteSBoaXBvdGV6xJkgemVyb3fEhSwgY28gcHJvd2FkemnFgm9ieSBkbyBwcnpla29uYW5pYSwgxbxlIGRpZXRhIHJ6ZWN6eXdpxZtjaWUgbWlhxYLEhSB3cMWCeXcgbmEgd2FnxJkga3VyY3pha8Ozdy4=