Wstęp

W tym raporcie będziemy analizować testy ANOVA. Jednak będzie to dokonane za pomocą permutacyjnej metody bootstrap. Podejście to pozwala na wielorazowe losowanie danych, dzięki czemu pojawia się prawdopodobieństwo, że dany test wykaże daną wartość. Aby zobaczyć różnice, zostanie przeprowadzone testowanie klasyczne, a następnie botstrapowe.

Dane

Do analizy posłuży zbiór danych ChickenWeight, w którym analizowany będzie wpływ diety na wagę kurczkaów. Są 4 diet i ponad 500 rekordów.

##   weight Diet
## 1     42    1
## 2     51    1
## 3     59    1
## 4     64    1
## 5     76    1
## 6     93    1

Rozkład kruczaków pomiędzy diety wygląda tak jak powyżej. Kolejnym krokiem będzie klasyczne testowanie ANOVA.

Klasycznie

Wpierw zbadamy hipotezę o normalności rozkładu każdej z grup kurczaków, które były poddane innej diecie.

## 
##  Shapiro-Wilk normality test
## 
## data:  dieta_pierwsza
## W = 0.89336, p-value = 2.211e-11
## 
##  Shapiro-Wilk normality test
## 
## data:  dieta_druga
## W = 0.90399, p-value = 3.159e-07
## 
##  Shapiro-Wilk normality test
## 
## data:  dieta_trzecia
## W = 0.91646, p-value = 1.509e-06
## 
##  Shapiro-Wilk normality test
## 
## data:  dieta_czwarta
## W = 0.95437, p-value = 0.0005195

W przypadku wszystkich grup, nie pochodzą one z populacji o rozkładzie normalnym. Sprawdzimy jednak hipotezę o jednorodności wariancji.

## 
##  Bartlett test of homogeneity of variances
## 
## data:  weight by Diet
## Bartlett's K-squared = 29.489, df = 3, p-value = 1.768e-06

Tutaj także trzeba odrzucić hipotezę zerową, co oznacza, że zbiór ten nie ma stałej wariancji. Niemniej można spróbować dokonać testowania ANOVA.

## Analysis of Variance Table
## 
## Response: weight
##            Df  Sum Sq Mean Sq F value    Pr(>F)    
## Diet        3  155863   51954   10.81 6.433e-07 ***
## Residuals 574 2758693    4806                      
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Testowanie to wykazuje, że jest istotna zależność pomiędzy dietą, a wagą.

Wykonać można także test sprawdzjący oneway.

## 
##  One-way analysis of means
## 
## data:  weight and Diet
## F = 10.81, num df = 3, denom df = 574, p-value = 6.433e-07

On także wykazał taką samą wartość, co test ANOVA.

Następnie możemy obliczyć test Tuskeya HSD jako środek do określenia konkretnych poziomów pojedynczego czynnika istniejącego w tej analizie, które są naprawdę niezależne od siebie i wpływają na analizowaną zmienną.

##   Tukey multiple comparisons of means
##     95% family-wise confidence level
## 
## Fit: aov(formula = weight ~ Diet)
## 
## $Diet
##          diff         lwr      upr     p adj
## 2-1 19.971212  -0.2998092 40.24223 0.0552271
## 3-1 40.304545  20.0335241 60.57557 0.0000025
## 4-1 32.617257  12.2353820 52.99913 0.0002501
## 3-2 20.333333  -2.7268370 43.39350 0.1058474
## 4-2 12.646045 -10.5116315 35.80372 0.4954239
## 4-3 -7.687288 -30.8449649 15.47039 0.8277810

Powyższa analiza wskazuje, że w praktyce różnice w relacji do pierwszej diety są najistotniejsze. Tutaj może pojawiać się problem, że istotność tej relacji zanika wraz z różnorodnością diety, co było widoczne nawet na wykresie. Czwarta dieta nie zwiększała bowiem tak dobrze wagi jak trzecia. Warto sprawdzić więc w podejściu bootstrapowym czy test ANOVA w podejściu permutacyjnym da podobne rezlutaty.

Podejście bootstrapowe

Ze względu na dużą liczbę rekordów zostanie podany tylko rezultat tej analizy. Dla Testu F o wadze 1000 rekordów prawdopodobieństwo wyniosło równe 0. Co oznacza, że jest istotna zależność pomiędzy dietą, a wagą. Całość analizy zostanie przedstawiony na histogramie.

Statystyka F dla 1000 rekrordów jest pokazana powyżej. Prawdopodobieństwo, aby przyjąć hipotezę zerową jest minmalne.

Podsumowanie

Test ANOVA boostrapowy ma wartość p = 0 (zero), co wskazuje, że istnieje prawdopodobieństwo = 0, że wynik rozkładu boostrapowego F jest wynikiem wyłącznie randomizacji. Dlatego na podstawie tego wyniku odrzucilibyśmy hipotezę zerową, co prowadziłoby do przekonania, że dieta rzeczywiście miałą wpływ na wagę kurczaków.

Ci0tLQp0aXRsZTogJ05pZWtsYXN5Y3puZSBtZXRvZHkgc3RhdHlzdHlraScKc3VidGl0bGU6ICdUZXN0b3dhbmllIEhpcG90ZXogQU5PVkEgeiBwb2RlasWbY2llbSBib290c3RyYXBvd3ltJwpkYXRlOiAiYHIgU3lzLkRhdGUoKWAiCmF1dGhvcjogIk1hY2llaiBIb3Jpc3pueSIKb3V0cHV0OgogIGh0bWxfZG9jdW1lbnQ6IAogICAgdGhlbWU6IGNlcnVsZWFuCiAgICBoaWdobGlnaHQ6IHRleHRtYXRlCiAgICBmb250c2l6ZTogMTBwdAogICAgdG9jOiB5ZXMKICAgIGNvZGVfZG93bmxvYWQ6IHllcwogICAgdG9jX2Zsb2F0OgogICAgICBjb2xsYXBzZWQ6IG5vCiAgICBkZl9wcmludDogZGVmYXVsdAogICAgdG9jX2RlcHRoOiA1CmVkaXRvcl9vcHRpb25zOiAKICBtYXJrZG93bjogCiAgICB3cmFwOiA3MgotLS0KCmBgYHtyIHNldHVwLCBpbmNsdWRlPUZBTFNFfQprbml0cjo6b3B0c19jaHVuayRzZXQoZWNobyA9IFRSVUUpCmxpYnJhcnkocm1kZm9ybWF0cykKbGlicmFyeSh0aWR5dmVyc2UpCmxpYnJhcnkoZ2dwdWJyKQpsaWJyYXJ5KHJzdGF0aXgpCmxpYnJhcnkoZGF0YXJpdW0pCmxpYnJhcnkoZ2dwbG90MikKYGBgCgojIyBXc3TEmXAKClcgdHltIHJhcG9yY2llIGLEmWR6aWVteSBhbmFsaXpvd2HEhyB0ZXN0eSBBTk9WQS4gSmVkbmFrIGLEmWR6aWUgdG8gZG9rb25hbmUgemEgcG9tb2PEhSBwZXJtdXRhY3lqbmVqIG1ldG9keSBib290c3RyYXAuIFBvZGVqxZtjaWUgdG8gcG96d2FsYSBuYSB3aWVsb3Jhem93ZSBsb3Nvd2FuaWUgZGFueWNoLCBkemnEmWtpIGN6ZW11IHBvamF3aWEgc2nEmSBwcmF3ZG9wb2RvYmllxYRzdHdvLCDFvGUgZGFueSB0ZXN0IHd5a2HFvGUgZGFuxIUgd2FydG/Fm8SHLgpBYnkgem9iYWN6ecSHIHLDs8W8bmljZSwgem9zdGFuaWUgcHJ6ZXByb3dhZHpvbmUgdGVzdG93YW5pZSBrbGFzeWN6bmUsIGEgbmFzdMSZcG5pZSBib3RzdHJhcG93ZS4KCiMjIERhbmUgCgpEbyBhbmFsaXp5IHBvc8WCdcW8eSB6YmnDs3IgZGFueWNoICpDaGlja2VuV2VpZ2h0KiwgdyBrdMOzcnltIGFuYWxpem93YW55IGLEmWR6aWUgd3DFgnl3IGRpZXR5IG5hIHdhZ8SZIGt1cmN6a2HDs3cuIFPEhSA0IGRpZXQgaSBwb25hZCA1MDAgcmVrb3Jkw7N3LgoKYGBge3IgY2FycywgZWNobz1GQUxTRX0KZGF0YSgiQ2hpY2tXZWlnaHQiKQpDaGlja2VuPC1zdWJzZXQoQ2hpY2tXZWlnaHQsIHNlbGVjdCA9ICh3ZWlnaHQpKQpDaGlja2VuJERpZXQ8LUNoaWNrV2VpZ2h0JERpZXQKaGVhZChDaGlja2VuKQoKYnhwPC0gZ2dib3hwbG90KENoaWNrZW4sIHk9IndlaWdodCIsIHg9IkRpZXQiLCBjb2xvciA9IkRpZXQiKSAKYnhwCmBgYAoKUm96a8WCYWQga3J1Y3pha8OzdyBwb21pxJlkenkgZGlldHkgd3lnbMSFZGEgdGFrIGphayBwb3d5xbxlai4gS29sZWpueW0ga3Jva2llbSBixJlkemllIGtsYXN5Y3puZSB0ZXN0b3dhbmllIEFOT1ZBLgoKIyMgS2xhc3ljem5pZQoKV3BpZXJ3IHpiYWRhbXkgaGlwb3RlesSZIG8gbm9ybWFsbm/Fm2NpIHJvemvFgmFkdSBrYcW8ZGVqIHogZ3J1cCBrdXJjemFrw7N3LCBrdMOzcmUgYnnFgnkgcG9kZGFuZSBpbm5laiBkaWVjaWUuCgpgYGB7ciBwcmVzc3VyZSwgZWNobz1GQUxTRSwgd2FybmluZz1GfQphdHRhY2goQ2hpY2tlbikKCmRpZXRhX3BpZXJ3c3phPC1zdWJzZXQod2VpZ2h0LERpZXQ9PScxJykKc2hhcGlyby50ZXN0KGRpZXRhX3BpZXJ3c3phKQpkaWV0YV9kcnVnYTwtc3Vic2V0KHdlaWdodCxEaWV0PT0nMicpCnNoYXBpcm8udGVzdChkaWV0YV9kcnVnYSkKZGlldGFfdHJ6ZWNpYTwtc3Vic2V0KHdlaWdodCxEaWV0PT0nMycpCnNoYXBpcm8udGVzdChkaWV0YV90cnplY2lhKQpkaWV0YV9jendhcnRhPC1zdWJzZXQod2VpZ2h0LERpZXQ9PSc0JykKc2hhcGlyby50ZXN0KGRpZXRhX2N6d2FydGEpCmBgYAoKVyBwcnp5cGFka3Ugd3N6eXN0a2ljaCBncnVwLCBuaWUgcG9jaG9kesSFIG9uZSB6IHBvcHVsYWNqaSBvIHJvemvFgmFkemllIG5vcm1hbG55bS4gU3ByYXdkemlteSBqZWRuYWsgaGlwb3RlesSZIG8gamVkbm9yb2Rub8WbY2kgd2FyaWFuY2ppLgoKYGBge3IgdHJhZCwgZWNobz1GQUxTRX0KYmFydGxldHQudGVzdCh3ZWlnaHQgfiBEaWV0LCBDaGlja2VuKQpgYGAKClR1dGFqIHRha8W8ZSB0cnplYmEgb2RyenVjacSHIGhpcG90ZXrEmSB6ZXJvd8SFLCBjbyBvem5hY3phLCDFvGUgemJpw7NyIHRlbiBuaWUgbWEgc3RhxYJlaiB3YXJpYW5jamkuCk5pZW1uaWVqIG1vxbxuYSBzcHLDs2Jvd2HEhyBkb2tvbmHEhyB0ZXN0b3dhbmlhIEFOT1ZBLgoKCmBgYHtyIHRyYWRlLCBlY2hvPUZBTFNFfQphbm92YShhb3Yod2VpZ2h0IH4gRGlldCwgQ2hpY2tlbikpCmBgYAoKVGVzdG93YW5pZSB0byB3eWthenVqZSwgxbxlIGplc3QgaXN0b3RuYSB6YWxlxbxub8WbxIcgcG9tacSZZHp5IGRpZXTEhSwgYSB3YWfEhS4KCgpXeWtvbmHEhyBtb8W8bmEgdGFrxbxlIHRlc3Qgc3ByYXdkemrEhWN5IG9uZXdheS4KCmBgYHtyIGJvb3RlaywgZWNobz1GQUxTRX0Kb25ld2F5LnRlc3Qod2VpZ2h0fkRpZXQsIHZhci5lcXVhbD1ULCBkYXRhPUNoaWNrZW4pCmBgYAoKT24gdGFrxbxlIHd5a2F6YcWCIHRha8SFIHNhbcSFIHdhcnRvxZvEhywgY28gdGVzdCBBTk9WQS4KCk5hc3TEmXBuaWUgbW/FvGVteSBvYmxpY3p5xIcgdGVzdCBUdXNrZXlhIEhTRCBqYWtvIMWbcm9kZWsgZG8gb2tyZcWbbGVuaWEga29ua3JldG55Y2ggcG96aW9tw7N3IHBvamVkeW5jemVnbyBjenlubmlrYSBpc3RuaWVqxIVjZWdvIHcgdGVqIGFuYWxpemllLCBrdMOzcmUgc8SFIG5hcHJhd2TEmSBuaWV6YWxlxbxuZSBvZCBzaWViaWUgaSB3cMWCeXdhasSFIG5hIGFuYWxpem93YW7EhSB6bWllbm7EhS4KCmBgYHtyIHRyYXJlLCBlY2hvPUZBTFNFfQpwb3N0X21vZGVsMTwtYW92KHdlaWdodCB+IERpZXQpCmVmZWt0X2hzZDwtVHVrZXlIU0QocG9zdF9tb2RlbDEsd2hpY2g9IkRpZXQiKQpwcmludChlZmVrdF9oc2QpCnBsb3QoKGVmZWt0X2hzZCkpCmBgYAoKUG93ecW8c3phIGFuYWxpemEgd3NrYXp1amUsIMW8ZSB3IHByYWt0eWNlIHLDs8W8bmljZSB3IHJlbGFjamkgZG8gcGllcndzemVqIGRpZXR5IHPEhSBuYWppc3RvdG5pZWpzemUuClR1dGFqIG1vxbxlIHBvamF3aWHEhyBzacSZIHByb2JsZW0sIMW8ZSBpc3RvdG5vxZvEhyB0ZWogcmVsYWNqaSB6YW5pa2Egd3JheiB6IHLDs8W8bm9yb2Rub8WbY2nEhSBkaWV0eSwgY28gYnnFgm8gd2lkb2N6bmUgbmF3ZXQgbmEgd3lrcmVzaWUuIEN6d2FydGEgZGlldGEgbmllIHp3acSZa3N6YcWCYSBib3dpZW0gdGFrIGRvYnJ6ZSB3YWdpIGphayB0cnplY2lhLgpXYXJ0byBzcHJhd2R6acSHIHdpxJljIHcgcG9kZWrFm2NpdSBib290c3RyYXBvd3ltIGN6eSB0ZXN0IEFOT1ZBIHcgcG9kZWrFm2NpdSBwZXJtdXRhY3lqbnltIGRhIHBvZG9ibmUgcmV6bHV0YXR5LgoKIyMgUG9kZWrFm2NpZSBib290c3RyYXBvd2UKClplIHd6Z2zEmWR1IG5hIGR1xbzEhSBsaWN6YsSZIHJla29yZMOzdyB6b3N0YW5pZSBwb2RhbnkgdHlsa28gcmV6dWx0YXQgdGVqIGFuYWxpenkuCkRsYSBUZXN0dSBGIG8gd2FkemUgMTAwMCByZWtvcmTDs3cgcHJhd2RvcG9kb2JpZcWEc3R3byB3eW5pb3PFgm8gcsOzd25lIDAuIENvIG96bmFjemEsIMW8ZSBqZXN0IGlzdG90bmEgemFsZcW8bm/Fm8SHIHBvbWnEmWR6eSBkaWV0xIUsIGEgd2FnxIUuIENhxYJvxZvEhyBhbmFsaXp5IHpvc3RhbmllIHByemVkc3Rhd2lvbnkgbmEgaGlzdG9ncmFtaWUuCgpgYGB7ciBib290LCBlY2hvPUZBTFNFLHJlc3VsdHM9Rn0KbGlicmFyeShsbWJvb3QpCmQ8LUFOT1ZBLmJvb3Qod2VpZ2h0fkRpZXQsIGRhdGE9Q2hpY2tlbikKCmBgYAoKYGBge3IgYm90cm8sIGVjaG89Rn0KcGFyKG1mcm93PWMoMSwxKSkKaGlzdChkJGJvb3RGU3RhdHMsIHlsaW09YygwLDEpLCB4bGltPWMoMCw4KSwgcHJvYj1ULCBtYWluID0gIkhpc3RvZ3JhbSByb3prZMWCYWR1IEYgYm9vc3RyYXBvd2VnbyIpCng9c2VxKC4yNSw2LC4yNSkKcG9pbnRzKHgseT1kZih4LDMsMzU3NCksdHlwZT0iYiIsY29sPSJyZWQiKSAgI1RoZSBGLWRpc3RyaWJ1dGlvbgpgYGAKClN0YXR5c3R5a2EgRiBkbGEgMTAwMCByZWtyb3Jkw7N3IGplc3QgcG9rYXphbmEgcG93ecW8ZWouIFByYXdkb3BvZG9iaWXFhHN0d28sIGFieSBwcnp5asSFxIcgaGlwb3RlesSZIHplcm93xIUgamVzdCBtaW5tYWxuZS4gCgojIyBQb2RzdW1vd2FuaWUKClRlc3QgQU5PVkEgYm9vc3RyYXBvd3kgbWEgd2FydG/Fm8SHIHAgPSAwICh6ZXJvKSwgY28gd3NrYXp1amUsIMW8ZSBpc3RuaWVqZSBwcmF3ZG9wb2RvYmllxYRzdHdvID0gMCwgxbxlIHd5bmlrIHJvemvFgmFkdSBib29zdHJhcG93ZWdvIEYgamVzdCB3eW5pa2llbSB3ecWCxIVjem5pZSByYW5kb21pemFjamkuIERsYXRlZ28gbmEgcG9kc3Rhd2llIHRlZ28gd3luaWt1IG9kcnp1Y2lsaWJ5xZtteSBoaXBvdGV6xJkgemVyb3fEhSwgY28gcHJvd2FkemnFgm9ieSBkbyBwcnpla29uYW5pYSwgxbxlIGRpZXRhIHJ6ZWN6eXdpxZtjaWUgbWlhxYLEhSB3cMWCeXcgbmEgd2FnxJkga3VyY3pha8Ozdy4=