Wprowadzenie

W tym raporcie przenalizujemy testowanie hipotez przy użyciu odpowiednich pakietów oraz danych przedstawionych w zbiorze OJ.

Dane

Po wczytaniu odpowiednich danych pora je zaprezentować:

##   Purchase WeekofPurchase StoreID PriceCH PriceMM DiscCH DiscMM SpecialCH
## 1       CH            237       1    1.75    1.99   0.00    0.0         0
## 2       CH            239       1    1.75    1.99   0.00    0.3         0
## 3       CH            245       1    1.86    2.09   0.17    0.0         0
## 4       MM            227       1    1.69    1.69   0.00    0.0         0
## 5       CH            228       7    1.69    1.69   0.00    0.0         0
## 6       CH            230       7    1.69    1.99   0.00    0.0         0
##   SpecialMM  LoyalCH SalePriceMM SalePriceCH PriceDiff Store7 PctDiscMM
## 1         0 0.500000        1.99        1.75      0.24     No  0.000000
## 2         1 0.600000        1.69        1.75     -0.06     No  0.150754
## 3         0 0.680000        2.09        1.69      0.40     No  0.000000
## 4         0 0.400000        1.69        1.69      0.00     No  0.000000
## 5         0 0.956535        1.69        1.69      0.00    Yes  0.000000
## 6         1 0.965228        1.99        1.69      0.30    Yes  0.000000
##   PctDiscCH ListPriceDiff STORE
## 1  0.000000          0.24     1
## 2  0.000000          0.24     1
## 3  0.091398          0.23     1
## 4  0.000000          0.00     1
## 5  0.000000          0.00     0
## 6  0.000000          0.30     0

Następnym krokiem jest wybór zmiennych. Będziemy testować czy cena soku Citrus Hill jest statystycznie zależna od tego jaki został zakupiony produkt: czy Citrus Hill, czy Minute Maid Orange Juice. Stąd do analizy, zmienną niezależną wybrano Purchase, a zależną PriceCH. Następnie zbadamy niezależność cen obu soków.

Analiza

Do analizy posłuży metoda postępowania bootstrapowego. Czyli procedura obliczeniowa wybranego testu statystycznego poprzez symulacyjne ocenianie empirycznego rozkładus, a następnie na jego podstawie wyliczanie wartości p.

Za pomocą funkcji boot.t.test, dokonano analizy testu t-studenta, przy 999 permutacji.Wartość ta jest podyktowana faktem, że Davidson i Hinkley zaproponowali, by dla dużych prób (powyżej 50) sprawdzać w takiej ilości, gdyż w takim wypdku ilość permutacji wynosi 1000, przy danym wzorze:

\[B >= 50/min( α,1-α ) \]

gdzie B = lizba permutacji. Dlatego w analizie taka wartość zostanie określona.

## 
##  Bootstrap Welch Two Sample t-test
## 
## data:  PriceMM by Purchase
## bootstrap p-value < 2.2e-16 
## bootstrap difference of means (SE) = 0.04091216 (0.008890043) 
## 95 percent bootstrap percentile confidence interval:
##  0.02404184 0.05773723
## 
## Results without bootstrap:
## t = 4.6148, df = 699.02, p-value = 4.682e-06
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  0.02360736 0.05856957
## sample estimates:
## mean in group CH mean in group MM 
##         2.101424         2.060336

Wyniki analizy wskazują, że należy odrzucić hipotezę zerową o nieistotności tych zmiennych. A więc rzeczywiście ta zależność jest istotna statystycznie. Przedstawić ją można na wykresie:

Średnio, cena CH wynosi 2,1, a MM 2,06. Kolejnym krokiem jest zbadanie niezależności cen obu napojów.

## 
##  Pearson's Chi-squared test with simulated p-value (based on 999
##  replicates)
## 
## data:  tabela
## X-squared = 2370, df = NA, p-value = 0.001

Wyniki testu chi^2 wskazują na odrzucenie hipotezy zerowej o braku różnic w cenach tych napojów. Wykres tego testu byłby zbyt nieczytelny z tego względu pominięto wizualizację.

Kolejnym krokiem jest więc test Test Kołmogorowa-Smirnowa do porównywania rozkładów jednowymiarowych cech statystycznych. Wartość testu oraz p-value prezentuje się następująco:

##         D 
## 0.7214953
## [1] 0.001

Z tego względu można odrzucić hipotezę zerową o jednorodności tych rozkładów. Wartość ta zostanie przedstawiona na wykresie:

Podsumowanie

Dokonano testowania hipotez. Analiza została dokonana na przykładowych danych dotyczących cen napojów. Wskazano pewne zależności, które także zwizualizowano.

Ci0tLQp0aXRsZTogJ05pZWtsYXN5Y3puZSBtZXRvZHkgc3RhdHlzdHlraScKc3VidGl0bGU6ICdUZXN0b3dhbmllIEhpcG90ZXonCmRhdGU6ICJgciBTeXMuRGF0ZSgpYCIKYXV0aG9yOiAiTWFjaWVqIEhvcmlzem55IgpvdXRwdXQ6CiAgaHRtbF9kb2N1bWVudDogCiAgICB0aGVtZTogY2VydWxlYW4KICAgIGhpZ2hsaWdodDogdGV4dG1hdGUKICAgIGZvbnRzaXplOiAxMHB0CiAgICB0b2M6IHllcwogICAgY29kZV9kb3dubG9hZDogeWVzCiAgICB0b2NfZmxvYXQ6CiAgICAgIGNvbGxhcHNlZDogbm8KICAgIGRmX3ByaW50OiBkZWZhdWx0CiAgICB0b2NfZGVwdGg6IDUKZWRpdG9yX29wdGlvbnM6IAogIG1hcmtkb3duOiAKICAgIHdyYXA6IDcyCi0tLQoKCmBgYHtyIHNldHVwLCBpbmNsdWRlPUZBTFNFfQprbml0cjo6b3B0c19jaHVuayRzZXQoZWNobyA9IFRSVUUpCmBgYAoKIyBXcHJvd2FkemVuaWUKClcgdHltIHJhcG9yY2llIHByemVuYWxpenVqZW15IHRlc3Rvd2FuaWUgaGlwb3RleiBwcnp5IHXFvHljaXUgb2Rwb3dpZWRuaWNoIHBha2lldMOzdyBvcmF6IGRhbnljaCBwcnplZHN0YXdpb255Y2ggdyB6YmlvcnplICoqT0oqKi4KCmBgYHtyIGNhcnMsIHdhcm5pbmc9RkFMU0UsIGVjaG89RkFMU0UsIG1lc3NhZ2U9Rn0KbGlicmFyeShNS2luZmVyKQpsaWJyYXJ5KGdnc3RhdHNwbG90KQpsaWJyYXJ5KElTTFIpCmRhdGEoT0opCgpgYGAKCiMgRGFuZQoKUG8gd2N6eXRhbml1IG9kcG93aWVkbmljaCBkYW55Y2ggcG9yYSBqZSB6YXByZXplbnRvd2HEhzoKCmBgYHtyIHByZXNzdXJlLCBlY2hvPUZBTFNFfQpoZWFkKE9KKQpgYGAKTmFzdMSZcG55bSBrcm9raWVtIGplc3Qgd3liw7NyIHptaWVubnljaC4KQsSZZHppZW15IHRlc3Rvd2HEhyBjenkgY2VuYSBzb2t1ICpDaXRydXMgSGlsbCogamVzdCBzdGF0eXN0eWN6bmllIHphbGXFvG5hIG9kIHRlZ28gamFraSB6b3N0YcWCIHpha3VwaW9ueSBwcm9kdWt0OiBjenkgQ2l0cnVzIEhpbGwsIGN6eSBNaW51dGUgTWFpZCBPcmFuZ2UgSnVpY2UuIFN0xIVkIGRvIGFuYWxpenksIHptaWVubsSFIG5pZXphbGXFvG7EhSB3eWJyYW5vICoqUHVyY2hhc2UqKiwgYSB6YWxlxbxuxIUgKipQcmljZUNIKiouIE5hc3TEmXBuaWUgemJhZGFteSBuaWV6YWxlxbxub8WbxIcgY2VuIG9idSBzb2vDs3cuCgojIEFuYWxpemEKRG8gYW5hbGl6eSBwb3PFgnXFvHkgbWV0b2RhIHBvc3TEmXBvd2FuaWEgYm9vdHN0cmFwb3dlZ28uIEN6eWxpIHByb2NlZHVyYSBvYmxpY3plbmlvd2Egd3licmFuZWdvIHRlc3R1IHN0YXR5c3R5Y3puZWdvIHBvcHJ6ZXogc3ltdWxhY3lqbmUgb2NlbmlhbmllIGVtcGlyeWN6bmVnbyByb3prxYJhZHVzLCBhIG5hc3TEmXBuaWUgbmEgamVnbyBwb2RzdGF3aWUgd3lsaWN6YW5pZSB3YXJ0b8WbY2kgcC4KClphIHBvbW9jxIUgZnVua2NqaSAqYm9vdC50LnRlc3QqLCBkb2tvbmFubyBhbmFsaXp5IHRlc3R1IHQtc3R1ZGVudGEsIHByenkgOTk5IHBlcm11dGFjamkuV2FydG/Fm8SHIHRhIGplc3QgcG9keWt0b3dhbmEgZmFrdGVtLCDFvGUgRGF2aWRzb24gaSBIaW5rbGV5IHphcHJvcG9ub3dhbGksIGJ5IGRsYSBkdcW8eWNoIHByw7NiIChwb3d5xbxlaiA1MCkgc3ByYXdkemHEhyB3IHRha2llaiBpbG/Fm2NpLCBnZHnFvCB3IHRha2ltIHd5cGRrdSBpbG/Fm8SHIHBlcm11dGFjamkgd3lub3NpIDEwMDAsIHByenkgZGFueW0gd3pvcnplOgoKICAkJEIgPj0gNTAvbWluKCDOsSwxLc6xICkKICQkCiAKZ2R6aWUgQiA9IGxpemJhIHBlcm11dGFjamkuIERsYXRlZ28gdyBhbmFsaXppZSB0YWthIHdhcnRvxZvEhyB6b3N0YW5pZSBva3JlxZtsb25hLgoKYGBge3IgcHJ1cmUsIGVjaG89RkFMU0V9Cnd5bmlraTwtYm9vdC50LnRlc3QoUHJpY2VNTX5QdXJjaGFzZSwgUj05OTksIGRhdGE9T0opCnd5bmlraQpgYGAKCld5bmlraSBhbmFsaXp5IHdza2F6dWrEhSwgxbxlIG5hbGXFvHkgb2RyenVjacSHIGhpcG90ZXrEmSB6ZXJvd8SFIG8gbmllaXN0b3Rub8WbY2kgdHljaCB6bWllbm55Y2guIEEgd2nEmWMgcnplY3p5d2nFm2NpZSB0YSB6YWxlxbxub8WbxIcgamVzdCBpc3RvdG5hIHN0YXR5c3R5Y3puaWUuClByemVkc3Rhd2nEhyBqxIUgbW/FvG5hIG5hIHd5a3Jlc2llOgoKYGBge3IgcHJlLCBlY2hvPUZBTFNFfQpnZ2JldHdlZW5zdGF0cyhkYXRhPU9KLAogICAgICAgICAgICAgIHg9UHVyY2hhc2UsCiAgICAgICAgICAgICAgeT1QcmljZU1NLAogICAgICAgICAgICAgIG5ib290PTk5OSkKYGBgCgoKxZpyZWRuaW8sIGNlbmEgQ0ggd3lub3NpIDIsMSwgYSBNTSAyLDA2LiAKS29sZWpueW0ga3Jva2llbSBqZXN0IHpiYWRhbmllIG5pZXphbGXFvG5vxZtjaSBjZW4gb2J1IG5hcG9qw7N3LgoKYGBge3Iga2VyZSwgZWNobz1GQUxTRX0KdGFiZWxhPC10YWJsZShPSiRQcmljZU1NLE9KJFByaWNlQ0gpCmNoaXNxLnRlc3QodGFiZWxhLCBzaW11bGF0ZS5wLnZhbHVlID0gVCwgQj05OTkpCmBgYApXeW5pa2kgdGVzdHUgY2hpXjIgd3NrYXp1asSFIG5hIG9kcnp1Y2VuaWUgaGlwb3RlenkgemVyb3dlaiBvIGJyYWt1IHLDs8W8bmljIHcgY2VuYWNoIHR5Y2ggbmFwb2rDs3cuIFd5a3JlcyB0ZWdvIHRlc3R1IGJ5xYJieSB6Ynl0IG5pZWN6eXRlbG55IHogdGVnbyB3emdsxJlkdSBwb21pbmnEmXRvIHdpenVhbGl6YWNqxJkuCgpLb2xlam55bSBrcm9raWVtIGplc3Qgd2nEmWMgdGVzdCBUZXN0IEtvxYJtb2dvcm93YS1TbWlybm93YSBkbyBwb3LDs3dueXdhbmlhIHJvemvFgmFkw7N3IGplZG5vd3ltaWFyb3d5Y2ggY2VjaCBzdGF0eXN0eWN6bnljaC4gV2FydG/Fm8SHIHRlc3R1IG9yYXogcC12YWx1ZSBwcmV6ZW50dWplIHNpxJkgbmFzdMSZcHVqxIVjbzoKCmBgYHtyIHByZXJlZmV3ZSwgZWNobz1GQUxTRSwgd2FybmluZz1GQUxTRX0KbGlicmFyeShmb3JlaWduKQp5PC1PSiRQcmljZU1NCng8LU9KJFByaWNlQ0gKCm48LWxlbmd0aCh4KTsgbTwtbGVuZ3RoKHkpOyBCPC05OTkKKHRoZXRhPC1rcy50ZXN0KHgseSkkc3RhdGlzdGljKQp0aGV0YXN0YXI8LW51bWVyaWMoQikKZm9yIChiIGluIDE6Qikgewp6c3Rhcjwtc2FtcGxlKGMoeCx5KSkKeHN0YXI8LXpzdGFyWzE6bl0KeXN0YXI8LXpzdGFyWygxOm0pK25dCnRoZXRhc3RhcltiXTwta3MudGVzdCh4c3Rhcix5c3Rhcikkc3RhdGlzdGljIH0KI29ibGljemFteSBwLXZhbHVlCihzdW0odGhldGFzdGFyPj10aGV0YSkrMSkvKEIrMSkKYGBgCgpaIHRlZ28gd3pnbMSZZHUgbW/FvG5hIG9kcnp1Y2nEhyBoaXBvdGV6xJkgemVyb3fEhSBvIGplZG5vcm9kbm/Fm2NpIHR5Y2ggcm96a8WCYWTDs3cuIFdhcnRvxZvEhyB0YSB6b3N0YW5pZSBwcnplZHN0YXdpb25hIG5hIHd5a3Jlc2llOgoKYGBge3IgcHJlZWZld3JlLCBlY2hvPUZBTFNFLCB3YXJuaW5nPUZBTFNFfQpsaWJyYXJ5KGdncGxvdDIpCnNhbXBsZTEgPC0gT0okUHJpY2VNTQpzYW1wbGUyIDwtIE9KJFByaWNlQ0gKZ3JvdXAgPC0gYyhyZXAoIlByaWNlTU0iLCBsZW5ndGgoc2FtcGxlMSkpLCByZXAoIlByaWNlQ0giLCBsZW5ndGgoc2FtcGxlMikpKQpkYXQgPC0gZGF0YS5mcmFtZShLU0QgPSBjKHNhbXBsZTEsc2FtcGxlMiksIGdyb3VwID0gZ3JvdXApCiMgY3JlYXRlIEVDREYgb2YgZGF0YQpjZGYxIDwtIGVjZGYoc2FtcGxlMSkgCmNkZjIgPC0gZWNkZihzYW1wbGUyKSAKIyBmaW5kIG1pbiBhbmQgbWF4IHN0YXRpc3RpY3MgdG8gZHJhdyBsaW5lIGJldHdlZW4gcG9pbnRzIG9mIGdyZWF0ZXN0IGRpc3RhbmNlCm1pbk1heCA8LSBzZXEobWluKHNhbXBsZTEsIHNhbXBsZTIpLCBtYXgoc2FtcGxlMSwgc2FtcGxlMiksIGxlbmd0aC5vdXQ9bGVuZ3RoKHNhbXBsZTEpKSAKeDAgPC0gbWluTWF4W3doaWNoKCBhYnMoY2RmMShtaW5NYXgpIC0gY2RmMihtaW5NYXgpKSA9PSBtYXgoYWJzKGNkZjEobWluTWF4KSAtIGNkZjIobWluTWF4KSkpICldIAp5MCA8LSBjZGYxKHgwKSAKeTEgPC0gY2RmMih4MCkgCmdncGxvdChkYXQsIGFlcyh4ID0gS1NELCBncm91cCA9IGdyb3VwLCBjb2xvciA9IGdyb3VwKSkrCiAgc3RhdF9lY2RmKHNpemU9MSkgKwogICAgdGhlbWVfYncoYmFzZV9zaXplID0gMjgpICsKICAgIHRoZW1lKGxlZ2VuZC5wb3NpdGlvbiA9InRvcCIpICsKICAgIHhsYWIoIkNlbmEiKSArCiAgICB5bGFiKCJSb3prxYJhZCIpICsKICAgICNnZW9tX2xpbmUoc2l6ZT0xKSArCiAgICBnZW9tX3NlZ21lbnQoYWVzKHggPSB4MFsxXSwgeSA9IHkwWzFdLCB4ZW5kID0geDBbMV0sIHllbmQgPSB5MVsxXSksCiAgICAgICAgbGluZXR5cGUgPSAiZGFzaGVkIiwgY29sb3IgPSAicmVkIikgKwogICAgZ2VvbV9wb2ludChhZXMoeCA9IHgwWzFdICwgeT0geTBbMV0pLCBjb2xvcj0icmVkIiwgc2l6ZT04KSArCiAgICBnZW9tX3BvaW50KGFlcyh4ID0geDBbMV0gLCB5PSB5MVsxXSksIGNvbG9yPSJyZWQiLCBzaXplPTgpICsKICAgIGdndGl0bGUoIkstUyBUZXN0IikgKwogICAgdGhlbWUobGVnZW5kLnRpdGxlPWVsZW1lbnRfYmxhbmsoKSkKYGBgCgojIFBvZHN1bW93YW5pZQoKRG9rb25hbm8gdGVzdG93YW5pYSBoaXBvdGV6LiBBbmFsaXphIHpvc3RhxYJhIGRva29uYW5hIG5hIHByenlrxYJhZG93eWNoIGRhbnljaCBkb3R5Y3rEhWN5Y2ggY2VuIG5hcG9qw7N3LiBXc2themFubyBwZXduZSB6YWxlxbxub8WbY2ksIGt0w7NyZSB0YWvFvGUgendpenVhbGl6b3dhbm8uIAoKCg==