Zdrojem dat je náhodně strojově (AI Gemini) soubor dat o pivních preferencích českých spotřebitelů.
Po pročištění dat dostaneme základní tabulku:
## # A tibble: 50 × 8
## id znacka pohlavi vek frekvence chut_hodnoceni nps utrata_mesic
## <dbl> <chr> <chr> <dbl> <chr> <dbl> <dbl> <dbl>
## 1 1 Pilsner Urqu… Muz 34 denne 9 10 1500
## 2 2 Kozel Zena 22 obcas 7 8 300
## 3 3 Radegast Muz 45 tydne 8 9 800
## 4 4 Staropramen Muz NaN obcas 5 4 200
## 5 5 Pilsner Urqu… Zena 28 tydne 10 10 900
## 6 6 Svijany Muz 50 denne 8 7 1200
## 7 7 Budvar Zena 33 obcas 6 5 400
## 8 8 Pilsner Urqu… Muz 41 tydne 9 9 1000
## 9 9 Kozel Muz 19 denne 7 8 1100
## 10 10 Radegast Zena 29 obcas 8 8 350
## # ℹ 40 more rows
Základní rozdělení úživatelů dle pohlaví: Mezi konzumenty piva jasně vítězí muži.
## # A tibble: 2 × 3
## pohlavi pocet procento
## <chr> <int> <dbl>
## 1 Muz 33 66
## 2 Zena 17 34
Tabulku obohatíme o sloupec věkových kategorií. Předtím ještě odstraníme extrémy (příliš vysoký věk) a N/A hodnoty, které nahradíme mediánem.
## # A tibble: 50 × 9
## id znacka pohlavi vek frekvence chut_hodnoceni nps utrata_mesic
## <dbl> <chr> <chr> <dbl> <chr> <dbl> <dbl> <dbl>
## 1 1 Pilsner Urqu… Muz 34 denne 9 10 1500
## 2 2 Kozel Zena 22 obcas 7 8 300
## 3 3 Radegast Muz 45 tydne 8 9 800
## 4 4 Staropramen Muz 33 obcas 5 4 200
## 5 5 Pilsner Urqu… Zena 28 tydne 10 10 900
## 6 6 Svijany Muz 50 denne 8 7 1200
## 7 7 Budvar Zena 33 obcas 6 5 400
## 8 8 Pilsner Urqu… Muz 41 tydne 9 9 1000
## 9 9 Kozel Muz 19 denne 7 8 1100
## 10 10 Radegast Zena 29 obcas 8 8 350
## # ℹ 40 more rows
## # ℹ 1 more variable: kategorie <fct>
Z dat dostáváme tabulku, ze které můžeme vyčíst frekvenci pití piva rozdělenou dle pohlaví:
## # A tibble: 7 × 4
## pohlavi frekvence pocet procento
## <fct> <fct> <int> <dbl>
## 1 Muz denne 14 42
## 2 Muz obcas 4 12
## 3 Muz tydne 13 39
## 4 Muz vyjimecne 2 6
## 5 Zena obcas 8 47
## 6 Zena tydne 5 29
## 7 Zena vyjimecne 4 24
Vidíme, že k častějšímu pití jsou náchylní spíše muži než ženy. Narozdíl od žen 42 % mužů pije denně a i týdenní frekvence je vyšší u mužů.
Tabulka ukazuje rozdělení dle věkových kategorií a četnosti pití piva:
## # A tibble: 13 × 4
## kategorie frekvence n procento
## <fct> <chr> <int> <dbl>
## 1 18-24 denne 3 60
## 2 18-24 obcas 2 40
## 3 25-34 denne 3 12
## 4 25-34 obcas 8 33
## 5 25-34 tydne 7 29
## 6 25-34 vyjimecne 6 25
## 7 35-49 denne 3 21
## 8 35-49 obcas 1 7
## 9 35-49 tydne 10 71
## 10 50-64 denne 4 67
## 11 50-64 obcas 1 17
## 12 50-64 tydne 1 17
## 13 65+ denne 1 100
## # A tibble: 19 × 4
## kategorie znacka n procento
## <fct> <chr> <int> <dbl>
## 1 18-24 Kozel 5 100
## 2 25-34 Budvar 2 8
## 3 25-34 Heineken 3 12
## 4 25-34 Kozel 1 4
## 5 25-34 Pilsner Urquell 6 25
## 6 25-34 Radegast 5 21
## 7 25-34 Staropramen 3 12
## 8 25-34 Stella Artois 3 12
## 9 25-34 Svijany 1 4
## 10 35-49 Budvar 2 14
## 11 35-49 Kozel 2 14
## 12 35-49 Pilsner Urquell 4 29
## 13 35-49 Radegast 3 21
## 14 35-49 Svijany 3 21
## 15 50-64 Braník 2 33
## 16 50-64 Kozel 1 17
## 17 50-64 Pilsner Urquell 2 33
## 18 50-64 Svijany 1 17
## 19 65+ Braník 1 100
Zatímco u nejmladší skupiny je oblíbená značka Kozel, u nejstarší je nejoblíbenější značka Braník. Ve všech ostatních kategoriích je nejoblíbenější značkou Pisner Urquell kromě kategorie 50-64, kde se dělí o první příčku se značkou Braník.