Průzkum chování spotřebitelů piva

Zdrojem dat je náhodně strojově (AI Gemini) soubor dat o pivních preferencích českých spotřebitelů.

Zpracování

Základní zpracování

Po pročištění dat dostaneme základní tabulku:

## # A tibble: 50 × 8
##       id znacka        pohlavi   vek frekvence chut_hodnoceni   nps utrata_mesic
##    <dbl> <chr>         <chr>   <dbl> <chr>              <dbl> <dbl>        <dbl>
##  1     1 Pilsner Urqu… Muz        34 denne                  9    10         1500
##  2     2 Kozel         Zena       22 obcas                  7     8          300
##  3     3 Radegast      Muz        45 tydne                  8     9          800
##  4     4 Staropramen   Muz       NaN obcas                  5     4          200
##  5     5 Pilsner Urqu… Zena       28 tydne                 10    10          900
##  6     6 Svijany       Muz        50 denne                  8     7         1200
##  7     7 Budvar        Zena       33 obcas                  6     5          400
##  8     8 Pilsner Urqu… Muz        41 tydne                  9     9         1000
##  9     9 Kozel         Muz        19 denne                  7     8         1100
## 10    10 Radegast      Zena       29 obcas                  8     8          350
## # ℹ 40 more rows

Rozdělení konzumentů dle pohlaví

Základní rozdělení úživatelů dle pohlaví: Mezi konzumenty piva jasně vítězí muži.

## # A tibble: 2 × 3
##   pohlavi pocet procento
##   <chr>   <int>    <dbl>
## 1 Muz        33       66
## 2 Zena       17       34

Přidání věkových kategorií

Tabulku obohatíme o sloupec věkových kategorií. Předtím ještě odstraníme extrémy (příliš vysoký věk) a N/A hodnoty, které nahradíme mediánem.

## # A tibble: 50 × 9
##       id znacka        pohlavi   vek frekvence chut_hodnoceni   nps utrata_mesic
##    <dbl> <chr>         <chr>   <dbl> <chr>              <dbl> <dbl>        <dbl>
##  1     1 Pilsner Urqu… Muz        34 denne                  9    10         1500
##  2     2 Kozel         Zena       22 obcas                  7     8          300
##  3     3 Radegast      Muz        45 tydne                  8     9          800
##  4     4 Staropramen   Muz        33 obcas                  5     4          200
##  5     5 Pilsner Urqu… Zena       28 tydne                 10    10          900
##  6     6 Svijany       Muz        50 denne                  8     7         1200
##  7     7 Budvar        Zena       33 obcas                  6     5          400
##  8     8 Pilsner Urqu… Muz        41 tydne                  9     9         1000
##  9     9 Kozel         Muz        19 denne                  7     8         1100
## 10    10 Radegast      Zena       29 obcas                  8     8          350
## # ℹ 40 more rows
## # ℹ 1 more variable: kategorie <fct>

Frekvence pití dle pohlaví

Z dat dostáváme tabulku, ze které můžeme vyčíst frekvenci pití piva rozdělenou dle pohlaví:

## # A tibble: 7 × 4
##   pohlavi frekvence pocet procento
##   <fct>   <fct>     <int>    <dbl>
## 1 Muz     denne        14       42
## 2 Muz     obcas         4       12
## 3 Muz     tydne        13       39
## 4 Muz     vyjimecne     2        6
## 5 Zena    obcas         8       47
## 6 Zena    tydne         5       29
## 7 Zena    vyjimecne     4       24

Vidíme, že k častějšímu pití jsou náchylní spíše muži než ženy. Narozdíl od žen 42 % mužů pije denně a i týdenní frekvence je vyšší u mužů.

Četnost pití piva napříč věkovými kategoriemi

Tabulka ukazuje rozdělení dle věkových kategorií a četnosti pití piva:

## # A tibble: 13 × 4
##    kategorie frekvence     n procento
##    <fct>     <chr>     <int>    <dbl>
##  1 18-24     denne         3       60
##  2 18-24     obcas         2       40
##  3 25-34     denne         3       12
##  4 25-34     obcas         8       33
##  5 25-34     tydne         7       29
##  6 25-34     vyjimecne     6       25
##  7 35-49     denne         3       21
##  8 35-49     obcas         1        7
##  9 35-49     tydne        10       71
## 10 50-64     denne         4       67
## 11 50-64     obcas         1       17
## 12 50-64     tydne         1       17
## 13 65+       denne         1      100

Konzumace jedntlivých značek v jednotlivých věkových kategoriích

## # A tibble: 19 × 4
##    kategorie znacka              n procento
##    <fct>     <chr>           <int>    <dbl>
##  1 18-24     Kozel               5      100
##  2 25-34     Budvar              2        8
##  3 25-34     Heineken            3       12
##  4 25-34     Kozel               1        4
##  5 25-34     Pilsner Urquell     6       25
##  6 25-34     Radegast            5       21
##  7 25-34     Staropramen         3       12
##  8 25-34     Stella Artois       3       12
##  9 25-34     Svijany             1        4
## 10 35-49     Budvar              2       14
## 11 35-49     Kozel               2       14
## 12 35-49     Pilsner Urquell     4       29
## 13 35-49     Radegast            3       21
## 14 35-49     Svijany             3       21
## 15 50-64     Braník              2       33
## 16 50-64     Kozel               1       17
## 17 50-64     Pilsner Urquell     2       33
## 18 50-64     Svijany             1       17
## 19 65+       Braník              1      100

Zatímco u nejmladší skupiny je oblíbená značka Kozel, u nejstarší je nejoblíbenější značka Braník. Ve všech ostatních kategoriích je nejoblíbenější značkou Pisner Urquell kromě kategorie 50-64, kde se dělí o první příčku se značkou Braník.