Analisis descriptivo variables cualitativas

library(summarytools)
Warning: package 'summarytools' was built under R version 4.5.2
table(cervezas$tipo)

baja en calorías / sin alcohol        cerveza normal y helada 
                            39                             48 
               clara artesanal                lager artesanal 
                            42                             36 
               lager importada 
                            35 
summarytools::freq(cervezas$tipo, cumul = FALSE)
Frequencies  
cervezas$tipo  
Type: Character  

                                       Freq   % Valid   % Total
------------------------------------ ------ --------- ---------
      baja en calorías / sin alcohol     39     19.50     19.50
             cerveza normal y helada     48     24.00     24.00
                     clara artesanal     42     21.00     21.00
                     lager artesanal     36     18.00     18.00
                     lager importada     35     17.50     17.50
                                <NA>      0                0.00
                               Total    200    100.00    100.00
summarytools::freq(cervezas$pais, cumul = FALSE)
Frequencies  
cervezas$pais  
Type: Character  

                        Freq   % Valid   % Total
--------------------- ------ --------- ---------
             Alemania      4      2.00      2.00
            Argentina      4      2.00      2.00
              Bélgica      5      2.50      2.50
               Brasil      7      3.50      3.50
               Canadá      6      3.00      3.00
                Chile      6      3.00      3.00
             Colombia    113     56.50     56.50
               España     13      6.50      6.50
       Estados Unidos      4      2.00      2.00
              Irlanda      2      1.00      1.00
               Italia      3      1.50      1.50
                Japón      7      3.50      3.50
               México      4      2.00      2.00
         Países Bajos      8      4.00      4.00
                 Perú      3      1.50      1.50
          Reino Unido      6      3.00      3.00
      República Checa      5      2.50      2.50
                 <NA>      0                0.00
                Total    200    100.00    100.00

Analisis descriptivo variables cuantitativas

summary(cervezas$alcohol)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
  0.000   3.975   4.800   4.064   5.200   7.300 
summarytools::descr(cervezas[,c(8,9,11,12)])
Descriptive Statistics  
cervezas  
N: 200  

                    alcohol   calorias   precio   presentacion
----------------- --------- ---------- -------- --------------
             Mean      4.06     161.36     5.64         455.02
          Std.Dev      1.91      62.00     3.29         169.03
              Min      0.00      18.00     0.89         269.00
               Q1      3.95     167.00     3.30         330.00
           Median      4.80     185.00     4.76         473.00
               Q3      5.20     199.00     6.79         500.00
              Max      7.30     239.00    17.89         750.00
              MAD      0.89      23.72     2.44         212.01
              IQR      1.23      32.00     3.49         170.00
               CV      0.47       0.38     0.58           0.37
         Skewness     -1.18      -1.30     1.46           0.71
      SE.Skewness      0.17       0.17     0.17           0.17
         Kurtosis     -0.03       0.10     2.11          -0.79
          N.Valid    200.00     200.00   200.00         200.00
                N    200.00     200.00   200.00         200.00
        Pct.Valid    100.00     100.00   100.00         100.00

El resultado nos indica que el contenido de concentracion de alcohol se encuentra al rededor de 4.8%, con un coeficiente de variacion del 47% y una distribucion asimetrica a la izquierda, lo cual indica que una gran cantidad de cervezas tienen alto contenido de alcohol y muy pocas bajo contenido del alcohol

Analisis bivariado

table(cervezas$tipo, cervezas$origen)
                                
                                 importada nacional
  baja en calorías / sin alcohol        15       24
  cerveza normal y helada               17       31
  clara artesanal                       15       27
  lager artesanal                        5       31
  lager importada                       35        0

1. Variables cualitativas y cuantitativas

Cualitativas (categóricas):

tipo (ej. lager artesanal, clara artesanal, etc.)

pais (ej. Colombia, Alemania, México, etc.)

origen (nacional, importada)

presentación (tipo de envase, aunque en tu base aparece como numérica en ml, conceptualmente es cualitativa si se refiere a formato: botella, lata, barril).

Se clasifican como cualitativas porque representan categorías o atributos no numéricos.

Cuantitativas (numéricas):

alcohol (% de concentración)

calorías (kcal por porción)

precio (valor monetario)

presentación (ml de contenido, si se refiere al tamaño del envase)

Se clasifican como cuantitativas porque expresan magnitudes medibles y permiten calcular indicadores de tendencia central y dispersión.

2. Tablas de frecuencias (cualitativas)

Tipo de cerveza (200 observaciones):

Cerveza normal y helada: 48 (24%)

Clara artesanal: 42 (21%)

Baja en calorías / sin alcohol: 39 (19.5%)

Lager artesanal: 36 (18%)

Lager importada: 35 (17.5%)

Las categorías con mayor proporción son cerveza normal y helada y clara artesanal.

País de procedencia (200 observaciones):

Colombia: 113 (56.5%)

España: 13 (6.5%)

Países Bajos: 8 (4%)

Brasil y Japón: 7 cada uno (3.5%)

Otros países: entre 1% y 3% cada uno.

Colombia concentra más de la mitad de las cervezas, seguida por España y Países Bajos.

Origen:

Nacional: predominan en casi todos los tipos (ej. lager artesanal: 31 nacionales vs. 5 importadas).

Importadas: destacan en la categoría lager importada (35 casos, todos importados).

3. Indicadores de resumen (cuantitativas)

Alcohol (%):

Min: 0.0

Q1: 3.95

Mediana: 4.8

Media: 4.06

Q3: 5.2

Máx: 7.3

Desv. estándar: 1.91

CV: 0.47 (alta variabilidad relativa)

Calorías (kcal):

Min: 18

Q1: 167

Mediana: 185

Media: 161.36

Q3: 199

Máx: 239

Desv. estándar: 62

CV: 0.38

Precio:

Min: 0.89

Q1: 3.30

Mediana: 4.76

Media: 5.64

Q3: 6.79

Máx: 17.89

Desv. estándar: 3.29

CV: 0.58 (muy variable)

Presentación (ml):

Min: 269

Q1: 330

Mediana: 473

Media: 455

Q3: 500

Máx: 750

Desv. estándar: 169

CV: 0.37

4. Variables con mayor variabilidad

Precio (CV = 0.58): gran dispersión, lo que refleja diferencias entre cervezas nacionales económicas e importadas premium.

Alcohol (CV = 0.47): también muy variable, indicando diversidad de estilos (desde sin alcohol hasta cervezas fuertes).

5. Patrones entre tipo, origen y país

Tipo vs. origen:

Las cervezas nacionales dominan en casi todos los tipos, excepto en lager importada, que es exclusivamente importada.

Las artesanales (clara y lager) tienen fuerte presencia nacional.

País:

Colombia concentra más de la mitad de las cervezas, lo que sugiere un mercado local muy fuerte.

Las importadas provienen principalmente de Europa (España, Países Bajos, Bélgica, Alemania).

Origen vs. precio:

Las importadas tienden a tener precios más altos, lo que segmenta el mercado en accesibles vs. premium.

6. Conclusiones descriptivas preliminares

El alcohol se concentra alrededor de 4.8%, pero con alta dispersión, lo que refleja diversidad de estilos.

Las calorías y la presentación muestran variabilidad moderada, asociada a diferencias en envases y recetas.

El precio es la variable más dispersa, indicando un mercado segmentado entre nacionales económicas e importadas premium.

El tipo de cerveza más común es la normal y helada, seguida por la clara artesanal.

Colombia domina como país productor, lo que refleja fuerte presencia local en el mercado.

El análisis bivariado muestra que las importadas se concentran en estilos específicos (lager importada), mientras que las nacionales diversifican más.