#install.packages("devtools") # solo una vez
devtools::install_github("dgonxalex80/paquetePROB") # descarga paqueteDEG
library(paquetePROB) # activa paqueteDEG
data("beer") # carga la base beer
beer$tipo <- as.factor(beer$tipo)
beer$origen <- as.factor(beer$origen)

Origen:

0-nacional 1-importada
60 216

Tipo de cerveza:

t <- (table(beer$tipo))
names(t) <- c("1-lager artesanal", "2-clara artesanal", "3-lager importada", "4-cerveza normal y helada", "5-cerveza baja en calorías y sin alcohol")
pander(t)
Table continues below
1-lager artesanal 2-clara artesanal 3-lager importada
52 68 40
4-cerveza normal y helada 5-cerveza baja en calorías y sin alcohol
64 52

Resumen indicadores:

pander(descr(beer))
  calorias id poralcoh precio
Mean 142.3 138.5 4.42 4.963
Std.Dev 29.74 79.82 1.566 1.439
Min 58 1 0 2.36
Q1 142 69.5 4.4 3.9
Median 148 138.5 4.9 4.79
Q3 160 207.5 5.1 6.24
Max 201 276 6 7.8
MAD 16.31 102.3 0.593 1.735
IQR 18 137.5 0.7 2.34
CV 0.2089 0.5763 0.3544 0.2899
Skewness -1.268 0 -2.16 0.1093
SE.Skewness 0.1466 0.1466 0.1466 0.1466
Kurtosis 1.271 -1.213 3.532 -1.07
N.Valid 276 276 276 276
Pct.Valid 100 100 100 100

Tabla de frecuencia para variables cuantitativas:

1. Precio:

h2=with(beer, graph.freq(precio, plot=FALSE))
t2=table.freq(h2)
colnames(t2) = c( "  LI  ", "  LS  ", "marca clase'", "Frec.Abs","Frec.Rel", "Frec.Abs.Ac","Frec.Rel.Ac")

pander(t2)
LI LS marca clase’ Frec.Abs Frec.Rel Frec.Abs.Ac Frec.Rel.Ac
2.3 2.91 2.605 24 8.7 24 8.7
2.91 3.52 3.215 24 8.7 48 17.4
3.52 4.13 3.825 68 24.6 116 42
4.13 4.74 4.435 12 4.3 128 46.4
4.74 5.35 5.045 24 8.7 152 55.1
5.35 5.96 5.655 36 13 188 68.1
5.96 6.57 6.265 56 20.3 244 88.4
6.57 7.18 6.875 12 4.3 256 92.8
7.18 7.79 7.485 16 5.8 272 98.6
7.79 8.4 8.095 4 1.4 276 100

2. Calorías:

h2=with(beer, graph.freq(calorias, plot=FALSE))
t2=table.freq(h2)
colnames(t2) = c( "  LI  ", "  LS  ", "marca clase'", "Frec.Abs","Frec.Rel", "Frec.Abs.Ac","Frec.Rel.Ac")

pander(t2)
LI LS marca clase’ Frec.Abs Frec.Rel Frec.Abs.Ac Frec.Rel.Ac
50 68 59 8 2.9 8 2.9
68 86 77 16 5.8 24 8.7
86 104 95 12 4.3 36 13
104 122 113 12 4.3 48 17.4
122 140 131 16 5.8 64 23.2
140 158 149 124 44.9 188 68.1
158 176 167 72 26.1 260 94.2
176 194 185 12 4.3 272 98.6
194 212 203 4 1.4 276 100

3. Porcentaje de alcohol:

h2=with(beer, graph.freq(poralcoh, plot=FALSE))
t2=table.freq(h2)
colnames(t2) = c( "  LI  ", "  LS  ", "marca clase'", "Frec.Abs","Frec.Rel", "Frec.Abs.Ac","Frec.Rel.Ac")

pander(t2)
LI LS marca clase’ Frec.Abs Frec.Rel Frec.Abs.Ac Frec.Rel.Ac
0 0.67 0.335 28 10.1 28 10.1
0.67 1.34 1.005 0 0 28 10.1
1.34 2.01 1.675 0 0 28 10.1
2.01 2.68 2.345 0 0 28 10.1
2.68 3.35 3.015 0 0 28 10.1
3.35 4.02 3.685 8 2.9 36 13
4.02 4.69 4.355 64 23.2 100 36.2
4.69 5.36 5.025 124 44.9 224 81.2
5.36 6.03 5.695 52 18.8 276 100

Anlálisis estadísitico respecto a los indicadores:

  1. Calorías: En una muestra de 5 tipos de cervezas de las 69 marcas recogidas tanto nacionales como internacionales, se encontró que en promedio una lata de 12 oz de cerveza contiene 142.3 calorías. El valor calórico más repetitivo fue de 148 calorías; un poco más alto de la media. Encuanto a la dispersión, nos encontramos con una desviación estándar de 29.74 y por ende una varianza de 884,47. el coeficiente de variación se encuentra alrededor del 20%, y en un contexto nutricional calorico, se podría decir que es una muestra homogenea ya que oscila entre valores relativamente similares. En cuanto a la asimetría, nos encontramos con un valor de -1.268, esto nos dice que es altamente asimétrico. 

  2. Precio: el precio medio es de 4.963, con una mediana de 4.79. en cuanto al sesgo, nos encontramos con un sesgo de 0.1093, por lo que se puede decir que los valores del precio son bastante simétricos. El coeficiente de variación es de aproximadamente 29%, por lo que se podría decir que la muestra es levemente heterogénea.

  3. Porcentaje alcohol: Las cervezas tienen un porcentaje de alcohol medio de 4.42 grados, con una mediana de 4.9. Tiene un sesgo de -2.16, por lo que los datos son significativamente asimétricos. Tienen un coeficiente de variación del 35% por lo que la muestra es heterogénea.