A continuación, realizaremos algunos análisis preliminares sobre nuestro conjunto de datos final, para así tener más información sobre los datos con los que vamos a trabajar.

Empezaremos observando el número de registros en el conjunto por supermercado.

A pesar de que en el conjunto de datos original el supermercado del que más datos había era el Mercadona, en el conjunto de los productos de interés seleccionados nos encontramos con que este es del que menos registros disponemos. Día y Carrefour tienen un número de registros muy similar.

La categoría a la cual pertenecen más registros es a la de alimentación general. ESta es también a la que pertenece mayor cantidad de productos.

Puede ser interesante también saber qué tipo de distribución siguen los precios de los productos.

Vemos que gran parte de los productos valen entre 0.50€ y 2€, y pocos son los que valen más de 3€. A continuación podemos ver otros parámetros estadísticos.

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##  0.1653  0.8800  1.2500  1.7081  2.0700  6.9500     558

Observemos ahora la misma gráfica para los precios unitarios:

La mayoría de productos tienen precios unitarios entre 0€ y 5€. Hay muy pocos registros con precios de referencia superiores a los 10€.

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##   0.010   0.624   1.180   2.130   2.540  24.110     558