##Cargar conjunto de datos

#cargar
ecomerce <- read.csv("E-commerce Website Logs.csv", sep=",")
head(ecomerce)

###Ideas u objetivos de interes para los tomadores de decision

Categorizar a los clientes por el monto de compra (cuartiles - 4 grupos, deciles - 10 grupos) Podria ser de intereses categorizar el tiempo de permanencia en website

*…

##Categorizar en 4 grupos a los montos de compra

quantile(ecomerce$Sales)
##   0%  25%  50%  75% 100% 
##   NA   NA   NA   NA   NA

Resultado /## 0% 25% 50% 75% 100% /## 0.00 5.23 46.92 600.16 11199.97

Segun los resultados:

El valor minimo del monto es 0

Cuartil 1 \((Q_1)\)

interpretación: es $ 5.23; El 25% de los clientes que accedieron al website, su monto maximo de compra es $ 5.23

Cuartil 2 \((Q_2)\)

interpretación: es $ 46.92; El 50% de los clientes que accedieron al website, su monto maximo de compra es $ 46.92

Cuartil 3 \((Q_3)\)

interpretación: es $ 600.16; El 75% de los clientes que accedieron al website, su monto maximo de compra es $ 600.16

Cuartil 4 \((Q_4)\)

interpretación: es $ 11199.97; El 100% de los clientes que accedieron al website, su monto maximo de compra es $ 11199.97

##Calcular cuartiles del tiempo de permanencia en el sitio web

quantile(ecomerce$duration_.seconds.)
##   0%  25%  50%  75% 100% 
##   NA   NA   NA   NA   NA

el valor minimo es 1500

Cuartil 1 \((Q_1)\)

interpretación: es 2371; El 25% de los clientes que accedieron al website, su tiempo maximo de permanencia es 2371 segundos

Cuartil 2 \((Q_2)\)

interpretación: es 3246; El 50% de los clientes que accedieron al website, su tiempo maximo de permanencia es 3246 segundos

Cuartil 3 \((Q_3)\)

interpretación: es 4124; El 75% de los clientes que accedieron al website, su tiempo maximo de permanencia es 4124 segundos

Dividir en 10 grupos (deciles)

quantile(ecomerce$Sales, probs = seq(0, 1, 0.1))
##   0%  10%  20%  30%  40%  50%  60%  70%  80%  90% 100% 
##   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA

Dividir en 100 grupos (percentiles)

quantile(ecomerce$Sales, probs = seq(0, 1, 0.01))
##   0%   1%   2%   3%   4%   5%   6%   7%   8%   9%  10%  11%  12%  13%  14%  15% 
##   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA 
##  16%  17%  18%  19%  20%  21%  22%  23%  24%  25%  26%  27%  28%  29%  30%  31% 
##   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA 
##  32%  33%  34%  35%  36%  37%  38%  39%  40%  41%  42%  43%  44%  45%  46%  47% 
##   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA 
##  48%  49%  50%  51%  52%  53%  54%  55%  56%  57%  58%  59%  60%  61%  62%  63% 
##   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA 
##  64%  65%  66%  67%  68%  69%  70%  71%  72%  73%  74%  75%  76%  77%  78%  79% 
##   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA 
##  80%  81%  82%  83%  84%  85%  86%  87%  88%  89%  90%  91%  92%  93%  94%  95% 
##   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA   NA 
##  96%  97%  98%  99% 100% 
##   NA   NA   NA   NA   NA

Asimetria y curtosis

Asimetria

library(fBasics)
skewness(ecomerce$Sales)
## Warning in skewness.default(ecomerce$Sales): argument is not numeric or
## logical: returning NA
## [1] NA

Resultado: [1] 3.126829, Como el valor es positivo, entonces la distribucion de los datos es asimetrica positiva, esto quiere decir que los valores estan concentrados en los puntos minimos(la mayoria de clientes compra montos minimos)

hist(ecomerce$sales)

Curtisis

kurtosis(ecomerce$Sales)
## Warning in kurtosis.default(ecomerce$Sales): argument is not numeric or
## logical: returning NA
## [1] NA

Resultado: [1] 12.80659