##Cargar conjunto de datos
#cargar
ecomerce <- read.csv("E-commerce Website Logs.csv", sep=",")
head(ecomerce)
###Ideas u objetivos de interes para los tomadores de decision
Categorizar a los clientes por el monto de compra (cuartiles - 4 grupos, deciles - 10 grupos) Podria ser de intereses categorizar el tiempo de permanencia en website
*…
##Categorizar en 4 grupos a los montos de compra
quantile(ecomerce$Sales)
## 0% 25% 50% 75% 100%
## NA NA NA NA NA
Resultado /## 0% 25% 50% 75% 100% /## 0.00 5.23 46.92 600.16 11199.97
Segun los resultados:
El valor minimo del monto es 0
interpretación: es $ 5.23; El 25% de los clientes que accedieron al website, su monto maximo de compra es $ 5.23
interpretación: es $ 46.92; El 50% de los clientes que accedieron al website, su monto maximo de compra es $ 46.92
interpretación: es $ 600.16; El 75% de los clientes que accedieron al website, su monto maximo de compra es $ 600.16
interpretación: es $ 11199.97; El 100% de los clientes que accedieron al website, su monto maximo de compra es $ 11199.97
##Calcular cuartiles del tiempo de permanencia en el sitio web
quantile(ecomerce$duration_.seconds.)
## 0% 25% 50% 75% 100%
## NA NA NA NA NA
el valor minimo es 1500
interpretación: es 2371; El 25% de los clientes que accedieron al website, su tiempo maximo de permanencia es 2371 segundos
interpretación: es 3246; El 50% de los clientes que accedieron al website, su tiempo maximo de permanencia es 3246 segundos
interpretación: es 4124; El 75% de los clientes que accedieron al website, su tiempo maximo de permanencia es 4124 segundos
quantile(ecomerce$Sales, probs = seq(0, 1, 0.1))
## 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
## NA NA NA NA NA NA NA NA NA NA NA
quantile(ecomerce$Sales, probs = seq(0, 1, 0.01))
## 0% 1% 2% 3% 4% 5% 6% 7% 8% 9% 10% 11% 12% 13% 14% 15%
## NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## 16% 17% 18% 19% 20% 21% 22% 23% 24% 25% 26% 27% 28% 29% 30% 31%
## NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## 32% 33% 34% 35% 36% 37% 38% 39% 40% 41% 42% 43% 44% 45% 46% 47%
## NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## 48% 49% 50% 51% 52% 53% 54% 55% 56% 57% 58% 59% 60% 61% 62% 63%
## NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## 64% 65% 66% 67% 68% 69% 70% 71% 72% 73% 74% 75% 76% 77% 78% 79%
## NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## 80% 81% 82% 83% 84% 85% 86% 87% 88% 89% 90% 91% 92% 93% 94% 95%
## NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## 96% 97% 98% 99% 100%
## NA NA NA NA NA
library(fBasics)
skewness(ecomerce$Sales)
## Warning in skewness.default(ecomerce$Sales): argument is not numeric or
## logical: returning NA
## [1] NA
Resultado: [1] 3.126829, Como el valor es positivo, entonces la distribucion de los datos es asimetrica positiva, esto quiere decir que los valores estan concentrados en los puntos minimos(la mayoria de clientes compra montos minimos)
hist(ecomerce$sales)
kurtosis(ecomerce$Sales)
## Warning in kurtosis.default(ecomerce$Sales): argument is not numeric or
## logical: returning NA
## [1] NA
Resultado: [1] 12.80659