Presentación Facundo Sigal

Importación de datos

Este documento presenta el trabajo realizado por Facundo Sigal para la selección de Analista de Datos en Strata. Las primeras lineas de código importan los datos provenientes de los archivos csv.

facturacion <- read.csv("facturacion_duracion_llamadas_trimestre - f.csv")
planes <- read.csv("cliente_planes - cliente_cdp.csv")
clientes <- read.csv("datos_clientes - dataset.csv")
segmentos <- read.csv("segmentos.csv")

Unión de bases en una única fuente de datos

A continuación se realizan las uniones que fusionan las 4 tablas en un único dataset. Tambien convertimos el indicador Target Churn en un factor.

fact_cli <- left_join(clientes,facturacion, by = "nro_cliente")
fact_cli_plan <- left_join(planes,fact_cli, by = "nro_cliente")
total <- left_join(fact_cli_plan,segmentos, by = "user_id", relationship = "many-to-many")
total$target_churn_indicator <- factor(total$target_churn_indicator)

Analisis exploratorio de datos

Ya estamos en condiciones de comenzar el análisis exploratorio de datos. En el primer grafico se observa la facturación por cliente.

Luego se representa la duración de llamadas por cliente.

En la siguiente visualización, vemos la distribución en un diagrama de caja de la facturación por cliente, dividido por el factor Target Churn Indicator, previa depuraciôn de los valores faltantes de esta ultima variable.

En el grafico anterior se observan algunos outliers que contaminan la visualización, por lo tanto vamos a depurar los datos sin esos valores para tener una mejor percepción de la distribución de cada grupo.

Se puede observar que los clientes que fueron objetivo de la campaña de Churn tienen una facturacion mediana algo mayor que los que no participaron de la misma