data(Telco_Cusomer_Churn)
## Warning in data(Telco_Cusomer_Churn): data set 'Telco_Cusomer_Churn' not found
summary(Telco_Cusomer_Churn)
## customerID gender SeniorCitizen Partner
## Length:7043 Length:7043 Min. :0.0000 Length:7043
## Class :character Class :character 1st Qu.:0.0000 Class :character
## Mode :character Mode :character Median :0.0000 Mode :character
## Mean :0.1621
## 3rd Qu.:0.0000
## Max. :1.0000
##
## Dependents tenure PhoneService MultipleLines
## Length:7043 Min. : 0.00 Length:7043 Length:7043
## Class :character 1st Qu.: 9.00 Class :character Class :character
## Mode :character Median :29.00 Mode :character Mode :character
## Mean :32.37
## 3rd Qu.:55.00
## Max. :72.00
##
## InternetService OnlineSecurity OnlineBackup DeviceProtection
## Length:7043 Length:7043 Length:7043 Length:7043
## Class :character Class :character Class :character Class :character
## Mode :character Mode :character Mode :character Mode :character
##
##
##
##
## TechSupport StreamingTV StreamingMovies Contract
## Length:7043 Length:7043 Length:7043 Length:7043
## Class :character Class :character Class :character Class :character
## Mode :character Mode :character Mode :character Mode :character
##
##
##
##
## PaperlessBilling PaymentMethod MonthlyCharges TotalCharges
## Length:7043 Length:7043 Min. : 18.25 Min. : 18.8
## Class :character Class :character 1st Qu.: 35.50 1st Qu.: 401.4
## Mode :character Mode :character Median : 70.35 Median :1397.5
## Mean : 64.76 Mean :2283.3
## 3rd Qu.: 89.85 3rd Qu.:3794.7
## Max. :118.75 Max. :8684.8
## NA's :11
## Churn
## Length:7043
## Class :character
## Mode :character
##
##
##
##
En la tabla anterior se presentan estadísticas descriptivas para el conjunto de datos Telco_Cusomer_Churn, donde se pudo observar lo siguiente:
La permanencia de los clientes tiende a ser relativamente corta, ya que la mediana es de 29 meses y más de la mitad no alcanza a cumplir tres años en la compañía.
Los cargos mensuales se concentran alrededor de 70, pero existen planes mucho más costosos que elevan el promedio, lo que refleja una oferta diversa de servicios y la presencia de valores extremos.
Los cargos totales muestran una fuerte asimetría: la mayoría de clientes acumula montos bajos a moderados, mientras que unos pocos concentran valores muy altos; los registros con permanencia igual a cero explican los once casos faltantes en esta variable. ## Matriz correlación
library(corrplot)
num_vars <- Telco_Cusomer_Churn[, c("tenure", "MonthlyCharges", "TotalCharges")]
M <- cor(num_vars, use = "complete.obs")
corrplot(M, method = "color", type = "upper",
addCoef.col = "black", # añade los coeficientes
tl.col = "black", tl.srt = 45,
col = colorRampPalette(c("red", "white", "blue"))(200),
title = "Matriz de Correlación",
mar = c(0,0,2,0))
library(ggplot2)
p4 <- ggplot(Telco_Cusomer_Churn, aes(x = Churn, y = MonthlyCharges, fill = Churn)) +
geom_boxplot() +
labs(title = "Cargos Mensuales según Fuga de Clientes (Churn)",
x = "Fuga (Churn)",
y = "Cargos Mensuales") +
scale_fill_manual(values = c("No" = "aliceblue", "Yes" = "#f82020"))
p4
## Warning: Removed 11 rows containing non-finite outside the scale range
## (`stat_boxplot()`).
Presentan cargos totales mucho más altos en promedio que los clientes que sí se fueron. - Esto tiene sentido porque la mayoría de estos clientes permanecieron más tiempo en la empresa, lo que incrementa el acumulado de cargos.
La caja es más “alta” y extendida hacia valores grandes, lo que muestra clientes de larga permanencia.
Sus cargos totales son más bajos en comparación.
La mediana y la dispersión son significativamente menores, indicando que estos clientes no permanecieron tanto tiempo y, por lo tanto, acumularon menos pagos.
library(ggplot2)
p6 <- ggplot(Telco_Cusomer_Churn, aes(x = Churn, fill = gender)) +
geom_bar(position = "fill") +
labs(title = "Distribución de Género según Fuga de Clientes (Churn)",
x = "Fuga (Churn)",
y = "Proporción") +
scale_fill_manual(values = c("Female" = "orchid", "Male" = "#89aaec"))
p6
library(ggplot2)
p7 <- ggplot(Telco_Cusomer_Churn, aes(x = tenure, y = MonthlyCharges)) +
geom_point(alpha = 0.4, color = "steelblue") +
geom_smooth(method = "lm", se = TRUE, color = "red") +
labs(title = "Relación entre Antigüedad y Cargos Mensuales",
x = "Antigüedad (meses)",
y = "Cargos Mensuales")
p7
## `geom_smooth()` using formula = 'y ~ x'
cor(Telco_Cusomer_Churn$tenure, Telco_Cusomer_Churn$MonthlyCharges, use = "complete.obs")
## [1] 0.2478999
modelo <- lm(MonthlyCharges ~ tenure, data = Telco_Cusomer_Churn)
summary(modelo)
##
## Call:
## lm(formula = MonthlyCharges ~ tenure, data = Telco_Cusomer_Churn)
##
## Residuals:
## Min 1Q Median 3Q Max
## -57.498 -27.251 6.245 24.943 54.376
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 54.92978 0.57476 95.57 <2e-16 ***
## tenure 0.30372 0.01415 21.47 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 29.15 on 7041 degrees of freedom
## Multiple R-squared: 0.06145, Adjusted R-squared: 0.06132
## F-statistic: 461 on 1 and 7041 DF, p-value: < 2.2e-16
El análisis de la relación entre la antigüedad del cliente y los cargos mensuales muestra una pendiente positiva de aproximadamente 0.30, lo que significa que por cada mes adicional de permanencia, el valor de los cargos mensuales aumenta en promedio treinta centavos. Aunque existe una relación lineal positiva entre la antigüedad y los cargos mensuales, esta relación es débil. La mayor parte de las diferencias en los montos pagados por los clientes se debe a otros factores, principalmente los planes y servicios contratados, más que al tiempo que llevan en la compañía.
library(gridExtra)
grid.arrange(p4, p5, p6, p7, ncol = 2)
## Warning: Removed 11 rows containing non-finite outside the scale range
## (`stat_boxplot()`).
## `geom_smooth()` using formula = 'y ~ x'