Aplicar transformación de variables (vistas en clase) para las variables cuantitativas del caso que no se aplicó (aplicar para Reclamos, Llamadas, Edad, Minutos, Monto, Tiempo)
Comparar resultados y comentar que transformación es la que permite mejorar la simetría
Realizarlo en su cuenta de rpubs y enviar el enlace
# Conjunto de datos
telco = read.csv("https://raw.githubusercontent.com/VictorGuevaraP/Estadistica-R/master/Caso_telefon%C3%ADa.csv", sep = ";", encoding = "latin1", stringsAsFactors = T)
hist(sqrt(telco$Reclamos), main="Raíz Cuadrada - Reclamos")
hist(sqrt(telco$Llamadas), main="Raíz Cuadrada - Llamadas")
hist(sqrt(telco$Minutos), main="Raíz Cuadrada - Minutos")
hist(sqrt(telco$Monto), main="Raíz Cuadrada - Monto")
hist(sqrt(telco$Tiempo), main="Raíz Cuadrada - Tiempo")
hist(exp(telco$Reclamos), main="Exponencial - Reclamos")
hist(exp(telco$Llamadas), main="Exponencial - Llamadas")
hist(exp(telco$Minutos), main="Exponencial - Minutos")
hist(exp(telco$Monto), main="Exponencial - Monto")
hist(exp(telco$Tiempo), main="Exponencial - Tiempo")
hist(log(telco$Reclamos), main="Logarítmica - Reclamos")
hist(log(telco$Llamadas), main="Logarítmica - Llamadas")
hist(log(telco$Minutos), main="Logarítmica - Minutos")
hist(log(telco$Monto), main="Logarítmica - Monto")
hist(log(telco$Tiempo), main="Logarítmica - Tiempo")
gráfica general
library(PerformanceAnalytics)
chart.Correlation(cor(telco[,4:9]), histogram = TRUE)
#Obtener solo tranaformaciones
reclamos_sqrt <- sqrt(telco$Reclamos)
reclamos_exp <- exp(telco$Reclamos)
reclamos_ln <- log(telco$Reclamos)
reclamos_log2 <- log(telco$Reclamos, base=2)
reclamos_log5 <- log(telco$Reclamos, base=5)
Ver graficamente cada una:
par(mfrow=c(3,2))
hist(telco$Reclamos, main = "Original")
hist(reclamos_sqrt, main = "Raiz Cuadrada")
hist(reclamos_exp, main = "Exponencial")
hist(reclamos_ln, main = "Logarítmica")
hist(reclamos_log2, main = "Logarítmica - Base 2")
hist(reclamos_log5, main = "Logarítmica - Base 5")
par(mfrow=c(1,1))
Gráfica de densidad
par(mfrow=c(3,2))
plot(density(telco$Reclamos), main = "Distribución de reclamos originales")
plot(density(reclamos_sqrt), main = "Distribución de reclamos transformadas - sqrt")
plot(density(reclamos_exp), main = "Distribución de reclamos transformadas - exp")
plot(density(reclamos_ln), main = "Distribución de reclamos transformadas - ln")
plot(density(reclamos_log2), main = "Distribución de reclamos transformadas - log2")
plot(density(reclamos_log5), main = "Distribución de reclamos transformadas - log5")
par(mfrow=c(1,1))
Comentario: La transformación logarítmica, es la que mejor nos permite mejorar la simetria
#Obtener solo tranaformaciones
llamadas_sqrt <- sqrt(telco$Llamadas)
llamadas_exp <- exp(telco$Llamadas)
llamadas_ln <- log(telco$Llamadas)
llamadas_log2 <- log(telco$Llamadas, base=2)
llamadas_log5 <- log(telco$Llamadas, base=5)
Ver graficamente cada una:
par(mfrow=c(3,2))
hist(telco$Llamadas, main = "Original")
hist(llamadas_sqrt, main = "Raiz Cuadrada")
hist(llamadas_exp, main = "Exponencial")
hist(llamadas_ln, main = "Logarítmica")
hist(llamadas_log2, main = "Logarítmica - Base 2")
hist(llamadas_log5, main = "Logarítmica - Base 5")
par(mfrow=c(1,1))
Gráfica de densidad
par(mfrow=c(3,2))
plot(density(telco$Llamadas), main = "Distribución de llamadas originales")
plot(density(llamadas_sqrt), main = "Distribución de llamadas transformadas - sqrt")
plot(density(llamadas_exp), main = "Distribución de llamadas transformadas - exp")
plot(density(llamadas_ln), main = "Distribución de llamadas transformadas - ln")
plot(density(llamadas_log2), main = "Distribución de llamadas transformadas - log2")
plot(density(llamadas_log5), main = "Distribución de llamadas transformadas - log5")
par(mfrow=c(1,1))
Comentario: La transformación logarítmica, es la que mejor nos permite mejorar la simetria
#Obtener solo tranaformaciones
minutos_sqrt <- sqrt(telco$Minutos)
minutos_exp <- exp(telco$Minutos)
minutos_ln <- log(telco$Minutos)
minutos_log2 <- log(telco$Minutos, base=2)
minutos_log5 <- log(telco$Minutos, base=5)
Ver graficamente cada una:
par(mfrow=c(3,2))
hist(telco$Minutos, main = "Original")
hist(minutos_sqrt, main = "Raiz Cuadrada")
hist(minutos_exp, main = "Exponencial")
hist(minutos_ln, main = "Logarítmica")
hist(minutos_log2, main = "Logarítmica - Base 2")
hist(minutos_log5, main = "Logarítmica - Base 5")
par(mfrow=c(1,1))
Gráfica de densidad
par(mfrow=c(3,2))
plot(density(telco$Minutos), main = "Distribución de minutos originales")
plot(density(minutos_sqrt), main = "Distribución de minutos transformadas - sqrt")
plot(density(minutos_exp), main = "Distribución de minutos transformadas - exp")
plot(density(minutos_ln), main = "Distribución de minutos transformadas - ln")
plot(density(minutos_log2), main = "Distribución de minutos transformadas - log2")
plot(density(minutos_log5), main = "Distribución de minutos transformadas - log5")
par(mfrow=c(1,1))
Comentario: La transformación de Raiz Cuadrada, es la que mejor nos permite mejorar la simetria
#Obtener solo tranaformaciones
monto_sqrt <- sqrt(telco$Monto)
monto_exp <- exp(telco$Monto)
monto_ln <- log(telco$Monto)
monto_log2 <- log(telco$Monto, base=2)
monto_log5 <- log(telco$Monto, base=5)
Ver graficamente cada una:
par(mfrow=c(3,2))
hist(telco$Monto, main = "Original")
hist(monto_sqrt, main = "Raiz Cuadrada")
hist(monto_exp, main = "Exponencial")
hist(monto_ln, main = "Logarítmica")
hist(monto_log2, main = "Logarítmica - Base 2")
hist(monto_log5, main = "Logarítmica - Base 5")
par(mfrow=c(1,1))
Gráfica de densidad
par(mfrow=c(3,2))
plot(density(telco$Monto), main = "Distribución de monto originales")
plot(density(monto_sqrt), main = "Distribución de monto transformadas - sqrt")
plot(density(monto_exp), main = "Distribución de monto transformadas - exp")
plot(density(monto_ln), main = "Distribución de monto transformadas - ln")
plot(density(monto_log2), main = "Distribución de monto transformadas - log2")
plot(density(monto_log5), main = "Distribución de monto transformadas - log5")
par(mfrow=c(1,1))
Comentario: La transformación logarítmica base 2 y raiz cuadrada, son las que mejor nos permite mejorarar la simetria
#Obtener solo tranaformaciones
tiempo_sqrt <- sqrt(telco$Tiempo)
tiempo_exp <- exp(telco$Tiempo)
tiempo_ln <- log(telco$Tiempo)
tiempo_log2 <- log(telco$Tiempo, base=2)
tiempo_log5 <- log(telco$Tiempo, base=5)
Ver graficamente cada una:
par(mfrow=c(3,2))
hist(telco$Tiempo, main = "Original")
hist(tiempo_sqrt, main = "Raiz Cuadrada")
hist(tiempo_exp, main = "Exponencial")
hist(tiempo_ln, main = "Logarítmica")
hist(tiempo_log2, main = "Logarítmica - Base 2")
hist(tiempo_log5, main = "Logarítmica - Base 5")
par(mfrow=c(1,1))
Gráfica de densidad
par(mfrow=c(3,2))
plot(density(telco$Tiempo), main = "Distribución de tiempo originales")
plot(density(tiempo_sqrt), main = "Distribución de tiempo transformadas - sqrt")
plot(density(tiempo_exp), main = "Distribución de tiempo transformadas - exp")
plot(density(tiempo_ln), main = "Distribución de tiempo transformadas - ln")
plot(density(tiempo_log2), main = "Distribución de tiempo transformadas - log2")
plot(density(tiempo_log5), main = "Distribución de tiempo transformadas - log5")
par(mfrow=c(1,1))
Comentario: La transformación logarítmica, es la que mejor nos permite mejorar la simetria