Identifique la población en estudio. POBLACIÓN DE ESTUDIO: Clientes de CAC
Indique los tipos de variables consideradas en el estudio. Empresa: Cualitativa nominal.
Género: Cualitativa nominal. Edad: Cuantitativa discreta. Llamadas: Cuantitativa discreta. Tiempo 1: Cuantitativa discreta.
Tiempo 2: Cuantitativa discreta. Monto: Cuantitativa continua. Espera: Cuantitativa discreta. Opinión: Cualitativa ordinal.
Realice el análisis univariado de las variables cualitativas. (Interprete resultados)
3.1. Empresa
library(readxl)
caso_1 <- read_excel("Caso 1.xlsx")
View(caso_1)
Tabla de fecuencia
empresa=table(caso_1$Empresa)
empresa
##
## Oscuro Pintel Teleafonica TelVi
## 30 20 40 30
Grafico de barras vertical
barplot(empresa, main = "Gráfico de barras", xlab = "Empresas", ylab ="Frecuencia")
Grafico de barras horizontal
barrasV=barplot(empresa, main = "Gráfico de barras", xlab = "Frecuencia", ylab ="Empresas", horiz = TRUE)
Grafico circular 3D
library(plotrix)
etiq=paste(names(empresa),"\n", empresa, sep = "")
etiq
## [1] "Oscuro\n30" "Pintel\n20" "Teleafonica\n40" "TelVi\n30"
pie3D(empresa,labels = etiq, main="diagrama circular 3D")
Interpretación de resultados: a. Absoluto
empresa
##
## Oscuro Pintel Teleafonica TelVi
## 30 20 40 30
propEmpresa=prop.table(empresa)
propEmpresa
##
## Oscuro Pintel Teleafonica TelVi
## 0.2500000 0.1666667 0.3333333 0.2500000
porcEmpresa=propEmpresa*100
porcEmpresa
##
## Oscuro Pintel Teleafonica TelVi
## 25.00000 16.66667 33.33333 25.00000
Mayor porcentaje:Teleafonica 33.33% Menor porcentaje:Pintel 16.66%
3.2. Genero Tabla de fecuencia
genero=table(caso_1$Genero)
genero
##
## Femenino Masculino
## 54 66
Grafico de barras vertical
barplot(genero, main = "Gráfico de barras", xlab = "Géneros", ylab ="Frecuencia")
Grafico de barras horizontal
barrasV=barplot(genero, main = "Gráfico de barras", xlab = "Frecuencia", ylab ="Géneros", horiz = TRUE)
Grafico circular 3D
etiq=paste(names(genero),"\n", genero, sep = "")
etiq
## [1] "Femenino\n54" "Masculino\n66"
pie3D(genero,labels = etiq, main="diagrama circular 3D")
Interpretación de resultados: a. Absoluto
genero
##
## Femenino Masculino
## 54 66
propGenero=prop.table(genero)
propGenero
##
## Femenino Masculino
## 0.45 0.55
porcGenero=propGenero*100
porcGenero
##
## Femenino Masculino
## 45 55
Mayor porcentaje:Masculino 55% Menor porcentaje:Femenino 45%
3.3. Opinión Tabla de fecuencia
opinion=table(caso_1$Opinion)
opinion
##
## Bueno Excelente Muy Bueno Pésimo Regular
## 23 19 19 44 15
Grafico de barras vertical
barplot(opinion, main = "Gráfico de barras", xlab = "Opiniones", ylab ="Frecuencia")
Grafico de barras horizontal
barrasV=barplot(opinion, main = "Gráfico de barras", xlab = "Frecuencia", ylab ="Opiniones", horiz = TRUE)
Grafico circular 3D
etiq=paste(names(opinion),"\n", opinion, sep = "")
etiq
## [1] "Bueno\n23" "Excelente\n19" "Muy Bueno\n19" "Pésimo\n44"
## [5] "Regular\n15"
pie3D(opinion,labels = etiq, main="diagrama circular 3D")
Interpretación de resultados: a. Absoluto
opinion
##
## Bueno Excelente Muy Bueno Pésimo Regular
## 23 19 19 44 15
propOpinion=prop.table(opinion)
propOpinion
##
## Bueno Excelente Muy Bueno Pésimo Regular
## 0.1916667 0.1583333 0.1583333 0.3666667 0.1250000
porcOpinion=propOpinion*100
porcOpinion
##
## Bueno Excelente Muy Bueno Pésimo Regular
## 19.16667 15.83333 15.83333 36.66667 12.50000
Mayor porcentaje:Pésimo 36.66% Menor porcentaje:Regular 12.50%
4.1. Empresa con Género Tabla de fecuencia
tabla1=table(caso_1$Empresa, caso_1$Genero)
tabla1
##
## Femenino Masculino
## Oscuro 17 13
## Pintel 15 5
## Teleafonica 16 24
## TelVi 6 24
Grafico de barras agrupadas
barplot(tabla1, main = "Gráfico de Barras agrupadas", beside = T, col = c("red","blue","white","green"), legend.text = c("Pintel", "Oscuro", "Teleafónica","TelVi"))
Interpretación de resultados: a. Absoluto
tabla1
##
## Femenino Masculino
## Oscuro 17 13
## Pintel 15 5
## Teleafonica 16 24
## TelVi 6 24
prop=prop.table(tabla1)
prop
##
## Femenino Masculino
## Oscuro 0.14166667 0.10833333
## Pintel 0.12500000 0.04166667
## Teleafonica 0.13333333 0.20000000
## TelVi 0.05000000 0.20000000
porc=prop*100
porc
##
## Femenino Masculino
## Oscuro 14.166667 10.833333
## Pintel 12.500000 4.166667
## Teleafonica 13.333333 20.000000
## TelVi 5.000000 20.000000
Mayor porcentaje género femenino:Empresa Oscuro 14.16% Mayor porcentaje género masculino:Empresa Teleafonica y TelVi 20%
4.2. Empresa con Opinión Tabla de fecuencia
tabla2=table(caso_1$Empresa, caso_1$Opinion)
tabla2
##
## Bueno Excelente Muy Bueno Pésimo Regular
## Oscuro 4 5 7 11 3
## Pintel 4 4 5 5 2
## Teleafonica 7 6 3 17 7
## TelVi 8 4 4 11 3
Grafico de barras agrupadas
barplot(tabla2, main = "Gráfico de Barras agrupadas", beside = T, col = c("red","blue","white","green"), legend.text = c("Pintel", "Oscuro", "Teleafónica","TelVi"))
Interpretación de resultados: a. Absoluto
tabla2
##
## Bueno Excelente Muy Bueno Pésimo Regular
## Oscuro 4 5 7 11 3
## Pintel 4 4 5 5 2
## Teleafonica 7 6 3 17 7
## TelVi 8 4 4 11 3
prop2=prop.table(tabla2)
prop2
##
## Bueno Excelente Muy Bueno Pésimo Regular
## Oscuro 0.03333333 0.04166667 0.05833333 0.09166667 0.02500000
## Pintel 0.03333333 0.03333333 0.04166667 0.04166667 0.01666667
## Teleafonica 0.05833333 0.05000000 0.02500000 0.14166667 0.05833333
## TelVi 0.06666667 0.03333333 0.03333333 0.09166667 0.02500000
porc2=prop2*100
porc2
##
## Bueno Excelente Muy Bueno Pésimo Regular
## Oscuro 3.333333 4.166667 5.833333 9.166667 2.500000
## Pintel 3.333333 3.333333 4.166667 4.166667 1.666667
## Teleafonica 5.833333 5.000000 2.500000 14.166667 5.833333
## TelVi 6.666667 3.333333 3.333333 9.166667 2.500000
Mayor porcentaje Empresa Oscuro: Opinión Pésimo 9.16% Mayor porcentaje Empresa Pintel: Opinión Muy bueno y Pésimo 4.16% Mayor porcentaje Empresa Teleafonica: Opinión Pésimo 14.16% Mayor porcentaje Empresa Telvi: Opinión Pésimo 9.16%
4.3. Opinión y Género Tabla de fecuencia
tabla3=table(caso_1$Opinion, caso_1$Genero)
tabla3
##
## Femenino Masculino
## Bueno 9 14
## Excelente 9 10
## Muy Bueno 8 11
## Pésimo 21 23
## Regular 7 8
Grafico de barras agrupadas
barplot(tabla3, main = "Gráfico de Barras agrupadas", beside = T, col = c("red","blue","white","green"), legend.text = c("Pésima", "Regular", "Buena", "Muy Buena", "Excelente"))
Interpretación de resultados: a. Absoluto
tabla3
##
## Femenino Masculino
## Bueno 9 14
## Excelente 9 10
## Muy Bueno 8 11
## Pésimo 21 23
## Regular 7 8
prop3=prop.table(tabla3)
prop3
##
## Femenino Masculino
## Bueno 0.07500000 0.11666667
## Excelente 0.07500000 0.08333333
## Muy Bueno 0.06666667 0.09166667
## Pésimo 0.17500000 0.19166667
## Regular 0.05833333 0.06666667
porc3=prop3*100
porc3
##
## Femenino Masculino
## Bueno 7.500000 11.666667
## Excelente 7.500000 8.333333
## Muy Bueno 6.666667 9.166667
## Pésimo 17.500000 19.166667
## Regular 5.833333 6.666667
Mayor porcentaje Género Masculino: Opinión Pésimo 19.16% Mayor porcentaje Género Femenino: Opinión Pésimo 17.50%
5.1.Edad Media:
edad=caso_1$Edad
mean(edad)
## [1] 30.34167
Interpretación:La edad promedio de los clientes entrevistados es de 30 años.
Mediana:
median(edad)
## [1] 31
Interpretación:El 50 % de clientes entrevistados tienen menos de 31 años.
Moda:
library('modeest')
mfv(edad)
## [1] 28
Interpretación:La edad más común de clientes entrevistados es de 28 años.
5.2.Llamadas Media:
llamadas=caso_1$Llamadas
mean(llamadas)
## [1] 5.016667
Interpretación:Laa llamadas promedio de los clientes entrevistados por día es de 5 llamadas.
Mediana:
median(llamadas)
## [1] 5
Interpretación:El 50 % de clientes entrevistados tienen menos de 5 llamadas al día.
Moda:
library('modeest')
mfv(llamadas)
## [1] 4
Interpretación:La cántidad de llamadas por día más común de los clientes entrevistados es de 4 llamadas.
5.3. Tiempo 1 Media:
tiempo1<-caso_1$`Tiempo 1`
mean(tiempo1)
## [1] 38.23583
Interpretación: El tiempo (en minutos) promedio utilizados en enero por los clientes entrevistados es de 38.23583
Mediana:
median(tiempo1)
## [1] 37.85
Interpretación: El 50 % de clientes entrevistados que utilizaron menos de 37 minutos en el mes de enero.
Moda:
library("modeest")
mfv(tiempo1)
## [1] 30.1 31.4 36.3 37.6 37.8 43.6 47.5
Interpretación: La cantidad de minutos mas común en el mes de enero utilizado por los clientes entrevistados es de 30, 31, 36, 37, 37, 43 y 47 minutos.
5.4.Tiempo 2 Media:
tiempo2=caso_1$`Tiempo 2`
mean(tiempo2)
## [1] 37.48333
Interpretación:El tiempo promedio en minutos en el mes de febrero utilizados por los clientes entrevistados es de 37 minutos.
Mediana:
median(tiempo2)
## [1] 37.6
Interpretación:El 50 % de clientes entrevistados utilizaron menos de 37 minutos en el mes de febrero.
Moda:
library('modeest')
mfv(tiempo2)
## [1] 29.9 36.3 37.6 38.6 39.8 41.8
Interpretación:La cántidad de minutos utilizados en el mes de febrero más común es de 30, 36, 37, 38, 39 y 41 minutos.
5.5.Monto Media:
monto=caso_1$Monto
mean(monto)
## [1] 92.67833
Interpretación:El monto mensual promedio en soles pagados por los clientes entrevistados es de 92.67 soles.
Mediana:
median(monto)
## [1] 90.7
Interpretación:El 50 % de clientes entrevistados pagan menos de 90.7 soles al mes.
Moda:
library('modeest')
mfv(monto)
## [1] 83.8 88.3
Interpretación:El monto más común pagados al mes por los clientes entrevistados es de 83.8 y 88.3 soles.
5.6. Espera Media:
espera<-caso_1$Espera
mean(espera)
## [1] 6.148333
Interpretación El tiempo (en minutos) promedio de espera por los clientes es de 6 minutos.
Mediana:
median(espera)
## [1] 3.65
Interpretación: El 50% de clientes entrevistados esperaron menos de 3 minutos para ser atendidos.
Moda:
mfv(espera)
## [1] 1.7 4.0
Intepretación: La cantidad de minutos mas común de espera de los clientes entrevistados es de 1 y 4 minutos.
range(caso_1$Espera)
## [1] 0.2 36.0
Interpretacion: El monto mensual de los clientes de CAC esta entre 0.2 y 36.0
Rango intercuartil:
IQR(caso_1$Espera)
## [1] 5.3
Interpretacion: La amplitud central del 50% de los datos de monto de los clientes, es de 5.3
Varianza:
var(caso_1$Espera)
## [1] 47.30218
Interpretacion: El valor cuadrado de la desviacion estandar de los datos del monto es de 47.30218
Desviacion estandar:
desv_espera = sd(caso_1$Espera)
desv_espera
## [1] 6.877658
Interpretacion: El monto de los clientes presenta una variacion con respecto a su media de 6.877658
Coeficiende de variacion:
mediana_espera = mean(caso_1$Espera)
cv_espera = (desv_espera/mediana_espera)*100
cv_espera
## [1] 111.8622
Interpretacion : Los datos son exageradamente heterogeneos
6.2. Monto. Rango o amplitud:
range(caso_1$Monto)
## [1] 74.1 119.1
Interpretacion: el monto de los clientes de CAC esta entre 74.1 y 119.1
Rango intercuartil:
IQR(caso_1$Monto)
## [1] 15.35
Interpretacion: la amplitud central del 50% de los datos de monto de los clientes, es de 15.35
Varianza:
var(caso_1$Monto)
## [1] 105.8303
Interpretacion: el valor cuadrado de la desviacion estandar de los datos del monto es de 105.8303
Desviacion estandar:
desv_monto = sd(caso_1$Monto)
desv_monto
## [1] 10.28738
Interpretacion: el monto de los clientes presenta una variacion con respecto a su media de 10.28738
Coeficiende de variacion:
mediana_monto = mean(caso_1$Monto)
cv_monto = (desv_monto/mediana_monto)*100
cv_monto
## [1] 11.1001
Interpretacion : Los datos son regularmente homogeneos,
edadC<-caso_1$Edad
llamadasC<-caso_1$Llamadas
tiempo1<-caso_1$`Tiempo 1`
montoM<-caso_1$Monto
tiempoE<-caso_1$Espera
library(modeest)
7.1. Edad
library(modeest)
skewness(edadC)
## Warning: encountered a tie, and the difference between minimal and
## maximal value is > length('x') * 'tie.limit'
## the distribution could be multimodal
## [1] -0.08923487
library('ggplot2')
plotE<-ggplot(caso_1,aes(x=Edad))+geom_density()
plotE
Interpretación:La edad de los clientes presentan una distribución asimétrica negativa
7.2. Llamadas
skewness(llamadasC)
## Warning: encountered a tie, and the difference between minimal and
## maximal value is > length('x') * 'tie.limit'
## the distribution could be multimodal
## [1] 0.1954174
plotL<-ggplot(caso_1,aes(x=Llamadas))+geom_density()
plotL
Interpretación:El número de llamadas recibidas el día de la entrevista presentan una distribución asimétrica positiva
7.3. Tiempo 1
skewness(tiempo1)
## [1] 0.238718
plotT1<-ggplot(caso_1,aes(x=tiempo1))+geom_density()
plotT1
Interpretación:El tiempo utilizado en el mes de enero presentan una distribución asimétrica positiva
7.4. Monto Mesual
skewness(montoM)
## [1] 0.5045236
plotM<-ggplot(caso_1,aes(x=Monto))+geom_density()
plotM
Interpretación:El monto mensual presentan una distribución asimétrica positiva
7.5. Tiempo Espera
skewness(tiempoE)
## [1] 1.869105
plotTE<-ggplot(caso_1,aes(x=Espera))+geom_density()
plotTE
Interpretación:El tiempo de espera antes de ser atendido presentan una distribución asimétrica positiva
monto=caso_1$Monto
boxplot(monto,data = caso_1, main="Diagrama de cajas",xlab="Monto mensual",col=c(2,4,5), horizontal = TRUE)
Interpretación:
min(monto)
## [1] 74.1
max(monto)
## [1] 119.1
IQR(monto)
## [1] 15.35
. Medida de concentración: Presenta una forma mesocurtica. . La centralización es de 90.7 soles. . La longitud de la caja se encuentra entre 80 y 100 soles. . La mediana es menor que la media. . La variabilidad es de 15.35 soles. . El mínimo valor del monto es 74.1. . El máximo valor del monto es 119.1. . Los datos de la variable no son atípicos.
8.2. Tiempo de espera:
espera=caso_1$Espera
boxplot(espera,data = caso_1, main="Diagrama de cajas",xlab="Tiempo de espera",col=c(2,4,5), horizontal = TRUE)
Interpretación:
min(espera)
## [1] 0.2
max(espera)
## [1] 36
IQR(espera)
## [1] 5.3
. Medida de concentración: Leptocurtica . La centralización es de 3.7 minutos. . LA longitud de la caja se encuentra entre los 0 y 10 minutos. . La mediana es menor que la media. . La variabilidad es de 5.3 minutos. . El mínimo valor del tiempo de espera es 0.2 minutos. . El máximo valor del tiempo de espera es 36 minutos. . Los datos de la variable tiempo de Espera son atípicos (Se descarta la media y la moda).
library(ggplot2)
edad<- caso_1$Edad
summary(edad)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 20.00 26.00 31.00 30.34 35.00 40.00
hist(edad)
Interpretación: . La edad de los clientes presenta una distribición platicúrtica. . Las edades de todos los clientes están 20 y 40 años. . La Mayor Cantidad de Clientes se encuentra entre las edades 25 y 30, y 30 y 35.
quantile(x=caso_1$Espera, probs = c(0.25,0.50,0.80,0.65))
## 25% 50% 80% 65%
## 1.700 3.650 11.260 4.735
Interpretación: . El 25% de clientes entrevistados esperan aproximadamente 1.7 minutos para ser atendidos. . El 50% de clientes entrevistados esperan aproximadamente 3.65 minutos para ser atendidos. . El 80% de clientes entrevistados esperan aproximadamente 11.26 minutos para ser atendidos. . El 65% de clientes entrevistados esperan aproximadamente 4.735 minutos para ser atendidos.