Trabajo unidad 1

  1. Identifique la población en estudio. POBLACIÓN DE ESTUDIO: Clientes de CAC

  2. Indique los tipos de variables consideradas en el estudio. Empresa: Cualitativa nominal.
    Género: Cualitativa nominal. Edad: Cuantitativa discreta. Llamadas: Cuantitativa discreta. Tiempo 1: Cuantitativa discreta.
    Tiempo 2: Cuantitativa discreta. Monto: Cuantitativa continua. Espera: Cuantitativa discreta. Opinión: Cualitativa ordinal.

  3. Realice el análisis univariado de las variables cualitativas. (Interprete resultados)

3.1. Empresa

library(readxl)
caso_1 <- read_excel("Caso 1.xlsx")
View(caso_1)

Tabla de fecuencia

empresa=table(caso_1$Empresa)
empresa
## 
##      Oscuro      Pintel Teleafonica       TelVi 
##          30          20          40          30

Grafico de barras vertical

barplot(empresa, main = "Gráfico de barras", xlab = "Empresas", ylab ="Frecuencia")

Grafico de barras horizontal

barrasV=barplot(empresa, main = "Gráfico de barras", xlab = "Frecuencia", ylab ="Empresas", horiz = TRUE)

Grafico circular 3D

library(plotrix)
etiq=paste(names(empresa),"\n", empresa, sep = "")
etiq
## [1] "Oscuro\n30"      "Pintel\n20"      "Teleafonica\n40" "TelVi\n30"
pie3D(empresa,labels = etiq, main="diagrama circular 3D")

Interpretación de resultados: a. Absoluto

empresa
## 
##      Oscuro      Pintel Teleafonica       TelVi 
##          30          20          40          30
  1. Proporcion
propEmpresa=prop.table(empresa)
propEmpresa
## 
##      Oscuro      Pintel Teleafonica       TelVi 
##   0.2500000   0.1666667   0.3333333   0.2500000
  1. Porcentual
porcEmpresa=propEmpresa*100
porcEmpresa
## 
##      Oscuro      Pintel Teleafonica       TelVi 
##    25.00000    16.66667    33.33333    25.00000

Mayor porcentaje:Teleafonica 33.33% Menor porcentaje:Pintel 16.66%

3.2. Genero Tabla de fecuencia

genero=table(caso_1$Genero)
genero
## 
##  Femenino Masculino 
##        54        66

Grafico de barras vertical

barplot(genero, main = "Gráfico de barras", xlab = "Géneros", ylab ="Frecuencia")

Grafico de barras horizontal

barrasV=barplot(genero, main = "Gráfico de barras", xlab = "Frecuencia", ylab ="Géneros", horiz = TRUE)

Grafico circular 3D

etiq=paste(names(genero),"\n", genero, sep = "")
etiq
## [1] "Femenino\n54"  "Masculino\n66"
pie3D(genero,labels = etiq, main="diagrama circular 3D")

Interpretación de resultados: a. Absoluto

genero
## 
##  Femenino Masculino 
##        54        66
  1. Proporcion
propGenero=prop.table(genero)
propGenero
## 
##  Femenino Masculino 
##      0.45      0.55
  1. Porcentual
porcGenero=propGenero*100
porcGenero
## 
##  Femenino Masculino 
##        45        55

Mayor porcentaje:Masculino 55% Menor porcentaje:Femenino 45%

3.3. Opinión Tabla de fecuencia

opinion=table(caso_1$Opinion)
opinion
## 
##     Bueno Excelente Muy Bueno    Pésimo   Regular 
##        23        19        19        44        15

Grafico de barras vertical

barplot(opinion, main = "Gráfico de barras", xlab = "Opiniones", ylab ="Frecuencia")

Grafico de barras horizontal

barrasV=barplot(opinion, main = "Gráfico de barras", xlab = "Frecuencia", ylab ="Opiniones", horiz = TRUE)

Grafico circular 3D

etiq=paste(names(opinion),"\n", opinion, sep = "")
etiq
## [1] "Bueno\n23"     "Excelente\n19" "Muy Bueno\n19" "Pésimo\n44"   
## [5] "Regular\n15"
pie3D(opinion,labels = etiq, main="diagrama circular 3D")

Interpretación de resultados: a. Absoluto

opinion
## 
##     Bueno Excelente Muy Bueno    Pésimo   Regular 
##        23        19        19        44        15
  1. Proporcion
propOpinion=prop.table(opinion)
propOpinion
## 
##     Bueno Excelente Muy Bueno    Pésimo   Regular 
## 0.1916667 0.1583333 0.1583333 0.3666667 0.1250000
  1. Porcentual
porcOpinion=propOpinion*100
porcOpinion
## 
##     Bueno Excelente Muy Bueno    Pésimo   Regular 
##  19.16667  15.83333  15.83333  36.66667  12.50000

Mayor porcentaje:Pésimo 36.66% Menor porcentaje:Regular 12.50%

  1. Realice el análisis bivariado de las variables cualitativas. (Interprete resultados)

4.1. Empresa con Género Tabla de fecuencia

tabla1=table(caso_1$Empresa, caso_1$Genero)
tabla1
##              
##               Femenino Masculino
##   Oscuro            17        13
##   Pintel            15         5
##   Teleafonica       16        24
##   TelVi              6        24

Grafico de barras agrupadas

barplot(tabla1, main = "Gráfico de Barras agrupadas", beside = T, col = c("red","blue","white","green"), legend.text = c("Pintel", "Oscuro", "Teleafónica","TelVi"))

Interpretación de resultados: a. Absoluto

tabla1
##              
##               Femenino Masculino
##   Oscuro            17        13
##   Pintel            15         5
##   Teleafonica       16        24
##   TelVi              6        24
  1. Proporcion
prop=prop.table(tabla1)
prop
##              
##                 Femenino  Masculino
##   Oscuro      0.14166667 0.10833333
##   Pintel      0.12500000 0.04166667
##   Teleafonica 0.13333333 0.20000000
##   TelVi       0.05000000 0.20000000
  1. Porcentual
porc=prop*100
porc
##              
##                Femenino Masculino
##   Oscuro      14.166667 10.833333
##   Pintel      12.500000  4.166667
##   Teleafonica 13.333333 20.000000
##   TelVi        5.000000 20.000000

Mayor porcentaje género femenino:Empresa Oscuro 14.16% Mayor porcentaje género masculino:Empresa Teleafonica y TelVi 20%

4.2. Empresa con Opinión Tabla de fecuencia

tabla2=table(caso_1$Empresa, caso_1$Opinion)
tabla2
##              
##               Bueno Excelente Muy Bueno Pésimo Regular
##   Oscuro          4         5         7     11       3
##   Pintel          4         4         5      5       2
##   Teleafonica     7         6         3     17       7
##   TelVi           8         4         4     11       3

Grafico de barras agrupadas

barplot(tabla2, main = "Gráfico de Barras agrupadas", beside = T, col = c("red","blue","white","green"), legend.text = c("Pintel", "Oscuro", "Teleafónica","TelVi"))

Interpretación de resultados: a. Absoluto

tabla2
##              
##               Bueno Excelente Muy Bueno Pésimo Regular
##   Oscuro          4         5         7     11       3
##   Pintel          4         4         5      5       2
##   Teleafonica     7         6         3     17       7
##   TelVi           8         4         4     11       3
  1. Proporcion
prop2=prop.table(tabla2)
prop2
##              
##                    Bueno  Excelente  Muy Bueno     Pésimo    Regular
##   Oscuro      0.03333333 0.04166667 0.05833333 0.09166667 0.02500000
##   Pintel      0.03333333 0.03333333 0.04166667 0.04166667 0.01666667
##   Teleafonica 0.05833333 0.05000000 0.02500000 0.14166667 0.05833333
##   TelVi       0.06666667 0.03333333 0.03333333 0.09166667 0.02500000
  1. Porcentual
porc2=prop2*100
porc2
##              
##                   Bueno Excelente Muy Bueno    Pésimo   Regular
##   Oscuro       3.333333  4.166667  5.833333  9.166667  2.500000
##   Pintel       3.333333  3.333333  4.166667  4.166667  1.666667
##   Teleafonica  5.833333  5.000000  2.500000 14.166667  5.833333
##   TelVi        6.666667  3.333333  3.333333  9.166667  2.500000

Mayor porcentaje Empresa Oscuro: Opinión Pésimo 9.16% Mayor porcentaje Empresa Pintel: Opinión Muy bueno y Pésimo 4.16% Mayor porcentaje Empresa Teleafonica: Opinión Pésimo 14.16% Mayor porcentaje Empresa Telvi: Opinión Pésimo 9.16%

4.3. Opinión y Género Tabla de fecuencia

tabla3=table(caso_1$Opinion, caso_1$Genero)
tabla3
##            
##             Femenino Masculino
##   Bueno            9        14
##   Excelente        9        10
##   Muy Bueno        8        11
##   Pésimo          21        23
##   Regular          7         8

Grafico de barras agrupadas

barplot(tabla3, main = "Gráfico de Barras agrupadas", beside = T, col = c("red","blue","white","green"), legend.text = c("Pésima", "Regular", "Buena", "Muy Buena", "Excelente"))

Interpretación de resultados: a. Absoluto

tabla3
##            
##             Femenino Masculino
##   Bueno            9        14
##   Excelente        9        10
##   Muy Bueno        8        11
##   Pésimo          21        23
##   Regular          7         8
  1. Proporcion
prop3=prop.table(tabla3)
prop3
##            
##               Femenino  Masculino
##   Bueno     0.07500000 0.11666667
##   Excelente 0.07500000 0.08333333
##   Muy Bueno 0.06666667 0.09166667
##   Pésimo    0.17500000 0.19166667
##   Regular   0.05833333 0.06666667
  1. Porcentual
porc3=prop3*100
porc3
##            
##              Femenino Masculino
##   Bueno      7.500000 11.666667
##   Excelente  7.500000  8.333333
##   Muy Bueno  6.666667  9.166667
##   Pésimo    17.500000 19.166667
##   Regular    5.833333  6.666667

Mayor porcentaje Género Masculino: Opinión Pésimo 19.16% Mayor porcentaje Género Femenino: Opinión Pésimo 17.50%

  1. Calcule e interprete las medidas de tendencia central de las variables cuantitativas

5.1.Edad Media:

edad=caso_1$Edad
mean(edad)
## [1] 30.34167

Interpretación:La edad promedio de los clientes entrevistados es de 30 años.

Mediana:

median(edad)
## [1] 31

Interpretación:El 50 % de clientes entrevistados tienen menos de 31 años.

Moda:

library('modeest')
mfv(edad)
## [1] 28

Interpretación:La edad más común de clientes entrevistados es de 28 años.

5.2.Llamadas Media:

llamadas=caso_1$Llamadas
mean(llamadas)
## [1] 5.016667

Interpretación:Laa llamadas promedio de los clientes entrevistados por día es de 5 llamadas.

Mediana:

median(llamadas)
## [1] 5

Interpretación:El 50 % de clientes entrevistados tienen menos de 5 llamadas al día.

Moda:

library('modeest')
mfv(llamadas)
## [1] 4

Interpretación:La cántidad de llamadas por día más común de los clientes entrevistados es de 4 llamadas.

5.3. Tiempo 1 Media:

tiempo1<-caso_1$`Tiempo 1`
mean(tiempo1)
## [1] 38.23583

Interpretación: El tiempo (en minutos) promedio utilizados en enero por los clientes entrevistados es de 38.23583

Mediana:

median(tiempo1)
## [1] 37.85

Interpretación: El 50 % de clientes entrevistados que utilizaron menos de 37 minutos en el mes de enero.

Moda:

library("modeest")
mfv(tiempo1)
## [1] 30.1 31.4 36.3 37.6 37.8 43.6 47.5

Interpretación: La cantidad de minutos mas común en el mes de enero utilizado por los clientes entrevistados es de 30, 31, 36, 37, 37, 43 y 47 minutos.

5.4.Tiempo 2 Media:

tiempo2=caso_1$`Tiempo 2`
mean(tiempo2)
## [1] 37.48333

Interpretación:El tiempo promedio en minutos en el mes de febrero utilizados por los clientes entrevistados es de 37 minutos.

Mediana:

median(tiempo2)
## [1] 37.6

Interpretación:El 50 % de clientes entrevistados utilizaron menos de 37 minutos en el mes de febrero.

Moda:

library('modeest')
mfv(tiempo2)
## [1] 29.9 36.3 37.6 38.6 39.8 41.8

Interpretación:La cántidad de minutos utilizados en el mes de febrero más común es de 30, 36, 37, 38, 39 y 41 minutos.

5.5.Monto Media:

monto=caso_1$Monto
mean(monto)
## [1] 92.67833

Interpretación:El monto mensual promedio en soles pagados por los clientes entrevistados es de 92.67 soles.

Mediana:

median(monto)
## [1] 90.7

Interpretación:El 50 % de clientes entrevistados pagan menos de 90.7 soles al mes.

Moda:

library('modeest')
mfv(monto)
## [1] 83.8 88.3

Interpretación:El monto más común pagados al mes por los clientes entrevistados es de 83.8 y 88.3 soles.

5.6. Espera Media:

espera<-caso_1$Espera
mean(espera)
## [1] 6.148333

Interpretación El tiempo (en minutos) promedio de espera por los clientes es de 6 minutos.

Mediana:

median(espera) 
## [1] 3.65

Interpretación: El 50% de clientes entrevistados esperaron menos de 3 minutos para ser atendidos.

Moda:

mfv(espera)
## [1] 1.7 4.0

Intepretación: La cantidad de minutos mas común de espera de los clientes entrevistados es de 1 y 4 minutos.

  1. Calcule e interprete las medidas de variabilidad o disperción del Monto mensual y la Espera. 6.1. Espera Rango o amplitud:
range(caso_1$Espera)
## [1]  0.2 36.0

Interpretacion: El monto mensual de los clientes de CAC esta entre 0.2 y 36.0

Rango intercuartil:

IQR(caso_1$Espera)
## [1] 5.3

Interpretacion: La amplitud central del 50% de los datos de monto de los clientes, es de 5.3

Varianza:

var(caso_1$Espera)
## [1] 47.30218

Interpretacion: El valor cuadrado de la desviacion estandar de los datos del monto es de 47.30218

Desviacion estandar:

desv_espera = sd(caso_1$Espera)
desv_espera
## [1] 6.877658

Interpretacion: El monto de los clientes presenta una variacion con respecto a su media de 6.877658

Coeficiende de variacion:

mediana_espera = mean(caso_1$Espera)
cv_espera = (desv_espera/mediana_espera)*100
cv_espera
## [1] 111.8622

Interpretacion : Los datos son exageradamente heterogeneos

6.2. Monto. Rango o amplitud:

range(caso_1$Monto)
## [1]  74.1 119.1

Interpretacion: el monto de los clientes de CAC esta entre 74.1 y 119.1

Rango intercuartil:

IQR(caso_1$Monto)
## [1] 15.35

Interpretacion: la amplitud central del 50% de los datos de monto de los clientes, es de 15.35

Varianza:

var(caso_1$Monto)
## [1] 105.8303

Interpretacion: el valor cuadrado de la desviacion estandar de los datos del monto es de 105.8303

Desviacion estandar:

desv_monto = sd(caso_1$Monto)
desv_monto
## [1] 10.28738

Interpretacion: el monto de los clientes presenta una variacion con respecto a su media de 10.28738

Coeficiende de variacion:

mediana_monto = mean(caso_1$Monto)
cv_monto = (desv_monto/mediana_monto)*100
cv_monto
## [1] 11.1001

Interpretacion : Los datos son regularmente homogeneos,

  1. Calcula e interprete las medidas de forma de la Edad de cliente, Número de llamadas, Tiempo 1, Monto mensual y Tiempo de espera.
edadC<-caso_1$Edad
llamadasC<-caso_1$Llamadas
tiempo1<-caso_1$`Tiempo 1`
montoM<-caso_1$Monto
tiempoE<-caso_1$Espera
library(modeest)

7.1. Edad

library(modeest)
skewness(edadC)
## Warning: encountered a tie, and the difference between minimal and 
##                    maximal value is > length('x') * 'tie.limit'
## the distribution could be multimodal
## [1] -0.08923487
library('ggplot2')
plotE<-ggplot(caso_1,aes(x=Edad))+geom_density()
plotE

Interpretación:La edad de los clientes presentan una distribución asimétrica negativa

7.2. Llamadas

skewness(llamadasC)
## Warning: encountered a tie, and the difference between minimal and 
##                    maximal value is > length('x') * 'tie.limit'
## the distribution could be multimodal
## [1] 0.1954174
plotL<-ggplot(caso_1,aes(x=Llamadas))+geom_density()
plotL

Interpretación:El número de llamadas recibidas el día de la entrevista presentan una distribución asimétrica positiva

7.3. Tiempo 1

skewness(tiempo1)
## [1] 0.238718
plotT1<-ggplot(caso_1,aes(x=tiempo1))+geom_density()
plotT1

Interpretación:El tiempo utilizado en el mes de enero presentan una distribución asimétrica positiva

7.4. Monto Mesual

skewness(montoM)
## [1] 0.5045236
plotM<-ggplot(caso_1,aes(x=Monto))+geom_density()
plotM

Interpretación:El monto mensual presentan una distribución asimétrica positiva

7.5. Tiempo Espera

skewness(tiempoE)
## [1] 1.869105
plotTE<-ggplot(caso_1,aes(x=Espera))+geom_density()
plotTE

Interpretación:El tiempo de espera antes de ser atendido presentan una distribución asimétrica positiva

  1. Construya e interprete el diagrama de cajas (boxplot) para la Monto mensual y Tiempo de espera. 8.1. Monto mensual:
monto=caso_1$Monto
boxplot(monto,data = caso_1, main="Diagrama de cajas",xlab="Monto mensual",col=c(2,4,5), horizontal = TRUE)

Interpretación:

min(monto)
## [1] 74.1
max(monto)
## [1] 119.1
IQR(monto)
## [1] 15.35

. Medida de concentración: Presenta una forma mesocurtica. . La centralización es de 90.7 soles. . La longitud de la caja se encuentra entre 80 y 100 soles. . La mediana es menor que la media. . La variabilidad es de 15.35 soles. . El mínimo valor del monto es 74.1. . El máximo valor del monto es 119.1. . Los datos de la variable no son atípicos.

8.2. Tiempo de espera:

espera=caso_1$Espera
boxplot(espera,data = caso_1, main="Diagrama de cajas",xlab="Tiempo de espera",col=c(2,4,5), horizontal = TRUE)

Interpretación:

min(espera)
## [1] 0.2
max(espera)
## [1] 36
IQR(espera)
## [1] 5.3

. Medida de concentración: Leptocurtica . La centralización es de 3.7 minutos. . LA longitud de la caja se encuentra entre los 0 y 10 minutos. . La mediana es menor que la media. . La variabilidad es de 5.3 minutos. . El mínimo valor del tiempo de espera es 0.2 minutos. . El máximo valor del tiempo de espera es 36 minutos. . Los datos de la variable tiempo de Espera son atípicos (Se descarta la media y la moda).

  1. Construya e interpreta el histrograma para la Edad del cliente.
library(ggplot2)
edad<- caso_1$Edad
summary(edad)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   20.00   26.00   31.00   30.34   35.00   40.00
hist(edad)

Interpretación: . La edad de los clientes presenta una distribición platicúrtica. . Las edades de todos los clientes están 20 y 40 años. . La Mayor Cantidad de Clientes se encuentra entre las edades 25 y 30, y 30 y 35.

  1. Construya e interprete P25, P50; P80; P65 , de la espera. Cuartiles del tiempo espera para ser atendidos:
quantile(x=caso_1$Espera, probs = c(0.25,0.50,0.80,0.65))
##    25%    50%    80%    65% 
##  1.700  3.650 11.260  4.735

Interpretación: . El 25% de clientes entrevistados esperan aproximadamente 1.7 minutos para ser atendidos. . El 50% de clientes entrevistados esperan aproximadamente 3.65 minutos para ser atendidos. . El 80% de clientes entrevistados esperan aproximadamente 11.26 minutos para ser atendidos. . El 65% de clientes entrevistados esperan aproximadamente 4.735 minutos para ser atendidos.