Actividad 06: describir los facotres controlable y no controlables, unidades experimentales, materia prima que infuyen en el proceso del experimento Asi, descrbir tambien la variable o variables de respuesta. Todo esto deve ser identificado en el tema de estudio del area actuante. en pdf Actividad 07: propornga los ttratamientos el tema en interes del experimento.
2 Experimento
Se realizó un estudio para investigar el efecto de las ofertas sobre los meses de permanencia de clientes. Se cree que el crecimiento se ve afectado por el tipo de oferta con que inicia el contrato de servicio del cliente. Se quiere medir el grado de fidelidad de las promociones.
Se tomó todo los clientes (7043) hasta el culmino del Q3-2023, el cual se les fue ofreciendo diferentes promociones. Se observó que el 55% de clientes rechazó la oferta. Aún así se ha monitoreado a cada cliente escogido aleatoriamente y tenemos el tiempo (en meses) en permanencia con el servicio.
Ya practicado el experimento a 100 clientes diferentes por cada nivel.
Unidad Experimental: Conjunto de clientes hasta el Q3-2023
Factores Controlables: Caracteristicas de la oferta (ancho de banda, velocidad up y down, latencia, tipo conexión), disponibilidad de soporte
Factores No Controlables: Arquitectura de las casas, mudanzas.
Variable de Respuesta: Grado de fidelidad del cliente.
Tratamiento: Las ofertas.
3 Almacenamiento de Datos
Almacenamos los datos en dos variables:
variable característica, la llamaremos 𝑋,
variable factor, la llamaremos F.
Elegimos 100 individuos diferentes aleatoriamente de cada nivel y hacemos la operación de horizontalizar.
Adjuntando el paquete: 'dplyr'
The following objects are masked from 'package:stats':
filter, lag
The following objects are masked from 'package:base':
intersect, setdiff, setequal, union
Ésta será la tabla sobre la que trabajaremos para realizar el contraste ANOVA.
Observamos gráficamente que los meses de permanencia de las muestras correspondientes a los 5 niveles de oferta parecen diferentes. Se deberia quitar la muestra de los clientes que no tienen oferta?
En el gráfico siguiente, dibujamos los 100 meses de permanancia correspondientes a los 100 clientes separándolos en 5 grupos correspondientes a los niveles de oferta.
También aparecen las medias de cada grupo, NOTA: media global es 32.37114.
Este gráfico corrobora lo que hemos dicho anteriormente: parecen que hay diferencias entre las medias de los porcentajes de aumentos de masa celular entre los 5 grupos.
Df Sum Sq Mean Sq F value Pr(>F)
F 1 294500 294500 9896 <2e-16 ***
Residuals 498 14820 30
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Primero con el sgte gráfico podemos identificar de forma preliminar si existen asimetrías, datos atípicos o diferencia de varianzas. En este caso, los 5 grupos parecen no seguir una distribución simétrica.
El tamaño de las cajas es casi similar para todos los niveles por lo que no hay indicios de falta de homocedasticidad.
5 Condiciones para un ANOVA (obs)
Independencia: Las observaciones de cada nivel se han elegido de manera aleatoria
Distribución normal de las observaciones: La variable cuantitativa debe de distribuirse de forma normal en cada uno de los grupos.
Dado que los grupos tienen mas de 50 eventos se emplea el test de Kolmogorov-Smirnov con la corrección de Lilliefors. Si fuesen menos de 50 eventos por grupo se emplearía el test Shapiro-Wilk.
datos$cEncod: 1
Lilliefors (Kolmogorov-Smirnov) normality test
data: x$Tenure_Months
D = 0.1866, p-value = 3.617e-09
------------------------------------------------------------
datos$cEncod: 2
Lilliefors (Kolmogorov-Smirnov) normality test
data: x$Tenure_Months
D = 0.12797, p-value = 0.0003619
------------------------------------------------------------
datos$cEncod: 3
Lilliefors (Kolmogorov-Smirnov) normality test
data: x$Tenure_Months
D = 0.16463, p-value = 4.839e-07
------------------------------------------------------------
datos$cEncod: 4
Lilliefors (Kolmogorov-Smirnov) normality test
data: x$Tenure_Months
D = 0.12178, p-value = 0.0009131
------------------------------------------------------------
datos$cEncod: 5
Lilliefors (Kolmogorov-Smirnov) normality test
data: x$Tenure_Months
D = 0.20504, p-value = 3.481e-11
Los valores de p indican que no siguen normalidad.
Observamos que esta ultima condicion no se cumplen, por lo que no tiene mucho sentido seguir adelante.
6 Condiciones para un ANOVA (res)
plot(modelo)
La representación gráfica de los residuos no muestra falta de homocedasticidad (gráfico 1) y en el qqplot los residuos se distribuyen muy cercanos a la linea de la normal (gráfico 2).
##### Independencia dos residuos o errores #####res =residuals(modelo)plot(res,pch=19,ylab ="Residuos", col="blue") #grafico para ver independencia dos erros, não tem alguma tendenciaabline(h=0,col="red")
plot(density(res),main="Gráfico de densidad de residuos",ylab="Densidad",xlab="Residuos")
7 Comparaciones múltiples
7.1 Contraste de Holm
No es indicado si se realizan más de 6 comparaciones.
pairwise.t.test(x = datos$Tenure_Months, g = datos$cEncod, p.adjust.method ="holm",pool.sd =TRUE, paired =FALSE, alternative ="two.sided")
Pairwise comparisons using t tests with pooled SD
data: datos$Tenure_Months and datos$cEncod
1 2 3 4
2 <2e-16 - - -
3 <2e-16 <2e-16 - -
4 <2e-16 <2e-16 <2e-16 -
5 <2e-16 <2e-16 <2e-16 <2e-16
P value adjustment method: holm
Comprobamos que el p-valor es muy pequeño. Concluimos, por tanto, que tenemos evidencias suficientes para concluir que las medias de permanencia de los clientes no son iguales para los diferentes niveles de oferta.
Y, consecuentemente, la oferta puede influir en la permanencia.
Observación: concluimos que no todas las medias son iguales, en este experiemento todas las medias son diferentes.