El siguiente proyecto tiene como objetivo analizar las ventas de la compañía Adidas en los Estados Unidos, especialmente en el estado de California. Para llevar a cabo este análisis se toma una amplia base de datos en donde se encuentran registradas las ventas de Adidas en los estados unidos. Esta base de datos tiene diferentes tipos de variables cuantitativas y cualitativas a partir de las cuales el grupo de trabajo desarrollara un análisis descriptivo y estimara un modelo de regresión múltiple.
Adidas
La base de datos anteriormente planteada brinda múltiples variables cuantitativas y cualitativas, las cuales se aprecian en la siguiente tabla:
Por otro lado, la base de datos en el estado de California tiene registradas tres tiendas o retailers, las cuales son: Food Locker, West Gear y Kohl’s. Food Locker es una multinacional estadounidense cuya sede principal se encuentra en Nueva York, esta empresa opera en mas de 20 paises y tiene alrededor de 3.900 franquicias. Kohl’s es una tienda departamental estadounidense que se encarga de vender productos como ropa y zapatos, aunque tiene mayor variedad de productos, ya que vende artículos para el hogar, muebles, entre otros. West Gear es una tienda que se encarga de vender ropa y zapatos principalmente en estadosunidos.
Este proyecto se realizará mediante el análisis de estadísticas descriptivas de las variables suministradas en la base de datos “Adidas”. Posteriormente se empleará un modelo estadístico denominado regresión lineal múltiple, el cual permite analizar la relación entre una variable dependiente (en este caso Operating Margin) y multiples variables independientes, permitiendo realizar predicciones. La regresión lineal múltiple tiene la siguiente formula:
\[ y = \beta_0 + \beta_1 x_1 + \beta_2 x_2 + \dots + \beta_n x_n + \varepsilon \] En esta formula se encuentran diferentes partes/aspectos importantes de identificar y comprender. En la función se encuentran los predictores, los cuales son las variables independientes que permiten realizar predicciones. Además, entre estos aspectos están los betas (\(\beta_0\) y \(B_i\)). \(\beta_0\) es la ordenada de origen o el valor de la variable dependiente \(Y\) cuando todos los predictores son cero. \(\beta_i\) se refiere al efecto promedio que tiene el incremento de una unidad de la variable predictora (variables independientes) sobre la variable dependiente \(Y\).
En este apartado presentaremos las diferentes graficas y tablas referentes al análisis descriptivo de la información suministrada en la base de datos de Adidas en el estado de California.
La base de datos Adidas presenta diferentes cifras referentes a las ventas totales de cada uno de los productos en el estado de California, por ello requerimos realizar un grafico de barras que nos muestre las ventas de cada producto.
Esta gráfica de ventas totales permite determinar que el producto más vendido en el estado de california es el calzado de calle de hombres, mientras que el producto menos vendido es la ropa de hombre. Además, se observa que las ventas de los diferentes tipos de calzado son mayores siempre y cuando se trate de zapatos para hombres mientras que las mujeres tienden a comprar más ropa, por ende, las ventas en productos de mujeres son más altas en la categoría de ropa mientras que en productos masculinos predomina la categoría de calzado.
Las ventas en el estado de California están distribuidas entre tres “retailers”, los cuales son Food Locker, West Gear y Kohl’s. La siguiente grafica muestra las ventas de cada producto en cada uno de los diferentes locales:
A partir de la gráfica se observa que West Gear es el retailer que vende más unidades de cada producto en comparación a las otras tiendas, así mismo, Foot Locker es la tienda que vende menor cantidad de cada uno de los productos,ademas se observa que no tiene ventas de ropa para hombre y para mujer. Por otro lado, el producto calzado de calle para hombre (Men’s Street Footwear) es el mas vendido en cada una de las tres tiendas.
Dentro del estado de California la base de datos tiene dos ciudades: San Francisco y Los Ángeles, por ende, en cada ciudad se presentan diferentes cifras de ventas para cada producto. En la siguiente gráfica se presentan las cifras de ventas que tienen las diferentes tiendas con respecto a cada producto dentro de la ciudad de San Francisco.
Esta gráfica ilustra el total de ventas por cada categoría de producto dentro de la ciudad de San Francisco. A partir de la grafica se observa que solo dos tiendas venden en la ciudad de San Francisco: Kohl’s y West Gear. Por otro lado, el líder de ventas en esta ciudad es West Gear, ya que, tiene mayor cantidad de ventas por categoría de productos.
Por otro lado, la siguiente gráfica ilustra las ventas en la ciudad de Los Ángeles. Estas ventas están separadas por categoría de producto y por tipo de retailer o tienda.
Con base en esta gráfica, se logra determinar que West Gear no vende ningún producto en Los Ángeles, lo cual resulta ser interesante debido a que West Gear es la tienda que lidera las cifras de ventas totales en el estado de California. Además, la tienda líder de ventas en esta ciudad es Kohl’s ya que tiene mayor cantidad de ventas en cada uno de los productos en comparación con Foot Locker. Por otra parte, Kohl’s tiene ventas en la categoría de ropa (Men’s Apparel y Women’s Apparel) solo en la ciudad de Los Ángeles puesto que, en San Francisco registra ventas en las demás categorías de productos, pero no en la categoría de ropa.
Por otro lado, se logra apreciar nuevamente que Food Locker no vende ningún producto perteneciente a la categoría de ropa (Men’s Apparel y Women’s Apparel).
Un margen operativo más alto, como lo es Foot Locker, sugiere que esta tienda está logrando generar mayores beneficios a partir de sus ventas, lo que podría deberse a un mejor control de los costos o a una estrategia de precios más eficaz en el estado de California. Por el contrario, las tiendas Kohl´s y Wes Gear, tiene un margen operativo menor, esto podría señalar que sus costos son más elevados o que están aplicando descuentos o estrategias que reducen su margen de beneficios. Esto podría ser una señal de que esas tiendas deben analizar sus operaciones para mejorar la rentabilidad. En resumen, estas variaciones en los márgenes pueden tener un impacto estratégico: las tiendas con márgenes más bajos podrían necesitar ajustar sus costos o estrategias, mientras que las que tienen márgenes más altos tienen una mayor flexibilidad para invertir en expansión o mejoras.
Con el fin de analizar el porcentaje de ventas totales por cada tipo
de producto en el estado de California, se realizó el siguiente diagrama
circular:
La ropa de mujer se destaca en el segmento de ventas, con un 19.56% de las ventas totales, lo que refleja una alta demanda en esta categoría.
Las diferencias entre las distintas categorías son bastante pequeñas. Por ejemplo, la ropa atlética de hombre alcanza un 18.15% y el calzado de hombre un 18.05%, lo que indica una competencia cercana entre estas dos categorías.
Por otro lado, la ropa de hombre tiene un 14.73% y la ropa atlética de mujer un 13.66%, mostrando una participación más baja, pero que sigue siendo significativa en el mercado.
El mercado de ropa y calzado en California muestra una gran diversidad, ya que ninguna categoría destaca de manera significativa sobre las demás, lo que refleja las variadas preferencias de los consumidores. A pesar de que la ropa de mujer lidera las ventas, hay oportunidades para que categorías como la ropa atlética de mujer aumenten su participación mediante estrategias de marketing efectivas. La cercanía en los porcentajes sugiere una competencia activa, lo que impulsa a las empresas a diferenciarse a través de la calidad y la innovación. Además, sería útil realizar un seguimiento de las tendencias para observar cambios en las preferencias del mercado.
En este apartado se muestra los diagramas de dispersion tomando la variable dependiente como operating margin y como variable independientes:Beneficio Operativo, Unidades Vendidas, Precio por Unidad, Ventas Totales, Método de Venta
En el siguiente apartado se observa la forma en que el grupo de trabajo decidió estimar el modelo de regresión lineal, tomando como variable dependiente el margen operativo y como variables independientes el beneficio operativo, las unidades vendidas, el precio por unidad, las ventas totales y el método de venta, con el fin de observar los efectos que dichas variables tienen sobre el margen operativo. Cabe mencionar que se define como:
“El margen operativo indica la relación entre tus ingresos operativos y tus ventas netas. También se le llama de otras maneras. En ocasiones se denomina margen de ingresos operativos, margen de beneficio operativo, retorno de las ventas o margen del EBIT (ganancias antes de intereses e impuestos).”
Tomado de: Chase for Business
Para estimar el modelo de regresión lineal primero observaremos las correlaciones del Margen operativo con Beneficio Operativo, Unidades Vendidas, Precio por Unidad, Ventas Totales, Método de Venta. Esto para ver qué tanta relación existe entre estas variables. Estas correlaciones se observan en el siguiente mapa de calor de correlaciones:
Luego de observar estos valores, notamos que entre el margen operativo y el beneficio operativo existe una correlación muy débil; esto se reafirmará en los resultados del modelo. Por el momento, este modelo se planteará de tal manera que se evalúe cómo varía el margen operativo en función de la suma de las variables independientes iniciales.
De este resumen proporcionado por R, el grupo de trabajo se dio cuenta de que todos los betas tienen un alto nivel de significancia, excepto el beta que le corresponde a las ventas totales.
Después de esto se realiza el test de multicolinealidad obteniendo los siguientes resultados:
Operating Profit :5.207927
Units Sold: 19.117147
Price per Unit :2.188040
Total Sales :24.065459
Sales Method: 1.875838
Como en Unidades Vendidas y en Ventas Totales se obtuvieron valores superiores a 5, el grupo de trabajo decidió eliminar dichas variables del modelo y añadir una variable categórica, la cual es Producto. Luego de este cambio, se obtuvieron los siguientes resultados:
Como se ve en la tabla anterior, el nivel de significancia en todas las variables es alto, excepto en el Beneficio Operativo. Además, el modelo tiene un R² (0.9085) y un R² ajustado (0.9068); estos dos valores indican que se está explicando la mayor parte de la variabilidad de los datos.
Después se realiza el supuesto multicolinealidad obteniendo los siguientes resultados:
Para ver si nuestros datos cumplen este supuesto se hará uso de la prueba estadística Shapiro-Wilk test la cual dice lo siguiente: -Hipótesis nula (H0): Los datos siguen una distribución normal. -Hipótesis alternativa (H1): Los datos no siguen una distribución normal. -p-valor > 0.05: No se rechaza la hipótesis nula. -p-valor < 0.05: Se rechaza la hipótesis nula. Una vez que se tiene claro el concepto anterior, el grupo obtuvo como resultado los siguientes valores:
Observemos que el p-valor < 0.05, por lo cual se rechaza la hipótesis nula y se dice que los datos no siguen una distribución normal.
Aunque W sea cercano a 1, esto no es suficiente debido a que el valor de p es extremadamente bajo.
El grupo de trabajo utilizó las hipótesis del Studentized Breusch-Pagan test para determinar la ausencia o existencia de la homocedasticidad en nuestro modelo. Estas hipótesis dicen lo siguiente:
Luego de aplicar el test de Breusch-Pagan, se obtuvo un p-valor = 0.01424, por lo cual se rechaza la hipótesis nula y los residuos son heterocedásticos, lo que indica que no se puede inferir nada respecto a la población (ventas de Adidas en EE.UU.) a partir de este modelo.