Introducción

Foot Locker es una empresa multinacional de origen estadounidense, especializada en la venta de calzado y ropa deportiva para hombre y mujer. Con sede principal en Nueva York, la compañía opera en más de 20 países y gestiona alrededor de 3,900 tiendas a nivel global. Se realizará un análisis de cada una de las variables independientes y categóricas tomadas del conjunto de datos, como por ejemplo, units sold, total sales, product, operating margin, entre otros. Posteriormente, se explorarán las relaciones entre estas variables, teniendo en cuenta los factores que afectan el margen operativo de la tienda. A lo largo del análisis, se presentarán gráficos que ilustran estas relaciones y ofrecerán una visualización detallada de las tendencias detectadas. Finalmente se aplicará un modelo de regresión múltiple que permitirá interpretar el impacto de cada una de las variables en los resultados financieros y con ayuda de esto se proponen estrategias que contribuyan a una mejor rentabilidad de Foot Locker en Illinois.

Metodología

A continuación se describe la implementación del análisis de regresión múltiple aplicado al estado de “Illinois”, para analizar las ventas y la rentabilidad de Foot locker, en conformidad con los lineamientos descritos en el caso 1, para así de la siguiente manera obtener resultados confiables y válidos:

  • Inicialmente, se filtran los datos del conjunto original para obtener únicamente las observaciones correspondientes al estado de Illinois. Esto se realizará mediante la función filter() en R utilizando las variables que representan la localización geográfica del estado.

  • Se llevará a cabo un análisis descriptivo de las variables cuantitativas y categóricas seleccionadas, como Price per unit, Units sold, Product and Sales method. Esto incluirá cálculos de medidas de tendencia central (media y mediana) y dispersión (desviación estándar) para las variables cuantitativas, así como tablas de frecuencia para las categóricas. Además, se crearán gráficos para visualizar la distribución de ventas, para esto se utilizará library(ggplot2).

  • Se ajustará un modelo de regresión múltiple utilizando el margen operativo como variable dependiente. Las variables predictoras incluirán the price per unit, the units sold, the type of product and the sales method.. La ecuación general del modelo es la siguiente: Yi= (β0​+β1​X1+β2X2​+…+βnXn​+ϵi) Donde:

    • β0: El intercepto, el valor de la variable dependiente (Y) cuando las variables predictoras son cero.
    • β1​: Efecto promedio que tiene el incremento en una unidad de la variable (Xi) sobre la variable dependiente (Y)
    • ϵ: El error o residuo, diferencia entre el valor observado y lo estimado

De acuerdo a lo anterior, la ecuación de nuestro modelo es la siguiente: Margen operativo= β0​+β1​(Price per Unit)+β2​(Units Sold)+β3​(Product)+β4​(Sales Method)+ϵ

  • Para validar el modelo, se evaluarán los siguientes supuestos: Normalidad de los residuos, Multicolinealidad y Homocedasticidad, se identificará además cada variable predictora en el margen operativo, en el cual se determinará qué factores tienen mayor influencia en los resultados financieros de Foot Locker en Illinois.

Descriptivas analíticas

En el presente análisis se estudiarán 144 datos, se consideraron las variables cuantitativas para evaluar la rentabilidad de las ventas en el estado de Illinois. Las variables analizadas incluyen el price per unit, units sold, total sales y operating margin.

A continuación, se presentan las principales características de estas variables en términos de medidas de tendencia central y la descripción de su comportamiento general.

Variables cuantitativas

Precio por unidad

La variable precio por unidad, hace referencia a la cantidad de dinero que un cliente está dispuesto a pagar por una unidad de un determinado producto.

En esta variable dada como “Price per Unit” se analizan los 144 datos mencionados anteriormente. Analizando la media de esta variable indica que el precio promedio por unidad en el estado de Illinois es de $47.74 aproximadamente. Esto da una referencia de el precio típico que un cliente estaría dispuesto a pagar por un producto

Estadísticas: Media:47.74306 - Moda:47.34722- Mediana:49 Percentiles: 0% 25% 50% 75% 100% 20.00 42.50 49.00 53.25 65.00

Percentil 25: $42.50, indicando que el 25% de los productos tienen un precio por unidad menor o igual a este valor.

Mediana (Percentil 50): $49.00, lo que significa que la mitad de los productos se vendieron por debajo de este precio.

Percentil 75: $53.25, lo que significa que el 25% de los productos más caros tienen un precio mayor a este valor.

Unidades vendidas

Esta variable hace referencia a la cantidad de unidades que se venden de una línea de producto. Esta está estrechamente relacionada con la variable “productos”, lo que permite investigar cómo las diferentes categorías de productos afectan las cifras de ventas y analizar cuántas veces se vende un mismo producto.

Estadísticas: Media : 176 unidades- Mediana:139.5 - Moda:82.79167

Valor max:725 unidades vendidas. Valor min:9 unidades

Ventas totales

Esta variable representa el total de ingresos generados en la tienda. En esta variable, se puede observar la dispersión de las ventas totales, lo que permite un análisis más detallado. Esta dispersión no solo refleja la capacidad de ventas, sino que también facilita la exploración de cómo las variables precio por unidad y unidades vendidas están relacionadas entre sí.

Al analizar la relación entre estas variables, podemos identificar patrones de comportamiento que indican cómo el ajuste en el precio por unidad puede influir en las unidades vendidas. Por ejemplo, un precio más bajo podría estar asociado con un aumento en las unidades vendidas, sugiriendo que los consumidores responden favorablemente a un producto ya sea, por descuentos o promociones.sin embargo también indica que tenga un mayor número de unidades vendidas no generar muchas veces el que tenga mayor número de ventas totales. Por otro lado, también se puede observar que ciertos productos, a pesar de tener un precio elevado, logran mantener altas cifras de venta, lo que podría reflejar su calidad, marca o exclusividad.

analizaremos su media y la dispersion de esta variable.

Estadísticas: Media:68038.11 -Meoa:3461.639- Median:21150 Percentiles: 0% 25% 50% 75% 100% 779.0 2833.5 21150.0 112500.0 300000.0

Margen operativo

El margen operativo cuantifica el porcentaje de ingresos por ventas que la empresa convierte en beneficios, antes de descontar impuestos e intereses. Dentro de esta variable se puede examinar que los mayores porcentajes del margen operativo son los que generan menores ventas totales y un menor beneficio operativo, esto podría indicar que el valor que le cuesta producir un producto a la empresa sea más económico.

Estadisticas. Media:0.4495139- Moda:0.4511111 Median:0.46

desviacion:0.08428498 Percentiles: 0% 25% 50% 75% 100% 0.30 0.35 0.46 0.50 0.65

Maxi:porcentaje de margen operativo es de 65% Min: margen operativo es del 30%

Variables cartegóricas

product

En esta variable se identifican seis tipos de productos: “Men’s Apparel”, “Men’s Athletic Footwear”, “Men’s Street Footwear”, “Women’s Apparel” “Women’s Athletic Footwear” y “Women’s Street Footwear”. Estos productos se clasifican en dos categorías principales: ropa y calzado, los cuales se dividen en función del género (hombres y mujeres) y del tipo de uso (ropa y calzado).

Métodos de ventas

El método de ventas se refiere a las diferentes formas o canales a través de los cuales una empresa o tienda vende su producto de manera beneficiosa para sus clientes. Básicamente, es el procedimiento o estrategia que se utiliza para vender productos o servicios. En esta variable se logró identificar lo siguiente.

En el análisis de la variable “Sales Method”, se observó que existen dos métodos de venta en la tienda, adicional a ello que la venta en línea es el método más utilizado, representando el 50% indicando que los clientes prefieren utilizar este método de compra, seguido por el método outlet con un 50%.

Gráficos

Gráfico 1. Ventas totales por producto. Histograma.

Ventas totales por producto (Gráfico 1): El gráfico muestra que “Men ’s Street Footwear” es el producto con mayores ventas totales, alcanzando alrededor de $3,000,000. Esto indica que el calzado masculino, especialmente el urbano, tiene una gran demanda en Illinois. El segundo producto más vendido es “Women ’s Apparel” lo cual denota una gran presencia del segmento de ropa femenina en el mercado.

Gráfico 2. Ventas totales por producto. Diagrama boxplot

Ventas totales por producto- Boxplot (Gráfico 2): El diagrama boxplot muestra la distribución de las ventas por producto. “Men ’s Street Footwear” presenta una amplia variabilidad en sus ventas, mientras que “Women ’s Apparel” tiene una menor dispersión, denotando que las ventas son más consistentes. La mediana más alta corresponde a “Women ’s street Footwear” lo cual sugiere un mayor rendimiento relativo.

Gráfico 3. Margen Operativo por producto. Histograma.

Margen Operativo por producto (Gráfico 3): “Women’s Apparel” tiene el mayor margen operativo, lo cual indica que este producto es el más rentable para la tienda en términos de margen. Esto puede ser debido a los menores costos de producción o a un mayor precio por unidad.

Gráfico 4. Margen operativo por producto . Diagrama Boxplot.

Margen operativo por producto, Boxplot (Gráfico 4): El boxplot confirma que “Men’s Street Footwear” tiene uno de los márgenes más bajos, lo que podría deberse a promociones o descuentos frecuentes, reduciendo el margen operativo. En cambio “Women ’s Apparel” continúa siendo el producto con el mayor margen operativo.

Gráfico 5. Total de ventas por método de ventas.

Ventas totales por método de ventas (Gráfico 5): El gráfico de barras muestra una clara diferencia entre los dos métodos de venta, con el “Outlet” generando significativamente más ventas que en el “Online”, interpretando de esta manera que los clientes en Illinois prefieren más las tiendas físicas.

Gráfico 6. Total de ventas por método de ventas. Diagrama Boxplot.

Total de ventas por método de ventas. Boxplot Los márgenes operativos no muestran una diferencia tan marcada entre el método “Online” y el “Outlet”, pero el “Outlet” muestra que tiene una ligera ventaja en términos de margen, lo que puede ser indicativo de menores costos asociados al mantenimiento de inventario en la tienda física.

Modelo de regresión multiple

Este modelo de regresión multiple busca analizar como se ve afectado el margen operativo de la empresa en el estado de Illinois por los factores claves: Productos, Precio por unidad, Unidades vendidas y los metodos de venta,esto para encontrar información valiosa sobre el rendimiento de la empresa.se plantea de la siguiente forma:

Margen operativo= β0​+β1​(Price per Unit)+β2​(Units Sold)+β3​(Product)+β4​(Sales Method)+ϵ

Una vez planteado el modelo de regresión múltiple, ejecutamos la función sumary( ), la cual brinda información y valores claves que permiten evaluar y analizar el modelo. Entre los datos proporcionados se destacaron el valor del intercepto β0, así como los coeficientes βn de las variables independientes. También se examinaron los valores p, que indican la significancia estadística de cada predictor, y el R cuadrado ajustado.

A continuación se mostrarán los resultados del modelo que se usaron para el análisis, seguido de la explicación de cada uno y la interpretación que se le da dentro del modelo.

Análisis y explicación de los resultados:

INTERCEPTO (β0)

Este valor corresponde al intercepto de la línea con el eje Y, es decir, es el valor que sumaria Y en la ausencia de las variables independientes X. En el caso hipotético el Margen Operativo sería de 0,4086 en la ausencia de las variables Precio por Unidad, Unidades Vendidas, Producto y Método de Venta, esto a pesar de ser matemáticamente correcto, en el contexto real puede no tener sentido ya que por ejemplo, no hay productos a precio 0.

ANÁLISIS DE LOS COEFICIENTES DE LAS VARIABLES Y SU SIGNIFICANCIA

COEFICIENTES (β1,β2,β3,β4,β5,β6,β7,β8,β9):

Los coeficientes representan cuánto cambia la variable dependiente Margen operativo por cada unidad que varíe las variables independientes (Precio por Unidad, Unidades Vendidas, Producto y Método de Venta). En este caso que se tienen variables categóricas, R toma una variable de referencia y los coeficientes de los resultados indican cómo varía el margen operativo de cada categoría en comparación a la categoría de referencia,

El p-valor representa la probabilidad de obtener un resultado tan extremo como el observado (o más extremo) si la hipótesis nula es verdadera. La hipótesis nula generalmente postula que no hay efecto o relación. Interpretación: Valores bajos (p < 0.05): Indican que hay evidencia suficiente para rechazar la hipótesis nula. Esto sugiere que hay una relación significativa entre las variables. En muchos estudios, un p-valor menor a 0.05 se considera estadísticamente significativo. Valores altos (p ≥ 0.05): Indican que no hay suficiente evidencia para rechazar la hipótesis nula, lo que sugiere que la variable en cuestión no tiene un efecto significativo.

Coeficientes de la variable Product

  • Product Men’s Athletic Footwear β1: Para esta variable se observa que el valor de P es de 0.2600,lo cual se encuentra por encima del umbral 0,05 e indica que la variable no es significativa dentro del modelo, y sugiere que no se puede inferir con confianza que el calzado atlético masculino tenga un efecto en el margen operativo en comparación del producto de referencia ropa masculina.

  • ProductMen’s Street Footwear β2: Se observa que el calzado de calle masculino aumenta el margen operativo en un 0,05925 a comparación de la ropa masculina, esto puede inferirse ya que en este caso el valor se encuentra entre 0 y 0,001.

  • ProductWomen’s Apparel β3: Este coeficiente indica que la elección de ropa femenina está asociada con un aumento de 0,1508 en el margen operativo, y cuenta con un valor P significativo.

  • ProductWomen’s Athletic Footwear β4: Con un valor de 0.06352, este coeficiente indica que el calzado atletico para mujeres aumenta el margen operativo, en comparación con la masculina, siendo este efecto significativo con un P menor a 0,05.

  • ProductWomen’s Street Footwear β5: ProductWomen’s Street Footwear: Se observa que para esta variable el valor P no es significativo,por lo cual no se puede inferir con confianza que el calzado de calle para mujeres genere un aumento o disminución del margen operativo, a comparación de la ropa para hombres.

  • Price_per_Unit β6: Este coeficiente sugiere que un aumento en el precio por unidad genera un incremento en el margen operativo de 0.0012. El valor de P para esta variable, es significativo.

  • Units_Sold β7: El signo que acompaña al coeficiente de esta variable es negativo, y el valor se encuentra enre 0,01 y 0,05, aun significativo, po lo cual se puede inferir quer lo cal se puede inferir que por cada unidad adicional vendida, el margen operativo disminuye en aproximadamente 0.00004276. Aunque el efecto es pequeño, sugiere que un aumento en las ventas no siempre se traduce en un mejor margen operativo.

  • Sales_MethodOutlet β8: Para esta variable categórica que toma como referencia al método de ventas online, se muestra un coeficiente negativo, lo que indica que cuando el método de ventas empleado es outlet,el margen operativo es menor en un 0.116 en comparación con el método online, que es el método de referencia. El valor P para esta variable es significativo.

Coeficiente de la variable Price per unit

Price_per_Unit : Este coeficiente sugiere que un aumento en el precio por unidad genera un incremento en el margen operativo de 0.0012. El valor de P para esta variable, es significativo.

Coeficiente de la variable Units Sold

Units Sold : El signo que acompaña al coeficiente de esta variable es negativo, y el valor se encuentra enre 0,01 y 0,05, aun significativo, por lo cual se puede inferir que por cada unidad adicional vendida, el margen operativo disminuye en aproximadamente 0.00004276. Aunque el efecto es pequeño, sugiere que un aumento en las ventas no siempre se traduce en un mejor margen operativo.

Coeficiente de la variable Sales_Method

Sales_MethodOutlet Para esta variable categórica que toma como referencia al método de ventas online, se muestra un coeficiente negativo, lo que indica que cuando el método de ventas empleado es outlet,el margen operativo es menor en un 0.116 en comparación con el método online, que es el método de referencia. El valor P para esta variable es significativo.

Analisis del R cuadrado ajustado

El R cuadrado ajustado nos dice qué porcentaje de variación de la variable dependiente es explicado colectivamente por todas las variables independientes. para este modelo el R cuadrado ajustado es de 0.9576, lo que indica que aproximadamente el 95.76% de la variabilidad de el Margen operativo se explica por las variables (Precio por Unidad, Unidades Vendidas, Producto y Método de Venta).

Variables con mayor impacto

Product

En cuanto a los productos, la categoría con más impacto sobre el rendimiento de la empresa es la ropa de mujer, ya que es la que aumenta en mayor cantidad el margen operativo tanto en comparación a la variable de referencia del modelo (Ropa de hombre) como en comparación al resto de productos, esto puede evidenciarse en el siguiente grafico:

Este impacto a comparación de los otros productos, puede deberse a que la ropa para mujer genera un costo menor al producirse en comparación a los otros productos y que además.

Sales Method

Otra variable con un gran impacto en el rendimiento de la empresa es Métodos de ventas, específicamente el método online tiene un impacto positivo en el Margen operativo, esto debido a que aumenta significativamente a este en comparación al método de ventas outlet, esto puede deberse a que como en el métodos de ventas outlet se usan puntos físicos esto genera costos adicionales como alquiler, mantenimiento o servicios, además los productos vendedidos en este metodo de ventas generalmente son de temporadas pasadas o de excedente de inventario, por lo cual se llegan a vender con descuento y esto disminuye el margen operativo.

Precio por unidad:

Se estudia el siguiente gráfico y se analiza que existe una relación positiva entre el precio por unidad y el margen operativo. Esto significa que, en general, a medida que el precio de los productos aumenta, también lo hace el margen operativo. Esto podría deberse a que los productos de mayor precio permiten reponer mejor los costos fijos y variables, incrementando así la rentabilidad. A medida que el precio aumenta, la empresa puede recuperar una mayor proporción de sus costos, lo que se refleja en un margen operativo más elevado.

Supestos

La validez de un modelo de regresión depende de varios supuestos que, si se cumplen, garantizan que las inferencias realizadas a partir del modelo sean confiables. Evaluar estos supuestos es fundamental para asegurar que los resultados obtenidos sean representativos y generalizables a la población de interés. De no cumplirse estos supuestos,no se podrán hacer inferencias sobre la muestra poblacional, solo se podrán hacer dentro de la muestra. Para este modelo, se evaluarán tres supuestos clave: la normalidad de los residuos, la multicolinealidad y la homocedasticidad.

Linealidad

El supuesto de linealidad implica que la relación entre la variable independiente (x) y la variable dependiente (y) es lineal. Los coeficientes betas deben ser iguales a cero. Dado que el resultado del valor p indica que es bajo ( p-value: < 2.2e-16), se rechaza la hipótesis nula y se acepta la hipótesis alternativa.

Varianza o homocedasticidad

El supuesto de homocedasticidad requiere que la varianza de los errores (residuales) sea constante en todos los niveles de las variables independientes. Para verificarlo de manera más precisa, se tendrá en cuenta el test Breusch-Pagan y arroja el p-value = 3.64e-07 , puesto que es menor a 0.05 se rechaza la hipótesis nula , que indica que la varianza constante y se acepta la hipótesis alternativa haciendo referencia a que la varianza no es constante.De esta manera se observa que el modelo no cumple con el supuesto de varianza constante.

Normalidad

El supuesto de normalidad implica que los residuos deben seguir una distribución normal. Dado que el resultado del test Shapiro-Wilk p-value = 4.334e-05 es menor que 0.05 se rechaza la hipótesis nula que nos dice que los datos son normales y se aprueba la hipótesis alternativa que nos indica que los datos no son normales. Los estimadores de nuestro modelo muestran que los coeficientes no equivalen a toda la población, sólo equivalen a la muestra tomada, por lo tanto se podrá inferir solo en la muestra.

Multicolinealidad

La multicolinealidad aparece cuando dos o más variables predictoras (variables independientes) muestran una alta correlación entre ellas. La multicolinealidad no afecta los resultados de la predicción,pero si los coeficientes individuales y los valores p.

Para analizar la multicolinealidad de estas variables, utilizaremos la función VIF, que nos proporcionará los valores de VIF para cada variable del modelo. El VIF (Variance Inflation Factor, o Factor de Inflación de la Varianza) es una medida que se utiliza para detectar la multicolinealidad en un modelo de regresión. Generalmente, un valor de VIF por encima de 5 se considera un indicativo de multicolinealidad que puede ser preocupante.

resultados del vif:

Variable VIF
Product 3.495055
Price_per_Unit 2.045646
Units_Sold 4.149004
Sales_Method 3.202830

Como se observa, ninguno de los valores del vif son mayores a 5 por lo cual,no hay una multicolinealidad significativa en el modelo. Esto indica que las variables independientes son relativamente independientes entre sí y no afectan negativamente a la interpretación de los coeficientes.

En conclusión, modelo no cumple com los supuestos de la normalidad de los residuos, y la homocedasticidad. Por lo cual, de los resultados que se obtuvieron en el modelo para la muestra analizada, no se puede inferir en la población.

Conclusiones y Estrategias:

El análisis realizado sobre las ventas y márgenes operativos de Foot Locker en el estado de Illinois revela patrones significativos los cuales pueden ser aprovechados para optimizar la rentabilidad de la tienda. A través de la aplicación del modelo de regresión múltiple, se identificaron los factores clave que afectan el margen operativo, como el tipo de producto, el precio por unidad, el método de ventas y las unidades vendidas. Gracias a estos resultados se obtiene una visión integral sobre el desempeño financiero de los diferentes productos y canales de venta en Illinois. Además se obtuvo unos hallazgos claves los cuales se nombraran a continuación:

Impacto del Tipo de producto en el margen Operativo: Los productos de ropa femenina (“Women ’s Apparel”) resultaron ser los más rentables, generando los márgenes operativos más altos. Esto nos indica que estos productos no solo tienen un alto valor percibido por los clientes sino que además cuentan con menores costos de producción en comparación con otros productos, como el calzado masculino.

Relación entre precio por unidad y rentabilidad: El análisis muestra que un mayor precio por unidad está positivamente correlacionado con el margen operativo. Esto demuestra que los productos más caros tienden a ser más rentables, ya que generan mayores márgenes por cada venta. Aún así es importante equilibrar el precio con la percepción de valor de cada cliente, para poder evitar que un precio alto reduzca el volumen de ventas.

Estrategia de ventas: Anteriormente se llegó a la conclusión de que en “Outlet” se generan mayores volúmenes de ventas, pero aún así se debería considerar que las ventas Online pueden ser potenciadas para poder mejorar los márgenes operativos. Esto puede incluir una mayor promoción de ventas en línea o reducir costos asociados a las tiendas físicas.

Unidades vendidas y margen operativo: El análisis revela que un mayor número de unidades vendidas no garantiza un mayor margen operativo, ya que por las estrategias de descuento que acompañan las ventas en grandes volúmenes, pueden reducir significativamente los márgenes. De esta manera se concluye que se debe revisar las estrategias promocionales para evitar que la búsqueda de volumen sacrifique la rentabilidad.