PROYECTO FINAL
Proporciono información a los ejecutivos, analistas y tomadores de decisiones, sobre los factores más relevantes de las compras al por menor realizadas en 10 centros comerciales de Estambul con el objetivo de orientar sobre los sectores económicos más beneficiados en el ámbito de las ventas y ganancias, los comportamientos de los precios de los productos comparados con el tipo de cambio, y la conveniencia para instalación o internacionalización de las empresas mexicanas. La información fue analizada con la base de datos titulada Conjunto de datos de compras de clientes: datos de ventas minoristas que recopiló datos de varios grupos de edad y género para investigar los hábitos de compra en este país, además de la integración de la variable del Tipo de Cambio extraída del Sistema de Información Económica de Banco de México que sirve de apoyo para dicho análisis.
Conjunto de datos de compras de clientes: datos de ventas minoristas Base de datos de Kaggle, creada por el Analista de datos en Crystal System, Mehmet Tahir Aslan.
Este conjunto de datos contiene información de compras de 10 centros comerciales diferentes entre 2021 y 2023. Recopila datos de varios grupos de edad y género para brindar una visión integral de los hábitos de compra en Estambul. El conjunto de datos incluye información esencial como números de factura, identificaciones de clientes, edad, género, métodos de pago, categorías de productos, cantidad, precio, fechas de pedido y ubicaciones de los centros comerciales.
Cobertura geográfica: Estambul, Turquía.
Cobertura temporal: 2021-2023
Corte temporal: Mensual
Variables:
Invoice_no: Número de factura. Nominal. Combinación de la letra “I” y un número entero de 6 dígitos asignado de forma única a cada operación.
Customer_id: Número de cliente. Nominal. Combinación de la letra “C” y un número entero de 6 dígitos asignado de forma única a cada operación.
Género: Variable de cadena del género del cliente.
Edad: Variable entera positiva de la edad del cliente.
Categoría: Variable de cadena de la categoría del producto adquirido.
Cantidad: Las cantidades de cada producto (artículo) por transacción. Numérico.
Precio: Precio unitario. Numérico. Precio del producto por unidad en liras turcas (TRY).
Payment_method: Variable de cadena del método de pago (efectivo, tarjeta de crédito o tarjeta de débito) utilizado para la transacción.
Invoice_date: Fecha de la factura. El día en que se generó la transacción.
Shopping_mall: Variable de cadena del nombre del centro comercial donde se realizó la transacción.
Tipos de cambio para revalorización de balance del Banco de México Base de datos del Sistema de Información Económica (SIE), Banco de México.
Este conjunto de datos contiene información de los diferentes Tipos de Cambio por país desde el periodo seleccionado, en este caso 2021-2023, con la conversión a Dólar y a Peso mexicano.
Cobertura geográfica: México
Cobertura temporal: 2021-2023
Corte temporal: Mensual
Variables: El conjunto de datos incluye el Tipo de Cambio de las diferentes monedas del mundo a Dolares y a pésos mexicanos por los periodos seleccionados en la plataforma (2021-2023).
De acuerdo a los resultados, ¿cuál es la edad más frecuente, el promedio y la mediana de edad en la que los consumidores adquieren el producto que más se vende de las categorías?
De los centros comerciales analizados ¿Qué proporción de ganancia tiene cada comercio?
¿Qué efectos tiene el tipo de cambio actual en los precios de dichos productos?
Para el análisis se utilizaron 5 librerías diferentes a la base. Readxl, Tidyr, Tidyverse, Dplyr, y Ggplot2.
Conjunto de datos de compras de clientes: datos de ventas minoristas Es importada desde Kaggle utilizando la función read.csv desde la biblioteca en donde el archivo es guardado con el nombre proyecto_customers.
En primera estancia, para comenzar a trabajarla solo fue necesario eliminar la columna de datos que no se usaría. Usando la función select, esta acción fue posible.
consumidores_1=consumidores%>%select(-customer_id)
Tipos de cambio para revalorización de balance del Banco de México Base de datos importada del Sistema de Información Económica (SIE), Banco de México utilizando la función read.xlsx desde la biblioteca en donde el archivo es guardado con el nombre tipo_de_cambio.
Para también dejar esta base preparada, fue necesario eliminar todas las filas que no se usarían, en este caso, la de todos los países diferentes a Turquía-Estambul. Luego, se le asigna la primera fila resultante como nombre de las columnas con colnames, y se elimina una vez sustituida.
tipo_de_cambio_2=tipo_de_cambio_1[-c(1, 2,3,4,5,6,7,8), ]
tipo_de_cambio_2=tipo_de_cambio_2[-c(2:127),]
tipo_de_cambio_2=tipo_de_cambio_2[-c(4:19),]
colnames(tipo_de_cambio_2)<- as.character(unlist(tipo_de_cambio_2[1,]))
tipo_de_cambio_2=tipo_de_cambio_2[-2,]
Debido a que la base fue descargada con una orientación horizontal, para facilitar el trato de la información fue necesario cambiar dicha orientación a vertical con la función pivot_longer. Además, eliminé las filas que no se utilizarían o que generaron algún error.
tipo_de_cambio_2$Título[2]="TRY_a_MXN"
tipo_de_cambio_2=tipo_de_cambio_2[,-c(2,3)]
tipo_de_cambio_3= pivot_longer(tipo_de_cambio_2,
cols = -Título,
names_to = "Fecha",
values_to = "TRY_a_MXN")
tipo_de_cambio_3=tipo_de_cambio_3[-c(1:36),]
tipo_de_cambio_3=tipo_de_cambio_3[,-1]
La base de datos, al ser leída en R, convirtió las fechas en un número que se podía distinguir como as.character, por lo que fue necesario convertir a números y a fechas. Para ello se usó la función as.numeric y as.date. Posteriormente la pegué a la base principal tipo_de_cambio_3 con un cbind y la cambié de lugar con un relocate.
tipo_de_cambio_3$Fecha=tipo_de_cambio_3$Fecha%>%as.numeric()
numero_dias=tipo_de_cambio_3$Fecha
fecha = as.Date(numero_dias, origin="1899-12-30")
tipo_de_cambio_3=tipo_de_cambio_3%>%cbind(fecha)
tipo_de_cambio_3=tipo_de_cambio_3%>%relocate(fecha, .before = Fecha)
tipo_de_cambio_3=tipo_de_cambio_3[,-2]
En la base de datos de ventas minoristas titulada “consumidores” contamos con la columna “Categoría”, que tiene en total 99,457 elementos. De acuerdo a los datos, tenemos 8 categorías, en donde la que abarca la mayor proporción de compras por cliente (no por quantity dentro de la transacción) es Ropa, teninedo el 35% del total.
Aunque la ropa domina, también hay una diversidad de categorías significativas como cosméticos, alimentos y bebidas, juguetes y zapatos. Esto sugiere una oferta variada de productos.
Libros, souvenirs y tecnología tienen proporciones similares y menores. Esto puede indicar nichos más pequeños o en su caso, áreas potenciales de crecimiento.
Lo más relevante para el cálculo de la figura 1 fue el uso de las funciones nrow para calcular elementos, rename para renombrar columnas, y ggplot-geom_bar para la creación del gráfico.
El gráfico muestra el porcentaje de hombres y mujeres que compraron diferentes categorías de productos en Estambul entre 2021 y 2023. Cada barra representa una categoría de producto, y las barras están segmentadas por género, con colores diferentes para hombres (azul) y mujeres (rosa).
Se denota que en la totalidad de los productos, las mujeres son quienes compran o consumen con más frecuencia dichas categorías, siendo souvenirs y cosmetics las categorías mayormente adquiridas por las mujeres. Y books la mayormente consumida por hombres.
Lo más relevante para el cálculo de la figura 2 fue el uso de la función group_by para agrupar por categoría y por género, y ggplot para el gráfico de barras apiladas.
De acuerdo a la totalidad de transacciones, el pago en cash representa casi la mitad gráfica, siendo el 45% de la población cuya preferencia es el uso de efectivo. Así mismo, las tarjetas de crédito son también bastante populares, posiblemente debido a las ventajas de pago a plazos y recompensas asociadas.
El gráfico nos hace ver que a pesar de los cambios tecnológicos, aún la mayor parte de la población, tal vez no se ha acostumbrado al uso de terminales, factor a considerar para un empresario que desee internacionalizar su comercio.
Tabla 1: Creación propia a partir de los datos de Conjunto de datos de compras de clientes: datos de ventas minoristas
| Media | Mediana | Moda |
|---|---|---|
| 43.40923 | 43 | 22 |
Primero, la media sugiere que, en promedio, los valores de la base de datos están alrededor de 43 años de edad. La media es sensible a valores extremos, en este caso a las edades más elevadas que han sido registradas.
La mediana de 43 años indica que el valor central de la base de datos es 43. Esto significa que el 50% de los datos son personas menores o iguales a 43 años y el otro 50% son mayores o iguales a 43. La mediana no se ve afectada por valores extremos y da una buena idea de la distribución central de los datos.
La moda de 22 años indica que las personas de esta edad son las que mayormente adquieren el producto que como vimos anteriormente contiene mayor cantidad de transacciones, clothing.
Este análisis nos indica pues, que las personas que más adquieren ropa son las personas de 22 años, así mismo, de todas las personas registradas, el valor central es de 43 años de edad, y el promedio de todos los consumidores en la categoría es igualmente un aproximado a 43.
Lo más relevante para el cálculo de la tabla 1 fue el uso de la función function para crear una función específica para generar la moda.
Tabla 2: Creación propia a partir de los datos de Conjunto de datos de compras de clientes: datos de ventas minoristas
| Shopping mall | Proporción |
|---|---|
| Cevahir AVM | 0.05027772 |
| Emaar Square Mall | 0.04932729 |
| Forum Istanbul | 0.04892102 |
| Istinye Park | 0.09788573 |
| Kanyon | 0.20100623 |
| Mall of Istanbul | 0.20227161 |
| Metrocity | 0.14831780 |
| Metropol AVM | 0.10091184 |
| Viaport Outlet | 0.04978549 |
| Zorlu Center | 0.05129525 |
Existen 10 centros comerciales que fueron registrados en esta base de datos. De dichos comercios, y una vez calculada la ganancia total por comercio (sum(precio x cantidad)), podemos denotar que el comercio que mayores ingresos obtuvo Mall of Istanbul con un total del 20.2% de la proporción, seguido de Kanyon con un 20.1%.
Así, podemos deducir que estos son los comercios que mayores ganancias proyectan, en los que están instalados los diferentes sectores que ofertan mercancía de forma minorista y que a su vez obtienen mayor cantidad no de transacciones, sino de ganancias totales.
Lo más relevante para el cálculo de la figura fue el uso de la función cbind para pegar una columna de creación propia que multiplica el precio por cantidad, relocate para cambiar la posición de columnas dentro del data.frame, group_by para agrupar por comercio y mutate para modificar las columnas existentes o creadas.
De acuerdo a la gráfica, podemos observar que en el periodo entre 2021 y 2023 existe un cambio considerable en el valor del Tipo de Cambio de TRY a MXN. Comenzamos viendo para inicios del 2021 un monto de 2.7 pesos MXN por TRY y terminamos para inicios del 2023 con un valor de 0.94 pesos MXN por TRY.
Lo anterior denota que exitió un valor apreciado de la moneda nacional (MXN) respecto a la divisa extranjera (TRY) en el año 2021, pero dicho valor fue encareciendose sucesivamente al paso de los meses teniendo altas y bajas hasta llegar al valor más reciente registrado en la base de datos, en donde se aprecia que ya la divisa extranjera obtuvo una apreciación respecto a la moneda nacional.
Lo más relevante para el cálculo de la figura 5 fue el uso de la función format para poder cambiar a primer día del mes la variable fecha en la base de consumidores, rename y mutate para renombrar la variable igual en ambas bases, merge para juntar ambas bases de datos por fechas iguales, y relocate para cambiar el orden en el que se encontraban dichas variables.
Para 2021, el TC TRY a MXN resultaba ser de aprox $3, es decir, por una lira obtendrías 3 pesos. Esto denota que existía una ventaja en el mercado extranjero, lo que nos muestra que generar ingresos dentro del país extranjero era más rentable al momento de intercambiar la moneda (se puede obtener utilidad con una reubicación y estrategia de internacionalización, teniendo en cuenta que este análisis de momento no analiza todas las variables necesarias.)
Por su parte, para 2023, dicha ventaja, debido a la apreciación del peso, hace que no sea tan viable una estrategia de internacionalización específicamente a esta zona.
Así mismo, el costo de los bienes importados, para un mexicano en el 2023 resulta ser bastante beneficioso.
Lo más relevante para el cálculo de la figura 6 fue el uso de la función group_by para agrupar por fecha, y summarise para sumar el valor neto de ganancias a MXN.
Tabla 3: Creación propia a partir de los datos de Conjunto de datos de compras de clientes: datos de ventas minoristas y Tipos de cambio para revalorización de balance del Banco de México
| Categoría | Suma ganancia x categoría |
|---|---|
| Books | 72279.68 |
| Clothing | 9445476.37 |
| Cosmetics | 596867.90 |
| Food & Beverage | 70448.88 |
| Shoes | 5372724.01 |
| Souvenir | 50700.23 |
| Technology | 5154954.14 |
| Toys | 316282.42 |
De acuerdo a la tabla, el sector que más beneficio puede llegar a tener en el sentido de ganancia total convertida a MXN es el de Clothing con un valor de 9,445,476.37 de pesos, seguido de Shoes y Technology con valores de 5,372,724.01 pesos, y 2,154,954.14 pesos.
Es así, que se deduce que si algun tomador de decisiones desea centrar sus esfuerzos en cierta categoría, principalmente tome en cuenta que las más y mejor beneficiadas son las mencionadas, no sin aclarar que las restantes también obtienen un beneficio, solo que significativamente menor.
Lo más relevante para el cálculo de la figura 6 fue el uso de la función filter para filtrar por la fecha más actual >=2023-01-01, group_by para agrupar por categoría, y summarise para sumar el precio neto en MXN.
El sector de la ropa sin duda es el sector más beneficiado en cuanto a cantidad de consumidores respecta. Si un empresario o tomador de decisiones desea realizar por ejemplo una reubicación o internacionalización de su empresa a Estambul, es importante considerar el histórico de estos datos y la posición dentro de la proporción que ocupa el sector en el que esté interesado. Así mismo, dentro de su estudio de mercado es relevante saber la proporción de población femenina y masculina que consume dichos productos, y la costumbre de pago que realizan en el país, esto para lograr una mayor estrategia y mejores resultados.
Como se dijo anteriormente, el producto con mayores transacciones en Estambul durante el periodo 2021-2023 fue el de la ropa, siendo un sector al que principalmente las personas de 22 años acceden. Sin embargo, hay una gran distribución de edades dentro de este sector, dandonos una media bastante distinta. Cuestión que es importante considerar debido a que para un tomador de decisiones podría ser relevante analizar más edades significativas para su estudio de mercado, logrando así una segmentación de mercado más amplia.
Para un análisis de mercado, sobre todo si se realiza para una decisión de internacionalización, es relevante tener una idea de los comercios a los cuales se puede acudir para una instalación de local. Como vimos en el análisis, Estambul nos brinda una gran variedad, pero los que más relevancia tienen dentro de este estudio son Mall of Istanbul y Kanyon, pues abarcan la proporción más grande en cuanto a recaudación de ganancias.
El tipo de cambio en los años analizados se ha visto muy fluctuante de manera negativa para los negocios que deseen internacionalizarse a este país debido a que al tener una moneda nacional (MXN) depreciada, establecerse en un mercado extranjero es desventajoso por el valor de nuestra moneda respecto a la extranjera, costear sueldos, pagos, y otros gastos de las empresas puede resultar difícil. Sin embargo, para algún empresario, tomador de decisiones o bien, consumidor que desea importar mercancía desde Estambul, es bastante más accesible.
También es importante tomar en cuenta que además de que clothing es la categoría que más obtiene transacciones en el periodo analizado, también es la que más obtiene ingresos también convertidos al Tipo de Cambio. Si algún tomador de decisiones necesita realizar un estudio de mercado con mayor profundidad, es relevante tener en cuenta dicha estadística con la finalidad de que nuestros empresarios mexicanos obtengan en la medida de lo posible, los mejores resultados.
Por ejemplo, para un tomador de decisiones de marketing, podría realizarse un análisis de la dispersión de los datos entre las diferentes categorías de productos en base a su edad, para saber la consistencia de la información.
Analizar otras variables relevantes, como el salario mínimo, el costo de la canasta básica, costos de internacionalización, etc.
Analizar más edades moda en las que acceden a los diversos productos de cada categoría.
Tipos de cambio para revalorización de balance del Banco de México (SIE, Banco de México). (2024). https://www.banxico.org.mx/SieInternet/consultarDirectorioInternetAction.do?sector=6&accion=consultarCuadroAnalitico&idCuadro=CA113&locale=es
Customer Shopping Dataset - Retail Sales data. (2023, 9 marzo). Kaggle. https://www.kaggle.com/datasets/mehmettahiraslan/customer-shopping-dataset/data?select=customer_shopping_data.csv
Duursma, R., Powell, J., & Stone, G. (2019). A Learning Guide to R. Western Sydney University. https://www.westernsydney.edu.au/__data/assets/pdf_file/0011/862346/00_SolutionsExercises.pdf
Rey Graña, C. (2007). Introducción a la Estadística Descriptiva (2oda). Netbiblo. https://core.ac.uk/download/pdf/61909762.pdf
Hernández, F. (2021). Manual de R. https://fhernanb.github.io/Manual-de-R/
Wilkinson, L. (2004). Statistics and Computing (2oda). Springer. https://content.e-bookshelf.de/media/reading/L-872-13ff1ea6cd.pdf