1 Introducción

Los modelos de decisión para optimizar los niveles de inventario son uno de los elementos centrales de la gestión de operaciones. La mayoría de los modelos asumen que quienes toman las decisiones son completamente racionales y maximizan las ganancias esperadas. Sin embargo, investigaciones recientes han desafiado estos supuestos. Estos estudios prueban si los tomadores de decisiones humanos en realidad maximizan las ganancias esperadas y buscan sesgos de decisión a los que los tomadores de decisiones podrían ser propensos.

En la actualidad es universalmente aceptada la idea que el éxito de una cadena de suministro depende en gran medida de decisiones efectivas sobre inventario y pedidos 1. Las organizaciones dependen de profesionales experimentados para tomar decisiones de inventario y pedidos. Con la ayuda de los sistemas de información, las personas deciden cuánto pedir, cuándo pedir y qué cantidad mantener en el inventario 2. La evidencia muestra que los tomadores de decisiones tienden a desviarse de lo prescrito por los modelos cuantitativos (analíticos y de optimización), lo que resulta en costos innecesarios e ineficiencias operativas3.

Los avances recientes en la tecnología de la información hacen posible que los tomadores de decisiones rastreen la información en tiempo real y obtengan feedback retroalimentación sobre sus decisiones. Desde un sentido normativo, un aumento en la frecuencia de la retroalimentación y la capacidad de realizar cambios debería conducir a un mejor desempeño, ya que los tomadores de decisiones pueden responder más rápidamente a los cambios en el entorno y ver las consecuencias de sus acciones. Al mismo tiempo, existen razones para creer que la retroalimentación más frecuente a veces puede conducir a una disminución en el rendimiento4.

Investigaciones anteriores han examinado cómo la fuerza de la retroalimentación puede ayudar o perjudicar el desempeño y el aprendizaje (Hogarth y Marquis, 1991)5, cómo los retrasos entre las decisiones y la retroalimentación perjudican el desempeño (Sterman, 1989)6, cómo las personas aprenden con y sin retroalimentación (Weber, 2003)7, cómo la retroalimentación ruidosa inhibe el aprendizaje (March, 1999)8 y cómo los incentivos impactan en el rendimiento y el aprendizaje (Hogarth, 1991)9, pero se ha examinado poco cómo la La presentación de información de retroalimentación afecta la toma de decisiones. En particular, ha habido pocos intentos de comprender cómo la frecuencia de retroalimentación afecta el rendimiento.

1.1 Newsvendor Problem

El problema del vendedor de noticias es uno de los modelos básicos estudiados en la gestión de inventarios y es aplicable a una variedad de entornos, incluidos el comercio minorista y la fabricación 10. El modelo estándar de Newsvendor considera a un decisor quien debe determinar la cantidad de pedido Q en multiplos periodos de venta. El precio de venta del producto es p, y el precio de venta unitario es Q. La demanda del producto D es estocástica con una función de densidad f(x).

Si el vendedor pidió Q unidades y la demanda fue de D pueden ocurrir tres escenarios:

  • Q < D el vendedor subestimó la demanda y su costo de faltante (oportunidad) por unidad sería el margen que dejaría de percibir (understock cost):

\[c_u = p - c_a\]

  • Q > D el vendedor sobrestimó la demanda y su costo unitario sería el de adquisición (overstock cost):

\[c_0 = c_a\]

  • Q = D no hay costos de subponderar ni sobreponderar.

Sea D una demanda aleatoria continua de función de densidad f(X) y función acumulada F(x) donde:

\[P(D\leq x) = \int_{0}^{x}f(x)dx = F(x)\] Las unidades vendidas serán el mínimo entre la demanda D y la cantidad de inventario Q, así también el costo de adquisición será solamente asociado a las Q unidades de inventario. Luego para determinar la ultilidad esperada debemos analizar los valores que puede tomar D con la probabilidad de que lo anterior ocurra (nótese que D no puede ser negativo).

\[E[U(Q)] = \int_{0}^{\infty}p\cdot min(Q,x)f(x)dx-\int_{0}^{\infty}c_a\cdot Q\cdot f(x)dx\] La cantidad de pedido que maximiza los beneficios esperados es (Arrow,1951)11.

\[q^*=F^{-1}\left(\frac{p-c}{p}\right)\] Donde F es la distribución de la demanda. Además la relación entre el understock cost y overstock cost se conoce como ratio crítico (CR) y se denota por la siguiente ecuacuación:

\[CR=\left(\frac{c_u}{c_u+c_0}\right)\] Esto proporciona un punto de referencia normativo para evaluar qué tan cerca están las decisiones de la optimalidad en un entorno dado.

1.2 Retroalimentación en Newsvendor Problem.

Swaminathan & Tayur (2003) examinaron los efectos de la frecuencia de la retroalimentación sobre el rendimiento dentro del contexto del Newsvendor Problem, proporcionando retroalimentación cognitiva y de resultados. En particular, los participantes reciben información cognitiva sobre la demanda del mercado, precio, costo y decisiones que llevaron a un determinado nivel de desempeño, además de información detallada sobre su desempeño en cada ronda.

En el entorno de los vendedores de noticias, en la medida en que la retroalimentación más frecuente conduzca a una mayor persecución de la demanda y, por lo tanto, a un rendimiento más bajo, estos efectos deberían ser mayores cuando hay una mayor variación en la demanda, en consecuencia con los hallazgos de Schweitzer & Cachon (2000).

1.2.1 Metodología

Setenta y seis estudiantes de negocios de pregrado (juniors y seniors) participaron en un experimento basado en computadora en el que eligieron cantidades de pedidos de inventario de “wodgets” durante dos períodos de 30 rondas. A los participantes se les dijo que estaban jugando un juego de toma de decisiones.

En este juego, eran los minoristas de un solo producto llamado wodget. En cada ronda podían comprar wodgets a 3 francos cada uno y venderlos a 12 francos cada uno. (Se utilizaron wodgets y francos para aumentar la comparabilidad entre nuestros resultados y los de Schweitzer & Cachon (2000) y para evitar posibles ingresos, familiaridad u otros efectos contextuales derivados del uso de productos reales con precios en la moneda local de los participantes). A los participantes se les dijo el costo y precio en cada ronda y que su objetivo era maximizar las ganancias en francos.

Los participantes fueron asignados aleatoriamente a una de las tres condiciones de frecuencia de retroalimentación. Dependiendo de la condición, los participantes tomaron decisiones y recibieron comentarios en cada ronda, cada tres rondas o cada seis rondas.Esta manipulación de la frecuencia de la retroalimentación es similar a permitir que los gerentes cambien los niveles de inventario todos los días, dos veces por semana o una vez por semana (asumiendo un programa de producción de 6 días).

A los participantes que recibieron retroalimentación en cada ronda se les preguntó cuántos wodgets querían pedir para esa ronda. Después de realizar su pedido, se les mostró la demanda de esa ronda, el número de wodgets que pidieron, la ganancia resultante y la ganancia acumulada de la ronda. A los que recibieron comentarios cada tres (seis) rondas se les preguntó cuántos wodgets querían pedir durante cada una de las siguientes tres (seis) rondas.

En la condición de alta varianza, se les dijo a los participantes que la demanda se distribuía uniformemente entre 1 y 1000. Siguiendo a Schweitzer y Cachon, se les dijo a los participantes que la demanda de los consumidores en cada período era incierta y que podían asumir que hay 1000 bolas en un balde. etiquetados del 1 al 1000, y la demanda es igual al número escrito en una bola que se extrae al azar del balde. En la condición de baja varianza, la demanda se distribuyó uniformemente entre 450 y 550. En la condición de alta varianza, la cantidad de maximización de ganancias fue 750 = 75% 1000, y en la condición de baja varianza, la cantidad de maximización de ganancias fue 525 = ( 75% 100) + 450. El beneficio esperado de utilizar la cantidad de pedido óptima fue de 3750 francos por ronda en la condición de alta variación y 4425 francos por ronda en la condición de baja variación. Dentro de cada condición de varianza, la demanda en cada ronda fue idéntica para todos los participantes independientemente de la frecuencia de la retroalimentación.

1.2.2 Resultados

La figura 2a muestra las cantidades de pedido promedio en cada ronda en cada una de las condiciones experimentales, así como las cantidades de pedido óptimas en estas condiciones. La figura 2b ilustra cómo la retroalimentación frecuente conduce a un comportamiento de persecución de la demanda consistente con los resultados de Schweitzer y Cachon (2000) con estudiantes de segundo año de MBA familiarizados con el problema de Newsvendor y su solución óptima. Al igual que Schweitzer y Cachon, encontramos que, en mercados caracterizados por altos márgenes de beneficio, las cantidades promedio de pedidos en las 30 rondas eran demasiado bajas en el mercado de baja varianza, 511 frente al óptimo 525 y en el mercado de alta varianza, 578 frente al óptimo 750.

Como se esperaba, el valor absoluto de la diferencia entre las cantidades de pedido óptimas y reales fue mayor en el mercado de alta variación que en el mercado de baja variación y disminuyó con el tiempo. La frecuencia de la retroalimentación no tuvo un efecto directo en la precisión de las cantidades de los pedidos, pero hubo una retroalimentación significativa por efecto de práctica con una mayor precisión para aquellos que recibieron retroalimentación en cada ronda o cada 3 rondas, pero disminuyó la precisión para aquellos que recibieron retroalimentación cada seis rondas. Esto sugiere que, más allá de cierto punto, aunque ayuda al rendimiento, la retroalimentación menos frecuente parece obstaculizar el aprendizaje.

1.2.3 Conclusiones

  1. Los resultados del Experimento muestran, contrariamente a lo que podría esperarse de las explicaciones normativas, que la retroalimentación más frecuente puede conducir a una disminución del rendimiento en entornos de información ruidosa.

  2. Sin embargo, estos efectos desfavorables de una retroalimentación más frecuente sólo son evidentes en los mercados de alta variación. En entornos de baja varianza, la frecuencia de retroalimentación no tiene un efecto significativo en el rendimiento.

  3. El análisis de las decisiones de los participantes sugiere que se le da más importancia a la demanda más reciente cuando se da retroalimentación en cada ronda.

  4. Obligar a los participantes a tomar una sola decisión para una serie de rondas ayuda a reducir esta tendencia y, en el proceso, mejora el rendimiento en entornos de alta variación.

1.2.4 Investigaciones futuras

Nuestros resultados muestran que las interacciones entre el tomador de decisiones humano y el sistema de información pueden conducir a resultados contrarios a lo que podría esperarse, particularmente en entornos con retroalimentación frecuente y ruido aleatorio. Esto abre preguntas de investigación en varias dimensiones:

  • ¿Se encontrarán resultados similares en dominios como el marketing, la atención médica y las finanzas, donde los avances en la tecnología de la información probablemente también aumentarán la frecuencia de la retroalimentación a los tomadores de decisiones?

  • ¿Cómo pueden los gerentes mitigar el impacto potencialmente dañino de la frecuencia de la retroalimentación en el desempeño?

  • ¿Se pueden dar incentivos a los tomadores de decisiones para mitigar los efectos de una retroalimentación más frecuente?

  • La investigación futura podría examinar las condiciones en las que la retroalimentación más frecuente mejora el rendimiento.

  • Alternativamente, la investigación podría examinar los efectos de educar a los tomadores de decisiones sobre la necesidad de considerar más información y moderar sus respuestas a la información ruidosa.

Estas y otras preguntas relacionadas podrían ser vías de exploración por parte de los investigadores interesados.

2 Problemática

Existe una brecha de conocimiento en la disciplina de Gestión de Operaciones que estudie condiciones donde la retroalimentación más frecuente mejora el rendimiento en un modelo de inventario Newsvendor Problem.

3 Objetivos

La teoría de la equidad fue introducida por primera vez por Adams 12 quien sugiere que las personas desean que la proporción de sus resultados e inversiones sea aproximadamente equivalente a la proporción de alguna otra persona o grupo de referencia. Si las proporciones no son iguales y la diferencia supera algún umbral individual, se producen respuestas emocionales y se manifiesta el deseo de restaurar la equidad.

3.1 Objetivo Principal

El objetivo principal de esta tesis es examinar cómo la retroalimentación interpersonal afecta el rendimiento individual.

3.2 Objetivos Secundarios

  1. Identificar desde el estado del arte condiciones en las cuales una retroalimentación más frecuente prodrían aumentar el desempeño.

  2. Diseñar un experimento de laboratorio que permita manipular diferentes niveles de las condiciones identificadas para determinar su efecto en el desempeño de los decisores.

  3. Diseñar un contexto al experimento que sea representativo de situaciones reales en caso de decisiones de inventario en periodos multiples.

  4. Analizar el efecto de las variables escogidas sobre desempeño de los decisores.

3.3 Preguntas de Investigación.

  • ¿Cómo influyen los resultados de los compañeros en el efecto de la frecuencia de la retroalimentación en el desempeño individual?
  • ¿Existe algún punto en el que la retroalimentación menos frecuente no mejore el desempeño?
  • ¿Cómo afecta un entrenamiento previo en la relación entre la frecuencia de retroalimentación y el desempeño individual?

4 Modelo Conceptual

De acuerdo con Sekaran 13 un modelo conceptual describe las ideas sobre como los conceptos (variables) se relacionan entre sí. Con un diagrama esquemático del modelo conceptual se puede visualizar las relaciones entre variables y así teorizar mediante hipótesis el resultado de estas interacciones.

5 Convocatoria

6 Metodología

6.1 Indagación

En esta etapa el participante deberá responder preguntas demográficas y de atributos, con el objetivo de obtener características de la muestra y el ID de cada participante para evitar duplicados en la muestra.

nombre = str(input("¿Cuál es su nombre?: "))
sexo = str(input("¿De qué sexo es? (H/M): "))
edad = int(input("¿Cuál es su edad?: "))
pais = str(input("¿De qué país es?: "))
carrera = str(input("¿Qué carrera estudió?: "))

6.2 Reflexión cognitiva

El Test de Reflexión Cognitiva o CRT (Cognitive Reflection Test) es introducido inicialmente en el estudio de Frederick como una medida de la capacidad cognitiva, en su investigación el puntaje sirve como predictivo en pruebas sobre toma de decisiones como “Expected Utility” y “Prospect Theory”.

print ("Un bate y una pelota cuestan 22 dólares en total. El bate cuesta 20 dólares más que la pelota. \n¿Cuántos dólares cuesta la pelota?")
rc1 = input("Respuesta 1: ")
print ("Si se necesitan 5 máquinas 5 minutos para hacer 5 zapatos, ¿cuántos minutos tomaría 100 máquinas hacer 100 zapatos?")
rc2 = input("Respuesta 2: ")
print ("En un lago, hay un parche de almohadillas de lirios. Todos los días, el parche duplica su tamaño. Si el parche tarda 48 días en cubrir todo el lago, ¿cuántos días tardaría el parche en cubrir la mitad del lago?")
rc3 = input("Respuesta 3: ")

  1. Cantor, D.E. and Katok, E. (2012), “Production smoothing in a serial supply chain: a laboratory investigation”, Transportation Research Part E: Logistics and Transportation Review, Vol. 48 No. 4, pp. 781-794, doi: 10.1016/j.tre.2012.01.005.

    ↩︎
  2. Williams, B.D. and Tokar, T. (2008), “A review of inventory management research in major logistics journals: themes and future”, International Journal of Logistics Management, Vol. 19 No. 2,pp. 212-232.

    ↩︎
  3. Becker-Peth, M. and Thonemann, U.W. (2018), “Behavioral inventory decisions: the newsvendor and other inventory settings”, in Donohue, K., Leider, S. and Katok, E. (Eds), The Handbook of Behavioral Operations, 1st ed., Hoboken, NJ.

    ↩︎
  4. Lurie, N. H., & Swaminathan, J. M. (2009). Is timely information always better? The effect of feedback frequency on decision making. Organizational Behavior and Human Decision Processes.

    ↩︎
  5. Hogarth, R. M., Gibbs, B. J., McKenzie, C. R., & Marquis, M. A. (1991). Learning from feedback: Exactingness and incentives. Journal of Experimental Psychology: Learning, Memory & Cognition, 17, 734–752.

    ↩︎
  6. Sterman, J. D. (1989b). Modeling managerial behavior: Misperceptions of feedback in a dynamic decision making experiment. Management Science,35, 321–339.

    ↩︎
  7. Camerer, C. (1997). Progress in behavioral game theory. Journal of Economic Perspectives, 11,167–188.

    ↩︎
  8. March, J. G. (1999). Exploration and exploitation in organizational learning. Organization Science, 2, 71–87.

    ↩︎
  9. Hogarth, R. M., Gibbs, B. J., McKenzie, C. R., & Marquis, M. A. (1991). Learning from feedback: Exactingness and incentives. Journal of Experimental Psychology: Learning, Memory & Cognition, 17, 734–752.

    ↩︎
  10. Swaminathan, J. M., & Tayur, S. R. (2003). Models for supply chains in e-business.Management Science, 49, 1387–1406.

    ↩︎
  11. Arrow, K., Harris, T., & Marschak, J. (1951). Optimal inventory policy. Econometrica, 19 (3), 250–272.

    ↩︎
  12. Adams. S.J, “Towards an understanding of inequity”, Journal of Abnormal and Social Psychology, vol.67, pp.422-436, 1963.

    ↩︎
  13. Uma Sekaran y Roger Bougie, Research methods for business: a skill-building approach, Chichester: Wiley, 2016.

    ↩︎