Uso de Fitness Trackers y recomedaciones basada en los datos.
Google Data Analytics: Caso Final: Informe para Bellabeat
Abstract
El contenido presente consiste en el informe de presentación para el
Caso Bellabeat del curso de “Google Data Analytics” en Coursera con el
objetivo de aplicar los conocimientos obtenidos y cumplir con los
Entregables solicitados. Refiere a la empresa “Bellabeat” interesada en
evaluar datos medidos por un dispositivo datalogger de actividad física
(Activity Tracker).
Se utiliza el lenguaje ‘R’ y ‘Rmarkdown’ en Rstudio y se procede a un
conjunto de tareas de Reducción de Variables, Limpieza y Sumarización.
El código realizado para este proceso se encuentra separado del presente
informe y queda accesible en el siguiente enlace: Inspeccion
y Limpieza de Fitbit Crowd-sourced Datasets para Google Data Analytics:
Caso Final: Bellabeat
¡Bienvenido al caso práctico de análisis de datos de Bellabeat! En este caso práctico, realizarás muchas tareas del mundo real, típicas de un analista de datos júnior. Imaginarás que trabajas para Bellabeat, un fabricante de productos de alta tecnología orientados a la salud de la mujer, y conocerás a diferentes personajes y miembros del equipo. Para responder a las preguntas clave de la empresa, seguirás los pasos del proceso de análisis de datos: preguntar, preparar, procesar, analizar, compartir y actuar. En este proceso, las tablas del mapa de ruta de caso práctico, incluidas las preguntas orientativas y las tareas clave, te ayudarán a mantenerte en el camino correcto.
Al final de esta lección, tendrás un caso práctico listo para el portfolio. Descarga el paquete y consulta los detalles de este caso práctico en cualquier momento. Así, cuando empieces a buscar trabajo, tu caso práctico será una forma tangible de demostrar tus conocimientos y habilidades a los posibles empleadores
Eres un analista de datos júnior que trabaja en el equipo de analistas de marketing de Bellabeat, fabricante de productos de alta tecnología orientados a la salud de la mujer. Bellabeat es una empresa pequeña exitosa, pero tiene el potencial para convertirse en un actor más grande en el mercado global de dispositivos inteligentes. Urška Sršen, cofundadora y directora creativa de Bellabeat, cree que analizar los datos de actividad física de los dispositivos inteligentes podría desplegar nuevas oportunidades de negocio para la empresa.
Te han pedido que te concentres en uno de los productos de Bellabeat y analices los datos de los dispositivos inteligentes para conocer el uso que hacen los consumidores de sus dispositivos inteligentes. Los hallazgos que descubras ayudarán a orientar la estrategia de marketing de la empresa. Presentarás tu análisis al equipo ejecutivo de Bellabeat junto con tus recomendaciones de alto nivel para la estrategia de marketing de Bellabeat.
- Urška Sršen: Cofundadora y directora creativa de Bellabeat
- Sando Mur: Matemático y cofundador de Bellabeat, miembro clave del equipo ejecutivo de Bellabeat.
- Equipo de análisis computacional de datos de marketing de Bellabeat:
Un equipo de analistas de datos que se encarga de recopilar, analizar e informar datos que ayudan a conducir la estrategia de marketing de Bellabeat. Te incorporaste a este equipo hace seis meses y te has dedicado a conocer la misión y las metas de negocios de Bellabeat, y a ver cómo puedes ayudar a la empresa a lograr estos objetivos desde tu lugar de analista de datos júnior.
- Aplicación:
La aplicación Bellabeat proporciona a los usuarios datos de salud relacionados con su actividad física, sueño, estrés, ciclo menstrual y hábitos de conciencia plena. Estos datos pueden ayudar a los usuarios a comprender sus hábitos actuales y adoptar decisiones saludables. La aplicación Bellabeat se conecta a su línea de productos de bienestar inteligentes.
- Leaf:
Dispositivo de seguimiento clásico de bienestar de Bellabeat que se puede usar como pulsera, collar o clip. El dispositivo Leaf se conecta a la aplicación Bellabeat para hacer un seguimiento de la actividad física, el sueño y el estrés.
- Time:
Este reloj de bienestar combina el aspecto intemporal de un reloj clásico con la tecnología inteligente para hacer el seguimiento de la actividad física, el sueño y el estrés del usuario. El reloj Time se conecta a la aplicación Bellabeat para proporcionar información sobre el bienestar diario.
- Spring:
Es una botella de agua que hace el seguimiento diario del consumo de agua mediante el uso de tecnología inteligente para garantizar la hidratación adecuada a lo largo del día. La botella Spring se conecta a la aplicación Bellabeat para hacer el seguimiento de los niveles de hidratación.
- Membresía:
Bellabeat también ofrece a los usuarios un programa de membresía mediante suscripción. La membresía brinda a los usuarios un acceso 24/7 a una orientación totalmente personalizada sobre nutrición, actividad física, sueño, salud y belleza y conciencia plena según el estilo de vida y las metas del usuario.
Adicional a la información expuesta en el caso podemos agregar:
Pulseras y Relojes inteligentes pueden registrar Actividades y medir Sueño, Frecuencia cardíaca (algunos) y contar Pasos.
Por otro lado, un tipo de producto asociado y no listado es la Balanza Inteligente que consiste en más que solo registrar el peso en un smartphone. Puede medir Peso corporal y Bioimpedancia (BIA). Con ésta ultima se lograr medir la Composición corporal: Indice de grasa corporal IMC, Masa muscular, Indice de agua, Metabolismo basal, Nivel de grasa visceral y Masa ósea. Algunos de estos datos son manualmente proporcionados por los usuarios.
Urška Sršen y Sando Mur fundaron Bellabeat, una empresa de alta tecnología que fabrica productos inteligentes focalizados en el cuidado de la salud. Sršen usó su experiencia como artista para desarrollar una tecnología con un bonito diseño que informará e inspirará a las mujeres de todo el mundo. Recopilar datos sobre la actividad física, el sueño, el estrés y la salud reproductiva le ha permitido a Bellabeat proporcionar a las mujeres conocimientos sobre su propia salud y sus hábitos. Desde su fundación, en 2013, Bellabeat creció a un ritmo vertiginoso y rápidamente se posicionó como empresa de bienestar impulsada por la tecnología para las mujeres.
En 2016, Bellabeat ya había inaugurado oficinas en todo el mundo y lanzado múltiples productos. Los productos Bellabeat pasaron a estar disponibles en línea a través de un creciente número de comerciantes minoristas además del canal de comercio electrónico propio de Bellabeat en su sitio web. La empresa invirtió en medios publicitarios tradicionales, como radio, cartelería en la vía pública, prensa gráfica y televisión, pero se centra mayormente en el marketing digital. Bellabeat invierte todo el año en Google Search, mantiene activas las páginas de Facebook e Instagram e interactúa de manera constante con los consumidores en Twitter. A su vez, Bellabeat publica anuncios por video en YouTube y avisos publicitarios en Red de Display de Google para apoyar las campañas en fechas de marketing claves.
Sršen sabe que el análisis de los datos de consumo disponibles de Bellabeat revelaría nuevas oportunidades de crecimiento. Ella le pidió al equipo de análisis computacional de datos de marketing que se concentrara en un producto Bellabeat y analizara los datos de uso de dispositivos inteligentes para conocer cómo las personas están usando sus dispositivos inteligentes. Después, con esta información, le gustaría recibir recomendaciones de alto nivel sobre cómo estas tendencias pueden colaborar en la estrategia de marketing de Bellabeat.
Los productos de Bellabeat buscan diferenciarse en lo siguiente:
Sršen te pide que analices los datos de uso de los dispositivos inteligentes para saber cómo usan los consumidores los dispositivos inteligentes que no son de Bellabeat. Después, quiere que selecciones un producto Bellabeat para aplicar estos conocimientos en tu presentación.
Estas preguntas orientarán tu análisis:
- ¿Cuáles son algunas tendencias de uso de los dispositivos inteligentes?
- ¿Cómo se podrían aplicar estas tendencias a los clientes de Bellabeat?
- ¿Cómo podrían ayudar estas tendencias a influir en la estrategia de marketing de Bellabeat?
Crearás un informe con los siguientes entregables:
- Un resumen claro de la tarea empresarial
- Una descripción de todas las fuentes de datos utilizadas
- Documentación de todas las limpiezas y manipulaciones de datos
- Un resumen de tu análisis
- Visualizaciones de respaldo y hallazgos clave
- Las tres recomendaciones de contenido de alto nivel basadas en tu análisis
Sršen te alienta a que uses datos públicos que exploren los hábitos cotidianos de los usuarios de dispositivos inteligentes. Ella te señala un conjunto de datos específicos:
- Datos de seguimiento de actividad física de Fitbit (CC0: Dominio público, conjunto de datos disponibles a través de Mobius): Este conjunto de datos de Kaggle contiene el seguimiento de la actividad física personal en treinta usuarios de Fitbit. Treinta usuarios elegibles de Fitbit prestaron su consentimiento para el envío de datos personales de seguimiento que incluyen rendimiento de la actividad física en minutos, ritmo cardíaco y monitoreo del sueño. Incluye información sobre la actividad diaria, pasos y ritmo cardíaco que se puede usar para explorar los hábitos de los usuarios.
Sršen te comenta que este conjunto de datos podría tener ciertas limitaciones y te alienta a considerar la posibilidad de agregar otros datos que te ayuden a resolver esas limitaciones a medida que profundices en el trabajo con los datos.
La fuente de datos original proviene de un estudio realizado a través de la plataforma Amazon Mechanical Turk (MTurk) por parte de un equipo de RTI International y se publica en dos paquetes, mientras que en el caso solo se provee la segunda parte.
En el documento del estudio se establece que el objetivo principal del estudio es determinar la factibilidad de un método de recolección de datos biométricos voluntarios de los usuarios con la participación de una encuesta adicional, des-identificados para privacidad, y de manera completamente remota, pudiendo ser utilizados para análisis científicos, poblacionales, o de servicio médico.
Estos datasets fueron recolectados brindando una compensación de 10 USD a través de MTurk con un objetivo de 30 usuarios en el cual debieron completar voluntariamente un cuestionario que incluye la conformidad con compartirlos para todo el mundo.
Los dispositivos FitBit se conectan a su propio sistema de sincronización propio y una base de datos externa denominada Fitabase es brindada de permisos para leer dicha información durante 30 días, obteniendo así 30 días de datos retrospectivos y 30 días prospectivos.
Adicionalmente, en el estudio, se consideran las limitaciones, por ejemplo que los usuario de MTurk podrían no ser generalizables a poblaciones completas en sentido geográfico, los usuarios de MTurk están mas familiarizados con las plataformas online, por lo que tampoco podría generalizarse a poblaciones completas en sentido de edades, se requiere a los usuarios que dispongan de dispositivos FitBit para conectarse a la plataforma por lo que otros tipos de dispositivos quedan descartados, los individuos que tienen y usan este tipo dispositivos son generalmente jóvenes entre 18 y 34 años, siendo 18 el mínimo permitido para poder brindar el consentimiento.
El diseño del experimento consiste en obtener información de 30 participantes, sin embargo, 35 personas aceptaron participar, aunque algunos de ellos contienen cantidades insignificativas de datos y la mayoría contiene períodos sin registros.
Solo 13 registraron datos de peso e Indice de Masa Corporal.
Cito la tarea empresarial enunciada en el Caso.
Sršen te pide que analices los datos de uso de los dispositivos inteligentes para saber cómo usan los consumidores los dispositivos inteligentes que no son de Bellabeat. Después, quiere que selecciones un producto Bellabeat para aplicar estos conocimientos en tu presentación.
¿Cuál es el problema que se intenta resolver?
¿Cómo se puede impulsar las decisiones empresariales?
¿Quienes son los Interesados clave?
Se utilizarán los datos sugeridos disponibles en kaggle para el caso, más aquellos que provienen del mismo Estudio.
¿Dónde se almacenan tus datos?
¿Cómo están organizados los datos? ¿Están en formato largo o ancho?
¿Hay problemas con el sesgo o la credibilidad de estos datos?
Si.
Hay limitaciones consideradas en el estudio original:
Otros problemas encontrados son:
¿Tus datos son confiables, originales, integrales, actuales y
citados (ROCCC)?
Parcialmente, por motivos ya expresados, pero son los datos asignados
para el análisis.
¿Cómo verificaste la integridad de los datos?
En esta primera fase se ha observado que el conjunto de datos corresponde a series de tiempo y se observó que no todos los usuarios registraron la misma cantidad.
Adicionalmente se observa que la mayor parte de las variables presentes son un subproducto de un conjunto reducido de variables primarias obtenidas por los sensores.
Con el objetivo de reducir la cantidad de variables se realizó el siguiente conjunto de tareas:
Durante el proceso se encuentra evidencia de datos duplicados, datos faltantes y necesidad de homogeneizar el formato.
¿De qué manera te ayuda a responder tu pregunta?
La pregunta consiste en un análisis exploratorio de los datos, por lo que la respuesta depende de la experiencia del analista. Los datos proporcionados no son suficiente para poder construir un modelo de predicción de potenciales usuarios ya que solo contienen registros con sesgos y sin clasificación supervisada. Se procede entonces a inspeccionar el conjunto para realizar algunas descripciones de utilidad para el negocio.
Se utiliza el lenguaje ‘R’ y ‘Rmarkdown’ en Rstudio y se procede a realizar un proceso de Reconocimiento, Reducción de Variables y Limpieza, finalmente resultando en un conjunto que utilizado para el presente análisis.
Conjunto de indicadores de los individuos: Descargar
Segmento del conjunto total de variables originales registradas: