📚 “Explorando el Universo Literario con Data Science”

¡Bienvenidos, exploradores de datos! Una importante cadena de librerías nos ha contratado para analizar su catálogo digital y entender las preferencias de sus clientes. Tu misión es extraer información valiosa de su sitio web mediante técnicas de web scraping y análisis de texto.

Contexto del negocio: La librería quiere optimizar su inventario, entender qué características de los libros influyen en su popularidad y analizar la percepción de los clientes a través de sus comentarios.

🎯 Objetivos específicos:

  1. Extracción de datos estructurados: Obtener información sobre precios, páginas, stock y año de publicación.

  2. Análisis exploratorio: Visualizar distribuciones y encontrar patrones en los datos numéricos.

  3. Análisis de texto: Procesar los comentarios de usuarios para identificar temas frecuentes y sentimientos.

📋 Instrucciones detalladas:

Parte 1: Web Scraping y Análisis Exploratorio

  1. Realiza web scraping de la página proporcionada para extraer:

    • Título del libro

    • Autor

    • Precio

    • Número de páginas

    • Stock disponible

    • Año de publicación

    • Comentarios de usuarios (texto completo) (3.5 puntos)

  2. Guarda esta información en un DataFrame con las columnas apropiadas. (2 puntos)

  3. Genera un histograma que muestre la distribución del stock disponible. (2 puntos)

  4. Crea dos tablas adicionales: (2 puntos)

    • Top 5 de los libros más caros

    • Top 5 de los libros más baratos

Parte 2: Procesamiento de Lenguaje Natural

  1. Filtra los libros publicados a partir del año 2000 y genera una nube de palabras con los comentarios asociados a estos libros (recuerda aplicar todo el proceso de limpieza de texto). (1.5 puntos)

  2. Realiza un análisis de sentimiento con el diccionario NRC para TODOS los comentarios, clasificándolos en emociones y sentimientos positivos/negativos. (2 puntos)

  3. Genera visualizaciones que muestren: (2 puntos)

    • La distribución de emociones en los comentarios

    • La proporción de comentarios positivos, negativos y neutros

Parte 3: Análisis Integrado

  1. Investiga si existe correlación entre: (2 puntos)

    • Precio y valoración (rating)

    • Número de páginas y stock disponible

  2. Elabora un breve informe ejecutivo con hallazgos clave y recomendaciones para la librería. (3 puntos)