¡Bienvenidos, exploradores de datos! Una importante cadena de librerías nos ha contratado para analizar su catálogo digital y entender las preferencias de sus clientes. Tu misión es extraer información valiosa de su sitio web mediante técnicas de web scraping y análisis de texto.
Contexto del negocio: La librería quiere optimizar su inventario, entender qué características de los libros influyen en su popularidad y analizar la percepción de los clientes a través de sus comentarios.
Extracción de datos estructurados: Obtener información sobre precios, páginas, stock y año de publicación.
Análisis exploratorio: Visualizar distribuciones y encontrar patrones en los datos numéricos.
Análisis de texto: Procesar los comentarios de usuarios para identificar temas frecuentes y sentimientos.
Realiza web scraping de la página proporcionada para extraer:
Título del libro
Autor
Precio
Número de páginas
Stock disponible
Año de publicación
Comentarios de usuarios (texto completo) (3.5 puntos)
Guarda esta información en un DataFrame con las columnas apropiadas. (2 puntos)
Genera un histograma que muestre la distribución del stock disponible. (2 puntos)
Crea dos tablas adicionales: (2 puntos)
Top 5 de los libros más caros
Top 5 de los libros más baratos
Filtra los libros publicados a partir del año 2000 y genera una nube de palabras con los comentarios asociados a estos libros (recuerda aplicar todo el proceso de limpieza de texto). (1.5 puntos)
Realiza un análisis de sentimiento con el diccionario NRC para TODOS los comentarios, clasificándolos en emociones y sentimientos positivos/negativos. (2 puntos)
Genera visualizaciones que muestren: (2 puntos)
La distribución de emociones en los comentarios
La proporción de comentarios positivos, negativos y neutros
Investiga si existe correlación entre: (2 puntos)
Precio y valoración (rating)
Número de páginas y stock disponible
Elabora un breve informe ejecutivo con hallazgos clave y recomendaciones para la librería. (3 puntos)