Analyse Exploratoire des Ventes 2019

Market Intelligence — EDA Complète

Équipe Data Science: KENKOU Marê Dave Christian, SAMA FARIDA, ATTOH-AHOIN Victor, BANSAH Chekinah, AKOUNDA Abner

22 juin 2026

️ Sommaire

Partie 1 — Les Données

  • Présentation du dataset
  • Nettoyage & préparation
  • KPIs globaux

Partie 2 — Produits

  • Produits les plus vendus
  • Produits les plus rentables
  • Quantité vs CA

Partie 3 — Temporel

  • Meilleur mois + variation
  • Meilleur jour de la semaine
  • Heure idéale pour la publicité

Partie 4 — Géographie & Comportement

  • Ventes par ville & panier moyen
  • Produits achetés ensemble
  • Loi de Pareto · Saisonnalité

Partie 1 — Le Dataset

Présentation du Dataset

Colonne Type Description
Order ID ID unique Numéro unique de commande
Product Texte Nom du produit vendu
Quantity Ordered Entier Nombre d'unités commandées
Price Each Décimal Prix unitaire en dollars
Order Date Date/Heure Date et heure de la commande
Purchase Address Texte Adresse complète de livraison


12 Fichiers CSV fusionnés

186,850 Lignes brutes

185,686 Lignes après nettoyage

Jan → Déc 2019 Période couverte

Nettoyage des Données

Problèmes détectés

1,164 lignes supprimées au total

Lignes vides — séparateurs entre les fichiers CSV

En-têtes répétés — “Order ID”, “Product”… dupliqués

Types incorrects — Quantité et Prix stockés comme texte

Date non parsée — stockée comme chaîne de caractères

Solutions appliquées

filter(str_detect(..., "^\d+$")) → vrais Order ID numériques uniquement

drop_na() → suppression des lignes entièrement vides

as.numeric() → conversion Quantity et Price

mdy_hm() lubridate → parsing correct des dates

Feature Engineering → Month · Hour · Weekday · Sales · City

KPIs Globaux — Vue d’Ensemble

$34,465,538 CA Total 2019

178,437 Commandes

19 Produits différents

9 Villes


$193.15 Panier Moyen par Commande

$94,426.13 CA Moyen par Jour

️ Partie 2 — Analyse Produits

Produits les Plus Vendus (Quantité)

Figure 1

Les câbles et batteries dominent en volume — consommables à faible prix, achetés en grande quantité.

Produits les Plus Rentables (CA)

Figure 2

Macbook Pro et iPhone génèrent le plus de CA malgré un volume modéré → prix élevé = fort levier sur le CA.

Quantité vs CA — Dualité du Catalogue

Figure 3

Partie 3 — Analyse Temporelle

Meilleur Mois de Vente

Figure 4

Évolution du CA Mois par Mois (%)

Figure 5

Meilleur Jour de la Semaine

Figure 6

Heure Idéale pour la Publicité

Figure 7

Partie 4 — Géographie & Comportement

Ventes par Ville

Figure 8

San Francisco domine à la fois en CA et en quantité — priorité absolue pour la logistique et le marketing.

Panier Moyen par Ville

Figure 9

Produits Souvent Achetés Ensemble

Figure 10

Loi de Pareto — 80/20

Figure 11

Saisonnalité par Produit

Figure 12

Synthèse & Recommandations

Tableau de Bord Final

Figure 13

Recommandations Business

Stock & Approvisionnement

Commander 2× plus de stock en novembre pour le pic de décembre

Protéger le stock Macbook Pro + iPhone en priorité (80% du CA)

️ Géographie

San Francisco = ville prioritaire logistique & marketing

Los Angeles = fort potentiel de croissance (2ème en volume)

Publicité

Diffuser les ads à 10h et 18h (avant les pics d’achat)

Lancer les promos le dimanche soir pour capturer le lundi

Stratégie Produit

Créer des bundles : iPhone + Cable · Google Phone + USB-C

Recommandations automatiques basées sur les paires fréquentes

Synthèse Finale

Dimension Insight clé
Meilleur mois Décembre (+169% vs mois moyen)
Meilleur jour Mardi
Heure pub 10h–12h · 18h–21h
Ville leader San Francisco
Produit volume USB-C / Câbles / Batteries
Produit rentable Macbook Pro · iPhone
Duo fréquent iPhone + Lightning Cable
Règle Pareto ~4 produits = 80% du CA


$34,465,538 CA Total 2019

178,437 Commandes traitées

10 axes d’analyse couverts

Merci !



Des questions ?