Bienvenue sur le projet Missions DATA menĂ© dans le cadre de la formation Data Analyst avec la Wild Code School. Cette initiative est une mĂ©thodologie dâapprentissage, conçue pour se concentrer sur les besoins mĂ©tiers tout en combinant rĂŽle-play, analyse de donnĂ©es, et interaction client. Voici une prĂ©sentation complĂšte de la dĂ©marche et des rĂ©sultats obtenus dans le cadre de notre mission.
Voici les principales étapes :
- Choix du Dataset : Chaque Ă©lĂšve sĂ©lectionne un jeu de donnĂ©es pertinent via Kaggle, Data.gouv.fr ou d'autres sources. Ce dataset doit permettre une Ă©tude complĂšte mais ĂȘtre modĂ©rĂ©ment complexe en termes de nettoyage.
- Validation et Brief Client : Une fois le dataset validé par le formateur, l'élÚve prépare un Brief Client fictif comportant :
- Nom et description du client
- Nature de la mission
- Livrables attendus
- Mission DATA : Le formateur organise des sessions sur deux jours, impliquant des interactions entre binÎmes élÚves en rÎles de Client et Data Analyst.
- JOUR 0 : Présentation de la Mission
- Introduction par le formateur.
- Choix des datasets.
- Formation des binĂŽmes Client/Data Analyst.
- JOUR 1 : Brief Client
- Rencontre initiale entre Client et Data Analyst (échange sur le projet, collecte des besoins).
- JOUR 2 : Retour Client
- PremiÚre ébauche présentée au Client, retour constructif.
- JOUR 2 : Présentation finale
- Livrable final présenté en fin de journée.
Ce projet consiste à analyser un jeu de données de ventes pour E-Shop Solutions, un détaillant en ligne basé au Royaume-Uni, spécialisé dans les cadeaux uniques pour diverses occasions. Le jeu de données couvre toutes les transactions du 1er décembre 2010 au 9 décembre 2011 et offre une vue transnationale des activités de vente. L'analyse visait à fournir des informations sur les performances de l'entreprise et le comportement des clients, avec un accent particulier sur les clients en gros.
- Nettoyage des données et analyse exploratoire (EDA) : Une étude approfondie du jeu de données pour découvrir des motifs, des valeurs aberrantes et des tendances.
- Tableau de bord interactif Power BI : Un tableau de bord convivial et esthétique permettant aux parties prenantes d'explorer les résultats de maniÚre dynamique.
- Source : Transactions d'E-Shop Solutions. Lien Kaggle
- Période : Du 1er décembre 2010 au 9 décembre 2011.
- Contenu :
- Données transactionnelles des ventes en ligne.
- Attributs inclus : InvoiceNo, StockCode, Description, Quantity, InvoiceDate, UnitPrice, CustomerID, et Country.
Remarque : Le jeu de données nécessitait un prétraitement important pour traiter les valeurs manquantes, les valeurs aberrantes et les incohérences.
- Traitement des IDs clients manquants en les supprimant ou en les imputant selon le contexte.
- Suppression des doublons pour assurer lâintĂ©gritĂ© des donnĂ©es.
- Gestion des valeurs aberrantes dans les colonnes Quantity et UnitPrice.
- Standardisation des formats de texte pour les descriptions de produits.
- Investigation :
- Produits et catégories les plus vendus.
- Tendances des revenus mensuels.
- Répartition des ventes par pays.
- Identification des indicateurs clés de performance (KPI) tels que :
- Revenu Total
- Valeur Moyenne des Commandes (AOV)
- Métriques de Fidélisation Client
CrĂ©ation dâun tableau de bord interactif Power BI comprenant :
- Répartition des revenus par produit, mois et pays.
- Segmentation des clients en gros et au détail.
- Visualisations mettant en évidence :
- Les tendances des ventes.
- Les clients Ă forte valeur.
- Les performances des stocks.
- Python : Pour le prĂ©traitement des donnĂ©es et lâEDA en utilisant des bibliothĂšques telles que Pandas, NumPy, Matplotlib et Seaborn.
- Power BI : Pour créer le tableau de bord interactif.
- Jupyter Notebook : Pour documenter le processus de nettoyage et dâanalyse.
- Git & GitHub : ContrĂŽle de version et partage du projet.
- Produits les plus vendus : Mise en évidence des articles les plus populaires générant des revenus.
- Tendances saisonniĂšres : DĂ©tection des pics pendant les pĂ©riodes de fĂȘtes.
- Répartition des clients : Les clients basés au Royaume-Uni ont contribué à la majorité des revenus, avec une participation significative des clients en gros.
- Anomalies : Identification des commandes annulées ou partiellement réalisées ayant un impact sur les revenus.
Une capture du tableau de bord Power BI inclut :
- Revenus par mois et par pays.
- Filtres interactifs pour une analyse détaillée.
- Meilleurs produits et leurs tendances de vente.
Pour une vue détaillée, veuillez consulter le fichier Power BI.
- Clonez le dépÎt :
git clone https://github.com/your-username/e-shop-solutions-sales-analysis.git
- Installez les bibliothĂšques Python requises :
pip install -r requirements.txt
- Lancez le notebook Jupyter pour lâEDA :
jupyter notebook sales_analysis.ipynb
- Ouvrez le fichier Power BI (
E-Shop_Dashboard.pbix) pour une exploration interactive.
đ E-Shop-Solutions-main
âââ đ dashboard
â âââ E-Shop_Dashboard.pbix
âââ đ data
â âââ data_clean.csv
â âââ data.csv
âââ đ notebooks
â âââ sales_analysis.ipynb
âââ README.md
âââ requirements.txt
Pour toute question ou opportunitĂ© de collaboration, nâhĂ©sitez pas Ă me contacter :
