Introductie

#Managementsamenvatting

#Introductie groep

De opdracht

Voor opdrachtgever Bright Kitchen zullen wij een onderzoek gaan houden. De hoofdvragen van het onderzoek zijn als volgt geformuleerd:

• Hoeveel orders (totaal en per restaurant) kunnen we verwachten 1, 2 en 7 dagen vooruit? Wat is de nauwkeurigheid van de voorspelling? 

• Welke variabelen hebben invloed op het aantal orders en op welke manier? 

Daarnaast hadden wij de mogelijkheid om per groep een of meerdere verdiepingsvragen te gaan onderzoeken. Er kon gekozen worden uit de volgende verdiepingsvragen:

• Voorspelling van het aantal orders per categorie (main, starter, dessert). 

• Koppelen van de dataset van vóór november (tabellen All_Orders, Items en SubItems) met de dataset ná november (tabellen PostOrders, PostItems en PostSubItems). Houd het nieuwe format aan.  

• Kun je terugkerende klanten (alleen thuisbezorgd.nl) herkennen en hun gedrag beschrijven? Zijn er gerechten die vaak nog een keer besteld door dezelfde klant worden of juist niet?  

• Hoe zijn de orders verspreid over de stad? Wat zou een goede locatie zijn voor een tweede keuken?  

• Bij welk (type) items zien we een langere pick-up time dan gebruikelijk op dit tijdstip? 

Data verzameling

De gebruikte tools: Er zijn een aantal verscheidene tools die wij gebruiken om onderstaande presentatie zo goed mogelijk te kunnen presenteren. Hieronder ziet u een overzicht van deze tools.

Het laden van de online omgeving

Deze opdracht voeren wij als studenten van de minor Data Science uit in een online omgeving zodat wij met alle studenten makkelijk bij de datasets kunnen komen en de interactie en communicatie met docenten en studenten simpeler kan verlopen.

## [1] "All_Orders"   "Items"        "PostItems"    "PostOrders"   "PostSubItems"
## [6] "SubItems"

Het inladen van de verscheidene databestanden

Voor dit project zijn er 6 databestanden vanuit de opdrachtgever beschikbaar gesteld voor de opdracht. Het zijn 3 verschillende soorten datasets waarbij iedere dataset 2 verscheidene perioden heeft. De datasets met Post ervoor is de huidige of vernieuwde situatie. De bestanden zonder Post ervoor zijn de databestanden in de oude situatie.

De bestanden zien er als volgt uit: - All_Orders en Postorders - Items en PostItems - SubItems en PostSubItems

Data schoonmaken

Het schoonmaken van data voor- en na de maand november

Als eerste gaan wij de 6 datasets terug brengen tot 3 datasets. Wij gaan dus de verouderde situatie klaarmaken om samengevoegd te worden met de vernieuwde situatie datasets. Wij hebben hiervoor gekozen om het overzichtelijker te maken om te presenteren maar ook om voorspellende variabele bij elkaar te voegen.

Orders en PostOrders

Items en PostItems

SubItems en PostSubItems

Data verwerking