Projet arbre de decision Charlotte Salvador

Document Author

2020-04-26

Un arbre de décision est un outil d’aide à la décision représentant un ensemble de choix sous la forme graphique d’un arbre. Les différentes décisions possibles sont situées aux extrémités des branches, et sont atteintes en fonction de décisions prises à chaque étape. C’est l’un des plus puissant classificteur

Pour pouvoire faire ma classification par arbre je vais avoire besoin de plusieur packages :

connexion pour pouvoire recupéré les donnée du projet tutoré sur phppgadmine

fusion des tables

creation de la table accident

on se pose la question de savoire si un accidant est mortel en fonction des condition au quelle l’accidant a eu lieu . On juge de la mortalité de l’accident si oui il sont mort ou si il ne sont pas mort

selection des variables et rectification des variable

J’ai choisi les variable :

  • gravité qui sera ma variable des refererance
  • secu qui est la securité a bord du vehicule avec port de ceinture ou non port de ceinture
  • atm qui est le temps qu’il fesai dehor au moment de l’accident pluis , neige ou un temps normale
  • lum qui repprensente la lumier au moment de l’accident crepuscule nuit ou joure
  • catu qui est la perssone qui a eu l’accident quelle
  • catr qui est la route ou y a eu l’accident Autoroute , national , departemental ou communale

choix de l’echantillon d’aprentissage

construction de l’arbre

Le fichier d’apprentissage contenait 1516+172= 1688 individu

Dans la premiere feuil on peut voire qu’il y a 1516 individu qui sont en vie et 172 individu qui sont mort lors de l’accident . il est donc plus probalbre de ne pas mourire que de mourire .

La variable la plus discriminante au sens de l’indice de Gini est secu avec le port oui ou non de la ceinture . cette variable permet de partagée en deux sous fichier . on trouve a gauche port de ceinture 107 individu parmmis les 1505 qui sont mort . et on trouve a droite les perssone qui ne porté pas la ceinture et parmis elle se trouve 11 individue parmis 65 qui sont decedé .

Chaque sous fichier est encore partager par rapport a une autre variable , la plus discriminante pour lui .

En dessous du 1er sous fichier de droite on trouve la variable catr national et on voit que 4 individue parmer les 51 sont mort

Le fichier est donc classer en 10 en 11 classe .