<!doctype html> Portfolio - Baptiste Lashermes

2024/2025
PORTFOLIO
BAPTISTE LASHERMES
IUT d’Avignon
Contents
Presentation Personnelle
Mon Parcours Scolaire
Experience Personnelle
Le BUT Science des Données
SAE - Reporting de données à partir d’un SGBD
SAE - Préparation et synthèse d’un tableau de données
SAE - Construction et présentation d’indicateur de performance
Importance des Sciences des Données dans les Entreprises
Débouchés
Compétences développées en BUT SD
Conclusion
Presentation Personnelle
Mon Parcours Scolaire
Le lycée
J’ai obtenu mon baccalauréat mention Assez Bien au lycée Philippe Lamour de Nîmes avec les spécialités maths et NSI ( Numérique et Sciences Informatiques). Après mon bac, vu que l’informatique me plaisait bien et sans trop d’idée de quoi faire plus tard, je suis parti en BUT Informatique au Puy-En-Velay.
Première année de BUT Informatique
Durant cette année, j’ai pu découvrir plusieurs aspects de l’informatique, notamment le développement avec différents langages, les bases de données, ainsi que la modélisation 3D. Grâce aux compétences acquises, j’ai pu réaliser mon projet de fin d’année : un jeu autour de Martin Luther King, retraçant son parcours et son combat pour les droits civiques.

Ce projet m’a beaucoup plu, tout comme la création de mon premier portfolio, qui m’a permis de mettre en valeur mon travail. Cependant, au fil de l’année, je me suis rendu compte que le développement pur occupait une place trop importante dans la formation et que les mathématiques me manquaient.

C’est pour ça que j’ai pris la décision de changer de formation, et de venir en BUT science des données.
Première année de BUT Science des Données
Aujourd’hui, après une année dans la formation, je suis content de mon choix d’avoir changé et je trouve que cette formation me correspond plus.
Experience Personnelle
Le sport
Le sport a toujours occupé une place importante dans ma vie. Depuis mon enfance, j’ai régulièrement pratiqué différents sports. J’ai notamment fait 9 ans de natation, qui m’a appris la rigueur, la persévérance et le dépassement de soi. Par la suite, je me suis tourné vers le handball, que j’ai pratiqué pendant 7 ans. Ce sport collectif m’a beaucoup apporté en matière de travail d’équipe, de communication, et aussi de dépassement de soi. Au lycée, je participais également à l’UNSS (Union Nationale du Sport Scolaire) en jouant au badminton et au volley-ball le midi. L’année dernière, lors de ma première année de BUT Informatique, j’ai continué le volley grâce à une organisation interne à l’université. Cette année, en BUT SD, j’ai repris le handball via l’université. Ces expériences sportives ont renforcé chez moi des qualités comme l’esprit d’équipe, la discipline, l’endurance mentale et le goût de l’effort, que je retrouve aujourd’hui dans ma façon d’aborder les études et les projets en groupe.
Job étudiant et membres d’une d’association
L’année dernière, en plus de ma formation, j’ai rejoint le BDE ASCII de mon IUT, où je participais à l’organisation d’événements pour les étudiants. Par exemple, on a organisé une sortie au Parc Le Pal, qui est à la fois un parc d’attractions et un parc animalier. Cette expérience m’a permis de développer des compétences comme la gestion de projet et la communication, notamment lors des réunions pour préparer les événements.

En plus de ça, chaque été, je travaille, notamment au CHU de Nîmes ou aux archives départementales. Ces jobs m’ont appris à être rigoureux et m’ont permis de découvrir le fonctionnement du monde professionnel.
Le BUT Science des Données
Preparation
Le BUT Science des Données a pour objectif de nous préparer dans l’analyse de données que ce soit mathématiques et informatique. Elle nous aide à développer des compétences techniques en SQL, R, Python mais aussi des compétences plus humaines telles que la communication écrite ou orale. Toutes ces compétences sont essentielles pour notre avenir professionnel..
Le BUT SD, une formation professionalisante
Le BUT Science des Données est une formation professionnalisante de trois ans en IUT. Il prépare aux métiers liés aux statistiques, probabilités et analyse de données, avec un équilibre entre théorie et pratique.

La formation repose sur trois axes principaux :

Traiter : Cette étape consiste à récupérer des données, par exemple depuis des fichiers fournis par l’INSEE ou à partir d’une base de données mise à notre disposition. Ensuite, il faut nettoyer les données. Par exemple, un fichier peut contenir des lignes quasiment vides (à 90 %), qui ne sont pas utiles et qu’on doit donc supprimer. Parfois, quand on sélectionne les données dans une base, il faut aussi choisir les bonnes informations, celles qui nous seront vraiment utiles pour l’analyse. Une fois ces étapes terminées, on peut passer à l’analyse des données, à l’aide d’outils comme R ou Excel. Ces logiciels permettent notamment de visualiser les données et de créer des graphiques pour mieux repérer les tendances ou les relations entre les variables.

Analyser : Une fois que les données sont propres et utilisables, on peut commencer à les analyser d’un point de vue mathématique. Pour cela, on utilise différents outils statistiques comme la moyenne, l’écart-type ou encore la variance, qui permettent de décrire et de mieux comprendre les données.On peut aussi repérer des tendances grâce à des méthodes comme la régression linéaire.Avec tous ces outils, on est capable de faire des prévisions ou de mieux interpréter les chiffres selon le contexte.

Valoriser les données : Une fois les graphiques créés et les analyses réalisées, il est essentiel de savoir présenter son travail. Cette compétence repose sur la communication, aussi bien à l’écrit qu’à l’oral, en français mais aussi en anglais. L’objectif est de réussir à expliquer clairement ses résultats, que ce soit à un public technique ou non. Pour cela, il faut parfois adapter son langage : tout le monde ne comprend pas le vocabulaire statistique ou informatique, donc il faut savoir vulgariser les choses quand c’est nécessaire. On développe aussi des connaissances en économie et en culture générale, ce qui permet de replacer les données dans leur contexte, un point souvent crucial pour bien les analyser et en tirer des conclusions pertinentes.

En parallèle de ces 3 axes, on développe à chaque fois des compétences dans les travaux
Débouchés et poursuite d’études
Pour ce qui est des débouchés et de la poursuite d’études, plusieurs possibilités s’offrent à nous après les trois années de BUT. Il est possible d’accéder à des formations de type master, notamment en statistiques, en informatique ou en science des données. On peut également intégrer des écoles d’ingénieurs comme les Mines de Saint-Étienne, l’INRAE ou encore l’ENSAI, qui est spécialisée en analyse de données.

La formation étant professionnalisante, il est aussi tout à fait envisageable d’entrer directement sur le marché du travail, grâce aux compétences techniques et pratiques acquises tout au long du parcours.

Analyse des SAE (Situation d’Aprentissage et d’Evaluation)
SAE - Reporting de données à partir d’un SGBD
Résumé
Dans cette SAE, l’objectif était d’extraire un jeu de données d’une base de données PostreSQL en lien avec une problématique qu’on avait. Après avoir récuperer ce jeu de données, le but était de l’analyser et de pouvoir intérpreter ces données afin de pouvoir en tirer des conclusions et restituer ces conclusions sous la forme d’un rapport
Actions menées
Analyse du besoin : Pour ce projet, on devait analyser les ménages et les secteurs de moins de 10000 habitants dans la région AURA (Auvergne Rhône-Alpes) et plus précisément leur dépenses, en regardant dans quels catégorie de produits ils ont dépensés le plus d’argent. Finalement, l’objectif final était de rendre un rapport.

Conception et préparation : Avant de passer a l’analyse, on a du étudier la base de données pour déterminer les tables qui nous intéressaient, quels étaient les colonnes les plus pertinentes par rapport a notre problématique. Une fois cette étape fini, on a pu écrire une requête SQL pour sélectionner les infos qui donc nous intéressaient.
Outils utilisés
Selection des données avec PgAdmin et du SQL pour récuperer les données
Export du résultat de la requête sous la forme d’un fichier CSV.
Analyse des données récupérees a l’aide de LibreOffice CALC
Création de graphique avec LibreOffice CALC
Redaction du rapport final avec google doc
Moyens mis a disposition
Pour tout ce qui est matériel, on avait accès à l’IUT à des salles avec ordinateurs, pour pouvoir travailler avec les logiciels nécessaires installés dessus. Pour ce qui est immatériel, ce sont les serveurs qui nous ont permis l’accès à la base de données.

Au niveau de l’encadrement, on a eu des séances dédiées avec la prof pour avancer, avec un suivi entre les séances et la possibilité de lui poser des questions par mail si nécessaire.

Dans les moyens mis à disposition pour réussir la partie technique, on a eu des cours de base de données et de SQL, afin de pouvoir récupérer les données. On a aussi eu des cours de tableur, qui nous ont aidés à réaliser les graphiques et à faire des analyses tout au long de l’année.
Ressources mobilisées
Savoir
Pour le savoir, on a utilisé tout ce qu’on a appris en cours, tout les cours vu en base de données ou en tableur nous ont été utiles. Le seul point négatif c’est qu’on a pas eu de conseil sur la rédaction du rapport part les autres prof et on a du chercher de nous même comment faire un bon rapport.

Savoir-Faire
Pour ce qui est du savoir faire, on a du écrire une fonction SQL qui répondait bien a la problématique, et pour le tableur, on a utilisé plusieurs fonctions.

Savoir-être
Vu que c’était un travail en groupe, on a du faire preuve de savoir être pour bien communiquer, bien travailler ensemble et pouvoir avancer sur le projet de façon efficace. On a aussi du s’organiser pour travailler en dehors des heures de cours ensemble pour ne pas prendre de retard et devoir tout faire au dernier moment.
Résultats obtenus
pour le livrable, on avait :

Une requête SQL pour récuperer le jeu de données selon la demande qu’on avait

Le jeu de données Excel, avec dessus les graphiques réalisés, les tableaux croisés dynamiques fait et des analyses faite sur la colonne des dépenses.

Un PDF avec l’analyse des graphiques crées.

Exemple de graphique réalise :

Figure 1: Graphique
Compétence développée
J’ai développé des compétences en informatique et en développement, en esprit d’analyse mais surtout en travail d’équipe et en gestion de temps et de projet.
Compétence Spécifique Développées
J’ai appris a écrire une requête SQL pour récuperer précisement un jeu de données parmis toute une base de données.
SAE - Préparation et synthèse d’un tableau de données
Résumé
Dans cette SAE nous avons comparé les transactions immobilières entre deux villes qui sont Cannes et La Rochelle, deux villes côtiéres. L’objectif de cette SAE c’était d’identifier les biens les plus chers et les moins chers et d’étudier le rapport entre le prix du mètre carré et la surface du logement. A la fin, nous avons rendu un rapport qui fait part de nos analyses et de nos représentations graphiques.
Actions menées
Analyse du besoin : Dans cette SAE, on devait choisir deux villes, ou deux arrondissements pour pouvoir les analyser au niveau des transactions immobilières. Il a donc fallu trouver deux villes à analyser qui avaient du sens, c’est pour ça qu’on a choisi une ville qui est vers la méditerranée et une ville plus proche de l’océan atlantique.

Conception et préparation : Pour commencer, on a récuperer un jeu de données avec toute les villes et arrondissements de France. Ensuite on fait ce qu’on appelle un “nettoyage des données”. Ce qu’il se passe c’est que certaine colonnes sont vides a 90% et donc inutile a l’analyse il a donc fallu les supprimer. Une fois tout ça terminé, on a filtrer les données pour ne garder que les villes qui nous intéressaient et on a crée une variable “Prix au m2” car c’est la chose la plus importante a analyser. Une fois tout ça fini on a pu commencer l’analyse.

Mise en oeuvre technique : Filtrage des données avec R, création de script R pour analyser des données et les nettoyer, création de graphique comme des boxplots, des nuages de point ou des histogrammes pour pouvoir visualiser.

Figure 2: Graphique2
Outils utilisés
Rstudio : Nettoyage et préparation des données utiles a notre étude.
Google Doc : Rédaction du Rapport
Moyens mis a disposition
Pour tout ce qui est matériel, on avait accès à l’IUT à des salles avec ordinateurs, pour pouvoir travailler avec les logiciels nécessaires installés dessus. Pour ce qui est immatériel, ce sont les serveurs qui nous ont permis l’accès à la base de données.

Au niveau de l’encadrement, on a eu des séances dédiées avec la prof pour avancer, avec un suivi entre les séances et la possibilité de lui poser des questions par mail si nécessaire.

Dans les moyens mis à disposition pour réussir la partie technique, on a eu des cours de R pour pouvoir récuperer analyser et nettoyer les données, créer des graphiques.
Ressources mobilisées
Savoir
Pour le savoir, on a utilisé tout ce qu’on a appris en cours, tout les cours vu avec les profs ou on utilisait R nous ont été utiles.

Savoir-Faire
Pour ce qui est du savoir faire, on a du écrire du code R pour pouvoir bien analyser et bien préparer les données avant de commencer les analyses.

Figure 3: Graphique3

Savoir-être
Vu que c’était un travail en groupe, on a du faire preuve de savoir être pour bien communiquer, bien travailler ensemble et pouvoir avancer sur le projet de façon efficace. On a aussi du s’organiser pour travailler en dehors des heures de cours ensemble pour ne pas prendre de retard et devoir tout faire au dernier moment.
Résultats obtenus
En livrable on avait :

Un script R qui détaille comment on a nettoyer nos données et créer nos graphiques.

Un rapport écrit qui explique le résultat de nos recherches.
Compétence Spécifique Développées
J’ai appris a nettoyer un grand jeu de données et a garder que les informations qui m’intéresse
SAE - Construction et présentation d’indicateur de performance
Résumé
Dans cette SAE, nous avons travaillé sur l’analyse de la performance de l’entreprise Genoyer entre 2010 et 2015. L’objectif, c’était de comprendre comment les événements qui peuvent se passer dans le monde peuvent impacter positivement ou négativement le résultat d’une entreprise. Pour cela, on a analysé les données économiques de cette entreprise sur plusieurs années pour voir l’évolution à travers plusieurs indicateurs.
Actions menées
Analyse du besoin : Dans cette SAE, on a remis des données dans leur contexte, dans le contexte économique mondial, pour pouvoir comprendre ce qui s’était passé.

Conception et préparation : On a donc commencé à rentrer les données dans un DataFrame R, une sorte de tableau, pour pouvoir commencer à créer des graphiques sur les données disponibles (chiffre d’affaires, résultat net).

Mise en œuvre technique : création de DataFrames R pour analyser les données, création de graphiques pour pouvoir les analyser, recherches sur Google d’informations sur un possible contexte mondial qui pouvait expliquer certaines choses, à l’aide d’articles de journaux ou d’informations de l’INSEE. On a finalement écrit un rapport pour expliquer le fruit de notre travail et de nos recherches.

Figure 4: Graphique4
Outils utilisés
RStudio pour la création de dataframe et de graphique

Google Doc pour la création d’un rapport

Google pour la recherche d’information sur le contexte de l’époque / Source économique comme l’INSEE ou la Banque Centrale Européenne

Figure 5: Graphique5
Moyens mis a disposition
Accès aux ordinateurs de l’IUT et aux serveurs pour avancer sur le projet. Données fournies pour pouvoir les analyser. Au niveau de l’encadrement, on a eu des séances dédiées avec la prof pour avancer, avec un suivi entre les séances et la possibilité de lui poser des questions par mail si nécessaire. On a aussi utilisé nos connaissances apprises en cours de Découverte des Données Économiques et Écologiques (DDEE) et nos cours de datavisualisation pour créer des graphiques plus poussés.
Ressources mobilisées
Savoir
J’ai pu réutiliser les connaissances que j’ai acquises en cours de DDEE sur les indicateurs importants pour une entreprise et ce qu’il fallait analyser. J’ai aussi consulté des ressources extérieures comme des journaux ou des rapports de ministères/instituts.

Savoir faire
J’ai utilisé R pour importer les données, créer des graphiques et les analyser. J’ai aussi appris à faire un lien entre les résultats d’une entreprise et ce qui pouvait se passer dans le monde. J’ai aussi créé un rapport qui résume tout ça.

Savoir être
Vu que c’était un travail en groupe, on a dû faire preuve de savoir-être pour bien communiquer, bien travailler ensemble et pouvoir avancer sur le projet de façon efficace. On a aussi dû s’organiser pour travailler en dehors des heures de cours ensemble, pour ne pas prendre de retard et devoir tout faire au dernier moment.
Résultats obtenus
Pour le livrable on avait :

Un rapport détaillé avec des graphiques et des informations sur l’entreprises ainsi qu’une présentation orale pour présenter notre recherche a nos camarades.
Compétence Spécifique Développées
J’ai appris a faire des recherches sur un sujet précis pour pouvoir créer un lien entre des données et des événements dans le monde.
Importance des Sciences des Données dans les Entreprises
La science des données et de nos jours très importante pour les entreprises. En effet les entreprises collectent et produisent des quantités énormes de données et il faut des gens pour analyser ces données, et c’est pour ça que la science des données joue un rôle aussi important pour les entreprises. Grâce a notre capaciter a analyser les données et a leur donner du sens, on peux donner une avantage a un entreprise si on parle du domaine marketing. Les entreprises ont donc besoin de personnes capables de faire ça et ça tommbe bien c’est a ça que nous forme le BUT SD.
Débouchés
Après un BUT Science Des Données, on peux faire plusieurs choses, voici un tableau récapitulatif :
Domaine Exemple
Poursuites d’études Master en Data Science / Statistiques
Poursuites d’études Écoles d’ingénieurs (ENSAI, Mines, INRAE)
Insertion professionnelle Data Analyst
Insertion professionnelle Chargé d’études statistiques
Insertion professionnelle Développeur Base de Données
Compétences développées en BUT SD
Compétences techniques
J’ai appris à manipuler des données, à les nettoyer, les exploiter, les intégrer, voire même à en créer. J’ai fait ça de plusieurs manières différentes, à l’aide d’une base de données en SQL ou avec le logiciel R. Ensuite, j’ai appris à les analyser, à faire des graphiques et à les interpréter. J’ai développé des compétences importantes en datavisualisation, ce qui m’a permis de mieux comprendre les résultats et de les rendre plus lisibles et plus parlants.
Compétences transversales
Les travaux en groupe m’ont appris à bien communiquer avec les membres de mon équipe, à travailler efficacement ensemble et à savoir organiser notre travail collectivement. Toujours dans le domaine de la communication, j’ai appris à rédiger de bons rapports pour présenter clairement le fruit de mes recherches, et j’ai aussi développé des compétences en communication orale pour exposer mes analyses devant toute la classe. Ces compétences me seront très utiles plus tard, car elles sont essentielles dans le monde professionnel, notamment en entreprise où le travail d’équipe et la capacité à s’exprimer clairement sont indispensables.
Compétences personnelles
Finalement, j’ai appris à mieux m’organiser. Les SAE s’étalaient souvent sur plusieurs mois, et il fallait que je planifie mon travail pour ne pas tout faire au dernier moment. J’ai aussi appris à avoir un regard critique sur ce que je produis, à repérer ce qui pouvait être amélioré, et à faire les modifications nécessaires pour rendre un travail meilleur.
Conclusion
En conclusion cette première année a été très formatrice, j’ai bien évolué que ce soit sur le plan personnel ou professionnel. Ce portfolio ma permis de faire une sorte d’état des lieux de mon année et de tout ce que j’avais accompli.