Les données soumisent à notre étude émanent de ma plateforme de discussion whatsapp, plus précisément du groupe de discussion qui réunit mes frères et moi.
Les données brutes sont des données sur lequelles aucune transformation n’a été effectuée.
Les données brutes ci-dessus comporte 6 colonnes que sont :
time : le temps depuis le début des conversations jusqu’à présent,
authors : il s’agit des utilisateurs de whatsapp, exemple : dans ce cas Tess et Moi. Il peut aussi s’agir d’un groupe whatsapp,
text : la colonne text enregistre tous les messages que interlocuteurs se sont écris,
source : cette colonne renvoie le nom du document qui contient les données brutes,
emoji : enregistre tous les emojis envoyés lors des discussions,
emoji_name : enregistre les noms de chaque emojis envoyé.
Les données nettoyées ont subi certaines transformations visant à rendre les données plus lisible et utilisable.
Pour nettoyer nos données, nous avons effectué les tâches suivantes :
rendre les noms des utilisateurs lisibles,
supprimer les valeurs manquates,
supprimer les colonnes dont nous avons pas besoin,
ajouter de nouvelles colonnes
supprimer la punctuation, les nombres, les espaces et autres choses inutiles pour notre analyse.
Dans le tableau ci-dessous nous avons réduit le nombre de variables.
Notre analyse consistera à faire parler les données issues des conversations whatsapp afin de comprendre les informations qu’elles renferment.
Le graphique ci-dessous montre la fréquence des discussions journalière. J’ai répartis les conversations sur quatre semestres dans la période 2022-2024.
Graphique 1 : Fréquence des chats entre 2023-2024
Le graphique ci-dessus met en évidence la fréquence des conversations dans le groupe des frères.
Il est visible que la fréquence de nos conversations est élévé au début de la première période, précisément dans la période d’avril 2022. En effet, on s’écrivait plus 40 messages par jour.
Entre avril 2022 et avril 2023, la fréquence de nos conversations est régulière avec quelques variations plus ou moins fortes.
Cependant, la période la plus marquante se situe entre juillet 2023 et janvier 2024. Nous sommes à la quatrième période, la fréquence de nos conversations est nulle, en gros, nous n’avons presque pas eu de conversations.
Quel jour de la semaine écrivons-nous le plus ?
Le tableau suivant met en évidence les jours de la semaine dans lesquels on discute plus.
On aperçoit à l’aide du tableau ci-dessus qu’on s’écrit le plus le mardi, le mercredi, et le lundi. Le reste de jours on s’écrit moins.
Le graphique. suivant expose encore mieux cette conclusion.
Graphique 2 : Fréquence des chats hebdomadaire
En fait, comme nous l’avons mentionné, ce graphique étaye les informations du tableau 2. En effet, nous discutons davantage le mardi, le mercredi, et le lundi.
Le tableau qui suit révèle le nombre de messages écrit par chaque utilisateur.
On peut observer quelle personne écrit plus. On constate que :
Parker a écrit 1113 messages;
Veny a écrit 385 messages;
Denson a écrit 374 messages;
Elbert a écrit 206 messages.
Vérifions ces informations à l’aide d’un graphique en camembert.
Graphique 3 : Part des messages par utilisateur
En pourcentage, la part des messages par utilisateur est :
Parker a écrit 50.3 % de messages écrits,
Elbert a écrit 9% de messages écrits,
Denon a écrit 18% de messages écrits,
Veny a écrit 18.4% de messages écrits.
A quelle heure chatons-nous le plus ?
Ici, nous désirons connaitre la tranche d’heure dans laquelle nous discutons le plus.
Aidons-nous d’un graphique pour voir clairement.
Graphique 4 : Fréquence de messages par heure
On constate que la tranche horaire dans laquelle nous discutons le plus se situe entre 20h et 22h. En fait, avant et après cette plage horaire, on discute moins.
En réalité pour être plus précis, l’heure à laquelle on discute le plus est 21h. Nos conversations peuvent aller au-delà de 200 messages.
Les messages whatsapp s’accompgnent souvent de logogrammes généralement appelés d’émojis.
Dans cette section, nous allons mettre en évidence les émojis les plus utlisés par chaque utlisiteurs.
Nous montrerons d’abord, les émojis que chaque utilisateurs aime utiliser. Ensuite, nous verrons les noms de ces émojis.
Le graphique 5 montre les six (6) émojis les plus utilisés par chaque utilisateur.
Graphique 5: Emojis préférés par chaque utilisateur
On peut aisement constater que nos préférence en termes d’émojis ne sont pas très éloignées. On a en commun quelque émojis.
Après avoir montré les émojis les plus utlisés, donnons désormais leurs noms.
En fait, nous avons l’habitude d’utiliser les émojis sans connaitre leurs noms. Ici, nous allons vous révéler les noms des émojis les plus utlisés par chaque utilisateur.
## Selecting by n
Graphique 7 : Noms des émojis préférés par chaque utilisateur
Voici les noms et les émojis préférés (maximum 2 émojis) par chaque utilisateur.
A partir du graphique, on peut conclure que :
Parker préfère utiliser clapping hands : medium skin tone 👏 et man dancing : skin tone 🕺
Elbert préfère utiliser face with tears 😂 et smiling face with heart-eyes 😍
Denson utilise préfère utiliser red heart ❤️ et face with tears of joy 😂
Moi (Veny) préfère utiliser check mark button ✅ et rose 🌹
A l’exemple de l’analyse sur les émojis, nous analyserons les mots.
Nous désirons également savoir les mots que nous utilisons le plus dans nos conversations.
Graphique 8 : Mots les plus utilisés
Les 4 mots les plus utilisés dans nos conversations sont : Merci, dieu, amen, bien. Ces mots ont été utilisés plus 60 fois.
Graphique 9 : Les 5 motsles plus utilisés par chaque utilisateur
Sur le nuage, les mot les plus utilisés sont au milieu et sont en plus grand caractère. Ensuite, les mots moyennement utilisés viennent juste après. Enfin, les mots les moins utilisés sont aux extrémités du nuage.
merci, dieu, amen et bien, sont les mots les plus utilisés lors de nos conversation. Ils se situent au centre du nuage.
Les mots les moins utilisés sont aux extrêmités du nuage.
Analysons maintenant les sentiments et les émotions qui se dégagent de nos discutions. En fait, à partir du type de mots que nous utilisons dans nos messages, nous pouvons voir le types de sentiments les plus manifestes.
Le tableau suivant resume l’ensemble des sentiments qui se dégagent de nos conversations. Ce tableau se compose des sentiments négatif d’une part, et des sentiments positifs d’autres part.
Note : dans la table ci-dessous,
0 si un mot n’a aucun lien avec un sentiment,
1 ou plus (2,3,4,5, etc.) si un mot a un lien avec un sentiment et est utilisé plusieurs fois.
Les cellules colorées en bleu indiquent la présence d’un mot en lien avec le sentiment qui s’affiche à l’entête de la colonne. On peut voir à peu prêt que les mots qu’on utilise le plus dans nos conversations sont plus positifs que négatifs.
On constate avec plaisir que nos conversations ont une portée très positive, avec plusieurs expressions liées à l’espoir. Il y a cependant également des sentiment négatifs, mais ils ne prédominent pas dans nos discussions.
Graphique 10 : Les sentiments les plus fréquents
Dans nos conversations, il y a beaucoup d’expressions positives, d’espérance, et moins de négativité. C’est bon à savoir.
Au terme de notre analyse, on peut conclure que notre analyse avait pour objet de faire un état des lieux des données émanant de conversations du réseau social whatsapp, précisément de mon groupe de discussions avec mes frères.
Nous avons fait une analyse descriptive de base ou introductive permettant de comprendre les informations contenues des données texte, en l’occurence des discussions. Nous avons su nettoyer, ordonner, analyser et comprendre les liens et modèles existant dans nos nos données.
Par ailleurs, d’autres études peuvent faire appelle à cette analyses de premier plan pour aller plus loin. En effet, elles pourraient en faire la continuité en s’orientant vers le diagnostic, la prédiction et la prescription selon les besoins et les domaines.