1) Présentation des données

Les données de notre étude émanent de ma plateforme de discussion whatsapp, de mes conversations whatsapp avec mon amie Tess.

a) Données Brutes

Les données brutes sont des données sur lequelles aucune transformation n’a été effectuée.

Ci-dessous une image de nos données brutes.

Données brutes
Données brutes

Les données brutes ci-dessus comporte 6 colonnes que sont :

  • time : le temps depuis le début des conversations jusqu’à présent,

  • authors : il s’agit des utilisateurs de whatsapp, exemple : dans ce cas Tess et Moi. Il peut aussi s’agir d’un groupe whatsapp,

  • text : la colonne text enregistre tous les messages que interlocuteurs se sont écris,

  • source : cette colonne renvoie le nom du document qui contient les données brutes,

  • emoji : enregistre tous les emojis envoyés lors des discussions,

  • emoji_name : enregistre les noms de chaque emojis envoyé.

b) Données nettoyées

Les données nettoyées ont subi certaines transformations visant à rendre les données plus lisible et utilisable.

Pour nettoyer nos données, nous avons effectué les tâches suivantes :

  • rendre les noms des utilisateurs lisibles,

  • supprimer les valeurs manquates,

  • supprimer les variables dont nous avons pas besoin,

  • ajouter de nouvelles colonnes,

  • supprimer la punctuation, les nombres, les espaces et autres choses inutiles pour notre analyse.

Données nettoyées et rangées
Données nettoyées et rangées

Dans le tableau ci-dessous nous avons réduit le nombre de variables .

2) Analyse des Données

Notre analyse consistera à faire parler les données afin de comprendre les informations qu’elles renferment.

A) Fréquence des chats

a) Fréquence des chats entre 2023 et 2024

Le graphique suivant montre la fréquence des discussions journalière entre Rachel et moi.

**Graphique 1** : Fréquence des chats entre 2023-2024

Graphique 1 : Fréquence des chats entre 2023-2024

La fréquence des discussions whatsapp entre Rachel et Moi est très faible entre la première (1) et la seconde (2) période [entre septembre 2022 et mai 2023]. Cependant, à partir de la troisème (3) période [juillet 2023], nos discussions ont connu une courte forte évolution. Par la suite, la fréquence de nos conversations est très variable.

b) Fréquence des chats par semaine

Quel jour de la semaine écrivons-nous le plus ?

Le tableau suivant met en évidence les jours de la semaine dans lesquels Rachel et moi on discute plus.

On aperçoit à l’aide du tableau ci-dessus qu’on s’écrit le plus le vendredi, le mercredi, et le mardi. Le reste de jours on s’écrit moins.

Le graphique suivant rend les choses visibles.

**Graphique 2** : Fréquence des chats hebdomadaire

Graphique 2 : Fréquence des chats hebdomadaire

En fait, comme nous l’avons mentionné, ce graphique étaye les informations du tableau 2. En effet, nous discutons davantage le vendredi, le mercredi, et le mardi.

c) Nombre de chats par utilisateur

Le tableau qui suit révèle le nombre de messages écrit par chaque utilisateur.

On peut observer quelle personne écrit plus. On constate que :

  • J’ai (Vincent) a écrit 1608 messages

  • Rachel a écrit 1387 messages.

J’ai écrit 200 messages de plus que Rachel.

Vérifions ces informations à l’aide d’un graphique.

Graphique 3 : Part des messages par utilisateur

En pourcentage, la part des messages par utilisateur est :

  • J’ai (Vincent) a écrit 53.7 % de messages,

  • Tess a écrit 46,3% de messages.

d) Fréquence des messages par heure

A quelle heure chatons-nous le plus ?

Ici, nous désirons connaitre la tranche d’heure dans laquelle nous discutons le plus.

Aidons-nous d’un graphique pour voir clairement.

**Graphique 4** : Fréquence de messages par heure

Graphique 4 : Fréquence de messages par heure

On constate que la tranche horaire dans laquelle nous discutons le plus se situe entre 20h et 22h. En fait, avant et après cette plage horaire, on discute moins.

En réalité pour être plus précis, l’heure à laquelle on discute le plus est 21h.

B) Emojis

Les messages whatsapp s’accompgnent souvent de logogrammes généralement appelés d’émojis.

Dans cette section, nous allons mettre en évidence les émojis les plus utlisés par chaque utlisiteurs.

Nous montrerons d’abord, les émojis que chaque utilisateurs aime utiliser. Ensuite, nous verrons les noms de ces émojis.

a) Emojis les plus utilisés

Le graphique 5 montre les six (6) émojis les plus utilisés par chaque utilisateur.

**Graphique 5**: Emojis préférés par chaque utilisateur

Graphique 5: Emojis préférés par chaque utilisateur

On peut aisement constater que nos préférence en termes d’émojis ne sont pas proches. En fait, Rachel et Moi n’apprécions pas les mêmes emojis. Elle préfère l’émoji 😅, Moi par contre je préfère l’émoji 🤣.

b) Noms des émojis les plus utilisés

Après avoir montré les émojis les plus utlisés, donnons désormais leurs noms.

En fait, nous avons l’habitude d’utiliser les émojis sans connaitre leurs noms. Ici, nous allons vous révéler les noms des émojis les plus utlisés par chaque utilisateur.

## Selecting by n
**Graphique 7** : Noms des émojis préférés par chaque utilisateur

Graphique 7 : Noms des émojis préférés par chaque utilisateur

En matière d’émojis, pour ma part, les trois émojis que je préfère sont : face with the tears of joy 😂, rolling on floor laughing 🤣, et smilling face with smiling eyes 😊.

Pour ce qui est de Rachel, les trois émojis qu’elle apprécie sont : grinning face with sweat😅, face with tears 😂, eyes 👀.

C) Mots

A l’exemple de l’analyse sur les émojis, nous analyserons les mots.

a) Mots les plus utilisés

Nous désirons également savoir les mots que nous utilisons le plus dans nos conversations.

**Graphique 8** : Mots les plus utilisés

Graphique 8 : Mots les plus utilisés

Les 4 mots les plus utilisés dans nos conversations sont : bien, merci, tess et d’accord.

b) Mots Préférés de Chaque Utlisateur

Nous allons maintenant voir les mots les plus utilsés par chaque utilisateur.

**Graphique 9** : Les 5 motsles plus utilisés par chaque utilisateur

Graphique 9 : Les 5 motsles plus utilisés par chaque utilisateur

c) Nuages de mots

Sur le nuage, les mot les plus utilisés sont au milieu et sont en plus grand caractère. Ensuite, les mots moyennement utilisés viennent juste après. Enfin, les mots les moins utilisés sont aux extrémités du nuage.

Bien, Merci, Tess, D’accord sont les mots les plus utilisés lors de nos conversation. Ils se situent au centre du nuage

Les mots les moins utilisés sont aux extrêmités du nuage.

Note : j’ai bien appelé Rachel par l’un de ses autres prénoms : Tess.

D) Analyse des sentiments

Analysons maintenant les sentiments et les émotions qui se dégagent de nos discutions. En fait, à partir du type de mots que nous utilisons dans nos messages, nous pouvons voir le types de sentiments les plus manifestes.

a) Sentiments liés à nos conversations

Le tableau suivant resume l’ensemble des sentiments qui se dégagent de nos conversations. Ce tableau se compose des sentiments négatif d’une part, et des sentiments positifs d’autres part.

Note : dans la table ci-dessous,

  • 0 si un mot n’a aucun lien avec un sentiment,

  • 1 ou plus (2,3,4,5, etc.) si un mot a un lien avec un sentiment et est utilisé plusieurs fois.

Les cellules colorées en bleu indiquent la présence d’un mot en lien avec le sentiment qui s’affiche à l’entête de la colonne. On peut voir à peu prêt que les mots qu’on utilise le plus dans nos conversations sont plus positifs que négatifs.

b) Sentiments les plus fréquents dans nos discussions

On constate que nos conversations ont une portée très positive. Il y a cependant également des sentiment négatifs, mais ils ne prédominent pas dans nos discussions.

**Graphique 10** : Les sentiments les plus fréquents

Graphique 10 : Les sentiments les plus fréquents

Dans nos conversations, il y a beaucoup d’expressions positives, et moins de négativité. C’est bon à savoir.

Conclusion

Au terme de notre analyse, on peut conclure que notre analyse avait pour objet de faire un état des lieux des données émanant de conversations du réseau social whatsapp, précisément de mon groupe de discussions avec mes frères.

Nous avons fait une analyse descriptive de base ou introductive permettant de comprendre les informations contenues des données texte, en l’occurence des discussions. Nous avons su nettoyer, ordonner, analyser et comprendre les liens et modèles existant dans nos nos données.

Par ailleurs, d’autres études peuvent faire appelle à cette analyses de premier plan pour aller plus loin. En effet, elles pourraient en faire la continuité en s’orientant vers le diagnostic, la prédiction et la prescription selon les besoins et les domaines.


BONNE LECTURE. MERCI