Introduction & Problématique :

La chimie est un domaine assez vague et chaque entité chimique a ses propres spécifications , mais parfois on est amené à classer les entités chimiques ayant des spécifications pareilles . Aujourd’hui , on va prendre quelques entités et les classer selon leurs symboles et on va analyser la relation entre la classification et la solubilité des entités .

Y a t-il alors une relation entre la solubilité et la classification ?

Description des variables :

MeltingPoint : Température de fusion .
BoilingPoint : Température d’ébullition .
Dielectric : La mesure du pouvoir électrique de l’entité chimique .
Dipole moment : Le moment dipolaire est la grandeur reflétant la polarité d’une molécule
Log P : C’est le logarithme de la pression partielle du solvant par rapport à la pression partielle de l’eau .
Solubility : La solubilité “La solubilité est la capacité d’une substance, appelée soluté, à se dissoudre dans une autre substance, appelée solvant, pour former un mélange homogène” .
RefractiveIndex : Indice de réfraction , c’est une grandeur sans dimension caractéristique d’un milieu, décrivant le comportement de la lumière dans celui-ci .

Importation des données :

data=read.table(file=file.choose(),sep=";",dec=",",header=T,row.names=1)
attach(data)
data=data[,-9]

Packages nécessaires :

library(FactoMineR)
## Warning: package 'FactoMineR' was built under R version 3.2.5
library(factoextra)
## Loading required package: ggplot2
## Warning: package 'ggplot2' was built under R version 3.2.3
## Loading required package: grid
library(ggplot2)

Réalisation de l’ACP :

res=PCA(data,scale.unit=T,graph=F,quali.sup=9)

Eboulis des valeurs propres :

barplot(res$eig[,1],names.arg = paste("dim",1:length(res$eig[,1])),col="darkblue",main = "Figure 1 : Eboulis des valeurs propres ")

L’histogramme des valeurs propres montre que les 2 premières dimensions présentent une importance destinguable des autres dimensions si bien qu’elles représentent 69,54% de l’inertie totale .

Cercle de corrélation :

plot.PCA(res,choix='var')

Le cercle de corrélation montre que notre plan factoriel synthétise 69,54% de l’inertie totale . La première composante principale est celle qui est la prédominante avec un pourcentage de 45,97% alors que la deuxième présente 23,57%.

Graphe des individus :

fviz_pca_ind(res,habillage=9,labelsize = 3)

Concernant le nuage des indicidus on peut remarquer que les classe A et K se situent dans le quadrant gauche supérieur là où la solubilité , le diélectrique et le moment dipolaire sont importants .Par contre le groupe D se situe dans le quadrant droit inférieur là où le logP est important . La dernière classe (la classe T et H) ont des inerties très proches du centre si bien que leur distribution n’est pas significative par rapport à la solubilité .

Observation du biplot :

fviz_pca(res,habillage=9)

Conclusion :

On peut conclure que la solubilité est inversement corrélée au logP et elle est indépendante des températures de fusion et d’ébullution et de l’indice de réfraction alors qu’elle est légèrement corrélée avec le diélectrique et le moment dipolaire , donc un une relation distinguable entre la solubilité et le logP et une relation avec le moment dipolaire et le diélectrique .

Une représentation sur les deux premiers axes était suffisante pour dégager 69,54% de l’inertie totale et à partir de notre analyse on peut conclure que la répartition selon des classes est significative pour 3 classes (A,K,D) c’est à dire que presque toute les entités d’une classe ont des solubilités proches alors que les entités de la classe T ne se rejoignent pas pour avoir les mêmes spécifications .

On peut donc aboutir au résultats suivants :

-La répartition selon des classe n’a pas d’effet sur la solubilité car on a trouvé 2 classes parmi 5 qui ont une inertie proche du centre , donc on parle de solubilité pour chaque entité à part et non pas par classe . -La solubilité est inversement lié au log P ,si la solubilité augmente , logP diminue et vice versa. -La solubilité est liée au moment dipolaire qui est corrélé au diélectrique . -La solubilité ne dépond ni de la température d’ébullition , ni de la température de fusion , ni de l’indice de réfraction .