Modélisation statistique et analyse multidimensionnelle des facteurs influençant l’avancement des projets entrepreneuriaux chez les étudiants-entrepreneurs du site clermontois.

Alexandre CABAGNOLS, maître de conférences, à Polytech UCA et référent SNEE PEPITE et Yassine LOUZZANI , maître de conférences à VetAgro Sup et co-référent SNEE PEPITE. Tous les deux rattachés au CleRMa, leurs travaux portent sur le processus entrepreneurial, les réseaux d’affaires et sur les transitions vertes.

Evelyne Bernard, maître de conférences à l’IUT GEA UCA et rattachée au CleRMa, Responsable de la filière entrepreneuriat de cette composante et référentes SNEE PEPITE. Ses travaux portent sur le profil de personnalité professionnel des entrepreneurs, elle travaille notamment avec l’Institut de la vocation.

Dieter Hillairet, maître de conférences à l’IAE rattaché au CleRMa, responsable du Master Entrepreneuriat et Innovation et du DU entrepreneuriat et Intrapreneuriat à l’IAE Clermont School of Management, Référent SNEE PEPITE pour l’IAE et STAPS. Ses travaux portent sur la créativité, l’open innovation, la stratégie de marque et plus récemment sur la méthode Lego Serious Play (LSP).

Boubacar GUIDA, Ingénieur Statisticien, Biostatisticien et Économètre, Ingénieur d’études statistiques dans le cadre de ce projet de recherche.

Lieu du travail : Équipe Pôle Étudiant Pour l’Innovation, le Transfert et l’Entrepreneuriat (PEPITE) Clermont Auvergne - Clermont Auvergne INP

10 mai 2026

Rapport de Stage - SESSTIM

Contexte

Afin de développer ses missions de sensibilisation, accompagnement et formation des étudiants à l’entrepreneuriat sur les 4 départements d’Auvergne, Clermont Auvergne PEPITE s’appuie sur un réseau de référents entrepreneuriat.

Le bilan fait lors des dix ans de PEPITE a montré un taux de création des étudiants accompagnés de l’ordre de 30 \(\%\). Dans un esprit d’amélioration continue une réflexion a été entreprise avec les référents entrepreneuriat du site universitaire clermontois dont les activités scientifiques sont en lien avec l’entrepreneuriat. Il en est ressorti un avis partagé concernant l’opportunité de mieux structurer l’accompagnement des étudiants entrepreneurs afin de leur proposer un accompagnement plus formalisé autour des axes importants du processus entrepreneurial tels que : le profil de personnalité professionnelle de l’entrepreneur, sa trajectoire de vie, le processus créatif et d’élaboration stratégique du projet, son insertion dans un écosystème territorial (stratégie de réseau d’acteurs).

Il s’agit pour ces chercheurs de mobiliser leurs compétences scientifiques pour l’accompagnement des étudiants-entrepreneurs (EE) du Pôle Étudiant Pour l’Innovation, le Transfert et l’Entrepreneuriat (PEPITE) en expérimentant des outils d’accompagnement innovants qui, après validation, pourront être mis au service des étudiants-entrepreneurs du pôle clermontois.

Préparation des données et Alpha de Cronbach’s

# Chargement des packages nécéssaires 
library(readxl)
library(dplyr)
library(reshape2)
library(knitr)
library(kableExtra)
library(psych)
library(gtsummary)
library(gt)
library(psych)
library(FactoMineR)
library(factoextra)
library(bestNormalize)

# Importation des jeux de données
data_phase1 <- read_excel("./data_phase1.xlsx", sheet = "data" )
data_info <- read_excel("C:/Users/bguida/Desktop/ESPACE DE TRAVAIL PEPITE/ANALYSE DES DONNEES PROJET RECHERCHE/DONNEES SOURCES/data_.xlsx", sheet = "data")
data_cgp <- read_excel("C:/Users/bguida/Desktop/ESPACE DE TRAVAIL PEPITE/ANALYSE DES DONNEES PROJET RECHERCHE/DONNEES ET ANALYSE TEST CGP/data_cgp.xlsx", sheet = "data_cgp")

## Traitement de la base de données data_phase1
# Retrait de l'individu avec l'identifiant zcwiOKjMQsHW7kM 
data_phase1 <- data_phase1[data_phase1$id != "zcwiOKjMQsHW7kM", ]

# Création des variables inversées (échelle 1–7)
data_phase1$q17_1i <- 8 - data_phase1$q17_1
data_phase1$q17_2i <- 8 - data_phase1$q17_2
data_phase1$q18_2i <- 8 - data_phase1$q18_2
data_phase1$q19_2i <- 8 - data_phase1$q19_2

# Création de la variable Score avancement du projet
data_phase1$q004 <- rowMeans(
  data_phase1[, c("q4_1","q4_2","q4_3","q4_4","q4_5","q4_6")],
  na.rm = TRUE
)

# Création de la variable score de créativité
data_phase1$q0011 <- rowSums(
  data_phase1[, c("q11_1","q11_2","q11_3","q11_4","q11_5","q11_6")],
  na.rm = TRUE
)

# Création de la variable score d'expansion des moyens mobilisables
data_phase1$q0012 <- rowMeans(
  data_phase1[, c("q12_1", "q12_2", "q12_3")],
  na.rm = TRUE
)

# Création de la variable score d'expansion des directions possibles
data_phase1$q0013 <- rowMeans(
  data_phase1[, c("q13_1", "q13_2", "q13_3")],
  na.rm = TRUE
)

# Création de la variable score globale d'expansion
data_phase1$q1213 <- rowMeans(
  data_phase1[, c("q0012", "q0013")],
  na.rm = TRUE
)

# Création de la variable score de convergence par clarification et alignement
data_phase1$q0014 <- rowMeans(
  data_phase1[, c("q14_1", "q14_2", "q14_3")],
  na.rm = TRUE
)

# Création de la variable score de convergence par limitation d’options 
data_phase1$q0015 <- rowMeans(
  data_phase1[, c("q15_1", "q15_2", "q15_3")],
  na.rm = TRUE
)

# Création de la variable score globale de convergence
data_phase1$q1415 <- rowMeans(
  data_phase1[, c("q0014", "q0015")],
  na.rm = TRUE
)

# Création de la variable score de contribution
data_phase1$q1215 <- rowMeans(
  data_phase1[, c("q1213", "q1415")],
  na.rm = TRUE
)

# Création de la variable score Path Dependence
data_phase1$q0016 <- rowMeans(
  data_phase1[, c("q16_1", "q16_2", "q16_3")],
  na.rm = TRUE
)

# Création de la variable score de State Incertitude
data_phase1$q0017 <- rowMeans(
  data_phase1[, c("q17_1i", "q17_2i", "q17_3")],
  na.rm = TRUE
)

# Création de la variable score de Effects Incertitude 
data_phase1$q0018 <- rowMeans(
  data_phase1[, c("q18_1", "q18_2i", "q18_3")],
  na.rm = TRUE
)

# Création de la variable score de Response Incertitude
data_phase1$q0019 <- rowMeans(
  data_phase1[, c("q19_1", "q19_2i", "q19_3")],
  na.rm = TRUE
)

# Création de la variable score globale d'Incertitude
data_phase1$q1719 <- rowMeans(
  data_phase1[, c("q0017", "q0018", "q0019")],
  na.rm = TRUE
)

# Création de la variable score globale d'Auto-efficacité
data_phase1$q0020 <- rowMeans(
  data_phase1[, c("q20_1", "q20_2", "q20_3")],
  na.rm = TRUE
)

## Traitement de la base de données data_cgp
# Création de la variable profil entrepreneurial
data_cgp <- data_cgp %>%
  mutate(
    type_profil = case_when(
      # Analytique
      type_personnalite_professionnelle %in% c(
        "Contrôleur de gestion à la télécommande", "Méthodologiste", "Réviseur",
        "Penseur-concepteur", "Aspirant concepteur utilitariste",
        "Polyvalent tendance méthologiste"
      ) ~ "Analytique",
      # Créatif
      type_personnalite_professionnelle %in% c(
        "Créatif inspiré", "Créatif raisonnable", "Polyvalent tendance créatif",
        "Planificateur", "Concepteur", "Metteur en scène aménageur",
        "Animateur entraineur", "Animateur modéré", "Aspirant animateur",
        "Polyvalent tendance animateur"
      ) ~ "Créatif",
      # Entrepreneurial
      type_personnalite_professionnelle %in% c(
        "Artisan inspiré", "Artisan illuminé", "Entrepreneur modéré",
        "Bâtisseur avisé", "Réalisateur avisé",
        "Aspirant réalisateur avisé", "Polyvalent tendance réalisateur"
      ) ~ "Entrepreneurial",
      # Technique / support
      type_personnalite_professionnelle %in% c(
        "Maitre et technicien", "Aspirant maitre et technicien", "Réparateur avisé",
        "Polyvalent tendance maitre et technicien",
        "Polyvalent tendance service public",
        "Surveillant", "Service social"
      ) ~ "Technique/Support",
      # Valeurs manquantes
      is.na(type_personnalite_professionnelle) ~ NA_character_,
      TRUE ~ "Polyvalent et adaptatif"
    ),
    type_profil = factor(type_profil)
  )

# Création de la variable binaire du profil innovant
data_cgp$profil_innovant <- as.factor(
  ifelse(is.na(data_cgp$type_profil), NA,
    ifelse(data_cgp$type_profil %in% c("Créatif", "Entrepreneurial"),
      "Innovant",
      "Non innovant"
    )
  )
)

# Création de la variable binaire du profil Entrepreneurial
data_cgp$profil_entrepreneurial <- as.factor(
  ifelse(is.na(data_cgp$type_profil), NA,
    ifelse(data_cgp$type_profil %in% c("Entrepreneurial"),
      "Entrepreneur naturel",
      "Non entrepreneur"
    )
  )
)

# Création de la variable binaire du profil Créatif
data_cgp$profil_creatif <- as.factor(
  ifelse(is.na(data_cgp$type_profil), NA,
    ifelse(data_cgp$type_profil %in% c("Créatif"),
      "Créatif",
      "Non créatif"
    )
  )
)

# Création de la variable pour les entreprises de moins de 10 personnes
data_cgp$ent_moins_10 <- ifelse(
  grepl("moins de 10 personnes", data_cgp$taille_entreprise), 1,
  ifelse(data_cgp$taille_entreprise == " ", NA, 0)
  )

# Création de la variable pour les entreprises de 10 à 50 personnes
data_cgp$ent_10_50 <- ifelse(
  grepl("10 à 50 personnes", data_cgp$taille_entreprise), 1,
  ifelse(data_cgp$taille_entreprise == " ", NA, 0)
  )

# Création de la variable pour les entreprises de 50 à 250 personnes
data_cgp$ent_50_250 <- ifelse(
  grepl("50 à 250 personnes", data_cgp$taille_entreprise), 1,
  ifelse(data_cgp$taille_entreprise == " ", NA, 0)
  )

# Création de la variable pour les entreprises de 250 à 5000 personnes
data_cgp$ent_250_5000 <- ifelse(
  grepl("250 à 5000 personnes", data_cgp$taille_entreprise), 1,
  ifelse(data_cgp$taille_entreprise == " ", NA, 0)
  )

# Création de la variable pour les entreprises de Plus de 5000 personnes
data_cgp$ent_plus_5000 <- ifelse(
  grepl("plus de 5000 personnes|plus 5000 personnes", data_cgp$taille_entreprise), 1,
  ifelse(data_cgp$taille_entreprise == " ", NA, 0)
  )

# Création de la variable pour les démarches Commerciales
data_cgp$info_commerciales <- ifelse(
  grepl("Commerciales", data_cgp$type_information), 1,
  ifelse(data_cgp$type_information == " ", NA, 0)
  )

# Création de la variable pour les démarches Financières
data_cgp$info_financieres <- ifelse(
  grepl("Financières|financières", data_cgp$type_information), 1,
  ifelse(data_cgp$type_information == " ", NA, 0)
  )

# Création de la variable pour les démarches Juridiques
data_cgp$info_juridiques <- ifelse(
  grepl("Juridiques|juridiques", data_cgp$type_information), 1,
  ifelse(data_cgp$type_information == " ", NA, 0)
  )

# Création de la variable catégorielle de la durée de l'horizon
data_cgp$duree_horizon <- ifelse(
  grepl("Moins d'un an", data_cgp$duree_horizon_creer_entreprise, ignore.case = TRUE), "Moins d'1 an après diplôme",
  ifelse(grepl("Aucune idée", data_cgp$duree_horizon_creer_entreprise, ignore.case = TRUE), "Aucune idée",
         ifelse(data_cgp$duree_horizon_creer_entreprise == " ", NA, "Plus d'1 an après diplôme"))
  )

# Création de la variable binaire Amis proches
data_cgp$proche_amis <- ifelse(
  grepl("Amis proches", data_cgp$nom_proche_createur, ignore.case = TRUE), 1,
  ifelse(data_cgp$nom_proche_createur == " ", NA, 0)
  )

# Création de la variable binaire Famille proche
data_cgp$proche_famille <- ifelse(
  grepl("Famille proche|Famille Proche", data_cgp$nom_proche_createur, ignore.case = TRUE), 1,
  ifelse(data_cgp$nom_proche_createur == " ", NA, 0)
  )

# Création de la variable binaire Parents
data_cgp$proche_parents <- ifelse(
  grepl("Parents", data_cgp$nom_proche_createur, ignore.case = TRUE), 1,
  ifelse(data_cgp$nom_proche_createur == " ", NA, 0)
  )

## Traitement de la base de données data_info
# Création de la variable union européenne 
data_info$ue <- ifelse(data_info$nationalite == "France", "UE", "Non UE")

# Création de la variable classe d'âge
data_info$age_cl <- ifelse(data_info$age < 23, "[18, 23[", "[23, 46]")

# Création de la variable niveau d'études
data_info <- data_info %>%
  mutate(
    # Niveau d'études
    niveau_etudes = case_when(
      type_formation %in% c(
        "Bachelor", "BUT", "Licence LMD",
        "Diplôme d'école d'art ou d’arts appliqués",
        "Diplôme universitaire ou d'établissement"
      ) ~ "Bac+3",
      
      type_formation %in% c(
        "Diplôme d'ingénieur", "Master LMD", "Maîtrise",
        "Mastère spécialisé, magistère",
        "Master Entrepreneuriat et Innovation"
      ) ~ "Bac+5",
      
      type_formation == "Doctorat" ~ "Doctorat",
      TRUE ~ NA_character_
    ),
    niveau_etudes = factor(niveau_etudes)
  )

# Création de la variable liée au renouvellement du statut SNEE
data_info$statut_SNEE <- ifelse(data_info$nbre_renouv == 0,
                              "Première obtention du SNEE",
                              "Statut déjà renouvelé")

## Fusion des bases de données
data <- merge(data_phase1, data_info, by = "id", all.x = TRUE)
data <- merge(data, data_cgp, by="id", all.x = TRUE)

# Définition des indicateurs
indicateurs <- list(
  "Score d'avancement du projet" = c("q4_1","q4_2","q4_3", "q4_4", "q4_5", "q4_6"),
  "Score de créativité" = c("q11_1", "q11_2", "q11_3", "q11_4", "q11_5", "q11_6"),
  "Score d'expansion des moyens mobilisables" = c("q12_1", "q12_2", "q12_3"),
  "Score d'expansion des directions possibles" = c("q13_1", "q13_2", "q13_3"),
  "Score de convergence par clarification et alignement" = c("q14_1", "q14_2", "q14_3"),
  "Score de convergence par limitation d’options" = c("q15_1", "q15_2", "q15_3"),
  "Score globale d'expansion" = c("q12_1", "q12_2", "q12_3", "q13_1", "q13_2", "q13_3"),
  "Score globale de convergence" = c("q14_1", "q14_2", "q14_3", "q15_1", "q15_2", "q15_3"),
  "Score de contribution" = c("q12_1", "q12_2", "q12_3", "q13_1", "q13_2", "q13_3", 
                              "q14_1", "q14_2", "q14_3", "q15_1", "q15_2", "q15_3"),
  "Score Path Dependence" = c("q16_1", "q16_2", "q16_3"),
  "Score de State Incertitude" = c("q17_1", "q17_2", "q17_3"),
  "Score de Effects Incertitude" = c("q18_1", "q18_2", "q18_3"),
  "Score de Response Incertitude" = c("q19_1", "q19_2", "q19_3"),
  "Score globale d'Incertitude" = c("q17_1", "q17_2", "q17_3", "q18_1", "q18_2", "q18_3", "q19_1", "q19_2", "q19_3"),
  "Score globale d'Auto-efficacité" = c("q20_1", "q20_2", "q20_3")
)

# Calcul automatique des alphas
alpha_results <- lapply(names(indicateurs), function(name){
  items <- indicateurs[[name]]
  # Vérifie que les colonnes existent
  items <- items[items %in% names(data)]
  # Alpha de Cronbach's
  if(length(items) > 1){
    a <- psych::alpha(data[, items], check.keys = TRUE)
    data.frame(
      Indicateur = name,
      Nombre_Items = length(items),
      Alpha = round(a$total$raw_alpha, 3)
    )
  } else {
    data.frame(
      Indicateur = name,
      Nombre_Items = length(items),
      Alpha = NA
    )
  }
})

# Combiner tous les résultats dans un tableau
Tableau_Alpha_Cronbach <- do.call(rbind, alpha_results)

# Affichage du tableau des alphas avec kable
Tableau_Alpha_Cronbach %>%
  kable(
    caption = "Alphas de Cronbach par indicateur",
    col.names = c("Indicateur", "Nombre d'items", "Alpha"),
    align = c("l", "c", "c"),
    digits = 3
  ) %>%
  kable_styling(
    bootstrap_options = c("striped", "hover", "condensed", "responsive"),
    full_width = FALSE,
    position = "center"
  )

Alphas de Cronbach par indicateur
Indicateur	Nombre d’items	Alpha
Score d’avancement du projet	6	0.697
Score de créativité	6	0.744
Score d’expansion des moyens mobilisables	3	0.807
Score d’expansion des directions possibles	3	0.806
Score de convergence par clarification et alignement	3	0.852
Score de convergence par limitation d’options	3	0.697
Score globale d’expansion	6	0.809
Score globale de convergence	6	0.671
Score de contribution	12	0.854
Score Path Dependence	3	0.666
Score de State Incertitude	3	0.604
Score de Effects Incertitude	3	0.715
Score de Response Incertitude	3	0.510
Score globale d’Incertitude	9	0.580
Score globale d’Auto-efficacité	3	0.794

Matrice de corrélations de Spearman entre les indicateurs

# Packages nécessaires
library(dplyr)
library(gt)

# Colonnes des indicateurs
cols_indic <- c(
  "q004",     # Score Avancement Projet
  "q0011",    # Score de Créativité Entrepreneuriale
  "q0012",    # Score d'expansion des moyens mobilisables 
  "q0013",    # Score d'expansion des directions possibles
  "q1213",    # Score globale d'expansion
  "q0014",    # Score de convergence par clarification et alignement
  "q0015",    # Score de convergence par limitation d’options
  "q1415",    # Score globale de convergence
  "q1215",    # Score de contribution
  "q0016",    # Score Path Dependence
  "q0017",    # Score de State Incertitude
  "q0018",    # Score de Effects Incertitude
  "q0019",    # Score de Response Incertitude
  "q1719",    # Score globale d'Incertitude
  "q0020"     # Score globale d'Auto-efficacité
)

# Vérifier les colonnes présentes
cols_indic <- cols_indic[cols_indic %in% names(data)]

# Sélection des variables
indicateurs <- data[, cols_indic]

# Garder uniquement les variables numériques
indicateurs <- indicateurs %>%
  mutate(across(everything(), as.numeric))

# Matrice de corrélation de Spearman
cor_matrix <- cor(
  indicateurs,
  method = "spearman",
  use = "pairwise.complete.obs"
)

# Nombre de variables
n <- ncol(indicateurs)

# Matrice des p-values
p_matrix <- matrix(NA, nrow = n, ncol = n)
rownames(p_matrix) <- colnames(indicateurs)
colnames(p_matrix) <- colnames(indicateurs)

# Calcul des tests de corrélation
for(i in 1:n){
  for(j in 1:n){
    test <- suppressWarnings(
      cor.test(
        indicateurs[[i]],
        indicateurs[[j]],
        method = "spearman",
        exact = FALSE,
        use = "pairwise.complete.obs"
      )
    )
    p_matrix[i, j] <- test$p.value
  }
}

# Fonction pour étoiles de significativité
sig_label <- function(p){
  if(is.na(p)) return("")
  if(p < 0.001) return("***")
  if(p < 0.01)  return("**")
  if(p < 0.05)  return("*")
  return("")
}

# Création matrice texte : coefficient + étoiles
coef_sig <- matrix("", nrow = n, ncol = n)
for(i in 1:n){
  for(j in 1:n){
    coef <- sprintf("%.2f", cor_matrix[i, j])
    sig  <- sig_label(p_matrix[i, j])
    coef_sig[i, j] <- paste0(coef, sig)
  }
}

# Ajouter noms des lignes et colonnes
rownames(coef_sig) <- colnames(indicateurs)
colnames(coef_sig) <- colnames(indicateurs)

# Transformer en data.frame
coef_sig_df <- as.data.frame(coef_sig)

# Ajouter les noms des variables comme première colonne
coef_sig_df <- data.frame(
  Variables = rownames(coef_sig),
  coef_sig,
  check.names = FALSE
)

# Tableau professionnel avec gt()
coef_sig_df %>%
  gt(rowname_col = "Variables") %>%
  tab_header(
    title = md("**Matrice de corrélation de Spearman**"),
    subtitle = "Coefficients avec niveaux de significativité"
  ) %>%
  cols_align(
    align = "center",
    columns = everything()
  ) %>%
  tab_options(
    table.font.size = px(12),
    data_row.padding = px(3),
    heading.align = "center"
  )

	q004	q0011	q0012	q0013	q1213	q0014	q0015	q1415	q1215	q0016	q0017	q0018	q0019	q1719	q0020
Matrice de corrélation de Spearman
Coefficients avec niveaux de significativité
q004	1.00***	0.57***	0.56***	0.49***	0.60***	0.49**	0.37*	0.56***	0.64***	0.23	-0.51***	-0.10	-0.04	-0.36*	0.41**
q0011	0.57***	1.00***	0.49***	0.51***	0.58***	0.41**	0.42**	0.60***	0.65***	0.18	-0.35*	-0.08	-0.08	-0.26	0.41**
q0012	0.56***	0.49***	1.00***	0.49***	0.84***	0.60***	0.41**	0.67***	0.84***	0.11	-0.10	-0.04	-0.04	-0.09	0.22
q0013	0.49***	0.51***	0.49***	1.00***	0.86***	0.47**	0.36*	0.52***	0.77***	0.09	-0.20	0.02	0.07	-0.09	0.07
q1213	0.60***	0.58***	0.84***	0.86***	1.00***	0.62***	0.38*	0.65***	0.92***	0.09	-0.18	-0.04	-0.02	-0.14	0.20
q0014	0.49**	0.41**	0.60***	0.47**	0.62***	1.00***	0.08	0.74***	0.72***	0.12	-0.21	-0.04	-0.07	-0.16	0.20
q0015	0.37*	0.42**	0.41**	0.36*	0.38*	0.08	1.00***	0.68***	0.56***	0.09	-0.11	0.12	0.16	0.07	-0.13
q1415	0.56***	0.60***	0.67***	0.52***	0.65***	0.74***	0.68***	1.00***	0.88***	0.17	-0.20	0.03	0.10	-0.03	0.09
q1215	0.64***	0.65***	0.84***	0.77***	0.92***	0.72***	0.56***	0.88***	1.00***	0.13	-0.19	-0.00	0.03	-0.08	0.18
q0016	0.23	0.18	0.11	0.09	0.09	0.12	0.09	0.17	0.13	1.00***	-0.16	-0.18	0.37*	0.03	0.07
q0017	-0.51***	-0.35*	-0.10	-0.20	-0.18	-0.21	-0.11	-0.20	-0.19	-0.16	1.00***	0.20	0.10	0.63***	-0.54***
q0018	-0.10	-0.08	-0.04	0.02	-0.04	-0.04	0.12	0.03	-0.00	-0.18	0.20	1.00***	0.23	0.73***	-0.35*
q0019	-0.04	-0.08	-0.04	0.07	-0.02	-0.07	0.16	0.10	0.03	0.37*	0.10	0.23	1.00***	0.58***	-0.33*
q1719	-0.36*	-0.26	-0.09	-0.09	-0.14	-0.16	0.07	-0.03	-0.08	0.03	0.63***	0.73***	0.58***	1.00***	-0.56***
q0020	0.41**	0.41**	0.22	0.07	0.20	0.20	-0.13	0.09	0.18	0.07	-0.54***	-0.35*	-0.33*	-0.56***	1.00***

Analyse descriptive des données

# Statistiques descriptives bivariées
tab3 <- data %>%
  tbl_summary(
    include = c(
      # Données sociodémographiques
      genre, age_cl, age, ue, niveau_etudes,
  
      # Statut étudiant-entrepreneur (SNEE)
      statut_SNEE, nbre_renouv, 
  
      # Scores du projet entrepreneurial
      q004, q0011, q1213, q1415, q0020
      ),
    statistic = list(all_continuous() ~ "{mean} ({sd})"),
    sort = all_categorical() ~ "frequency",
    label = list(
      genre = "Genre",
      age_cl = "Classe d'âge",
      age = "Âge",
      ue = "Union Européenne",
      nationalite = "Nationalité",
      niveau_etudes = "Niveau d'études",
      statut_SNEE = "Statut national d'étudiant entrepreneur",
      nbre_renouv = "Nombre de renouvellements SNEE",
      q004 = "Score avancement du projet",
      q0011 = "Score créativité",
      q1213 = "Score expansion globale",
      q1415 = "Score convergence globale",
      q0020 = "Score auto-efficacité"
      ),
    missing = "no"
    ) %>%
  add_overall() %>%
  modify_header(label ~ "**Variable**") %>%
  as_gt() %>%
  gt::tab_row_group(
  group = "Scores du projet entrepreneurial", 
  rows = 22:26) %>%
  gt::tab_row_group(
  group = "Statut étudiant-entrepreneur (SNEE)", 
  rows = 15:21) %>%
  gt::tab_row_group(
  group = "Variables sociodémographiques", 
  rows = 1:14) %>%
  gt::tab_options(
    table.font.size = px(12), 
    heading.title.font.size = px(12), 
    heading.subtitle.font.size = px(10),
    heading.align = "left",
    row_group.font.size = px(10), 
    table_body.hlines.width = px(0), 
    row_group.border.top.width = px(0),    
    row_group.border.bottom.width = px(0),
    column_labels.border.bottom.width = px(0),
    table.border.top.width = px(0),
    table.border.bottom.width = px(0),
    table.align = "left",
    table.width = pct(90),
    latex.use_longtable = TRUE
  ) %>%
  gt::tab_source_note(source_note = md("*Scores : Avancement (1–7) ; 
                   Créativité (6–42) ; Expansion (2–14) ; 
                   Convergence (2–14) ; Auto-efficacité (3–21)*")) %>%
  gt::cols_width(everything() ~ px(170)) %>%
  gt:: tab_header(
    title = md("Tableau 3 : Tests statistiques"),
    subtitle = md("Des étudiants entrepreneurs du site clermontois")
  )

# Affichage des résultats
tab3

Variable	N = 42¹
Tableau 3 : Tests statistiques
Des étudiants entrepreneurs du site clermontois
Variables sociodémographiques
Genre
Homme	24 (57%)
Femme	18 (43%)
Classe d'âge
[23, 46]	27 (64%)
[18, 23[	15 (36%)
Âge	24.6 (5.1)
Union Européenne
UE	24 (57%)
Non UE	18 (43%)
Niveau d'études
Bac+5	32 (76%)
Bac+3	7 (17%)
Doctorat	3 (7.1%)
Statut étudiant-entrepreneur (SNEE)
Statut national d'étudiant entrepreneur
Première obtention du SNEE	32 (76%)
Statut déjà renouvelé	10 (24%)
Nombre de renouvellements SNEE
0	32 (76%)
1	8 (19%)
2	2 (4.8%)
Scores du projet entrepreneurial
Score avancement du projet	3.11 (1.10)
Score créativité	20 (8)
Score expansion globale	3.61 (1.28)
Score convergence globale	3.60 (1.08)
Score auto-efficacité	5.25 (1.39)
¹ n (%); Mean (SD)
Scores : Avancement (1–7) ; Créativité (6–42) ; Expansion (2–14) ; Convergence (2–14) ; Auto-efficacité (3–21)

Tests statistiques

# Statistiques descriptives bivariées
tab4 <- data %>%
  tbl_summary(
    include = c(
      # Données sociodémographiques
      genre, age_cl, age, ue, niveau_etudes,
  
      # Statut étudiant-entrepreneur (SNEE)
      statut_SNEE, nbre_renouv, 
  
      # Scores du projet entrepreneurial
      q004, q0011, q1213, q1415, q0020
      ),
    statistic = list(all_continuous() ~ "{mean} ({sd})"),
    sort = all_categorical() ~ "frequency",
    label = list(
      genre = "Genre",
      age_cl = "Classe d'âge",
      age = "Âge",
      ue = "Union Européenne",
      nationalite = "Nationalité",
      niveau_etudes = "Niveau d'études",
      statut_SNEE = "Statut national d'étudiant entrepreneur",
      nbre_renouv = "Nombre de renouvellements SNEE",
      q004 = "Score avancement du projet",
      q0011 = "Score créativité",
      q1213 = "Score expansion globale",
      q1415 = "Score convergence globale",
      q0020 = "Score auto-efficacité"
      ),
    by = type_atelier,
    missing = "no"
    ) %>%
  add_overall() %>%
  add_p() %>%
  modify_header(label ~ "**Variable**") %>%
  as_gt() %>%
  gt::tab_row_group(
  group = "Scores du projet entrepreneurial", 
  rows = 22:26) %>%
  gt::tab_row_group(
  group = "Statut étudiant-entrepreneur (SNEE)", 
  rows = 15:21) %>%
  gt::tab_row_group(
  group = "Variables sociodémographiques", 
  rows = 1:14) %>%
  gt::tab_options(
    table.font.size = px(12), 
    heading.title.font.size = px(12), 
    heading.subtitle.font.size = px(10),
    heading.align = "left",
    row_group.font.size = px(10), 
    table_body.hlines.width = px(0), 
    row_group.border.top.width = px(0),    
    row_group.border.bottom.width = px(0),
    column_labels.border.bottom.width = px(0),
    table.border.top.width = px(0),
    table.border.bottom.width = px(0),
    table.align = "left",
    table.width = pct(90),
    latex.use_longtable = TRUE
  ) %>%
  gt::tab_source_note(source_note = md("*Scores : Avancement (1–7) ; 
                   Créativité (6–42) ; Expansion (2–14) ; 
                   Convergence (2–14) ; Auto-efficacité (3–21)*")) %>%
  gt::cols_width(everything() ~ px(88)) %>%
  gt:: tab_header(
    title = md("Tableau 4 : Tests statistiques"),
    subtitle = md("Des étudiants entrepreneurs du site clermontois selon le type d'atelier")
  ) %>%
  gt::cols_width(
    label ~ gt::pct(45),
    -label ~ gt::px(80)   # largeur fixe pour les autres
  )

# Affichage des résultats
tab4

Variable	Overall N = 42¹	LEGO N = 22¹	RESEAU N = 20¹	p-value²
Tableau 4 : Tests statistiques
Des étudiants entrepreneurs du site clermontois selon le type d’atelier
Variables sociodémographiques
Genre				0.3
Homme	24 (57%)	11 (50%)	13 (65%)
Femme	18 (43%)	11 (50%)	7 (35%)
Classe d'âge				>0.9
[23, 46]	27 (64%)	14 (64%)	13 (65%)
[18, 23[	15 (36%)	8 (36%)	7 (35%)
Âge	24.6 (5.1)	24.5 (5.7)	24.7 (4.5)	0.7
Union Européenne				0.8
UE	24 (57%)	13 (59%)	11 (55%)
Non UE	18 (43%)	9 (41%)	9 (45%)
Niveau d'études				0.9
Bac+5	32 (76%)	17 (77%)	15 (75%)
Bac+3	7 (17%)	3 (14%)	4 (20%)
Doctorat	3 (7.1%)	2 (9.1%)	1 (5.0%)
Statut étudiant-entrepreneur (SNEE)
Statut national d'étudiant entrepreneur				>0.9
Première obtention du SNEE	32 (76%)	17 (77%)	15 (75%)
Statut déjà renouvelé	10 (24%)	5 (23%)	5 (25%)
Nombre de renouvellements SNEE				>0.9
0	32 (76%)	17 (77%)	15 (75%)
1	8 (19%)	4 (18%)	4 (20%)
2	2 (4.8%)	1 (4.5%)	1 (5.0%)
Scores du projet entrepreneurial
Score avancement du projet	3.11 (1.10)	3.21 (1.06)	3.00 (1.16)	0.4
Score créativité	20 (8)	21 (9)	19 (6)	0.3
Score expansion globale	3.61 (1.28)	3.86 (1.40)	3.33 (1.10)	0.2
Score convergence globale	3.60 (1.08)	3.73 (1.17)	3.47 (0.98)	0.5
Score auto-efficacité	5.25 (1.39)	5.06 (1.48)	5.45 (1.28)	0.4
¹ n (%); Mean (SD)
² Pearson’s Chi-squared test; Wilcoxon rank sum test; Fisher’s exact test
Scores : Avancement (1–7) ; Créativité (6–42) ; Expansion (2–14) ; Convergence (2–14) ; Auto-efficacité (3–21)

# Statistiques descriptives bivariées
tab5 <- data %>%
  tbl_summary(
    include = c(
      # Données sociodémographiques
      genre, age_cl, age, ue, niveau_etudes,
  
      # Statut étudiant-entrepreneur (SNEE)
      statut_SNEE, nbre_renouv, 
  
      # Scores du projet entrepreneurial
      q004, q0011, q1213, q1415, q0020
      ),
    statistic = list(all_continuous() ~ "{mean} ({sd})"),
    sort = all_categorical() ~ "frequency",
    label = list(
      genre = "Genre",
      age_cl = "Classe d'âge",
      age = "Âge",
      ue = "Union Européenne",
      nationalite = "Nationalité",
      niveau_etudes = "Niveau d'études",
      statut_SNEE = "Statut national d'étudiant entrepreneur",
      nbre_renouv = "Nombre de renouvellements SNEE",
      q004 = "Score avancement du projet",
      q0011 = "Score créativité",
      q1213 = "Score expansion globale",
      q1415 = "Score convergence globale",
      q0020 = "Score auto-efficacité"
      ),
    by = profil_creatif,
    missing = "no"
    ) %>%
  add_overall() %>%
  add_p() %>%
  modify_header(label ~ "**Variable**") %>%
  as_gt() %>%
  gt::tab_row_group(
  group = "Scores du projet entrepreneurial", 
  rows = 22:26) %>%
  gt::tab_row_group(
  group = "Statut étudiant-entrepreneur (SNEE)", 
  rows = 15:21) %>%
  gt::tab_row_group(
  group = "Variables sociodémographiques", 
  rows = 1:14) %>%
  gt::tab_options(
    table.font.size = px(12), 
    heading.title.font.size = px(12), 
    heading.subtitle.font.size = px(10),
    heading.align = "left",
    row_group.font.size = px(10), 
    table_body.hlines.width = px(0), 
    row_group.border.top.width = px(0),    
    row_group.border.bottom.width = px(0),
    column_labels.border.bottom.width = px(0),
    table.border.top.width = px(0),
    table.border.bottom.width = px(0),
    table.align = "left",
    table.width = pct(90),
    latex.use_longtable = TRUE
  ) %>%
  gt::tab_source_note(source_note = md("*Scores : Avancement (1–7) ; 
                   Créativité (6–42) ; Expansion (2–14) ; 
                   Convergence (2–14) ; Auto-efficacité (3–21)*")) %>%
  gt::cols_width(everything() ~ px(88)) %>%
  gt:: tab_header(
    title = md("Tableau 5 : Tests statistiques"),
    subtitle = md("Des étudiants entrepreneurs du site clermontois selon le profil créatif")
  ) %>%
  gt::cols_width(
    label ~ gt::pct(45),
    -label ~ gt::px(80)   # largeur fixe pour les autres
  )

# Affichage des résultats
tab5

Variable	Overall N = 41¹	Créatif N = 14¹	Non créatif N = 27¹	p-value²
Tableau 5 : Tests statistiques
Des étudiants entrepreneurs du site clermontois selon le profil créatif
Variables sociodémographiques
Genre				0.4
Homme	24 (59%)	7 (50%)	17 (63%)
Femme	17 (41%)	7 (50%)	10 (37%)
Classe d'âge				>0.9
[23, 46]	26 (63%)	9 (64%)	17 (63%)
[18, 23[	15 (37%)	5 (36%)	10 (37%)
Âge	24.6 (5.2)	23.6 (3.1)	25.1 (5.9)	0.5
Union Européenne				0.6
UE	24 (59%)	9 (64%)	15 (56%)
Non UE	17 (41%)	5 (36%)	12 (44%)
Niveau d'études				0.7
Bac+5	31 (76%)	12 (86%)	19 (70%)
Bac+3	7 (17%)	1 (7.1%)	6 (22%)
Doctorat	3 (7.3%)	1 (7.1%)	2 (7.4%)
Statut étudiant-entrepreneur (SNEE)
Statut national d'étudiant entrepreneur				0.4
Première obtention du SNEE	31 (76%)	12 (86%)	19 (70%)
Statut déjà renouvelé	10 (24%)	2 (14%)	8 (30%)
Nombre de renouvellements SNEE				0.6
0	31 (76%)	12 (86%)	19 (70%)
1	8 (20%)	2 (14%)	6 (22%)
2	2 (4.9%)	0 (0%)	2 (7.4%)
Scores du projet entrepreneurial
Score avancement du projet	3.15 (1.09)	3.04 (1.41)	3.20 (0.90)	0.6
Score créativité	20 (8)	17 (6)	22 (7)	0.044
Score expansion globale	3.61 (1.30)	3.36 (1.42)	3.73 (1.24)	0.3
Score convergence globale	3.61 (1.09)	3.24 (1.23)	3.80 (0.98)	0.14
Score auto-efficacité	5.24 (1.40)	4.76 (1.74)	5.49 (1.15)	0.2
¹ n (%); Mean (SD)
² Pearson’s Chi-squared test; Wilcoxon rank sum test; Fisher’s exact test
Scores : Avancement (1–7) ; Créativité (6–42) ; Expansion (2–14) ; Convergence (2–14) ; Auto-efficacité (3–21)

# Statistiques descriptives bivariées
tab6 <- data %>%
  tbl_summary(
    include = c(
      # Données sociodémographiques
      genre, age_cl, age, ue, niveau_etudes,
  
      # Statut étudiant-entrepreneur (SNEE)
      statut_SNEE, nbre_renouv, 
  
      # Scores du projet entrepreneurial
      q004, q0011, q1213, q1415, q0020
      ),
    statistic = list(all_continuous() ~ "{mean} ({sd})"),
    sort = all_categorical() ~ "frequency",
    label = list(
      genre = "Genre",
      age_cl = "Classe d'âge",
      age = "Âge",
      ue = "Union Européenne",
      nationalite = "Nationalité",
      niveau_etudes = "Niveau d'études",
      statut_SNEE = "Statut national d'étudiant entrepreneur",
      nbre_renouv = "Nombre de renouvellements SNEE",
      q004 = "Score avancement du projet",
      q0011 = "Score créativité",
      q1213 = "Score expansion globale",
      q1415 = "Score convergence globale",
      q0020 = "Score auto-efficacité"
      ),
    by = profil_entrepreneurial,
    missing = "no"
    ) %>%
  add_overall() %>%
  add_p() %>%
  modify_header(label ~ "**Variable**") %>%
  as_gt() %>%
  gt::tab_row_group(
  group = "Scores du projet entrepreneurial", 
  rows = 22:26) %>%
  gt::tab_row_group(
  group = "Statut étudiant-entrepreneur (SNEE)", 
  rows = 15:21) %>%
  gt::tab_row_group(
  group = "Variables sociodémographiques", 
  rows = 1:14) %>%
  gt::tab_options(
    table.font.size = px(12), 
    heading.title.font.size = px(12), 
    heading.subtitle.font.size = px(10),
    heading.align = "left",
    row_group.font.size = px(10), 
    table_body.hlines.width = px(0), 
    row_group.border.top.width = px(0),    
    row_group.border.bottom.width = px(0),
    column_labels.border.bottom.width = px(0),
    table.border.top.width = px(0),
    table.border.bottom.width = px(0),
    table.align = "left",
    table.width = pct(90),
    latex.use_longtable = TRUE
  ) %>%
  gt::tab_source_note(source_note = md("*Scores : Avancement (1–7) ; 
                   Créativité (6–42) ; Expansion (2–14) ; 
                   Convergence (2–14) ; Auto-efficacité (3–21)*")) %>%
  gt::cols_width(everything() ~ px(88)) %>%
  gt:: tab_header(
    title = md("Tableau 6 : Tests statistiques"),
    subtitle = md("Des étudiants entrepreneurs du site clermontois selon le profil entrepreneurial")
  ) %>%
  gt::cols_width(
    label ~ gt::pct(45),
    -label ~ gt::px(80)   # largeur fixe pour les autres
  )

# Affichage des résultats
tab6

Variable	Overall N = 41¹	Entrepreneur naturel N = 9¹	Non entrepreneur N = 32¹	p-value²
Tableau 6 : Tests statistiques
Des étudiants entrepreneurs du site clermontois selon le profil entrepreneurial
Variables sociodémographiques
Genre				0.3
Homme	24 (59%)	7 (78%)	17 (53%)
Femme	17 (41%)	2 (22%)	15 (47%)
Classe d'âge				0.2
[23, 46]	26 (63%)	4 (44%)	22 (69%)
[18, 23[	15 (37%)	5 (56%)	10 (31%)
Âge	24.6 (5.2)	23.2 (4.0)	25.0 (5.4)	0.3
Union Européenne				>0.9
UE	24 (59%)	5 (56%)	19 (59%)
Non UE	17 (41%)	4 (44%)	13 (41%)
Niveau d'études				>0.9
Bac+5	31 (76%)	7 (78%)	24 (75%)
Bac+3	7 (17%)	2 (22%)	5 (16%)
Doctorat	3 (7.3%)	0 (0%)	3 (9.4%)
Statut étudiant-entrepreneur (SNEE)
Statut national d'étudiant entrepreneur				0.7
Première obtention du SNEE	31 (76%)	6 (67%)	25 (78%)
Statut déjà renouvelé	10 (24%)	3 (33%)	7 (22%)
Nombre de renouvellements SNEE				0.5
0	31 (76%)	6 (67%)	25 (78%)
1	8 (20%)	2 (22%)	6 (19%)
2	2 (4.9%)	1 (11%)	1 (3.1%)
Scores du projet entrepreneurial
Score avancement du projet	3.15 (1.09)	3.63 (0.77)	3.01 (1.13)	0.14
Score créativité	20 (8)	24 (8)	19 (7)	0.2
Score expansion globale	3.61 (1.30)	4.30 (1.35)	3.41 (1.23)	0.054
Score convergence globale	3.61 (1.09)	3.85 (1.18)	3.54 (1.07)	0.8
Score auto-efficacité	5.24 (1.40)	6.22 (0.62)	4.97 (1.45)	0.024
¹ n (%); Mean (SD)
² Fisher’s exact test; Wilcoxon rank sum test
Scores : Avancement (1–7) ; Créativité (6–42) ; Expansion (2–14) ; Convergence (2–14) ; Auto-efficacité (3–21)

Représentations graphiques

# Liste des variables quantitatives (numériques ou entières)
quanti_names <- names(data)[sapply(data, function(x) is.numeric(x) | is.integer(x))]

# Division de la fenêtre graphique en 4 zones (2 lignes × 2 colonnes)
par(mfrow = c(2, 2), mar = c(3, 3, 2, 1))
# Boucle sur chaque variable quantitative contenue
for (v in quanti_names) {
  # Conversion de la variable en numérique
  x <- suppressWarnings(as.numeric(data[[v]]))
  # Suppression des valeurs manquantes (NA)
  x <- x[!is.na(x)]
  # Vérification avant de tracer l'histogramme 
  if (length(x) > 1 && length(unique(x)) > 1) {
    # Création de l'histogramme
    hist(x,
         main = v,
         xlab = "",
         col = "lightblue",
         border = "white")
  }
}

# Division de la fenêtre graphique en 4 zones (2 lignes × 2 colonnes)
par(mfrow = c(2, 2), mar = c(3, 3, 2, 1))
# Boucle sur chaque variable quantitative contenue
for (v in quanti_names) {
  # Conversion de la variable en numérique
  x <- suppressWarnings(as.numeric(data[[v]]))
  # Suppression des valeurs manquantes (NA)
  x <- x[!is.na(x)]
  # Vérification avant de tracer l'histogramme 
  if (length(x) > 1 && length(unique(x)) > 1) {
    # Création de l'histogramme
    boxplot(x, main = v)
  }
}

Normalité des variables (Test de Shapiro-Wilk)

# Création du vecteur des p-values
p_shapiro = rep(NA_real_, length(quanti_names))
# Attribution des noms des variables
names(p_shapiro) = quanti_names
# Boucle sur les variables quantitatives
for (v in quanti_names) {
  # Conversion en numérique
  x <- suppressWarnings(as.numeric(data[[v]]))
  # Suppression des valeurs manquantes
  x <- x[!is.na(x)]
  # Vérification avant le test
  if (length(x) >= 3 && length(unique(x)) > 1) {
  # Test de Shapiro-Wilk
  p_shapiro[v] <- shapiro.test(x)$p.value
  }
}

# Affichage des résultats
round(p_shapiro, 4)

##                id_s               duree                q2_2                q2_3 
##              0.0304              0.0000              0.0005              0.0005 
##                q2_4                q4_1                q4_2                q4_3 
##              0.0000              0.0018              0.0012              0.0000 
##                q4_4                q4_5                q4_6                q4_7 
##              0.0041              0.0096              0.0000              0.0000 
##               q10_1               q10_2               q11_1               q11_2 
##              0.0005              0.0000              0.0198              0.0084 
##               q11_3               q11_4               q11_5               q11_6 
##              0.0000              0.0001              0.0000              0.0001 
##               q12_1               q12_2               q12_3               q13_1 
##              0.0007              0.0020              0.0441              0.0209 
##               q13_2               q13_3               q14_1               q14_2 
##              0.0093              0.0076              0.0296              0.0069 
##               q14_3               q15_1               q15_2               q15_3 
##              0.0163              0.0008              0.0001              0.0002 
##               q16_1               q16_2               q16_3               q17_1 
##              0.0002              0.0000              0.0000              0.0316 
##               q17_2               q17_3               q18_1               q18_2 
##              0.0416              0.0061              0.0319              0.0077 
##               q18_3               q19_1               q19_2               q19_3 
##              0.0153              0.0020              0.0315              0.0168 
##               q20_1               q20_2               q20_3              q17_1i 
##              0.0011              0.0028              0.0000              0.0316 
##              q17_2i              q18_2i              q19_2i                q004 
##              0.0416              0.0077              0.0315              0.3594 
##               q0011               q0012               q0013               q1213 
##              0.2044              0.1010              0.5065              0.3666 
##               q0014               q0015               q1415               q1215 
##              0.4927              0.0033              0.6170              0.4817 
##               q0016               q0017               q0018               q0019 
##              0.0037              0.5046              0.5320              0.5333 
##               q1719               q0020 nombre_seance_suivi         nbre_renouv 
##              0.3456              0.0105              0.0000              0.0000 
##                 age        ent_moins_10           ent_10_50          ent_50_250 
##              0.0000              0.0000              0.0000              0.0000 
##        ent_250_5000       ent_plus_5000   info_commerciales    info_financieres 
##              0.0000              0.0000              0.0000              0.0000 
##     info_juridiques         proche_amis      proche_famille      proche_parents 
##              0.0000              0.0000              0.0000              0.0000

Application de l’APC sur les variables d’échelles de Likert

# Variables "échelles de likert" utilisées pour l'ACP
vars_apc <- c(
  paste0("q4_", 1:6),
  paste0("q11_", 1:6),
  paste0("q12_", 1:3),
  paste0("q13_", 1:3),
  paste0("q14_", 1:3),
  paste0("q15_", 1:3),
  paste0("q16_", 1:3),
  "q17_1i", "q17_2i", "q17_3", 
  paste0("q18_", c(1,3)), "q18_2i",
  paste0("q19_", c(1,3)), "q19_2i",
  paste0("q20_", 1:3))

# Création de la base ACP
data_apc1 <- data[, vars_apc]

# Corrélations de Spearman
cor_spear <- cor(data_apc1, method = "spearman")

# Application de l'ACP sur les variables d'échelle de messure
res.pca1 <- PCA(cor_spear,  scale.unit = TRUE, ncp = 8, graph = FALSE)

# Affichage des valeurs propres
kable(
  res.pca1$eig,
  format = "latex",
  booktabs = FALSE,
  linesep = ""
) %>%
  kable_styling(
    latex_options = c("hold_position", "scale_down"),
    full_width = FALSE
  )

# Création des cercles de corrélation
par(mfrow = c(2, 2), mar = c(3, 3, 2, 1))
for(i in 1:7){
  for(j in (i + 1):8){
    print(fviz_pca_var(
        res.pca1,
        axes = c(i, j),
        col.var = "contrib",
        gradient.cols = c("lightblue", "blue", "darkblue"),
        repel = TRUE) +
        ggtitle(paste("Cercle des corrélations : Axe", i, "vs Axe", j))
    )
  }
}

Transformation des scores non-normales

# Scores utilisées pour l'ACP
scores_apc <- c(
  "q004", "q0011", "q0012", "q0013", "q0014",
  "q0015", "q0016", "q0017", "q0018", "q0019",
  "q0020", "q1213", "q1415", "q1215", "q1719"
)

# Création de la base ACP
data_apc2 <- data[, scores_apc]

# Transformation uniquement des scores non normales
scores_non_nor <- c("q0015", "q0016", "q0020")

data_apc2[scores_non_nor] <- lapply(data_apc2[scores_non_nor], 
                            function(x) predict(yeojohnson(x)))

# Vérification de la normalité après transformation
sapply(data_apc2, \(x) shapiro.test(x)$p.value)

##       q004      q0011      q0012      q0013      q0014      q0015      q0016 
## 0.35941604 0.20440482 0.10100530 0.50654559 0.49265521 0.03075998 0.06417783 
##      q0017      q0018      q0019      q0020      q1213      q1415      q1215 
## 0.50458646 0.53196738 0.53326052 0.03136768 0.36655845 0.61704389 0.48170213 
##      q1719 
## 0.34556272

Application de l’ACP sur les scores calculés

# Application de l'ACP sur les scores calculées
res.pca2 <- PCA(data_apc2,  scale.unit = TRUE, ncp = 8, graph = FALSE)

# Affichage des valeurs propres
kable(
  res.pca2$eig,
  format = "latex",
  booktabs = FALSE,
  linesep = ""
) %>%
  kable_styling(
    latex_options = c("hold_position", "scale_down"),
    full_width = FALSE
  )

# Création des cercles de corrélation
for(i in 1:3){
  for(j in (i + 1):4){
    print(fviz_pca_var(
        res.pca2,
        axes = c(i, j),
        col.var = "contrib",
        gradient.cols = c("lightblue", "blue", "darkblue"),
        repel = TRUE) +
        ggtitle(paste("Cercle des corrélations : Axe", i, "vs Axe", j))
    )
  }
}

# Graphique conjoint des individus
fviz_pca_biplot(res.pca2,
                repel = TRUE)