Modélisation statistique et analyse multidimensionnelle des facteurs influençant l’avancement des projets entrepreneuriaux chez les étudiants-entrepreneurs du site clermontois.
Alexandre CABAGNOLS, maître de conférences, à Polytech UCA et référent SNEE PEPITE et Yassine LOUZZANI , maître de conférences à VetAgro Sup et co-référent SNEE PEPITE. Tous les deux rattachés au CleRMa, leurs travaux portent sur le processus entrepreneurial, les réseaux d’affaires et sur les transitions vertes.
Evelyne Bernard, maître de conférences à l’IUT GEA UCA et rattachée au CleRMa, Responsable de la filière entrepreneuriat de cette composante et référentes SNEE PEPITE. Ses travaux portent sur le profil de personnalité professionnel des entrepreneurs, elle travaille notamment avec l’Institut de la vocation.
Dieter Hillairet, maître de conférences à l’IAE rattaché au CleRMa, responsable du Master Entrepreneuriat et Innovation et du DU entrepreneuriat et Intrapreneuriat à l’IAE Clermont School of Management, Référent SNEE PEPITE pour l’IAE et STAPS. Ses travaux portent sur la créativité, l’open innovation, la stratégie de marque et plus récemment sur la méthode Lego Serious Play (LSP).
Boubacar GUIDA, Ingénieur Statisticien, Biostatisticien et Économètre, Ingénieur d’études statistiques dans le cadre de ce projet de recherche.
Lieu du travail : Équipe Pôle Étudiant Pour l’Innovation, le Transfert et l’Entrepreneuriat (PEPITE) Clermont Auvergne - Clermont Auvergne INP
Afin de développer ses missions de sensibilisation, accompagnement et formation des étudiants à l’entrepreneuriat sur les 4 départements d’Auvergne, Clermont Auvergne PEPITE s’appuie sur un réseau de référents entrepreneuriat.
Le bilan fait lors des dix ans de PEPITE a montré un taux de création des étudiants accompagnés de l’ordre de 30 \(\%\). Dans un esprit d’amélioration continue une réflexion a été entreprise avec les référents entrepreneuriat du site universitaire clermontois dont les activités scientifiques sont en lien avec l’entrepreneuriat. Il en est ressorti un avis partagé concernant l’opportunité de mieux structurer l’accompagnement des étudiants entrepreneurs afin de leur proposer un accompagnement plus formalisé autour des axes importants du processus entrepreneurial tels que : le profil de personnalité professionnelle de l’entrepreneur, sa trajectoire de vie, le processus créatif et d’élaboration stratégique du projet, son insertion dans un écosystème territorial (stratégie de réseau d’acteurs).
Il s’agit pour ces chercheurs de mobiliser leurs compétences scientifiques pour l’accompagnement des étudiants-entrepreneurs (EE) du Pôle Étudiant Pour l’Innovation, le Transfert et l’Entrepreneuriat (PEPITE) en expérimentant des outils d’accompagnement innovants qui, après validation, pourront être mis au service des étudiants-entrepreneurs du pôle clermontois.# Chargement des packages nécéssaires
library(readxl)
library(dplyr)
library(reshape2)
library(knitr)
library(kableExtra)
library(psych)
library(gtsummary)
library(gt)
library(psych)
library(FactoMineR)
library(factoextra)
library(bestNormalize)
# Importation des jeux de données
data_phase1 <- read_excel("./data_phase1.xlsx", sheet = "data" )
data_info <- read_excel("C:/Users/bguida/Desktop/ESPACE DE TRAVAIL PEPITE/ANALYSE DES DONNEES PROJET RECHERCHE/DONNEES SOURCES/data_.xlsx", sheet = "data")
data_cgp <- read_excel("C:/Users/bguida/Desktop/ESPACE DE TRAVAIL PEPITE/ANALYSE DES DONNEES PROJET RECHERCHE/DONNEES ET ANALYSE TEST CGP/data_cgp.xlsx", sheet = "data_cgp")
## Traitement de la base de données data_phase1
# Retrait de l'individu avec l'identifiant zcwiOKjMQsHW7kM
data_phase1 <- data_phase1[data_phase1$id != "zcwiOKjMQsHW7kM", ]
# Création des variables inversées (échelle 1–7)
data_phase1$q17_1i <- 8 - data_phase1$q17_1
data_phase1$q17_2i <- 8 - data_phase1$q17_2
data_phase1$q18_2i <- 8 - data_phase1$q18_2
data_phase1$q19_2i <- 8 - data_phase1$q19_2
# Création de la variable Score avancement du projet
data_phase1$q004 <- rowMeans(
data_phase1[, c("q4_1","q4_2","q4_3","q4_4","q4_5","q4_6")],
na.rm = TRUE
)
# Création de la variable score de créativité
data_phase1$q0011 <- rowSums(
data_phase1[, c("q11_1","q11_2","q11_3","q11_4","q11_5","q11_6")],
na.rm = TRUE
)
# Création de la variable score d'expansion des moyens mobilisables
data_phase1$q0012 <- rowMeans(
data_phase1[, c("q12_1", "q12_2", "q12_3")],
na.rm = TRUE
)
# Création de la variable score d'expansion des directions possibles
data_phase1$q0013 <- rowMeans(
data_phase1[, c("q13_1", "q13_2", "q13_3")],
na.rm = TRUE
)
# Création de la variable score globale d'expansion
data_phase1$q1213 <- rowMeans(
data_phase1[, c("q0012", "q0013")],
na.rm = TRUE
)
# Création de la variable score de convergence par clarification et alignement
data_phase1$q0014 <- rowMeans(
data_phase1[, c("q14_1", "q14_2", "q14_3")],
na.rm = TRUE
)
# Création de la variable score de convergence par limitation d’options
data_phase1$q0015 <- rowMeans(
data_phase1[, c("q15_1", "q15_2", "q15_3")],
na.rm = TRUE
)
# Création de la variable score globale de convergence
data_phase1$q1415 <- rowMeans(
data_phase1[, c("q0014", "q0015")],
na.rm = TRUE
)
# Création de la variable score de contribution
data_phase1$q1215 <- rowMeans(
data_phase1[, c("q1213", "q1415")],
na.rm = TRUE
)
# Création de la variable score Path Dependence
data_phase1$q0016 <- rowMeans(
data_phase1[, c("q16_1", "q16_2", "q16_3")],
na.rm = TRUE
)
# Création de la variable score de State Incertitude
data_phase1$q0017 <- rowMeans(
data_phase1[, c("q17_1i", "q17_2i", "q17_3")],
na.rm = TRUE
)
# Création de la variable score de Effects Incertitude
data_phase1$q0018 <- rowMeans(
data_phase1[, c("q18_1", "q18_2i", "q18_3")],
na.rm = TRUE
)
# Création de la variable score de Response Incertitude
data_phase1$q0019 <- rowMeans(
data_phase1[, c("q19_1", "q19_2i", "q19_3")],
na.rm = TRUE
)
# Création de la variable score globale d'Incertitude
data_phase1$q1719 <- rowMeans(
data_phase1[, c("q0017", "q0018", "q0019")],
na.rm = TRUE
)
# Création de la variable score globale d'Auto-efficacité
data_phase1$q0020 <- rowMeans(
data_phase1[, c("q20_1", "q20_2", "q20_3")],
na.rm = TRUE
)
## Traitement de la base de données data_cgp
# Création de la variable profil entrepreneurial
data_cgp <- data_cgp %>%
mutate(
type_profil = case_when(
# Analytique
type_personnalite_professionnelle %in% c(
"Contrôleur de gestion à la télécommande", "Méthodologiste", "Réviseur",
"Penseur-concepteur", "Aspirant concepteur utilitariste",
"Polyvalent tendance méthologiste"
) ~ "Analytique",
# Créatif
type_personnalite_professionnelle %in% c(
"Créatif inspiré", "Créatif raisonnable", "Polyvalent tendance créatif",
"Planificateur", "Concepteur", "Metteur en scène aménageur",
"Animateur entraineur", "Animateur modéré", "Aspirant animateur",
"Polyvalent tendance animateur"
) ~ "Créatif",
# Entrepreneurial
type_personnalite_professionnelle %in% c(
"Artisan inspiré", "Artisan illuminé", "Entrepreneur modéré",
"Bâtisseur avisé", "Réalisateur avisé",
"Aspirant réalisateur avisé", "Polyvalent tendance réalisateur"
) ~ "Entrepreneurial",
# Technique / support
type_personnalite_professionnelle %in% c(
"Maitre et technicien", "Aspirant maitre et technicien", "Réparateur avisé",
"Polyvalent tendance maitre et technicien",
"Polyvalent tendance service public",
"Surveillant", "Service social"
) ~ "Technique/Support",
# Valeurs manquantes
is.na(type_personnalite_professionnelle) ~ NA_character_,
TRUE ~ "Polyvalent et adaptatif"
),
type_profil = factor(type_profil)
)
# Création de la variable binaire du profil innovant
data_cgp$profil_innovant <- as.factor(
ifelse(is.na(data_cgp$type_profil), NA,
ifelse(data_cgp$type_profil %in% c("Créatif", "Entrepreneurial"),
"Innovant",
"Non innovant"
)
)
)
# Création de la variable binaire du profil Entrepreneurial
data_cgp$profil_entrepreneurial <- as.factor(
ifelse(is.na(data_cgp$type_profil), NA,
ifelse(data_cgp$type_profil %in% c("Entrepreneurial"),
"Entrepreneur naturel",
"Non entrepreneur"
)
)
)
# Création de la variable binaire du profil Créatif
data_cgp$profil_creatif <- as.factor(
ifelse(is.na(data_cgp$type_profil), NA,
ifelse(data_cgp$type_profil %in% c("Créatif"),
"Créatif",
"Non créatif"
)
)
)
# Création de la variable pour les entreprises de moins de 10 personnes
data_cgp$ent_moins_10 <- ifelse(
grepl("moins de 10 personnes", data_cgp$taille_entreprise), 1,
ifelse(data_cgp$taille_entreprise == " ", NA, 0)
)
# Création de la variable pour les entreprises de 10 à 50 personnes
data_cgp$ent_10_50 <- ifelse(
grepl("10 à 50 personnes", data_cgp$taille_entreprise), 1,
ifelse(data_cgp$taille_entreprise == " ", NA, 0)
)
# Création de la variable pour les entreprises de 50 à 250 personnes
data_cgp$ent_50_250 <- ifelse(
grepl("50 à 250 personnes", data_cgp$taille_entreprise), 1,
ifelse(data_cgp$taille_entreprise == " ", NA, 0)
)
# Création de la variable pour les entreprises de 250 à 5000 personnes
data_cgp$ent_250_5000 <- ifelse(
grepl("250 à 5000 personnes", data_cgp$taille_entreprise), 1,
ifelse(data_cgp$taille_entreprise == " ", NA, 0)
)
# Création de la variable pour les entreprises de Plus de 5000 personnes
data_cgp$ent_plus_5000 <- ifelse(
grepl("plus de 5000 personnes|plus 5000 personnes", data_cgp$taille_entreprise), 1,
ifelse(data_cgp$taille_entreprise == " ", NA, 0)
)
# Création de la variable pour les démarches Commerciales
data_cgp$info_commerciales <- ifelse(
grepl("Commerciales", data_cgp$type_information), 1,
ifelse(data_cgp$type_information == " ", NA, 0)
)
# Création de la variable pour les démarches Financières
data_cgp$info_financieres <- ifelse(
grepl("Financières|financières", data_cgp$type_information), 1,
ifelse(data_cgp$type_information == " ", NA, 0)
)
# Création de la variable pour les démarches Juridiques
data_cgp$info_juridiques <- ifelse(
grepl("Juridiques|juridiques", data_cgp$type_information), 1,
ifelse(data_cgp$type_information == " ", NA, 0)
)
# Création de la variable catégorielle de la durée de l'horizon
data_cgp$duree_horizon <- ifelse(
grepl("Moins d'un an", data_cgp$duree_horizon_creer_entreprise, ignore.case = TRUE), "Moins d'1 an après diplôme",
ifelse(grepl("Aucune idée", data_cgp$duree_horizon_creer_entreprise, ignore.case = TRUE), "Aucune idée",
ifelse(data_cgp$duree_horizon_creer_entreprise == " ", NA, "Plus d'1 an après diplôme"))
)
# Création de la variable binaire Amis proches
data_cgp$proche_amis <- ifelse(
grepl("Amis proches", data_cgp$nom_proche_createur, ignore.case = TRUE), 1,
ifelse(data_cgp$nom_proche_createur == " ", NA, 0)
)
# Création de la variable binaire Famille proche
data_cgp$proche_famille <- ifelse(
grepl("Famille proche|Famille Proche", data_cgp$nom_proche_createur, ignore.case = TRUE), 1,
ifelse(data_cgp$nom_proche_createur == " ", NA, 0)
)
# Création de la variable binaire Parents
data_cgp$proche_parents <- ifelse(
grepl("Parents", data_cgp$nom_proche_createur, ignore.case = TRUE), 1,
ifelse(data_cgp$nom_proche_createur == " ", NA, 0)
)
## Traitement de la base de données data_info
# Création de la variable union européenne
data_info$ue <- ifelse(data_info$nationalite == "France", "UE", "Non UE")
# Création de la variable classe d'âge
data_info$age_cl <- ifelse(data_info$age < 23, "[18, 23[", "[23, 46]")
# Création de la variable niveau d'études
data_info <- data_info %>%
mutate(
# Niveau d'études
niveau_etudes = case_when(
type_formation %in% c(
"Bachelor", "BUT", "Licence LMD",
"Diplôme d'école d'art ou d’arts appliqués",
"Diplôme universitaire ou d'établissement"
) ~ "Bac+3",
type_formation %in% c(
"Diplôme d'ingénieur", "Master LMD", "Maîtrise",
"Mastère spécialisé, magistère",
"Master Entrepreneuriat et Innovation"
) ~ "Bac+5",
type_formation == "Doctorat" ~ "Doctorat",
TRUE ~ NA_character_
),
niveau_etudes = factor(niveau_etudes)
)
# Création de la variable liée au renouvellement du statut SNEE
data_info$statut_SNEE <- ifelse(data_info$nbre_renouv == 0,
"Première obtention du SNEE",
"Statut déjà renouvelé")
## Fusion des bases de données
data <- merge(data_phase1, data_info, by = "id", all.x = TRUE)
data <- merge(data, data_cgp, by="id", all.x = TRUE)
# Définition des indicateurs
indicateurs <- list(
"Score d'avancement du projet" = c("q4_1","q4_2","q4_3", "q4_4", "q4_5", "q4_6"),
"Score de créativité" = c("q11_1", "q11_2", "q11_3", "q11_4", "q11_5", "q11_6"),
"Score d'expansion des moyens mobilisables" = c("q12_1", "q12_2", "q12_3"),
"Score d'expansion des directions possibles" = c("q13_1", "q13_2", "q13_3"),
"Score de convergence par clarification et alignement" = c("q14_1", "q14_2", "q14_3"),
"Score de convergence par limitation d’options" = c("q15_1", "q15_2", "q15_3"),
"Score globale d'expansion" = c("q12_1", "q12_2", "q12_3", "q13_1", "q13_2", "q13_3"),
"Score globale de convergence" = c("q14_1", "q14_2", "q14_3", "q15_1", "q15_2", "q15_3"),
"Score de contribution" = c("q12_1", "q12_2", "q12_3", "q13_1", "q13_2", "q13_3",
"q14_1", "q14_2", "q14_3", "q15_1", "q15_2", "q15_3"),
"Score Path Dependence" = c("q16_1", "q16_2", "q16_3"),
"Score de State Incertitude" = c("q17_1", "q17_2", "q17_3"),
"Score de Effects Incertitude" = c("q18_1", "q18_2", "q18_3"),
"Score de Response Incertitude" = c("q19_1", "q19_2", "q19_3"),
"Score globale d'Incertitude" = c("q17_1", "q17_2", "q17_3", "q18_1", "q18_2", "q18_3", "q19_1", "q19_2", "q19_3"),
"Score globale d'Auto-efficacité" = c("q20_1", "q20_2", "q20_3")
)
# Calcul automatique des alphas
alpha_results <- lapply(names(indicateurs), function(name){
items <- indicateurs[[name]]
# Vérifie que les colonnes existent
items <- items[items %in% names(data)]
# Alpha de Cronbach's
if(length(items) > 1){
a <- psych::alpha(data[, items], check.keys = TRUE)
data.frame(
Indicateur = name,
Nombre_Items = length(items),
Alpha = round(a$total$raw_alpha, 3)
)
} else {
data.frame(
Indicateur = name,
Nombre_Items = length(items),
Alpha = NA
)
}
})
# Combiner tous les résultats dans un tableau
Tableau_Alpha_Cronbach <- do.call(rbind, alpha_results)
# Affichage du tableau des alphas avec kable
Tableau_Alpha_Cronbach %>%
kable(
caption = "Alphas de Cronbach par indicateur",
col.names = c("Indicateur", "Nombre d'items", "Alpha"),
align = c("l", "c", "c"),
digits = 3
) %>%
kable_styling(
bootstrap_options = c("striped", "hover", "condensed", "responsive"),
full_width = FALSE,
position = "center"
)
| Indicateur | Nombre d’items | Alpha |
|---|---|---|
| Score d’avancement du projet | 6 | 0.697 |
| Score de créativité | 6 | 0.744 |
| Score d’expansion des moyens mobilisables | 3 | 0.807 |
| Score d’expansion des directions possibles | 3 | 0.806 |
| Score de convergence par clarification et alignement | 3 | 0.852 |
| Score de convergence par limitation d’options | 3 | 0.697 |
| Score globale d’expansion | 6 | 0.809 |
| Score globale de convergence | 6 | 0.671 |
| Score de contribution | 12 | 0.854 |
| Score Path Dependence | 3 | 0.666 |
| Score de State Incertitude | 3 | 0.604 |
| Score de Effects Incertitude | 3 | 0.715 |
| Score de Response Incertitude | 3 | 0.510 |
| Score globale d’Incertitude | 9 | 0.580 |
| Score globale d’Auto-efficacité | 3 | 0.794 |
# Packages nécessaires
library(dplyr)
library(gt)
# Colonnes des indicateurs
cols_indic <- c(
"q004", # Score Avancement Projet
"q0011", # Score de Créativité Entrepreneuriale
"q0012", # Score d'expansion des moyens mobilisables
"q0013", # Score d'expansion des directions possibles
"q1213", # Score globale d'expansion
"q0014", # Score de convergence par clarification et alignement
"q0015", # Score de convergence par limitation d’options
"q1415", # Score globale de convergence
"q1215", # Score de contribution
"q0016", # Score Path Dependence
"q0017", # Score de State Incertitude
"q0018", # Score de Effects Incertitude
"q0019", # Score de Response Incertitude
"q1719", # Score globale d'Incertitude
"q0020" # Score globale d'Auto-efficacité
)
# Vérifier les colonnes présentes
cols_indic <- cols_indic[cols_indic %in% names(data)]
# Sélection des variables
indicateurs <- data[, cols_indic]
# Garder uniquement les variables numériques
indicateurs <- indicateurs %>%
mutate(across(everything(), as.numeric))
# Matrice de corrélation de Spearman
cor_matrix <- cor(
indicateurs,
method = "spearman",
use = "pairwise.complete.obs"
)
# Nombre de variables
n <- ncol(indicateurs)
# Matrice des p-values
p_matrix <- matrix(NA, nrow = n, ncol = n)
rownames(p_matrix) <- colnames(indicateurs)
colnames(p_matrix) <- colnames(indicateurs)
# Calcul des tests de corrélation
for(i in 1:n){
for(j in 1:n){
test <- suppressWarnings(
cor.test(
indicateurs[[i]],
indicateurs[[j]],
method = "spearman",
exact = FALSE,
use = "pairwise.complete.obs"
)
)
p_matrix[i, j] <- test$p.value
}
}
# Fonction pour étoiles de significativité
sig_label <- function(p){
if(is.na(p)) return("")
if(p < 0.001) return("***")
if(p < 0.01) return("**")
if(p < 0.05) return("*")
return("")
}
# Création matrice texte : coefficient + étoiles
coef_sig <- matrix("", nrow = n, ncol = n)
for(i in 1:n){
for(j in 1:n){
coef <- sprintf("%.2f", cor_matrix[i, j])
sig <- sig_label(p_matrix[i, j])
coef_sig[i, j] <- paste0(coef, sig)
}
}
# Ajouter noms des lignes et colonnes
rownames(coef_sig) <- colnames(indicateurs)
colnames(coef_sig) <- colnames(indicateurs)
# Transformer en data.frame
coef_sig_df <- as.data.frame(coef_sig)
# Ajouter les noms des variables comme première colonne
coef_sig_df <- data.frame(
Variables = rownames(coef_sig),
coef_sig,
check.names = FALSE
)
# Tableau professionnel avec gt()
coef_sig_df %>%
gt(rowname_col = "Variables") %>%
tab_header(
title = md("**Matrice de corrélation de Spearman**"),
subtitle = "Coefficients avec niveaux de significativité"
) %>%
cols_align(
align = "center",
columns = everything()
) %>%
tab_options(
table.font.size = px(12),
data_row.padding = px(3),
heading.align = "center"
)
| Matrice de corrélation de Spearman | |||||||||||||||
| Coefficients avec niveaux de significativité | |||||||||||||||
| q004 | q0011 | q0012 | q0013 | q1213 | q0014 | q0015 | q1415 | q1215 | q0016 | q0017 | q0018 | q0019 | q1719 | q0020 | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| q004 | 1.00*** | 0.57*** | 0.56*** | 0.49*** | 0.60*** | 0.49** | 0.37* | 0.56*** | 0.64*** | 0.23 | -0.51*** | -0.10 | -0.04 | -0.36* | 0.41** |
| q0011 | 0.57*** | 1.00*** | 0.49*** | 0.51*** | 0.58*** | 0.41** | 0.42** | 0.60*** | 0.65*** | 0.18 | -0.35* | -0.08 | -0.08 | -0.26 | 0.41** |
| q0012 | 0.56*** | 0.49*** | 1.00*** | 0.49*** | 0.84*** | 0.60*** | 0.41** | 0.67*** | 0.84*** | 0.11 | -0.10 | -0.04 | -0.04 | -0.09 | 0.22 |
| q0013 | 0.49*** | 0.51*** | 0.49*** | 1.00*** | 0.86*** | 0.47** | 0.36* | 0.52*** | 0.77*** | 0.09 | -0.20 | 0.02 | 0.07 | -0.09 | 0.07 |
| q1213 | 0.60*** | 0.58*** | 0.84*** | 0.86*** | 1.00*** | 0.62*** | 0.38* | 0.65*** | 0.92*** | 0.09 | -0.18 | -0.04 | -0.02 | -0.14 | 0.20 |
| q0014 | 0.49** | 0.41** | 0.60*** | 0.47** | 0.62*** | 1.00*** | 0.08 | 0.74*** | 0.72*** | 0.12 | -0.21 | -0.04 | -0.07 | -0.16 | 0.20 |
| q0015 | 0.37* | 0.42** | 0.41** | 0.36* | 0.38* | 0.08 | 1.00*** | 0.68*** | 0.56*** | 0.09 | -0.11 | 0.12 | 0.16 | 0.07 | -0.13 |
| q1415 | 0.56*** | 0.60*** | 0.67*** | 0.52*** | 0.65*** | 0.74*** | 0.68*** | 1.00*** | 0.88*** | 0.17 | -0.20 | 0.03 | 0.10 | -0.03 | 0.09 |
| q1215 | 0.64*** | 0.65*** | 0.84*** | 0.77*** | 0.92*** | 0.72*** | 0.56*** | 0.88*** | 1.00*** | 0.13 | -0.19 | -0.00 | 0.03 | -0.08 | 0.18 |
| q0016 | 0.23 | 0.18 | 0.11 | 0.09 | 0.09 | 0.12 | 0.09 | 0.17 | 0.13 | 1.00*** | -0.16 | -0.18 | 0.37* | 0.03 | 0.07 |
| q0017 | -0.51*** | -0.35* | -0.10 | -0.20 | -0.18 | -0.21 | -0.11 | -0.20 | -0.19 | -0.16 | 1.00*** | 0.20 | 0.10 | 0.63*** | -0.54*** |
| q0018 | -0.10 | -0.08 | -0.04 | 0.02 | -0.04 | -0.04 | 0.12 | 0.03 | -0.00 | -0.18 | 0.20 | 1.00*** | 0.23 | 0.73*** | -0.35* |
| q0019 | -0.04 | -0.08 | -0.04 | 0.07 | -0.02 | -0.07 | 0.16 | 0.10 | 0.03 | 0.37* | 0.10 | 0.23 | 1.00*** | 0.58*** | -0.33* |
| q1719 | -0.36* | -0.26 | -0.09 | -0.09 | -0.14 | -0.16 | 0.07 | -0.03 | -0.08 | 0.03 | 0.63*** | 0.73*** | 0.58*** | 1.00*** | -0.56*** |
| q0020 | 0.41** | 0.41** | 0.22 | 0.07 | 0.20 | 0.20 | -0.13 | 0.09 | 0.18 | 0.07 | -0.54*** | -0.35* | -0.33* | -0.56*** | 1.00*** |
# Statistiques descriptives bivariées
tab3 <- data %>%
tbl_summary(
include = c(
# Données sociodémographiques
genre, age_cl, age, ue, niveau_etudes,
# Statut étudiant-entrepreneur (SNEE)
statut_SNEE, nbre_renouv,
# Scores du projet entrepreneurial
q004, q0011, q1213, q1415, q0020
),
statistic = list(all_continuous() ~ "{mean} ({sd})"),
sort = all_categorical() ~ "frequency",
label = list(
genre = "Genre",
age_cl = "Classe d'âge",
age = "Âge",
ue = "Union Européenne",
nationalite = "Nationalité",
niveau_etudes = "Niveau d'études",
statut_SNEE = "Statut national d'étudiant entrepreneur",
nbre_renouv = "Nombre de renouvellements SNEE",
q004 = "Score avancement du projet",
q0011 = "Score créativité",
q1213 = "Score expansion globale",
q1415 = "Score convergence globale",
q0020 = "Score auto-efficacité"
),
missing = "no"
) %>%
add_overall() %>%
modify_header(label ~ "**Variable**") %>%
as_gt() %>%
gt::tab_row_group(
group = "Scores du projet entrepreneurial",
rows = 22:26) %>%
gt::tab_row_group(
group = "Statut étudiant-entrepreneur (SNEE)",
rows = 15:21) %>%
gt::tab_row_group(
group = "Variables sociodémographiques",
rows = 1:14) %>%
gt::tab_options(
table.font.size = px(12),
heading.title.font.size = px(12),
heading.subtitle.font.size = px(10),
heading.align = "left",
row_group.font.size = px(10),
table_body.hlines.width = px(0),
row_group.border.top.width = px(0),
row_group.border.bottom.width = px(0),
column_labels.border.bottom.width = px(0),
table.border.top.width = px(0),
table.border.bottom.width = px(0),
table.align = "left",
table.width = pct(90),
latex.use_longtable = TRUE
) %>%
gt::tab_source_note(source_note = md("*Scores : Avancement (1–7) ;
Créativité (6–42) ; Expansion (2–14) ;
Convergence (2–14) ; Auto-efficacité (3–21)*")) %>%
gt::cols_width(everything() ~ px(170)) %>%
gt:: tab_header(
title = md("Tableau 3 : Tests statistiques"),
subtitle = md("Des étudiants entrepreneurs du site clermontois")
)
# Affichage des résultats
tab3
| Tableau 3 : Tests statistiques | |
| Des étudiants entrepreneurs du site clermontois | |
| Variable | N = 421 |
|---|---|
| Variables sociodémographiques | |
| Genre | |
| Homme | 24 (57%) |
| Femme | 18 (43%) |
| Classe d'âge | |
| [23, 46] | 27 (64%) |
| [18, 23[ | 15 (36%) |
| Âge | 24.6 (5.1) |
| Union Européenne | |
| UE | 24 (57%) |
| Non UE | 18 (43%) |
| Niveau d'études | |
| Bac+5 | 32 (76%) |
| Bac+3 | 7 (17%) |
| Doctorat | 3 (7.1%) |
| Statut étudiant-entrepreneur (SNEE) | |
| Statut national d'étudiant entrepreneur | |
| Première obtention du SNEE | 32 (76%) |
| Statut déjà renouvelé | 10 (24%) |
| Nombre de renouvellements SNEE | |
| 0 | 32 (76%) |
| 1 | 8 (19%) |
| 2 | 2 (4.8%) |
| Scores du projet entrepreneurial | |
| Score avancement du projet | 3.11 (1.10) |
| Score créativité | 20 (8) |
| Score expansion globale | 3.61 (1.28) |
| Score convergence globale | 3.60 (1.08) |
| Score auto-efficacité | 5.25 (1.39) |
| 1 n (%); Mean (SD) | |
| Scores : Avancement (1–7) ; Créativité (6–42) ; Expansion (2–14) ; Convergence (2–14) ; Auto-efficacité (3–21) | |
# Statistiques descriptives bivariées
tab4 <- data %>%
tbl_summary(
include = c(
# Données sociodémographiques
genre, age_cl, age, ue, niveau_etudes,
# Statut étudiant-entrepreneur (SNEE)
statut_SNEE, nbre_renouv,
# Scores du projet entrepreneurial
q004, q0011, q1213, q1415, q0020
),
statistic = list(all_continuous() ~ "{mean} ({sd})"),
sort = all_categorical() ~ "frequency",
label = list(
genre = "Genre",
age_cl = "Classe d'âge",
age = "Âge",
ue = "Union Européenne",
nationalite = "Nationalité",
niveau_etudes = "Niveau d'études",
statut_SNEE = "Statut national d'étudiant entrepreneur",
nbre_renouv = "Nombre de renouvellements SNEE",
q004 = "Score avancement du projet",
q0011 = "Score créativité",
q1213 = "Score expansion globale",
q1415 = "Score convergence globale",
q0020 = "Score auto-efficacité"
),
by = type_atelier,
missing = "no"
) %>%
add_overall() %>%
add_p() %>%
modify_header(label ~ "**Variable**") %>%
as_gt() %>%
gt::tab_row_group(
group = "Scores du projet entrepreneurial",
rows = 22:26) %>%
gt::tab_row_group(
group = "Statut étudiant-entrepreneur (SNEE)",
rows = 15:21) %>%
gt::tab_row_group(
group = "Variables sociodémographiques",
rows = 1:14) %>%
gt::tab_options(
table.font.size = px(12),
heading.title.font.size = px(12),
heading.subtitle.font.size = px(10),
heading.align = "left",
row_group.font.size = px(10),
table_body.hlines.width = px(0),
row_group.border.top.width = px(0),
row_group.border.bottom.width = px(0),
column_labels.border.bottom.width = px(0),
table.border.top.width = px(0),
table.border.bottom.width = px(0),
table.align = "left",
table.width = pct(90),
latex.use_longtable = TRUE
) %>%
gt::tab_source_note(source_note = md("*Scores : Avancement (1–7) ;
Créativité (6–42) ; Expansion (2–14) ;
Convergence (2–14) ; Auto-efficacité (3–21)*")) %>%
gt::cols_width(everything() ~ px(88)) %>%
gt:: tab_header(
title = md("Tableau 4 : Tests statistiques"),
subtitle = md("Des étudiants entrepreneurs du site clermontois selon le type d'atelier")
) %>%
gt::cols_width(
label ~ gt::pct(45),
-label ~ gt::px(80) # largeur fixe pour les autres
)
# Affichage des résultats
tab4
| Tableau 4 : Tests statistiques | ||||
| Des étudiants entrepreneurs du site clermontois selon le type d’atelier | ||||
| Variable | Overall N = 421 |
LEGO N = 221 |
RESEAU N = 201 |
p-value2 |
|---|---|---|---|---|
| Variables sociodémographiques | ||||
| Genre | 0.3 | |||
| Homme | 24 (57%) | 11 (50%) | 13 (65%) | |
| Femme | 18 (43%) | 11 (50%) | 7 (35%) | |
| Classe d'âge | >0.9 | |||
| [23, 46] | 27 (64%) | 14 (64%) | 13 (65%) | |
| [18, 23[ | 15 (36%) | 8 (36%) | 7 (35%) | |
| Âge | 24.6 (5.1) | 24.5 (5.7) | 24.7 (4.5) | 0.7 |
| Union Européenne | 0.8 | |||
| UE | 24 (57%) | 13 (59%) | 11 (55%) | |
| Non UE | 18 (43%) | 9 (41%) | 9 (45%) | |
| Niveau d'études | 0.9 | |||
| Bac+5 | 32 (76%) | 17 (77%) | 15 (75%) | |
| Bac+3 | 7 (17%) | 3 (14%) | 4 (20%) | |
| Doctorat | 3 (7.1%) | 2 (9.1%) | 1 (5.0%) | |
| Statut étudiant-entrepreneur (SNEE) | ||||
| Statut national d'étudiant entrepreneur | >0.9 | |||
| Première obtention du SNEE | 32 (76%) | 17 (77%) | 15 (75%) | |
| Statut déjà renouvelé | 10 (24%) | 5 (23%) | 5 (25%) | |
| Nombre de renouvellements SNEE | >0.9 | |||
| 0 | 32 (76%) | 17 (77%) | 15 (75%) | |
| 1 | 8 (19%) | 4 (18%) | 4 (20%) | |
| 2 | 2 (4.8%) | 1 (4.5%) | 1 (5.0%) | |
| Scores du projet entrepreneurial | ||||
| Score avancement du projet | 3.11 (1.10) | 3.21 (1.06) | 3.00 (1.16) | 0.4 |
| Score créativité | 20 (8) | 21 (9) | 19 (6) | 0.3 |
| Score expansion globale | 3.61 (1.28) | 3.86 (1.40) | 3.33 (1.10) | 0.2 |
| Score convergence globale | 3.60 (1.08) | 3.73 (1.17) | 3.47 (0.98) | 0.5 |
| Score auto-efficacité | 5.25 (1.39) | 5.06 (1.48) | 5.45 (1.28) | 0.4 |
| 1 n (%); Mean (SD) | ||||
| 2 Pearson’s Chi-squared test; Wilcoxon rank sum test; Fisher’s exact test | ||||
| Scores : Avancement (1–7) ; Créativité (6–42) ; Expansion (2–14) ; Convergence (2–14) ; Auto-efficacité (3–21) | ||||
# Statistiques descriptives bivariées
tab5 <- data %>%
tbl_summary(
include = c(
# Données sociodémographiques
genre, age_cl, age, ue, niveau_etudes,
# Statut étudiant-entrepreneur (SNEE)
statut_SNEE, nbre_renouv,
# Scores du projet entrepreneurial
q004, q0011, q1213, q1415, q0020
),
statistic = list(all_continuous() ~ "{mean} ({sd})"),
sort = all_categorical() ~ "frequency",
label = list(
genre = "Genre",
age_cl = "Classe d'âge",
age = "Âge",
ue = "Union Européenne",
nationalite = "Nationalité",
niveau_etudes = "Niveau d'études",
statut_SNEE = "Statut national d'étudiant entrepreneur",
nbre_renouv = "Nombre de renouvellements SNEE",
q004 = "Score avancement du projet",
q0011 = "Score créativité",
q1213 = "Score expansion globale",
q1415 = "Score convergence globale",
q0020 = "Score auto-efficacité"
),
by = profil_creatif,
missing = "no"
) %>%
add_overall() %>%
add_p() %>%
modify_header(label ~ "**Variable**") %>%
as_gt() %>%
gt::tab_row_group(
group = "Scores du projet entrepreneurial",
rows = 22:26) %>%
gt::tab_row_group(
group = "Statut étudiant-entrepreneur (SNEE)",
rows = 15:21) %>%
gt::tab_row_group(
group = "Variables sociodémographiques",
rows = 1:14) %>%
gt::tab_options(
table.font.size = px(12),
heading.title.font.size = px(12),
heading.subtitle.font.size = px(10),
heading.align = "left",
row_group.font.size = px(10),
table_body.hlines.width = px(0),
row_group.border.top.width = px(0),
row_group.border.bottom.width = px(0),
column_labels.border.bottom.width = px(0),
table.border.top.width = px(0),
table.border.bottom.width = px(0),
table.align = "left",
table.width = pct(90),
latex.use_longtable = TRUE
) %>%
gt::tab_source_note(source_note = md("*Scores : Avancement (1–7) ;
Créativité (6–42) ; Expansion (2–14) ;
Convergence (2–14) ; Auto-efficacité (3–21)*")) %>%
gt::cols_width(everything() ~ px(88)) %>%
gt:: tab_header(
title = md("Tableau 5 : Tests statistiques"),
subtitle = md("Des étudiants entrepreneurs du site clermontois selon le profil créatif")
) %>%
gt::cols_width(
label ~ gt::pct(45),
-label ~ gt::px(80) # largeur fixe pour les autres
)
# Affichage des résultats
tab5
| Tableau 5 : Tests statistiques | ||||
| Des étudiants entrepreneurs du site clermontois selon le profil créatif | ||||
| Variable | Overall N = 411 |
Créatif N = 141 |
Non créatif N = 271 |
p-value2 |
|---|---|---|---|---|
| Variables sociodémographiques | ||||
| Genre | 0.4 | |||
| Homme | 24 (59%) | 7 (50%) | 17 (63%) | |
| Femme | 17 (41%) | 7 (50%) | 10 (37%) | |
| Classe d'âge | >0.9 | |||
| [23, 46] | 26 (63%) | 9 (64%) | 17 (63%) | |
| [18, 23[ | 15 (37%) | 5 (36%) | 10 (37%) | |
| Âge | 24.6 (5.2) | 23.6 (3.1) | 25.1 (5.9) | 0.5 |
| Union Européenne | 0.6 | |||
| UE | 24 (59%) | 9 (64%) | 15 (56%) | |
| Non UE | 17 (41%) | 5 (36%) | 12 (44%) | |
| Niveau d'études | 0.7 | |||
| Bac+5 | 31 (76%) | 12 (86%) | 19 (70%) | |
| Bac+3 | 7 (17%) | 1 (7.1%) | 6 (22%) | |
| Doctorat | 3 (7.3%) | 1 (7.1%) | 2 (7.4%) | |
| Statut étudiant-entrepreneur (SNEE) | ||||
| Statut national d'étudiant entrepreneur | 0.4 | |||
| Première obtention du SNEE | 31 (76%) | 12 (86%) | 19 (70%) | |
| Statut déjà renouvelé | 10 (24%) | 2 (14%) | 8 (30%) | |
| Nombre de renouvellements SNEE | 0.6 | |||
| 0 | 31 (76%) | 12 (86%) | 19 (70%) | |
| 1 | 8 (20%) | 2 (14%) | 6 (22%) | |
| 2 | 2 (4.9%) | 0 (0%) | 2 (7.4%) | |
| Scores du projet entrepreneurial | ||||
| Score avancement du projet | 3.15 (1.09) | 3.04 (1.41) | 3.20 (0.90) | 0.6 |
| Score créativité | 20 (8) | 17 (6) | 22 (7) | 0.044 |
| Score expansion globale | 3.61 (1.30) | 3.36 (1.42) | 3.73 (1.24) | 0.3 |
| Score convergence globale | 3.61 (1.09) | 3.24 (1.23) | 3.80 (0.98) | 0.14 |
| Score auto-efficacité | 5.24 (1.40) | 4.76 (1.74) | 5.49 (1.15) | 0.2 |
| 1 n (%); Mean (SD) | ||||
| 2 Pearson’s Chi-squared test; Wilcoxon rank sum test; Fisher’s exact test | ||||
| Scores : Avancement (1–7) ; Créativité (6–42) ; Expansion (2–14) ; Convergence (2–14) ; Auto-efficacité (3–21) | ||||
# Statistiques descriptives bivariées
tab6 <- data %>%
tbl_summary(
include = c(
# Données sociodémographiques
genre, age_cl, age, ue, niveau_etudes,
# Statut étudiant-entrepreneur (SNEE)
statut_SNEE, nbre_renouv,
# Scores du projet entrepreneurial
q004, q0011, q1213, q1415, q0020
),
statistic = list(all_continuous() ~ "{mean} ({sd})"),
sort = all_categorical() ~ "frequency",
label = list(
genre = "Genre",
age_cl = "Classe d'âge",
age = "Âge",
ue = "Union Européenne",
nationalite = "Nationalité",
niveau_etudes = "Niveau d'études",
statut_SNEE = "Statut national d'étudiant entrepreneur",
nbre_renouv = "Nombre de renouvellements SNEE",
q004 = "Score avancement du projet",
q0011 = "Score créativité",
q1213 = "Score expansion globale",
q1415 = "Score convergence globale",
q0020 = "Score auto-efficacité"
),
by = profil_entrepreneurial,
missing = "no"
) %>%
add_overall() %>%
add_p() %>%
modify_header(label ~ "**Variable**") %>%
as_gt() %>%
gt::tab_row_group(
group = "Scores du projet entrepreneurial",
rows = 22:26) %>%
gt::tab_row_group(
group = "Statut étudiant-entrepreneur (SNEE)",
rows = 15:21) %>%
gt::tab_row_group(
group = "Variables sociodémographiques",
rows = 1:14) %>%
gt::tab_options(
table.font.size = px(12),
heading.title.font.size = px(12),
heading.subtitle.font.size = px(10),
heading.align = "left",
row_group.font.size = px(10),
table_body.hlines.width = px(0),
row_group.border.top.width = px(0),
row_group.border.bottom.width = px(0),
column_labels.border.bottom.width = px(0),
table.border.top.width = px(0),
table.border.bottom.width = px(0),
table.align = "left",
table.width = pct(90),
latex.use_longtable = TRUE
) %>%
gt::tab_source_note(source_note = md("*Scores : Avancement (1–7) ;
Créativité (6–42) ; Expansion (2–14) ;
Convergence (2–14) ; Auto-efficacité (3–21)*")) %>%
gt::cols_width(everything() ~ px(88)) %>%
gt:: tab_header(
title = md("Tableau 6 : Tests statistiques"),
subtitle = md("Des étudiants entrepreneurs du site clermontois selon le profil entrepreneurial")
) %>%
gt::cols_width(
label ~ gt::pct(45),
-label ~ gt::px(80) # largeur fixe pour les autres
)
# Affichage des résultats
tab6
| Tableau 6 : Tests statistiques | ||||
| Des étudiants entrepreneurs du site clermontois selon le profil entrepreneurial | ||||
| Variable | Overall N = 411 |
Entrepreneur naturel N = 91 |
Non entrepreneur N = 321 |
p-value2 |
|---|---|---|---|---|
| Variables sociodémographiques | ||||
| Genre | 0.3 | |||
| Homme | 24 (59%) | 7 (78%) | 17 (53%) | |
| Femme | 17 (41%) | 2 (22%) | 15 (47%) | |
| Classe d'âge | 0.2 | |||
| [23, 46] | 26 (63%) | 4 (44%) | 22 (69%) | |
| [18, 23[ | 15 (37%) | 5 (56%) | 10 (31%) | |
| Âge | 24.6 (5.2) | 23.2 (4.0) | 25.0 (5.4) | 0.3 |
| Union Européenne | >0.9 | |||
| UE | 24 (59%) | 5 (56%) | 19 (59%) | |
| Non UE | 17 (41%) | 4 (44%) | 13 (41%) | |
| Niveau d'études | >0.9 | |||
| Bac+5 | 31 (76%) | 7 (78%) | 24 (75%) | |
| Bac+3 | 7 (17%) | 2 (22%) | 5 (16%) | |
| Doctorat | 3 (7.3%) | 0 (0%) | 3 (9.4%) | |
| Statut étudiant-entrepreneur (SNEE) | ||||
| Statut national d'étudiant entrepreneur | 0.7 | |||
| Première obtention du SNEE | 31 (76%) | 6 (67%) | 25 (78%) | |
| Statut déjà renouvelé | 10 (24%) | 3 (33%) | 7 (22%) | |
| Nombre de renouvellements SNEE | 0.5 | |||
| 0 | 31 (76%) | 6 (67%) | 25 (78%) | |
| 1 | 8 (20%) | 2 (22%) | 6 (19%) | |
| 2 | 2 (4.9%) | 1 (11%) | 1 (3.1%) | |
| Scores du projet entrepreneurial | ||||
| Score avancement du projet | 3.15 (1.09) | 3.63 (0.77) | 3.01 (1.13) | 0.14 |
| Score créativité | 20 (8) | 24 (8) | 19 (7) | 0.2 |
| Score expansion globale | 3.61 (1.30) | 4.30 (1.35) | 3.41 (1.23) | 0.054 |
| Score convergence globale | 3.61 (1.09) | 3.85 (1.18) | 3.54 (1.07) | 0.8 |
| Score auto-efficacité | 5.24 (1.40) | 6.22 (0.62) | 4.97 (1.45) | 0.024 |
| 1 n (%); Mean (SD) | ||||
| 2 Fisher’s exact test; Wilcoxon rank sum test | ||||
| Scores : Avancement (1–7) ; Créativité (6–42) ; Expansion (2–14) ; Convergence (2–14) ; Auto-efficacité (3–21) | ||||
# Liste des variables quantitatives (numériques ou entières)
quanti_names <- names(data)[sapply(data, function(x) is.numeric(x) | is.integer(x))]
# Division de la fenêtre graphique en 4 zones (2 lignes × 2 colonnes)
par(mfrow = c(2, 2), mar = c(3, 3, 2, 1))
# Boucle sur chaque variable quantitative contenue
for (v in quanti_names) {
# Conversion de la variable en numérique
x <- suppressWarnings(as.numeric(data[[v]]))
# Suppression des valeurs manquantes (NA)
x <- x[!is.na(x)]
# Vérification avant de tracer l'histogramme
if (length(x) > 1 && length(unique(x)) > 1) {
# Création de l'histogramme
hist(x,
main = v,
xlab = "",
col = "lightblue",
border = "white")
}
}
# Division de la fenêtre graphique en 4 zones (2 lignes × 2 colonnes)
par(mfrow = c(2, 2), mar = c(3, 3, 2, 1))
# Boucle sur chaque variable quantitative contenue
for (v in quanti_names) {
# Conversion de la variable en numérique
x <- suppressWarnings(as.numeric(data[[v]]))
# Suppression des valeurs manquantes (NA)
x <- x[!is.na(x)]
# Vérification avant de tracer l'histogramme
if (length(x) > 1 && length(unique(x)) > 1) {
# Création de l'histogramme
boxplot(x, main = v)
}
}
# Création du vecteur des p-values
p_shapiro = rep(NA_real_, length(quanti_names))
# Attribution des noms des variables
names(p_shapiro) = quanti_names
# Boucle sur les variables quantitatives
for (v in quanti_names) {
# Conversion en numérique
x <- suppressWarnings(as.numeric(data[[v]]))
# Suppression des valeurs manquantes
x <- x[!is.na(x)]
# Vérification avant le test
if (length(x) >= 3 && length(unique(x)) > 1) {
# Test de Shapiro-Wilk
p_shapiro[v] <- shapiro.test(x)$p.value
}
}
# Affichage des résultats
round(p_shapiro, 4)
## id_s duree q2_2 q2_3
## 0.0304 0.0000 0.0005 0.0005
## q2_4 q4_1 q4_2 q4_3
## 0.0000 0.0018 0.0012 0.0000
## q4_4 q4_5 q4_6 q4_7
## 0.0041 0.0096 0.0000 0.0000
## q10_1 q10_2 q11_1 q11_2
## 0.0005 0.0000 0.0198 0.0084
## q11_3 q11_4 q11_5 q11_6
## 0.0000 0.0001 0.0000 0.0001
## q12_1 q12_2 q12_3 q13_1
## 0.0007 0.0020 0.0441 0.0209
## q13_2 q13_3 q14_1 q14_2
## 0.0093 0.0076 0.0296 0.0069
## q14_3 q15_1 q15_2 q15_3
## 0.0163 0.0008 0.0001 0.0002
## q16_1 q16_2 q16_3 q17_1
## 0.0002 0.0000 0.0000 0.0316
## q17_2 q17_3 q18_1 q18_2
## 0.0416 0.0061 0.0319 0.0077
## q18_3 q19_1 q19_2 q19_3
## 0.0153 0.0020 0.0315 0.0168
## q20_1 q20_2 q20_3 q17_1i
## 0.0011 0.0028 0.0000 0.0316
## q17_2i q18_2i q19_2i q004
## 0.0416 0.0077 0.0315 0.3594
## q0011 q0012 q0013 q1213
## 0.2044 0.1010 0.5065 0.3666
## q0014 q0015 q1415 q1215
## 0.4927 0.0033 0.6170 0.4817
## q0016 q0017 q0018 q0019
## 0.0037 0.5046 0.5320 0.5333
## q1719 q0020 nombre_seance_suivi nbre_renouv
## 0.3456 0.0105 0.0000 0.0000
## age ent_moins_10 ent_10_50 ent_50_250
## 0.0000 0.0000 0.0000 0.0000
## ent_250_5000 ent_plus_5000 info_commerciales info_financieres
## 0.0000 0.0000 0.0000 0.0000
## info_juridiques proche_amis proche_famille proche_parents
## 0.0000 0.0000 0.0000 0.0000
# Variables "échelles de likert" utilisées pour l'ACP
vars_apc <- c(
paste0("q4_", 1:6),
paste0("q11_", 1:6),
paste0("q12_", 1:3),
paste0("q13_", 1:3),
paste0("q14_", 1:3),
paste0("q15_", 1:3),
paste0("q16_", 1:3),
"q17_1i", "q17_2i", "q17_3",
paste0("q18_", c(1,3)), "q18_2i",
paste0("q19_", c(1,3)), "q19_2i",
paste0("q20_", 1:3))
# Création de la base ACP
data_apc1 <- data[, vars_apc]
# Corrélations de Spearman
cor_spear <- cor(data_apc1, method = "spearman")
# Application de l'ACP sur les variables d'échelle de messure
res.pca1 <- PCA(cor_spear, scale.unit = TRUE, ncp = 8, graph = FALSE)
# Affichage des valeurs propres
kable(
res.pca1$eig,
format = "latex",
booktabs = FALSE,
linesep = ""
) %>%
kable_styling(
latex_options = c("hold_position", "scale_down"),
full_width = FALSE
)
# Création des cercles de corrélation
par(mfrow = c(2, 2), mar = c(3, 3, 2, 1))
for(i in 1:7){
for(j in (i + 1):8){
print(fviz_pca_var(
res.pca1,
axes = c(i, j),
col.var = "contrib",
gradient.cols = c("lightblue", "blue", "darkblue"),
repel = TRUE) +
ggtitle(paste("Cercle des corrélations : Axe", i, "vs Axe", j))
)
}
}
# Scores utilisées pour l'ACP
scores_apc <- c(
"q004", "q0011", "q0012", "q0013", "q0014",
"q0015", "q0016", "q0017", "q0018", "q0019",
"q0020", "q1213", "q1415", "q1215", "q1719"
)
# Création de la base ACP
data_apc2 <- data[, scores_apc]
# Transformation uniquement des scores non normales
scores_non_nor <- c("q0015", "q0016", "q0020")
data_apc2[scores_non_nor] <- lapply(data_apc2[scores_non_nor],
function(x) predict(yeojohnson(x)))
# Vérification de la normalité après transformation
sapply(data_apc2, \(x) shapiro.test(x)$p.value)
## q004 q0011 q0012 q0013 q0014 q0015 q0016
## 0.35941604 0.20440482 0.10100530 0.50654559 0.49265521 0.03075998 0.06417783
## q0017 q0018 q0019 q0020 q1213 q1415 q1215
## 0.50458646 0.53196738 0.53326052 0.03136768 0.36655845 0.61704389 0.48170213
## q1719
## 0.34556272
# Application de l'ACP sur les scores calculées
res.pca2 <- PCA(data_apc2, scale.unit = TRUE, ncp = 8, graph = FALSE)
# Affichage des valeurs propres
kable(
res.pca2$eig,
format = "latex",
booktabs = FALSE,
linesep = ""
) %>%
kable_styling(
latex_options = c("hold_position", "scale_down"),
full_width = FALSE
)
# Création des cercles de corrélation
for(i in 1:3){
for(j in (i + 1):4){
print(fviz_pca_var(
res.pca2,
axes = c(i, j),
col.var = "contrib",
gradient.cols = c("lightblue", "blue", "darkblue"),
repel = TRUE) +
ggtitle(paste("Cercle des corrélations : Axe", i, "vs Axe", j))
)
}
}
# Graphique conjoint des individus
fviz_pca_biplot(res.pca2,
repel = TRUE)