Ce document est à utiliser comme une table de référence, qui peut être consultée ponctuellement ou servir de support à des révisions.
Généralités
Opérateurs
+ |
Addition |
1+1 |
- |
Soustraction |
1-1 |
/ |
Division |
1/1 |
* |
Multiplication |
1*1 |
^ |
Puissance |
10^2 |
Symboles
<- |
Assignation à une variable |
animaux <- c("chien", "chat") |
() |
Éxécution d’une fonction. Contient souvent des arguments |
c(1, 2, 3) |
[] |
Sélection d’un sous-ensemble dans une variable |
animaux[1] |
$ |
Sélection d’une variable dans un data.frame |
bdd$genre |
# |
Commentaire : ignorer ce qui suit |
# Test |
= |
Assignation d’un argument dans une fonction |
mean(x, na.rm = TRUE) |
Exemples :
# Cette ligne n'est pas interprétée par R
c("chien", "chat") # Fonction
[1] "chien" "chat"
animaux <- c("chien", "chat") # Assignation dans la variable animaux
animaux[1] # Sélection du premier élément
[1] "chien"
# En revanche :
animaux(1)
Erreur : impossible de trouver la fonction "animaux"
Raccourcis clavier essentiels
Ctrl+Entrée |
Exécuter la ligne où se trouve le curseur |
Ctrl+Entrée |
Exécuter les lignes sélectionnées |
Ctrl+L |
Effacer la console |
Shift |
Obtenir les suggesions de complétion |
Ctrl+S |
Sauvegarder le fichier |
R est sensible à la casse
Attention aux appels de fonction :
factor(c("chien", "chat"))
[1] chien chat
Levels: chat chien
# Mais...
Factor(c("chien", "chat"))
Erreur : impossible de trouver la fonction "Factor"
Et aux appels de variable :
animaux <- c("chien", "chat")
animaux
[1] "chien" "chat"
# Mais...
Animaux
Erreur : objet 'Animaux' introuvable
Structures de données
Types de données
Pour identifier un type de données, on peut utiliser la fonction typeof().
1234 |
Un nombre (“double”) |
1 |
"" ou '' |
Chaîne de caractères |
"animaux" |
NA |
Absence de données |
NA |
Résultats de la fonction typeof() :
typeof(1)
[1] "double"
typeof("1")
[1] "character"
typeof(NA)
[1] "logical"
Le type de données doit être bien compris sous peine d’erreurs !
1+1
[1] 2
# Mais...
1+"1"
Error in 1 + "1" : argument non numérique pour un opérateur binaire
Structures de données
Pour identifier une structure de données, on peut utiliser la fonction str().
| vector |
c() |
Variable |
| factor |
factor() |
Variable qualitative |
| data.frame |
data.frame() |
Base de données |
Vecteur
| vector |
Variable |
| Suite de données de même type |
Série de données homogènes |
c(1,2,3,4) # Équivalent à une variable quantitative
[1] 1 2 3 4
str(c(1,2,3,4))
num [1:4] 1 2 3 4
c("homme", "femme", "homme") # Série de données textuelles
[1] "homme" "femme" "homme"
str(c("homme", "femme", "homme"))
chr [1:3] "homme" "femme" "homme"
Manipulation des vecteurs :
genre <- c("homme", "femme", "homme")
genre[1]
[1] "homme"
genre[1:2]
[1] "homme" "femme"
genre[c(1, 3)]
[1] "homme" "homme"
Facteur
Les facteurs sont un type particulier de vecteurs dans R, de la même façon que les variables qualitatives sont un type de variable particulier dans R.
| vector |
Variable qualitative |
| levels |
Modalités de la variable |
genre <- c("homme", "femme", "homme")
# Transformation en facteur
genre.f <- factor(genre)
str(genre.f)
Factor w/ 2 levels "femme","homme": 2 1 2
genre.f
[1] homme femme homme
Levels: femme homme
Pour voir les modalités (levels) :
levels(genre.f)
Data.frame
C’est l’équivalent d’une base de données en statistiques : une série de variables sur les mêmes individus.
Pour sélectionner une variable en particulier :
bdd$variable1
Les fonctions
Les fonctions sont un concept central des langages de programmation… et donc de R !
Anatomie d’une fonction
Toujours sous la forme :
nomDeLaFonction(arguments)
nomDeLaFonction : nom de la fonction à appeler
() : les parenthèses signifient qu’on demande à R d’éxécuter la fonction.
arguments : une liste d’arguments séparés par des virgules et une espace. Le nombre d’arguments dépend des fonctions.
Les arguments
Fonction qui n’a besoin d’aucun argument :
getwd()
La fonction c() accepte un nombre illimité d’arguments :
c(1, 2, 3, 4)
Certaines fonctions ont des arguments obligatoires :
mean()
Mais :
notes <- c(10, 20)
mean(notes)
Certaines fonctions prennent des arguments falcutatifs, qui peuvent être nommés. Dans ce cas, le nom de l’argument est suivi d’un signe = puis de sa valeur.
notes <- c(10, 20, NA)
mean(notes, na.rm = TRUE)
Fonctions imbriquées
Il est bien sûr possible d’imbriquer nos fonctions :
mean(c(c(10, 20), NA), na.rm = TRUE)
Ce qui est identique à :
notes <- c(10, 20)
notes2 <- c(notes, NA)
mean(notes2, na.rm = TRUE)
Pour comprendre les fonctions imbriquées, il faut donc procéder par étapes, en partant de l’intérieur des parenthèses pour aller vers l’extérieur.
Les variables
Dans un langage de programmation, les variables permettent d’atteindre un niveau d’abstraction supplémentaire, en attribuant un nom à un objet pour le réutiliser par la suite. Elles améliorent également la lisibilité du programme.
variable <- "coucou"
variable
[1] "coucou"
Attention aux erreurs de notation !
variable
[1] "coucou"
# Mais...
"variable"
[1] "variable"
