Formation analyse de donnee

GAMSORE

2024-07-10

Ce document fait la synthèse des diffrentes manipulation de la formation

nomination des variables

Dans cette partie, j’explique la difference entre les variables

cette partie affiche le resultat de Foo

Foo
## [1] 10

cette partie affiche le resultat de foo

foo
## [1] 20

cette partie affiche le resultat de foO

foO
## [1] 40

Le mode d’un objet est obtenu avec la fonction mode : exemple

v <- c(1,2,5,9)

le mode de v est :

## [1] "numeric"

la longueur de v est obtenue avec la fonction length :

length(v)
## [1] 4

This is an R Markdown document. Markdown is a simple formatting syntax for authoring HTML, PDF, and MS Word documents. For more details on using R Markdown see http://rmarkdown.rstudio.com.

When you click the Knit button a document will be generated that includes both content as well as the output of any embedded R code chunks within the document. You can embed an R code chunk like this:

summary(cars)
##      speed           dist       
##  Min.   : 4.0   Min.   :  2.00  
##  1st Qu.:12.0   1st Qu.: 26.00  
##  Median :15.0   Median : 36.00  
##  Mean   :15.4   Mean   : 42.98  
##  3rd Qu.:19.0   3rd Qu.: 56.00  
##  Max.   :25.0   Max.   :120.00

Cette partie affiche les 6 premieres ligne de la base de données car

head(cars)
##   speed dist
## 1     4    2
## 2     4   10
## 3     7    4
## 4     7   22
## 5     8   16
## 6     9   10

Cette partie affiche les 3 premieres et les 3 dernieres lignes de la base de données car

head(cars, n=3)
##   speed dist
## 1     4    2
## 2     4   10
## 3     7    4
tail(cars, n=3)
##    speed dist
## 48    24   93
## 49    24  120
## 50    25   85

longueur d’une chaine de caractere :

v1<-"model"
v2<- c("m", "oml", "d", "e", "l")
length(v1)
## [1] 1
length(v2)
## [1] 5

la fonction nchar permet d’obtenir le nombre de cacartere

nchar(v1)
## [1] 5
nchar(v2)
## [1] 1 3 1 1 1

attribut des données

attributes(cars)
## $names
## [1] "speed" "dist" 
## 
## $class
## [1] "data.frame"
## 
## $row.names
##  [1]  1  2  3  4  5  6  7  8  9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
## [26] 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50
str(cars)
## 'data.frame':    50 obs. of  2 variables:
##  $ speed: num  4 4 7 7 8 9 10 10 10 11 ...
##  $ dist : num  2 10 4 22 16 10 18 26 34 17 ...

les vecteurs

cette partie est consacrée aux vecteurs

x<-c(1,4,9)
y<-c(x,2,3)

affichage de y

## [1] 1 4 9 2 3

Suites arithmetriques

# c(a:b)
c(1 : 4) #a < b raison 1 
## [1] 1 2 3 4
c(4:1) #a > b raison-1
## [1] 4 3 2 1
c(1.4:7) # a-b n’est pas un entier
## [1] 1.4 2.4 3.4 4.4 5.4 6.4

la fonction seq permet de creer un vecteur

seq(0,8) # ici la raison est par defaut 1
## [1] 0 1 2 3 4 5 6 7 8
seq(0,8, 2) # un vecteur compris entre 1 et 6 de raison 2
## [1] 0 2 4 6 8
seq(0,8, length.out = 12) # avec length.out on fixe le nombre de terme 
##  [1] 0.0000000 0.7272727 1.4545455 2.1818182 2.9090909 3.6363636 4.3636364
##  [8] 5.0909091 5.8181818 6.5454545 7.2727273 8.0000000

matrices

Les matrices sont créées avec la fonction matrix() à partir d’un vecteur. On doit fixer le nombre de colonnes ncol et/ou le nombre de lignes nrow.

x= matrix(c(2,3,5,7,11,13),ncol=2)
x
##      [,1] [,2]
## [1,]    2    7
## [2,]    3   11
## [3,]    5   13

Par défaut la matrice est remplie colonne par colonne. Pour remplir ligne par ligne, on ajoute l’argument byrow=T.

y=matrix(c(2,3,5,7,11, 13),ncol=2, byrow=T)
y
##      [,1] [,2]
## [1,]    2    3
## [2,]    5    7
## [3,]   11   13
matrix(c(1:6), ncol=2, nrow=3) 
##      [,1] [,2]
## [1,]    1    4
## [2,]    2    5
## [3,]    3    6
matrix(c(1:9), ncol=3)
##      [,1] [,2] [,3]
## [1,]    1    4    7
## [2,]    2    5    8
## [3,]    3    6    9

selection

vect = c(2.5:10.5)
mat = matrix(vect, ncol = 3, nrow = 3)
mat
##      [,1] [,2] [,3]
## [1,]  2.5  5.5  8.5
## [2,]  3.5  6.5  9.5
## [3,]  4.5  7.5 10.5
vect
## [1]  2.5  3.5  4.5  5.5  6.5  7.5  8.5  9.5 10.5

selection de matrice

mat
##      [,1] [,2] [,3]
## [1,]  2.5  5.5  8.5
## [2,]  3.5  6.5  9.5
## [3,]  4.5  7.5 10.5
mat[2:3, c(1,3)]
##      [,1] [,2]
## [1,]  3.5  9.5
## [2,]  4.5 10.5
mat[c(1,3),c(1,3)]
##      [,1] [,2]
## [1,]  2.5  8.5
## [2,]  4.5 10.5
vect[3] # pour la troisieme données du vecteur
## [1] 4.5
mat[2,1] # valeur de la 2eme ligne, 1ere colonne
## [1] 3.5
mat[3, ]# valeur de la troisemme ligne, toutes les colonnes
## [1]  4.5  7.5 10.5

selectionne les 2eme, 4eme et 8em elmnt de vecteur

vect[c(2,4,8)] 
## [1] 3.5 5.5 9.5

tous les elements inferieur à 7

vect[vect<7] 
## [1] 2.5 3.5 4.5 5.5 6.5

tous les elements sup a 3 ou inf à 7

vect[vect< 7 |  vect> 3] 
## [1]  2.5  3.5  4.5  5.5  6.5  7.5  8.5  9.5 10.5

tous les elements inf à 3 et sup à 7

vect[vect< 7 &  vect> 3] 
## [1] 3.5 4.5 5.5 6.5

Quelques fonctions sur les matrices Sommes sur lignes

apply(mat, 1, sum)
## [1] 16.5 19.5 22.5

Sommes sur colonnes

apply(mat, 2, sum)
## [1] 10.5 19.5 28.5

diagonale d’une matrice

diag(mat)
## [1]  2.5  6.5 10.5

valeurs propres / vecteurs propre

eigen(mat)
## eigen() decomposition
## $values
## [1]  2.038309e+01 -8.830852e-01  2.761998e-16
## 
## $vectors
##            [,1]       [,2]       [,3]
## [1,] -0.4888581 -0.8610068  0.4082483
## [2,] -0.5732260 -0.1958088 -0.8164966
## [3,] -0.6575939  0.4693892  0.4082483

determinant de la matrice

det(mat)
## [1] -1.065814e-14

transposée de la matrice

t(mat)
##      [,1] [,2] [,3]
## [1,]  2.5  3.5  4.5
## [2,]  5.5  6.5  7.5
## [3,]  8.5  9.5 10.5

decomposition svd

svd(mat)
## $d
## [1] 2.096456e+01 8.585918e-01 1.003487e-16
## 
## $u
##            [,1]        [,2]       [,3]
## [1,] -0.4964360  0.76608396  0.4082483
## [2,] -0.5738774  0.06323061 -0.8164966
## [3,] -0.6513187 -0.63962274  0.4082483
## 
## $v
##            [,1]       [,2]       [,3]
## [1,] -0.2948116 -0.8639557 -0.4082483
## [2,] -0.5411748 -0.2011547  0.8164966
## [3,] -0.7875380  0.4616463 -0.4082483

Including Plots

You can also embed plots, for example:

plot(pressure)

Note that the echo = FALSE parameter was added to the code chunk to prevent printing of the R code that generated the plot.