Formats de données en R

Les vecteurs

Il est possible de créer manuellement des vecteurs grâce à la fonction c(). Voici quelques exemples :

a <- c(1, 2, 3) # vecteur numérique
b <- c("one", "two", "three") # vecteur de caractères
c <- c(TRUE, FALSE, FALSE) # vecteur logique

 

Matrices

En R, les matrices sont des types de tableau comprenant des ensemble de données. La spécificité des matrices réside dans les de données utilisées. Ainsi, chaque colonne doit être du même type. La longueur de chaque colonne doit également être la même.

L'ajout de données dans la matrice se fait de manière linéaire, par ligne en définissant le paramètres byrow = TRUE ou par colonnes en définissant le paramètre byrow = FALSE.

Voici un exemple de création de matrice.

data <- c(98,901,33,27) # mon vecteur de données
rowNames <- c("Row1", "Row2") # un vecteur contenant le nom de mes lignes
colNames <- c("Col1", "Col2")
maMatrice <- matrix(data, nrow=2, ncol=2, byrow=TRUE,
dimnames = list(rowNames, colNames))

 

Data frames

Si les matrices doivent disposer du même type de données, ce n'est pas le cas des dataframes. Les dataframes peuvent ainsi disposer de colonnes comportant des types de données différentes. Vous pouvez ainsi associer des colonnes comportant des nombres, des caractères, des booléens...

Pour créer un dataframe, vous pouvez utiliser la fonction data.frame().

Voici un exemple de dataframe reposant sur ce principe :

a <- c(1,2,3,4) # vecteur numérique
b <- c("rouge", "blanc", "rouge", NA) # vecteur de caractères
c <- c(TRUE,TRUE,TRUE,FALSE) # vecteur de booléens
monDataframe <- data.frame(a,b,c) # Mon dataframe

 

Listes

Les listes sont des collections d'objets ordonnées pouvant contenir une variété de types d'objets. La création d'une liste se fait grâce à la fonction list(). Voici un exemple :

maListe <- list(mesCharacteres = "Emma", monVecteur = a, maMatrice = y, monNombre = 42, monBooleen = TRUE)

 

Article précédent
Supprimer un objet en R
Article suivant
Formats de dates

A propos de l'auteur

David Looses

David Looses est consultant en référencement sénior à l'agence SEO de Lille Aseox. Il est passionné par le langage R et est spécialiste du traitement des données.