Top 20 des fonctions à connaître sur R

Vous vous lancez dans l'apprentissage du langage R ? C'est une super idée !
Par contre, vous vous y perdez parmi toutes les fonctions disponibles ? OK, voici un petit guide pour vous y retrouver parmi les fonctions les plus utilisées et les plus utiles pour veiller à la perennité de vos scripts.

Manipulation de fichiers / dossiers en R

Vous pensez qu'il est indispensable d'utiliser votre explorateur pour parcourir vos fichiers et dossiers en R ?
Alors, non, R dispose d'une multitude de fonctions de base afin d'accéder aux éléments de votre ordinateurs. Parcourons quelques unes de ces fonctions ensemble.

  • ls()
    Liste tous les éléments de l'environnement.
  • rm(x)

    Supprime l'objet x de l'environnement de travail.
  • dir()

    Liste tous les éléments du répertoire de travail.

    Si un chemin de répertoire est mentionné en paramètre, la fonction retournera les éléments de ce répertoire.
  • list.files()

    Liste l'ensemble des fichiers du répertoire. S'il n'y a pas d'argument mentionné, la fonction retournera les éléments du répertoire courant.
  • getwd()
    Retourne le chemin du répertoire de travail.
  • setwd()
    Définit le chemin du répertoire de travail.

Traitement des chaines de caractères

Sans doute le type de traitement le plus répandu après le traitement arithmétique, voici quelques fonctions essentielles inclues de base dans R.

  • paste(x, y, z, ...)

    Permet de concaténer les éléments proposés en arguments et retourne une chaîne de caractères.
  • substr(x, start, stop)

    Extrait une chaîne de caractère depuis la chaîne x en spécifiant le début et la fin de l'extraction.
  • strsplit(x, split)

    Découpe la chaîne de caractères en fonction du séparateur défini dans l'argument split.

Information sur les objets

Hé oui, car préparer ses scripts pour qu'ils fonctionnent dans un cas précis, c'est bien, mais pour pouvoir vous assurer des scripts fonctionnels, il va falloir tester la valeurs de vos objets 🙂

Voici quelques fonctions de base qui sauront vous aider.

  • length(x)

    Renvoie le nombre d'éléments que contient l'objet x
  • nrow(x)

    Renvoie le nombre de lignes de l'objet x
  • ncol(x)

    Renvoie le nombre de colonnes de l'objet x
  • class(x)

    Renvoie la classe de l'objet x (liste, dataframe, entier...)
  • is.na(x), is.null(x)...
    Teste la valeur d'un objet et renvoie TRUE si l'objet est égal à NA ou si l'objet est NULL
  • exists(x)

    Teste l'existence d'un objet x. Si l'objet existe, la fonction renvoie TRUE. Sinon, FALSE.

Fonctions utilitaires de R

Pour finir, un petit tour d'horizon des requêtes vous permettant de mieux vous y retrouver parmi les fonctions de R ainsi que votre environnement.

  • help.start()

    Ouvre l'aide au format HTML
  • help(x) / ?
    Accéder à l'aide. Remplacez x par le nom de votre fonction. Par exemple
    help(print)
  • ls("package")

    Renvoie la liste de toutes les fonction d'un package.
  • print(x)
    Affiche l'argument mentionné dans le terminal.

N'hésitez pas à tester ces fonctions et les intégrer dans vos scripts R 😉

A propos de l'auteur

David Looses

David Looses est consultant en référencement sénior à l'agence SEO de Lille Aseox. Il est passionné par le langage R et est spécialiste du traitement des données.