Commandes R : aperçu des commandes R de base

Les commandes R sont la base de l’analyse de données et de la modélisation statistique dans l’environnement R. Elles offrent les outils et la flexibilité nécessaires pour comprendre les données, détecter des schémas et prendre des décisions avisées.

Commandes R : qu’est-ce que c’est ?

Les commandes R (ou Commandes R en anglais) sont des instructions utilisées en programmation R pour exécuter des tâches spécifiques ou initier des tâches dans l’environnement R. Ces commandes permettent d’analyser des données, d’exécuter des calculs statistiques ou de créer des visualisations. Les commandes R peuvent être saisies et traitées dans la ligne de commande R ou dans les scripts R. Il est important de distinguer les commandes des fonctions R.

Les fonctions R sont des blocs de code définis et désignés sous R, qui exécutent des tâches spécifiques. Elles peuvent inclure l’utilisation d’opérateurs R et de données R afin d’accepter des arguments ou d’afficher des valeurs de retour. Cela signifie que les fonctions peuvent enregistrer, traiter et retourner des données qui sont associées à différents types de données R.

Conseil

Avec un hébergement Web de IONOS, vous bénéficiez d’au moins 50 Go de mémoire libre et de serveurs puissants à disponibilité élevée, qui veillent à ce que votre site Web soit toujours en ligne et qu’il charge rapidement. En outre, vous disposez d’un domaine gratuit et d’un certificat SSL Wildcard afin de garantir la sécurité de votre site Web.

Commandes R : liste des différentes commandes

La liste des commandes R suivante vous donne un aperçu des différents domaines d’application en programmation R. Selon vos projets et exigences spécifiques, vous pouvez sélectionner et combiner les commandes R appropriées.

Manipulation et traitement des données

  • read.csv() : lecture des données d’un fichier CSV
  • data.frame() : création d’une trame de données
  • subset() : filtrage des données sur la base de conditions spécifiques
  • merge() : fusion de données provenant de trames de données différentes
  • aggregate() : agrégation de données sur la base de critères spécifiques
  • transform() : création de nouvelles variables dans une trame de données
  • sort() : tri de vecteurs ou de trames de données
  • unique() : identification de valeurs uniques dans un vecteur ou une colonne

Visualisation des données

  • plot() : création de diagrammes de dispersion et d’autres types de diagrammes basiques
  • hist() : création d’histogrammes
  • barplot() : création de diagrammes à barres
  • boxplot() : création de boîtes à moustache
  • ggplot2::ggplot() : pour des visualisations plus exigeantes et personnalisables avec le paquet ggplot2

Analyses statistiques

  • summary() : préparation d’un regroupement de données, y compris les chiffres clés statistiques
  • lm() : exécution de régressions linaires
  • t.test() : exécution de tests T pour tester des hypothèses
  • cor() : calcul des coefficients de corrélation entre les variables
  • anova() : exécution d’analyses de la variance (ANOVA)
  • chi-sq.test() : pour les tests du chi carré

Traitement des données

  • ifelse() : pour les évaluations de la condition et les expressions conditionnelles
  • apply() : application d’une fonction à des matrices ou trames de données
  • dplyr::filter() : filtrage des données dans une trame de données avec le paquet dplyr
  • dplyr::mutate() : création de nouvelles variables dans les trames de données avec le paquet dplyr
  • lapply(), sapply(), mapply() : pour l’application de fonctions à des listes ou vecteurs

Importation et exportation des données

  • readRDS(), saveRDS() : lecture et enregistrement des objets de données R
  • write.csv(), read.table() : exportation et importation des données en différents formats

Diagrammes et graphiques statistiques

  • qqnorm(), qqline() : pour la création de diagrammes quantile-quantile
  • plot(), acf() : représentation de diagrammes d’autocorrélation
  • density() : représentation de fonctions de densité et d’histogrammes
  • heatmap() : création de cartes de densité

Commandes R : exemples d’utilisation

Les exemples de code suivants illustrent l’utilisation des principales commandes R dans divers domaines d’application. Selon vos exigences en matière de données et d’analyses, vous pouvez adapter et développer ces commandes.

Lecture des données d’un fichier CSV

data <- read.csv("donnees.csv")
R

Read.csv() est une commande permettant de lire les données présentes dans un fichier CSV, en R. Dans notre exemple, les données lues sont enregistrées dans la variable data. Cette commande est utile pour importer des données externes en R et pour mettre à disposition des analyses.

Création d’un diagramme de dispersion

plot(data$X, data$Y, main="DiagrammeDispersion")
R

Plot() est une commande R permettant de créer des diagrammes et des graphiques en R. Dans notre exemple, un diagramme de dispersion est créé afin de représenter la relation entre les variables X et Y de la trame de données data. L’argument main définit le titre du diagramme.

Exécution d’une régression linéaire

regression_model <- lm(Y ~ X, data=data)
R

Dans cet exemple, nous exécutons une régression linéaire afin de modéliser la relation entre les variables X et Y dans la trame de données data. La commande lm() sert à calculer une régression linéaire en R. Le résultat de la régression est enregistré dans la variable regression_model et peut être utilisé pour d’autres analyses.

Filtrage des données avec le paquet dplyr

filtered_data <- dplyr::filter(data, column > 10)
R

La commande dplyr::filter() provient du paquet dplyr et sera utilisée pour la manipulation des données. Le paquet dplyr fournit des fonctions puissantes pour le filtrage des données. Nous obtenons la variable filtered_data en sélectionnant les lignes de la trame de données data pour lesquelles la valeur de la colonne column est supérieure à 10.

Création de diagrammes quantile-quantile

qqnorm(data$Variable)
qqline(data$Variable)
R

Vous pouvez utiliser qqnorm() pour représenter un diagramme quantile-quantile en R. Dans cet exemple, un diagramme quantile-quantile est représenté pour la variable Variable de data. qqline() ajoute une ligne de référence afin de comparer la répartition avec une répartition normale.

Nous recommandons à tous les débutants de consulter le tutoriel de présentation de la programmation en R. Vous y trouverez de nombreux conseils et les connaissances de base nécessaires pour progresser avec le langage de programmation en R. D’autres conseils et bases sont disponibles dans notre article « Apprendre la programmation : principes de base » du Digital Guide.