Les commandes R sont la base de l’analyse de données et de la mo­dé­li­sa­tion sta­tis­tique dans l’en­vi­ron­ne­ment R. Elles offrent les outils et la flexi­bi­lité né­ces­saires pour com­prendre les données, détecter des schémas et prendre des décisions avisées.

Commandes R : qu’est-ce que c’est ?

Les commandes R (ou Commandes R en anglais) sont des ins­truc­tions utilisées en pro­gram­ma­tion R pour exécuter des tâches spé­ci­fiques ou initier des tâches dans l’en­vi­ron­ne­ment R. Ces commandes per­met­tent d’analyser des données, d’exécuter des calculs sta­tis­tiques ou de créer des vi­sua­li­sa­tions. Les commandes R peuvent être saisies et traitées dans la ligne de commande R ou dans les scripts R. Il est important de dis­tin­guer les commandes des fonctions R.

Les fonctions R sont des blocs de code définis et désignés sous R, qui exécutent des tâches spé­ci­fiques. Elles peuvent inclure l’uti­li­sa­tion d’opé­ra­teurs R et de données R afin d’accepter des arguments ou d’afficher des valeurs de retour. Cela signifie que les fonctions peuvent en­re­gis­trer, traiter et retourner des données qui sont associées à dif­fé­rents types de données R.

Conseil

Avec un hé­ber­ge­ment Web de IONOS, vous bé­né­fi­ciez d’au moins 50 Go de mémoire libre et de serveurs puissants à dis­po­ni­bi­lité élevée, qui veillent à ce que votre site Web soit toujours en ligne et qu’il charge ra­pi­de­ment. En outre, vous disposez d’un domaine gratuit et d’un cer­ti­fi­cat SSL Wildcard afin de garantir la sécurité de votre site Web.

Commandes R : liste des dif­fé­rentes commandes

La liste des commandes R suivante vous donne un aperçu des dif­fé­rents domaines d’ap­pli­ca­tion en pro­gram­ma­tion R. Selon vos projets et exigences spé­ci­fiques, vous pouvez sé­lec­tion­ner et combiner les commandes R ap­pro­priées.

Ma­ni­pu­la­tion et trai­te­ment des données

  • read.csv() : lecture des données d’un fichier CSV
  • data.frame() : création d’une trame de données
  • subset() : filtrage des données sur la base de con­di­tions spé­ci­fiques
  • merge() : fusion de données provenant de trames de données dif­fé­rentes
  • aggregate() : agré­ga­tion de données sur la base de critères spé­ci­fiques
  • transform() : création de nouvelles variables dans une trame de données
  • sort() : tri de vecteurs ou de trames de données
  • unique() : iden­ti­fi­ca­tion de valeurs uniques dans un vecteur ou une colonne

Vi­sua­li­sa­tion des données

  • plot() : création de dia­grammes de dis­per­sion et d’autres types de dia­grammes basiques
  • hist() : création d’his­to­grammes
  • barplot() : création de dia­grammes à barres
  • boxplot() : création de boîtes à moustache
  • ggplot2::ggplot() : pour des vi­sua­li­sa­tions plus exi­geantes et per­son­na­li­sables avec le paquet ggplot2

Analyses sta­tis­tiques

  • summary() : pré­pa­ra­tion d’un re­grou­pe­ment de données, y compris les chiffres clés sta­tis­tiques
  • lm() : exécution de ré­gres­sions linaires
  • t.test() : exécution de tests T pour tester des hy­po­thèses
  • cor() : calcul des coef­fi­cients de cor­ré­la­tion entre les variables
  • anova() : exécution d’analyses de la variance (ANOVA)
  • chi-sq.test() : pour les tests du chi carré

Trai­te­ment des données

  • ifelse() : pour les éva­lua­tions de la condition et les ex­pres­sions con­di­tion­nelles
  • apply() : ap­pli­ca­tion d’une fonction à des matrices ou trames de données
  • dplyr::filter() : filtrage des données dans une trame de données avec le paquet dplyr
  • dplyr::mutate() : création de nouvelles variables dans les trames de données avec le paquet dplyr
  • lapply(), sapply(), mapply() : pour l’ap­pli­ca­tion de fonctions à des listes ou vecteurs

Im­por­ta­tion et ex­por­ta­tion des données

  • readRDS(), saveRDS() : lecture et en­re­gis­tre­ment des objets de données R
  • write.csv(), read.table() : ex­por­ta­tion et im­por­ta­tion des données en dif­fé­rents formats

Dia­grammes et gra­phiques sta­tis­tiques

  • qqnorm(), qqline() : pour la création de dia­grammes quantile-quantile
  • plot(), acf() : re­pré­sen­ta­tion de dia­grammes d’au­to­cor­ré­la­tion
  • density() : re­pré­sen­ta­tion de fonctions de densité et d’his­to­grammes
  • heatmap() : création de cartes de densité

Commandes R : exemples d’uti­li­sa­tion

Les exemples de code suivants il­lustrent l’uti­li­sa­tion des prin­ci­pales commandes R dans divers domaines d’ap­pli­ca­tion. Selon vos exigences en matière de données et d’analyses, vous pouvez adapter et dé­ve­lop­per ces commandes.

Lecture des données d’un fichier CSV

data <- read.csv("donnees.csv")
R

Read.csv() est une commande per­met­tant de lire les données présentes dans un fichier CSV, en R. Dans notre exemple, les données lues sont en­re­gis­trées dans la variable data. Cette commande est utile pour importer des données externes en R et pour mettre à dis­po­si­tion des analyses.

Création d’un diagramme de dis­per­sion

plot(data$X, data$Y, main="DiagrammeDispersion")
R

Plot() est une commande R per­met­tant de créer des dia­grammes et des gra­phiques en R. Dans notre exemple, un diagramme de dis­per­sion est créé afin de re­pré­sen­ter la relation entre les variables X et Y de la trame de données data. L’argument main définit le titre du diagramme.

Exécution d’une ré­gres­sion linéaire

regression_model <- lm(Y ~ X, data=data)
R

Dans cet exemple, nous exécutons une ré­gres­sion linéaire afin de modéliser la relation entre les variables X et Y dans la trame de données data. La commande lm() sert à calculer une ré­gres­sion linéaire en R. Le résultat de la ré­gres­sion est en­re­gis­tré dans la variable regression_model et peut être utilisé pour d’autres analyses.

Filtrage des données avec le paquet dplyr

filtered_data <- dplyr::filter(data, column > 10)
R

La commande dplyr::filter() provient du paquet dplyr et sera utilisée pour la ma­ni­pu­la­tion des données. Le paquet dplyr fournit des fonctions puis­santes pour le filtrage des données. Nous obtenons la variable filtered_data en sé­lec­tion­nant les lignes de la trame de données data pour les­quelles la valeur de la colonne column est su­pé­rieure à 10.

Création de dia­grammes quantile-quantile

qqnorm(data$Variable)
qqline(data$Variable)
R

Vous pouvez utiliser qqnorm() pour re­pré­sen­ter un diagramme quantile-quantile en R. Dans cet exemple, un diagramme quantile-quantile est re­pré­senté pour la variable Variable de data. qqline() ajoute une ligne de référence afin de comparer la ré­par­ti­tion avec une ré­par­ti­tion normale.

Nous re­com­man­dons à tous les débutants de consulter le tutoriel de pré­sen­ta­tion de la pro­gram­ma­tion en R. Vous y trouverez de nombreux conseils et les con­nais­sances de base né­ces­saires pour pro­gres­ser avec le langage de pro­gram­ma­tion en R. D’autres conseils et bases sont dis­po­nibles dans notre article « Apprendre la pro­gram­ma­tion : principes de base » du Digital Guide.

Aller au menu principal