Qu’est-ce que R ?

Introduction à R

R est un langage et un environnement pour le calcul statistique et les graphiques. C’est un projet GNU qui est similaire au langage et à l’environnement S qui a été développé aux Laboratoires Bell (anciennement À &T, maintenant Lucent Technologies) par John Chambers et ses collègues. R peut être considéré comme une implémentation différente de S. Il y a quelques différences importantes, mais beaucoup de code écrit pour S fonctionne sans modification sous R.

R fournit une grande variété de techniques statistiques (modélisation linéaire et non linéaire, tests statistiques classiques, analyse de séries chronologiques, classification, clustering, …) et graphiques, et est très extensible. Le langage S est souvent le véhicule de choix pour la recherche en méthodologie statistique, et R fournit une voie Open Source pour participer à cette activité.

L’une des forces de R est la facilité avec laquelle des graphiques de qualité de publication bien conçus peuvent être produits, y compris des symboles mathématiques et des formules si nécessaire. Un grand soin a été apporté aux paramètres par défaut pour les choix de conception mineurs dans les graphiques, mais l’utilisateur conserve le contrôle total.

R est disponible en tant que Logiciel Libre selon les termes de la Licence Publique Générale GNU de la Free Software Foundation sous forme de code source. Il compile et fonctionne sur une grande variété de plates-formes UNIX et de systèmes similaires (y compris FreeBSD et Linux), Windows et macOS.

L’environnement R

R est une suite logicielle intégrée pour la manipulation, le calcul et l’affichage graphique des données. Il comprend

  • une installation efficace de traitement et de stockage des données,
  • une suite d’opérateurs pour les calculs sur des tableaux, en particulier des matrices,
  • une vaste collection cohérente et intégrée d’outils intermédiaires pour l’analyse des données,
  • des installations graphiques pour l’analyse et l’affichage des données à l’écran ou sur papier, et
  • un langage de programmation bien développé, simple et efficace qui comprend des conditions, des boucles, des fonctions récursives définies par l’utilisateur et des installations d’entrée et de sortie.

Le terme « environnement » vise à le caractériser comme un système entièrement planifié et cohérent, plutôt que comme une accumulation progressive d’outils très spécifiques et inflexibles, comme c’est souvent le cas avec d’autres logiciels d’analyse de données.

R, comme S, est conçu autour d’un véritable langage informatique, et il permet aux utilisateurs d’ajouter des fonctionnalités supplémentaires en définissant de nouvelles fonctions. Une grande partie du système est elle-même écrite dans le dialecte R de S, ce qui permet aux utilisateurs de suivre facilement les choix algorithmiques effectués. Pour les tâches à forte intensité de calcul, le code C, C++ et Fortran peut être lié et appelé au moment de l’exécution. Les utilisateurs avancés peuvent écrire du code C pour manipuler directement les objets R.

De nombreux utilisateurs considèrent R comme un système de statistiques. Nous préférons le considérer comme un environnement dans lequel les techniques statistiques sont mises en œuvre. R peut être étendu (facilement) via des paquets. Il y a environ huit paquets fournis avec la distribution R et beaucoup d’autres sont disponibles via la famille de sites Internet CRAN couvrant un très large éventail de statistiques modernes.

R a son propre format de documentation de type LaTeX, qui est utilisé pour fournir une documentation complète, à la fois en ligne dans un certain nombre de formats et sur papier.

Related Posts

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *