Introducción a R
R es un lenguaje y entorno para computación estadística y gráficos. Es un proyecto GNU que es similar al lenguaje y entorno S que fue desarrollado en Bell Laboratories (anteriormente EN& T, ahora Lucent Technologies) por John Chambers y colegas. R puede considerarse como una implementación diferente de S. Hay algunas diferencias importantes, pero gran parte del código escrito para S se ejecuta inalterado bajo R.
R proporciona una amplia variedad de técnicas estadísticas (modelado lineal y no lineal, pruebas estadísticas clásicas, análisis de series temporales, clasificación, agrupación, clus) y gráficas, y es altamente extensible. El lenguaje S es a menudo el vehículo de elección para la investigación en metodología estadística, y R proporciona una ruta de Código abierto para la participación en esa actividad.
Uno de los puntos fuertes de R es la facilidad con la que se pueden producir gráficos de calidad de publicación bien diseñados, incluidos símbolos matemáticos y fórmulas cuando sea necesario. Se ha tenido mucho cuidado con los valores predeterminados para las opciones de diseño menores en gráficos, pero el usuario conserva el control total.
R está disponible como Software Libre bajo los términos de la Licencia Pública General GNU de la Free Software Foundation en forma de código fuente. Compila y se ejecuta en una amplia variedad de plataformas UNIX y sistemas similares (incluidos FreeBSD y Linux), Windows y macOS.
El entorno R
R es un conjunto integrado de instalaciones de software para manipulación de datos, cálculo y visualización gráfica. Incluye
- una instalación eficaz de almacenamiento y manejo de datos,
- un conjunto de operadores para cálculos en matrices, en particular matrices,
- una colección grande, coherente e integrada de herramientas intermedias para el análisis de datos,
- instalaciones gráficas para el análisis y visualización de datos en pantalla o en papel, y
- un lenguaje de programación bien desarrollado, simple y eficaz que incluye condicionales, bucles, funciones recursivas definidas por el usuario e instalaciones de entrada y salida.
El término «entorno» pretende caracterizarlo como un sistema totalmente planificado y coherente, en lugar de una acumulación incremental de herramientas muy específicas e inflexibles, como suele ser el caso con otros programas de análisis de datos.
R, al igual que S, está diseñado en torno a un verdadero lenguaje informático, y permite a los usuarios agregar funcionalidad adicional definiendo nuevas funciones. Gran parte del sistema está escrito en el dialecto R de S, lo que facilita a los usuarios seguir las elecciones algorítmicas realizadas. Para tareas de uso intensivo de computación, el código de C, C++ y Fortran se puede vincular y llamar en tiempo de ejecución. Los usuarios avanzados pueden escribir código C para manipular objetos R directamente.
Muchos usuarios piensan en R como un sistema de estadísticas. Preferimos considerarlo como un entorno en el que se implementan técnicas estadísticas. R se puede extender (fácilmente) a través de paquetes. Hay alrededor de ocho paquetes suministrados con la distribución R y muchos más están disponibles a través de la familia de sitios de Internet CRAN que cubren una amplia gama de estadísticas modernas.
R tiene su propio formato de documentación similar a LaTeX, que se utiliza para proporcionar documentación completa, tanto en línea en varios formatos como en papel.