Introduktion til R
R er et sprog og miljø for statistisk computing og grafik. Det er et GNU-projekt, der ligner s sprog og miljø, som blev udviklet på Bell Laboratories (tidligere på&t, nu Lucent Technologies) af John Chambers og kolleger. R kan betragtes som en anden implementering af S. Der er nogle vigtige forskelle, men meget kode skrevet til S kører uændret under R.
R giver en bred vifte af statistiske (lineær og ikke-lineær modellering, klassiske statistiske tests, tidsserieanalyse, klassificering, klyngedannelse, …) og grafiske teknikker og er meget udvidelig. S-sproget er ofte det valgte middel til forskning i statistisk metode, og R giver en Open Source-rute til deltagelse i denne aktivitet.
en af R ‘ s styrker er den lethed, hvormed veldesignede plots af publikationskvalitet kan produceres, herunder matematiske symboler og formler, hvor det er nødvendigt. Der er taget stor omhu over standardindstillingerne for de mindre designvalg i grafik, men brugeren bevarer fuld kontrol.
R er tilgængelig som gratis program under betingelserne i gratis Programfondens GNU General Public License i kildekodeform. Det samler og kører på en lang række forskellige platforme og lignende systemer (herunder FreeBSD og MacOS), vinduer og MacOS.
r-miljøet
R er en integreret pakke af programmelfaciliteter til datamanipulation, beregning og grafisk visning. Det inkluderer
- en effektiv datahåndterings-og lagerfacilitet,
- en række operatører til beregninger på arrays, især matricer,
- en stor, sammenhængende, integreret samling af mellemværktøjer til dataanalyse,
- grafiske faciliteter til dataanalyse og visning enten på skærmen eller på hardcopy, og
- et veludviklet, enkelt og effektivt programmeringssprog, der inkluderer betingede, sløjfer, brugerdefinerede rekursive funktioner og input-og outputfaciliteter.
udtrykket “miljø” er beregnet til at karakterisere det som et fuldt planlagt og sammenhængende system snarere end en trinvis tilvækst af meget specifikke og ufleksible værktøjer, som det ofte er tilfældet med andre dataanalyseprogrammer.
R, som S, er designet omkring et ægte computersprog, og det giver brugerne mulighed for at tilføje yderligere funktionalitet ved at definere nye funktioner. Meget af systemet er selv skrevet i R dialekt af S, hvilket gør det nemt for brugerne at følge de algoritmiske valg. Til beregningsintensive opgaver kan C, C++ og Fortran-kode knyttes sammen og kaldes på kørselstid. Avancerede brugere kan skrive C-kode for at manipulere R-objekter direkte.
mange brugere tænker på R som et statistiksystem. Vi foretrækker at tænke på det som et miljø, inden for hvilket statistiske teknikker implementeres. R kan udvides (let) via pakker. Der er omkring otte pakker, der leveres med R-distributionen, og mange flere er tilgængelige via CRAN-familien af internetsider, der dækker en meget bred vifte af moderne statistikker.
R har sit eget lateks-lignende dokumentationsformat, som bruges til at levere omfattende dokumentation, både online i en række formater og i hardcopy.