introduktion till R
R är ett språk och en miljö för statistisk databehandling och grafik. Det är ett GNU-projekt som liknar s-språket och miljön som utvecklades vid Bell Laboratories (tidigare vid&t, nu Lucent Technologies) av John Chambers och kollegor. R kan betraktas som en annan implementering av S. Det finns några viktiga skillnader, men mycket kod skriven för S körs oförändrat under R.
r ger ett brett utbud av statistiska (linjär och olinjär modellering, klassiska statistiska tester, tidsserieanalys, klassificering, kluster,…) och grafiska tekniker och är mycket utbyggbar. S-språket är ofta det valfria fordonet för forskning inom statistisk metodik, och R ger en öppen Källväg till deltagande i den aktiviteten.
en av r: s styrkor är den lätthet med vilken väldesignade publiceringskvalitetsplaner kan produceras, inklusive matematiska symboler och formler där det behövs. Stor omsorg har tagits över standardvärdena för de mindre designvalen i grafik, men användaren behåller full kontroll.
R är tillgänglig som fri programvara enligt villkoren i Free Software Foundation GNU General Public License i källkodsform. Den sammanställer och körs på en mängd olika UNIX-plattformar och liknande system (inklusive FreeBSD och Linux), Windows och MacOS.
r-miljön
R är en integrerad svit av programvaruanläggningar för datamanipulation, beräkning och grafisk visning. Den innehåller
- en effektiv datahanterings-och lagringsanläggning,
- en serie operatörer för beräkningar på matriser, särskilt matriser,
- en stor, sammanhängande, integrerad samling av mellanliggande verktyg för dataanalys,
- grafiska anläggningar för dataanalys och visning antingen på skärmen eller på papperskopia, och
- ett välutvecklat, enkelt och effektivt programmeringsspråk som inkluderar villkor, loopar, användardefinierade rekursiva funktioner och inmatnings-och utgångsanläggningar.
termen ”miljö” är avsedd att karakterisera det som ett helt planerat och sammanhängande system, snarare än en inkrementell accretion av mycket specifika och oflexibla verktyg, vilket ofta är fallet med annan dataanalysprogramvara.
R, som S, är utformad kring ett riktigt datorspråk, och det tillåter användare att lägga till ytterligare funktioner genom att definiera nya funktioner. Mycket av systemet är själv skrivet i r-dialekten av S, vilket gör det enkelt för användare att följa de algoritmiska val som gjorts. För beräkningsintensiva uppgifter kan C, C++ och Fortran-kod länkas och ringas vid körtid. Avancerade användare kan skriva C-kod för att manipulera r-objekt direkt.
många användare tänker på R som ett statistiksystem. Vi föredrar att tänka på det som en miljö inom vilken statistiska tekniker implementeras. R kan förlängas (enkelt) via paket. Det finns cirka åtta paket som levereras med R-distributionen och många fler är tillgängliga via CRAN-familjen av webbplatser som täcker ett mycket brett utbud av modern statistik.
R har sitt eget LaTeX-liknande dokumentationsformat, som används för att leverera omfattande dokumentation, både online i ett antal format och i papperskopia.