Úvod do R
R je jazyk a prostředí pro statistické výpočty a grafiku. Je to GNU projekt, který je podobný S jazykem a životní prostředí, který byl vyvinut v Bellových Laboratořích (dříve V&T, nyní Lucent Technologies) John Chambers a kolegy. R lze považovat za jinou implementaci s. Existují některé důležité rozdíly, ale mnoho kódu napsaného pro S běží nezměněno pod R.
R poskytuje širokou škálu statistických (lineární a nelineární modelování, klasické statistické testy, časové řady analýzy, klasifikace, shlukování, …) a grafických technik, a je vysoce rozšiřitelný. Jazyk S je často prostředkem volby pro výzkum statistické metodiky, a R poskytuje otevřenou zdrojovou cestu k účasti na této činnosti.
jednou ze silných stránek R je snadnost, s jakou lze vytvářet dobře navržené grafy v publikační kvalitě, včetně matematických symbolů a vzorců v případě potřeby. Velká pozornost byla věnována výchozím hodnotám pro drobné volby designu v grafice, ale uživatel si zachovává plnou kontrolu.
R je k dispozici jako svobodný Software podle podmínek GNU General Public License Free Software Foundation ve formě zdrojového kódu. Kompiluje a běží na široké škále unixových platforem a podobných systémů (včetně FreeBSD a Linux), Windows a MacOS.
prostředí R
R je integrovaná sada softwarových zařízení pro manipulaci s daty, výpočet a grafické zobrazení. To zahrnuje,
- účinné zpracování údajů a skladovací zařízení,
- sadu operátorů pro výpočty na poli, zejména matrice,
- velké, soudržné, integrované shromažďování intermediate nástroje pro analýzu dat,
- grafické zařízení pro analýzu dat a zobrazení buď na obrazovce nebo v tištěné podobě, a
- dobře vyvinuté, jednoduchý a efektivní programovací jazyk, který zahrnuje podmínky, smyčky, uživatelem definované rekurzivní funkce a vstupní a výstupní zařízení.
pojem „prostředí“ je určen charakterizovat jako plně plánované a ucelený systém, spíše než postupné narůstání velmi specifické a nepružné nástroje, jak je často případ s jinými analýzu dat software.
R, stejně jako S, je navržen kolem skutečného počítačového jazyka a umožňuje uživatelům přidávat další funkce definováním nových funkcí. Velká část systému je sama o sobě napsána v dialektu R S, což uživatelům usnadňuje sledování algoritmických rozhodnutí. Pro výpočetně náročné úlohy lze kód C, C++ a Fortran propojit a volat v době běhu. Pokročilí uživatelé mohou psát C kód pro přímou manipulaci s objekty R.
mnoho uživatelů považuje R za statistický systém. Raději to považujeme za prostředí, ve kterém jsou implementovány statistické techniky. R lze rozšířit (snadno) prostřednictvím balíčků. Existuje asi osm balíčků dodávaných s distribucí R a mnoho dalších je k dispozici prostřednictvím rodiny internetových stránek CRAN pokrývajících velmi širokou škálu moderních statistik.
R má vlastní dokumentační formát podobný latexu, který se používá k dodávání komplexní dokumentace, a to jak on-line v řadě formátů, tak v tištěné podobě.