10 Tips om att arbeta med paket i R

10 Tips om att arbeta med paket i R-dummies

En av de mycket attraktiva egenskaperna hos R är att den innehåller en stor samling av tredje part paket (samlingar av funktioner i ett väldefinierat format) . För att få ut mesta möjliga av R behöver du förstå var du ska hitta ytterligare paket, hur man hämtar och installerar dem och hur man använder dem.

Poking runt CRANs krökar och kranar

Det omfattande R Archive Network (CRAN) är ett nätverk av webbservrar runt om i världen där du kan hitta R-källkoden, R-manualer och dokumentation och medverkade paket.

CRAN är inte en enda webbplats; Det är en samling webbservrar, var och en med en identisk kopia av all information på CRAN. Således kallas varje webbserver en spegel. Tanken är att du väljer spegeln som ligger närmast där du befinner dig, vilket minskar internationell eller fjärrtrafik på Internet. Du kan hitta en lista med CRAN-speglar här.

Oavsett vilket R-gränssnitt du använder kan du permanent spara din favorit CRAN-spegel (och andra inställningar) i en speciell fil som heter. RProfile, som finns i användarens hemkatalog eller R-startkatalogen. Till exempel, för att ställa in Imperial College, UK-spegeln som din standard CRAN-spegel, inkludera den här raden i din. RProfile:

 alternativ ("repos" = c (CRAN = " // cran. Ma. Imperial. Ac. Uk /")) 

Hitta intressanta paket

I början av 2015 fanns det över 6 000 paket på CRAN. Det innebär att hitta ett paket för din uppgift till hands kan tyckas svårt.

Lyckligtvis har en handfull volontärexperter samlat några av de mest använda paketen i kurerade listor. Dessa listor kallas CRAN-uppgiftsvyer. Du kan hitta uppgiftsvyer för empirisk finansiering, statistisk genetik, maskininlärning, statistisk inlärning och många andra fascinerande ämnen.

Varje paket har sin egen webbsida på CRAN. På webbsidan för ett paket hittar du en sammanfattning, information om vilka paket som används, en länk till paketets webbplats (om en sådan webbplats finns) och annan användbar information.

Installera paket

För att installera ett paket, använd installationen. paket () funktion. Det här enkla kommandot hämtar paketet från ett specifikt förråd (som standard, CRAN) och installerar det på din maskin: >> installera. paket ("förmögenheter")

 Observera att argumentet att installera. paket () är en teckensträng. Med andra ord, kom ihåg citaten runt paketets namn! 

I RGui, liksom i RStudio, hittar du ett menykommando för att göra samma sak:

I RGui väljer du Paket → Installera paket (er).

  • I RStudio väljer du Verktyg → Installera paket ...

  • Laddar paket

För att ladda ett paket använder du funktionen bibliotek () eller () (). Dessa funktioner är identiska i sina effekter, men de skiljer sig i returvärdet:

library ()

  • : Returnerar osynligt en lista över paket som är bifogade eller slutar med ett fel om paketet inte är på din maskin kräver ()

  • : Returnerar TRUE om paketet var korrekt bifogat och FALSE om inte.

    R dokumentationen tyder på att biblioteket () är det bästa sättet att ladda paket i skript, medan kravet () föredras inom funktioner och paket.

Så, efter att du har installerat paketets förmögenheter, laddar du det så här: >> bibliotek ("förmögenheter")

Observera att du inte behöver citera paketets namn i bibliotekets argument , men det är bra att alltid citera paketets namn.

 

Även om det är möjligt att ladda ett paket inom en R-session med funktionen detach (), är det i praktiken oftast mycket lättare att helt enkelt starta om din R-session.

Läsning av paketmanualen och vignetten

Pakethandboken är en samling av alla funktioner och annan dokumentationsdokumentation. Du kan komma åt handboken på två sätt. Det första sättet är att använda hjälpargumentet till biblioteket () -funktionen:

>> bibliotek (help = "fortunes")

Det andra sättet är att hitta handboken på paketets hemsida. Om du pekar ditt webbläsarfönster till CRAN-sidan för förmögenhetspaketet kommer du att märka en länk till handboken längst ner på sidan.

Oavsett vilken metod du väljer, är resultatet ett PDF-dokument som innehåller pakethandboken.
 Vissa paketförfattare skriver också en eller flera 

vignetter,

dokument som illustrerar hur man använder paketet. En vignett visar vanligtvis några exempel på hur man använder funktionerna och hur man kommer igång. Det viktigaste är att en vignett illustrerar hur man använder paketet med R-kod och -utmatning, precis som den här boken.

För att läsa vignetten för förmögenhetspaketet, prova följande: >> vignette ("förmögenheter") Uppdatera paket För att säkerställa att du har den senaste versionen av ett paket, använd uppdatering. paket (): >> uppdatering. paket ()

Den här funktionen ansluter till CRAN (som standard) och kontrollerar om det finns uppdateringar för alla paket som du har installerat på din maskin. Om det finns, frågar du om du vill uppdatera varje paket och sedan hämtar koden och installerar den nya versionen.

 Om du lägger till uppdatering. paket (fråga = FALSE), R uppdaterar alla föråldrade paket i den aktuella biblioteksplatsen utan att fråga dig. Du kan också berätta uppdateringen. paket () för att titta på ett annat repository än CRAN genom att ändra repos argumentet. Om repos-argumentet pekar på en fil på din maskin (eller nätverk) installerar R paketet från den här filen. 

Både RGui och RStudio har menyalternativ som låter dig uppdatera paketet:

I RGui väljer du Paket → Uppdatera paket (er).

 I RStudio väljer du Verktyg → Sök efter paketuppdateringar ... 

Med båda programmen kan du grafiskt välja paket som ska uppdateras.

Smidigare med R-Forge

Även om det inte är helt sant, har paket på CRAN en viss miniminivå av löptid.

  • Så, var bor paket som lever i utvecklingscykeln? Sällan lever de hos R-Forge. R-Forge ger utvecklare en plattform för att utveckla och testa sina R-paket. Till exempel erbjuder R-Forge

Ett bygg- och kontrollsystem på Windows och Linux operativsystem (Mac OSX stöds inte)

Versionsstyrning

Felrapporteringssystem

Backup och administration

För att installera ett projekt från R-Forge, använder du också installationen. paket () -funktionen, men du måste ange repos-argumentet. Till exempel, för att installera utvecklingsversionen av paketdata. tabell, prova följande:
  • >> installera. paket ("data. table", repos = " // R-Forge. R-project. org")

  • Även om R-Forge inte har ett bygg- och kontrollsystem för Mac OSX specifikt kan Mac-användare installera och använda paket från R-Forge genom att installera källkodspaketet. Du hittar mer information i Vanliga frågor om Mac.

  • Få paket från github

  • Under de senaste åren har många utvecklare börjat använda github som kodutvecklingswebbplats. Även om github inte erbjuder någon av de R-specifika egenskaperna hos CRAN eller R-Forge, är det ibland lättare att dela kod genom att använda github. Så du kan ibland få instruktioner för att installera ett paket direkt från github.

På Linux och Mac OSX operativsystem är installation av paket från github relativt enkelt. Men på Windows måste du också installera RTools (en uppsättning kompilatorer och andra verktyg för att bygga paket från källan). För att installera RTools på en Windows-dator följ noga instruktionerna.
 Ledningsinstallationer från BioConductor 

BioConductor är ett förråd av R-paket och programvara, en samling verktyg som är specialiserade på analys av genomisk och relaterad data.

BioConductor har egna regler för utvecklare. Till exempel, för att installera ett paket från BioConductor måste du källa ett skript från servern: >> source (" // bioconductor. Org / biocLite. R")

Då kan du använda biocLite () funktion för att installera paket från BioConductor. Om du inte ger ett argument, installerar du bara de nödvändiga baspaketen från BioConductor-projektet.

BioConductor använder omfattande objektorienteringsprogrammering med S4-klasser.

Läsa R-manuell

Handboken "R Installation och Administration" är en omfattande guide till installation och administration av R. Kapitel 6 i denna handbok innehåller all information du behöver om att arbeta med paket.