R hat den nächsten Meilenstein erreicht: 10.000 Pakete auf CRAN. Von A3 bis zyp, von der ABC-Analyse bis zu Zero-Inflated Models – 10.000 R-Pakete bedeuten Vielfalt und Methoden für nahezu jeden Anwendungsfall. Anlässlich des Jubiläums haben wir die Top 10 der R-Pakete zusammengestellt und die gefragt, die es wissen müssen: unsere Data Scientists.
Unsere Top 10 der R-Pakete
- Hmisc: Hmisc war eines der ersten regelmäßig verwendeten R-Pakete bei eoda. Heute nutzen wir Hmisc kaum noch, aber aus nostalgischen Gründen ein klarer Fall für unsere Top 10.
- data.table: R als In-Memory-Datenbank mit data.table. Wer hat gesagt R wäre langsam?
- TraceR: Herausragendes Profiling-Paket. Findet jeden Flaschenhals.
- dplyR: Nicht nur schnell in der Auswertung, sondern auch leicht zu erlernen. Intuitives Datenmanagement mit R trägt einen Namen – dplyR.
- ggplot2: Der Garant für die einfache Erstellung anschaulicher Grafiken.
- magrittr: %>%. Der Pipe Operator macht aus komplizierten Verschachtelungen lesbare Verkettungen.
- shiny: Interaktive Webapplikationen mit geringem Programmieraufwand in HTML und JavaScript.
- tidyr: Sehr gute Funktionalitäten um Daten umzustrukturieren. Besonders hervorzuheben: Die Funktionen gather und spread, um Daten von long to wide-Format oder wide to long-Format zu konvertieren.
- caret: caret vereinheitlicht die Data Mining Algorithmen in einem Interface.
- rcpp: Ein Paket, das wir selber nicht explizit verwenden, aber trotzdem unverzichtbarer Bestandteil unserer Top 10 ist, da es wichtiger Bestandteil so vieler anderer guter R-Pakete ist.
Wir dürfen gespannt sein, welche R-Pakete in Zukunft zu unverzichtbaren Wegbegleitern werden und es in die Hitliste anlässlich des 20.000. R-Pakets schaffen.
Jetzt heißt es aber erstmal: Herzlichen Glückwunsch an die weltweite R-Community und das R Core-Team.