Die useR!2017 ist am Freitag mit interessanten Talks und einer ganz besonderen Keynote zu Ende gegangen.
Programming with tidyverse grammars
Lionel Henry zeigte eine gelungene Einführung in das tidyverse. Das Augenmerk des Vortrags war das Thema Non-Standard Evaluation, welches das Arbeiten mit den direkten Variablen ermöglicht. Es wurden die Unterschiede zwischen quasiquoting und quosures hervorragend demonstriert. Zusätzlich wurde der neue Ausdruck „!!“ aus dem tidyverse auch mit einem Namen benannt. !! wird im R-Universum als „BANG-BANG“ bezeichnet. Der BANG-BANG Ausdruck wird innerhalb von dplyr und in Zukunft in weiteren Paketen verwendet, um Ausdrücke „quotes“ zu evaluieren.
Modules in R
Viele kennen es: das Problem mit der Benennung von Funktionen, da viele Funktionsnamen, wie z.B. filter, summarise oder spread, von oft verwendeten Paketen schon belegt sind. Innerhalb der modules werden die Namensräume definiert, also der Import und Export der Funktion. Tendenziell kann man sich vorstellen, dass durch modules eine Verwaltung von zusammenhängenden Funktionen bereitgestellt wird. Diese Module berechnen beispielsweise Minima, Maxima und Median. Diese Gruppe von Modulen wird dem Objekt Arithmetics zugewiesen, so kann über Arithmetics$Minima diese Funktion aufgerufen werden.
Ergebnisbewertung mit direkter Rückmeldung
Lucy DâAgostino McGowan hat in ihrem Vortrag „papr: Tinder for pre-prints, a Shiny Application for collecting gut-reactions to pre-prints from the scientific community“ ihre Shiny App vorgestellt, bei der wie bei Tinder Bewertungen vorgenommen werden können. Konkret ging es in ihrem Anwendungsfall um Paper, die auf diese Weise schnell bewertet werden können. Grundsätzlich ist dieser Ansatz höchst interessant, wenn es um die Bewertung von Ergebnissen geht und man eine direkte Rückmeldung hat, die in den nächsten Analysen eine direkte Anwendung finden kann.
Das Thema „Missing Data“
Ein zentraler Block widmete sich am Freitag dem Thema „Missing Data“. Konkret wurden die Pakete „naniar“, „simputation“, „amput“ und „imputeTS“ vorgestellt.
Der Vortrag von Rianne Schouten zu „amput“ stach aus der Vortragsreihe heraus, da sie kein impute-Paket, sondern mit amput ein Paket vorstellte, dass fehlende Werte in Datensätzen simuliert und dann impute Methoden auf diesen testet. Mit einer Fülle von zusätzlichen Parametern lassen sich verschiedenste Szenarien simulieren, wodurch Modelle in Vorbereitung auf den Ernstfall getestet und verfeinert werden können.
Das Paket „imputeTS“ von Steffen Moritz stellt verschiedene Routinen bereit, um fehlende Werte bei Zeitreihen zu berechnen. Neben Verfahren, die eine Notlösung bereitstellen und normalerweise in der Praxis eine „Quick-and-Dirty“ Lösung darstellen, wie z.B. die Imputation über den Mittelwert, wurden auch Verfahren wie ein Seasplit, ein auf Saisonalität basierendes Verfahren, vorgestellt, welches die fehlenden Werte berechnet. Zum Abschluss gab es zusätzlich einen aufschlussreichen Überblick über die Wahl des richtigen Algorithmus für die Imputation.
„The most important driver of the history of R“
Eine großartige useR! Konferenz hat in der Keynote von Uwe Ligges einen würdigen Abschluss gefunden. Das Thema: „20 years of CRAN“. Ligges hat einen Überblick über CRAN und seine Geschichte gegeben, erklärt welche Aufgaben mit der Rolle eines CRAN-Maintainer einhergehen und wie komplex das System in Bezug auf Paketabhängigkeiten ist.
David Smith von Microsoft bezeichnete CRAN als „the most important driver of the history of R“ und so zeigte sich das Publikum sehr dankbar für das lange Engagement Ligges‘ für das Comprehensive R Archive Network.
Ein bemerkenswerter, da für viele Zuhörer überraschender Aspekt, war Ligges‘ Aussprache des Namens „CRAN“: „see-ran“.
Die Bilder des letzten Tags finden Sie hier.
Hier entlang.