Unter dem Titel Big Data Analytics: Benchmarking SAS, R and Mahout. hat SAS am 26. April auf der SAS-Webseite einen Vergleich von SAS, R und Apache Mahout veröffentlicht.
In einem zweiteiligen Blog-Beitrag setzt sich Thomas Dinsmore, Director of Product Management bei Revolution Analytics , kritisch mit dem Text auseinander. Der erste Teil beschäftigt sich mit fehlerhaften Darstellungen und offenen Fragen im Zusammenhang mit dem Benchmark.
Dinsmore arbeitet dabei unter anderem heraus, dass R im Gegensatz zur Darstellung in dem SAS-Papier sehr wohl Ensemble-Verfahren unterstützt und verweist dabei auf die folgenden Pakete:
gbm, mboost, party, randomForest (mehr), caret
Mit Hilfe von Ensemble Verfahren werden die Ergebnisse mehrerer Prognose-Modelle zusammengefasst, um dadurch die Vorhersagequalität zu erhöhen.
Dieser erste Beitrag enthält darüber hinaus eine Liste von offenen Fragen, die interessierte Nutzer bei einem Vergleich von R, SAS und anderen Lösungen für Predictive Modeling berücksichtigen sollten. So wird in dem Benchmark von SAS auf diverse Details nicht eingegangen, die für einen ernsthaften und aussagekräftigen Vergleich notwendig wären. Dazu zählen unter anderem eingehende Informationen zu den verwendeten Paketen, Parametern in Modellen, oder Größe der verwendeten Daten.
Hier entlang.