|
RapidMiner (früher YALE) unterstützt das interaktive Design von komplexen Data Mining Prozessen und ihrer Evaluation.
Iterativ werden Teile des Prozesses geändert oder optimiert bis die gewünschten Ergebnisse erzielt werden.
Data Mining Prozesse werden innerhalb von RapidMiner als Operatorbäume modelliert.
Anders als bei den meisten anderen Data Mining Tools werden die Operatoren in RapidMiner also nicht
in einem beliebigen Graphen angeordnet und durch den Nutzer verbunden.
Trotz der vollen Mächtigkeit dieses Operatorbaumkonzepts ist diese Beschränkung äußerst intuitiv:
Der Datenfluss innerhalb eines solchen Baums ist stets gleich und folgt dem bekannten Prinzip der
Tiefensuche.
Dies vereinfacht das Design von Data Mining Prozessen entscheidend.
Innere Operatoren werden von ihren Eltern aufgerufen und arbeiten auf den Daten, welche die Eltern
bereitstellen.
Die vollständigen Bäume können durch XML beschrieben werden was RapidMiner in eine mächtige Data Mining
Skriptsprachen Engine verwandelt.
Zusammen mit der graphischen Benutzeroberfläche stellt RapidMiner somit eine erste vollständige
intergrierte Entwicklungsumgebung (IDE) für Data Mining dar.
Nach Abschluss der Designphase wird der erstellte Prozess durchgeführt und evaluiert.
Das modulare Konzept von RapidMiner erlaubt Änderungen in schnellster Weise bevor die
Wirkung dieser Änderungen erneut evaluiert werden kann.
Die Open-Source Data Mining Software RapidMiner hat diese Stärken bereits in einer
Vielzahl von Anwendungen unter Beweis gestellt, darunter Text Mining, Multimedia Mining,
Data Stream Mining und Aktienkursprognose.
|