|
Das modulare Operatorkonzept von RapidMiner (früher YALE) erlaubt das
Design von komplexen verschachtelten Data Mining Prozessen zur
Bearbeitung aller gängigen Data Mining Aufgaben in schnellster Weise
(Rapid Prototyping).
Die Datenquellen sind dabei transparent für die einzelnen Operatoren,
d.h. sie brauchen keinen Zugriff auf die Quellen selbst und arbeiten
nur mit mehreren - auch übereinander gestapelten - Sichten auf die Daten.
Der RapidMiner Kern übernimmt alle notwendigen Transformationen.
Erfahren Sie auf dieser Seite mehr über die wichtigsten Eigenschaften
von RapidMiner.
|
Die Wissensentdeckung in Datenbanken (Knowledge Discovery in Databases, KDD)
ist eine komplexe und fordernde Aufgabe.
Obwohl sich bereits viele Methoden für bestimmte Probleme etabliert haben,
bleiben zahlreiche Herausforderungen bestehen.
Rapid Prototyping ist ein Ansatz, welcher erlaubt, kritische Designentscheidungen
so früh wie möglich zu treffen.
Ein Rapid Prototyping System sollte maximale Wiederverwendbarkeit
genauso unterstützen wie die innovative Kombination bereits existierender Lösungen.
Eine einfache Integration neuer Methoden ist ebenso zu unterstützen.
|
Die wichtigsten Features von RapidMiner sind:
- frei erhältliche open-source Data Mining Anwendung und Bilbiothek
- 100% Java (läuft auf jedem gängigen Betriebssystem)
- Data Mining Prozesse werden durch einfache Operatorbäume
modelliert was sowohl mächtig als auch intuitiv ist
- Operatorbäume oder Teilbäume können als Building Blocks zur späteren
Wiederverwendung gespeichert werden
- Interne XML Repräsentation sichert ein standardisiertes Austauschformat
für Data Mining Prozesse
- Eine einfache Skriptsprache erlaubt automatisierte large-scale Prozesse
- Das Multi-Layered Data View Concept sorgt für effiziente und transparente
Datenzugriffe unabhängig von der tatsächlichen Quelle und ohne unnötige Kopien von Daten
- Verschiedene Ausführungsmodi:
- Graphische Benutzeroberfläche (GUI) für interaktives Prototyping
- Kommandozeilenversion (batch mode) für automatisierte large-scale Anwendungen
- Java API (application programming interface) um eine Einbindung von
RapidMiner in eigene Programmen zu ermöglichen
- Einfache Plugin- und Erweiterungsmechanismen, eine breite Vielfalt von Plugins
existiert bereits und eigene Plugins können leicht hinzugefügt werden
- Eine mächtige Visualisierungsengine mit zahlreichen ausgefeilten
Visualisierungen hochdimensionaler Daten und Modellen
- Mehr als 400 Operatoren zum Data Mining, zur Evaluierungs, Ein- und Ausgabe,
Vorverarbeitung und Visualisierung sowie viele Metaoptimierungsverfahren
- Die Machine Learning Bibliothek WEKA ist vollständig integriert
(WEKA Webseite)
- YALE wurde bereits erfolgreich angewendet in unterschiedlichsten Anwendungsfeldern,
in denen die Rapid Prototyping Fähigkeiten ihre Nützlichkeit bewiesen, darunter
Text Mining, Multimedia Mining, Feature Engineering,
Data Stream Mining, die Entwicklung von Ensemble-Methoden sowie
verteiltes Data Mining.
|
Eine Zusammenfassung aller RapidMiner Operatoren finden Sie auf der folgenden
Übersichtsseite.
|
|
|