|
RapidMiner (früher YALE) unterstützt äußerst flexibel die Erstellung neuer und die Anpassung
bestehender Data Mining Prozesse.
Dies erlaubt die effiziente Suche nach den besten Data Mining Verfahren und der zugehörigen
Vorverarbeitung in Abhängigkeit von den gegebenen Daten und Aufgaben.
Diese einfache Anpassungen und Evaluationen verschiedener Prozessdefinitionen erlaubt einen
schnellen Vergleich zwischen verschiedenen Lösungen.
|
|
Durch das modulare Operatorkonzept braucht oftmals nur ein einziger Operator im Prozess
ersetzt zu werden, um seine Leistungsfähigkeit zu evaluieren.
Die übrige Prozessdefinition bleibt hingegen exakt die gleiche.
Dies ist eine wichtige Eigenschaft für die Optimierung von Data Mining Prozessen.
Um die Suche nach einer optimalen Repräsentation der Daten oder die Suche nach einer optimalen Vorverarbeitung
zu leiten, kann der Benutzer zusätzliche Metadaten definieren.
Diese beinhalten den Typ der Merkmale oder auch die Angabe, ob die Werte der Variable geordnet vorliegen.
Diese Informationen können beispielsweise von Verfahren zur Merkmalskonstruktion ausgenutzt werden.
Die Definition von Metadaten ist optional und RapidMiner versucht, die korrekten Typen automatisch zu erraten,
falls keine Metadaten angegeben werden.
|