HomeSucheSitemapImpressumKontakt
 
Daten und Metadaten

RapidMiner (früher YALE) unterstützt äußerst flexibel die Erstellung neuer und die Anpassung bestehender Data Mining Prozesse. Dies erlaubt die effiziente Suche nach den besten Data Mining Verfahren und der zugehörigen Vorverarbeitung in Abhängigkeit von den gegebenen Daten und Aufgaben. Diese einfache Anpassungen und Evaluationen verschiedener Prozessdefinitionen erlaubt einen schnellen Vergleich zwischen verschiedenen Lösungen.

Image

Durch das modulare Operatorkonzept braucht oftmals nur ein einziger Operator im Prozess ersetzt zu werden, um seine Leistungsfähigkeit zu evaluieren. Die übrige Prozessdefinition bleibt hingegen exakt die gleiche. Dies ist eine wichtige Eigenschaft für die Optimierung von Data Mining Prozessen.

Um die Suche nach einer optimalen Repräsentation der Daten oder die Suche nach einer optimalen Vorverarbeitung zu leiten, kann der Benutzer zusätzliche Metadaten definieren. Diese beinhalten den Typ der Merkmale oder auch die Angabe, ob die Werte der Variable geordnet vorliegen. Diese Informationen können beispielsweise von Verfahren zur Merkmalskonstruktion ausgenutzt werden. Die Definition von Metadaten ist optional und RapidMiner versucht, die korrekten Typen automatisch zu erraten, falls keine Metadaten angegeben werden.

 
< zurück   weiter >