Neues Release: Am Dienstag, den 31. Juli 2007 hat Rapid-I die neue Version der Open-Source Software RapidMiner 4.0 (früher: YALE) veröffentlicht.
Aus rechtlichen Gründen hat sich Rapid-I entschieden, YALE umzubenennen. Als neuer Name wurde RapidMiner gewählt, weil dieser Name besonders gut zum Unternehmensnamen Rapid-I und zum vorgesehenen Namensschema für die von Rapid-I geplante Produktserie passt. Es ändert sich nur der Name. Alles andere bleibt unverändert. Auch in Zukunft bleibt RapidMiner / YALE quelloffen unter der GNU GPL und für Endanwender kostenlos verfügbar.
Änderungen von RapidMiner 4.0beta2 zu RapidMiner 4.0
Generelle Verbesserungen:
RapidMiner unterstützt nun verschiedene Workspaces für unterschiedliche Projekte. Der Standard-Workspace muss während des ersten Starts gesetzt werden.
Trainings- und Testdaten müssen nun nicht länger das exakt gleiche Format besitzen. Unterschiede in der Reihenfolge von nominalen Werten führten in der Vergangenheit häufig zu Problemen.
Der Operator PerformanceEvaluator ist nun in mehrere kleine Operatoren aufgeteilt, welche auch zusätzliche Validierungen erlauben.
Neue Kompatibilitätsprüfungen der Vorhersagemodelle für Trainings- und Testdaten.
Ein Filter wurde dem New Operator Tab hinzugefügt.
Regellerner können nun auch mit numerischen Daten arbeiten.
Die Visualisierung beinahe aller Performanzkriterien wurde verbessert.
Eine 3D Visualisierung der Konfusionsmatrizen wurde hinzugefügt.
Eine automatische Visualisierung der (durchschnittlichen) ROC Kurve wurde ergänzt für das Performanzkriterium AUC.
Neuer Plotter: Deviation.
und weitere Verbesserungen
Screenshots
Neue Operatoren:
Performance
ClassificationPerformance
BinominalClassificationPerformance
RegressionPerformance
UserBasedPerformance
SingleRuleWeighting
MPCKMeans
Bugfixes:
Dieses Release enthält eine Vielzahl von Bugfixes, unter anderem die Entfernung unnötiger Parameter des Operators RandomForest, ein Problem mit Attributnamen gleicher Schreibweise aber unterschiedlicher Groß- und Kleinschreibung, ein Fehler in den Anova und t-Test Operatoren, ein Fehler, welcher die Visualisierung der Cluster Model Graphen verhinderte, ein Fehler für Diskretisierungsoperatoren innerhalb von Schleifen-Operatoren, ein Fehler in den Regellernern, welcher keine größer-als-Relationen erlaubte sowie ein Fehler beim Speichern von Modellen des NeuralNet Lerners.