|
Neues Release: Rapid-I veröffentlicht die neue Version der führenden Open-Source Data Mining Lösung RapidMiner 4.2
RapidMiner 4.2: Neue Small Enterprise Edition
Auch die neue Version von RapidMiner ist natürlich wieder in verschiedenen Versionen erhältlich. Anwender können zwischen der frei erhältlichen Community Edition von RapidMiner und einer der Enterprise Editions wählen, welche optimiert sind auf die Bedürfnisse professioneller Analysten:
Enterprise Edition = Community Edition + Mehr Leistung + Services + Garantien
Die gute Nachricht für kleine Unternehmen oder einzelne Anwender: Rapid-I bietet die RapidMiner Enterprise Edition nun auch in Form einer Small Enterprise Edition an. Mehr Details hierzu finden Sie auf der Seite Enterprise Edition Leistungsmerkmale!
RapidMiner 4.2: Fokus auf Large-Scale Data Mining
Dieses Release ist ein kleineres Bugfix Release mit zahlreichen neuen Features. Der Hauptfokus lag dabei unter anderem auf einer Verbesserung der Large-Scale Fähigkeiten von RapidMiner. Der Zugriff auf Datenbanken wurde verbessert und bietet nun konstante Zugriffszeiten für Datenbanken mit beliebiger Größe. Der Fokus auf Large-Scale Data Mining wird auch durch die Re-Implementierung mehrerer Analyseverfahren deutlich, was zu einer Geschwindigkeitssteigerung bis zu Faktor 13 führte. Außerdem wurden zahlreiche unnötige Datenscans entfernt, so dass die Laufzeiten weiter reduziert werden konnten.
Generelle Verbesserungen:
- Aggregation unterstützt nun multiple Group-By Attribute und mehrere Aggregationsattribute mit jeweils unterschiedlichen Aggregationsfunktionen
- Die Wertetypen Date und Time sind nun besser unterstützt und können mittels mehrerer Operatoren nun in beinahe beliebige Formate konvertiert werden
- Histogram Plotter unterstützen nun Jitterung und logarithmische Achsen
- Database Wizard verbessert und untersützt nun größere Datensätze ohne Speicherprobleme
- Statistiken werden für größere Datensätze nun nur noch auf Nachfrage berechnet
- Die Iterierzeiten durch partitioned / splitted data sets wurde reduziert
- Alle Plotter können nun mit fehlenden Werten umgehen
- Viele Plotter unterstützen nun die Darstellung absoluter Werte oder das Sortieren nach der zu plottenden Spalte
- One-Class SVM für den LibSVMLearner ist nun unterstützt
- Die neuen Operatoren GroupModel und UngroupModel ersetzen die automatische Erstellung von Container-Modellen aus früheren Versionen zum Zusammenfassen von Preprocessing- und Prediction-Modellen. Dies gibt dem Nutzer mehr Kontrolle über den Modellbildungs- und -gruppierungsprozess.
- AttributeSubsetPreprocessing unterstützt nun die Invertierung des angegebenen regulären Ausdrucks
- AttributeSubsetPreprocessing kann nun die Subsets nach den gleichen Kriterien wie der Operator AttributeFilter bilden. Beispielse ist nun die Anwendung der inneren Operatoren nur auf den numerischen Attributen mmöglich.
- Der DatabaseExampleSetWriter unterstützt nun neue Modi zum Überschreiben / Anhängen von Daten
- and a lot more
Bugfixes:
Dieses Release behebt mehrere Fehler, insbesondere zwei Fehler in dem neuen Parameter Wizard für String und Integer Parameter. Der CSV- und der SimpleExampleSource Operator unterstützen nun auch Zeilen mit einem korrekt abgetrennten leeren String am Zeilenende (fehlender Wert). Einige andere Fehler wurden ebenfalls behoben.
Links
|