|
RapidMiner ist unter zwei verschiedenen Lizenztypen verfügbar:
Zum einen die Open-Source-Versionen (die Community Edition ist genauso Open-Source wie die Enterprise Edition) unter der
GNU Affero General Public License (AGPL)
und zum anderen als Version unter Closed-Source Lizenz, also unter kommerzieller Lizenz für Entwickler proprietärer
Closed-Source Software.
Obwohl wir bemüht sind, beide Versionen so ähnlich wie möglich zu erhalten,
gibt es ein paar kleine Unterschiede, die hier erläutert werden.
Ein- und Ausgabeformate
| Lizenz |
open-source |
closed-source |
| RapidMiner (YALE) Datenformat |
ja |
ja |
| ARFF |
ja |
ja |
| XRFF |
ja |
ja |
| C4.5 Format |
ja |
ja |
| csv |
ja |
ja |
| SVM Format (sparse) |
ja |
ja |
| Excel |
ja |
ja |
| SPSS |
ja |
ja |
| Datenbankunterstützung |
ja |
ja |
| dBase |
ja |
ja |
| Textdateien |
ja |
ja |
| Audiodateien |
ja |
ja |
Maschinelle Lernverfahren
| Lizenz |
open-source |
closed-source |
| Support Vector Machines (SVM) |
ja |
ja |
| Entscheidungsbäume |
ja |
ja |
| Regellerner |
ja |
ja |
| Faule Lerner |
ja |
ja |
| Bajasche Lerner |
ja |
ja |
| Logistische Verfahren |
ja |
ja |
| Gaußsche Prozesse |
ja |
ja |
| Regressionslerner |
ja |
ja |
| Meta Lerner |
ja |
ja |
| Assoziationsregeln |
ja |
ja |
| Clusterer-Verfahren |
ja |
ja |
Weka Algorithmen
Wegen der schwierigen Lizenzbedingungen für Closed-Source-Lizenzen der Weka-Bibliothek haben wir beschlossen,
die wichtigsten Algorithmen aus Weka durch eigene Implementationen zu ersetzen.
Die Weka-Bibliothek bleibt Teil der Open-Source-Version von RapidMiner (vormals YALE).
Die folgende Tabelle zeigt, dass die meisten Algorithmen von Weka in RapidMiner ersetzt wurden. Einige der exotischeren Algorithmen aus Weka, die eher dem wissenschaftlichen Interesse dienen, werden hiervon wahrscheinlich jedoch auch in Zukunft eher ausgeschlossen sein.
Wie man jedoch aus den Tabellen erkennen kann, werden die wichtigsten Lernverfahren und Verfahrenstypen sowohl in der Open-Source- als auch in der Closed-Source-Version verfügbar sein.
Weitere Verfahren sind auf Anfrage möglich.
| Lizenz |
open-source |
closed-source |
| Lernverfahren (s.o.) |
ja |
alle wichtigen |
| Merkmalsevaluatoren |
ja |
ja |
| Merkmalsgewichtungen |
ja |
ja |
Datenvorverarbeitung
| Lizenz |
open-source |
closed-source |
| Diskretisierung |
ja |
ja |
| Daten-Filter |
ja |
ja |
| Merkmals-Filter |
ja |
ja |
| Normalisierung |
ja |
ja |
| Sampling |
ja |
ja |
| Dimensionsreduktion |
ja |
ja |
| Behandlung fehlender und unendlicher Werte |
ja |
ja |
| Entfernung nutzloser Merkmale |
ja |
ja |
Merkmalsoperatoren
| Lizenz |
open-source |
closed-source |
| Merkmalsauswahl |
ja |
ja |
| Merkmalsgewichtung |
ja |
ja |
| Merkmalskonstruktion |
ja |
ja |
| Merkmalsextraktion |
ja |
ja |
| Zeitreihenanalyse |
ja |
ja |
Performanzevaluation
| Lizenz |
open-source |
closed-source |
| Kreuzvalidierungsverfahren |
ja |
ja |
| Leave-One-Out |
ja |
ja |
| Trainings- und Testmengen |
ja |
ja |
| Signifikanztests |
ja |
ja |
| Menge von Performanzkriterien |
ja |
ja |
Meta Verfahren
| Lizenz |
open-source |
closed-source |
| Parameteroptimierung |
ja |
ja |
| Lernkurven |
ja |
ja |
| Prozessschleifen und -iterationen |
ja |
ja |
Visualisierung
| Lizenz |
open-source |
closed-source |
| Online Logging und Plotting |
ja |
ja |
| Zahlreiche Grafikdarstellungstypen |
ja |
ja |
| Modellvisualisierungen |
ja |
ja |
| Hochdimensionale Visualisierungen |
ja |
ja |
| ROC Kurven |
ja |
ja |
| Lift Charts |
ja |
ja | |