HomeSucheSitemapImpressumKontakt
 
Quick Links

 

Aussagen von Nutzern

"I really like your product and I can't believe how easy data mining has become and how extendable it is by custom operators."

Marcel Van Velzen, Netherlands

 
Neue Seminare!

 

Zufallsbild
Hosted by
SourceForge.net Logo
Lizenzunterschiede

RapidMiner ist unter zwei verschiedenen Lizenztypen verfügbar: Zum einen die Open-Source-Versionen (die Community Edition ist genauso Open-Source wie die Enterprise Edition) unter der GNU Affero General Public License (AGPL) und zum anderen als Version unter Closed-Source Lizenz, also unter kommerzieller Lizenz für Entwickler proprietärer Closed-Source Software. Obwohl wir bemüht sind, beide Versionen so ähnlich wie möglich zu erhalten, gibt es ein paar kleine Unterschiede, die hier erläutert werden.

 

Ein- und Ausgabeformate

Lizenz open-source closed-source
RapidMiner (YALE) Datenformat ja ja
ARFF ja ja
XRFF ja ja
C4.5 Format ja ja
csv ja ja
SVM Format (sparse) ja ja
Excel ja ja
SPSS ja ja
Datenbankunterstützung ja ja
dBase ja ja
Textdateien ja ja
Audiodateien ja ja

Maschinelle Lernverfahren

Lizenz open-source closed-source
Support Vector Machines (SVM) ja ja
Entscheidungsbäume ja ja
Regellerner ja ja
Faule Lerner ja ja
Bajasche Lerner ja ja
Logistische Verfahren ja ja
Gaußsche Prozesse ja ja
Regressionslerner ja ja
Meta Lerner ja ja
Assoziationsregeln ja ja
Clusterer-Verfahren ja ja

Weka Algorithmen

Wegen der schwierigen Lizenzbedingungen für Closed-Source-Lizenzen der Weka-Bibliothek haben wir beschlossen, die wichtigsten Algorithmen aus Weka durch eigene Implementationen zu ersetzen. Die Weka-Bibliothek bleibt Teil der Open-Source-Version von RapidMiner (vormals YALE). Die folgende Tabelle zeigt, dass die meisten Algorithmen von Weka in RapidMiner ersetzt wurden. Einige der exotischeren Algorithmen aus Weka, die eher dem wissenschaftlichen Interesse dienen, werden hiervon wahrscheinlich jedoch auch in Zukunft eher ausgeschlossen sein. Wie man jedoch aus den Tabellen erkennen kann, werden die wichtigsten Lernverfahren und Verfahrenstypen sowohl in der Open-Source- als auch in der Closed-Source-Version verfügbar sein. Weitere Verfahren sind auf Anfrage möglich.

 

Lizenz open-source closed-source
Lernverfahren (s.o.) ja alle wichtigen
Merkmalsevaluatoren ja ja
Merkmalsgewichtungen ja ja

Datenvorverarbeitung

Lizenz open-source closed-source
Diskretisierung ja ja
Daten-Filter ja ja
Merkmals-Filter ja ja
Normalisierung ja ja
Sampling ja ja
Dimensionsreduktion ja ja
Behandlung fehlender und unendlicher Werte ja ja
Entfernung nutzloser Merkmale ja ja

Merkmalsoperatoren

Lizenz open-source closed-source
Merkmalsauswahl ja ja
Merkmalsgewichtung ja ja
Merkmalskonstruktion ja ja
Merkmalsextraktion ja ja
Zeitreihenanalyse ja ja

Performanzevaluation

Lizenz open-source closed-source
Kreuzvalidierungsverfahren ja ja
Leave-One-Out ja ja
Trainings- und Testmengen ja ja
Signifikanztests ja ja
Menge von Performanzkriterien ja ja

Meta Verfahren

Lizenz open-source closed-source
Parameteroptimierung ja ja
Lernkurven ja ja
Prozessschleifen und -iterationen ja ja

Visualisierung

Lizenz open-source closed-source
Online Logging und Plotting ja ja
Zahlreiche Grafikdarstellungstypen ja ja
Modellvisualisierungen ja ja
Hochdimensionale Visualisierungen ja ja
ROC Kurven ja ja
Lift Charts ja ja
 
< zurück   weiter >