Am Dienstag, den 29. Mai 2007, veröffentlicht Rapid-I die nächste Version seiner
Open-Source Data Mining Software YALE, YALE 4.0beta, und ändert
dabei den Namen in RapidMiner 4.0beta.
Aus rechtlichen Gründen hat sich Rapid-I entschieden, YALE umzubenennen.
Als neuer Name wurde RapidMiner gewählt, weil dieser Name besonders gut
zum Unternehmensnamen Rapid-I und zum vorgesehenen Namensschema für die
von Rapid-I geplante Produktserie passt.
Es ändert sich nur der Name. Alles andere bleibt unverändert.
Auch in Zukunft bleibt RapidMiner / YALE quelloffen unter der GNU GPL
und für Endanwender kostenlos verfügbar.
Über RapidMiner / YALE
RapidMiner / YALE ist eine Umgebung für die schnelle Entwicklung (Rapid Prototyping)
von Wissensentdeckungs- und Data Mining Lösungen.
Während Rapid-I die Wartung und Weiterentwicklung von RapidMiner sowie
den Support seiner Nutzer sicherstellt, bleibt RapidMiner open-source (unter GNU GPL).
Also ändert sich für Endanwender von RapidMiner nichts: Die Benutzung von RapidMiner ist und bleibt
kostenlos.
Entwicklern von Closed-Source Software, die RapidMiner gerne als leistungsstarke Bibliothek
in ihre proprietären Produkte integrieren möchten, bietet Rapid-I auch die
Möglichkeit, eine Enwicklerlizenz (OEM-Lizenz) für RapidMiner zu erwerben,
um ihre Produkte um Lernfähigkeit, Anpassungsfähigkeit und innovative analytische
Fähigkeiten zu erweitern.
Zusätzlich zu dieser dualen Lizensierung bietet Rapid-I seinen Kunden das komplette
Spektrum von Data Mining Dienstleistungen:
Beratung, professionellen Support, Anpassung (Customization), individuelle
Systemintegration und Softwareentwicklung sowie Datenanalyse.
RapidMiner / YALE ist die technologisch führende und mit über 400 Operatoren weltweit umfangreichste
Open-Source Softwareumgebung für intelligente Datenanalyse, maschinelles Lernen, Data Mining
und Wissensentdeckung.
Sie ist bei einer großen Anzahl von Unternehmen und Organisationen in einer weiten
Bandbreite von Branchen und Anwendungen im Einsatz.
RapidMiner wird in tausenden Datenanalyse- und Business Intelligence Anwendungen in über 30 Ländern
eingesetzt und verhilft seinen Anwendern damit zu einem Wettbewerbsvorteil.
Änderungen von YALE 3.4 zu RapidMiner 4.0beta
Preview
Generelle Verbesserungen:
Insgesamt verbesserte Ausführungsgeschwindigkeit:
Die meisten YALE-Anwendungen brauchen nun weniger als 60% ihrer früheren Laufzeit.
Große Änderungen der Programmierschnittstelle (API), die nun die Einbindung von YALE
in eigene Anwendungen erleichtert und besser unterstützt.
Alle YALE-Dateiformate basieren jetzt auf XML.
Verbesserte Durckfunktionalität.
Mehrere Fehlerbehebungen (Bugfixes).
Neue Operatoren:
Insgesamt mehr als 80 neue Operatoren, unter anderem:
Mehrere Operatoren zur Erkennung von Ausreißern in den Daten
FPGrowth (schneller und speichereffizienter Assoziationsregellerner)
Eine große Anzahl neuer Lern- und Meta-Lernverfahren
CostBasedThresholdLearner (ein Kosten berücksichtigendes Schwellwertlernverfahren,
das auch die Klassifizierung von Beispielen als unbekannt erlaubt, wenn die
Konfidenz unter dem Schwellwert liegt)
(Weighted) Bootstrapping und BootstrappingValidation
Viele neue Operatoren zur Datenvorverarbeitung wie Zusammenfügen (merge),
Kartesisches Produkt, Gruppieren (group by), Aggregation, Sortieren,
etc.
Schreiben von Datenmengen und Ergebnissen jetzt auch in Datenbanken möglich
Generische Vorverarbeitung von Attribut(teil)mengen
Generische Visualisierung von Modellen durch Dimensionsreduktion
Neue ANOVA-Matrix
Das Clustering Plugin wurde in den Kern von YALE integriert
und muß deswegen nicht mehr extra installiert werden.
Neues Look & Feel:
Drag & Drop für Operatorbäume
Komplett überarbeitetes Look & Feel sowie überarbeitete Icons
Neuer Dateibrowser, der die Auswahl von Favoriten ermöglicht
Alle Tabellen(ansichten) können nach allen Spalten sortiert werden durch
Klicken auf die entsprechenden Kopfzeilenfelder der Tabelle
Alle textuellen Ergebnisse unterstützen nun eine Textmarkierung für Copy & Paste
(Kopieren & Einfügen) in andere Anwendungen
Logarithmische Skalierung als weitere Option im normalen Scatter Plotter (Punktwolken-Diagramm)
Mehrere neue Diagramm-Plotter (neue 2D- und 3D-Balkendiagramme, 2D- und 3D-Kuchendiagramme,
Kugeldiagramme)
Grafische Benutzerschnittstelle (GUI) ermöglicht nun auch den sofortigen Abbruch laufender Experimente
Grafische Ansicht Bayesscher Netze hinzugefügt
Textuelle und grafische Ansichtmodi für dazu geeignete Modelle hinzugefügt, z.B. für
Entscheidungsbäume und Bayessche Netze
Betrachter für die Ergebnisherkunft (Result History) zeigt textuelle Beschreibungen aller
bisherigen Experimentergebnisse einer Anwendungssitzung und erlaubt zusätzlich die Anova-Berechnung
verschiedener Ergebnisse
Neue Funktionen:
Verbesserte Filter für Beispieldaten (inklusive Inversion und Konkatenierung)
Neue zusätzliche Performanzkriterien: Spearmans rho und Kendalls tau
Neue Datenrepräsentationstypen basierend auf short oder sogar boolean
reduzieren den Speicherbedarf deutlich
Neue HSQLDB JDBC Datenbanktreiber
ExampleSetWriter untersützt jetzt auch gepackte Dateien
Quelldefinitionen für alle IO-Objekte, d.h. alle Ergebnisobjekte können bei Bedarf angeben,
von welchem Operator sie erzeugt wurden
Verbesserte automatische Datentypschätzung im ExampleSource Konfigurations-Wizard
Gewichtete Performanzmaße für die gewichteten Mittelwerte der Recall- und Precision-Werte pro Klasse
hinzugefügt
Nun auch Schreiben und Lesen gepackter Modelle möglich (.gz)
Handhabung und Anzeige der Attributstatistiken verbessert