|
YALE 3.4 am 3. Oktober 2006 veröffentlicht |
|
Die neue Version 3.4 der freien Umgebung für Data Mining und maschinelles Lernen
YALE wurde am 3. Oktober 2006 veröffentlicht.
Neben anderen neuen Funktionen bietet diese Version erweiterte Eingabemöglichkeiten
für verschiedene Dateiformate und Datenbanksysteme.
Zusammen mit der leistungsstarken Visualisierungskomponente, die bereits für YALE 3.3
komplett überarbeitet worden war, und der sehr großen Anzahl integrierter
Datenvorverarbeitungs- und Lernverfahren, ist YALE 3.4 die erste Wahl für die
Entwicklung von Data Mining Anwendungen für den realen Einsatz.
Zahlreiche neue Operatoren sind Teil der neuen Version:
- SPSSExampleSource
- ExcelExampleSource
- MultivariateSeries2WindowExamples
- EvolutionaryParameterOptimization
- Y-NaiveBayes
- IOObjectReader
- IOObjectWriter
- AGA
- YAGGA2
- LiftChart
- ROCChart
- MacroDefinition (siehe unten)
|
|
|
Die wahrscheinlich wichtigsten Erweiterungen erfolgten durch zusätzliche
Operatoren zum Einladen von Daten. Die neu unterstützten
Eingabeformate umfassen unter anderem Microsoft Excel und SPSS.
Mehrere Datenbanksysteme werden nun nativ unterstützt und der
Datenbankzugriff wurde deutlich erleichtert. |
Andere (Daten)Ein- und Ausgabe bezogenen Änderungen:
- ExampleSource unterstützt jetzt auch gezipte Datendateien (gepackte Daten im ZIP-Format)
- Neue Datenrepräsentation mit nicht-double Arrays mit geringerem Speicherbedarf
- SimpleExampleSource errät nun automatisch alle Attributwertetypen
- Neue Funktionen des Attributeditors zur Erleichterung der Definition des Eingabeformats:
- Verwendung beliebiger Tabellenzeilen als Attributnamen möglich
(hilfreich beispielsweise für csv-Dateien)
- Erneutes Raten aller Attributwertetypen möglich
- Erinnerung sn Speicherung der Daten und Meta-Daten
- Leichte Definition von JDBC-Treibern:
durch Angabe im CLASSPATH oder durch Kopieren in das Verzeichnis lib/jdbc
- Freie JDBC-Treiber für MySQL, PostgreSQL, Microsoft SQL Server und Sybase mitgeliefert
- Verbessertes Arbeiten direkt in der Datenbank (Modus im DatabaseES)
- Neue Konfigurations-Wizards für ExampleSource und
DatabaseExampleSource - deutliche Vereinfachung der Handhabung dieser
beiden komplexen und leistungsfähigen Operatoren
Weitere Features:
- Makro-Definitionen hinzugefügt:
Makros können mit dem Operator MacroDefinition definiert werden
und mit %{my_macro} benutzt werden.
- Verbessertes Logging
- Operator Konfigurations-Wizards
- Die minimalen and maximalen Farben für Abbildungsplotter können jetzt angegeben werden
- Dichte- und SOM-Plotter unterstützen jetzt die Visualisierung einzelner Beispiele
und sind effizienter
- SOM-Plots werden jetzt interpoliert
- Neue Operatordialoge zeigen Informationen zur Veralterung (Deprecation)
- Erlauben von sowohl Attribut- als auch Beispielrepräsentationen für
Series 2 Window Examples (Zeitreihen in Zeitfenster Beispielumwandlung)
- Plotter robuster gegenüber fehlenden Werten
- Verbesserte Speicherung von ExampleSets
- Einbindung der neusten Version von Weka
- Eine große Anzahl von Bugfixes (Fehlerbehebungen)
- ...und vieles mehr...
|
Links
|
|