|
Das Text Plugin basiert auf einer eine flexiblen Java Bibliothek für statistische Modellierungen
natürlicher Sprache (Word Vector Tool, WVTool).
Insbesondere die Erzeugung von Repräsentation auf Basis von Wortvektoren (jedes Dokument ist durch die
Worte repräsentiert, die es enthält) wird unterstützt.
Dieses Wortvektormodell ist der Ausgangspunkt zahlreicher Textanalyseaufgaben, darunter Web Mining,
Textklassifikation oder Information Retrieval.
|
|
Features
Dieses Plugin bietet eine einfach zu bedienende und ebenso einfach zu erweiternde Schnittstelle
zum Lernen aus Texten und erweitert RapidMiner (früher YALE) damit um diese Fähigkeit.
Die wichtigsten Eigenschaften sind:
- 100% Java
- Sehr einfach zu konfigurieren und zu erweitern
- Flexible Auswahl der Schritte, auch sprachenabhängig
- Integriert viele Vorverarbeitungsschritte, beispielsweise mehrsprachiges Stemming und Stoppwortlisten
- Erlaubt das Laden aus unterschiedlichen Quellen (Dateien, URLs ...)
- Integrierter Web Crawler
- Unterstützung von WordNet
- Wörterbücher mit Unterstützung für reguläre Ausdrücke
Download und Dokumentation
Die folgenden Dateien finden Sie im RapidMiner (YALE) Plugins Download Bereich:
| Typ |
Dateiname |
Beschreibung |
| Plugin |
rapidminer-wvtool-XXX.jar |
Die Hauptplugindatei (.jar Datei) |
|
rapidminer-wvtool-XXX-installer.exe |
Die Hauptplugindatei (Windows Installation) |
| Tutorial |
rapidminer-wvtool-XXX-tutorial.pdf |
Das WVTool Tutorial |
| Examples |
rapidminer-wvtool-XXX-examples.zip |
Die Beispiele für das Plugin |
| Source |
rapidminer-wvtool-XXX-src.jar |
Der Source Code des Plugins |
| Javadoc |
rapidminer-wvtool-XXX-javadoc.jar |
Die Javadoc API Dokumentation |
|