|
Aussagen von Nutzern |
|
"Thank you so much for a great product and great support. I am very pleased
with this support package so far, it has increased my productivity
amazingly."
Mike Kabjian, AI Investing, USA |
|
|
Hosted by |
|
|
|
RapidMiner (früher YALE) und seine Plugins bieten mehr als 400 Operatoren für alle Aspekte des Data Mining.
Meta-Operatoren optimieren automatisiert das Design des Data Mining Prozesses und Benutzer müssen nicht
länger einzelne Schritte oder Parameter selbst anpassen.
Eine große Zahl von Visualisierungstechniken und die Möglichkeit für Breakpoints an jeder Stelle des Prozesses
geben Einsichten in den Erfolg Ihres Designs - sogar online für laufende Prozesse.
Auf dieser Seite stellen wir eine Auswahl von Operatoren aus den verschiedenen Aufgabengebieten des Data Mining vor.
RapidMiner bietet Operatoren für:
|
Ein- und Ausgabe: Flexible Operatoren für die Ein- und Ausgabe
von Daten in verschiedenen Formaten, darunter
- Bekannte Formate aus den Bereichen Data Mining und Lernverfahren (Arff, C4.5, csv ...)
- Spärliche Dateien (bekannt von SVMlight, mySVM ...)
- Excel Tabellen
- SPSS Dateien
- Daten aus Datenbanken (Oracle, mySQL, PostgreSQL, Microsoft SQL Server, Sybase ...)
- dBase
- Textdateien (Word Vector plugin) und Audiodateien (Value Series Plugin)
- und mehr
|
|
Modellierung: mehr als 100 Verfahren für Regression, Klassifikation und
unüberwachtes Lernen, darunter:
- Support Vector Machines (SVM, LibSVM, SMO, mySVM ...)
- Entscheidungsbäume und Regellerner (ID3, C4.5, PART, PRISM, RIPPER ...)
- Lazy Learners (Nearest Neighbors, K*, LBR ...)
- Bayes'sche Lerner (Naive Bayes, Bayes Net, AODE ...)
- Logistische Lerner (Logistic Regression, SimpleLogistic ...)
- Gauss'sche Prozesse
- Meta Learning (AdaBoost, Bagging, Stacking, BayesianBoosting ...)
- Association Rule Mining (Apriori, Tertius ...)
- Clustering (Clustering Plugin: k-Means, k-Medoids, DBscan, SVClustering ...)
- und mehr
|
|
Weka Operatoren: sämtliche Lernverfahren und Merkmalsevaluatoren aus der
Machine Learning Bibliothek Weka sind in die Open-Source Version von RapidMiner integriert
und können wie alle anderen RapidMiner-Operatoren direkt angewendet werden.
|
|
Vorverarbeitung: Operatoren, welche oftmals vor der eigentlichen Modellierung
angewendet werden müssen, darunter
- Diskretisierung (Binning, Frequency ...)
- Beispiels- und Merkmalsfilter (Conditioned, ValueTypeFilter ...)
- Normalisierung (Interval, Standardization, z-Transformation ...)
- Sampling (Simple, Stratified, ModelBased ...)
- Dimensionsreduktion (PCA, Kernel-PCA, GHA, ICA ...)
- Ersetzen fehlender und unendlicher Werte
- Löschen unnötiger Merkmale
- und mehr
|
|
Merkmalsoperatoren:
- Merkmalsauswahl (Forward Selection, Backward Elimination, Genetische Algorithmen, WeightGuided ...)
- Merkmalsgewichtung und -relevanz (ChiSquared, Correlation, InfoGain, Relief ...)
- Merkmalskonstruktion (GGA, YAGGA ...)
- Merkmalsextraktion aus Reihendaten (Value Series Plugin)
- und mehr
|
|
Evaluation: mehrere Validierungs- und Evaluaierungsschemata um die Performanz des
Data Mining Prozesses auf den zu Grunde liegenden Daten zu schätzen, darunter
- Kreuzvalidierung (Stratified, Shuffled, Linear ...)
- Trainings- und Testmengen (zufällig, fix ...)
- Leave-One-Out Validierung
- Signifikanztests (ANOVA, Paired t-Tests ...)
- Große Zahl von Performanzkriteriern für Klassifikation und Regression (Absoluter Fehler,
Relativer Fehler, Accuracy, Precision, Recall, Kappa, AUC, ...)
- und mehr
|
|
Meta-Operatoren: mehrere Operatoren, welche den Data Mining Prozess selbst optimieren,
darunter
- Parameteroptimierung (Grid, Quadratic, Evolutionär ...)
- Learning Curves
- Schleifen und Iterationen
- und mehr
|
|
Visualisierung: die Fähigkeit zum Loggen und der graphischen Präsentation von
Ergebnissen beinhalten
- Online 1D, 2D und 3D Plots Ihrer Daten und Ergebnisse (ExperimentLog, DataView, MetaDataView ...)
- Histogramme
- Quartile
- Modellvisualisierungen (Tree View, ClusterModel Graphen ...)
- Visualisierungen für hochdimensionale Daten (Andrew's Curves, GridViz, Parallel, RadViz, Survey,
SOM, ...)
- SVM Funktionen (HyperplaneProjection, AttributeFunction ...)
- ROC Plots
- Lift Charts
- und mehr
|
|
|
|