HomeSucheSitemapImpressumKontakt
Quick Links
Aussagen von Nutzern

"I would like to first congratulate you on a wonderful product. The text plugin is, of course, spectacular."

Timothy R. Tangherlini, USA

 
Seminare

 

Zufallsbild
Hosted by
SourceForge.net Logo
Home arrow Produkte arrow RapidMiner Community Edition arrow Einführung arrow Operatorübersicht
Operator Übersicht

RapidMiner (früher YALE) und seine Plugins bieten mehr als 400 Operatoren für alle Aspekte des Data Mining. Meta-Operatoren optimieren automatisiert das Design des Data Mining Prozesses und Benutzer müssen nicht länger einzelne Schritte oder Parameter selbst anpassen. Eine große Zahl von Visualisierungstechniken und die Möglichkeit für Breakpoints an jeder Stelle des Prozesses geben Einsichten in den Erfolg Ihres Designs - sogar online für laufende Prozesse. Auf dieser Seite stellen wir eine Auswahl von Operatoren aus den verschiedenen Aufgabengebieten des Data Mining vor.

 

RapidMiner bietet Operatoren für:

Image Ein- und Ausgabe: Flexible Operatoren für die Ein- und Ausgabe von Daten in verschiedenen Formaten, darunter
  • Bekannte Formate aus den Bereichen Data Mining und Lernverfahren (Arff, C4.5, csv ...)
  • Spärliche Dateien (bekannt von SVMlight, mySVM ...)
  • Excel Tabellen
  • SPSS Dateien
  • Daten aus Datenbanken (Oracle, mySQL, PostgreSQL, Microsoft SQL Server, Sybase ...)
  • dBase
  • Textdateien (Word Vector plugin) und Audiodateien (Value Series Plugin)
  • und mehr
Image Modellierung: mehr als 100 Verfahren für Regression, Klassifikation und unüberwachtes Lernen, darunter:
  • Support Vector Machines (SVM, LibSVM, SMO, mySVM ...)
  • Entscheidungsbäume und Regellerner (ID3, C4.5, PART, PRISM, RIPPER ...)
  • Lazy Learners (Nearest Neighbors, K*, LBR ...)
  • Bayes'sche Lerner (Naive Bayes, Bayes Net, AODE ...)
  • Logistische Lerner (Logistic Regression, SimpleLogistic ...)
  • Gauss'sche Prozesse
  • Meta Learning (AdaBoost, Bagging, Stacking, BayesianBoosting ...)
  • Association Rule Mining (Apriori, Tertius ...)
  • Clustering (Clustering Plugin: k-Means, k-Medoids, DBscan, SVClustering ...)
  • und mehr
Image Weka Operatoren: sämtliche Lernverfahren und Merkmalsevaluatoren aus der Machine Learning Bibliothek Weka sind in die Open-Source Version von RapidMiner integriert und können wie alle anderen RapidMiner-Operatoren direkt angewendet werden.
Image Vorverarbeitung: Operatoren, welche oftmals vor der eigentlichen Modellierung angewendet werden müssen, darunter
  • Diskretisierung (Binning, Frequency ...)
  • Beispiels- und Merkmalsfilter (Conditioned, ValueTypeFilter ...)
  • Normalisierung (Interval, Standardization, z-Transformation ...)
  • Sampling (Simple, Stratified, ModelBased ...)
  • Dimensionsreduktion (PCA, Kernel-PCA, GHA, ICA ...)
  • Ersetzen fehlender und unendlicher Werte
  • Löschen unnötiger Merkmale
  • und mehr
Image Merkmalsoperatoren:
  • Merkmalsauswahl (Forward Selection, Backward Elimination, Genetische Algorithmen, WeightGuided ...)
  • Merkmalsgewichtung und -relevanz (ChiSquared, Correlation, InfoGain, Relief ...)
  • Merkmalskonstruktion (GGA, YAGGA ...)
  • Merkmalsextraktion aus Reihendaten (Value Series Plugin)
  • und mehr
Image Evaluation: mehrere Validierungs- und Evaluaierungsschemata um die Performanz des Data Mining Prozesses auf den zu Grunde liegenden Daten zu schätzen, darunter
  • Kreuzvalidierung (Stratified, Shuffled, Linear ...)
  • Trainings- und Testmengen (zufällig, fix ...)
  • Leave-One-Out Validierung
  • Signifikanztests (ANOVA, Paired t-Tests ...)
  • Große Zahl von Performanzkriteriern für Klassifikation und Regression (Absoluter Fehler, Relativer Fehler, Accuracy, Precision, Recall, Kappa, AUC, ...)
  • und mehr
Image Meta-Operatoren: mehrere Operatoren, welche den Data Mining Prozess selbst optimieren, darunter
  • Parameteroptimierung (Grid, Quadratic, Evolutionär ...)
  • Learning Curves
  • Schleifen und Iterationen
  • und mehr
Image Visualisierung: die Fähigkeit zum Loggen und der graphischen Präsentation von Ergebnissen beinhalten
  • Online 1D, 2D und 3D Plots Ihrer Daten und Ergebnisse (ExperimentLog, DataView, MetaDataView ...)
  • Histogramme
  • Quartile
  • Modellvisualisierungen (Tree View, ClusterModel Graphen ...)
  • Visualisierungen für hochdimensionale Daten (Andrew's Curves, GridViz, Parallel, RadViz, Survey, SOM, ...)
  • SVM Funktionen (HyperplaneProjection, AttributeFunction ...)
  • ROC Plots
  • Lift Charts
  • und mehr
 
< zurück   weiter >