|
Vorverarbeitung von Daten für das Data Mining mit RapidMiner |
|
Unser Seminar "Vorverarbeitung von Daten für das Data Mining mit RapidMiner" ist eine kompakte zweitägige Einführung in
die Grundlagen der Datenvorverarbeitung sowie in die Vorverarbeitung mit der Data Mining Software RapidMiner. Oftmals sind
zufriedenstellende Modellierungen überhaupt erst durch eine gute Vorverarbeitung der Daten möglich. In praktisch allen Fällen
wird die Qualität der Vorhersagemodelle durch eine gute Vorverarbeitung weiter verbessert. Das Seminar behandelt dabei Themen
wie die Entdeckung und Entfernung von Ausreißern (Outlier Detection), der Datenbereinigung (Data Cleansing), die Auswahl
guter Merkmale (Feature Selection), die Konstruktion neuer, latenter Variablen (Feature Construction und Extraction) und
zahlreiche weitere automatisierte Methoden zu Optimierung der Data Mining Ergebnisse. Durch die hohe Anzahl praktischer
Übungen werden die Teilnehmer in die Lage versetzt, das gewonnene Wissen auf eigene Data Mining Probleme anzuwenden und diese
effizient und erfolgreich zu lösen.
Sie können sich für dieses Seminar online anmelden.
Details
- Kursnummer: 230801
- Datum: 08. - 09. Mai 2008
- Dauer: 2 Tage
- Ort: Dortmund
- Zielgruppe: Anwender, Analysten, Entwickler, Administratoren
- Vorkenntnisse: Grundkenntnisse von RapidMiner und des Data Mining (ein Besuch einer unserer Einführungskurse ist
andernfalls empfohlen)
- Methoden: Vortrag, Diskussionen, Einzel- und Gruppenarbeit, Übungen auf realistischen Daten. Die Teilnehmer können
eigene Arbeiten und projektspezifische Fragen einbringen, welche dann zusammen mit dem Trainer und den anderen Teilnehmern
beantwortet werden.
- Inhalt: Dieses Seminar beinhaltet eine kompakte Einführung in die Grundlagen des Data Mining sowie in die Software
RapidMiner. Es richtet sich sowohl an Anfänger wie auch an fortgeschrittene Anfänger. Die Themen des Seminars sind
- Einführung in grundlegende Vorverarbeitungsmethoden wie Normalisierungen, Standardisierungen, Joins etc.
- Entdeckung und Entfernung von Ausreißern
- Ersetzung fehlender Werte
- Methoden der Dimensionsreduktion und der Merkmalsauswahl, insbesondere Genetische Algorithmen und Greedy-Heuristiken
- Merkmalsgewichtung und gewichtsbasierte Selektion
- Evolutionäre Merkmalskonstruktion
- Validierung von Vorverarbeitung und von Preprocessin-Modellen.
- Sammlung von Statistiken über den Erfolg der Vorverarbeitung
Ausführliche Übungen auf verschiedenen Datensätzen werden für alle Themenbereiche durchgeführt.
Preise
| Teilnehmerzahl: |
1 |
2 |
3 |
mehr als 3 |
| Preis pro Teilnehmer: |
1650 Euro |
1400 Euro |
1300 Euro |
1100 Euro |
Die Preise verstehen sich zzgl. Umsatzsteuer.
Online Anmeldung
|