HomeSucheSitemapImpressumKontakt
 
Fortgeschrittene Vorverarbeitung von Daten für das Data Mining mit RapidMiner

Unser Seminar "Fortgeschrittene Vorverarbeitung von Daten für das Data Mining mit RapidMiner" ist eine kompakte zweitägige Einführung in die Grundlagen der Datenvorverarbeitung sowie in die Vorverarbeitung mit der Data Mining Software RapidMiner. Oftmals sind zufriedenstellende Modellierungen überhaupt erst durch eine gute Vorverarbeitung der Daten möglich. In praktisch allen Fällen wird die Qualität der Vorhersagemodelle durch eine gute Vorverarbeitung weiter verbessert. Das Seminar behandelt dabei Themen wie die Entdeckung und Entfernung von Ausreißern (Outlier Detection), der Datenbereinigung (Data Cleansing), die Auswahl guter Merkmale (Feature Selection), die Konstruktion neuer, latenter Variablen (Feature Construction und Extraction) und zahlreiche weitere automatisierte Methoden zu Optimierung der Data Mining Ergebnisse. Durch die hohe Anzahl praktischer Übungen werden die Teilnehmer in die Lage versetzt, das gewonnene Wissen auf eigene Data Mining Probleme anzuwenden und diese effizient und erfolgreich zu lösen.

 

Details

  • Kursnummer: 1302
  • Dauer: 2 Tage
  • Ort: Dortmund
  • Zielgruppe: Anwender, Analysten, Entwickler, Administratoren
  • Vorkenntnisse: Grundkenntnisse von RapidMiner und des Data Mining (ein Besuch einer unserer Einführungskurse ist andernfalls empfohlen)
  • Methoden: Vortrag, Diskussionen, Einzel- und Gruppenarbeit, Übungen auf realistischen Daten. Die Teilnehmer können eigene Arbeiten und projektspezifische Fragen einbringen, welche dann zusammen mit dem Trainer und den anderen Teilnehmern beantwortet werden.
  • Inhalt: Dieses Seminar beinhaltet eine kompakte Einführung in die Grundlagen des Data Mining sowie in die Software RapidMiner. Es richtet sich sowohl an Anfänger wie auch an fortgeschrittene Anfänger. Die Themen des Seminars sind
    • Einführung in grundlegende Vorverarbeitungsmethoden wie Normalisierungen, Standardisierungen, Joins etc.
    • Entdeckung und Entfernung von Ausreißern
    • Ersetzung fehlender Werte
    • Methoden der Dimensionsreduktion und der Merkmalsauswahl, insbesondere Genetische Algorithmen und Greedy-Heuristiken
    • Merkmalsgewichtung und gewichtsbasierte Selektion
    • Evolutionäre Merkmalskonstruktion
    • Validierung von Vorverarbeitung und von Preprocessin-Modellen.
    • Sammlung von Statistiken über den Erfolg der Vorverarbeitung
    Ausführliche Übungen auf verschiedenen Datensätzen werden für alle Themenbereiche durchgeführt.

 

Preise

Teilnehmerzahl: 1 2 3 mehr als 3
Preis pro Teilnehmer: 1450 Euro 1300 Euro 1200 Euro 1050 Euro


Die Preise verstehen sich zzgl. Umsatzsteuer.

 

Online Anmeldung

 
< zurück   weiter >