HomeSucheSitemapImpressumKontakt
 
Exploratives Data Mining und Hochdimensionale Datenmodellierung mit RapidMiner

Unser Seminar "Exploratives Data Mining und Hochdimensionale Datenmodellierung mit RapidMiner" ist eine kompakte zweitägige Einführung in die Grundlagen der explorativen Datenanalyse mit der Data Mining Software RapidMiner. Ein wichtiges Merkmal der explorativen Datenanalyse ist neben der relativen Einfachheit der verwendeten Verfahren das bewusste Einbeziehen von Subjektivität bei der Datenanalyse und -interpretation. Sie ist also im wesentlichen eine Sammlung von Verfahren zur (semi-)graphischen Beschreibung und Analyse von Daten welche die Basis des Analysten zum Auffinden von Mustern, Gesetzmäßigkeiten oder Zusammenhängen darstellen. Exploratives Data Mining stellt damit den häufig ersten Schritt zur Modellbildung dar.

 

Das Seminar führt die Teilnehmer in die Visualisierung von Daten und einfacher Modelle ein und zeigt wie diese erste Erkenntnisse und Hinweise zum weiteren Vorgehen liefern. Die Berechnung statistischer Kennzahlen werden zusammen mit den Analysen von Verteilungen und Korrelationen beschrieben. Einfach verständliche und darstellbare Modellierungsverfahren wie lineare Regressionen und Entscheidungsbaumlerner ergänzen die diskutierten Verfahren zusätzlich. Durch die hohe Anzahl praktischer Übungen werden die Teilnehmer in die Lage versetzt, das gewonnene Wissen auf eigene Data Mining Probleme anzuwenden und diese effizient und erfolgreich zu lösen.

 

Details

  • Kursnummer: 1003
  • Dauer: 2 Tage
  • Ort: Dortmund
  • Zielgruppe: Anwender, Analysten, Entwickler, Administratoren
  • Vorkenntnisse: Grundkenntnisse von Computerprogrammen und der Mathematik
  • Methoden: Vortrag, Diskussionen, Einzel- und Gruppenarbeit, Übungen auf realistischen Daten. Die Teilnehmer können eigene Arbeiten und projektspezifische Fragen einbringen, welche dann zusammen mit dem Trainer und den anderen Teilnehmern beantwortet werden.
  • Inhalt: Dieses Seminar beinhaltet eine kompakte Einführung in die Grundlagen des Data Mining sowie in die Software RapidMiner. Es richtet sich sowohl an Anfänger wie auch an fortgeschrittene Anfänger. Die Themen des Seminars sind
    • Einführung in die explorative Datenanalyse und Visualisierungstechniken
    • Einladen von Daten
    • Visualisierungstechniken: niedrig- und hochdimensionale Visualisierungen, Boxplots, Histogramme, Self-Organizing Maps (SOM)
    • Berechnung statistischer Kenngrößen
    • Berechnung von Korrelationen, Korrelationsanalyse und Korrelationsmatrizen
    • Visualisierung von Verteilungen und Differenzierung zwischen Verteilungen unterschiedlicher Klassen
    • Grundlagen verständlicher Modellierungsverfahren: Naive Bayes, Entscheidungsbäume und Lineare Regression
    • Modellvalidierung: Einführung in Performanzkriterien, Kreuzvalidierung, Bootstrapping
    Ausführliche Übungen auf verschiedenen Datensätzen werden für alle Themenbereiche durchgeführt.

 

Preise

Teilnehmerzahl: 1 2 3 mehr als 3
Preis pro Teilnehmer: 1450 Euro 1300 Euro 1200 Euro 1050 Euro


Die Preise verstehen sich zzgl. Umsatzsteuer.

 

Online Anmeldung

 
< zurück   weiter >