ALIs

kommt noch

Achtung: Die Navigationslinks auf dieser Seite funktionieren nicht, weil das nicht der Rahmen ist, der zu diesem Skript gehört. Wenn das Skript ordnungsgemäß dort installiert ist, wo es später laufen soll, funktionieren auch die Links in der dortigen Umgebung.

LINUX Cluster Project

Statistische Klassifikationsverfahren (z.B. Random Forests)


Institution

  • Name: Institut für Medizinische Informationsverarbeitung, Biometrie und Epidemiologie
  • Address: Marchioninistr. 15, 81377 München
  • Project Proposal Date: 2016-10-19 14:22:22

Abstract:

Die Random Forest Methode ist ein Klassifikationsverfahren, das aus mehreren tausend Entscheidungsbäumen besteht. Als Ensemble-Methode sind theoretische Erkenntnisse über Random Forests schwierig zu gewinnen, und die Methode ist bis heute nicht hinreichend untersucht. Die Gewinnung von empirischen Ergebnissen über Simulationsstudien ist daher essenziell. In diesem Projekt werden Eigenschaften der Random Forest Methode sowie die Eigenschaften des darin integrierten Out-of-Bag Fehlermaßes und der Variablenwichtigkeitsmaße untersucht um Defizite der Methode aufzudecken. Zur Durchführung der Studie werden sowohl hoch- und niedrig-dimensionale Daten selbst generiert als auch öffentlich verfügbare Daten betrachtet. Basierend auf diesen Ergebnissen werden in einem zweiten Schritt Optimierungen der Methode entwickelt und anhand von simulierten und realen Datensätzen getestet. Der Rechenaufwand ist deshalb sehr hoch, da die Studien mehrfach wiederholt werden müssen um stabile Ergebnisse zu erhalten (z.B. 1000 Wiederholungen, jede Wiederholung basiert auf einem leicht abgeänderten Datensatz).