ILMES - Internet-Lexikon der Methoden der empirischen Sozialforschung
Artikel drucken

Cooks Distanz (engl.: Cook's Distance)

Cooks Distanz (oft abgekürzt als Cooks D) ist das wichtigste Maß zur Bestimmung einflussreicher Fälle in einem Regressionsmodell. Im linearen Regressionsmodell lautet eine Formel

D = h ii k · ( 1 - h ii ) · ε ^ i 2 σ ^ 2 · ( 1 - h ii )

Dabei steht hii für die Diagonalelemente der Hat-Matrix, k ist die Zahl der Koeffizienten im Modell (einschließlich Konstante), epsilon-Dachi steht für das Residuum des betreffenden Falles und sigma-Dach zum Quadrat für die (geschätzte) Varianz der Residuen.

Für andere Regressionsmodelle (etwa die logistische Regression) wurden vergleichbare Kennzahlen entwickelt.

Literatur:

© W. Ludwig-Mayerhofer, ILMES | Last update: 17 May 2007