Die partielle Korrelation wird verwendet, wenn man den Zusammenhang zwischen zwei Variablen beschreiben will und dabei den Einfluss einer dritten Variable „heraus rechnen“ will. Man sagt dazu: „Man kontrolliert die dritte Variable“. Diese dritte Variable wird auch Kontrollvariable oder Störvariable genannt.

Das klingt sehr theoretisch. Wann aber braucht man die partielle Korrelation konkret? Das bekannteste Beispiel ist das von Störchen und Babys:

In einer Studie wurde für verschiedene Regionen untersucht, wie viele Störche dort zu Hause sind und wie hoch die Geburtenrate ist. Es zeigte sich eine signifikante positive Korrelation zwischen der Anzahl der Störche und der Anzahl der Babys. Das heißt, je mehr Störche eine Region hat, umso mehr Babys gibt es dort. Heißt das nun, dass der Storch die Babys bringt? Sicher nicht. Das ist ein typisches Beispiel, dass Korrelation keine Kausalität bedeutet.

Du willst mehr Durchblick im Statistik-Dschungel?

Nein, in diesem Fall ist eine dritte Variable für diesen scheinbaren Zusammenhang verantwortlich. Diese dritte Variable ist die Industrialisierung. Die Regionen, die stark industrialisiert sind, haben weniger Störche, da es sich um eher städtische Regionen handelt. Aus dem gleichen Grund haben sie auch weniger Babys, da Familien sich eher im ländlichen Bereich ansiedeln.

Berechnet man die partielle Korrelation des Vorkommens der Störche und der Geburtenrate und kontrolliert dabei die Variable Industrialisierung, so stellt man keine signifikante Korrelation mehr fest. Das zeigt, dass der eigentliche Zusammenhang zwischen der Industrialisierung und der Geburtenrate und zwischen der Industrialisierung und der Anzahl der Störche besteht und nicht zwischen der Anzahl der Babys und der Anzahl der Störche.

Die partielle Korrelation setzt lineare Zusammenhänge zwischen den Variablen sowie Normalverteilung der Residuen voraus. Für die normalverteilten Residuen reichen normalverteilte Variablen aus, was mit Normalverteilungsplots überprüft werden kann.  Der lineare Zusammenhang wird mittels Streudiagrammen graphisch untersucht.