PreviousNext
Korrelationen
Help > Statistische Begriffe: > Korrelationen

Korrelationen sind Wechselwirkungen zwischen zwei Zufallsvariablen. Eine Korrelation zwischen Variable A und B drückt aus, wie stark sich Variable A ändert wenn sich Variable B geändert hat und umgekehrt.

Die Korrelation ist im engeren Sinne keine Inputgröße sondern ein Ergebnis. Aus vorhandenen Realisationen wird deren Korrelation berechnet. Entsprechend hat dies auch keine Richtungsinformation im Sinne eines Ursache-Wirkung Zusammenhangs.

Korrelationen werden in Modellierung aber trotzdem häufig als Inputfaktor verwendet. IN diesen Fällen wirkt sie (aus oben beschrieben Gründen) „in beide Richtungen“. Variable A ändert sich wenn B sich ändert, aber B ändert sich auch wenn A sich (c.p.) ändert. 

 

Auszug aus Wikipedia (https://de.wikipedia.org/wiki/Korrelation):

            Eine Korrelation ist ein Maß des Zusammenhangs zwischen zwei Varaiblen.

Eine Korrelation beschreibt jedoch keine Ursache-Wirkungs-Beziehung in die eine und/oder andere Richtung, d.h. aus einem starken Zusammenhang folgt nicht, dass es auch eine eindeutige Ursache-Wirkungs-Beziehung gibt.

            Beispiele:

Aus der Tatsache, dass in Sommern mit hohem Speiseeisumsatz viele Sonnenbrände auftreten, kann man nicht schlussfolgern, dass Eisessen Sonnenbrand erzeugt.

         Zwischen dem Rückgang der Störche im Burgenland und einem Rückgang der Anzahl Neugeborener kann es durchaus eine Korrelation geben, aber weder bringen Störche Kinder noch umgekehrt.

In beiden Beispielen hängen die jeweiligen Messgrößen allerdings über eine dritte Größe als Ursache kausal zusammen. Im ersten Fall ist es die Sonneneinstrahlung, die sowohl Eisverkauf als auch Sonnenbrand bewirkt, im zweiten Fall die Verstädterung, die sowohl Nistplätze vernichtet als auch begünstigt, dass mehr Paare kinderlos sind bzw. nur ein Kind haben (siehe Vereinbarkeit von Familie und Beruf). Korrelationen dieser Art werden Scheinkorrelationen genannt.

 

Liegt allerdings tatsächlich eine Ursache-Wirkungs-Beziehung vor, dann erwartet man eine Korrelation von Ursache und Wirkung. Daher benutzt man häufig die Korrelation auch, um einen Hinweis darauf zu bekommen, ob zwei statistische Größen ursächlich miteinander zusammenhängen könnten.

 

Im Gegensatz zur Proportionalität ist die Korrelation nur ein statistischer Zusammenhang. Häufig wird der lineare oder monotone Zusammenhang zweier Variablen bestimmt. Das bedeutet in diesen Fällen, dass die Korrelation zwischen X und Y durch die Gleichung Y = c + t • X beschrieben werden kann; ist t > 0 liegt eine positive Korrelation vor, bei t < 0 liegt eine negative Korrelation vor. Aus dieser Eigenschaft folgt, dass keine Prognose von Y ohne die Kenntnis der Parameter c und t möglich ist. Die Parameter für den unterstellten linearen Zusammenhang können mittels einer linearen Regression bestimmt werden.

Die Verwechslung von Korrelation und direktem Kausalzusammenhang wird dadurch gefördert, dass bei Berechnung der Korrelationskoeffizienten r nach Pearson und bei der linearen Regression mit einer unabhängigen Variablen mathematisch ganz ähnliche Verfahren zum Tragen kommen. In Regressionsanalysen wird das Bestimmtheitsmaß R2 angegeben; es ist gleich dem quadrierten Korrelationskoeffizienten r2 und beschreibt die erklärte Varianz des einfachen Regressionsmodells. Dies fördert die falsche Vermutung, die beiden Verfahren mit ihren jeweiligen Interpretationsmöglichkeiten seien austauschbar. Die Korrelation beschreibt die Stärke des Zusammenhangs, während die Regression eine unterstellte Kausalrichtung des Zusammenhangs misst.