Korrelationen vergleichen

Manchmal ist es sinnvoll, zwei Korrelationskoeffizienten miteinander zu vergleichen, um herauszufinden, ob sich die Stärke zweier Zusammenhänge signifikant unterscheidet.

Dazu verwendet man die z-Transformation von Fisher und berechnet für jeden Korrelationskoeffizienten ein Konfidenzintervall. Wenn sich diese beiden Konfidenzintervalle nicht überschneiden, so unterscheiden sich die beiden Korrelationskoeffizienten signifikant.

Hier die Formeln zur Berechnung des Konfidenzintervalls zum Korrelationskoeffizienten r mit n Beobachtungen (ln() bedeutet „natürlicher Logarithmus von“):

ztransform

Für beide zu vergleichenden Korrelationskoeffizienten wird jeweils ein Konfidenzintervall nach obiger Formel berechnet. Diese beiden Konfidenzintervalle werden verglichen. Wenn sie sich nicht überschneiden, unterscheiden sich die beiden Korrelationskoeffizienten signifikant.

36 Gedanken zu “Korrelationen vergleichen

  1. Sehr geehrte Frau Keller,

    ich schreibe momentan meine Diplomarbeit und Ihr Blog hat mir mit den zahlreichen verständlichen Erklärungen bereits sehr weitergeholfen.
    Nun habe ich vor mit der Methode der Fishers`Z-Transformation zu arbeiten. Hierzu hätte ich drei kurze Fragen:

    *Ich habe mehrere Korrelationskoeffizienten zweier Stichprobe (n1=9; n2=11), die ich gerne erst in Fishers`Z -Werte transformieren,mitteln und so einen Gesamtkorrelationskoeffizienten für jede Gruppe berechnen würde. Gibt es eine Möglichkeit diese vor einem Vergleich auf Signifikanz zu testen?

    *Darf ich die Fisher-Z- Transformation auch für Spearmanns Rho oder Kendall`s Tau verwenden oder ist dies nur für die Pearson`s r möglich?

    *Müssen die Korrelationskoeffizienten für einen Vergleich signifikant sein?

    Ich bedanke mich im Voraus!

    Beste Grüße

    • Hallo,

      vielen Dank für Deinen Kommentar und Deine Fragen, die ich Dir gern beantworte:

      zur Frage 1: Welchen Wert willst Du hier genau auf Signifikanz testen? Den Originalen, den transformierten oder den zusammen gefassten?

      zur Frage 2: Die Z-Transformation geht nur für den Pearson-Korrelationskoeffizienten.

      zur Frage 3: Nein, sie müssen nicht signifikant sei.

      Schöne Grüße
      Daniela

      • Danke für die schnelle Antwort!

        Ich wollte gerne die transformierte Gesamtkorrelation auf Signifikanz testen. Da es die Fisher`s Z- Transformation nicht in SPSS gibt, müsste man dies ja von Hand bzw. über entsprechende Tabellen versuchen!?

        Gib es eine Möglichkeit die Spearmann Koeffizienten in Pearson`s r zu überführen?
        Leider haben sich meine Daten als nicht normalverteilt herausgestellt. Und ich dachte die z-Transformation schafft u.A. eine Annäherung an die Normalverteilung.

        • Die z-Transformation macht aus den Korrelationskoeffizienten, die im Allgemeinen nicht normalverteilt sind, normalverteilte Werte. Deshalb kann dieser transformierte Wert dann anhand einer Tabelle oder mit einem Konfidenzintervall auf Signifikanz überprüft werden.

          Eigentlich ist sie für die Pearson-Korrelation gedacht, es gibt aber Untersuchungen, dass sie auch für die Spearman-Korrelationskoeffizienten gut funktioniert (z.B. http://onlinelibrary.wiley.com/doi/10.1002/0471667196.ess5050.pub2/abstract).

          Alternativ könntest Du auch für Deine nicht normalverteilten Daten die Pearson-Korrelation mittels Bootstrapping in SPSS ausrechnen. Bootstrapping erlaubt es, auch ohne Normalverteilung verlässliche Schätzer zu berechnen, die eigentlich normalverteilte Daten voraussetzen.

  2. Sehr geehrte Frau Keller,

    vielen Dank für Ihren informativen Blog. Das ist sehr hilfreich, um meine Statistikkenntnisse für die Abschlussarbeit aufzufrischen.

    Ich hätte hier eine Frage:

    Wie kann ich gemittelte Korrelationen (ähnlich wie oben stammen meine von einer Person d.h. über mehrere Messzeitpunkte wurden zwei Variablen erfasst) auf Signifikanz gegen Null überprüfen? Ich habe gelesen – allerdings in einem Text über Metaanalysen – dass man bei gemittelten Korrelationen nicht so vorgehen darf, wie bei Einzelkorrelationen, da hier die konkrete Festlegung der Stichprobengröße problematisch ist (http://userpage.fu-berlin.de/~health/manual.pdf) (S.37ff). Hier wird empfohlen, über 95%-Konfidenzintervalle zu gehen und über die Faustregel, dass die Populationskorrelation mindestens doppelt so hoch sein muss, wie die Populationsstandardabweichung.

    Vielleicht haben Sie eine Antwort darauf.
    Vielen Dank schonmal und einen schönen Sonntag.

    Mit freundlichen Grüßen

    Thomas G.

    • Hallo Thomas,

      wie genau wurden die Korrelationen gemittelt? Woher stammen die einzelnen Korrelationskoeffizienten?

      Schöne Grüße
      Daniela

  3. Hallo Frau Keller

    Ich habe drei Gruppen, die jeweils zwei Verfahren bearbeitet haben. Mich interessiert, ob sich die Korrelationen zwischen den Verfahren in drei Gruppen signifikant unterscheiden (Sie sollen es nicht). Gibt es eine einfache Möglichkeit, dies in SPSS zu berechnen? Ich kenne leider nur den einfachen Fisher-Test mit 2 Korrelationen.

    Beste Grüße
    Jan

    • Hallo Jan,

      welche Variablentypen haben die gemessenen Werte? Metrisch, ordinal, nominal?

      Schöne Grüße
      Daniela

  4. Hallo Daniela
    Vielen Dank für die Antwort.
    Die Werte müssten metrisch sein (?). Es handelt sich jeweils immer um die Zahl korrekter Antworten in den jeweiligen Untertests. Ich korreliere Untertest A aus Verfahren X mit Untertest A aus Verfahren Y, etc….
    Schöne Grüße
    Jan

    • Es wird für jede der drei Gruppen so eine Korrelation berechnet und diese drei Korrelationskoeffizienten sollen auf signifikante Unterschiede überprüft werden? Dann muss hier die z-Transformation wie im Beitrag beschrieben gemacht werden, jeweils mit der Berechnung des Konfidenzintervalls dazu. Wenn sich die Konfidenzintervalle dann deutlich überschneiden, unterscheiden sich die Korrelationskoeffizienten nicht signifikant.

  5. Hallo Daniela
    Danke für die schnelle Antwort. Ich prüfe also Korrelation A in Gruppe 1 jeweils gegen Gruppe 2 und 3, sowie nochmal Gruppe 2 gegen Gruppe 3, richtig?

    Hm, Mist, ich habe von einer Art „Profilanalyse“ geträumt, die ich bloß bei SPSS noch nicht gefunden habe… 🙂

    Liebe Grüße
    Jan

  6. Hallo Daniela,

    ich habe auch mal eine Frage. Ich sitze gerade an meiner Bachelorarbeit und mein Dozent hatte mir folgenden Link http://vassarstats.net/rdiff.html genannt, um die Korrelationen zu vergleichen. Als Ergebnis erhalte ich einen z-Wert von 0.11. Ich weiß nicht genau, ob ich nun noch weitere Berechnungen machen muss oder was ich genau mit diesem Wert anfange.
    Kannst du mir vielleicht weiterhelfen?
    Das wäre soo nett!

    Liebe Grüße,

    Isabelle Schneider

    • Hallo Isabelle,

      diesen z-Wert musst Du nun noch in einen p-Wert umrechnen, um zu wissen, ob er signifikant ist. Das machst Du mit einer Tabelle, z.B. hier http://eswf.uni-koeln.de/glossar/zvert.htm. Am ermittelten p-Wert siehst Du dann, ob sich Deine Korrelationen signifikant unterscheiden: ist der p-Wert kleiner 0,05, so gibt es einen signifikanten Unterschied.

      Schöne Grüße
      Daniela

  7. Hallo Daniela,

    vielen lieben Dank für diesen tollen Blog.

    Ich habe eine kurze Frage zu der Bedeutung der Signifikanz der Korrelationskoeffizienten.

    Ich Vergleiche gerade Eifersuchtsdimensionen mit Persönlichkeitsvariablen in zwei unabhängigen Stichproben. z.B. unterscheiden sich die Korrelationen Eifersucht-Schmerz mit Selbstwert mit r=-.36, p<.01in der ersten SP (N=56) und in der zweiten (N=270) mit r=-.05, n.s. Transformiert man die, erhält man einen z-Wert von 2,17, p = .03. Andererseits korreliert Eifersucht-Ärger mit Selbstwert in SP1 r = -.17 n.s. und in SP2 mit r= -.27, p<.01. Nach deren Transformation erhält man z = .7, p= .24 n.s.

    Was bedeutet das jetzt? Das, obwohl Eifersucht-Ärger x Selbstwert in der ersten Stichprobe nicht signifikant wird, aber in der zweiten, doch kein Unterschied zwischen diesen Korrelationen hat? Wäre die erste SP größer, hätte man auch da eine signifikante Korrelation gefunden?

    Vielen Dank für die Hilfe schonmal im Voraus.

    Viele Grüße,
    Maike

    • Hallo Maike,

      ja, das haben Sie genau richtig interpretiert. Die beiden Korrelationskoeffizienten liegen so nahe beieinander, dass der Unterschied nicht als signifikant nachgewiesen werden kann. Dagegen war der Vergleich zur 0 bei SP2 signifikant (signifikanter Korrelationskoeffizient, p<.01). Und ja, wenn die SP1 größer wäre, hätte man sie als signifikant nachweisen können. Und mit genügend großen Stichproben hätte man auch den Unterschied zwischen den Korrelationskoeffizienten als signifikant nachweisen können. Schöne Grüße Daniela Keller

  8. Hallo Daniela,

    ich möchte herausfinden, ob sich zwei zum gleichen Zeitpunkt erhobene Werte einer Person signifikant unterscheiden (bzw. dann für meine ganze Stichprobe). Ich hatte an einen t-Test für abhängige Stichproben gedacht, ginge das?
    Außerdem möchte ich danach prüfen, ob sich die Verteilung der Korrelationen dieser zwei Werte zwischen zwei Altersgruppen unterscheiden bzw. ob der Grad der Unterschiedlichkeit zwischen den zwei Werten altersabhängig ist. Kann ich hierführ einfach pro Altersgruppe alle intraindividuellen Korrelationen zwischen den 2 Werten zusammenfassen (wie?) und dann mitteils Fischer’s Z Transformation die beiden Korrelationskoeffizienten vergleichen?

    Zum besseren Verständnis hier noch knapp meine Hypothesen: „Aufgrund der bisherigen Befunde wir angenommen, dass es Unterschiede im Bindungsstil innerhalb einer Person zu verschiedenen Beziehungstypen (hier Mutter vs. Partner/in) gibt.
    Außerdem werden Altersunterschiede zwischen den beiden Gruppen 20-30 Jahre vs. 50-60 Jahre in Bezug auf die Ausprägung der Beziehungsspezifität erwartet.“

    Außerdem bin ich noch auf die Intra-Klassen-Korrelation bzw. die Q-Korrelation gestoßen, wäre der Einsatz bei meiner Problematik sinnvoll?

    Schon einmal vielen lieben Dank im Voraus für deine Hilfe! Dein Blog hat mir bisher schon sehr weitergeholfen 🙂

    Viele Grüße,
    Nadja

    • Hallo Nadja,

      wenn die Daten normalverteilt sind, können Sie zum Vergleich der beiden Variablen den t-Test für abhängige Stichproben verwenden. Ansonsten den Wilcoxon-Test.

      Für den Vergleich der Korrelationen in den verschiedenen Klassenstufen wird für jede Klassenstufe der Korrelationskoeffizient berechnet und dann mittels z-Transformation transformiert und die Konfidenzintervalle dazu berechnet. Diese Intervalle können dann verglichen und damit de Korrelationskoeffizienten auf Unterschiede untersucht weden. Ob das Ihre Fragestllung zum Altersunterschied beantworten kann, weiß ich nicht. Eventuell würde ich da eher einen Gruppenvergleich machen, bei dem die Altersgruppen auf Lageunterschied in den erhobenen Werten untersucht werden (dann für jeden Zeitpunkt einzeln).

      Die Intra-Klassen-Korrelation und Q-Korrelation wird dann verwendet, wenn öfter als zweimal das gleiche gemessen wird. Normalerweisen, um nachzuweisen, in wieweit die Messungen übereinstimmen (z.B. Reliabilität).

      Schöne Grüße
      Daniela Keller

  9. Liebe Daniela,
    gibt es ein ähnliches Verfahren dass ich anwenden kann, wenn ich punktbiseriale Korrelationen bzw. phi-Koeffizienten vergleichen will? Was kann ich alternativ machen, um sagen zu können, ob sich die Stärke der Zusammenhänge signifikant unterscheidet?

    Viele Grüße
    Lisia

    • Hallo Lisa,

      Rasch, Friese, Hofmann (Quantitative Methoden 1, 2. Auflage, Seite 129) schreiben „Die Fisher z-Transformation eignet sich neben der Produkt-Moment-Korrelation .. auch für die punktbiseriale … und die Rangkorrelation“. Also kannst du diese Methode auch für die punktbiseriale Korrelation anwenden.
      Für Phi habe ich etwas in Klemm (Einführung in die Statistik für die Sozialwissenschaften, 1. Auflage, Seite 272f) gefunden. Hier wird die Formel für das Konfidenzintervall für Phi gegeben. Wenn du das berechnest, kannst du wieder die Konfidenzintervalle wie gehabt vergleichen.

      Schöne Grüße
      Daniela

  10. Liebe Daniela,

    kann ich die Fisher-z-transformierten Korrelationskoeffizienten auf Signifikanz überprüfen? Wenn ja, wie kann man das in STATA umsetzen?

    Werden die Fisher-z-transformierten Koeffizienten genau so interpretiert, wie die normalen Korrelationskoeffizienten?
    Und kann ich die transformierten mit den normalen Korrelationskoeffizienten vergleichen?

    Tausend Dank!

    Liebe Grüße

    • Hallo,
      für die Fisher-z-transformierten Koeffizienten kannst du (wie in dem Beitrag beschrieben) ein Konfidenzintervall ausrechnen. Wenn das die 0 nicht einschließt, ist der Koeffizient signifikant.
      Die transformierten Werte sind nicht so zu interpretieren wie die Originalen und können auch nicht mit ihnen verglichen werden.
      Schöne Grüße
      Daniela

  11. Sehr geehrte Frau Keller,

    ich sitze gerade an der Auswertung meiner Bachelorarbeit und bin in meiner Verzweiflung über Ihren tollen Blog gestoßen! In meiner Arbeit soll festgestellt werden, ob es signifikante Unterschiede hinsichtlich der Suggestibilität bei Zeugenaussagen von Personen mit unterschiedlichen Ausprägungen in Kulturdimensionen gibt. Dazu haben meine Probanden einen Fragebogen ausgefüllt und darin Werte für die 4 verschiedenen Kulturdimensionen erhalten (ähnlich wie bei den Big % beispielsweise) und hinterher anhand eines Fragebogens jeweils einen individuellen Suggestibilitäts-Score.
    Nun wurde mir von meiner Dozentin empfohlen, die Probanden in Gruppen einzuteilen und nur mit Pearson- und Partieller Korrelation zu arbeiten, ich verstehe allerdings nicht so recht, was sie damit meint und jede weitere Hilfe ihrerseits ist leider nicht möglich.
    Muss ich, wie die Kommentatoren vor mir, auch ganz viele einzelnen Korrelationen berechnen und diese dann in z-Werte transformieren und dann auf Signifikanz testen? Also für jede meiner 4 Dimensionen jeweils 2 Untergruppen mit hohen vs. niedrigen Ausprägungen bilden, diese 8 Gruppen dann jeweils mit dem Suggestibilitäts-Score korrelieren? Und die Korrelationskoeffizienten berechne ich dann in fisher-z-Werte um und vergleiche dann alle 8 Konfidenzintervalle miteinander? Und gibt es eine möglichkeit, das über SPSS zu machen oder Excel, um dann meine Ergebnisse in die Bachelorarbeit einzufügen (also quasi nicht nur ein Schmierblatt, auf dem ich das alles per Hand berechnet habe)?

    Ich hoffe Sie können mir bei diesen vielen Fragen trotzdem weiterhelfen, vielen lieben Dank und Grüße!

    • Hallo Kerstin,
      welche Analysen genau du rechnen musst kann ich so nicht beantworten. Probiere mal deine Fragestellungen ganz präzise zu formulieren (am besten mit Nullhypothese und Alternativhypothese). Dann wird klarer, was du untersuchen musst.
      Die von dir genannten Methoden gehen – bis auf die z-Transformation – alle in SPSS. Die Ergebnisse von SPSS kannst du dann als Tabellen oder Abbildungen in deiner Arbeit verwenden.
      Schöne Grüße
      Daniela

  12. Hallo Daniela,

    wir sitzen gerade an unserer Examensarbeit. Wir haben einen Test nach Piaget (kognitive Entwicklung) in einem Kindergarten durchgeführt, dazu noch einen Fragebogen über das Verhalten. Unsere Fragestellung ist darauf ausgerichtet, ob sich Verhaltensauffälligkeiten auf die kognitive Entwicklung auswirken.

    Jetzt haben wir festgestellt, dass der Verhaltenstest (SDQ) nicht der Normalverteilung folgt, unser Dozent meinte, dass wir dieses Problem mit der Fisher´s z-Transformation lösen können. Aber wir haben ja insgesamt nur eine Korrelation (TEKO Gesamtproblemwert – SDQ Gesamtproblemwert), überall lese ich jedoch, dass man den Fisher´s z-Wert benutzt, um verschiedene Korrelationen zu überprüfen.

    Ich weiß jetzt gar nicht, ob wir unser Problem deutlich machen konnten, aber vielleicht können Sie uns helfen?

    • Hallo Giulia,

      eventuell hat er eine andere Transformation gemeint? Einfach nochmal genau bei ihm nachfragen!

      Schöne Grüße
      Daniela

  13. Sehr geehrte Frau Keller,

    ich bin kürzlich auf Ihren Blog gestoßen, da ich mich für meine Abschlussarbeit gerade mit Statistik beschäftige und Ihr Blog war mir bereits sehr hilfreich. Nun sitze ich vor einer Fragestellung und komme nicht weiter. Ich hoffe, dass Sie mir vielleicht schnell helfen können.

    Ich habe folgende Fisher-Transformation r(X,Y) des Korrelationskoeffizienten:
    r(X,Y)= ln(1+p(X,Y)) / ln(2-p(X,Y))

    Für diesen möchte ich nun den Wertebereich bestimmen. Haben Sie vielleicht eine Antwort für mich?

    Danke und viele Grüße,
    Manfred

    • Hallo Manfred,
      suchst du den kleinsten und größten Wert, der angenommen werdenkann?

  14. Sehr geehrte Frau Keller,

    im Rahmen eines Modulprojekts möchte ich den Zusammenhang von der Suizidrate in europäischen Ländern mit dem GDP per capita in Verbindung bringen – da meine Daten nicht normal verteilt sind, nutze ich dafür den Spearman-Rangkorrelationskoeffizienten. Nach der Berechnung dieses mittels SPSS für die 26 Länder über die einzelnen Jahre, habe ich für jedes Land einen Korrelationskoeffizienten. Hieraus möchte ich den gewichteten (leider habe ich je Land unterschiedliche Anzahlen von Jahren) gepoolten Korrelationskoeffizienten bestimmen. Dies kann man meines Erachtens mittels einer einfachen Formel (Summe aus (xi*yi)/yi) mit Excel berechnen, wobei xi der Korrelationskoeffizient ist und yi die Anzahl der Jahre (n). Somit habe ich den gewichteten gepoolten Koeffizienten.Stimmt dies so und kann man für diesen Koeffizienten nun auch einen P-Wert berechnen, dass man feststellen kann, ob der Wert stat. signifikant ist oder geht dies bei gepoolten Korrelationskoeffizienten nicht?

    Über eine zeitnahe Rückmeldung würde ich mich sehr freuen.

    Viele Grüße,

    Alexandra

    • Hallo Alexandra,
      ich würde die Korrelationskoeffizienten erst mit der Fishers-z-Transformation transformieren und dann zusammen fassen.
      Schöne Grüße
      Daniela

  15. Liebe Frau Keller,

    kann das oben beschriebene Verfahren auch angewendet werden, um die Signifikanz zwischen zwei Intra-Klassen-Koeffizienten zur berechnen? Bei meinen berechneten ICCs handelt es sich um: two-way random, Average measures, absolute agreement. Oder existiert eine andere Möglichkeit zu Berechnen, ob eine sig. Differenz vorliegt?

    Vielen Dank schon einmal für die Hilfe und viele Grüße
    Lena

    • Hallo Lena,
      es gibt die Möglichkeit, sich auf für ICCs die Konfidenzintervalle zu berechnen, ja. Wie und wo kommt auf die verwendete Software an. Alternativ eben die Formeln dafür verwenden.
      Schöne Grüße
      Daniela

  16. Hallo Frau Keller,

    ich möchte im Rahmen meiner Bachelorarbeit u.a. folgende Hypothese prüfen: Stehen auditorische Cues in größerem Zusammenhang mit kristalliner als fluider Intelligenz.

    Ich möchte also zwei Zusammenhänge auf einen signifikanten Unterschied testen. Da dachte ich an die Fisher-Z-Transformation.

    Die Zusammenhänge, um die es geht, sind jedoch multiple Korrelationen (ich teste also „kristalline I. ~ cue 1 + cue 2 + cue 3″ gegen “ fluide I. ~ cue 1 + cue 2 + cue 3″). Ich nutze also zwei Multiple Korrelationskoeffizienten, die ich durch lineare Regressionen ermitteln kann, und möchte diese dann Z-transformieren. Wäre dies „mathematisch zulässig“?

    Vielen Dank für die Hilfe
    Veasna

    • Hallo Veasna,
      da kannst Du statt die z-Transformation zu verwenden einfach die standardisierten Regressionskoeffizienten verwenden und vergleichen.
      LG
      Daniela

Die Kommentarfunktion ist geschlossen.