Wie mit Ausreißern umgehen?

Wie soll man damit umgehen, wenn man Ausreißer in den Daten hat? Vorab das schon kontrollieren, oder erst nach Rechnen aller Analysen? Die auffälligen Werte einfach löschen? Ab wann spricht man überhaupt von einem Ausreißer? und und und …

Solche Fragen werden Dir durch den Kopf gehen, wenn Du Deine Datenanalyse rechnest und Du extreme Werte in den Daten hast.

Es gibt keine pauschale Antwort auf diese Fragen, sondern viele Möglichkeiten, mit Ausreißern umzugehen. Damit Du weißt, wie und wo Du anfangen sollst, habe ich Dir hier eine Liste der Schritte erstellt, die ich als Vorgehen im Umgang mit Ausreißern empfehle. Weiterlesen

Transformationen – wozu und wie?

Wozu brauchst Du eine Transformation Deiner Daten?

Wenn sich Deine Daten als nicht normalverteilt herausstellen, kannst Du versuchen, sie durch Transformation in eine annähernde Normalverteilung umzuformen. Wenn das gelingt, rechnest Du anschließend die weiteren Analysen wie Signifikanztests mit den transformierten Daten. Dann ist es möglich, parametrische Methoden, die Normalverteilung fordern, anzuwenden.

Auch andere Probleme mit der Verteilung, wie zum Beispiel Hetereskedastizität, Nicht-Linearität oder Ausreißer können eventuell mit Transformationen behoben werden. Weiterlesen

Missings – Fehlende Werte

MISS YOU

Wenn Du fehlende Werte in Deinen Daten hast, must Du Dir überlegen, wie Du mit ihnen umgehen willst. Es gibt verschiedene Möglichkeiten:

  • Du kannst bei der Analyse jeweils nur die paarweise vollständigen Fälle verwenden,
  • Du kannst nur die komplett vollständigen Fälle verwenden und
  • Du kannst die fehlenden ersetzen (Imputation). Für dieses Ersetzen gibt es auch wieder verschiedene Möglichkeiten.

Egal wie Du Dich entscheidest, wichtig ist zu wissen, um welche Art von fehlenden Werten es sich handelt.

Man unterscheidet MCAR, MAR und NMAR. Je nachdem welche Art von fehlenden Werten vorliegen, sind unterschiedliche Arten vom Umgang mit diesen fehlenden Werten erlaubt. Weiterlesen

Ist meine Stichprobe repräsentativ? – 4 Fragen und Antworten

cancy_freeimages_Alison_CarterWas heißt eigentlich repräsentativ?

Eine repräsentative Stichprobe soll die Grundgesamtheit in allen Merkmalen sowie in deren Kombinationen widerspiegeln.

Warum soll die Stichprobe repräsentativ sein?

Nur wenn die Stichprobe repräsentativ ist, Weiterlesen

Was tun bei teilweise verbundenen Daten?

Wie ich bereits in einem früheren Beitrag beschrieben habe, muss für die Auswahl der richtigen Testmethode klar sein, ob es sich bei den Messungen um verbundene oder unverbundene Daten handelt.

Problem: teilweise Mehrfachmessungen

Was aber macht man, wenn man teilweise Mehrfachmessungen hat, also teilweise verbundene Daten? Und wann kommt das überhaupt vor? Weiterlesen