Transformationen – wozu und wie?

Wozu brauchst Du eine Transformation Deiner Daten?

Wenn sich Deine Daten als nicht normalverteilt herausstellen, kannst Du versuchen, sie durch Transformation in eine annähernde Normalverteilung umzuformen. Wenn das gelingt, rechnest Du anschließend die weiteren Analysen wie Signifikanztests mit den transformierten Daten. Dann ist es möglich, parametrische Methoden, die Normalverteilung fordern, anzuwenden.

Auch andere Probleme mit der Verteilung, wie zum Beispiel Hetereskedastizität, Nicht-Linearität oder Ausreißer können eventuell mit Transformationen behoben werden. Weiterlesen

Nicht normal? Schiefe und Exzess

Schiefe (Skew) und Exzess (Kurtosis) sind Maße, die die Abweichung einer Verteilung von der Normalverteilung beschreiben.

Schiefe

Die Schiefe gibt dabei an, ob die Verteilung symmetrisch ist oder nicht.

Eine positive Schiefe beschreibt dabei rechtsschiefe Daten (links steil, rechts schief). Hier gibt es viele kleine Werte in den Daten. Weiterlesen

Was bedeutet Robustheit in der Statistik?

Der Begriff Robustheit wird in der Statistik in verschiedenen Zusammenhängen gebraucht, beispielsweise bei Schätzern oder bei statistischen Tests. In allen Fällen geht es darum, dass die Methode auch bei geänderter Ausgangslage zuverlässig bleibt. Im folgenden erkläre ich den robusten Schätzer und die Robustheit von statistischen Tests.

Robuster Schätzer

Ein statistisches Maß ist robust, wenn es nicht sehr von Ausreißern beeinflusst wird.

Beispielsweise ist als Lagemaß der Median robust gegen Ausreißer. Der Median ist die mittlere Beobachtung der Daten, oder auch das 50 %-Quantil. Da er sich nicht aus den einzelnen gemessenen Werten berechnet, sondern der Wert der mittleren Beobachtung ist, wird er durch Ausreißer nach oben oder unten kaum beeinflusst. Weiterlesen

Parametrisch oder nichtparametrisch? Das ist hier die Frage.

Wenn ich einen statistischen Test durchführen will, muss ich vorher wissen, ob meine Daten normalverteilt sind oder nicht. Sind sie normalverteilt, so kann ich einen parametrischen Test verwenden. Sind sie es nicht, so muss ein nichtparametrischer her. Für den Vergleich zweier Gruppen wäre das bei Normalverteilung der berühmte t-Test. Wenn keine Normalverteilung vorliegt, der Mann-Whitney-U Test. Weiterlesen