Was ist ein guter R-Quadrat-Wert? (2025)

Das R-Quadrat ist ein Maß dafür, wie gut ein lineares Regressionsmodell zu einem Datensatz passt. R-Quadrat wird auch als Bestimmtheitsmaß bezeichnet und ist der Anteil der Varianz in der Antwortvariablen, der durch die Prädiktorvariable erklärt werden kann.

Der Wert für das R-Quadrat kann im Bereich von 0 bis 1 liegen. Ein Wert von 0 zeigt an, dass die Antwortvariable überhaupt nicht durch die Prädiktorvariable erklärt werden kann. Ein Wert von 1 gibt an, dass die Antwortvariable durch die Prädiktorvariable fehlerfrei perfekt erklärt werden kann.

In der Praxis werden Sie wahrscheinlich nie einen Wert von 0 oder 1 für das R-Quadrat sehen. Stattdessen werden Sie wahrscheinlich auf einen Wert zwischen 0 und 1 stoßen.

Angenommen, Sie haben einen Datensatz, der die Bevölkerungsgröße und die Anzahl der Blumenläden in 30 verschiedenen Städten enthält. Sie passen ein einfaches lineares Regressionsmodell an den Datensatz an, wobei Sie die Populationsgröße als Prädiktorvariable und die Blumenläden als Antwortvariable verwenden. In der Ausgabe der Regressionsergebnisse sehen Sie, dass R2 = 0,2 ist. Dies weist darauf hin, dass 20% der Varianz in der Anzahl der Blumenläden durch die Bevölkerungsgröße erklärt werden können.

Dies führt zu einer wichtigen Frage: Ist dies ein „guter“ Wert für das R-Quadrat?

  1. Möchten Sie die Beziehung zwischen dem / den Prädiktor (en) und der Antwortvariablen erklären?

ODER

  1. Möchten Sie die Antwortvariable vorhersagen?

Je nach Ziel die Antwort auf „Was ist ein guter Wert für R-Quadrat?“ wird anders sein.

Erläutern der Beziehung zwischen dem / den Prädiktor(en) und der Antwortvariablen

Wenn Ihr Hauptziel für Ihr Regressionsmodell darin besteht, die Beziehung zwischen dem / den Prädiktor (en) und der Antwortvariablen zu erklären, ist das R-Quadrat größtenteils irrelevant.

Angenommen, im obigen Regressionsbeispiel sehen Sie, dass der Koeffizient für die Größe der Prädiktorpopulation 0,005 beträgt und statistisch signifikant ist. Dies bedeutet, dass eine Zunahme der Bevölkerungszahl um eins mit einer durchschnittlichen Zunahme der Anzahl der Blumenläden in einer bestimmten Stadt um 0,005 verbunden ist. Die Bevölkerungsgröße ist auch ein statistisch signifikanter Prädiktor für die Anzahl der Blumenläden in einer Stadt.

Ob der R-Quadrat-Wert für dieses Regressionsmodell 0,2 oder 0,9 beträgt, ändert nichts an dieser Interpretation. Da Sie lediglich an der Beziehung zwischen der Bevölkerungsgröße und der Anzahl der Blumenläden interessiert sind, müssen Sie sich nicht zu sehr mit dem R-Quadrat-Wert des Modells befassen.

Vorhersage der Antwortvariablen

Wenn Ihr Hauptziel darin besteht, den Wert der Antwortvariablen mithilfe der Prädiktorvariablen genau vorherzusagen, ist das R-Quadrat wichtig.

Je größer der R-Quadrat-Wert ist, desto genauer können die Prädiktorvariablen im Allgemeinen den Wert der Antwortvariablen vorhersagen.

Wie hoch ein R-Quadrat-Wert sein muss, hängt davon ab, wie genau Sie sein müssen. Beispielsweise muss in wissenschaftlichen Studien das R-Quadrat möglicherweise über 0,95 liegen, damit ein Regressionsmodell als zuverlässig angesehen werden kann. In anderen Bereichen kann ein R-Quadrat von nur 0,3 ausreichend sein, wenn der Datensatz extrem variabel ist.

Um herauszufinden, was als „guter“ R-Quadrat-Wert angesehen wird, müssen Sie untersuchen, welche R-Quadrat-Werte in Ihrem Fachgebiet allgemein akzeptiert werden. Wenn Sie eine Regressionsanalyse für einen Kunden oder ein Unternehmen durchführen, können Sie ihn möglicherweise fragen, was als akzeptabler R-Quadrat-Wert angesehen wird.

Vorhersageintervalle

Ein Vorhersageintervall gibt einen Bereich an, in den eine neue Beobachtung fallen könnte, basierend auf den Werten der Prädiktorvariablen. Engere Vorhersageintervalle zeigen an, dass die Prädiktorvariablen die Antwortvariable genauer vorhersagen können.

Oft kann ein Vorhersageintervall nützlicher sein als ein R-Quadrat-Wert, da es Ihnen einen genauen Wertebereich gibt, in den eine neue Beobachtung fallen könnte. Dies ist besonders nützlich, wenn Ihr primäres Ziel der Regression darin besteht, neue Werte der Antwortvariablen vorherzusagen.

Angenommen, eine Bevölkerungsgröße von 40.000 ergibt ein Vorhersageintervall von 30 bis 35 Blumengeschäften in einer bestimmten Stadt. Dies kann als akzeptabler Wertebereich angesehen werden oder nicht, je nachdem, wofür das Regressionsmodell verwendet wird.

Fazit

Je größer der R-Quadrat-Wert ist, desto genauer können die Prädiktorvariablen im Allgemeinen den Wert der Antwortvariablen vorhersagen.

Wie hoch ein R-Quadrat-Wert sein muss, um als „gut“ eingestuft zu werden, hängt vom jeweiligen Feld ab. Einige Felder erfordern eine höhere Genauigkeit als andere.

Um herauszufinden, was als „guter“ R-Quadrat-Wert angesehen wird, überlegen Sie, was in dem Bereich, in dem Sie arbeiten, allgemein akzeptiert wird, fragen Sie jemanden mit spezifischen Fachkenntnissen oder fragen Sie den Kunden / das Unternehmen, mit dem Sie die Regressionsanalyse durchführen für das, was sie für akzeptabel halten.

Wenn Sie die Beziehung zwischen Prädiktor und Antwortvariable erklären möchten, ist das R-Quadrat weitgehend irrelevant, da es keinen Einfluss auf die Interpretation des Regressionsmodells hat.

Wenn Sie an der Vorhersage der Antwortvariablen interessiert sind, sind Vorhersageintervalle im Allgemeinen nützlicher als R-Quadrat-Werte.

Weiterführende Literatur:

Pearson-Korrelationskoeffizient
Einführung in die einfache lineare Regression

Was ist ein guter R-Quadrat-Wert? (2025)

FAQs

Was ist ein guter R-Quadrat-Wert? ›

Wenn R-Quadrat = 1 ist, bedeutet das ein perfektes lineares Verhältnis (perfekte Korrelation), d.h. die Regressionsgerade beinhaltet 100% der Datenpunkte eines Ertragsdiagramms zweier Fonds. Wenn R-Quadrat = 0 ist, gibt es keine Korrelation zwischen den Daten.

Wie hoch sollte R² sein? ›

Ist R² = 1, so liegen alle Beobachtungen genau auf der Regressionsgeraden. Zwischen X und Y besteht dann ein perfekter linearer Zusammenhang. Je kleiner R² ist, desto geringer ist der lineare Zusammenhang. Ein R² = 0 bedeutet, dass zwischen X und Y kein linearer Zusammenhang vorliegt.

Wie interpretiert man r 2? ›

Zu beachten ist, dass das R² ein Gütemaß zum Beschreiben eines linearen Zusammenhangs darstellt. Es lässt sich leicht interpretieren als der Anteil der Varianz der abhängigen Variablen (erklärte Variable), der durch die unabhängigen Variablen (erklärende Variablen) erklärt werden kann.

Wann ist ein bestimmtheitsmaß gut? ›

Das Bestimmtheitsmaß liegt zwischen 0 und 1. Je näher es an 1 liegt, desto besser stimmt die lineare Regression mit den erhobenen Daten überein. 1 entspricht 100%, d.h. in diesem Fall ist die Korrelation zwischen den Variablen vollständig.

Was sagt das korrigierte R-Quadrat aus? ›

Das korrigierte R2 ist eine korrigierte Genauigkeitskennzahl (Modellgenauigkeit) für lineare Modelle. Es gibt den Prozentsatz der Varianz im Zielfeld an, die durch die Eingabe(n) erklärt wird.

Was sind gute r Werte? ›

Wenn R-Quadrat = 0 ist, gibt es keine Korrelation zwischen den Daten. Ein R-Quadrat-Wert von 0,7 – 0,9 verdeutlicht eine hohe Korrelation zwischen den Daten, ein Wert von 0,4 – 0,699 zeigt ein mittelmäßiges Verhältnis und ein Wert unter 0,3 wird als unerhebliche Korrelation erachtet.

Wie hoch R2? ›

Das R-Quadrat nimmt immer Werte von 0 bis 100 % an. 0 % gibt an, dass das Modell die Streuung in der Antwortvariablen bezogen auf den Mittelwert überhaupt nicht erklärt. 100% gibt an, dass das Modell die Streuung in der Antwortvariablen bezogen auf den Mittelwert vollständig erklärt.

Ist R2 Der Korrelationskoeffizient? ›

Ein weiteres Maß für die Quantifizierung des Zusammenhangs zwischen zwei (quantitativen) Merkmalen ist der Korrelations- koeffizient „r“. Der Absolutbetrag des Korrelationskoeffizienten nach Pearson ist einfach die Wurzel aus dem Bestimmtheits- maß: |r| = √R2.

Wie viel Varianzaufklärung ist gut? ›

Erklärte Varianz / Multipler Determinationskoeffizient
Interpretation von R² nach Cohen (1988, S. 412 ff.)
geringe / schwache Varianzaufklärung|R²| = .02
mittlere / moderate Varianzaufklärung|R²| = .13
hohe / starke Varianzaufklärung|R²| = .26

Was sagt der Determinationskoeffizient aus? ›

Bestimmtheitsmaß R² einfach erklärt

(auch: Determinationskoeffizient, R squared) ist eine Kennzahl der Regressionsanalyse . Sie gibt dir Auskunft darüber, wie gut du die abhängige Variable mit den betrachteten unabhängigen Variablen vorhersagen kannst.

Warum R Quadrat? ›

Eine R-squared-Interpretation gibt Aufschluss darüber, wie dicht die beobachteten Daten an einer errechneten Regressionsgerade liegen. Hierbei gilt: Je höher der R-squared-Wert, desto besser erklärt das Modell die Daten. Ein niedriger R-squared-Wert weist auf eine schlechte Modellanpassung hin.

Kann R2 negativ sein? ›

then the R2 can be negative. This is because, without the benefit of an intercept, the regression could do worse than the sample mean in terms of tracking the dependent variable (i.e., the numerator could be greater than the denominator).

Wie rechnet man R Quadrat? ›

Berechnung. Die Kreisfläche A entspricht dem Quadrat des Radius, also r² multipliziert mit der Zahl Pi (π = 3,1415...) und somit A = r² × π. Setzt man die im Beispiel gewählten 10 cm für den Radius r ein, beträgt die Fläche des Kreises A = (10 cm)² × π = 314,16 cm².

Wie groß ist R2? ›

Größen von R2
Kragenweite (cm)3747
Brustumfang (cm)105148
Taillenumfang (cm)93141
Rückenlänge SL7 (cm)8090
Armlänge SL7 (cm)70.574.5
1 more row

Was sagen die regressionskoeffizienten aus? ›

– Der Regressionskoeffizient zeigt die durchschnittliche Zunahme der abhängigen Variable Gewicht (Y), wenn die erklärende Variable Größe (X) um 1 Zentimeter erhöht wird.

Wann ist Varianzaufklärung hoch? ›

Erklärte Varianz / Multipler Determinationskoeffizient
Interpretation von R² nach Cohen (1988, S. 412 ff.)
geringe / schwache Varianzaufklärung|R²| = .02
mittlere / moderate Varianzaufklärung|R²| = .13
hohe / starke Varianzaufklärung|R²| = .26

Kann R 2 negativ sein? ›

then the R2 can be negative. This is because, without the benefit of an intercept, the regression could do worse than the sample mean in terms of tracking the dependent variable (i.e., the numerator could be greater than the denominator).

References

Top Articles
Latest Posts
Recommended Articles
Article information

Author: Francesca Jacobs Ret

Last Updated:

Views: 6095

Rating: 4.8 / 5 (68 voted)

Reviews: 83% of readers found this page helpful

Author information

Name: Francesca Jacobs Ret

Birthday: 1996-12-09

Address: Apt. 141 1406 Mitch Summit, New Teganshire, UT 82655-0699

Phone: +2296092334654

Job: Technology Architect

Hobby: Snowboarding, Scouting, Foreign language learning, Dowsing, Baton twirling, Sculpting, Cabaret

Introduction: My name is Francesca Jacobs Ret, I am a innocent, super, beautiful, charming, lucky, gentle, clever person who loves writing and wants to share my knowledge and understanding with you.