Bestimmtheitsmaß • Berechnung und Interpretation (2024)

Video anzeigen

Hier geht's zum Video „Regressionsanalyse“Hier geht's zum Video „Abhängige und unabhängige Variable“Hier geht's zum Video „Varianz“

zur Videoseite: Bestimmtheitsmaß

In diesem Artikel erfährst du alles Wichtige zum Bestimmtheitsmaß R². Wir erklären dir, was das Bestimmtheitsmaß ist, wie du es berechnest und was du bei der Interpretation beachten musst.

Du möchtest das Thema noch schneller abhaken? Dann sieh dir unser Video an und lerne dort ganz entspannt alles, was du wissen musst!

Inhaltsübersicht

Bestimmtheitsmaß R² einfach erklärt

im Videozur Stelle im Video springen

(00:19)

Das Bestimmtheitsmaß Bestimmtheitsmaß • Berechnung und Interpretation (1)(auch: Determinationskoeffizient, R squared) ist eine Kennzahl der Regressionsanalyse. Sie gibt dir Auskunft darüber, wie gut du die abhängige Variable mit den betrachteten unabhängigen Variablen vorhersagen kannst. In der Fachsprache sagt man, es gibt an, welchen Anteil der Varianz der abhängigen Variable durch die unabhängige(n) Variable(n) „aufgeklärt“ wird. Das Bestimmtheitsmaß kann Werte zwischen 0 und 1 annehmen. Prinzipiell stehen dabei höhere Werte für eine bessere Vorhersage der abhängigen Variable.

Wie hoch es sein soll, hängt dabei allerdings von den betrachteten Variablen und dem untersuchten Thema ab. Tendenziell überschätzt das Bestimmtheitsmaß Bestimmtheitsmaß • Berechnung und Interpretation (2) zudem leicht den Anteil der aufgeklärten Varianz. Deshalb verwendet man das adjustierte Bestimmtheitsmaß Bestimmtheitsmaß • Berechnung und Interpretation (3), wenn man Aussagen aus einer Stichprobe auf die Grundgesamtheit übertragen möchte.

Bestimmtheitsmaß Herleitung

im Videozur Stelle im Video springen

(00:58)

Das Bestimmtheitsmaß Bestimmtheitsmaß • Berechnung und Interpretation (4) zeigt den Anteil der aufgeklärten Varianz an der Gesamtvarianz der abhängigen Variable (AV).

Bestimmtheitsmaß • Berechnung und Interpretation (5)

Um diese Statistik zu verstehen, müssen wir uns also nochmal die Bedeutung der Varianz ins Gedächtnis rufen: Grob gesagt beschreibt die Varianz, wie stark sich die Messwerte in einer Stichprobe unterscheiden. Eine kleine Varianz sagt aus, dass sich die Messwerte alle sehr ähneln. Eine große Varianz heißt hingegen, dass die Werte sehr unterschiedlich sind und weit verstreut liegen.

Stell dir nun vor, du betrachtest in einer Untersuchung die erreichte Punktzahl in einer Matheprüfung. Vermutlich werden nicht alle Personen in der Prüfung die gleiche Punktzahl erreicht haben. Stattdessen werden einige werden besser, und andere schlechter abgeschnitten haben. Es gibt also Varianz in der erreichten Punktzahl.

Nun kann es verschiedene Gründe geben, warum Personen in der Prüfung mehr oder weniger Punkte erreicht haben. Beispielsweise könnte das Ausmaß der Vorbereitung einen Einfluss auf das Prüfungsergebnis haben. Ebenfalls könnte die Intelligenz oder das Vorwissen einer Person die Leistung beeinflussen. Und schließlich könnten Personen abgeschrieben, schlecht geschlafen oder vor der Prüfung sehr viel Kaffee getrunken haben, was ihre zusätzliche Punktzahl beeinflusst. All diese Gründe können dazu führen, dass Personen unterschiedliche Punktzahlen in der Prüfung erreichen.

In einerRegressionsanalyse wählst du nun einzelne dieser möglichen Gründe als unabhängige Variablen aus. Von diesen Variablen vermutest du, dass sie einen besonders starken Einfluss auf die abhängige Variable „Punkte in der Matheprüfung“ haben könnten.

Dein Ziel ist es, mit Hilfe der unabhängigen Variablen möglichst gut zu erklären, warum sich die Punktzahlen verschiedener Personen in der Prüfung unterscheiden. In der Fachsprache sagt man, du möchtest möglichst viel Varianz der abhängigen Variable durch die unabhängige Variable „aufklären“. Du untersuchst also zum Beispiel, wie viel der Unterschiedlichkeit der erreichten Punktzahlen dadurch erklärt werden kann, dass Menschen unterschiedlich intelligent sind.

Bestimmtheitsmaß Berechnung

Das Bestimmtheitsmaß Bestimmtheitsmaß • Berechnung und Interpretation (6) ist nun eine Kennzahl, die dir genau das verrät. Es gibt an, welcher Anteil der Varianz der Punktzahl (also der abhängigen Variablen) durch die Intelligenz (die unabhängige Variable) erklärt werden kann.

Um es zu berechnen, kannst du diese Formel verwenden:

Bestimmtheitsmaß: Formel 1

Bestimmtheitsmaß • Berechnung und Interpretation (7)

Bestimmtheitsmaß • Berechnung und Interpretation (8) – Bestimmtheitsmaß in der Stichprobe
Bestimmtheitsmaß • Berechnung und Interpretation (9) – Aufgeklärte Varianz der abhängigen Variable
Bestimmtheitsmaß • Berechnung und Interpretation (10) – Totale Varianz der abhängigen Variable
Bestimmtheitsmaß • Berechnung und Interpretation (11) – Vorhergesagter Wert der Person Bestimmtheitsmaß • Berechnung und Interpretation (12) auf der abhängigen Variable
Bestimmtheitsmaß • Berechnung und Interpretation (13) – Mittelwert der abhängigen Variable
Bestimmtheitsmaß • Berechnung und Interpretation (14) – Beobachteter Wert von Person Bestimmtheitsmaß • Berechnung und Interpretation (15) auf der abhängigen Variable

Du teilst also die aufgeklärte Varianz durch die gesamte Varianz der abhängigen Variable. Damit erhältst du, welcher Anteil an der Gesamtvarianz durch die unabhängigen Variablen aufgeklärt werden konnte.

Alternativ kannst du Bestimmtheitsmaß • Berechnung und Interpretation (16) auch über die nicht aufgeklärte Varianz berechnen:

Bestimmtheitsmaß: Formel 2

Bestimmtheitsmaß • Berechnung und Interpretation (17)

Bestimmtheitsmaß • Berechnung und Interpretation (18) – Bestimmtheitsmaß in der Stichprobe
Bestimmtheitsmaß • Berechnung und Interpretation (19) – Nicht aufgeklärte Varianz der abhängigen Variable
Bestimmtheitsmaß • Berechnung und Interpretation (20) – Totale Varianz der abhängigen Variable
Bestimmtheitsmaß • Berechnung und Interpretation (21) – Vorhergesagter Wert der Person Bestimmtheitsmaß • Berechnung und Interpretation (22) auf der abhängigen Variable
Bestimmtheitsmaß • Berechnung und Interpretation (23) – Mittelwert der abhängigen Variable
Bestimmtheitsmaß • Berechnung und Interpretation (24) – Beobachteter Wert von Person Bestimmtheitsmaß • Berechnung und Interpretation (25) auf der abhängigen Variable

Bei diesem Rechenweg ziehst du den Anteil der Varianz, der nicht aufgeklärt wurde, von 1 ab. Da sich die Anteile von aufgeklärter und nicht aufgeklärter Varianz zu 1 ergänzen, erhältst du auch über diesen Weg das Ergebnis für Bestimmtheitsmaß • Berechnung und Interpretation (26).

Beide Formeln liefern also das gleiche Ergebnis. Welchen Weg du zur Berechnung wählst, hängt meist einfach davon ab, welche Angaben du in der Aufgabe gegeben hast. Bei der einfachen linearen Regression kannst du das Bestimmtheitsmaß sogar noch einfacher berechnen: Hier erhältst du es, in dem du einfach den Korrelationskoeffizienten Bestimmtheitsmaß • Berechnung und Interpretation (27) quadrierst.

Um das Konzept des Bestimmtheitsmaß möglichst einfach zu verdeutlichen, haben wir in diesem Beitrag ein Beispiel gewählt, das einen kausalen Zusammenhang zwischen unabhängiger und abhängiger Variable nahe legt („Eine Person ist besser in der Prüfung, weil sie intelligenter ist“). Bitte beachte aber, dass du im Zuge einer Regressionsanalyse nicht einfach von einer Korrelation auf Kausalität schließen darfst! Ob das möglich ist, hängt immer von deinem gewählten Untersuchungsdesign (z.B. Experiment) ab.

Bestimmtheitsmaß Interpretation

Da das Bestimmtheitsmaß einen Anteil von etwas ausdrückt, kann es Werte zwischen 0 und 1 annehmen. Größere Werte stehen hierbei für mehr aufgeklärte Varianz und somit für eine bessere Vorhersage der abhängigen Variable.

Zwar spricht ein hohes Bestimmtheitsmaß für einen starken Zusammenhang zwischen unabhängiger und abhängiger Variable, das bedeutet jedoch im Umkehrschluss nicht, dass gar kein Zusammenhang besteht, wenn Bestimmtheitsmaß • Berechnung und Interpretation (28) nahe oder gleich 0 ist. Das liegt daran, dass Bestimmtheitsmaß • Berechnung und Interpretation (29) nur geeignet ist, um lineare Zusammenhänge abzubilden. Stehen deine Variablen also zum Beispiel in einem quadratischen oder exponentiellen Verhältnis zueinander, wird Bestimmtheitsmaß • Berechnung und Interpretation (30) quasi 0 sein, obwohl die Variablen systematisch zusammenhängen. Um solche Fälle zu erkennen, hilft es sich Diagramme deiner Daten anzusehen.

Generell kannst du das Bestimmtheitsmaß aber so interpretieren: Nehmen wir an, du erhältst ein Bestimmtheitsmaß von Bestimmtheitsmaß • Berechnung und Interpretation (31). Das bedeutet, dass 30 % der Varianz der abhängigen Variablen durch die unabhängige(n) Variable(n) aufgeklärt werden konnten. 70 % der Unterschiedlichkeit der Messwerte geht hingegen auf Einflüsse zurück, die wir in unserer Untersuchung nicht betrachtet haben. Diese Varianz aufgrund von unbekannten Einflüssen bezeichnen wir pauschal als „Fehler-„ oder als „Residualvarianz“.

Wie hoch das Bestimmtheitsmaß mindestens sein soll, lässt sich nicht pauschal festlegen. Das hängt von verschiedenen Faktoren ab, beispielsweise in welchem Forschungsfeld du deine Untersuchung durchführst und wie viele unabhängige Variablen du gleichzeitig betrachtest. Wenn du dir unsicher bist, wie hoch Bestimmtheitsmaß • Berechnung und Interpretation (32) in einem konkreten Fall sein sollte, dann schlage am besten in anderen Untersuchungen zu deinem Thema nach.

Adjustiertes Bestimmtheitsmaß

Nun weißt du bereits, wie man das Bestimmtheitsmaß in einer Stichprobe berechnet und interpretiert. Allerdings fällt das Bestimmtheitsmaß durch zufällige Fehler in Stichproben meistens etwas zu hoch aus. Wie stark diese Überschätzung ist, ist dabei von der Stichprobengröße und der Anzahl der betrachteten Variablen abhängig. Das ist vor allem ein Problem, wenn du Ergebnisse aus der Stichprobe auf die Grundgesamtheit übertragen möchtest. Deshalb gibt es eine Formel, mit der du die Überschätzung von Bestimmtheitsmaß • Berechnung und Interpretation (33) korrigieren kannst. Die korrigierte Version des Bestimmtheitsmaßes wird adjustiertes Bestimmtheitsmaß Bestimmtheitsmaß • Berechnung und Interpretation (34) oder auch „adjusted squared multiple R“ genannt.
Du berechnest es so:

Adjustiertes Bestimmtheitsmaß: Formel

Bestimmtheitsmaß • Berechnung und Interpretation (35)

Bestimmtheitsmaß • Berechnung und Interpretation (36) – Adjustiertes Bestimmtheitsmaß
Bestimmtheitsmaß • Berechnung und Interpretation (37) – Bestimmtheitsmaß in der Stichprobe
Bestimmtheitsmaß • Berechnung und Interpretation (38) – Stichprobengröße
Bestimmtheitsmaß • Berechnung und Interpretation (39) – Anzahl der unabhängigen Variablen

Residuen

im Videozum Video springen

Ein weiteres Wichtiges Thema der Regressionsanalyse sind die Residuen. Was Residuen sind und wie du sie berechnest, erfährst du in unserem Video dazu. Schau es dir unbedingt an damit du die Regressionsanalyse für deine nächste Prüfung verstehst!

Beliebte Inhalte aus dem BereichInduktive Statistik

  • ResiduenDauer:02:22
  • Lineare RegressionDauer:04:20
  • Logistische RegressionDauer:04:19

Weitere Inhalte:Induktive Statistik

Regressionsanalyse

RegressionDauer:05:19
RegressionsanalyseDauer:04:14
RegressionskoeffizientDauer:03:37
BestimmtheitsmaßDauer:04:28
ResiduenDauer:02:22
Lineare RegressionDauer:04:20
Logistische RegressionDauer:04:19
Multiple RegressionDauer:03:41
MultikollinearitätDauer:04:50
HeteroskedastizitätDauer:04:12
Bestimmtheitsmaß • Berechnung und Interpretation (2024)

FAQs

What type of plot would you use to display the relationship between runs and one of the other numerical variables? ›

A scatterplot is a type of data display that shows the relationship between two numerical variables. Each member of the dataset gets plotted as a point whose x-y coordinates relates to its values for the two variables.

What is the linear regression graph? ›

Linear regression shows the linear relationship between the independent(predictor) variable i.e. X-axis and the dependent (output) variable i.e. Y-axis, called linear regression. If there is a single input variable X (independent variable), such linear regression is simple linear regression.

What is the relationship plotting in linear regression? ›

In Linear Regression, plotting the relationship between dependent and independent variables will form a Parabola.

What is multiple linear regression in statistics? ›

Multiple linear regression refers to a statistical technique that uses two or more independent variables to predict the outcome of a dependent variable. The technique enables analysts to determine the variation of the model and the relative contribution of each independent variable in the total variance.

What is the statistical test to determine the relationship between two numerical variables? ›

Simple linear regression is a type of test that describes the relationship between a dependent and an independent variable using a straight line. This test determines the relationship between two quantitative variables.

How do you interpret a scatter plot in linear regression? ›

Interpreting Scatterplots: Strength

Another important component to a scatterplot is the strength of the relationship between the two variables. The slope provides information on the strength of the relationship. The strongest linear relationship occurs when the slope is 1.

How to interpret regression results? ›

Interpreting Linear Regression Coefficients

A positive coefficient indicates that as the value of the independent variable increases, the mean of the dependent variable also tends to increase. A negative coefficient suggests that as the independent variable increases, the dependent variable tends to decrease.

How do you explain linear regression in simple terms? ›

Linear regression is a data analysis technique that predicts the value of unknown data by using another related and known data value. It mathematically models the unknown or dependent variable and the known or independent variable as a linear equation.

How to report linear regression results? ›

The report of the regression analysis should include the estimated effect of each explanatory variable – the regression slope or regression coefficient – with a 95% confidence interval, and a P-value. The P-value is for a test of the null hypothesis that the true regression coefficient is zero.

What is the best plot for linear regression? ›

Create Scatter Plot for Simple Linear Regression

pValue of the Weight variable is very small, which means that the variable is statistically significant in the model. Visualize this result by creating a scatter plot of the data, along with a fitted curve and its 95% confidence bounds, using the plot function.

How should residual plots look like? ›

Essentially when you look at this plot, you want the points to be in a pretty 'random' cloud pattern - ideally clustered close to the zero line (i.e. smaller residuals). What you don't want is any clear pattern where the residuals either increase/decrease in line with your predicted value.

How to explain a regression plot? ›

Regression plots as the name suggests creates a regression line between 2 parameters and helps to visualize their linear relationships. This article deals with those kinds of plots in seaborn and shows the ways that can be adapted to change the size, aspect, ratio etc.

What is a good R-squared value? ›

A R-squared between 0.50 to 0.99 is acceptable in social science research especially when most of the explanatory variables are statistically significant.

What is a multiple linear regression for dummies? ›

Multiple linear regression is the most common form of linear regression analysis. As a predictive analysis, the multiple linear regression is used to explain the relationship between one continuous dependent variable and two or more independent variables.

What is the goal of linear regression? ›

The goal of a simple linear regression is to predict the value of a dependent variable based on an independent variable. The greater the linear relationship between the independent variable and the dependent variable, the more accurate is the prediction.

Which graph is used to show the relationship of one variable to another? ›

A scatter plot is a type of graph used to show the relationship between two variables. Learn more about how scatter plots work, who uses them, and why. A scatter plot (also called a scatter chart, scatter graph, or scattergram) allows you to visualize relationships between two variables.

How to determine the relationship between two numerical variables? ›

The correlation coefficient is measured on a scale that varies from + 1 through 0 to – 1. Complete correlation between two variables is expressed by either + 1 or -1. When one variable increases as the other increases the correlation is positive; when one decreases as the other increases it is negative.

What is a technique used to describe the relationship between two numerical variables? ›

Correlation is the numerical measure of the direction and strength of the linear association between two numerical variables. where: n denotes the number of values in the list.

What is a plot that shows the relationship between two continuous variables? ›

Scatter plots are used to display the relationship between two continuous variables x and y. In this article, we'll start by showing how to create beautiful scatter plots in R. We'll use helper functions in the ggpubr R package to display automatically the correlation coefficient and the significance level on the plot.

References

Top Articles
Latest Posts
Recommended Articles
Article information

Author: Msgr. Benton Quitzon

Last Updated:

Views: 6085

Rating: 4.2 / 5 (63 voted)

Reviews: 94% of readers found this page helpful

Author information

Name: Msgr. Benton Quitzon

Birthday: 2001-08-13

Address: 96487 Kris Cliff, Teresiafurt, WI 95201

Phone: +9418513585781

Job: Senior Designer

Hobby: Calligraphy, Rowing, Vacation, Geocaching, Web surfing, Electronics, Electronics

Introduction: My name is Msgr. Benton Quitzon, I am a comfortable, charming, thankful, happy, adventurous, handsome, precious person who loves writing and wants to share my knowledge and understanding with you.