Die lineare Regression ist eine Form der Regressionsanaylse. Unter dem Wort Regression versteht man die gewichtete Zusammenhangsanalyse. Dabei untersucht die lineare Regression einen Zusammenhang zwischen abhängige Variablen (endogene) und unabhängige Variablen (exogene). Bei mehreren gegebenen Variablen spricht man auch von einem multiplen Regressionsmodell. Eine einfach lineare Regression beinhaltet lediglich zwei metrische Größen; die Einflussgröße X und eine Zielgröße Y. Eine Unterstellung dabei ist, dass der Einfluss der endogene Variablen auf die exogene Variablen linear sind. Die Überprüfung eines Zusammenhangs wird anhand von einer Stichprobe vollzogen, da diese Aufschlüsse über die Grundgesamtheit liefert. Die Stichprobe weichen von einer idealen Gerade ab. Mit Hilfe der Regressionsgeraden kann der lineare Zusammenhang dennoch dargestellt werden. Die Abweichung zwischen der Regressionsgeraden und der Messwerte wird auch als Residuen bezeichnet. Dabei sollen die Fehlerquadrate so gering wie möglich gehalten werden. Die Regression summiert die Abweichungen zum Quadrat der Messwerte und stellt so eine Gerade da, die dem Verlauf der Punkte am besten entspricht, indem die Abweichungen minimal sind. Je größer dieser Wert ist, umso mehr verliert die Regressionsgerade ihre Aussagekraft zu der Stichprobe. :

summary(cars)
##      speed           dist       
##  Min.   : 4.0   Min.   :  2.00  
##  1st Qu.:12.0   1st Qu.: 26.00  
##  Median :15.0   Median : 36.00  
##  Mean   :15.4   Mean   : 42.98  
##  3rd Qu.:19.0   3rd Qu.: 56.00  
##  Max.   :25.0   Max.   :120.00

You can also embed plots, for example:

plot(cars)
plot of chunk unnamed-chunk-2