Hausübung 3 - Statistik - UBRM

Gruppenname HUe1_Gruppe_032
Gruppenmitglieder MALEK Janis 11938376
erzeugt am 2023-06-06 09:39:33

Einlesen der Daten

# include this code chunk as-is to set options
knitr::opts_chunk$set(comment=NA, prompt=TRUE, out.width=750, fig.height=8, fig.width=8)
library(RcmdrPlugin.iasc)
library(car)
library(RcmdrMisc)
> Dataset <- 
+   readXL("//fs.univie.ac.at/homedirs/janism97/Downloads-Chrome/data.xlsx", 
+   rownames=FALSE, header=TRUE, na="", sheet="Tabelle1", stringsAsFactors=TRUE)

Visualisierung der Daten

  1. Stellen Sie ein lineares Modell der Form y = a + bx fur die Abhängigkeit des Messwerts von der Konzentration der Standardlösung auf. Schätzen Sie die zugehörigen Koeffizienten a und b sowie die Fehlervarianz. Testen Sie außerdem die Nullhypothesen H0: a = 0 und H0: b = 0 bei einem Risiko 1. Art von α = 0.05.

Lineares Regressionsmodell: RegModel.1: Standard~Messungen

> RegModel.1 <- lm(Standard~Messungen, data=Dataset)
> summary(RegModel.1)

Call:
lm(formula = Standard ~ Messungen, data = Dataset)

Residuals:
     Min       1Q   Median       3Q      Max 
-0.49484 -0.05756 -0.00453  0.17010  0.40612 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept) -0.25868    0.09735  -2.657   0.0133 *  
Messungen    0.99032    0.01504  65.861   <2e-16 ***
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 0.2378 on 26 degrees of freedom
Multiple R-squared:  0.994, Adjusted R-squared:  0.9938 
F-statistic:  4338 on 1 and 26 DF,  p-value: < 2.2e-16

Ob die Parameter signifikant von Null verschieden sind, kann mithilfe der p-Werte in der letzten Spalte p-value beurteilt werden, wobei kleine p-Werte gegen die Nullhypothese sprechen. Irrtumswahrscheinlichkeit α = 0.05

Parameter a (Intercept): -0.25868 Fehlervarianz a: 0.0133 Parameter b Messungen: 0.99032 Fehlervarianz b:<2e-16

Allgemeine Fehlervarianz: <2.2e-16

H0: a = 0 und H0: b = 0 bei einem Risiko 1. Art von α = 0.05

Die Nullhypothese H0: a = 0 und H0: b = 0 werder daher beide verworfen.

Erstellen des linearen Modells

  1. Fertigen Sie ein Streudiagramm der Daten an, das die geschätzte Regressionsgerade, das Konfidenzband und das Vorhersageband enthält.

scatterplotRegression

> scatterplotRegression(model = RegModel.1)

  1. Beurteilen Sie anhand numerischer und grafischer Kriterien, wie gut die Modellgerade den Zusammenhang zwischen den beiden Variablen beschreibt.

  2. Überprüfen Sie anhand geeigneter grafischer Darstellungen, ob die für die Regression notwendigen Voraussetzungen erfüllt sind.

> oldpar <- par(oma=c(0,0,3,0), mfrow=c(2,2))
> plot(RegModel.1)

Basic Model Plots: RegModel.1

> par(oldpar)
  1. Geben Sie ein 95 %-iges Konfidenzintervall fur den Erwartungswert der Messung einer 4.8%-igen Standardlösung an

confintRegression

> confintRegression(model = RegModel.1, predictor = 4.8, level = 0.95)
                fit      lwr      upr
Modell     4.494844 4.397965 4.591724
Vorhersage 4.494844 3.996441 4.993248
  1. Geben Sie ein nach unten beschränktes 99 %-iges Vorhersageintervall fur einen Messwert einer 7.8%-igen Standardlösung an.

confintRegression

> confintRegression(model = RegModel.1, predictor = 7.8, level = 0.99)
                fit      lwr      upr
Modell     7.465794 7.314179 7.617410
Vorhersage 7.465794 6.787723 8.143865

Wiederholung ihrer Ergebnisse in Tabellenform (Bonus)

Frage Ergebnis
Koeffizient \(a\) -0.25868
Koeffizient \(b\) 0.99032
Fehlervarianz \(s^2\) <2.2e-16
Konfidenzintervall untere Grenze 4.397965
Konfidenzintervall obere Grenze 4.591724
Prognoseintervall untere Grenze 6.787723
Prognoseintervall obere Grenze 8.143865