1. Installation und Laden des Pakets

# Installiere das Paket, falls noch nicht vorhanden
if (!require(dslabs)) {
  install.packages("dslabs")
}
## Lade nötiges Paket: dslabs
library(dslabs)

2. Simulation einer Stichprobe von 25 Ziehungen

# Funktion zum Ziehen der Stichprobe
set.seed(123)  # Für Reproduzierbarkeit
stichprobe <- take_poll(25)

print(stichprobe)
## NULL

3. Mehrere Stichproben und Betrachtung der Variabilität:

# Mehrere Stichproben ziehen
set.seed(456)
stichprobe1 <- take_poll(25)

stichprobe2 <- take_poll(25)

stichprobe3 <- take_poll(25)

stichprobe4 <- take_poll(25)

# Anzeige der Ergebnisse
stichproben <- list(stichprobe1, stichprobe2, stichprobe3, stichprobe4)
names(stichproben) <- paste0("Stichprobe_", 1:4)
print(stichproben)
## $Stichprobe_1
## NULL
## 
## $Stichprobe_2
## NULL
## 
## $Stichprobe_3
## NULL
## 
## $Stichprobe_4
## NULL
# Installiere und lade das dslabs Paket, falls nicht bereits installiert
if (!require(dslabs)) {
  install.packages("dslabs")
}
library(dslabs)

# Funktion zur Simulation einer Umfrage mit einer Stichprobengröße von 25
take_poll <- function(sample_size) {
  sample <- sample(c("blue", "red"), size = sample_size, replace = TRUE)
  prop_blue <- mean(sample == "blue")
  return(prop_blue)
}

# Beispiel: Ziehe eine Stichprobe von 25 Kugeln
set.seed(123)  # Setze den Zufallsgenerator für reproduzierbare Ergebnisse
poll_result <- take_poll(25)
print(poll_result)
## [1] 0.6
# Wiederhole den Vorgang mehrmals, um die Variabilität zu beobachten
poll_results <- replicate(4, take_poll(25))
print(poll_results)
## [1] 0.60 0.68 0.40 0.48

4. Zusammenfassung:

In diesem Szenario wird die Verbindung zwischen Umfragen und Wahrscheinlichkeitstheorie anhand eines Beispiels mit einer Urne verdeutlicht. Die Urne enthält rote und blaue Kugeln, die Wähler verschiedener Parteien repräsentieren. Die Aufgabe besteht darin, den Unterschied (Spread) zwischen dem Anteil der blauen und roten Kugeln in der Urne zu schätzen. Dazu kann man eine Stichprobe mit Zurücklegen aus der Urne ziehen. Jede gezogene Kugel kostet $0.10, und das Ziel ist es, durch die Wahl eines geeigneten Intervalls die tatsächliche Verteilung so genau wie möglich vorherzusagen.

Der geschätzte Parameter 𝑝ist der Anteil der blauen Kugeln in der Urne. Der Spread wird durch 2𝑝− 1 berechnet. Um p zu schätzen, wird der Anteil der blauen Kugeln in der Stichprobe betrachtet. Dieser Stichprobenanteil ist eine Zufallsvariable, die von Stichprobe zu Stichprobe variiert. Durch die Beschreibung der Verteilung dieser Zufallsvariablen können wir Einblicke in die Genauigkeit unserer Schätzung gewinnen und diese verbessern.

# Installiere und lade das dslabs Paket, falls nicht bereits installiert
if (!require(dslabs)) {
  install.packages("dslabs")
}
library(dslabs)

# Funktion zur Simulation einer Umfrage mit einer Stichprobengröße von 25
take_poll <- function(sample_size) {
  sample <- sample(c("blue", "red"), size = sample_size, replace = TRUE)
  prop_blue <- mean(sample == "blue")
  return(prop_blue)
}

# Beispiel: Ziehe eine Stichprobe von 25 Kugeln
set.seed(123)  # Setze den Zufallsgenerator für reproduzierbare Ergebnisse
poll_result <- take_poll(25)
print(poll_result)
## [1] 0.6
# Wiederhole den Vorgang mehrmals, um die Variabilität zu beobachten
poll_results <- replicate(4, take_poll(25))
print(poll_results)
## [1] 0.60 0.68 0.40 0.48