Relacja pomiędzy dochodem (X) a prestiżem (Y)

plot(Prestige$income,Prestige$prestige)

Widać pozytywną korelację między dochodem a prestiżem zawodowym. Wyższy dochód wiąże się z wyższym prestiżem, choć nie jest to ścisła zależność liniowa. Przy najwyższych wartościach dochodu widać, że prestiż zawodowy nie zawsze osiąga maksymalne wartości – są zawody o stosunkowo wysokim dochodzie, ale nie najwyższym prestiżu.

Wykres z podziałem na grupy dochodowe z regresją liniową dla każdej grupy

Prestige <- Prestige %>%
  mutate(income_group = case_when(
    income < 10000 ~ "<10k",
    income >= 10000 & income <= 25000 ~ "10k-25k",
    TRUE ~ ">25k"
  ))

ggplot(data = Prestige, aes(x = income, y = prestige, color = income_group)) +
  geom_point() +  
  geom_smooth(method = "lm", se = FALSE) + labs(
    title = "Zależność między średnim dochodem a prestiżem z podziałem na przedziały",
    x = "Średni dochód",
    y = "Prestiż",
    color = "Grupa dochodowa" ) + theme_minimal()
## `geom_smooth()` using formula = 'y ~ x'

Wykres zależności między średnim dochodem a prestiżem zawodów z podziałem na grupy dochodowe pokazuje, że dla dochodów poniżej 10k istnieje silna pozytywna zależność - wyższy dochód oznacza wyższy prestiż. W przedziale 10k-25k ta zależność jest słabsza, co sugeruje mniej spójny związek między zmiennymi. Dla dochodów powyżej 25k dostępnych jest niewiele danych, co utrudnia ocenę trendu.

Loess oraz geom_smooth()

ggplot(Prestige) +
  geom_point(aes(x = income, y = prestige), color = "blue") +  
  geom_smooth(aes(x = income, y = prestige), method = "loess", 
              color = "green", se = TRUE, span = 0.22) + 
  labs(
    title = "Regresja nieparametryczna (LOESS): Średni dochód vs Prestiż",
    x = "Średni dochód",
    y = "Prestiż"
  ) +
  theme_minimal()
## `geom_smooth()` using formula = 'y ~ x'

Na przedstawionym wykresie, korzystamy z regresji nieparametrycznej LOESS, widzimy zależność między średnim dochodem a prestiżem zawodowym. Regresja (zielona linia) pokazuje, że istnieje generalnie rosnąca zależność – wyższy dochód wiąże się z wyższym prestiżem. Przy wyższych wartościach dochodu krzywa stabilizuje się, co sugeruje, że dalszy wzrost dochodu nie zawsze prowadzi do proporcjonalnego wzrostu prestiżu. Szary obszar wokół linii regresji pokazuje możliwe wahania zależności.

data("mcycle")

plot(mcycle$times, mcycle$accel)

Na wykresie między czasem a przyspieszeniem dla danych widać, że przyspieszenie zmienia się nieliniowo. Początkowo jest stabilne, po czym gwałtownie spada (ok. 10-20 ms), następnie staje się bardzo zmienne. Ogólny przebieg pokazuje dużą zmienność.

Kernel smoothing

fit <- locpoly(mcycle$times, mcycle$accel, 
               degree = 1, bandwidth = 2)
fit <- tibble( x = fit$x,  y = fit$y )

ggplot(data = mcycle, aes(x = times, y = accel)) + 
  geom_point(color = "blue", size = 2) +           
  geom_line(data = fit, aes(x = x, y = y),        
            color = "red", size = 1) +
  labs(    x = "Czas (ms)",y = "Przyspieszenie (g)") + theme_minimal()
## Warning: Using `size` aesthetic for lines was deprecated in ggplot2 3.4.0.
## ℹ Please use `linewidth` instead.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.

Niebieskie punkty pokazują dane, czerwona linia reprezentuje wygładzoną krzywą. Na wykresie widoczny jest gwałtowny spadek przyspieszenia w okolicach 10-20 ms, a następnie wzrost. Czerwona linia wygładza lokalne wahania, i odzwierciedla kształt zależności. Dynamika przyspieszenia zmienia się w złożony sposób w czasie.

Loess oraz geom_smooth()

ggplot(mcycle) +
  geom_point(aes(x = times, y = accel), color = "blue") +  
  geom_smooth(aes(x = times, y = accel), method = "loess", 
              color = "green", se = TRUE, span = 0.22) +  
  labs(
    title = "Regresja nieparametryczna (LOESS): Czas vs Przyspieszenie",
    x = "Czas (ms)",
    y = "Przyspieszenie głowy (g)"
  ) +
  theme_minimal()
## `geom_smooth()` using formula = 'y ~ x'

Na przedstawionym wykresie pokazano zależność między czasem a przyspieszeniem głowy przy użyciu regresji nieparametrycznej LOESS. Widać, że początkowo przyspieszenie jest stabilne, po czym następuje gwałtowny spadek (ok. 10-20 ms), a potem wzrost i dalsze wahania.