Chapter 1 : Probability Distributions
Elementary For Statistics
| Kontak | \(\downarrow\) |
| naftaligunawan@gmail.com | |
| https://www.instagram.com/nbrigittag/ | |
| RPubs | https://rpubs.com/naftalibrigitta/ |
| Nama | Naftali Brigitta Gunawan |
| NIM | 20214920002 |
Latihan 1
Misalkan terdapat 20 pertanyaan pilihan ganda dalam kuis kelas statistik. Setiap pertanyaan memiliki 5 kemungkinan jawaban, dan hanya 1 dari mereka yang benar. Temukan probabilitas memiliki empat atau kurang jawaban yang benar jika seorang siswa mencoba menjawab setiap pertanyaan secara acak!
JAWABAN
Karena hanya 1 dari 5 kemungkinan jawaban yang benar, probabilitas menjawab pertanyaan dengan benar secara acak adalah 1/5 = 0,2. Kita dapat menemukan probabilitas memiliki 4 jawaban yang benar dengan upaya acak sebagai berikut.
dbinom(4, size = 20, prob = 0.2)## [1] 0.2181994
Untuk menemukan probabilitas memiliki empat atau kurang jawaban yang benar dengan upaya acak, kami menerapkan fungsi dbinom dengan x = 0,…, 4.
dbinom(0, size=20, prob=0.2) +
+ dbinom(1, size=20, prob=0.2) +
+ dbinom(2, size=20, prob=0.2) +
+ dbinom(3, size=20, prob=0.2) +
+ dbinom(4, size=20, prob=0.2) ## [1] 0.6296483
Atau,dapat juga menggunakan fungsi probabilitas kumulatif untuk pbinom distribusi binomial.
pbinom(4, size=20, prob=0.2) ## [1] 0.6296483
Visualisasinya adalah sebagai berikut
library(dplyr)## Warning: package 'dplyr' was built under R version 4.1.3
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(ggplot2)## Warning: package 'ggplot2' was built under R version 4.1.3
data.frame(heads = 0:10,
pmf = dbinom(x = 0:10, size = 20, prob = 0.2),
cdf = pbinom(q = 0:10, size = 20, prob = 0.2,
lower.tail = TRUE)) %>%
mutate(Heads = ifelse(heads <= 4, "<=4", "other")) %>%
ggplot(aes(x = factor(heads), y = cdf, fill = Heads)) +
geom_col() +
theme_minimal()+
geom_text(
aes(label = round(cdf,2), y = cdf + 0.01),
position = position_dodge(0.9),
size = 3,
vjust = 0) +
labs(title = "Probability of X <= 4 Sukses",
subtitle = "b(20, .2)",
x = "Sukses(x)",
y = "Probability") Latihan 2
Jika ada 20 mobil yang melintasi jembatan per menit rata -rata, temukan kemungkinan memiliki 13 atau lebih mobil yang melintasi jembatan dalam satu menit tertentu!
JAWABAN
Probabilitas memiliki 12 atau kurang mobil yang melintasi jembatan pada menit tertentu diberikan oleh fungsi PPOIS.
ppois(12, lambda = 20) # lower tail## [1] 0.03901199
Oleh karena itu probabilitas memiliki 13 atau lebih mobil yang melintasi jembatan dalam satu menit adalah di bagian atas fungsi kepadatan probabilitas.
ppois(12, lambda = 20, lower=FALSE) # upper tail## [1] 0.960988
Sehingga jika terdapat 20 mobil yang melintasi jembatan rata rata per menit, kemungkinan memiliki 13 atau lebih mobil yang melintasi jembatan pada menit tertentu adalah 96%.
Latihan 3
Misalkan probabilitas bahwa obat menghasilkan efek samping tertentu adalah p = 0,1% dan n = 1.000 pasien dalam uji klinis menerima obat. Berapa probabilitas 0 orang mengalami efek samping dengan menggunakan teknik visualisasi?
JAWABAN
dpois(x=0 , lambda = 1000*0.001)## [1] 0.3678794
library(ggplot2)
library(dplyr)
options(scipen = 999, digits = 2) # sig digits
n = 0:10
density = dpois(x=n, lambda = 1000*0.001)
probability = ppois(q = n ,lambda = 1000*0.001, lower.tail = TRUE )
df <- data.frame(n, density, probability)
ggplot(df, aes(x = n, y = density)) +
geom_col() +
geom_text(
aes(label = round(density,2), y = density + 0.01),
position = position_dodge(0.9),
size = 3,
vjust = 0
)+
labs(title = "Poisson(1)",
subtitle = "PMF dan CDF of Poisson(1) distribution.",
x = "Events (x)",
y = "Density")+
geom_line (data=df, aes(x=n, y= probability))Latihan 4
Misalkan waktu checkout rata -rata dari kasir supermarket adalah tiga menit. Temukan probabilitas checkout pelanggan yang diselesaikan oleh kasir dalam waktu kurang dari dua menit!
JAWABAN
pexp(2, rate=1/3)## [1] 0.49