Analisis Data Kategori

#Distribusi Probabilitas dalam Data Kategori ##3.1 Distribusi Bernouli Distribusi Bernoulli digunakan untuk percobaan biner, yaitu percobaan yang memiliki dua kemungkinan hasil: - Sukses (1) dengan probabilitas \(p\)- Gagal (0) dengan probabilitas \(1−p\)

library(knitr)
library(kableExtra)
library(dplyr)

## 
## Attaching package: 'dplyr'

## The following object is masked from 'package:kableExtra':
## 
##     group_rows

## The following objects are masked from 'package:stats':
## 
##     filter, lag

## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union

library(broom)
library(ggplot2)
library(tidyverse)

## ── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
## ✔ forcats   1.0.1     ✔ stringr   1.6.0
## ✔ lubridate 1.9.5     ✔ tibble    3.3.1
## ✔ purrr     1.2.1     ✔ tidyr     1.3.2
## ✔ readr     2.2.0

## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter()     masks stats::filter()
## ✖ dplyr::group_rows() masks kableExtra::group_rows()
## ✖ dplyr::lag()        masks stats::lag()
## ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors

library(ResourceSelection)

## ResourceSelection 0.3-6   2023-06-27

set.seed(123)
bernoulli_sample <- rbinom(n = 10, size = 1, prob = 0.5)  # 10 percobaan Bernoulli
bernoulli_sample

##  [1] 0 1 0 1 1 0 1 1 1 0

3.2 Distribusi Binomial

Distribusi Binomial adalah generalisasi dari distribusi Bernoulli yang digunakan untuk n kali percobaan independen yang masing-masing memiliki dua kemungkinan hasil (sukses atau gagal). Jika setiap percobaan memiliki probabilitas sukses \(p\), maka distribusi Binomial memiliki fungsi probabilitas: \[ P(X = k) = \binom{n}{k} p^k (1 - p)^{n-k} \]

set.seed(123)
binomial_sample <- rbinom(n = 10, size = 5, prob = 0.5)  # 10 percobaan Binomial dengan 5 ulangan
binomial_sample

##  [1] 2 3 2 4 4 1 3 4 3 2

3.3 Distribusi Multinomial

Distribusi Multinomial adalah generalisasi lebih lanjut dari distribusi Binomial, digunakan ketika setiap percobaan memiliki lebih dari dua kemungkinan hasil. Jika suatu eksperimen dilakukan n kali, dan setiap percobaan dapat menghasilkan salah satu dari k kategori dengan probabilitas \(p1,p2,...,pk\), maka distribusi probabilitasnya: \[ P(X_1 = x_1, \dots, X_k = x_k) = \frac{n!}{x_1! x_2! \cdots x_k!} p_1^{x_1} p_2^{x_2} \cdots p_k^{x_k} \]

set.seed(123)
multinomial_sample <- rmultinom(n = 1, size = 10, prob = c(0.3, 0.5, 0.2))
multinomial_sample

##      [,1]
## [1,]    2
## [2,]    5
## [3,]    3

3.4 Distribusi Poisson

Distribusi Poisson digunakan untuk menghitung jumlah kejadian dalam interval waktu atau ruang tertentu dengan rata-rata kejadian λ per unit waktu/ruang. Fungsi probabilitasnya: \[ P(X = k) = \frac{e^{-\lambda} \lambda^k}{k!} \]

set.seed(123)
poisson_sample <- rpois(10, lambda = 3)  # 10 sampel dengan rata-rata kejadian 3
poisson_sample

##  [1] 2 4 2 5 6 0 3 5 3 3

Analisis Data Kategori

Reza Monika

2026-02-26

3.2 Distribusi Binomial

3.3 Distribusi Multinomial

3.4 Distribusi Poisson