Data Stasiun TV

Import Data

stasiun_tv <- read.csv("https://raw.githubusercontent.com/nurkhamidah/dat/main/stasiun_tv.csv", sep = ";")
stasiun_tv
##        Usia Stasiun.TV Jumlah
## 1   > 50 th    MetroTV    326
## 2  40-50 th    MetroTV    688
## 3  20-39 th    MetroTV    343
## 4  10-19 th    MetroTV     98
## 5   > 50 th   Indosiar     38
## 6  40-50 th   Indosiar    116
## 7  20-39 th   Indosiar     84
## 8  10-19 th   Indosiar     48
## 9   > 50 th      NETTV    241
## 10 40-50 th      NETTV    584
## 11 20-39 th      NETTV    909
## 12 10-19 th      NETTV    403
## 13  > 50 th    TransTV    110
## 14 40-50 th    TransTV    188
## 15 20-39 th    TransTV    412
## 16 10-19 th    TransTV    681
## 17  > 50 th       RCTI      3
## 18 40-50 th       RCTI      4
## 19 20-39 th       RCTI     26
## 20 10-19 th       RCTI     85

Membentuk Tabel Kontingensi

  1. Tabel Kontingensi

Dari data yang terbentuk, dapat kita bentuk tabel kontingensi sebagai berikut:

stasiun_tv$Usia <- factor(stasiun_tv$Usia, levels=c("> 50 th", "40-50 th",
                                                        "20-39 th", "10-19 th"))
stasiun_tv$Stasiun.TV <- factor(stasiun_tv$Stasiun.TV,
                                    levels=c("MetroTV", "Indosiar",
                                             "NETTV","TransTV","RCTI"))
table_count <- xtabs(Jumlah ~ Usia + Stasiun.TV, data = stasiun_tv)
table_count
##           Stasiun.TV
## Usia       MetroTV Indosiar NETTV TransTV RCTI
##   > 50 th      326       38   241     110    3
##   40-50 th     688      116   584     188    4
##   20-39 th     343       84   909     412   26
##   10-19 th      98       48   403     681   85

Eksplorasi Data

library(gplots)
## 
## Attaching package: 'gplots'
## The following object is masked from 'package:stats':
## 
##     lowess
balloonplot(table_count, main ="Tabel Kontingensi Stasiun TV x Usia", xlab ="", ylab="", label = FALSE, show.margins = FALSE)

Semakin besar lingkaran menunjukkan semakin besar pula nilai yang direpresentasikan.

# Uji Chi Square
chisq <- chisq.test(table_count)
chisq
## 
##  Pearson's Chi-squared test
## 
## data:  table_count
## X-squared = 1240, df = 12, p-value < 2.2e-16

Berdasaarkan hasil uji Khi-kuadrat, diperoleh hasil bahwa kedua peubah (stasiun TV dan rentang usia) secara signifikan saling terkait.

Membentuk model Correspondence Analysis

library(factoextra)
## Loading required package: ggplot2
## Welcome! Want to learn more? See two factoextra-related books at https://goo.gl/ve3WBa
library(FactoMineR)
model_tv <- CA(table_count, graph = F)
# Presentase keragaman
fviz_screeplot(model_tv, addlabels = TRUE)

Dapat dilihat bahwa untuk mereduksi menjadi 2 dimensi saja, kita sudah mendapatkan 99.63% keragaman dalam data.

# Plot Analisis Korespondensi
fviz_ca_biplot(model_tv, repel = TRUE)

Interpretasi

  • Plot dalam gambar diatas, menunjukkan bagaimana korelasi antara stasiun TV favorit dengan berbagai kategori usia.
  • Terlihat bahwa usia kategori 10-19 tahun berdekatan dengan stasiun televisi RCTI dan TransTV, artinya jelas bahwa pemirsa dengan rentang usia 10-19 tahun lebih sering menonton stasiun RCTI dan TransTV dibanding stasiun televisi lainnya.
  • Kemudian pemirsa dengan kategori usia 20-39 tahun lebih sering menonton stasiun televisi NETTV.
  • Terakhir, pemirsa dengan kategori usia 40-50 tahun dan > 50 tahun lebih sering menonton stasiun televisi Indosiar dan MetroTV dibanding stasiun televisi lainnya.