Analisis Penggunaan Media Sosial

Skenario

Y: Keputusan berlangganan layanan premium pada platform media sosial X

X1 : Jumlah teman atau pengikut

X2 : Waktu yang dihabiskan per hari di platform media sosial (dalam jam)

X3 : Aktivitas harian (0: Sedikit, 1: Banyak)

X4 : Umur pengguna (dalam tahun)

Membangkitkan data X1

X1 : Jumlah teman atau pengikut Membangkitkan variabel X1 dengan jumlah teman atau pengikut berkisar 0-500 dengan nilai tengah 250 dan jumlah pengguna adalah 100

set.seed(100)
n <- 100
x1 <- round(runif(n, min = 0, max = 500))
x1
##   [1] 154 129 276  28 234 242 406 185 273  85 312 441 140 199 381 335 102 179
##  [19] 180 345 268 355 269 374 210  86 385 441 275 139 244 464 174 477 348 445
##  [37]  90 315 495  65 165 433 389 414 302 246 390 442 104 154 165  99 118 137
##  [55] 296 127  62 115 299 106 232 324 480 338 223 179 228 223 123 347 206 164
##  [73] 286 483 331 312 428 387 417  46 230 300 460 491  19 289 367 124 150 367
##  [91] 453 105 179 224 453 195 259  63  15 386

Membangkitkan Data X2

X2 : Waktu yang dihabiskan per hari di platform media sosial (dalam jam)

set.seed(322)
x2 <- round(runif(n, min = 0, max = 10), 2)
x2
##   [1] 4.62 3.01 1.50 8.44 0.18 8.00 8.99 0.21 1.34 7.27 4.15 9.01 3.68 8.62 9.19
##  [16] 6.20 0.55 5.00 1.97 8.42 6.86 6.91 8.30 7.45 2.35 3.69 9.85 9.93 6.34 1.83
##  [31] 4.87 1.70 7.15 9.27 1.97 2.44 9.39 2.32 5.38 0.14 4.26 3.22 2.55 4.61 5.47
##  [46] 0.21 7.18 9.68 6.20 0.19 8.32 4.32 9.50 6.18 0.73 2.95 5.45 0.90 6.35 0.17
##  [61] 2.62 0.42 5.20 8.85 0.46 5.49 9.55 3.27 5.82 1.29 6.33 3.56 2.16 8.80 5.81
##  [76] 7.20 0.10 9.50 6.18 9.40 9.95 4.17 2.48 8.19 8.59 7.09 4.10 9.31 8.61 3.85
##  [91] 3.61 8.28 5.08 4.92 0.20 1.29 9.10 9.15 7.23 7.98

Membangkitkan Data X3

X3 : Aktivitas harian

set.seed(100)
x3 <- round(runif(n))
x3
##   [1] 0 0 1 0 0 0 1 0 1 0 1 1 0 0 1 1 0 0 0 1 1 1 1 1 0 0 1 1 1 0 0 1 0 1 1 1 0
##  [38] 1 1 0 0 1 1 1 1 0 1 1 0 0 0 0 0 0 1 0 0 0 1 0 0 1 1 1 0 0 0 0 0 1 0 0 1 1
##  [75] 1 1 1 1 1 0 0 1 1 1 0 1 1 0 0 1 1 0 0 0 1 0 1 0 0 1

Membangkitkan Data X4

X4 : Umur pengguna (dalam tahun)

set.seed(11)
x4 <- round(runif(n, min = 13, max = 65))
x4
##   [1] 27 13 40 14 16 63 17 28 59 19 22 36 60 57 51 43 38 30 21 38 24 48 32 31 16
##  [26] 38 34 14 20 34 39 30 34 24 55 46 27 18 26 16 26 24 39 47 30 58 46 14 41 56
##  [51] 39 44 35 29 25 36 34 55 21 44 20 52 22 43 52 23 16 39 23 45 49 35 35 24 62
##  [76] 41 27 30 32 24 16 39 39 25 55 35 23 47 55 25 32 53 14 38 55 25 53 23 44 25

Membangkitkan Data Y

Menentukan Koefisien

b0 <- -2
b1 <- 0.03
b2 <- 0.5
b3 <- 0.8
b4 <- -0.02
set.seed(2)
datapendukung <- b0 + (b1 * x1) + (b2 * x2) + (b3 * x3) + (b4 * x4)
p <- exp(datapendukung) / (1 + exp(datapendukung))
p
##   [1] 0.9877512 0.9575073 0.9991159 0.9415854 0.9917561 0.9996646 0.9999997
##   [8] 0.9566860 0.9984685 0.9782255 0.9999443 0.9999999 0.9447995 0.9992079
##  [15] 0.9999990 0.9999847 0.6399161 0.9948827 0.9813851 0.9999966 0.9999440
##  [22] 0.9999935 0.9999690 0.9999980 0.9942626 0.8409081 0.9999995 0.9999999
##  [29] 0.9999456 0.9172078 0.9990659 0.9999977 0.9977954 1.0000000 0.9998911
##  [36] 0.9999961 0.9922709 0.9998826 0.9999999 0.4255575 0.9896463 0.9999976
##  [43] 0.9999827 0.9999966 0.9999544 0.9869393 0.9999981 0.9999999 0.9677045
##  [50] 0.8313184 0.9982211 0.9046505 0.9962789 0.9902433 0.9994715 0.9285748
##  [57] 0.8704564 0.6899745 0.9999731 0.5950785 0.9971851 0.9995428 0.9999998
##  [64] 0.9999963 0.9797670 0.9965122 0.9999081 0.9961083 0.9843267 0.9998709
##  [71] 0.9982822 0.9820138 0.9995737 1.0000000 0.9999694 0.9999823 0.9999856
##  [78] 0.9999995 0.9999989 0.9734030 0.9999292 0.9998889 0.9999979 1.0000000
##  [85] 0.8538348 0.9999669 0.9999888 0.9956577 0.9966818 0.9999868 0.9999987
##  [92] 0.9856563 0.9964243 0.9983740 0.9999887 0.9819253 0.9999572 0.9821019
##  [99] 0.7658456 0.9999991
set.seed(3)
y <- rbinom(n, 1, p)
y
##   [1] 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
##  [38] 1 1 0 1 1 1 1 1 1 1 1 1 1 1 1 1 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
##  [75] 1 1 1 1 1 1 1 1 1 1 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
datagab <- data.frame(y, x1, x2, x3, x4)
datagab
##     y  x1   x2 x3 x4
## 1   1 154 4.62  0 27
## 2   1 129 3.01  0 13
## 3   1 276 1.50  1 40
## 4   1  28 8.44  0 14
## 5   1 234 0.18  0 16
## 6   1 242 8.00  0 63
## 7   1 406 8.99  1 17
## 8   1 185 0.21  0 28
## 9   1 273 1.34  1 59
## 10  1  85 7.27  0 19
## 11  1 312 4.15  1 22
## 12  1 441 9.01  1 36
## 13  1 140 3.68  0 60
## 14  1 199 8.62  0 57
## 15  1 381 9.19  1 51
## 16  1 335 6.20  1 43
## 17  1 102 0.55  0 38
## 18  1 179 5.00  0 30
## 19  1 180 1.97  0 21
## 20  1 345 8.42  1 38
## 21  1 268 6.86  1 24
## 22  1 355 6.91  1 48
## 23  1 269 8.30  1 32
## 24  1 374 7.45  1 31
## 25  1 210 2.35  0 16
## 26  1  86 3.69  0 38
## 27  1 385 9.85  1 34
## 28  1 441 9.93  1 14
## 29  1 275 6.34  1 20
## 30  1 139 1.83  0 34
## 31  1 244 4.87  0 39
## 32  1 464 1.70  1 30
## 33  1 174 7.15  0 34
## 34  1 477 9.27  1 24
## 35  1 348 1.97  1 55
## 36  1 445 2.44  1 46
## 37  1  90 9.39  0 27
## 38  1 315 2.32  1 18
## 39  1 495 5.38  1 26
## 40  0  65 0.14  0 16
## 41  1 165 4.26  0 26
## 42  1 433 3.22  1 24
## 43  1 389 2.55  1 39
## 44  1 414 4.61  1 47
## 45  1 302 5.47  1 30
## 46  1 246 0.21  0 58
## 47  1 390 7.18  1 46
## 48  1 442 9.68  1 14
## 49  1 104 6.20  0 41
## 50  1 154 0.19  0 56
## 51  1 165 8.32  0 39
## 52  1  99 4.32  0 44
## 53  1 118 9.50  0 35
## 54  0 137 6.18  0 29
## 55  1 296 0.73  1 25
## 56  1 127 2.95  0 36
## 57  1  62 5.45  0 34
## 58  1 115 0.90  0 55
## 59  1 299 6.35  1 21
## 60  1 106 0.17  0 44
## 61  1 232 2.62  0 20
## 62  1 324 0.42  1 52
## 63  1 480 5.20  1 22
## 64  1 338 8.85  1 43
## 65  1 223 0.46  0 52
## 66  1 179 5.49  0 23
## 67  1 228 9.55  0 16
## 68  1 223 3.27  0 39
## 69  1 123 5.82  0 23
## 70  1 347 1.29  1 45
## 71  1 206 6.33  0 49
## 72  1 164 3.56  0 35
## 73  1 286 2.16  1 35
## 74  1 483 8.80  1 24
## 75  1 331 5.81  1 62
## 76  1 312 7.20  1 41
## 77  1 428 0.10  1 27
## 78  1 387 9.50  1 30
## 79  1 417 6.18  1 32
## 80  1  46 9.40  0 24
## 81  1 230 9.95  0 16
## 82  1 300 4.17  1 39
## 83  1 460 2.48  1 39
## 84  1 491 8.19  1 25
## 85  0  19 8.59  0 55
## 86  1 289 7.09  1 35
## 87  1 367 4.10  1 23
## 88  1 124 9.31  0 47
## 89  1 150 8.61  0 55
## 90  1 367 3.85  1 25
## 91  1 453 3.61  1 32
## 92  1 105 8.28  0 53
## 93  1 179 5.08  0 14
## 94  1 224 4.92  0 38
## 95  1 453 0.20  1 55
## 96  1 195 1.29  0 25
## 97  1 259 9.10  1 53
## 98  1  63 9.15  0 23
## 99  1  15 7.23  0 44
## 100 1 386 7.98  1 25

Analisis Regresi Logistik

modelreglog <- glm(y ~ x1 + x2 + x3 + x4, family = binomial(link = "logit"), data = datagab)
summary(modelreglog)
## 
## Call:
## glm(formula = y ~ x1 + x2 + x3 + x4, family = binomial(link = "logit"), 
##     data = datagab)
## 
## Coefficients:
##               Estimate Std. Error z value Pr(>|z|)  
## (Intercept) -1.574e+00  2.625e+00  -0.599   0.5489  
## x1           2.875e-02  1.554e-02   1.850   0.0643 .
## x2           1.964e-01  2.207e-01   0.890   0.3736  
## x3           1.249e+01  3.592e+03   0.003   0.9972  
## x4           7.014e-03  4.614e-02   0.152   0.8792  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## (Dispersion parameter for binomial family taken to be 1)
## 
##     Null deviance: 26.948  on 99  degrees of freedom
## Residual deviance: 17.259  on 95  degrees of freedom
## AIC: 27.259
## 
## Number of Fisher Scoring iterations: 20

Kesimpulan

jadi, dalam studi kasus ini kita memperhitungkan variabel-variabel yang mungkin mempengaruhi keputusan seseorang untuk berlangganan layanan premium di platform media sosial. Variabel yang dipertimbangkan meliputi jumlah teman atau pengikut, waktu yang dihabiskan setiap hari di platform, aktivitas harian, dan umur pengguna. Setelah membangkitkan data untuk variabel tersebut, kita menggunakan analisis regresi logistik untuk mengevaluasi hubungan antara variabel-variabel tersebut dan keputusan berlangganan layanan premium.