Pada agroindustri, regresi linear sering dipakai untuk memprediksi output produksi dan menganalisis faktor-faktor proses yang memengaruhi hasil.
Pada materi ini, studi kasus menggunakan data mingguan produksi tapioka (tepung singkong). Tujuan utama:
Membangun regresi linear sederhana untuk memprediksi output_tapioka_ton.
Membangun regresi linear berganda dengan beberapa variabel proses.
Mengevaluasi model menggunakan RMSE pada data uji.
(Bonus) Membangun model untuk memprediksi laba_juta.
##2. Persiapan & Memuat Data ### 2.1 Memuat paket yang diperlukan
#install.packages(c("dplyr","ggplot2","knitr")) # jalankan sekali saja
library(dplyr)
## Warning: package 'dplyr' was built under R version 4.4.3
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(ggplot2)
## Warning: package 'ggplot2' was built under R version 4.4.3
Pastikan file dataset_agroindustri_tapioka_mingguan.csv berada di folder yang sama dengan file .Rmd.
data <- read.csv("dataset_agroindustri_tapioka_mingguan.csv")
dim(data)
## [1] 150 17
head(data, 10)
## id_produksi minggu_ke bahan_baku_singkong_ton kadar_pati_persen
## 1 TAP001 1 41.2 23.1
## 2 TAP002 2 49.9 29.7
## 3 TAP003 3 46.8 26.3
## 4 TAP004 4 54.3 22.9
## 5 TAP005 5 46.5 27.5
## 6 TAP006 6 61.8 30.0
## 7 TAP007 7 26.7 22.1
## 8 TAP008 8 24.1 24.1
## 9 TAP009 9 42.8 19.6
## 10 TAP010 10 15.0 22.8
## kadar_air_persen jam_operasi_jam energi_kwh tenaga_kerja_jam
## 1 65.4 87 38109 581
## 2 72.6 63 28247 462
## 3 69.1 107 41402 745
## 4 65.2 70 28930 481
## 5 62.4 113 38334 817
## 6 68.2 72 29540 403
## 7 69.9 70 28341 443
## 8 67.8 86 36777 574
## 9 63.0 78 30561 548
## 10 60.4 86 30476 593
## harga_bahan_juta_per_ton harga_jual_tapioka_juta_per_ton output_tapioka_ton
## 1 0.90 8.58 7.33
## 2 1.10 9.25 9.90
## 3 1.33 8.76 9.81
## 4 1.01 8.89 8.63
## 5 0.92 9.87 10.77
## 6 1.05 10.38 13.46
## 7 1.11 9.69 4.74
## 8 1.20 7.00 4.16
## 9 0.98 8.65 6.19
## 10 1.28 9.67 2.62
## pendapatan_juta biaya_bahan_juta biaya_energi_juta biaya_tenaga_juta
## 1 62.89 37.08 13.34 0.10
## 2 91.58 54.89 9.89 0.08
## 3 85.94 62.24 14.49 0.13
## 4 76.72 54.84 10.13 0.09
## 5 106.30 42.78 13.42 0.15
## 6 139.71 64.89 10.34 0.07
## 7 45.93 29.64 9.92 0.08
## 8 29.12 28.92 12.87 0.10
## 9 53.54 41.94 10.70 0.10
## 10 25.34 19.20 10.67 0.11
## biaya_lain_juta laba_juta
## 1 4.86 9.11
## 2 4.62 23.46
## 3 7.71 -1.69
## 4 8.68 4.92
## 5 5.53 41.59
## 6 5.61 60.55
## 7 4.07 4.04
## 8 3.50 -15.53
## 9 6.78 -5.87
## 10 6.29 -11.78
data
## id_produksi minggu_ke bahan_baku_singkong_ton kadar_pati_persen
## 1 TAP001 1 41.2 23.1
## 2 TAP002 2 49.9 29.7
## 3 TAP003 3 46.8 26.3
## 4 TAP004 4 54.3 22.9
## 5 TAP005 5 46.5 27.5
## 6 TAP006 6 61.8 30.0
## 7 TAP007 7 26.7 22.1
## 8 TAP008 8 24.1 24.1
## 9 TAP009 9 42.8 19.6
## 10 TAP010 10 15.0 22.8
## 11 TAP011 11 43.3 30.0
## 12 TAP012 12 51.0 24.7
## 13 TAP013 13 56.2 23.0
## 14 TAP014 14 29.7 25.1
## 15 TAP015 15 61.8 16.6
## 16 TAP016 16 61.6 18.3
## 17 TAP017 17 16.1 21.6
## 18 TAP018 18 38.9 25.3
## 19 TAP019 19 29.5 22.3
## 20 TAP020 20 48.1 23.7
## 21 TAP021 21 32.1 23.9
## 22 TAP022 22 49.0 20.6
## 23 TAP023 23 34.0 23.9
## 24 TAP024 24 57.8 27.9
## 25 TAP025 25 38.5 21.8
## 26 TAP026 26 31.6 26.6
## 27 TAP027 27 49.7 18.5
## 28 TAP028 28 58.9 19.2
## 29 TAP029 29 31.5 22.9
## 30 TAP030 30 23.5 23.8
## 31 TAP031 31 42.3 22.5
## 32 TAP032 32 50.6 29.0
## 33 TAP033 33 61.2 27.0
## 34 TAP034 34 54.1 16.8
## 35 TAP035 35 15.5 28.2
## 36 TAP036 36 55.8 23.5
## 37 TAP037 37 25.0 23.8
## 38 TAP038 38 58.9 23.2
## 39 TAP039 39 20.4 24.0
## 40 TAP040 40 29.5 22.2
## 41 TAP041 41 48.0 20.8
## 42 TAP042 42 56.7 22.8
## 43 TAP043 43 54.3 20.1
## 44 TAP044 44 45.5 22.1
## 45 TAP045 45 62.3 20.9
## 46 TAP046 46 15.6 30.0
## 47 TAP047 47 36.2 24.1
## 48 TAP048 48 58.6 23.6
## 49 TAP049 49 37.9 24.0
## 50 TAP050 50 53.5 23.0
## 51 TAP051 51 48.6 28.2
## 52 TAP052 52 55.7 20.6
## 53 TAP053 53 63.5 21.0
## 54 TAP054 54 40.0 20.9
## 55 TAP055 55 28.2 24.3
## 56 TAP056 56 28.9 23.3
## 57 TAP057 57 31.6 23.4
## 58 TAP058 58 21.6 21.7
## 59 TAP059 59 46.5 25.1
## 60 TAP060 60 48.9 25.7
## 61 TAP061 61 62.3 29.3
## 62 TAP062 62 48.0 23.5
## 63 TAP063 63 33.2 23.0
## 64 TAP064 64 56.1 25.2
## 65 TAP065 65 56.9 19.8
## 66 TAP066 66 15.5 27.5
## 67 TAP067 67 28.6 25.8
## 68 TAP068 68 60.7 20.8
## 69 TAP069 69 19.4 23.1
## 70 TAP070 70 12.4 21.7
## 71 TAP071 71 42.9 28.3
## 72 TAP072 72 23.7 20.1
## 73 TAP073 73 21.7 19.1
## 74 TAP074 74 36.5 15.3
## 75 TAP075 75 48.4 30.0
## 76 TAP076 76 19.9 18.8
## 77 TAP077 77 53.5 23.4
## 78 TAP078 78 48.6 21.7
## 79 TAP079 79 56.0 17.8
## 80 TAP080 80 40.6 16.7
## 81 TAP081 81 54.5 25.0
## 82 TAP082 82 31.8 17.4
## 83 TAP083 83 55.1 18.5
## 84 TAP084 84 27.1 21.4
## 85 TAP085 85 49.1 30.0
## 86 TAP086 86 41.1 21.4
## 87 TAP087 87 60.4 23.2
## 88 TAP088 88 58.9 22.4
## 89 TAP089 89 63.0 27.0
## 90 TAP090 90 52.7 22.1
## 91 TAP091 91 61.0 27.8
## 92 TAP092 92 21.3 15.0
## 93 TAP093 93 20.8 25.7
## 94 TAP094 94 16.6 24.1
## 95 TAP095 95 27.7 26.5
## 96 TAP096 96 52.2 25.8
## 97 TAP097 97 20.0 26.1
## 98 TAP098 98 14.8 24.2
## 99 TAP099 99 22.7 18.0
## 100 TAP100 100 15.9 20.6
## 101 TAP101 101 50.5 20.0
## 102 TAP102 102 36.0 25.7
## 103 TAP103 103 61.7 27.1
## 104 TAP104 104 29.9 25.2
## 105 TAP105 105 57.0 23.7
## 106 TAP106 106 36.7 24.8
## 107 TAP107 107 17.1 24.3
## 108 TAP108 108 25.6 28.5
## 109 TAP109 109 47.2 23.2
## 110 TAP110 110 49.6 26.5
## 111 TAP111 111 49.5 24.1
## 112 TAP112 112 62.3 24.8
## 113 TAP113 113 24.0 30.0
## 114 TAP114 114 64.4 24.0
## 115 TAP115 115 23.6 21.7
## 116 TAP116 116 52.4 26.5
## 117 TAP117 117 54.5 24.6
## 118 TAP118 118 18.7 23.4
## 119 TAP119 119 45.8 29.2
## 120 TAP120 120 52.4 23.2
## 121 TAP121 121 58.0 21.3
## 122 TAP122 122 23.4 24.5
## 123 TAP123 123 53.7 15.0
## 124 TAP124 124 49.0 20.4
## 125 TAP125 125 19.8 22.5
## 126 TAP126 126 61.4 27.0
## 127 TAP127 127 54.6 21.0
## 128 TAP128 128 30.7 22.7
## 129 TAP129 129 13.1 27.6
## 130 TAP130 130 59.0 24.7
## 131 TAP131 131 49.8 24.2
## 132 TAP132 132 56.8 23.9
## 133 TAP133 133 22.9 15.2
## 134 TAP134 134 12.4 20.0
## 135 TAP135 135 43.2 22.5
## 136 TAP136 136 31.2 20.9
## 137 TAP137 137 36.0 24.7
## 138 TAP138 138 44.6 23.9
## 139 TAP139 139 22.9 28.2
## 140 TAP140 140 49.1 22.4
## 141 TAP141 141 31.7 25.5
## 142 TAP142 142 31.0 25.6
## 143 TAP143 143 62.9 22.5
## 144 TAP144 144 52.9 27.6
## 145 TAP145 145 26.0 26.7
## 146 TAP146 146 33.6 26.6
## 147 TAP147 147 52.7 16.6
## 148 TAP148 148 21.2 23.4
## 149 TAP149 149 54.3 23.8
## 150 TAP150 150 64.6 24.3
## kadar_air_persen jam_operasi_jam energi_kwh tenaga_kerja_jam
## 1 65.4 87 38109 581
## 2 72.6 63 28247 462
## 3 69.1 107 41402 745
## 4 65.2 70 28930 481
## 5 62.4 113 38334 817
## 6 68.2 72 29540 403
## 7 69.9 70 28341 443
## 8 67.8 86 36777 574
## 9 63.0 78 30561 548
## 10 60.4 86 30476 593
## 11 64.5 80 33453 522
## 12 66.6 105 37591 667
## 13 71.3 111 35881 761
## 14 65.3 106 42279 579
## 15 65.4 80 32044 487
## 16 67.2 92 41268 674
## 17 62.0 93 33917 524
## 18 72.7 85 30196 579
## 19 68.5 101 36039 528
## 20 61.1 116 52677 739
## 21 63.3 96 34204 537
## 22 65.2 119 44687 909
## 23 61.8 117 44254 681
## 24 71.8 112 37476 757
## 25 59.1 87 30827 642
## 26 57.0 113 42202 829
## 27 65.0 81 37591 601
## 28 66.7 48 18298 420
## 29 63.2 85 35409 606
## 30 62.5 70 28405 370
## 31 71.8 109 39338 663
## 32 65.3 111 43112 800
## 33 62.7 85 29288 619
## 34 73.6 77 27147 520
## 35 75.0 71 24391 510
## 36 62.8 91 34005 551
## 37 64.8 70 27472 394
## 38 71.0 80 31450 504
## 39 64.3 72 28816 468
## 40 65.5 67 25296 366
## 41 66.6 71 29240 425
## 42 55.8 77 28939 499
## 43 72.4 80 30470 467
## 44 62.9 102 45885 688
## 45 69.0 76 32531 527
## 46 57.6 79 22886 565
## 47 72.8 75 30110 475
## 48 74.2 75 30258 438
## 49 68.3 63 25040 313
## 50 65.9 80 31622 487
## 51 66.4 90 37594 563
## 52 65.9 75 30012 509
## 53 60.9 65 27975 497
## 54 58.8 79 31732 585
## 55 72.4 96 32105 578
## 56 75.0 74 28539 534
## 57 64.1 84 35312 430
## 58 59.4 106 33095 597
## 59 68.1 64 23490 331
## 60 65.0 68 26366 514
## 61 62.7 82 31244 685
## 62 62.0 84 28213 632
## 63 67.2 87 36805 553
## 64 69.2 85 34122 498
## 65 60.5 95 41738 677
## 66 61.9 113 44543 704
## 67 67.5 77 29997 553
## 68 69.1 81 30290 398
## 69 66.9 107 36526 685
## 70 63.4 76 30767 471
## 71 69.8 85 31390 434
## 72 72.9 80 28611 476
## 73 66.7 99 29307 572
## 74 61.6 62 21814 421
## 75 66.4 96 39122 620
## 76 73.6 104 37476 790
## 77 66.8 83 34004 558
## 78 63.2 116 45878 637
## 79 70.5 63 27212 535
## 80 64.6 80 29642 505
## 81 61.1 84 33998 391
## 82 69.1 84 28319 546
## 83 65.2 71 28587 523
## 84 70.1 79 33159 512
## 85 72.5 96 35278 618
## 86 66.9 61 26439 397
## 87 63.1 83 30592 577
## 88 60.7 69 23208 524
## 89 63.5 84 29860 624
## 90 63.7 87 37413 663
## 91 67.0 95 32621 625
## 92 73.7 69 20230 406
## 93 69.3 77 25215 518
## 94 65.7 100 38039 676
## 95 65.8 50 17143 284
## 96 68.1 82 31098 577
## 97 60.7 73 32211 511
## 98 66.8 78 28460 511
## 99 57.9 60 24175 415
## 100 70.1 99 38736 530
## 101 56.2 97 42860 668
## 102 65.7 93 29866 554
## 103 72.9 60 20925 433
## 104 67.3 109 41275 651
## 105 66.0 50 18792 330
## 106 63.7 82 30431 546
## 107 58.2 85 29856 455
## 108 68.2 82 28720 645
## 109 65.6 68 26964 492
## 110 63.2 58 17043 339
## 111 67.6 120 49318 708
## 112 69.3 91 37370 524
## 113 72.6 108 31975 708
## 114 69.2 71 24544 491
## 115 63.9 86 31829 633
## 116 68.9 73 27959 495
## 117 63.9 80 30407 559
## 118 67.5 74 27069 368
## 119 67.7 95 30213 529
## 120 70.5 82 29957 481
## 121 61.5 67 26302 421
## 122 69.8 95 35642 604
## 123 69.7 62 25823 461
## 124 62.8 86 31774 582
## 125 67.5 74 21171 502
## 126 60.4 100 42389 751
## 127 70.4 115 43858 710
## 128 65.0 93 42214 612
## 129 69.7 100 34470 570
## 130 61.1 78 29117 530
## 131 62.4 42 15834 351
## 132 67.3 86 35692 469
## 133 65.5 77 29978 360
## 134 68.0 97 37216 569
## 135 60.6 77 29869 565
## 136 73.3 103 38110 522
## 137 67.1 69 31953 499
## 138 65.4 76 25814 393
## 139 63.2 103 34672 618
## 140 57.5 51 21458 305
## 141 64.8 81 28724 445
## 142 67.0 60 26652 325
## 143 72.0 85 30597 615
## 144 75.0 85 34503 501
## 145 56.3 120 38493 657
## 146 63.0 71 22491 412
## 147 72.8 93 40902 583
## 148 56.8 58 22599 432
## 149 67.1 65 27133 451
## 150 61.8 77 29422 591
## harga_bahan_juta_per_ton harga_jual_tapioka_juta_per_ton output_tapioka_ton
## 1 0.90 8.58 7.33
## 2 1.10 9.25 9.90
## 3 1.33 8.76 9.81
## 4 1.01 8.89 8.63
## 5 0.92 9.87 10.77
## 6 1.05 10.38 13.46
## 7 1.11 9.69 4.74
## 8 1.20 7.00 4.16
## 9 0.98 8.65 6.19
## 10 1.28 9.67 2.62
## 11 1.21 8.53 9.46
## 12 1.17 7.93 10.31
## 13 1.01 8.10 11.53
## 14 0.92 9.52 6.34
## 15 1.25 8.52 7.82
## 16 1.10 8.36 8.49
## 17 1.23 8.10 2.31
## 18 0.98 11.00 7.24
## 19 0.89 9.27 5.09
## 20 1.26 8.26 9.67
## 21 0.78 9.03 6.36
## 22 0.93 9.30 8.98
## 23 0.70 9.71 7.41
## 24 1.06 10.16 13.70
## 25 0.90 8.97 6.61
## 26 1.23 10.49 7.16
## 27 1.12 8.24 7.58
## 28 1.12 9.30 7.32
## 29 1.23 10.41 5.30
## 30 1.11 8.67 4.05
## 31 1.11 9.03 8.00
## 32 1.48 8.40 11.83
## 33 1.28 9.34 12.63
## 34 0.97 9.48 6.30
## 35 0.92 9.43 2.84
## 36 0.82 9.24 10.20
## 37 1.01 8.87 4.39
## 38 1.38 11.00 10.69
## 39 0.94 9.53 3.64
## 40 1.27 10.54 4.76
## 41 0.97 7.57 7.21
## 42 0.76 7.97 10.25
## 43 1.34 8.75 8.31
## 44 0.99 8.70 8.28
## 45 0.99 7.90 9.81
## 46 1.19 9.20 3.39
## 47 1.06 8.13 6.46
## 48 1.22 9.90 10.10
## 49 1.13 9.00 6.27
## 50 1.08 9.06 8.78
## 51 0.90 9.69 10.78
## 52 1.06 7.77 7.87
## 53 1.08 9.12 9.03
## 54 1.09 7.00 6.55
## 55 0.83 8.81 5.65
## 56 1.18 10.48 4.79
## 57 1.01 8.32 5.67
## 58 1.16 8.93 3.87
## 59 0.86 9.74 8.23
## 60 0.99 8.45 9.40
## 61 0.98 8.50 14.06
## 62 1.19 9.30 9.52
## 63 1.13 8.26 5.69
## 64 0.79 10.05 11.59
## 65 1.06 9.08 8.97
## 66 0.90 9.38 3.39
## 67 1.11 8.54 4.96
## 68 1.06 8.58 9.34
## 69 1.14 9.27 3.70
## 70 1.11 9.38 2.02
## 71 1.22 9.40 8.99
## 72 1.34 9.97 3.35
## 73 1.04 8.74 3.40
## 74 1.40 9.12 3.97
## 75 1.05 8.89 11.60
## 76 1.12 8.13 3.01
## 77 0.75 7.99 9.97
## 78 0.86 8.39 9.25
## 79 0.89 9.22 7.42
## 80 1.07 7.73 4.98
## 81 1.18 9.88 10.77
## 82 0.99 9.05 4.13
## 83 0.94 8.38 8.05
## 84 1.24 9.11 4.38
## 85 1.32 8.93 11.79
## 86 1.32 9.27 5.82
## 87 1.16 8.99 10.09
## 88 1.36 8.37 10.26
## 89 0.88 8.00 13.74
## 90 0.98 8.62 8.98
## 91 0.95 10.87 13.89
## 92 0.91 8.60 2.08
## 93 1.14 8.21 3.82
## 94 1.05 9.31 3.34
## 95 1.00 9.20 4.81
## 96 1.16 8.94 10.29
## 97 1.02 9.82 4.15
## 98 1.39 8.36 2.85
## 99 0.96 8.93 2.94
## 100 1.15 9.47 2.36
## 101 0.70 10.61 8.34
## 102 1.28 9.34 7.19
## 103 0.78 7.03 12.21
## 104 0.94 9.26 5.94
## 105 1.24 8.09 8.99
## 106 1.05 9.39 6.68
## 107 1.02 8.01 3.01
## 108 0.96 7.90 5.85
## 109 0.95 9.17 8.17
## 110 1.04 9.33 9.67
## 111 0.86 7.71 10.53
## 112 1.05 9.74 11.54
## 113 1.03 9.20 5.81
## 114 1.10 9.52 11.18
## 115 0.91 7.68 4.08
## 116 0.70 8.73 10.10
## 117 1.10 9.75 10.06
## 118 0.93 9.50 3.49
## 119 1.02 9.64 11.18
## 120 1.18 9.38 9.31
## 121 1.04 8.37 9.25
## 122 1.24 9.04 4.50
## 123 0.95 9.16 5.41
## 124 1.17 8.90 7.69
## 125 0.75 7.60 3.40
## 126 1.12 7.07 13.57
## 127 1.16 10.35 9.91
## 128 1.09 8.55 5.78
## 129 1.31 9.15 2.75
## 130 1.28 8.91 10.83
## 131 0.90 9.17 8.05
## 132 1.08 9.94 10.99
## 133 1.08 7.18 2.47
## 134 0.88 8.39 2.00
## 135 1.23 9.66 7.15
## 136 0.97 9.61 5.38
## 137 0.91 8.77 6.56
## 138 1.45 8.89 8.43
## 139 1.10 8.17 4.88
## 140 1.05 8.17 7.60
## 141 1.04 9.33 6.06
## 142 0.90 9.16 6.02
## 143 0.84 8.98 10.04
## 144 1.00 9.34 11.35
## 145 1.05 8.19 5.72
## 146 1.13 8.27 6.70
## 147 1.01 9.30 6.39
## 148 0.92 8.05 3.48
## 149 0.80 8.51 9.49
## 150 1.08 8.42 10.89
## pendapatan_juta biaya_bahan_juta biaya_energi_juta biaya_tenaga_juta
## 1 62.89 37.08 13.34 0.10
## 2 91.58 54.89 9.89 0.08
## 3 85.94 62.24 14.49 0.13
## 4 76.72 54.84 10.13 0.09
## 5 106.30 42.78 13.42 0.15
## 6 139.71 64.89 10.34 0.07
## 7 45.93 29.64 9.92 0.08
## 8 29.12 28.92 12.87 0.10
## 9 53.54 41.94 10.70 0.10
## 10 25.34 19.20 10.67 0.11
## 11 80.69 52.39 11.71 0.09
## 12 81.76 59.67 13.16 0.12
## 13 93.39 56.76 12.56 0.14
## 14 60.36 27.32 14.80 0.10
## 15 66.63 77.25 11.22 0.09
## 16 70.98 67.76 14.44 0.12
## 17 18.71 19.80 11.87 0.09
## 18 79.64 38.12 10.57 0.10
## 19 47.18 26.26 12.61 0.10
## 20 79.87 60.61 18.44 0.13
## 21 57.43 25.04 11.97 0.10
## 22 83.51 45.57 15.64 0.16
## 23 71.95 23.80 15.49 0.12
## 24 139.19 61.27 13.12 0.14
## 25 59.29 34.65 10.79 0.12
## 26 75.11 38.87 14.77 0.15
## 27 62.46 55.66 13.16 0.11
## 28 68.08 65.97 6.40 0.08
## 29 55.17 38.74 12.39 0.11
## 30 35.11 26.08 9.94 0.07
## 31 72.24 46.95 13.77 0.12
## 32 99.37 74.89 15.09 0.14
## 33 117.96 78.34 10.25 0.11
## 34 59.72 52.48 9.50 0.09
## 35 26.78 14.26 8.54 0.09
## 36 94.25 45.76 11.90 0.10
## 37 38.94 25.25 9.62 0.07
## 38 117.59 81.28 11.01 0.09
## 39 34.69 19.18 10.09 0.08
## 40 50.17 37.47 8.85 0.07
## 41 54.58 46.56 10.23 0.08
## 42 81.69 43.09 10.13 0.09
## 43 72.71 72.76 10.66 0.08
## 44 72.04 45.04 16.06 0.12
## 45 77.50 61.68 11.39 0.09
## 46 31.19 18.56 8.01 0.10
## 47 52.52 38.37 10.54 0.09
## 48 99.99 71.49 10.59 0.08
## 49 56.43 42.83 8.76 0.06
## 50 79.55 57.78 11.07 0.09
## 51 104.46 43.74 13.16 0.10
## 52 61.15 59.04 10.50 0.09
## 53 82.35 68.58 9.79 0.09
## 54 45.85 43.60 11.11 0.11
## 55 49.78 23.41 11.24 0.10
## 56 50.20 34.10 9.99 0.10
## 57 47.17 31.92 12.36 0.08
## 58 34.56 25.06 11.58 0.11
## 59 80.16 39.99 8.22 0.06
## 60 79.43 48.41 9.23 0.09
## 61 119.51 61.05 10.94 0.12
## 62 88.54 57.12 9.87 0.11
## 63 47.00 37.52 12.88 0.10
## 64 116.48 44.32 11.94 0.09
## 65 81.45 60.31 14.61 0.12
## 66 31.80 13.95 15.59 0.13
## 67 42.36 31.75 10.50 0.10
## 68 80.14 64.34 10.60 0.07
## 69 34.30 22.12 12.78 0.12
## 70 18.95 13.76 10.77 0.08
## 71 84.51 52.34 10.99 0.08
## 72 33.40 31.76 10.01 0.09
## 73 29.72 22.57 10.26 0.10
## 74 36.21 51.10 7.63 0.08
## 75 103.12 50.82 13.69 0.11
## 76 24.47 22.29 13.12 0.14
## 77 79.66 40.12 11.90 0.10
## 78 77.61 41.80 16.06 0.11
## 79 68.41 49.84 9.52 0.10
## 80 38.50 43.44 10.37 0.09
## 81 106.41 64.31 11.90 0.07
## 82 37.38 31.48 9.91 0.10
## 83 67.46 51.79 10.01 0.09
## 84 39.90 33.60 11.61 0.09
## 85 105.28 64.81 12.35 0.11
## 86 53.95 54.25 9.25 0.07
## 87 90.71 70.06 10.71 0.10
## 88 85.88 80.10 8.12 0.09
## 89 109.92 55.44 10.45 0.11
## 90 77.41 51.65 13.09 0.12
## 91 150.98 57.95 11.42 0.11
## 92 17.89 19.38 7.08 0.07
## 93 31.36 23.71 8.83 0.09
## 94 31.10 17.43 13.31 0.12
## 95 44.25 27.70 6.00 0.05
## 96 91.99 60.55 10.88 0.10
## 97 40.75 20.40 11.27 0.09
## 98 23.83 20.57 9.96 0.09
## 99 26.25 21.79 8.46 0.07
## 100 22.35 18.28 13.56 0.10
## 101 88.49 35.35 15.00 0.12
## 102 67.15 46.08 10.45 0.10
## 103 85.84 48.13 7.32 0.08
## 104 55.00 28.11 14.45 0.12
## 105 72.73 70.68 6.58 0.06
## 106 62.73 38.54 10.65 0.10
## 107 24.11 17.44 10.45 0.08
## 108 46.22 24.58 10.05 0.12
## 109 74.92 44.84 9.44 0.09
## 110 90.22 51.58 5.97 0.06
## 111 81.19 42.57 17.26 0.13
## 112 112.40 65.42 13.08 0.09
## 113 53.45 24.72 11.19 0.13
## 114 106.43 70.84 8.59 0.09
## 115 31.33 21.48 11.14 0.11
## 116 88.17 36.68 9.79 0.09
## 117 98.08 59.95 10.64 0.10
## 118 33.16 17.39 9.47 0.07
## 119 107.78 46.72 10.57 0.10
## 120 87.33 61.83 10.48 0.09
## 121 77.42 60.32 9.21 0.08
## 122 40.68 29.02 12.47 0.11
## 123 49.56 51.02 9.04 0.08
## 124 68.44 57.33 11.12 0.10
## 125 25.84 14.85 7.41 0.09
## 126 95.94 68.77 14.84 0.14
## 127 102.57 63.34 15.35 0.13
## 128 49.42 33.46 14.77 0.11
## 129 25.16 17.16 12.06 0.10
## 130 96.50 75.52 10.19 0.10
## 131 73.82 44.82 5.54 0.06
## 132 109.24 61.34 12.49 0.08
## 133 17.73 24.73 10.49 0.06
## 134 16.78 10.91 13.03 0.10
## 135 69.07 53.14 10.45 0.10
## 136 51.70 30.26 13.34 0.09
## 137 57.53 32.76 11.18 0.09
## 138 74.94 64.67 9.03 0.07
## 139 39.87 25.19 12.14 0.11
## 140 62.09 51.56 7.51 0.05
## 141 56.54 32.97 10.05 0.08
## 142 55.14 27.90 9.33 0.06
## 143 90.16 52.84 10.71 0.11
## 144 106.01 52.90 12.08 0.09
## 145 46.85 27.30 13.47 0.12
## 146 55.41 37.97 7.87 0.07
## 147 59.43 53.23 14.32 0.10
## 148 28.01 19.50 7.91 0.08
## 149 80.76 43.44 9.50 0.08
## 150 91.69 69.77 10.30 0.11
## biaya_lain_juta laba_juta
## 1 4.86 9.11
## 2 4.62 23.46
## 3 7.71 -1.69
## 4 8.68 4.92
## 5 5.53 41.59
## 6 5.61 60.55
## 7 4.07 4.04
## 8 3.50 -15.53
## 9 6.78 -5.87
## 10 6.29 -11.78
## 11 6.78 10.53
## 12 5.69 0.66
## 13 5.18 20.25
## 14 5.75 13.52
## 15 4.91 -24.95
## 16 7.68 -19.40
## 17 9.08 -24.02
## 18 5.83 25.61
## 19 5.78 2.92
## 20 3.62 0.45
## 21 4.75 16.10
## 22 9.63 15.56
## 23 5.15 28.46
## 24 5.10 59.19
## 25 8.03 3.76
## 26 8.92 13.72
## 27 6.12 -14.87
## 28 7.89 -12.36
## 29 7.46 -0.54
## 30 7.48 -7.43
## 31 6.84 3.46
## 32 6.35 1.90
## 33 6.78 24.16
## 34 4.10 -9.58
## 35 5.16 -4.82
## 36 6.32 31.76
## 37 7.05 -1.66
## 38 7.29 19.39
## 39 5.24 -2.89
## 40 8.30 -5.73
## 41 8.23 -8.23
## 42 3.50 24.60
## 43 4.91 -15.72
## 44 5.81 4.69
## 45 9.40 -8.46
## 46 4.75 -0.88
## 47 6.11 0.53
## 48 6.98 9.35
## 49 5.38 -1.90
## 50 3.81 6.56
## 51 5.95 41.82
## 52 6.90 -15.72
## 53 6.06 -1.83
## 54 10.33 -22.61
## 55 7.00 11.04
## 56 6.12 -0.56
## 57 6.70 -6.75
## 58 6.18 -10.85
## 59 8.05 25.81
## 60 6.17 14.79
## 61 5.74 39.32
## 62 7.97 14.50
## 63 6.99 -11.36
## 64 5.74 54.22
## 65 4.42 2.32
## 66 4.85 1.86
## 67 7.72 -7.46
## 68 5.32 0.83
## 69 6.64 -8.92
## 70 8.17 -13.91
## 71 6.45 17.85
## 72 6.69 -17.09
## 73 6.69 -10.39
## 74 5.25 -25.33
## 75 7.16 33.11
## 76 7.09 -17.05
## 77 3.85 23.02
## 78 5.82 16.90
## 79 5.42 3.69
## 80 4.58 -18.11
## 81 5.12 22.67
## 82 5.25 -10.56
## 83 6.51 1.10
## 84 8.35 -12.26
## 85 6.27 19.83
## 86 7.13 -16.87
## 87 6.77 -0.56
## 88 9.56 -9.30
## 89 4.23 39.25
## 90 6.48 7.41
## 91 5.85 75.25
## 92 5.02 -11.34
## 93 6.62 -10.42
## 94 5.09 -2.72
## 95 6.04 2.47
## 96 6.27 15.82
## 97 5.52 1.05
## 98 4.02 -12.21
## 99 5.19 -8.99
## 100 6.77 -16.72
## 101 6.47 34.22
## 102 6.54 3.69
## 103 5.69 24.63
## 104 7.97 4.67
## 105 7.05 -11.01
## 106 6.80 7.05
## 107 6.13 -11.66
## 108 7.20 3.96
## 109 4.36 15.06
## 110 8.81 26.27
## 111 3.87 19.66
## 112 10.22 24.94
## 113 3.50 14.36
## 114 7.32 19.53
## 115 9.55 -13.61
## 116 6.44 33.05
## 117 5.94 19.01
## 118 8.55 -3.89
## 119 6.49 45.44
## 120 7.85 6.02
## 121 5.04 2.09
## 122 4.92 -3.53
## 123 6.66 -17.95
## 124 7.76 -7.71
## 125 6.05 1.76
## 126 10.39 2.83
## 127 4.14 17.81
## 128 4.52 -2.86
## 129 5.71 -7.88
## 130 6.18 3.23
## 131 3.72 19.47
## 132 3.76 32.99
## 133 5.35 -24.19
## 134 6.57 -14.22
## 135 5.27 -2.72
## 136 10.70 -4.83
## 137 5.83 4.54
## 138 7.23 -3.18
## 139 7.90 -7.51
## 140 6.77 -3.95
## 141 8.38 5.67
## 142 5.83 11.34
## 143 5.84 19.97
## 144 5.19 32.75
## 145 8.63 -2.88
## 146 5.44 6.21
## 147 3.50 -12.00
## 148 6.36 -4.49
## 149 8.93 19.84
## 150 6.49 7.17
bahan_baku_singkong_ton : jumlah singkong masuk (ton/minggu) kadar_pati_persen : kadar pati singkong (%) kadar_air_persen : kadar air umbi (%) jam_operasi_jam : jam operasi pabrik (jam/minggu) energi_kwh : konsumsi energi (kWh/minggu) tenaga_kerja_jam : jam kerja (jam/minggu) output_tapioka_ton : output tapioka (ton/minggu) ✅ target utama laba_juta : laba (juta Rupiah) ✅ target bonus
#3. Eksplorasi Data (EDA) ## 3.1 Cek missing value dan ringkasan
Tujuan: Memprediksi hasil tepung tapioka (kg) dari jumlah singkong yang diolah (kg) pada satu agroindustri.
X (variabel bebas): jumlah singkong diolah per batch (kg)
Y (variabel terikat): hasil tapioka kering per batch (kg)
Hipotesis sederhana: makin banyak singkong yang diolah, makin besar hasil tapioka (hubungan positif)
# Data contoh tapioka
df <- data.frame(
singkong = c(200,250,300,350,400,450,500,550,600,650,700,750),
tapioka = c(48,61,74,84,96,108,121,132,145,156,169,181)
)
# Scatterplot
plot(df$singkong, df$tapioka,
main="Regresi Linear: Singkong vs Hasil Tapioka",
xlab="Singkong diolah (kg)",
ylab="Hasil tapioka (kg)")
# Model regresi linear sederhana
model <- lm(tapioka ~ singkong, data = df)
abline(model, col="red", lwd=2)
# Ringkasan model
summary(model)
##
## Call:
## lm(formula = tapioka ~ singkong, data = df)
##
## Residuals:
## Min 1Q Median 3Q Max
## -0.62005 -0.57022 -0.08333 0.39569 1.45338
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 0.483683 0.591733 0.817 0.433
## singkong 0.240210 0.001171 205.158 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.7001 on 10 degrees of freedom
## Multiple R-squared: 0.9998, Adjusted R-squared: 0.9997
## F-statistic: 4.209e+04 on 1 and 10 DF, p-value: < 2.2e-16
# Contoh prediksi: kalau olah 620 kg singkong, hasilnya berapa?
predict(model, newdata = data.frame(singkong = 620))
## 1
## 149.4138
Penjelasan
###1. Model yang digunakan
knitr::include_graphics("regresi2.png")
###2. Interpretasi koefisien (nanti ambil dari output summary(model))
Intercept : nilai hasil tapioka saat singkong = 0 kg (makna teoritis; dipakai untuk membentuk garis).
Slope : setiap tambahan 1 kg singkong akan menaikkan hasil tapioka rata-rata sebesar
###3. Uji signifikansi (p-value)
Jika p-value koefisien singkong < 0.05 → jumlah singkong berpengaruh signifikan terhadap hasil tapioka.
###4. Kekuatan model (R-squared)
R² menunjukkan berapa persen variasi hasil tapioka dijelaskan oleh jumlah singkong.
###5. Prediksi
Dengan predict(), kamu bisa memprediksi hasil tapioka untuk input singkong tertentu, misalnya 620 kg.
Penjelasan analisis Analisis ini bertujuan untuk mengetahui dan memodelkan hubungan antara jumlah singkong yang diolah per batch (X) terhadap hasil tapioka (Y) pada agroindustri tapioka. Metode yang digunakan adalah regresi linear sederhana, karena hanya melibatkan satu variabel bebas (singkong) untuk menjelaskan perubahan variabel terikat (tapioka).
Berdasarkan hasil pemodelan regresi, diperoleh persamaan garis regresi sebagai berikut:
knitr::include_graphics("tapioka.png")
Nilai intercept (0.483683) menunjukkan perkiraan hasil tapioka ketika jumlah singkong bernilai 0 kg. Secara operasional kondisi ini tidak terjadi dalam produksi, sehingga intercept lebih berfungsi sebagai konstanta pembentuk persamaan. Selain itu, intercept memiliki p-value = 0.433 (lebih besar dari 0.05), sehingga secara statistik intercept tidak signifikan; namun hal ini tidak menjadi masalah utama karena fokus analisis biasanya pada pengaruh variabel singkong.
Nilai koefisien regresi singkong (0.240210) bernilai positif, artinya terdapat hubungan searah antara jumlah singkong yang diolah dengan hasil tapioka. Interpretasinya adalah: setiap penambahan 1 kg singkong yang diolah akan meningkatkan hasil tapioka rata-rata sebesar 0.240210 kg, dengan asumsi kondisi proses relatif sama. Jika dinyatakan sebagai rendemen, koefisien ini mengindikasikan rendemen sekitar 24% (karena 0.240 kg per 1 kg singkong), yang masih masuk akal untuk proses tapioka.
Dari sisi signifikansi, variabel singkong memiliki nilai t = 205.158 dengan p-value < 2e-16, yang jauh lebih kecil dari 0.05. Dengan demikian dapat disimpulkan bahwa jumlah singkong berpengaruh signifikan terhadap hasil tapioka, sehingga variabel singkong layak digunakan sebagai prediktor dalam model.
Kekuatan model terlihat dari nilai Multiple R-squared = 0.9998 dan Adjusted R-squared = 0.9997. Hal ini berarti sekitar 99.98% variasi hasil tapioka dapat dijelaskan oleh jumlah singkong yang diolah. Dengan kata lain, model memiliki kecocokan yang sangat tinggi terhadap data. Nilai F-statistic = 4.209 × 10⁴ dengan p-value < 2.2e-16 juga menunjukkan bahwa model regresi secara keseluruhan signifikan dan lebih baik dibandingkan model tanpa prediktor (model konstanta saja).
Besarnya kesalahan prediksi rata-rata model dapat dilihat dari Residual Standard Error = 0.7001. Artinya, rata-rata selisih antara nilai aktual dan nilai prediksi hasil tapioka berada di sekitar ±0.70 kg (pada skala data ini). Ringkasan residual menunjukkan error berkisar dari sekitar -0.62 hingga 1.45, yang menandakan masih ada variasi kecil (misalnya akibat perbedaan kualitas bahan baku atau efisiensi proses), namun secara umum penyimpangannya relatif kecil.
Sebagai contoh penerapan prediksi, ketika agroindustri mengolah 620 kg singkong, maka hasil tapioka yang diperkirakan oleh model adalah:
knitr::include_graphics("tapioka 2.png")
Sehingga, hasil tapioka yang diprediksi untuk 620 kg singkong adalah sekitar 149.41 kg.
Secara keseluruhan dapat disimpulkan bahwa terdapat hubungan linear positif yang sangat kuat dan signifikan antara jumlah singkong yang diolah dan hasil tapioka. Model regresi ini dapat digunakan sebagai alat bantu perencanaan produksi untuk memperkirakan output tapioka berdasarkan input singkong. Namun, untuk penerapan yang lebih luas, disarankan mempertimbangkan faktor lain seperti kadar pati singkong, efisiensi ekstraksi, dan kondisi pengeringan karena faktor tersebut juga dapat memengaruhi rendemen dan kualitas hasil.
#Studi kasus yang cocok untuk “keseluruhan dataset 150 data” (Regresi Linear Sederhana) Judul Pengaruh jumlah bahan baku singkong terhadap output tapioka pada 150 data produksi mingguan.
Variabel
X: bahan_baku_singkong_ton
Y: output_tapioka_ton
Hasil model
##Cara 1
Persamaan regresinya (menggunakan seluruh 150 data):
knitr::include_graphics("regresi3.png")
df <- read.csv("dataset_agroindustri_tapioka_mingguan.csv")
# Regresi linear sederhana
model <- lm(output_tapioka_ton ~ bahan_baku_singkong_ton, data = df)
summary(model)
##
## Call:
## lm(formula = output_tapioka_ton ~ bahan_baku_singkong_ton, data = df)
##
## Residuals:
## Min 1Q Median 3Q Max
## -4.2195 -0.6125 -0.0419 0.6905 3.3394
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 0.053234 0.320349 0.166 0.868
## bahan_baku_singkong_ton 0.178329 0.007289 24.467 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 1.366 on 148 degrees of freedom
## Multiple R-squared: 0.8018, Adjusted R-squared: 0.8004
## F-statistic: 598.6 on 1 and 148 DF, p-value: < 2.2e-16
# Plot + garis regresi
plot(df$bahan_baku_singkong_ton, df$output_tapioka_ton,
main="Singkong (ton) vs Output Tapioka (ton) - 150 data",
xlab="Bahan baku singkong (ton)",
ylab="Output tapioka (ton)")
abline(model, col="red", lwd=2)
# Contoh prediksi
predict(model, newdata = data.frame(bahan_baku_singkong_ton = 50))
## 1
## 8.969669
Interpretasi koefisien:
Koefisien 0.178 artinya setiap tambahan 1 ton singkong diperkirakan menaikkan output tapioka sekitar 0.178 ton (≈ 17.8% rendemen).
R² ≈ 0.802, artinya sekitar 80.2% variasi output bisa dijelaskan oleh jumlah singkong.
Koefisien singkong signifikan (p-value sangat kecil), sedangkan intercept tidak terlalu penting secara operasional.
Contoh prediksi: Jika singkong = 50 ton, prediksi output ≈ 8.97 ton.
##Cara 2
# =========================================
# REGRESI LINEAR SEDERHANA (CARA 2)
# Mulai dari import data + rename kolom + split + model + RMSE
# Dataset: dataset_agroindustri_tapioka_mingguan.csv
# =========================================
# 1) (Opsional tapi disarankan) set working directory ke folder tempat CSV berada
# setwd("C:/Users/NamaKamu/Documents/ProjectTapioka")
# 2) Import data
df <- read.csv("dataset_agroindustri_tapioka_mingguan.csv")
# 3) Cek data (opsional)
str(df)
## 'data.frame': 150 obs. of 17 variables:
## $ id_produksi : chr "TAP001" "TAP002" "TAP003" "TAP004" ...
## $ minggu_ke : int 1 2 3 4 5 6 7 8 9 10 ...
## $ bahan_baku_singkong_ton : num 41.2 49.9 46.8 54.3 46.5 61.8 26.7 24.1 42.8 15 ...
## $ kadar_pati_persen : num 23.1 29.7 26.3 22.9 27.5 30 22.1 24.1 19.6 22.8 ...
## $ kadar_air_persen : num 65.4 72.6 69.1 65.2 62.4 68.2 69.9 67.8 63 60.4 ...
## $ jam_operasi_jam : int 87 63 107 70 113 72 70 86 78 86 ...
## $ energi_kwh : int 38109 28247 41402 28930 38334 29540 28341 36777 30561 30476 ...
## $ tenaga_kerja_jam : int 581 462 745 481 817 403 443 574 548 593 ...
## $ harga_bahan_juta_per_ton : num 0.9 1.1 1.33 1.01 0.92 1.05 1.11 1.2 0.98 1.28 ...
## $ harga_jual_tapioka_juta_per_ton: num 8.58 9.25 8.76 8.89 9.87 ...
## $ output_tapioka_ton : num 7.33 9.9 9.81 8.63 10.77 ...
## $ pendapatan_juta : num 62.9 91.6 85.9 76.7 106.3 ...
## $ biaya_bahan_juta : num 37.1 54.9 62.2 54.8 42.8 ...
## $ biaya_energi_juta : num 13.34 9.89 14.49 10.13 13.42 ...
## $ biaya_tenaga_juta : num 0.1 0.08 0.13 0.09 0.15 0.07 0.08 0.1 0.1 0.11 ...
## $ biaya_lain_juta : num 4.86 4.62 7.71 8.68 5.53 5.61 4.07 3.5 6.78 6.29 ...
## $ laba_juta : num 9.11 23.46 -1.69 4.92 41.59 ...
summary(df)
## id_produksi minggu_ke bahan_baku_singkong_ton kadar_pati_persen
## Length:150 Min. : 1.00 Min. :12.40 Min. :15.00
## Class :character 1st Qu.: 38.25 1st Qu.:27.82 1st Qu.:21.62
## Mode :character Median : 75.50 Median :45.05 Median :23.55
## Mean : 75.50 Mean :41.20 Mean :23.48
## 3rd Qu.:112.75 3rd Qu.:54.30 3rd Qu.:25.68
## Max. :150.00 Max. :64.60 Max. :30.00
## kadar_air_persen jam_operasi_jam energi_kwh tenaga_kerja_jam
## Min. :55.80 Min. : 42.00 Min. :15834 Min. :284.0
## 1st Qu.:63.00 1st Qu.: 73.00 1st Qu.:28325 1st Qu.:468.2
## Median :65.90 Median : 82.00 Median :30595 Median :530.0
## Mean :66.02 Mean : 83.91 Mean :31924 Mean :542.2
## 3rd Qu.:69.10 3rd Qu.: 95.00 3rd Qu.:36404 3rd Qu.:617.2
## Max. :75.00 Max. :120.00 Max. :52677 Max. :909.0
## harga_bahan_juta_per_ton harga_jual_tapioka_juta_per_ton output_tapioka_ton
## Min. :0.7000 Min. : 7.000 Min. : 2.000
## 1st Qu.:0.9425 1st Qu.: 8.383 1st Qu.: 4.827
## Median :1.0500 Median : 8.995 Median : 7.370
## Mean :1.0589 Mean : 8.945 Mean : 7.401
## 3rd Qu.:1.1600 3rd Qu.: 9.380 3rd Qu.: 9.877
## Max. :1.4800 Max. :11.000 Max. :14.060
## pendapatan_juta biaya_bahan_juta biaya_energi_juta biaya_tenaga_juta
## Min. : 16.78 Min. :10.91 Min. : 5.540 Min. :0.0500
## 1st Qu.: 44.65 1st Qu.:27.75 1st Qu.: 9.912 1st Qu.:0.0800
## Median : 67.31 Median :43.52 Median :10.710 Median :0.1000
## Mean : 66.41 Mean :43.52 Mean :11.174 Mean :0.0972
## 3rd Qu.: 85.87 3rd Qu.:57.67 3rd Qu.:12.738 3rd Qu.:0.1100
## Max. :150.98 Max. :81.28 Max. :18.440 Max. :0.1600
## biaya_lain_juta laba_juta
## Min. : 3.500 Min. :-25.330
## 1st Qu.: 5.242 1st Qu.: -8.143
## Median : 6.225 Median : 1.995
## Mean : 6.338 Mean : 5.318
## 3rd Qu.: 7.152 3rd Qu.: 16.700
## Max. :10.700 Max. : 75.250
colSums(is.na(df)) # cek missing value
## id_produksi minggu_ke
## 0 0
## bahan_baku_singkong_ton kadar_pati_persen
## 0 0
## kadar_air_persen jam_operasi_jam
## 0 0
## energi_kwh tenaga_kerja_jam
## 0 0
## harga_bahan_juta_per_ton harga_jual_tapioka_juta_per_ton
## 0 0
## output_tapioka_ton pendapatan_juta
## 0 0
## biaya_bahan_juta biaya_energi_juta
## 0 0
## biaya_tenaga_juta biaya_lain_juta
## 0 0
## laba_juta
## 0
# 4) Cara 2: rename kolom agar bisa pakai formula "tapioka ~ singkong"
df2 <- df
df2$singkong <- as.numeric(df2$bahan_baku_singkong_ton)
df2$tapioka <- as.numeric(df2$output_tapioka_ton)
# 5) Split data 80% train - 20% test
set.seed(123)
idx <- sample(nrow(df2), size = floor(0.8 * nrow(df2)))
train <- df2[idx, ]
test <- df2[-idx, ]
# 6) Bangun model regresi linear sederhana
model_train <- lm(tapioka ~ singkong, data = train)
# 7) Ringkasan model (koefisien, p-value, R2)
summary(model_train)
##
## Call:
## lm(formula = tapioka ~ singkong, data = train)
##
## Residuals:
## Min 1Q Median 3Q Max
## -4.2114 -0.6909 -0.0184 0.7191 3.3437
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -0.004427 0.378047 -0.012 0.991
## singkong 0.179252 0.008534 21.005 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 1.416 on 118 degrees of freedom
## Multiple R-squared: 0.789, Adjusted R-squared: 0.7872
## F-statistic: 441.2 on 1 and 118 DF, p-value: < 2.2e-16
# 8) Prediksi ke data test
pred <- predict(model_train, newdata = test)
# 9) Evaluasi RMSE
# Cara A: pakai MLmetrics (jika sudah terinstall)
# install.packages("MLmetrics") # jalankan sekali saja jika belum ada
library(MLmetrics)
##
## Attaching package: 'MLmetrics'
## The following object is masked from 'package:base':
##
## Recall
rmse_val <- RMSE(pred, test$tapioka)
rmse_val
## [1] 1.151089
# Cara B (alternatif tanpa paket): RMSE manual
rmse_manual <- sqrt(mean((pred - test$tapioka)^2))
rmse_manual
## [1] 1.151089
# 10) (Opsional) Tabel perbandingan aktual vs prediksi (10 baris pertama)
hasil_pred <- data.frame(
singkong = test$singkong,
tapioka_aktual = test$tapioka,
tapioka_pred = pred,
error = test$tapioka - pred
)
head(hasil_pred, 10)
## singkong tapioka_aktual tapioka_pred error
## 1 41.2 7.33 7.380755 -0.05075498
## 2 49.9 9.90 8.940247 0.95975277
## 3 46.8 9.81 8.384566 1.42543392
## 11 43.3 9.46 7.757184 1.70281586
## 18 38.9 7.24 6.968475 0.27152458
## 19 29.5 5.09 5.283507 -0.19350678
## 28 58.9 7.32 10.553515 -3.23351508
## 33 61.2 12.63 10.965795 1.66420536
## 36 55.8 10.20 9.997834 0.20216607
## 48 58.6 10.10 10.499739 -0.39973948
# 11) (Opsional) Plot data train + garis regresi
plot(train$singkong, train$tapioka,
main = "Train: Singkong vs Tapioka + Garis Regresi",
xlab = "Singkong (ton)",
ylab = "Tapioka (ton)")
abline(model_train, col="red", lwd=2)
# 12) (Opsional) Plot aktual vs prediksi (data test)
plot(test$tapioka, pred,
main = "Test: Aktual vs Prediksi",
xlab = "Tapioka Aktual (ton)",
ylab = "Tapioka Prediksi (ton)")
abline(0, 1, col="blue", lwd=2) # garis ideal (prediksi = aktual)
Dari output bagian “Coefficients”, kamu dapat:
Intercept (β0)
Koefisien singkong (β1)
Persamaan umumnya:
knitr::include_graphics("regresi2.png")
Cara baca gampang:
β0 (Intercept) = nilai Y saat X = 0. (Biasanya hanya “konstanta”, tidak terlalu penting secara nyata kalau X=0 tidak mungkin terjadi.)
β1 (Koefisien singkong) = “setiap X naik 1 satuan, Y naik/turun berapa”.
Contoh interpretasi:
Jika β1 = 0.18, artinya setiap tambahan 1 ton singkong akan meningkatkan output tapioka sekitar 0.18 ton, rata-rata.
Di output koefisien ada kolom Pr(>|t|).
Aturan mudah:
Kalau p-value < 0.05 → pengaruh X ke Y signifikan (berpengaruh nyata).
Kalau p-value ≥ 0.05 → pengaruhnya tidak signifikan.
Interpretasi sederhana:
Karena p-value variabel singkong < 0.05, maka jumlah singkong berpengaruh nyata terhadap output tapioka.
Di bagian bawah output ada Multiple R-squared.
Cara baca gampang:
R² = 0.80 artinya 80% perubahan output bisa dijelaskan oleh jumlah singkong.
Sisanya (20%) dijelaskan faktor lain (kadar pati, efisiensi mesin, dll).
RMSE itu “rata-rata besar kesalahan prediksi”.
Cara baca gampang:
RMSE kecil → prediksi makin mendekati kenyataan.
RMSE besar → prediksi sering meleset.
Interpretasi contoh:
RMSE = 0.50 ton artinya rata-rata prediksi output meleset sekitar 0.50 ton pada data uji.
Kalau mau ubah ke kg:
0.50 ton ≈ 500 kg.
Kesimpulan singkat:
#Tugas: Latar belakang
Dalam agroindustri tapioka, kadar pati singkong sangat menentukan banyaknya pati yang bisa diekstrak menjadi tapioka. Karena itu, perusahaan ingin mengetahui apakah kadar pati (%) berpengaruh terhadap rendemen (%) tapioka.
Tujuan
Mengukur pengaruh kadar_pati_persen (X) terhadap rendemen_persen (Y).
Membuat persamaan regresi untuk memprediksi rendemen jika kadar pati diketahui.
Variabel
X: kadar_pati_persen
Y: rendemen_persen (dibuat dari data):
knitr::include_graphics("rendemen.png")
# 1) Import data
df <- read.csv("dataset_agroindustri_tapioka_mingguan.csv")
# 2) Buat variabel rendemen (%)
df$rendemen_persen <- (df$output_tapioka_ton / df$bahan_baku_singkong_ton) * 100
#Lanjutkan pengerjaan regresi linear hingga mendapatkan nilai prediksi dan buatkan interpretasinya