Puji syukur penulis panjatkan kepada Tuhan yang maha Esa, karena berkat rahmat dan karunia-Nya penulis dapat menyelesaikan tugas publikasi yang berjudul “ANALISIS DATASET MTCARS PADA PENGARUH VARIABEL HP TERHADAP VARIABEL MPG”. Publikasi ini disusun untuk memenuhi tugas mata kuliah Pengantar Data Sains pada jurusan Statistika Universitas Sultan ageng Tirtayasa. Penulis mengucapkan terima kasih yang sebesar - besarnya kepada semua pihak yang telah memberikan dukungan, serta bimbingan selama proses penyusunan tugas ini, terutama kepada :
Bapak/Ibu dosen yang telah memberikan bimbingan serta arahan yang sangat membantu,
Kedua orang tua serta keluarga yang telah memberikan dukungan dan semangat,
Teman - teman yang telah memberikan semangat serta dukungan kepada penulis.
Penulis sangat menyadari bahwa masih terdapat banyak kesalahan dan kekurangan dalam penyusunan serta penulisan publikasi ini, oleh karena itu, penulis mengharapkan kritik dan saran yang membangun sehingga pada kesempatan selanjutnya penulis dapat menyusun publikasi dengan lebih baik di masa yang akan datang. Semoga apa yang terdapat dalam publikasi ini bisa memberikan manfaat kepada penulis khususnya dan para pembaca.
Dataset mtcars adalah salah satu dataset yang sudah tersedia di R. Dataset mtcars membahas tentang spesifikasi teknis dan performa 32 jenis mobil yang terdapat dalam majalah Motor Trend pada tahun 1974, meliputi 11 variabel, yaitu jumlah konsumsi bahan bakar (mpg), jumlah silinder (cyl), tenaga kuda (hp), berat mobil (wt), dan transmisi (am). Dataset ini pertama kali dipublikasikan dalam konteks studi akademik pada tahun 1976 oleh Ronald R. Hoking dan direferensikan kembali oleh Harold Henderson dan Paul Velleman pada tahun 1981.
Dataset mtcars meberikan fasilitas pembelajaran konsep dasar statistik dan mechine learning, seperti seleksi variabel, uji signifikansi, dan pemodelan prediktif. Dataset mtcars juga sering digunakan untuk melakukan analisis serta menguji hubungan antara variabel - variabel teknis kendaran dengan performa mobil seperti jenis transmisi terhadap efisiensi bahan bakar (mpg) dan seberapa besar tenaga kuda (hp) pada mobil, serta hubungan dan pengaruh antara keduanya.
Dalam dataset mtcars terdapat 11 variabel yang berkaitan dengan spesifikasi dan performa mobil, sehingga dapat melakukan analisis dengan melihat hubungan dari beberapa variabelnya. Salah satu hubungan yang dapat di analisis adalah hubungan antara variabel efisiensi bahan bakar(mpg) dengan variabel tenaga kuda (hp). variabel mpg adalah variabel yang menampilkan data terhadap efisiensi bahan bakar pada jenis mobil dalam satuan mil per galon AS. Sedangkan variabel tenaga kuda (hp) merupakan varibel yang mempresentasikan besar daya kuda pada mesin mobil, yang memengaruhi akselerasi dan kecepatan maksimum mobil. rentang nilai hp dalam dataset berkisar pada 52 hp hingga 335 hp untuk nilai yang paling tinggi.Pada Analisis ini digunakan variabel mpg dan hp untuk melihat hubungan antara kedua variabel
Bagaimana arah hubungan dari variabel mpg dan variabel hp pada dataset mtcars?
Bagaimana korelasi antara varibel mpg dengan variabel hp pada dataset mt cars?
Seperti apa distribusi dari variabel mpg dan hp pada dataset mtcars?
Apakah terdapat hubungan yang signifikan antara aribel mpg dengan variabel hp pada dataset mt cars?
Melihat arah hubungan dari variabel mpg dengan hp pada dataset mtcars.
Mengetahui korelasi natara variabel mpg dengan variabel hp pada dataset mtcars
Melihat distribusi dari variabel mpg dan hp pada dataset mtcars.
Mengecek signifikansi antara variabel mpg dengan variabel hp pada dataset mtcars
Analisis yang dilakukan pada variabel mpg dengan variabel hp adalah untuk mengetahui seberapa baik dan seberapa berpengaruh variabel *horsepower* (hp) terhadap variabel *miles per galon* (mpg) .
Dataset mtcars menyediakan sebelas parameter untuk 32 mobil pada tahun 1973 - 1974, seperti yang publikasikan dalam majalah edisi 1974 majalah Motor Trend. Dataset - dataset tersebut telah digunakan selama puluhan tahun. Dataset mtcars dipublikasikan bertepatan dengan dikembangkannya alat pemrograman statistik dikembangkan. Fakta bahwa sebuah dataset yang sudah ada sejak lama tidak berarti dataset itu sudah usang. (Speegle dan Clair dalam Musgrave Paul, 2022) berpendapat bahwa menggunakan dataset yang familiar seperti mtcars memungkinkan orang fokus pada aspek baru dari kode daripada dataset itu sendiri. menggunakan dataset standar membantu danpengguna
Analisi korelasi berasal dari kata correlation analysis, digunakan untuk mengetahui arah hubungan, kuat hubungan, dan signifikansi kuatnya hubungan antara dua variabel atau lebih. Kuatnya hubungan antara variabel dinyatakan dengan ukuran statistik yang dinamalan koefisien korelasi. Dua variabel dikatakan berkorelasi apabila perubahan pada salah satu variabel disertai dengan perubahan pada vaiabel lainnya secara linier, baik dalam arah yang sama maupun yang sebaliknya. Analisis korelasi pada variabel numerik sensitif pada adanya data yang ekstrem (outlier points). Analisis korelasi pada variabel kategorik juga sensitif terhadap jumlah kategori pada masing - masing variabel.
Analisis regresi merupakan perhitungan statistik untuk menguji seberapa erat hubungan antar variabel (Trianggana dalam N. Almumtazah dkk., 2020). Analisis regresi yang paling sederhana dan sering digunakan adalah regresi linier sederhana. Dalam analisis regresi terdapat satu variabel dependen yang dapat dinyatakan dengan simbol Y dan satu variabel independen yang dapat dinyatakan dengan X. Sifat dari hubungan kedua variabel tersebut adalah linier sesuai dengan namanya (amiruddin dan Ishak dalam, 2018).
Regresi linier memiliki persamaan dasar metode sebagai berikut : Y = a + bX di mana : Y = Variabel dependen a = intercept b = koefisien variabel X X = variabel independen
summary(mtcars$mpg,mtcars$hp)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 10.40 15.43 19.20 20.09 22.80 33.90
Berdasarkan output tersebut diperoleh 5 nilai, yaitu nilai minimal sebesar 10,40 nilai quartile 1 sebesar 15,43 , nilai median sebesar 19,20 , nilai mean sebesar 20,09 , nilai quartile 3 sebesar 22,80 , dan nilai maksimal sebesar 33,90. nilai minimal menunjukkan mobil dengan bahan bakar yang paling boros, sedangkan nilai maksimal menujukkan mobil dengan bahan bakar yang paling irit. dengan rata - rata konsumsi bahan bakar sebesar 20,09 mpg.
Hasil yang dapat dilihat dari Scatter plot tersebut adalah titik - titik
semakin menurun ke arah kanan menunjukan arah negatif di mana apabila
nilai suatu variabel naik, maka variabel yang lain akan menurun.
terlihat hp semakin besar, maka konsumsi bahan bakar cenderung semakin
besar pula
## [1] -0.7761684
Berdasarkan hasil output korelasi antara variabel mpg dengan variabel hp memiliki hasil sebesar -0,7761684. NIlai dari korelasi kedua variabel tersebut bernilai negatif menunjukan bahwa hubungan variabel mpg dengan variabel hp beersifat berlawanan arah, apabila hp meningkat, maka nilai dari mpg akan mengalami penurunan dan juga sebaliknya. nilai yang mendekati -1 menandakan bahwa hubungan tersebut cukup kuat meskipun tidak sempurna. Dengan demikian, dapat ditarik kesimpulan bahwa semakin besar tenaga mesin yang dihasilkan, maka semakin boros konsumsi bahan bakarnya.
(reg_sed <- lm(mtcars$mpg ~ mtcars$hp, data = mtcars))
##
## Call:
## lm(formula = mtcars$mpg ~ mtcars$hp, data = mtcars)
##
## Coefficients:
## (Intercept) mtcars$hp
## 30.09886 -0.06823
Berdasrkan output diperoleh hasil nilai koefisien sebesar -0,06823 yang menunjukkan apabila setiap bertambahnya 1 hp, maka mpg akan menurun sebesar 0,06823 mpg. Dengan demikian, apabila tenaga mesin semakin besar konsumsi bahan bakar juga semakin boros.
anv <- aov(mpg ~ hp, data = mtcars)
summary(anv)
## Df Sum Sq Mean Sq F value Pr(>F)
## hp 1 678.4 678.4 45.46 1.79e-07 ***
## Residuals 30 447.7 14.9
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Hasil yang output pada uji anova yang telah dilakukan diperoleh nilai F - value sebesar 45,46 dan nilai P - value sebesar 0,00000079 < 0,05 sehingga variabel hp sangant berpengaruh signifikan terhadap variabel mpg
## $breaks
## [1] 10 15 20 25 30 35
##
## $counts
## [1] 6 12 8 2 4
##
## $density
## [1] 0.0375 0.0750 0.0500 0.0125 0.0250
##
## $mids
## [1] 12.5 17.5 22.5 27.5 32.5
##
## $xname
## [1] "mtcars$mpg"
##
## $equidist
## [1] TRUE
##
## attr(,"class")
## [1] "histogram"
## $breaks
## [1] 50 100 150 200 250 300 350
##
## $counts
## [1] 9 10 6 5 1 1
##
## $density
## [1] 0.005625 0.006250 0.003750 0.003125 0.000625 0.000625
##
## $mids
## [1] 75 125 175 225 275 325
##
## $xname
## [1] "mtcars$hp"
##
## $equidist
## [1] TRUE
##
## attr(,"class")
## [1] "histogram"
Berdasarkan diagram histogram tersebut dari kedua variabel menunjukkan distribusi yang miring ke arah kanan atau right skewed, unntuk histogram variabel mpg nilai banyak terkumpul di rentang 15 sampai 22 mpg. Di mana banyak mobil yang memiliki jumlah konsumsi bahan bakar yang boros dan hanya sedikit mobil dengan jumlah konsumsi bahan bakar yang irit, sehingga batang di sebelah kanan lebih sedikit. untuk histogram variabel hp kebanyakan mobil memiliki nilai hp di rentang 90 sampai 150 hp, sedangkan mobil dengan hp sangat besar berada di rentang 250 sampai 335 hp. MObil dengan nilai hp yang tinggi sangat sedikit sehingga histogram memiliki bar lebih sedikit di sebelah kanan atau right skewed. ## Boxlot
(boxplot(mtcars$mpg, main = "Boxplot mgp", xlab = "mpg", col = "lightblue"))
## $stats
## [,1]
## [1,] 10.40
## [2,] 15.35
## [3,] 19.20
## [4,] 22.80
## [5,] 33.90
##
## $n
## [1] 32
##
## $conf
## [,1]
## [1,] 17.11916
## [2,] 21.28084
##
## $out
## numeric(0)
##
## $group
## numeric(0)
##
## $names
## [1] ""
(boxplot(mtcars$hp, main = "Boxplot hp", xlab = "hp", col = "lightblue"))
## $stats
## [,1]
## [1,] 52
## [2,] 96
## [3,] 123
## [4,] 180
## [5,] 264
##
## $n
## [1] 32
##
## $conf
## [,1]
## [1,] 99.5382
## [2,] 146.4618
##
## $out
## [1] 335
##
## $group
## [1] 1
##
## $names
## [1] ""
Berdasrkan diagram boxplot tersebut dapat dilihat bahwa diagram boxplot untuk variabel hp dan variabel mpg sebagai berikut :
Pada boxplot untuk variabel hp terdapat bagian yang lebih besar dan bagian yang lebih kecil, di mana bagian yang lebih kecil menunjukkan bahwa mobil dengan nilai horsepower yang kecil cenderung irit pada bagian bawah sehingga terdapat jumlah mobil yang sdikit, dan untuk bagian atas boxplot menunjukkan jumlah mobil dengan nilai horsepower yang besar, dan terdapat nilai pencilan atas yang mana nilai tersebut dadalah nilai pada mobil dengan horsepower yang sangat besar.
Pada boxplot untuk variabel mpg terdapat bagian yang hampir setara, namun pada bagian atas terlihat sedikit lebih kecil dari bagian yang dibawah, ini menunjukkan bahwa mobil dengan konsumsi bahan bakar yang irit lebih sedikit jumlahnuya dari mobil yang memiliki konsumsi bahan bakar yang boros dengan nilai median berada pada rentang 10 sampai 20.
Dataset mtcars menyediakan sebelas parameter untuk 32 mobil pada tahun 1973 - 1974, seperti yang publikasikan dalam majalah edisi 1974 majalah Motor Trend. Dataset - dataset tersebut telah digunakan selama puluhan tahun. Dataset mtcars dipublikasikan bertepatan dengan dikembangkannya alat pemrograman statistik dikembangkan.
Dalam dataset mtcars terdapat 11 variabel yang berkaitan dengan spesifikasi dan performa mobil, sehingga dapat melakukan analisis dengan melihat hubungan dari beberapa variabelnya. Salah satu hubungan yang dapat di analisis adalah hubungan antara variabel efisiensi bahan bakar(mpg) dengan variabel tenaga kuda (hp). variabel mpg adalah variabel yang menampilkan data terhadap efisiensi bahan bakar pada jenis mobil dalam satuan mil per galon AS. Sedangkan variabel tenaga kuda (hp) merupakan varibel yang mempresentasikan besar daya kuda pada mesin mobil, yang memengaruhi akselerasi dan kecepatan maksimum mobil. rentang nilai hp dalam dataset berkisar pada 52 hp hingga 335 hp untuk nilai yang paling tinggi.Pada Analisis ini digunakan variabel mpg dan hp untuk melihat hubungan antara kedua variabel.
Setelah dilakukan analisis dengan korelasi, regresi, dan anova terbukti bahwa variabel hp memberikan pengaruh yang signifikan terhadap variabel mpg, dimana ketika nilai dari variabel hp naik sebesar 1 hp, maka variabel mpg akan mengalami penurunan sebesar 0,06823 mpg.
Alika, R. I. (2025). Analisis regresi liniear. R-Pubs. Retrieved from https://rpubs.com/Razha_alika/1342840
Almumtazah, N., Azizah, N., Putri, Y. L., & Novitasari, D. R.(2021). Prediksi jumlah mahasiswa baru menggunakan metode regresi linier sederhana. Jurnal Ilmiah Matematika dan Terapan, 18(1), 31-40
Musgrave, P. (2025). Defaulting to Incusion : Producing sample datasets for the global data sciece clasroom, 10(10).
Roflin, E., Zulvia, F., E. (2021). Kupas tuntas analisis regresi (1st ed.). NEM - Anggota IKAPI.