Tugas 1 Visualisasi Data by Tengku Mashitah Crisanty (054983862)

#Tugas 1 Visualisasi Data

##Nomor 1 Gunakan R untuk menghitung nilai berikut a. Rata-rata kecepatan mobil (10) b. Rata-rata jarak yang ditempuh mobil (10) c. Standar deviasi data jarak yang ditempuh mobil (10)

Entri Data ke R

library(readxl)
Tabel_Tugas_1  <- read_excel("C:/Users/tengk/Downloads/Tabel Tugas 1.xlsx")
Tabel_Tugas_1

###a. Rata-ratakecepatan mobil

# a. Rata-rata kecepatan mobil
rata_kecepatan <- mean(Tabel_Tugas_1$`Kecepatan (m/s)`)
rata_kecepatan

## [1] 4.861111

Rata-rata kecepatan mobil sebesar 4,86 m/s

###b. Rata-rata jarak tempuh mobil

# b. Rata-rata jarak yang ditempuh mobil
rata_jarak <- mean(Tabel_Tugas_1$`Jarak (meter)`)
rata_jarak

## [1] 42.28

Rata-rata jarak tempuh mobil sebesar 42,28 meter.

###c. Standar deviasi jarak tempuh mobil

# c. Standar deviasi jarak yang ditempuh mobil
sd_jarak <- sd(Tabel_Tugas_1$`Jarak (meter)`)
sd_jarak

## [1] 24.76505

Standar deviasi jarak tempuh sebesar 24,76 meter. Artinya, dalam suatu himpunan memiliki sebaran atau variasi rata-rata sebesar 24,76 meter dari nilai rata-rata nya. Didapatkan nilai rata-rata dari jarak (soal b) yaitu 42,28, maka sebagian besar dari jarak berada di kisaran 24,76 +/- 42,28 yaitu 67 meter. Nilai standar deviasi 24,76 meter juga menunjukkan bahwa data memiliki variabilitas tinggi, yang artinya data-data tersebar atau menyebar luas dari nilai rata-ratanya.

##Nomor 2 Berdasarkan Tabel pada soal Nomor 1, gunakan program R untuk membuat plot dan interpretasikan hasilnya! a. Scatter plot dari data kecepatan dan jarak (10) b. Interpretasi Scatter plot yang diperoleh (15) c. Histogram untuk data kecepatan mobil (10)
d. Interpretasi histogram yang diperoleh (15)

###a. Scatter Plot

# a. Scatter plot
plot(Tabel_Tugas_1$`Jarak (meter)`, Tabel_Tugas_1$`Kecepatan (m/s)`,
     main = "Scatter Plot Kecepatan vs Jarak",
     xlab = "Jarak Tempuh (meter)",
     ylab = "Kecepatan Mobil(m/s)",
     pch = 19, col = "orange")

Membuat scatter plot lebih detail

x= Tabel_Tugas_1$`Jarak (meter)`
y= Tabel_Tugas_1$`Kecepatan (m/s)`


group <- as.factor(ifelse(x < 0.5, "Group 1", "Group 2"))
plot(x, y, pch = as.numeric(group), col = group)


# Underlying model
lines(seq(0, 1, 0.05), 2 + 3 * seq(0, 1, 0.05)^2, col = "2", lwd = 3, lty = 2)

# Linear fit
abline(lm(y ~ x), col = "orange", lwd = 3)

# Smooth fit
lines(lowess(x, y), col = "blue", lwd = 3)

# Legend
legend("topleft", legend = c("Theoretical", "Linear", "Smooth"),
       lwd = 3, lty = c(2, 1, 1), col = c("red", "orange", "blue"))

# Calculate correlation
Corr <- cor(x, y)

# Create the plot and add the calculated value
plot(x, y, pch = 19)
text(paste("Correlation:", round(Corr, 2)), x = 0.2, y = 4.5)

# install.packages("car")
library(car)

## Loading required package: carData

scatterplot(y ~ x)

###Interpretasi Scatter plot yang diperoleh Scatter plot merupakan metode persentase secara grafis untuk menggambarkan hubungan antara dua variabel kuantitati yang ditunjukkan dengan pola titik-titik.

Interpretasi:

Scatter plot menunjukkan hubungan antara Kecepatan mobil (sumbu-X) dan Jarak henti (sumbu-Y).

Sebagian besar data menunjukkan kecepatan mobil berkisar antara 0–10 m/s, meskipun terdapat satu titik pencilan (outlier) dengan kecepatan di atas 30 m/s.
Kekuatan Hubungan: plot jika dilihat dari gambar XX membentuk tren naik, ditambah lagi dengan pengujian korelasi di Gambar XX yang menunjukkan angka korelasi sebesar 0,3 yang artinya hub antara jarak dan kecepatan sangat rendah.Hal ini menunjukkan bahwa peningkatan jarak tidak selalu proporsional dengan kenaikan kecepatan — mungkin dipengaruhi oleh faktor lain seperti kondisi jalan, waktu tempuh, atau variasi data.
Pencilan (Outliers): Dilihat dari Gambar XX terdapat satu titik data yang dapat dianggap sebagai pencilan, yaitu data dengan kecepatan 31,67 m/s dan menempuh jarak 43 meter. Pencilan ini mungkin disebabkan oleh faktor-faktor lain (misalnya kondisi jalan, respons pengemudi, atau kondisi rem) yang tidak termasuk dalam data.

###c. Histogram untuk data kecepatan mobil

# Histogram untuk data kecepatan mobil
hist(Tabel_Tugas_1$`Kecepatan (m/s)`, 
     main = "Histogram Data Kecepatan Mobil",
     xlab = "Kecepatan (km/h)", 
     ylab = "Frekuensi",
     col = "maroon", # Warna batang histogram
     border = "black")

# Menambah garis rata-rata 
abline(v = mean(Tabel_Tugas_1$`Kecepatan (m/s)`), col = "blue", lwd = 2, lty = 2)
legend("topright", legend = c("Rata-rata"), col = c("blue"), lwd = 2, lty = 2, cex = 0.8)

# how to generate a histogram in r - unequal bins
hist(Tabel_Tugas_1$`Kecepatan (m/s)`, breaks = quantile(Tabel_Tugas_1$`Kecepatan (m/s)`, 0:10 / 10))

library(moments)

skewness_value <- skewness(Tabel_Tugas_1$`Kecepatan (m/s)`)
print(skewness_value)

## [1] 5.507905

# menghitung kernel density
dens <- density(Tabel_Tugas_1$`Kecepatan (m/s)`)

# histogram
hist(Tabel_Tugas_1$`Kecepatan (m/s)`, freq=FALSE, col="steelblue")

# tambahkan density plot
polygon(dens, border="red")

Histogram adalah jenis grafik statistik di mana sekumpulan data statistik diwakili oleh batang persegi panjang, sehingga setiap batang dalam histogram sebanding dengan frekuensinya.

###d. Interpretasi Histogram yang diperoleh: Histogram menunjukkan distribusi frekuensi dari data Kecepatan mobil. - Bentuk Distribusi (Skewness): Kemencengan positif terjadi ketika ekor distribusi data lebih panjang di sebelah kanan atau nilai-nilai ekstrim lebih banyak terkumpul di sebelah kanan dari nilai tengah atau median. Artinya, distribusi data memiliki puncak yang lebih rendah dan nilai ekstrim yang lebih tinggi. Berdasarkan Gambar XX, Distribusi Kecepatan terlihat menceng ke kanan (positively skewed). Sebagian besar data kecepatan terkonsentrasi pada rentang nilai yang lebih rendah (sekitar 0-6 m/s). - Pemusatan Data (Modus): Berdasarkan Gambar XX, nilai yang paling sering muncul (modus) berada di sekitar kelompok kecepatan 4-5 km/jam (terpatnya 4,72) atau sebagian besar mobil memiliki kecepatan rendah, yang menunjukkan bahwa sebagian besar observasi kecepatan mobil berada di rentang ini. - outlier : pada Gambar XX. adanya kurva gunung di sebelah kiri menandakan adanya outlier.

#Nomor 3 Thomas memperoleh nilai 80 untuk ujian Matematika dengan rata-rata kelas 75 dan standar deviasi 10. Untuk ujian bahasa Inggris, Thomas memperoleh nilai 75 dengan rata-rata kelas 70 dan standar deviasi 8. Hitunglah koefisien keragaman untuk nilai ujian Matematika dan bahasa Inggris Thomas!

Koefisien keragaman menunjukkan nilai relatif standar deviasi terhadap rata-rata. Nilai ini digunakan untuk membandingkan keragaman. Rumus Koefisien keragaman = (s/xbar)*100%

# Data Matematika
mean_math <- 75
sd_math <- 10

# Data Bahasa Inggris
mean_english <- 70
sd_english <- 8

# Hitung koefisien keragaman
Koef.Keragaman.math <- (sd_math / mean_math) * 100
Koef.Keragaman.english <- (sd_english / mean_english) * 100

# Tampilkan hasil
#Math : 
Koef.Keragaman.math

## [1] 13.33333

#English
Koef.Keragaman.english

## [1] 11.42857

Koefisien keragaman ujian Matematika sebesar 13,33% menunjukkan tingkat penyebaran nilai Matematika di kelas Thomas cukup tinggi.

Koefisien keragaman ujian Bahasa Inggris sebesar 11,43% lebih rendah, artinya penyebaran nilai di ujian Bahasa Inggris lebih homogen dibandingkan ujian Matematika.

Karena koef keragaman Matematika > koef keragaman Bahasa Inggris, maka nilai ujian Bahasa Inggris lebih konsisten (tidak terlalu bervariasi antar siswa) dibandingkan nilai Matematika. Hal ini mengindikasikan bahwa nilai ujian Matematika memiliki variabilitas atau dispersi data yang lebih tinggi relatif terhadap rata-ratanya, dibandingkan dengan nilai ujian Bahasa Inggris. Nilai ujian Bahasa Inggris relatif lebih homogen.