Email : naufal.fadhlullah@student.matanauniversity.ac.id
Instagram : https://www.instagram.com/naaufald
RPubs
: https://rpubs.com/naaufaldd/
Address : ARA
Center, Matana University Tower
Jl. CBD
Barat Kav, RT.1, Curug Sangereng, Kelapa Dua, Tangerang, Banten
15810.
berikut merupakan data yang berisikan tentang rata-rata waktu studi per hati antara fakultas STM dan fakultas Bisnis
fakultas<- c("FSTM", "BISNIS")
ratarata_FSTM<- c(7, 8, 6, 7, 9, 8, 8, 7, 6, 9, 7, 8, 7, 9, 8, 7, 8, 7, 9, 8, 6, 7, 8, 9, 7, 8, 7, 6, 9, 8, 7, 8, 7, 9, 8, 7, 8, 7, 9, 8, 6, 7, 8,
9, 7, 8, 7, 6, 9, 8, 7, 8, 7, 9, 8, 7, 8, 7, 9, 8, 6, 7, 8, 9, 7, 8, 7, 6, 9, 8, 7, 8, 7, 9, 8, 7, 8, 7, 9, 8, 6, 7, 8, 9, 7, 8,
7, 6, 9, 8, 7, 8, 7)
ratarata_bisnis<-c(6, 7, 7, 6, 8, 9, 6, 8, 7, 8, 7, 6, 8, 7, 8, 9, 7, 6, 8, 7, 6, 7, 8, 6, 9, 7, 8, 7, 6, 8, 7, 8, 9, 7, 6, 8, 7, 6, 7, 8, 6, 9, 7,
8, 7, 6, 8, 7, 8, 9, 7, 6, 8, 7, 6, 7, 8, 6, 9, 7, 8, 7, 6, 8, 7, 8, 9, 7, 6, 8, 7, 6, 7, 8, 6, 9, 7, 8, 7, 6, 8, 7, 8, 9, 7, 6,
8, 7, 6, 7, 8)
panjang_maksimum <- max(length(ratarata_FSTM), length(ratarata_bisnis))
ratarata_FSTM <- ratarata_FSTM[1:panjang_maksimum]
print(is.na(ratarata_FSTM))## [1] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [13] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [25] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [37] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [49] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [61] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [73] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [85] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [1] 92 93
## [1] 7
# Ganti nilai NA dengan nilai rata-rata
ratarata_bisnis[is.na(ratarata_bisnis)] <- median_bisnis
#membuat data frame
data <- data.frame(
FSTM = ratarata_FSTM,
Bisnis = ratarata_bisnis
)
data## FSTM Bisnis
## 1 7 6
## 2 8 7
## 3 6 7
## 4 7 6
## 5 9 8
## 6 8 9
## 7 8 6
## 8 7 8
## 9 6 7
## 10 9 8
## 11 7 7
## 12 8 6
## 13 7 8
## 14 9 7
## 15 8 8
## 16 7 9
## 17 8 7
## 18 7 6
## 19 9 8
## 20 8 7
## 21 6 6
## 22 7 7
## 23 8 8
## 24 9 6
## 25 7 9
## 26 8 7
## 27 7 8
## 28 6 7
## 29 9 6
## 30 8 8
## 31 7 7
## 32 8 8
## 33 7 9
## 34 9 7
## 35 8 6
## 36 7 8
## 37 8 7
## 38 7 6
## 39 9 7
## 40 8 8
## 41 6 6
## 42 7 9
## 43 8 7
## 44 9 8
## 45 7 7
## 46 8 6
## 47 7 8
## 48 6 7
## 49 9 8
## 50 8 9
## 51 7 7
## 52 8 6
## 53 7 8
## 54 9 7
## 55 8 6
## 56 7 7
## 57 8 8
## 58 7 6
## 59 9 9
## 60 8 7
## 61 6 8
## 62 7 7
## 63 8 6
## 64 9 8
## 65 7 7
## 66 8 8
## 67 7 9
## 68 6 7
## 69 9 6
## 70 8 8
## 71 7 7
## 72 8 6
## 73 7 7
## 74 9 8
## 75 8 6
## 76 7 9
## 77 8 7
## 78 7 8
## 79 9 7
## 80 8 6
## 81 6 8
## 82 7 7
## 83 8 8
## 84 9 9
## 85 7 7
## 86 8 6
## 87 7 8
## 88 6 7
## 89 9 6
## 90 8 7
## 91 7 8
## 92 8 7
## 93 7 7
library(ggplot2)
boxplot(ratarata_FSTM, ratarata_bisnis,
main = "Rata-rata FSTM dan Bisnis",
ylab = "Rata-rata",
col = c("red", "pink"),
border = c("black", "black"),
names = c("FSTM", "Bisnis"))hal ini dilakukan dengan menguji apakah data berdistribusi normal dan memiliki varians yang homogen menggunakan uji Kolmogorov-smirnov dan uji homogenitas varians seperti uji Levene.
library(car)
# Uji normalitas untuk kelompok FSTM
ks_test_FSTM <- ks.test(ratarata_FSTM, "pnorm", mean(ratarata_FSTM), sd(ratarata_FSTM))
print(ks_test_FSTM)##
## Asymptotic one-sample Kolmogorov-Smirnov test
##
## data: ratarata_FSTM
## D = 0.2135, p-value = 0.0004159
## alternative hypothesis: two-sided
library(car)
ks_test_bisnis <- ks.test(ratarata_bisnis, "pnorm", mean(ratarata_bisnis), sd(ratarata_bisnis))
print(ks_test_bisnis)##
## Asymptotic one-sample Kolmogorov-Smirnov test
##
## data: ratarata_bisnis
## D = 0.21404, p-value = 0.0003983
## alternative hypothesis: two-sided
library(car)
# Gabungkan data ke dalam satu data frame
data <- data.frame(
Kelompok = rep(c("FSTM", "BISNIS"), each = length(ratarata_FSTM)),
Nilai = c(ratarata_FSTM, ratarata_bisnis)
)
# Lakukan uji Levene untuk homogenitas varians
leveneTest(Nilai ~ Kelompok, data = data)## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 1 0.053 0.8181
## 184
penentuan penetapan signifikansi mengacu pada data dimana apabila data merupakan data sosial, mak signifikansi sebesar 0,05 dan apabila data yang menyangkut nyawa, signifikansi 0,01
alpha <- 0.05
# Output tingkat signifikansi
print(paste("Tingkat signifikansi (α) yang ditetapkan adalah:", alpha))## [1] "Tingkat signifikansi (α) yang ditetapkan adalah: 0.05"
ratarata_FSTM <- c(7, 8, 6, 7, 9, 8, 8, 7, 6, 9, 7, 8, 7, 9, 8, 7, 8, 7, 9, 8, 6, 7, 8, 9, 7, 8, 7, 6, 9, 8, 7, 8, 7, 9, 8, 7, 8, 7, 9, 8, 6, 7, 8,
9, 7, 8, 7, 6, 9, 8, 7, 8, 7, 9, 8, 7, 8, 7, 9, 8, 6, 7, 8, 9, 7, 8, 7, 6, 9, 8, 7, 8, 7, 9, 8, 7, 8, 7, 9, 8, 6, 7, 8, 9, 7, 8,
7, 6, 9, 8, 7, 8, 7)
ratarata_bisnis <- c(6, 7, 7, 6, 8, 9, 6, 8, 7, 8, 7, 6, 8, 7, 8, 9, 7, 6, 8, 7, 6, 7, 8, 6, 9, 7, 8, 7, 6, 8, 7, 8, 9, 7, 6, 8, 7, 6, 7, 8, 6, 9, 7,
8, 7, 6, 8, 7, 8, 9, 7, 6, 8, 7, 6, 7, 8, 6, 9, 7, 8, 7, 6, 8, 7, 8, 9, 7, 6, 8, 7, 6, 7, 8, 6, 9, 7, 8, 7, 6, 8, 7, 8, 9, 7, 6,
8, 7, 6, 7, 8)
# Menghitung rata-rata, simpangan baku, dan ukuran sampel
mean_FSTM <- mean(ratarata_FSTM)
mean_bisnis <- mean(ratarata_bisnis)
sd_FSTM <- sd(ratarata_FSTM)
sd_bisnis <- sd(ratarata_bisnis)
n_FSTM <- length(ratarata_FSTM)
n_bisnis <- length(ratarata_bisnis)
# Menghitung nilai t
t_value <- (mean_FSTM - mean_bisnis) / sqrt((sd_FSTM^2 / n_FSTM) + (sd_bisnis^2 / n_bisnis))
t_value## [1] 2.523148
## [1] 182
## Nilai t: 2.523148
## Derajat kebebasan: 182
setelah mengetahui nilai t, maka kita harus mengetahui apakah nilai t tersebut menolak atau menerima H0
## [1] 1.987513
## Nilai p: 1.987513
# Tentukan apakah H0 ditolak atau diterima
if (p_value < alpha) {
cat("Nilai t yang diamati signifikan pada tingkat signifikansi yang ditetapkan (α). H0 ditolak.\n")
} else {
cat("Tidak cukup bukti untuk menolak H0 pada tingkat signifikansi yang ditetapkan (α). H0 diterima.\n")
}## Tidak cukup bukti untuk menolak H0 pada tingkat signifikansi yang ditetapkan (α). H0 diterima.
berikut meripukan interpretasi atas hasil yang telah diujikan
if (p_value < alpha) {
cat("Nilai t yang diamati signifikan pada tingkat signifikansi yang ditetapkan (α). H0 ditolak.\n")
cat("Ini berarti ada bukti statistik yang cukup untuk menyatakan bahwa ada perbedaan yang signifikan dalam rata-rata waktu studi antara mahasiswa sarjana Fakultas Sains dan Teknologi MIPA (FSTM) dan Fakultas Bisnis.\n")
} else {
cat("Tidak cukup bukti untuk menolak H0 pada tingkat signifikansi yang ditetapkan (α). sebab H0 diterima.\n")
}## Tidak cukup bukti untuk menolak H0 pada tingkat signifikansi yang ditetapkan (α). sebab H0 diterima.
Studi Kasus ini bertujuan untuk mengidentifikasi pengaruh dari tiga metode promosi yang berbeda (Iklan Televisi, Media Sosial, dan Iklan Cetak) terhadap penjualan produk suatu perusahaan. Diberikan Data Penjualan Produk (dalam ribuan unit). berikut datanya:
televisi<- c(20, 25, 22, 18, 23, 21, 24, 19, 26, 20,22, 23, 21, 19, 25, 24, 18, 20, 22, 21,19, 24, 23, 20, 22, 18, 21, 25, 19, 24,23, 20, 22, 18, 24, 21, 19, 25, 23, 20)
medsos<- c(15, 18, 17, 16, 19, 20, 21, 18, 16, 22,17, 20, 18, 19, 15, 16, 21, 17, 20, 18,19, 15, 16, 21, 17, 20, 18, 19, 15, 16,21, 17, 20, 18, 19, 15, 16, 21, 17, 20)
cetak<- c(12, 14, 13, 15, 12, 14, 16, 13, 15, 14,13, 15, 14, 12, 14, 16, 13, 15, 14, 13,15, 14, 12, 14, 16,
13, 15, 14, 12, 14,16, 13, 15, 14, 13, 15, 14, 12, 14, 16)
# Menggabungkan vektor penjualan ke dalam sebuah data frame
data_penjualan <- data.frame(
televisi = televisi,
medsos = medsos,
cetak = cetak
)
data_penjualan## televisi medsos cetak
## 1 20 15 12
## 2 25 18 14
## 3 22 17 13
## 4 18 16 15
## 5 23 19 12
## 6 21 20 14
## 7 24 21 16
## 8 19 18 13
## 9 26 16 15
## 10 20 22 14
## 11 22 17 13
## 12 23 20 15
## 13 21 18 14
## 14 19 19 12
## 15 25 15 14
## 16 24 16 16
## 17 18 21 13
## 18 20 17 15
## 19 22 20 14
## 20 21 18 13
## 21 19 19 15
## 22 24 15 14
## 23 23 16 12
## 24 20 21 14
## 25 22 17 16
## 26 18 20 13
## 27 21 18 15
## 28 25 19 14
## 29 19 15 12
## 30 24 16 14
## 31 23 21 16
## 32 20 17 13
## 33 22 20 15
## 34 18 18 14
## 35 24 19 13
## 36 21 15 15
## 37 19 16 14
## 38 25 21 12
## 39 23 17 14
## 40 20 20 16
berikut akan ditampilkan membuat boxplot dari ketiga data
# Menggabungkan data penjualan ke dalam satu data frame
data_penjualan <- data.frame(
Televisi = televisi,
Medsos = medsos,
Cetak = cetak
)
# Membuat boxplot untuk ketiga metode promosi
boxplot(data_penjualan,
main="Penjualan Produk Berdasarkan Metode Promosi",
ylab="Penjualan",
col=c("lightblue", "lightgreen", "lightcoral"),
border=c("blue", "darkgreen", "red"))
## uji normalitas dalam hal ini, dilakukan uji normalitas apakah
masing-masing data memiliki data yang normal atau tidak.
menggunakan uji kolmogorov
library(car)
televisi<- c(20, 25, 22, 18, 23, 21, 24, 19, 26, 20,22, 23, 21, 19, 25, 24, 18, 20, 22, 21,19, 24, 23, 20, 22, 18, 21, 25, 19, 24,23, 20, 22, 18, 24, 21, 19, 25, 23, 20)
medsos<- c(15, 18, 17, 16, 19, 20, 21, 18, 16, 22, 17, 20, 18, 19, 15, 16, 21, 17, 20, 18,19, 15, 16, 21, 17, 20, 18, 19, 15, 16,21, 17, 20, 18, 19, 15, 16, 21, 17, 20)
cetak<- c(12, 14, 13, 15, 12, 14, 16, 13, 15, 14,13, 15, 14, 12, 14, 16, 13, 15, 14, 13,15, 14, 12, 14, 16, 13, 15, 14, 12, 14,16, 13, 15, 14, 13, 15, 14, 12, 14, 16)
televisi1<- ks.test(televisi, "pnorm")
medsos2<- ks.test(medsos, "pnorm")
cetak3<- ks.test(cetak,"pnorm")
televisi1##
## Asymptotic one-sample Kolmogorov-Smirnov test
##
## data: televisi
## D = 1, p-value < 2.2e-16
## alternative hypothesis: two-sided
##
## Asymptotic one-sample Kolmogorov-Smirnov test
##
## data: medsos
## D = 1, p-value < 2.2e-16
## alternative hypothesis: two-sided
##
## Asymptotic one-sample Kolmogorov-Smirnov test
##
## data: cetak
## D = 1, p-value < 2.2e-16
## alternative hypothesis: two-sided
library(car)
televisi<- c(20, 25, 22, 18, 23, 21, 24, 19, 26, 20,22, 23, 21, 19, 25, 24, 18, 20, 22, 21,19, 24, 23, 20, 22, 18, 21, 25, 19, 24,23, 20, 22, 18, 24, 21, 19, 25, 23, 20)
medsos<- c(15, 18, 17, 16, 19, 20, 21, 18, 16, 22, 17, 20, 18, 19, 15, 16, 21, 17, 20, 18,19, 15, 16, 21, 17, 20, 18, 19, 15, 16,21, 17, 20, 18, 19, 15, 16, 21, 17, 20)
cetak<- c(12, 14, 13, 15, 12, 14, 16, 13, 15, 14,13, 15, 14, 12, 14, 16, 13, 15, 14, 13,15, 14, 12, 14, 16, 13, 15, 14, 12, 14,16, 13, 15, 14, 13, 15, 14, 12, 14, 16)
data_hasil <- data.frame(
Kelompok = rep(c("televisi", "medsos", "cetak"), each = length(televisi)),
nilai = c(televisi, medsos, cetak)
)
# Perform Levene's test for homogeneity of variances
leveneTest(nilai ~ Kelompok, data = data_hasil)## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 2 10.97 4.299e-05 ***
## 117
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
alpha <- 0.05
# Output tingkat signifikansi
print(paste("Tingkat signifikansi (α) yang ditetapkan adalah:", alpha))## [1] "Tingkat signifikansi (α) yang ditetapkan adalah: 0.05"
televisi<- c(20, 25, 22, 18, 23, 21, 24, 19, 26, 20,22, 23, 21, 19, 25, 24, 18, 20, 22, 21,19, 24, 23, 20, 22, 18, 21, 25, 19, 24,23, 20, 22, 18, 24, 21, 19, 25, 23, 20)
medsos<- c(15, 18, 17, 16, 19, 20, 21, 18, 16, 22, 17, 20, 18, 19, 15, 16, 21, 17, 20, 18,19, 15, 16, 21, 17, 20, 18, 19, 15, 16,21, 17, 20, 18, 19, 15, 16, 21, 17, 20)
cetak<- c(12, 14, 13, 15, 12, 14, 16, 13, 15, 14,13, 15, 14, 12, 14, 16, 13, 15, 14, 13,15, 14, 12, 14, 16, 13, 15, 14, 12, 14,16, 13, 15, 14, 13, 15, 14, 12, 14, 16)
data_hasil2 <- data.frame(
Metode_Promosi = factor(rep(c("Televisi", "Medsos", "Cetak"), each = length(televisi))),
Penjualan = c(televisi, medsos, cetak)
)
# Perform one-way ANOVA
anova_result <- aov(Penjualan ~ Metode_Promosi, data = data_hasil2)
# Summary of ANOVA
summary(anova_result)## Df Sum Sq Mean Sq F value Pr(>F)
## Metode_Promosi 2 1165.4 582.7 157.7 <2e-16 ***
## Residuals 117 432.5 3.7
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
p_value <- summary(anova_result)[[1]]$'Pr(>F)'[1]
alpha <- 0.05
if (p_value < alpha) {
cat("menolak hipotesis nol dan menyimpulkan bahwa terdapat perbedaan yang signifikan dalam penjualan produk antara metode promosi.")
} else {
cat("Tidak cukup bukti untuk menolak hipotesis nol. Tidak terdapat perbedaan yang signifikan dalam penjualan produk antara metode promosi.")
}## menolak hipotesis nol dan menyimpulkan bahwa terdapat perbedaan yang signifikan dalam penjualan produk antara metode promosi.
diberikan data kepuasan pelanggan di industri hotel sebagai berikut dan lakukan analisis dengan menggunakan R.
library(readr)
library(dplyr)
hotel<- read.csv("D:/Matana/Semester 2/Pengantar Data Sains/datanya_hotel.csv")
hotel## no Kualitas_Layanan Kualitas_Kamar Ketersediaan_Fasilitas
## 1 1 9 8 7
## 2 2 8 7 8
## 3 3 7 8 7
## 4 4 8 9 7
## 5 5 9 7 8
## 6 6 7 8 9
## 7 7 8 7 8
## 8 8 9 8 7
## 9 9 8 7 8
## 10 10 7 8 9
## 11 11 9 8 7
## 12 12 8 9 8
## 13 13 7 8 7
## 14 14 8 7 9
## 15 15 9 8 8
## 16 16 8 7 7
## 17 17 7 8 8
## 18 18 8 7 7
## 19 19 9 8 8
## 20 20 7 7 7
## Responsibilitas_Staf Harga Kepuasan_Pelanggan
## 1 8 7 8
## 2 7 6 7
## 3 9 8 7
## 4 8 6 8
## 5 7 7 8
## 6 6 6 7
## 7 7 7 8
## 8 8 8 9
## 9 9 7 8
## 10 8 6 7
## 11 7 8 8
## 12 7 7 8
## 13 8 6 7
## 14 7 7 8
## 15 6 8 9
## 16 9 7 8
## 17 7 6 7
## 18 8 7 8
## 19 7 8 9
## 20 9 6 8
melakukan visualisasi dari data yang telah disediakan.
library(reshape2)
library(ggplot2)
conv <- apply(hotel, 2, function(hotel) as.numeric(as.character(hotel)))
correlation_matrix <- cor(conv)
ggplot(data = melt(correlation_matrix), aes(x = Var1, y = Var2, fill = value))+
geom_tile()+
scale_fill_gradient(low = "black", high = "pink") +
labs(title = "Correlation Matrix Heatmap")
## melakukan perhitungan
melakukan Perhitungan Korelasi: Menggunakan metode korelasi seperti Pearson, Spearman, atau Kendall untuk mengukur hubungan antara kualitas layanan dan kepuasan pelanggan.
library(readr)
library(nortest)
data1 = read.csv("D:/Matana/Semester 2/Pengantar Data Sains/datanya_hotel.csv")
View(data1)
#uji normalitas
shapiro.test(data1$Kualitas_Layanan)##
## Shapiro-Wilk normality test
##
## data: data1$Kualitas_Layanan
## W = 0.81255, p-value = 0.001337
shapiro.test((data1$Kepuasan_Pelanggan)) #dari hasil perhitungan, dapat disimpulkan bahwa data ini tidak terdistribusi normal karena p-value< alpha##
## Shapiro-Wilk normality test
##
## data: (data1$Kepuasan_Pelanggan)
## W = 0.798, p-value = 0.0008068
#karena tidak terdistribusi normal, maka menggunakan uji spearman
uji<- cor.test(x=data1$Kualitas_Layanan, y=data1$Kepuasan_Pelanggan, method = 'spearman')
uji##
## Spearman's rank correlation rho
##
## data: data1$Kualitas_Layanan and data1$Kepuasan_Pelanggan
## S = 276.45, p-value = 3.145e-05
## alternative hypothesis: true rho is not equal to 0
## sample estimates:
## rho
## 0.7921426
if (uji$p.value < 0.05) {
print("Nilai p-nilai < 0.05, maka ada korelasi yang signifikan antara kualitas layanan dan kepuasan pelanggan.")
} else {
print("Nilai p-nilai > 0.05, maka tidak cukup bukti untuk menyatakan adanya korelasi yang signifikan antara kualitas layanan dan kepuasan pelanggan.")
}## [1] "Nilai p-nilai < 0.05, maka ada korelasi yang signifikan antara kualitas layanan dan kepuasan pelanggan."
##
## Spearman's rank correlation rho
##
## data: data1$Kualitas_Layanan and data1$Kepuasan_Pelanggan
## S = 276.45, p-value = 3.145e-05
## alternative hypothesis: true rho is not equal to 0
## sample estimates:
## rho
## 0.7921426
alpha <- 0.05
if (uji$p.value < alpha) {
print(paste("Nilai p-nilai <", alpha, ", maka ada korelasi yang signifikan antara kualitas layanan dan kepuasan pelanggan."))
} else {
print(paste("Nilai p-nilai >", alpha, ", maka tidak cukup bukti untuk menyatakan adanya korelasi yang signifikan antara kualitas layanan dan kepuasan pelanggan."))
}## [1] "Nilai p-nilai < 0.05 , maka ada korelasi yang signifikan antara kualitas layanan dan kepuasan pelanggan."