1 Deskripsi Insight

Insight yang dianalisis adalah hubungan antara harga rental film dan tingkat popularitas film yang diukur berdasarkan jumlah rental pada database Sakila. Analisis ini digunakan untuk mengetahui pengaruh perbedaan harga rental pada minat pelanggan dalam menyewa film.

Apakah harga rental berpengaruh terhadap jumlah penyewaan film pada database sakila?

2 Connect SQL ke R

library(DBI)
library(odbc)
## Warning: package 'odbc' was built under R version 4.5.2
con1 <- dbConnect(odbc(),
                  Driver   = "MySQL ODBC 8.0 ANSI Driver",
                  Server   = "127.0.0.1",
                  UID      = "root",
                  PWD      = "Kumgig416",
                  Port     = 3306,
                  Database = "sakila")

2.1 Sumber Data

Tabel Keterangan
film Judul film dan harga rental
inventory Stok film yang disewa
rental Transaksi penyewaan film

2.2 Variabel Penelitian

  • `rental_rate`` — harga rental film
  • total_rental — jumlah total penyewaan film

3 Query SQL

SELECT 
    f.title,
    f.rental_rate,
    COUNT(r.rental_id) AS total_rental
  FROM film f
  JOIN inventory i
    ON f.film_id = i.film_id
  JOIN rental r
    ON i.inventory_id = r.inventory_id
  GROUP BY f.title, f.rental_rate
  ORDER BY total_rental DESC;

4 Import Library dan Dataset

library(dplyr)
## Warning: package 'dplyr' was built under R version 4.5.2
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(ggplot2)
## Warning: package 'ggplot2' was built under R version 4.5.2
data <- read.csv("C:/Users/kumal/OneDrive/Dokumen/Smt 2/Sistem Informasi Manajemen/rental film.csv")
head(data)
##                 title rental_rate total_rental
## 1  BUCKET BROTHERHOOD        4.99           34
## 2    ROCKETEER MOTHER        0.99           33
## 3      FORWARD TEMPLE        2.99           32
## 4      GRIT CLOCKWORK        0.99           32
## 5      JUGGLER HARDLY        0.99           32
## 6 RIDGEMONT SUBMARINE        0.99           32
summary(data)
##     title            rental_rate     total_rental  
##  Length:958         Min.   :0.990   Min.   : 4.00  
##  Class :character   1st Qu.:0.990   1st Qu.:11.00  
##  Mode  :character   Median :2.990   Median :16.00  
##                     Mean   :2.977   Mean   :16.75  
##                     3rd Qu.:4.990   3rd Qu.:22.00  
##                     Max.   :4.990   Max.   :34.00

5 Visualisasi

5.1 Top 10 Film Paling Populer

top10 <- data %>%
  arrange(desc(total_rental)) %>%
  head(10)
top10
##                  title rental_rate total_rental
## 1   BUCKET BROTHERHOOD        4.99           34
## 2     ROCKETEER MOTHER        0.99           33
## 3       FORWARD TEMPLE        2.99           32
## 4       GRIT CLOCKWORK        0.99           32
## 5       JUGGLER HARDLY        0.99           32
## 6  RIDGEMONT SUBMARINE        0.99           32
## 7        SCALAWAG DUCK        4.99           32
## 8        APACHE DIVINE        4.99           31
## 9    GOODFELLAS SALUTE        4.99           31
## 10        HOBBIT ALIEN        0.99           31
ggplot(top10, aes(x = reorder(title, total_rental),
                  y = total_rental)) +
  geom_bar(stat = "identity", fill = "#D3968C", show.legend = FALSE, width = 0.7) +
  geom_text(aes(label = total_rental), hjust = -0.2, size = 3.5) +
  coord_flip() +
  scale_y_continuous(expand = expansion(c(0, 0.12))) +
  labs(
    title    = "Top 10 Film Paling Populer",
    x = "Film",
    y = "Jumlah Rental"
  )

Visualisasi di atas menunjukkan 10 film dengan jumlah rental tertinggi pada database Sakila. Berdasarkan grafik, film Bucket Brotherhood menjadi film paling populer dengan total rental sebanyak 34 kali. Perbedaan jumlah rental antar film terlihat tidak terlalu jauh. Hal ini menunjukkan bahwa tingkat popularitas film relatif merata pada 10 film terpopuler.

5.2 Hubungan Antara Harga Rental dengan Popularitas Film

ggplot(data, aes(x = rental_rate, y = total_rental)) +
  geom_point(
    color = "darkblue",size = 3,alpha = 0.7) +
  geom_smooth(
    method = "lm",se = FALSE,color = "red") +
  theme_minimal() +
  labs(
    title = "Hubungan Harga Rental dan Popularitas Film",
    subtitle = "Database Sakila",
    x = "Harga Rental",
    y = "Jumlah Rental"
  )
## `geom_smooth()` using formula = 'y ~ x'

Visualisasi scatter plot menunjukkan hubungan antara harga rental film dan jumlah rental film pada database Sakila. Setiap titik pada grafik merepresentasikan satu film dengan nilai harga rental tertentu dan jumlah rental film yang diperoleh.

Pada garis regresi linear berwarna merah, garis tersebut sedikit menurun. Artinya, semakin tinggi harga rental film, jumlah rental film cenderung sedikit menurun. Adanya persebaran titik yang acak pada kelompok harga ini menunjukkan bahwa popularitas film tidak hanya dipengaruhi oleh harga rental, namun bisa melalui genre film, rating, dan aktor.

6 Analisis Regresi Linear

model <- lm(total_rental ~ rental_rate, data = data)
summary(model)
## 
## Call:
## lm(formula = total_rental ~ rental_rate, data = data)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -12.745  -5.312  -0.312   4.823  17.688 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  17.3916     0.4462  38.977   <2e-16 ***
## rental_rate  -0.2164     0.1312  -1.649   0.0995 .  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 6.67 on 956 degrees of freedom
## Multiple R-squared:  0.002836,   Adjusted R-squared:  0.001792 
## F-statistic: 2.718 on 1 and 956 DF,  p-value: 0.09952
coef(model)
## (Intercept) rental_rate 
##   17.391585   -0.216356

6.1 Persamaan Matematis

\[ \hat{Y} = 17.3916 - 0.2164X \] dengan: - Y = jumlah rental film - X = harga rental film

6.2 Penjelasan

Koefisien regresi bernilai negatif sebesar -0.2164. Hal ini menunjukkan bahwa hubungan antara harga rental dan popularitas film bersifat negatif. Namun, berdasarkan nilai p-value sebesar 0.09952, hubungan tersebut tidak signifikan pada tingkat signifikansi 5%. Hubungan tersebut berarti bahwa harga rental tidak memiliki pengaruh yang signifikan terhadap jumlah rental film.

Nilai multiple r-squared sebesar 0.002836 juga menunjukkan bahwa sebagian besar variasi popularitas film dipengaruhi oleh faktor lain di luar harga rental.

Kesimpulan Berdasarkan visualisasi dan hasil analisis regresi linear, hubungan antara harga rental film dan jumlah rental film pada database Sakila ini tergolong lemah.

Harga rental bukanlah faktor utama yang memengaruhi popularitas film pada database Sakila. Popularitas film ini bisa dipengaruhi oleh faktor-faktor lain, seperti genre film, rating, maupun aktor yang memerankan.