NHIỆM VỤ 2.1


1. Đọc dữ liệu từ file xlsx

Để thực hiện chức năng đọc dữ liệu từ file xlsx của R, ta thực hiện theo các bước sau:

Bước 1: Tải package xlsx và gọi dữ liệu file lên R với câu lệnh:

Bước 2: Đọc dữ liệu file xlsx với câu lệnh read.xlsx()

library('xlsx') #gọi package 'xlsx'
d <- read.xlsx(file = 'C:/Users/Admin/Downloads/Grunfeld.xls', sheetIndex = 1, header = T)

Trong đó:

  • read.xlsx(): đọc dữ liệu

  • file = ’ ’ : nguồn dữ liệu

  • sheetIndex: số trang sheet muốn lấy

  • header = T: dòng đầu tiên là tiêu đề chứ không phải dữ liệu

2. Sử dụng 1 bộ dữ liệu ‘cars’ có sẵn trong gói package ‘datasets’

Datasets là một gói package bao gồm nhiều bộ dữ liệu mà ta có thể sử dụng sẵn trong R, để sử dụng ta thực hiện theo các bước sau:

Bước 1: Tải gói package datasets với câu lệnh:

library('datasets') #gọi package datasets sau khi đã tải xong
data(package = 'datasets') #xem trong gói package datasets có những bộ dữ liệu nào

Bước 2: Tải 1 bộ dữ liệu cars trong gói package Datasets

a <- cars #gán bộ dữ liệu 'cars' vào a 

Bước 3: Sử dụng bộ dữ liệu cars:

is.data.frame(a) #kiểm tra xem a có phải là 1 data frame hay không, nếu ra True thì phải, False thì không phải
## [1] TRUE
length(a) #kiểm tra chiều dài của dữ liệu
## [1] 2
names(a) #tên biến của dữ liệu, "speed" và "dist"
## [1] "speed" "dist"
dim(a) #kiểm tra dữ liệu có bao nhiêu dòng và bao nhiêu cột, ở đây a có 50 dòng và 2 cột
## [1] 50  2
library(skimr) #gọi package skimr
skim(a) #mô tả chi tiết dữ liệu như: mean là trung bình, sd là độ lệch chuẩn,...
Data summary
Name a
Number of rows 50
Number of columns 2
_______________________
Column type frequency:
numeric 2
________________________
Group variables None

Variable type: numeric

skim_variable n_missing complete_rate mean sd p0 p25 p50 p75 p100 hist
speed 0 1 15.40 5.29 4 12 15 19 25 ▂▅▇▇▃
dist 0 1 42.98 25.77 2 26 36 56 120 ▅▇▅▂▁
head(a,10) #đầu, hiện 10 dòng đầu tiên của dữ liệu
##    speed dist
## 1      4    2
## 2      4   10
## 3      7    4
## 4      7   22
## 5      8   16
## 6      9   10
## 7     10   18
## 8     10   26
## 9     10   34
## 10    11   17
tail(a,10) #đuôi, hiện 10 dòng cuối của dữ liệu 
##    speed dist
## 41    20   52
## 42    20   56
## 43    20   64
## 44    22   66
## 45    23   54
## 46    24   70
## 47    24   92
## 48    24   93
## 49    24  120
## 50    25   85
str(a) #cung cấp thông tin dữ liệu
## 'data.frame':    50 obs. of  2 variables:
##  $ speed: num  4 4 7 7 8 9 10 10 10 11 ...
##  $ dist : num  2 10 4 22 16 10 18 26 34 17 ...

3. Rút trích dữ liệu từ bộ dữ liệu ‘cars’

Trong một số trường hợp, chúng ta thu về là một dữ liệu lớn tuy nhiên ta lại không sử dụng hết. Để thuận tiện R hỗ trợ chức năng rút trích dữ liệu, ta thực hiện theo các bước sau:

Bước 1: Đổi tên cho các biến để thuận tiện cho việc thao tác dữ liệu:

names(a) <- c('S', 'D')

Sau bước này, thay vì phải gọi dữ liệu là ‘Speed’ và ‘Dist’ thì chũng ta chỉ cần gọi là ‘S’ và ‘D’

Bước 2: Thực hiện thao tác rút trích dữ liệu:

b <- a[7,2] #b bao gồm hàng 7 cột 2 của a
S <- a$S #S bao gồm nguyên dữ liệu cột S
c <- a[ ,1] #c cũng bao gồm nguyên dữ liệu cột S, c và S giống nhau
e <- a[3:7, ] #e bao gồm dữ liệu từ dòng 3,7 của a
f <- a[c(2,4,6,8),c(1,2)] #f bao gồm dữ liệu dòng 2,4,6,8 và cột 1,2 của a
g <- a[a$D >=35 & a$D <=70, ] #g bao gồm các dữ liệu vừa bé hơn hoặc bằng 35 vừa nhỏ hơn hoặc bằng 70 của a
h <-a[a$D == 35 | a$D == 80, ] #h bao gồm các dự liệu bằng 35 hoặc bằng 80 của a
i <- a[S != 15, ] #i bao gồm dữ liệu S nhưng bỏ tất cả giá trị bằng 15

4. Một số package quan trọng khác của R

Ngoài datasets trong R còn nhiều gói package quan trọng khác như tidyverse hay ggplot2. Chúng ta hoàn toàn có thể áp dụng những lệnh ở mục 3 với những package đó.

Tuy nhiên, đối với packgae tidyverse, package này có 1 chức năng vô cùng thú vị mà các package khác không có đó là %>% (pipe). Để sử dụng chức năng này, ta thực hiện như sau:

Ví dụ:

library(tidyverse) #gọi package 'tidyverse'
## ── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
## ✔ dplyr     1.1.4     ✔ readr     2.1.5
## ✔ forcats   1.0.0     ✔ stringr   1.5.1
## ✔ ggplot2   3.4.4     ✔ tibble    3.2.1
## ✔ lubridate 1.9.3     ✔ tidyr     1.3.0
## ✔ purrr     1.0.2     
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag()    masks stats::lag()
## ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors
m <- a %>% filter(S>15) #dữ liệu m bao gồm có a làm dữ liệu đầu vào, lọc sao cho dữ liệu S>15

Chú thích: * %>% (pipe) mang nghĩa “kế đến là”.

Ở đây, chúng ta có thể hiểu ý nghĩa của ví dụ trên là: Với m, chúng ta lấy a làm dữ liệu đầu vào, kế đến dùng lệnh filter để lọc những giá trị S lớn hơn 15.

5. Giới thiệu về World Bank

Bên cạnh gói package được đề cập bên trên như datasets, ggplot2 hay tidyverse, chúng ta còn có thể lấy và sử dụng dữ liệu từ World Bank.

World Bank lưu trữ rất nhiều thông tin kinh tế vĩ mô của nhiều nước trên thế giới và hoàn toàn cho phép người dùng truy cập và sử dụng dữ liệu.

NHIỆM VỤ 2.2

Phân tích một số đặc trưng của Board Game


1. Giới thiệu

1.1. Board game là gì?

Thuật ngữ board game được dùng để chỉ các loại trò chơi cờ bàn bao gồm 2 hay nhiều người chơi tương tác với nhau thông qua một bàn cờ và tuân theo một quy luật nhất định. Một số trò còn sử dụng các vật dụng hỗ trợ như lá bài, xí ngầu, quân cờ…

Người chơi cần phải phán đoán, tư duy, phân tích tình huống và cả sự may mắn của mình để chiến thắng. Thời gian cho lần chơi tùy thuộc vào từng trò, có những trò chơi rất nhanh nhưng cũng có những trò phải mất từ 1 đến 2 tiếng mới kết thúc.

Một số trò board game nổi tiếng mà chúng ta có thể đã nghe qua như: Cờ vua, cờ cá ngựa, ma sói, rút gỗ, bài unô, lô tô, trò ca rô, ma sói, mèo nổ, …

1.2. Bộ dữ liệu board game

game <- read.csv(file = 'C:/Users/Admin/Downloads/board_game_data.csv', header = T) #đọc dữ liệu board game

Bộ dữ liệu board game bao gồm 2212 quan sát và 10 biến, được lấy từ Kaggle - một nơi uy tín cung cấp lượng lớn thông tin về đa dạng các lĩnh vực và ngành nghề.

Nghiên cứu bộ dữ liệu board game bằng công cụ R giúp cho những nhà sáng tạo hay các nhà kinh doanh về mảng trò chơi có một cái nhìn cụ thể và tốt hơn về một số yếu tố, từ đó, họ có thể tự điều chỉnh và thu hút thêm tệp khách hàng như:

  • Game id của trò (game_id)

  • Tên trò chơi (names)

  • Số lượng người tham gia tối thiểu (min_player)

  • Số lượng người tham gia tối đa (max_player)

  • Thời gian trung bình khi chơi một trò, tính theo phút (avg_time)

  • Thời gian tối thiểu khi chơi một trò, tính theo phút (min_time)

  • Thời gian tối đa khi chơi một trò, tính theo phút (max_time)

  • Số lượt đánh giá (avg_rating)

  • Độ tuổi người chơi (age)

  • Nhà sáng lập trò chơi (designer)

2. Phân tích số người chơi

names(game) <- c('ID', 'N', 'minp', 'maxp', 'AT', 'mint', 'maxt', 'AR', 'A', 'D') 
#Đổi tên các biến để tiện lợi trong việc thực hiện thác tác trên dữ liệu

game1 <- game[game$minp ==1 & game$maxp <=2, ] 
#game1 bao gồm dữ liệu đầu vào là game, số người chơi tối thiểu là 1, số người chơi tối đa là 2, ứng với nhóm khách hàng lẻ/cặp đôi

game2 <- game[game$minp >= 2 & game$maxp >= 3, ] 
#game2 cũng bao gồm dữ liệu đầu vào là game, số người chơi tối thiểu lớn hơn hoặc bằng 2, số người chơi tối đa lớn hơn hoặc bằng 3, ứng với nhóm khách hàng đội/nhóm

Qua việc phân tích 2212 trường hợp quan sát, ta nhận thấy tỷ lệ xuất hiện của trò chơi dành cho nhóm khách hàng lẻ/cặp đôi chiếm một tỷ trọng thấp hơn (khoảng 2,667%, tương đương với 59/2212) so với trò chơi dành cho nhóm khách hàng là đội/nhóm (khoảng 69,168%, tương đương với 1530/2212). Kết quả này làm nổi bật sự ít được chú ý của nhóm khách hàng lẻ/cặp đôi so với nhóm khách hàng là đội/nhóm.

Dựa trên phân tích này, ta có thể đề xuất rằng các nhà sáng tạo và doanh nghiệp trong lĩnh vực trò chơi có thể khai thác thêm cơ hội bằng cách sáng tạo và phát triển các trò chơi đặc biệt dành cho nhóm khách hàng lẻ/cặp đôi. Đồng thời, liên tục nỗ lực cải thiện trò chơi, nhằm tạo ra trải nghiệm thú vị và giữ chân người chơi thuộc nhóm khách hàng là đội/nhóm.

=> Điều này không chỉ giúp tăng cường sự chú ý đối với đối tượng này mà còn có thể mang lại nguồn lợi nhuận bổ sung cho họ.

Một số trò chơi dành cho nhóm khách hàng lẻ/cặp đôi mà ta có thể phát triển thêm là:

  • Arkham Horror: The Card Game

  • Nate French, Matthew Newman

  • Fields of Arle

  • Uwe Rosenberg

  • The Lord of the Rings: The Card Game

3. Phân tích thời gian chơi một trò

game3 <- game[game$mint >= 5 & game$maxt <= 180, ]
#game3 bao gồm dữ liệu đầu vào là game, số thời gian chơi tối thiểu là lớn hơn bằng 5, số thời gian chơi tối đa là bé hơn bằng 180, ứng với bộ trò chơi mất ít thời gian để chơi

game4 <- game[game$mint >= 180 & game$maxt <= 6000, ]
#game4 bao gồm dữ liệu đầu vào là game, số thời gian chơi tối thiểu là lớn hơn bằng 180, số thời gian chơi tối đa là bé hơn bằng 6000, ứng với bộ trò chơi mất nhiều thời gian để chơi

Kết quả nghiên cứu cho thấy rằng đối với các trò chơi có thời gian chơi ngắn, chúng có tỷ lệ rất cao (2039/2212 xấp xỉ 92,179%), hầu hết các bộ trò chơi đều được chơi trong khoảng thời gian từ 1 đến 3 tiếng. Ngược lại, trò chơi đòi hỏi thời gian chơi lâu hơn có tỷ lệ sử dụng thấp hơn (177/2212 xấp xỉ 8,001%).

Nhìn chung, nghiên cứu cho thấy rằng ưu điểm chính và điểm độc đáo trong lĩnh vực trò chơi nằm ở không những sản phẩm thú vị mà còn mất ít thời gian để chơi, tiết kiệm thời gian. Điều này đặt ra một cơ hội rõ ràng cho các nhà sáng tạo và doanh nghiệp trò chơi để tập trung và phát triển những trò chơi có đặc điểm này, nhằm tối ưu hóa sự hấp dẫn và tiện lợi cho người chơi.

4. Tổng kết

Thông qua nghiên cứu trên, ta có thể rút ra kết luận rằng, nhà sáng tạo và nhà kinh doanh trong lĩnh vực trò chơi nên:

  • Quan tâm đến nhóm khách hàng lẻ/cặp đôi bằng cách sáng tạo thêm những bộ trò chơi cho nhóm khách hàng này.

  • Giữ chân nhóm khách hàng đội/nhóm bằng cách không ngừng cải tiến, cải thiện trò chơi.

  • Tập trung vào những bộ trò chơi mất ít thời gian để chơi.

  • Thông điệp, quy luật trong trò chơi cần được thiết kế một cách lành mạnh vì khách hàng là các em học sinh dưới 19 tuổi.

check <- is.na(game) #kiểm tra tính hoàn chỉnh của dữ liệu 'board game'
---
title: "Nhiệm vụ 2"
author: "Nguyễn Phạm Thúy An"
output: 
  html_document: 
    toc: true 
    number section: true
    toc_float: true
    code_download: true
date: "`r format(Sys.time(), '%H:%M:%S, %d - %m - %Y')`"
---

```{r setup, include=FALSE}
knitr::opts_chunk$set(echo = TRUE)
```

# **NHIỆM VỤ 2.1**
***

## **1. Đọc dữ liệu từ file xlsx**

Để thực hiện chức năng đọc dữ liệu từ file xlsx của R, ta thực hiện theo các bước sau:

**Bước 1:** Tải package xlsx và gọi dữ liệu file lên R với câu lệnh:

**Bước 2:** Đọc dữ liệu file xlsx với câu lệnh **read.xlsx()**

```{r}
library('xlsx') #gọi package 'xlsx'
d <- read.xlsx(file = 'C:/Users/Admin/Downloads/Grunfeld.xls', sheetIndex = 1, header = T)
```

Trong đó:

* read.xlsx(): đọc dữ liệu

* file = ' ' : nguồn dữ liệu

* sheetIndex: số trang sheet muốn lấy

* header = T: dòng đầu tiên là tiêu đề chứ không phải dữ liệu

## **2. Sử dụng 1 bộ dữ liệu 'cars' có sẵn trong gói package 'datasets'**

**Datasets** là một gói package bao gồm nhiều bộ dữ liệu mà ta có thể sử dụng sẵn trong R, để sử dụng ta thực hiện theo các bước sau:

**Bước 1:** Tải gói package **datasets** với câu lệnh:

```{r}
library('datasets') #gọi package datasets sau khi đã tải xong
data(package = 'datasets') #xem trong gói package datasets có những bộ dữ liệu nào
```

**Bước 2:** Tải 1 bộ dữ liệu **cars** trong gói package **Datasets**

```{r}
a <- cars #gán bộ dữ liệu 'cars' vào a 
```

**Bước 3:** Sử dụng bộ dữ liệu **cars**:
```{r}
is.data.frame(a) #kiểm tra xem a có phải là 1 data frame hay không, nếu ra True thì phải, False thì không phải
length(a) #kiểm tra chiều dài của dữ liệu
names(a) #tên biến của dữ liệu, "speed" và "dist"
dim(a) #kiểm tra dữ liệu có bao nhiêu dòng và bao nhiêu cột, ở đây a có 50 dòng và 2 cột

library(skimr) #gọi package skimr
skim(a) #mô tả chi tiết dữ liệu như: mean là trung bình, sd là độ lệch chuẩn,...

head(a,10) #đầu, hiện 10 dòng đầu tiên của dữ liệu
tail(a,10) #đuôi, hiện 10 dòng cuối của dữ liệu 
str(a) #cung cấp thông tin dữ liệu
```

## **3. Rút trích dữ liệu từ bộ dữ liệu 'cars'**

Trong một số trường hợp, chúng ta thu về là một dữ liệu lớn tuy nhiên ta lại không sử dụng hết. Để thuận tiện R hỗ trợ chức năng rút trích dữ liệu, ta thực hiện theo các bước sau:

**Bước 1:** Đổi tên cho các biến để thuận tiện cho việc thao tác dữ liệu:
```{r}
names(a) <- c('S', 'D')
```

Sau bước này, thay vì phải gọi dữ liệu là 'Speed' và 'Dist' thì chũng ta chỉ cần gọi là 'S' và 'D'

**Bước 2:** Thực hiện thao tác rút trích dữ liệu:
```{r}
b <- a[7,2] #b bao gồm hàng 7 cột 2 của a
S <- a$S #S bao gồm nguyên dữ liệu cột S
c <- a[ ,1] #c cũng bao gồm nguyên dữ liệu cột S, c và S giống nhau
e <- a[3:7, ] #e bao gồm dữ liệu từ dòng 3,7 của a
f <- a[c(2,4,6,8),c(1,2)] #f bao gồm dữ liệu dòng 2,4,6,8 và cột 1,2 của a
g <- a[a$D >=35 & a$D <=70, ] #g bao gồm các dữ liệu vừa bé hơn hoặc bằng 35 vừa nhỏ hơn hoặc bằng 70 của a
h <-a[a$D == 35 | a$D == 80, ] #h bao gồm các dự liệu bằng 35 hoặc bằng 80 của a
i <- a[S != 15, ] #i bao gồm dữ liệu S nhưng bỏ tất cả giá trị bằng 15
```

## **4. Một số package quan trọng khác của R**
Ngoài **datasets** trong R còn nhiều gói package quan trọng khác như **tidyverse** hay **ggplot2**. Chúng ta hoàn toàn có thể áp dụng những lệnh ở mục 3 với những package đó.

Tuy nhiên, đối với packgae **tidyverse**, package này có 1 chức năng vô cùng thú vị mà các package khác không có đó là **%>% (pipe)**. Để sử dụng chức năng này, ta thực hiện như sau:

_Ví dụ:_
```{r}
library(tidyverse) #gọi package 'tidyverse'
m <- a %>% filter(S>15) #dữ liệu m bao gồm có a làm dữ liệu đầu vào, lọc sao cho dữ liệu S>15
```

**Chú thích:**
* %>% (pipe) mang nghĩa "kế đến là". 

Ở đây, chúng ta có thể hiểu ý nghĩa của ví dụ trên là: Với m, chúng ta lấy a làm dữ liệu đầu vào, kế đến dùng lệnh filter để lọc những giá trị S lớn hơn 15.

## **5. Giới thiệu về World Bank**
Bên cạnh gói package được đề cập bên trên như **datasets**, **ggplot2** hay **tidyverse**, chúng ta còn có thể lấy và sử dụng dữ liệu từ **World Bank**. 

**World Bank** lưu trữ rất nhiều thông tin kinh tế vĩ mô của nhiều nước trên thế giới và hoàn toàn cho phép người dùng truy cập và sử dụng dữ liệu.

# **NHIỆM VỤ 2.2**

# **Phân tích một số đặc trưng của Board Game**
***

## **1. Giới thiệu**
### **1.1. Board game là gì?**

Thuật ngữ _board game_ được dùng để chỉ các loại trò chơi cờ bàn bao gồm 2 hay nhiều người chơi tương tác với nhau thông qua một bàn cờ và tuân theo một quy luật nhất định. Một số trò còn sử dụng các vật dụng hỗ trợ như lá bài, xí ngầu, quân cờ... 

Người chơi cần phải phán đoán, tư duy, phân tích tình huống và cả sự may mắn của mình để chiến thắng. Thời gian cho lần chơi tùy thuộc vào từng trò, có những trò chơi rất nhanh nhưng cũng có những trò phải mất từ 1 đến 2 tiếng mới kết thúc.

Một số trò _board game_ nổi tiếng mà chúng ta có thể đã nghe qua như: Cờ vua, cờ cá ngựa, ma sói, rút gỗ, bài unô, lô tô, trò ca rô, ma sói, mèo nổ, ...

### **1.2. Bộ dữ liệu board game**

```{r}
game <- read.csv(file = 'C:/Users/Admin/Downloads/board_game_data.csv', header = T) #đọc dữ liệu board game
```

Bộ dữ liệu _board game_ bao gồm 2212 quan sát và 10 biến, được lấy từ [Kaggle](https://www.kaggle.com/datasets/mrpantherson/board-game-data/data) - một nơi uy tín cung cấp lượng lớn thông tin về đa dạng các lĩnh vực và ngành nghề.

Nghiên cứu bộ dữ liệu _board game_ bằng công cụ R giúp cho những nhà sáng tạo hay các nhà kinh doanh về mảng trò chơi có một cái nhìn cụ thể và tốt hơn về một số yếu tố, từ đó, họ có thể tự điều chỉnh và thu hút thêm tệp khách hàng như:

* Game id của trò **(game_id)**

* Tên trò chơi **(names)**

* Số lượng người tham gia tối thiểu **(min_player)**

* Số lượng người tham gia tối đa **(max_player)**

* Thời gian trung bình khi chơi một trò, tính theo phút **(avg_time)**

* Thời gian tối thiểu khi chơi một trò, tính theo phút **(min_time)**

* Thời gian tối đa khi chơi một trò, tính theo phút **(max_time)**

* Số lượt đánh giá **(avg_rating)**

* Độ tuổi người chơi **(age)**

* Nhà sáng lập trò chơi **(designer)**

## **2. Phân tích số người chơi**

```{r}
names(game) <- c('ID', 'N', 'minp', 'maxp', 'AT', 'mint', 'maxt', 'AR', 'A', 'D') 
#Đổi tên các biến để tiện lợi trong việc thực hiện thác tác trên dữ liệu

game1 <- game[game$minp ==1 & game$maxp <=2, ] 
#game1 bao gồm dữ liệu đầu vào là game, số người chơi tối thiểu là 1, số người chơi tối đa là 2, ứng với nhóm khách hàng lẻ/cặp đôi

game2 <- game[game$minp >= 2 & game$maxp >= 3, ] 
#game2 cũng bao gồm dữ liệu đầu vào là game, số người chơi tối thiểu lớn hơn hoặc bằng 2, số người chơi tối đa lớn hơn hoặc bằng 3, ứng với nhóm khách hàng đội/nhóm
```

Qua việc phân tích 2212 trường hợp quan sát, ta nhận thấy tỷ lệ xuất hiện của trò chơi dành cho nhóm khách hàng lẻ/cặp đôi chiếm một tỷ trọng thấp hơn _(khoảng 2,667%, tương đương với 59/2212)_ so với trò chơi dành cho nhóm khách hàng là đội/nhóm _(khoảng 69,168%, tương đương với 1530/2212)_. Kết quả này làm nổi bật sự ít được chú ý của nhóm khách hàng lẻ/cặp đôi so với nhóm khách hàng là đội/nhóm. 

Dựa trên phân tích này, ta có thể đề xuất rằng các nhà sáng tạo và doanh nghiệp trong lĩnh vực trò chơi có thể khai thác thêm cơ hội bằng cách sáng tạo và phát triển các trò chơi đặc biệt dành cho nhóm khách hàng lẻ/cặp đôi. Đồng thời, liên tục nỗ lực cải thiện trò chơi, nhằm tạo ra trải nghiệm thú vị và giữ chân người chơi thuộc nhóm khách hàng là đội/nhóm.

=> Điều này không chỉ giúp tăng cường sự chú ý đối với đối tượng này mà còn có thể mang lại nguồn lợi nhuận bổ sung cho họ.

Một số trò chơi dành cho nhóm khách hàng lẻ/cặp đôi mà ta có thể phát triển thêm là:

* Arkham Horror: The Card Game

* Nate French, Matthew Newman

* Fields of Arle

* Uwe Rosenberg

* The Lord of the Rings: The Card Game

## **3. Phân tích thời gian chơi một trò**

```{r}
game3 <- game[game$mint >= 5 & game$maxt <= 180, ]
#game3 bao gồm dữ liệu đầu vào là game, số thời gian chơi tối thiểu là lớn hơn bằng 5, số thời gian chơi tối đa là bé hơn bằng 180, ứng với bộ trò chơi mất ít thời gian để chơi

game4 <- game[game$mint >= 180 & game$maxt <= 6000, ]
#game4 bao gồm dữ liệu đầu vào là game, số thời gian chơi tối thiểu là lớn hơn bằng 180, số thời gian chơi tối đa là bé hơn bằng 6000, ứng với bộ trò chơi mất nhiều thời gian để chơi
```

Kết quả nghiên cứu cho thấy rằng đối với các trò chơi có thời gian chơi ngắn, chúng có tỷ lệ rất cao _(2039/2212 xấp xỉ 92,179%)_, hầu hết các bộ trò chơi đều được chơi trong khoảng thời gian từ 1 đến 3 tiếng. Ngược lại, trò chơi đòi hỏi thời gian chơi lâu hơn có tỷ lệ sử dụng thấp hơn _(177/2212 xấp xỉ 8,001%)_.

Nhìn chung, nghiên cứu cho thấy rằng ưu điểm chính và điểm độc đáo trong lĩnh vực trò chơi nằm ở không những sản phẩm thú vị mà còn mất ít thời gian để chơi, tiết kiệm thời gian. Điều này đặt ra một cơ hội rõ ràng cho các nhà sáng tạo và doanh nghiệp trò chơi để tập trung và phát triển những trò chơi có đặc điểm này, nhằm tối ưu hóa sự hấp dẫn và tiện lợi cho người chơi.

## **4. Tổng kết**

Thông qua nghiên cứu trên, ta có thể rút ra kết luận rằng, nhà sáng tạo và nhà kinh doanh trong lĩnh vực trò chơi nên:

* Quan tâm đến nhóm khách hàng lẻ/cặp đôi bằng cách sáng tạo thêm những bộ trò chơi cho nhóm khách hàng này.

* Giữ chân nhóm khách hàng đội/nhóm bằng cách không ngừng cải tiến, cải thiện trò chơi.

* Tập trung vào những bộ trò chơi mất ít thời gian để chơi.

* Thông điệp, quy luật trong trò chơi cần được thiết kế một cách lành mạnh vì khách hàng là các em học sinh dưới 19 tuổi.

```{r}
check <- is.na(game) #kiểm tra tính hoàn chỉnh của dữ liệu 'board game'
```


