#一、 動機及分析目的: 在社群媒體分析的課程中,我們學會了關於文本分析的技巧,也學會了如何進行社群媒體的分析,這次我們希望能利用所學,用最貼近平民生活的電視劇,來分析及探討什麼樣的發文最能吸引大家的回覆。

#二、前置:環境設定及資料集載入

(一)載入packages

library(readr)
library(jiebaR)
## Loading required package: jiebaRD
library(tidyr)
library(tidytext)
library(igraph)
## 
## Attaching package: 'igraph'
## The following object is masked from 'package:tidyr':
## 
##     crossing
## The following objects are masked from 'package:stats':
## 
##     decompose, spectrum
## The following object is masked from 'package:base':
## 
##     union
library(topicmodels)
library(stringr)
library(ggplot2)
library(purrr)
## 
## Attaching package: 'purrr'
## The following objects are masked from 'package:igraph':
## 
##     compose, simplify
require(tm)
## Loading required package: tm
## Loading required package: NLP
## 
## Attaching package: 'NLP'
## The following object is masked from 'package:ggplot2':
## 
##     annotate
require(data.table)
## Loading required package: data.table
## 
## Attaching package: 'data.table'
## The following object is masked from 'package:purrr':
## 
##     transpose
require(dplyr)
## Loading required package: dplyr
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:data.table':
## 
##     between, first, last
## The following objects are masked from 'package:igraph':
## 
##     as_data_frame, groups, union
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
require(stringr)
require(udpipe)
## Loading required package: udpipe
require(LDAvis)
## Loading required package: LDAvis
require(wordcloud2)
## Loading required package: wordcloud2
require(webshot)
## Loading required package: webshot
require(htmlwidgets)
## Loading required package: htmlwidgets
require(servr)
## Loading required package: servr
require(ramify)
## Loading required package: ramify
## 
## Attaching package: 'ramify'
## The following object is masked from 'package:webshot':
## 
##     resize
## The following object is masked from 'package:purrr':
## 
##     flatten
## The following object is masked from 'package:tidyr':
## 
##     fill
## The following object is masked from 'package:graphics':
## 
##     clip
require(RColorBrewer)
## Loading required package: RColorBrewer
library(caTools)
library(caret)
## Loading required package: lattice
## 
## Attaching package: 'caret'
## The following object is masked from 'package:purrr':
## 
##     lift
library(rpart)
library(rpart.plot)
library(e1071)
library(textstem)
## Loading required package: koRpus.lang.en
## Loading required package: koRpus
## Loading required package: sylly
## For information on available language packages for 'koRpus', run
## 
##   available.koRpus.lang()
## 
## and see ?install.koRpus.lang()
## 
## Attaching package: 'koRpus'
## The following object is masked from 'package:readr':
## 
##     tokenize
library(topicmodels)
library(DT)
library(knitr)

(二)設定斷詞

(三)資料集說明:

(1)資料來源:以中山大學文字處理平台抓取PTT資料三個聊天版,共抓取四部陸劇:如懿傳、延禧攻略、甄嬛傳、步步驚心

(2)如懿傳:692筆、延禧攻略513筆、甄嬛傳362筆、步步驚心63筆,共1,630筆

Ruyi_china_drama_articleMetaData <- read_csv("D:/OC Learn/NSYSU/Social Media Analysis/Final Paper/Final_report_group7/data/Ruyi-china drama_articleMetaData.csv")

Ruyi_articleMetaData <- read_csv("D:/OC Learn/NSYSU/Social Media Analysis/Final Paper/Final_report_group7/data/Ruyi_articleMetaData.csv")

Ruoxi_articleMetaData <- read_csv("D:/OC Learn/NSYSU/Social Media Analysis/Final Paper/Final_report_group7/data/Ruoxi_articleMetaData.csv")

Yanxi_articleMetaData <- read_csv("D:/OC Learn/NSYSU/Social Media Analysis/Final Paper/Final_report_group7/data/Yanxi_articleMetaData.csv")

Yanxi_china_drama_articleMetaData <- read_csv("D:/OC Learn/NSYSU/Social Media Analysis/Final Paper/Final_report_group7/data/Yanxi_chinadrama_articleMetaData.csv")

Zhenhuan_articleMetaData <- read_csv("D:/OC Learn/NSYSU/Social Media Analysis/Final Paper/Final_report_group7/data/Zhenhuan_articleMetaData.csv")

drama_article <- rbind(Ruyi_china_drama_articleMetaData,Ruyi_articleMetaData,Ruoxi_articleMetaData,Yanxi_articleMetaData,Yanxi_china_drama_articleMetaData,Zhenhuan_articleMetaData)

(四)去掉重複文章,共1450筆

drama_article <- drama_article %>% group_by(artUrl, artTitle ,artDate , artTime , artPoster ,artCat , commentNum ,push ,boo,sentence) %>%
  count() %>%
  
  select(-n) %>%
  
  ungroup()

#三、特徵處理:

1.以Topic Model取Beta值: 1-1:將資料轉換為Document Term Matrix (DTM)

drama_article_tokens <- drama_article %>%
  unnest_tokens(word , sentence , token = Book_tokenizer) %>%
  filter(!str_detect(word, regex("[0-9a-zA-Z]")))

drama_article_tokens
## # A tibble: 301,446 x 10
##    artUrl artTitle artDate    artTime  artPoster artCat commentNum  push   boo
##    <chr>  <chr>    <date>     <time>   <chr>     <chr>       <dbl> <dbl> <dbl>
##  1 https~ Re:[閒聊]~ 2014-11-08 18:11:29 marcus40  China~         23     8     0
##  2 https~ Re:[閒聊]~ 2014-11-08 18:11:29 marcus40  China~         23     8     0
##  3 https~ Re:[閒聊]~ 2014-11-08 18:11:29 marcus40  China~         23     8     0
##  4 https~ Re:[閒聊]~ 2014-11-08 18:11:29 marcus40  China~         23     8     0
##  5 https~ Re:[閒聊]~ 2014-11-08 18:11:29 marcus40  China~         23     8     0
##  6 https~ Re:[閒聊]~ 2014-11-08 18:11:29 marcus40  China~         23     8     0
##  7 https~ Re:[閒聊]~ 2014-11-08 18:11:29 marcus40  China~         23     8     0
##  8 https~ Re:[閒聊]~ 2014-11-08 18:11:29 marcus40  China~         23     8     0
##  9 https~ Re:[閒聊]~ 2014-11-08 18:11:29 marcus40  China~         23     8     0
## 10 https~ Re:[閒聊]~ 2014-11-08 18:11:29 marcus40  China~         23     8     0
## # ... with 301,436 more rows, and 1 more variable: word <chr>
drama_article_words <- drama_article_tokens %>%
  
  count(artUrl, word, sort = TRUE)
drama_article_dtm <- drama_article_words %>% cast_dtm(artUrl , word, n)

drama_article_dtm
## <<DocumentTermMatrix (documents: 1450, terms: 43469)>>
## Non-/sparse entries: 213214/62816836
## Sparsity           : 100%
## Maximal term length: 11
## Weighting          : term frequency (tf)
inspect(drama_article_dtm[1:10,1:10])
## <<DocumentTermMatrix (documents: 10, terms: 10)>>
## Non-/sparse entries: 56/44
## Sparsity           : 44%
## Maximal term length: 3
## Weighting          : term frequency (tf)
## Sample             :
##                                                             Terms
## Docs                                                         于 如懿 皇上 皇帝
##   https://www.ptt.cc/bbs/China-Drama/M.1532872951.A.752.html  0    0   24    0
##   https://www.ptt.cc/bbs/China-Drama/M.1539014029.A.1A8.html  2    0    5   16
##   https://www.ptt.cc/bbs/China-Drama/M.1539164993.A.F8B.html  0   77    8    3
##   https://www.ptt.cc/bbs/China-Drama/M.1549885126.A.40B.html  0   35    1   64
##   https://www.ptt.cc/bbs/China-Drama/M.1550492467.A.B64.html  0   25    1   66
##   https://www.ptt.cc/bbs/China-Drama/M.1551700115.A.4A2.html  0   49    1   62
##   https://www.ptt.cc/bbs/China-Drama/M.1552300499.A.E89.html  0   49    1   75
##   https://www.ptt.cc/bbs/China-Drama/M.1552907104.A.FE1.html  0   54    2   55
##   https://www.ptt.cc/bbs/China-Drama/M.1553511885.A.21B.html  0   56    2   67
##   https://www.ptt.cc/bbs/China-Drama/M.1553854408.A.557.html  0   45    2   65
##                                                             Terms
## Docs                                                         凌雲 甄 嬛 魏瓔珞
##   https://www.ptt.cc/bbs/China-Drama/M.1532872951.A.752.html    0  1  3      6
##   https://www.ptt.cc/bbs/China-Drama/M.1539014029.A.1A8.html    0  2  5      9
##   https://www.ptt.cc/bbs/China-Drama/M.1539164993.A.F8B.html    3  1  1      0
##   https://www.ptt.cc/bbs/China-Drama/M.1549885126.A.40B.html    9  0  0      0
##   https://www.ptt.cc/bbs/China-Drama/M.1550492467.A.B64.html   12  0  0      0
##   https://www.ptt.cc/bbs/China-Drama/M.1551700115.A.4A2.html    7  0  0      0
##   https://www.ptt.cc/bbs/China-Drama/M.1552300499.A.E89.html    1  1  1      0
##   https://www.ptt.cc/bbs/China-Drama/M.1552907104.A.FE1.html   62  0  0      0
##   https://www.ptt.cc/bbs/China-Drama/M.1553511885.A.21B.html    7  0  0      0
##   https://www.ptt.cc/bbs/China-Drama/M.1553854408.A.557.html    7  0  0      0
##                                                             Terms
## Docs                                                         嬿婉 瓔珞
##   https://www.ptt.cc/bbs/China-Drama/M.1532872951.A.752.html    0   83
##   https://www.ptt.cc/bbs/China-Drama/M.1539014029.A.1A8.html    0   88
##   https://www.ptt.cc/bbs/China-Drama/M.1539164993.A.F8B.html    3    0
##   https://www.ptt.cc/bbs/China-Drama/M.1549885126.A.40B.html   29    0
##   https://www.ptt.cc/bbs/China-Drama/M.1550492467.A.B64.html   29    0
##   https://www.ptt.cc/bbs/China-Drama/M.1551700115.A.4A2.html   66    0
##   https://www.ptt.cc/bbs/China-Drama/M.1552300499.A.E89.html    8    0
##   https://www.ptt.cc/bbs/China-Drama/M.1552907104.A.FE1.html   17    0
##   https://www.ptt.cc/bbs/China-Drama/M.1553511885.A.21B.html   30    0
##   https://www.ptt.cc/bbs/China-Drama/M.1553854408.A.557.html   46    0
dim(drama_article_dtm)
## [1]  1450 43469

1-2:尋找看看最適當的主題數

drama_article_ldas = c()
topics = c(2,3,5,6,7)
for(topic in topics){
start_time <- Sys.time()
drama_article_lda <- LDA(drama_article_dtm, k = topic, control = list(seed = 123))
drama_article_ldas =c(drama_article_ldas,drama_article_lda)
print(paste(topic ,paste("topic(s) and use time is ", Sys.time() -start_time)))
save(drama_article_ldas,file = "drama_article_ldas_result")
}
## [1] "2 topic(s) and use time is  23.2824251651764"
## [1] "3 topic(s) and use time is  35.9583370685577"
## [1] "5 topic(s) and use time is  1.60461778243383"
## [1] "6 topic(s) and use time is  2.06127586364746"
## [1] "7 topic(s) and use time is  2.39275696277618"

載入每個主題的LDA結果

load("drama_article_ldas_result")

使用perplexith方式後,決定以5個主題數進行

topics = c(2,3,5,6,7)
data_frame(k = topics,
           perplex = map_dbl(drama_article_ldas, topicmodels::perplexity)) %>%
  ggplot(aes(k, perplex)) +
  geom_point() +
  geom_line() +
  labs(title = "Evaluating LDA topic_king models",
       subtitle = "Optimal number of topics (smaller is better)",
       x = "Number of topics",
       y = "Perplexity")
## Warning: `data_frame()` is deprecated, use `tibble()`.
## This warning is displayed once per session.

以擷取beta值作為特徵1~5

drama_article_lda = drama_article_ldas[[3]] ## 選定topic 為 5 的結果

drama_article_topics <- tidy(drama_article_lda, matrix = "beta") # 在tidy function裡面使用"beta"來取出Phi矩陣。

drama_article_topics
## # A tibble: 217,345 x 3
##    topic term      beta
##    <int> <chr>    <dbl>
##  1     1 瓔珞  1.05e- 3
##  2     2 瓔珞  1.72e- 2
##  3     3 瓔珞  3.68e- 4
##  4     4 瓔珞  5.03e-37
##  5     5 瓔珞  3.57e-15
##  6     1 如懿  1.02e- 2
##  7     2 如懿  4.67e- 3
##  8     3 如懿  6.65e- 4
##  9     4 如懿  2.73e- 2
## 10     5 如懿  8.30e- 5
## # ... with 217,335 more rows

1-3:設定主題

mycolors <- colorRampPalette(brewer.pal(8, "Set3"))(20)

drama_article_terms <- drama_article_topics %>%
  group_by(topic) %>%
  top_n(15, beta) %>%
  ungroup() %>%
  arrange(topic, -beta)
drama_article_terms %>%
  mutate(term = reorder(term, beta)) %>%
  ggplot(aes(term, beta, fill = factor(topic))) +
  geom_col(show.legend = FALSE) +
  scale_fill_manual(values = mycolors)+
  facet_wrap(~ topic, scales = "free") +
  coord_flip()

移除常出現、跨主題共同的詞彙

drama_remove_word = c("覺得","一個","皇上","皇后","真的","乾隆","喜歡","喜歡","最後","甄嬛","比較","如懿傳","皇帝","看到","劇情","應該","攻略","角色","知道","一直","如懿","華妃","感覺","已經","有點","","","","","","","","")
drama_article_terms <- drama_article_topics %>%
  filter(!term  %in% drama_remove_word , nchar(term)>1) %>%
  group_by(topic) %>%
  top_n(15, beta) %>%
  ungroup() %>%
  arrange(topic, -beta)
drama_article_terms %>%
  mutate(term = reorder(term, beta)) %>%
  ggplot(aes(term, beta, fill = factor(topic))) +
  geom_col(show.legend = FALSE) +
  scale_fill_manual(values=mycolors)+
  facet_wrap(~ topic, scales = "free") +
  coord_flip()

drama_article_terms %>% count(term, sort = TRUE)
## # A tibble: 65 x 2
##    term       n
##    <chr>  <int>
##  1 太后       3
##  2 小說       2
##  3 不知道     2
##  4 之後       2
##  5 周迅       2
##  6 阿哥       2
##  7 建華       2
##  8 貴人       2
##  9 演員       2
## 10 一下       1
## # ... with 55 more rows

去除各主題共同字後,命名5個主題為actor(演員)、Ruyi_drama(如懿傳)、news(周邊新聞)、Zhenhuan_drama(甄嬛傳)、role(角色)

drama_article_topic_name = c('topic_actor','topic_Ruyi_drama','topic_news','topic_Zhenhuan_drama','topic_role')
drama_article_tmResult <- posterior(drama_article_lda)
drama_article_pro <- drama_article_tmResult$topics 
dim(drama_article_pro)               # nDocs(DTM) distributions over K topics
## [1] 1450    5
# get document topic proportions 
drama_article_topics <- drama_article_pro[drama_article$artUrl,]
drama_article_topics_df = data.frame(drama_article_topics)
colnames(drama_article_topics_df) = drama_article_topic_name
rownames(drama_article_topics_df) = NULL
drama_article_new_topic = cbind(drama_article,drama_article_topics_df)
drama_article_new_topic %>% head(10)
##                                                        artUrl
## 1  https://www.ptt.cc/bbs/China-Drama/M.1415470292.A.575.html
## 2  https://www.ptt.cc/bbs/China-Drama/M.1417601811.A.2E6.html
## 3  https://www.ptt.cc/bbs/China-Drama/M.1417952654.A.D09.html
## 4  https://www.ptt.cc/bbs/China-Drama/M.1418565689.A.155.html
## 5  https://www.ptt.cc/bbs/China-Drama/M.1418915314.A.CFD.html
## 6  https://www.ptt.cc/bbs/China-Drama/M.1420720419.A.E44.html
## 7  https://www.ptt.cc/bbs/China-Drama/M.1420731308.A.B45.html
## 8  https://www.ptt.cc/bbs/China-Drama/M.1421261867.A.E45.html
## 9  https://www.ptt.cc/bbs/China-Drama/M.1421335264.A.BB7.html
## 10 https://www.ptt.cc/bbs/China-Drama/M.1422542563.A.690.html
##                                            artTitle    artDate  artTime
## 1   Re:[閒聊]蘭陵王-鄭兒跟後宮甄嬛傳-甄嬛的能力高低 2014-11-08 18:11:29
## 2                      [心得]如何訓練荷蘭人看甄嬛傳 2014-12-03 10:16:48
## 3                          [問題]關於步步驚心DVD 2014-12-07 11:44:08
## 4            [問題]甄嬛原聲帶(可以幫我看是哪一首嗎) 2014-12-14 14:01:27
## 5       [閒聊]美版甄嬛傳片頭華麗曝光即將登陸HBO播出 2014-12-18 15:08:28
## 6  [新聞]林<U+5CEF>張曉龍《陸小鳳與花滿樓》基情滿滿 2015-01-08 12:33:36
## 7                          [問題]步步驚心的某首配樂 2015-01-08 15:35:06
## 8                                  [閒聊]重看甄嬛傳 2015-01-14 18:57:45
## 9                   [閒聊]看了甄嬛再看其他古裝劇... 2015-01-15 15:20:59
## 10         [新聞]陳意涵新版若曦曝光!網友「鬼新娘」 2015-01-29 14:42:35
##       artPoster      artCat commentNum push boo
## 1      marcus40 China_Drama         23    8   0
## 2  sleepingbaby China_Drama         11    8   0
## 3     Dreamkids China_Drama         14    8   0
## 4       ckqueen China_Drama          1    1   0
## 5    chenyu4700 China_Drama         22   21   0
## 6       djdotut China_Drama         14   10   0
## 7       cv77811 China_Drama         19   12   0
## 8     pccu80825 China_Drama         32   13   0
## 9       jessieQ China_Drama        145   74   0
## 10    Dreamkids China_Drama         67   46   0
##                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                    sentence
## 1                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                             我也覺得這討論等級差太多\n\n我到想到一個跟甄嬛類似的角色\n\n那就是美人心計的竇漪房\n\n一樣都是小小地位爬到太后\n\n竇漪房甚至是太皇太后(甄嬛最久就是能太后 誰叫乾隆活那麼久)\n\n這兩部個人都覺得很經典\n\n也覺得這兩角色都是極具智慧的角色\n\n一樣的美人\n\n一樣一開始的單純\n\n到最後的都是能獨單一面的主角\n\n差別就是一個是死忠踏地的愛皇上\n\n一個就不是了\n\n只是比較起來竇漪房後宮對手其實不多\n\n但也是整部都沒冷掉的戲\n\n也很想跟大家討論\n\n如果今天竇漪房是甄嬛的角色\n\n會是什麼樣的結果\n\n這兩人的智勇 到底是哪位較高呢?\n\n\n\n
## 2  圖文好讀版:\nhttp://kitchuitaiwan.blogspot.nl/2014/11/blog-post_28.html\n<<原文於2014年11月11日刊登於云閱讀>>\n\n台灣瘋歐美劇的人不少,雖然東西方文化的差異甚大,但至少在我們包山包海的教育方\n式下,也讓我們對西方文化有著一定的接觸和認識;因此在看歐美劇時,至少對我個人\n而言,文化的衝擊不算太大。原本以為這種本土和世界文化史觀並重的教育體系是普世\n皆然的系統;然而和一些歐洲朋友閒聊後才發現,歹痔恩係 憨人想得那麼簡單!以我\n取得、不具統計效力的歐洲小樣本來說,在歷史地理兩個領域中,皆是以本國為主,再\n加上些許歐洲其它國家的簡單文史而已。其它和本國較無關的亞洲、美洲等等文史,對\n這些歐洲人來說,可以說是模糊的一大片(註一)。是以,在我的超隨便田野調查後,\n我突然發現自己好有世界觀哦!在台灣填鴨 式教育數十年的濡染之下,我可是具備了收\n看歐美劇無礙的另類出走能力哦!這可是真真切切的與國際無縫接軌呢!什麼都可以輸\n,就是看電視的能力不能不如人啊!\n\n  那麼對自以為身在世界中心卻只知歐洲文史,對於他國文史不甚了解的某些歐洲人\n來說,在觀看中國古代宮廷劇時,到底會不會產生文化障礙呢?於是作者我極具用心的\n找了個荷蕃來和蕃一下,邀我的荷蘭朋友一起觀看有無數矯情賤人的《後宮甄嬛傳》。\n像《冰與火之歌:權力遊戲》 那樣以歐洲中古世紀為背景的奇幻劇,老娘都可以看得津\n津有味了,叫個老外看個《甄嬛傳》,應該也不算過份吧!因此我千辛萬苦的幫他在網路\n上找到英文字幕,\再搭配我的不負責任解文化解說,就這樣慢慢的看,也從貴人看到\n莞嬪,再過幾天就要封妃了!而看影集時,我要解釋的內容,從三跪九叩的數字三和九\n怎麼來,到劇中所出現的各種花卉花語,我都得好好的解析一番。但在這樣強力的洗腦\n下,我朋友果然對中國文化有了深入的認識。像是他也想要每天有很多牌子可以翻啦!\n哪 裡他也可以買一台?鑾春恩車來接他的妃子們一起共渡春宵啦!最重要的是,他也學\n會說一兩句中文囉!\n\n  有一天他笑咪咪的看著我說:「我會講一句中文哦!」\n\n  「哦!真的嗎?快說來聽聽吧!」我欣慰的看著他說。\n\n  真不枉費我花那麼時間做即席口譯及文化解說;果然番邦之人仍是有可教之徒的!\n於是他開開心心的用著標準外國人腔的中文說了這麼一句:\n\n  「都起來吧!」\n\n  說完還興高采烈的問我這句是什麼意思!他接著很認真的說,因為劇中人一天到晚\n都在講這句話,所以他就自然而然的學起來了!唉!皇上,是這樣也沒錯;但是裡面的\n人也一天到晚都在叫「娘娘」啊?你怎麼就學不會叫我聲娘娘呢?\n\n我在荷蘭的台灣朋友,聽到我教該荷蘭友人看甄嬛傳後,火速送了前陣子在台灣紅到不\n行的「朕知道了」膠帶,當作他學會說「都起來吧!」的賀禮。收 到禮物的他,不但喜\n滋滋的把膠帶貼在行李箱上當裝飾,今年夏天就開開心心的拖著「朕知道了」出門去旅\n行;閒暇之餘,更是不斷的在我面前複習「都起來吧!」、「朕知道了」兩句話!弄得\n我跪安也不是,領旨也不是,一整個只想去碎月軒好好待著,閉門思過!\n\n  另外荷蘭語中,很有名而外國人不易學成的一個音素, ──小舌擦音 (uvular\nfricative),文雅的解釋,這個音叫「喉音」;講白了,就是吐痰時發的聲音!因此這\n位荷蘭皇帝常被我笑,說他講話一直吐痰是怎樣?有病就要去看醫生啊!而在我的長久\n訕笑之下,有天他在看甄嬛傳時,突然很開心的指著銀幕上猛翻白眼的華妃說:\n\n  「你聽聽看!華妃講話也有喉音啊!所以又不是只有我們荷蘭人講話會吐痰!你們\n講中文的也會啊!(註二)」\n\n  從此之後,只要華妃在銀幕上一開口,他就會在下面一直發吐痰音以示找到知已,\n還敦促我快練習荷文裡的吐痰音,還很有信心的鼓勵我:華妃行,你也行的!待華妃一\n頭撞死後,更是無限惋惜的表示,再也聽不到華妃親切的鄉音,真是太可惜了!\n\n  在我的苦心栽培之下,我造就了一個只會說「你好」、「朕知道了」和「都起來吧\n!」,而且天天想翻牌子兼叫我一直吐痰的荷蘭人;但這位荷蘭皇帝也 藉由觀看甄嬛傳\n,觀察到中國/台灣文化中許多異於西方文化之處。舉例來說,戲中人常以隱喻、譬喻\n法來對話,對向來講話直白的荷蘭人來說,常搞不清楚話裡真 正的涵意。所以他常常看\n一半就問我:為什麼現在又在講花呢?為什麼又在講歷史故事呢?在諸多解釋後,他終\n於明白劇中人的說話哲學與藝術。現在只要看到皇帝 要以政事詢問甄嬛意見時,他馬\n上就會說:又要以古諷今了厚!只可惜,在現實生活中,他仍是不改荷蘭人說話直\n白(目)特色,像是一見面就立馬指著我的新褲子說:\n\n  「你今天穿這條褲子,看起來腿很粗說!」\n\n  「看起來腿很粗說!」\n  「看起來腿很粗說!」\n  「看起來腿很粗說!」\n  「看起來腿很粗說!」\n\n  此外,像是我們會因身份地位的不同,而對他人有不同的稱謂;譬如,天子雖為全\n國地位最尊貴的人,但天子的父母,在某方面來說,地位仍是凌駕於天子之上,故所有\n的人都要尊稱天子為「皇上」,只有太后能使用「皇帝」這個稱謂。光是這樣稱謂的不\n同,讓他得以對傳統中國/台灣社會中的君臣階級制度和家族模式,有了更深入的理解\n,也比較能夠感同身受,身為一個台灣人,身上所承受的家庭期待和壓力。\n\n  總結的來說,我所遇到的歐洲人,大部份都對東方文化所知有限;因此若要讓他們\n看歷史宮廷戲時,一般而言,都需要大量的解說並輔以優質的翻譯,才 能夠讓他們真\n正的理解劇中內容,難度比我們看歐美劇時大上許多,但並非不可能之事!雖說以電視\n劇作文化教材是有許多可議之處,但若純粹以文化交流的角度來 說,倒也不失為一個\n輕鬆而有趣的方式。台灣人瘋歐美日韓劇多年,那麼,什麼時候,台灣也能拍出自己的\n通俗代表作,與各國和蕃一下,讓其它國家的人更了解台 灣文化,在遇到台灣人時,\n都能說上一句:「呷飽沒?」而不是只會問我們:\n\n  「你說你是泰國人?」\n  「你們吃狗肉厚?」\n\n\n    作者註一:我也曾遇過許多上知天文下知地理的歐洲朋友;他們不但知道中國和台\n       灣在現今的微妙關係,連蔣介石和國共內戰的歷史都說得比我清楚。但\n       這類的朋友,多半是因自己興趣而自行鑽研這方面的知識,絕大多數非\n       從高中以前的正統教育體系裡習得的。\n\n    作者註二:像是「很好」的「很」:如果發ㄏ音時,不只是發氣音,連喉頭聲帶一\n       起震動,發出吐痰一樣聲音,就是小舌擦音。一般而言,台灣人要發這\n       個音 並不會太困難,只是在中文裡,兩種發音並不用來區別字義,只是\n       口音或個人說話方式上的變化而己。但在荷文裡,則具有區別字義的作\n       用。有興趣的讀者,可參考 維基中的解釋(荷文中的g發音、喉音)\n\n  此外,像是我們會因身份地位的不同,而對他人有不同的稱謂;譬如,天子雖為全國\n地位最尊貴的人,但天子的父母,在某方面來說,地位仍是凌駕於天子之上,故所有的人\n都要尊稱天子為「皇上」,只有太后能使用「皇帝」這個稱謂。光是這樣稱謂的不同,讓\n他得以對傳統中國/台灣社會中的君臣階級制度和家族模式,有了更深入的理解,也比較\n能夠感同身受,身為一個台灣人,身上所承受的家庭期待和壓力。\n\n  總結的來說,我所遇到的歐洲人,大部份都對東方文化所知有限;因此若要讓他們看\n歷史宮廷戲時,一般而言,都需要大量的解說並輔以優質的翻譯,才 能夠讓他們真正的\n理解劇中內容,難度比我們看歐美劇時大上許多,但並非不可能之事!雖說以電視劇作文\n化教材是有許多可議之處,但若純粹以文化交流的角度來 說,倒也不失為一個輕鬆而有\n趣的方式。台灣人瘋歐美日韓劇多年,那麼,什麼時候,台灣也能拍出自己的通俗代表作\n,與各國和蕃一下,讓其它國家的人更了解台 灣文化,在遇到台灣人時,都能說上一句\n:「呷飽沒?」而不是只會問我們:\n\n  「你說你是泰國人?」\n  「你們吃狗肉厚?」\n\n\n    作者註一:我也曾遇過許多上知天文下知地理的歐洲朋友;他們不但知道中國和台灣\n在現今的微妙關係,連蔣介石和國共內戰的歷史都說得比我清楚。但這類的朋友,多半是\n因自己興趣而自行鑽研這方面的知識,絕大多數非從高中以前的正統教育體系裡習得的。\n\n    作者註二:像是「很好」的「很」:如果發ㄏ音時,不只是發氣音,連喉頭聲帶一起\n震動,發出吐痰一樣聲音,就是小舌擦音。一般而言,台灣人要發這個音 並不會太困難\n,只是在中文裡,兩種發音並不用來區別字義,只是口音或個人說話方式上的變化而己。\n但在荷文裡,則具有區別字義的作用。有興趣的讀者,可參考 維基中的解釋(荷文中的g\n發音、喉音)\n\nKiTchui: FB\nhttps://www.facebook.com/KiTchui88\n部落格:\nhttp://kitchuitaiwan.blogspot.nl/
## 3                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                              呵呵 先直接進入正題\n\n目前線上搜尋步步驚心的DVD\n從博客來那邊發現有兩個版本\n步步驚心8DVD\nhttp://ppt.cc/sAWj\n步步驚心 [典藏裝] 8DVD\nhttp://ppt.cc/UZ-5\n從介紹看來並沒有說明兩版本的差異\n但價格相差將近兩倍\n典藏價格約九百 發行日期是今年9月(?!)\n爬完文有提到繁體版畫質不好\n不知道是針對哪個版本 還是其實都不好...?\n藍光版的部分?\n爬了文但還是一知半解,\n中國版金裝版買有點複雜,但畫質真的有差很多嗎?\n
## 4                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                        雖然過了很久,但是還是很想知道答案\n\n請問甄嬛傳65集,浣碧要結婚時\n\n禧貴妃幫她蓋頭巾\n\n到她上轎子那一段的音樂是原聲帶裡的哪一首??\n\n找好久都找不到\n\n\n不好意思 因為不知道會不會違反版規,就沒放連結了\n如果有人剛好知道能告訴我嗎??\n謝謝\n\n\n
## 5                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                     http://www.weibo.com/1820114225/BBpoMfses?type=comment\n@美劇貼吧: 【美版《甄嬛傳》片頭華麗曝光 即將登陸HBO播出!】此次甄嬛劇組聯合HBO\n電視臺將原版76集的電視劇剪輯成6集的電視電影(每集時長90分鐘)是啟用了好萊塢著名\n導演和音樂制作人來操刀,如今看這發布的美版片頭確實別有一番風味,孫儷的這股娘娘\n風能順利刮翻老美嗎?\n\n視頻: 美版甄嬛傳即將上映 OP曲風婉轉凄美盡顯嬛嬛柔情\nhttp://v.youku.com/v_show/id_XODUwMDIxODQ4.html\nOP是歌劇風格 我覺得挺好聽的\n視頻中有補拍的鏡頭 還有很高大上的CG\n跟陸劇普遍的5毛特效一點都不一樣 有錢真好!\n話說6集每集90分鐘......能講多少內容啊?\n無論如何都好期待 雖然講英文一定很奇怪^_^\n
## 6                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                林<U+5CEF>張曉龍《陸小鳳與花滿樓》基情滿滿\n2015年01月08日00:02   新浪娛樂\n\n  新浪娛樂訊 首部3D武俠劇《陸小鳳與花滿樓》1月10日登陸深圳衛視黃金劇場,\n1月7日,導演潘文杰攜主演林<U+5CEF>、張曉龍、張檬、鄭則仕等現身深圳,為新劇開播造\n勢。在劇中,陸小鳳和花滿樓被塑造成是東方的卷福與華生,基情滿滿,連女主角張\n檬也抱怨自己成了第三者,林<U+5CEF>和張曉龍飾演的陸小鳳與花滿樓才是真愛。\n\n  林<U+5CEF>:不敢稱“最帥陸小鳳”\n\n  在《陸小鳳與花滿樓》之前,以往的影視作品中也有不少經典陸小鳳形象,但林\n<U+5CEF>坦言,他“都沒看過”。在林<U+5CEF>看來,觀眾把他的表演跟其他演員對比是不可避免\n的,但他自己並不介意,“有對比很好,只要大家關注我們這部作品就夠了。”對於\n網友“史上最帥陸小鳳”的封號,林<U+5CEF>連說“不可以這麼說”。在林<U+5CEF>看來:“每位\n演員都有自己出彩的地方,最重要是角色的表演能符合戲的要求,總之觀眾看的時候\n投入就行。”\n\n  戲裡,陸小鳳與花滿樓合作破案非常默契,林<U+5CEF>表示,戲外他跟張曉龍也是惺惺\n相惜,“這是我們第一次合作,但完全不需要磨合,合作非常愉快。”林<U+5CEF>笑稱,跟\n張曉龍合作,他的家人比他更高興,“張曉龍是我堂妹的老師,他同時還是我爸爸媽\n媽的偶像,我爸媽一直很迷溫太醫,聽說我跟張老師合作,他們找借口來探班,但不\n是來看我的,目的是去看溫太醫。”\n\n  劇中,林<U+5CEF>有不少打戲,在他看來,最難的不是吊威亞,而是粘假鬍子,“粘了\n鬍子再拍打戲,其實是一門功夫。而且,我一笑的時候鬍子就會掉,所以陸小鳳鬍子\n整天掉,常常要補妝、重新粘鬍子。”\n\n  去年的《使徒行者》被認為是林<U+5CEF>轉型最成功的作品,林<U+5CEF>透露,自己拍了多年\n港劇,面對的都是家庭觀眾,“未來希望在電影方面能有更多突破,畢竟電影的受眾\n跟電視是不同的。”對於粉絲和媒體關心的婚事,林<U+5CEF>不願多談,“現在工作正是拼\n命的時候,人生各方面都需要拼。謝謝大家關心,但我除了工作之外,也很需要私人\n空間。”\n\n  “花滿樓”張曉龍:演盲人真的好難\n\n  扮演“花滿樓”的張曉龍則表示,自己一直很迷古龍小說,“每個男人都有一個\n武俠夢,這次能演武俠劇,也算圓了我的夢。”第一次拍武俠劇,張曉龍卻因為太興\n奮傷了腰,“我有舞蹈功底,所以我覺得自己拍打戲也能打得好看,加上我這個人不\n經誇,大家都說我打得好看,我就什麼戲都不用替身,結果是把自己打殘廢了。”張\n曉龍透露,拍完《陸小鳳與花滿樓》,自己很長一段時間都在用於治療腰傷,“那時\n大概只能站10分鐘就要休息,要不腰受不了。”\n\n  《甄嬛傳》後,《陸小鳳與花滿樓》是張曉龍第三次扮演醫生,而且這位醫生還\n是盲人。談到演盲人的難度,張曉龍表示,自己花了很多時間揣摩視覺無焦點的感覺\n,“真的很難,尤其是我們這是部武俠劇,刀光劍影之間導演常常喊‘<U+5494>’,因為我\n的眼神不自覺地就跟盲人不同了。”\n\n  除了演員這個身份外,張曉龍還是不少古裝劇的禮儀指導。談到現在電視上的古\n裝劇,張曉龍說自己也常常有不少“看不慣”的時候,“但是我後來寬慰自己,只當\n一個純粹的觀眾,娛樂就好。”說起熱播的《武媚娘傳奇》,張曉龍透露:“當時那\n部電視劇邀請我當禮儀指導,但我抽不出時間,就推薦我的學生去給他們把關。不過\n看劇的時候我也批評了學生,她有些地方做不好,當然我也理解她的難處。”如今《\n武媚娘傳奇》變成“大頭劇”,張曉龍認為按照要求做改動是必要的,“能屈能伸嘛\n,觀眾能看到劇、不影響劇情就行了。”\n\n  張檬:我是女版都敏俊\n\n  劇中,張檬飾演的阿信是新加入的虛構角色,張檬介紹說:“這個角色雖然是個\n古代的俠女,但性格卻融合了現代女孩兒的一些個性,這種衝突的設置讓這個人物很\n有意思,相信會有很多人到時候會愛上這個角色”。阿信這個角色擁有“天眼神通”\n這一特殊技能,張檬透露,她見到陸小鳳的第一眼就向對方表白,“你是我未來孩子\n的爹,我必須要跟著你”。這個大膽的表白讓陸小鳳嚇壞的,林<U+5CEF>在一旁笑說:“陸\n小鳳當時覺得這個女孩有問題吧。”\n\n  在認定了陸小鳳之後,阿信就一直跟隨在他身邊,張檬覺得,這個角色就像陸小\n鳳身邊“女版都敏俊”,“只要他需要、只要覺察出陸小鳳有困難,我馬上就會出現\n、幫助他。”\n\n  對於跟兩位男主角的配戲,張檬說自己更喜歡<U+5CEF>哥,“因為他其實是一個很好玩\n的人,還和我一樣喜歡吃零嘴,他的包包裡總能翻出數不清的零食,巧克力、餅乾、\n棒棒糖什麼的應有盡有,剛開始讓我驚呆了,而且他很照顧人很細心,每次拍打戲,\n只要一停下來他就會問其他人怎麼樣?有沒有碰疼你?對我也一樣,還會主動提前跟\n我套招。”說起張曉龍,張檬用“暖男”來形容對方,“但這款男人並不是我的菜”。\n\n  劇情很基 陸小鳳最愛花滿樓?\n\n  《陸小鳳與花滿樓》改編自古龍經典武俠小說《陸小鳳傳奇之大金鵬王》,主要\n講述古老且被遺忘的國度金鵬王朝,因陸小鳳調查中原皇帝怪病再次進入到人們的視\n線中,經過萬重難關之後陸小鳳解開謎團阻止陰謀發生。\n\n  劇中,陸小鳳與花滿樓堪稱“東方雙俠”、又有人說是東方的卷福與華生,他們\n攜手偵破懸疑案件。兩人一動一靜、一風流一儒雅的相處模式是怎樣的?林<U+5CEF>笑說:\n“要說真愛的話,可能陸小鳳跟花滿樓才是真愛,因為他們每天形影不離。”林<U+5CEF>解\n釋說,因為張曉龍演的是盲人,所以他常常要拉著花滿樓,“兩個男人感情很好,還\n拉拉扯扯的,你們自己想吧!哈哈。”就連女主角也看不過眼了——張檬就說:“在\n戲裡,我覺得我是一個第三者,因為陸小鳳和花滿樓他們兩個實在太膩歪了,我覺得\n他們倆才是一對,只有在有限的時間裡,陸小鳳才會來找我。”\n\n  3D特效增強視覺美感\n\n  《陸小鳳與花滿樓》由香港金像獎導演潘文杰執導。《陸小鳳與花滿樓》最大的\n創新在於加入了大量的奇幻元素,古龍對作品時空背景的大量留白給了奇幻元素巨大\n的設置空間,特效團隊採用3D實景合成技術,特效鏡頭總數高達一萬三千個。全劇後\n期製作歷時長達16個月。\n\n  據悉,該劇力邀《臥虎藏龍》的原班人馬為該劇全程製作後期特效,為了將古龍\n筆下魔幻世界的精髓更加完美呈現在觀眾面,前後歷時18個月才宣布完工的特效周期\n,數次刷新電視劇行業的後期製作記錄。說到跟電腦合成畫面一起合作的經歷,張曉\n龍笑說,幸好自己演的是盲人,不需要跟電腦特技畫面合作,“反正我也看不到,但\n其他演員就要充分發揮想像才能演好了。”符康林/文\n\n(責編: Soul Food)\n\n==\n\n本篇新聞全文轉錄自新浪娛樂網站\n\n新聞原文網址如下\nhttp://ent.sina.com.cn/v/m/2015-01-08/doc-icczmvun4786663.shtml\n視頻:《陸小鳳與花滿樓》片花展奇幻夢境\nhttp://video.sina.com.cn/p/ent/v/m/2015-01-07/110964480599.html
## 7                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                          最近在電視看到步步驚心的手機遊戲廣告\n放的那首配樂突然勾起了一些當時看得感動= =+\n然後就去把原聲帶找出來聽\n可是聽來聽去就是沒聽到廣告裡放的那首配樂\n可是我記得戲劇裡有出現啊\n請問有大大知道知道這首配樂叫什麼名字嗎~?\n謝謝\n
## 8                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                       最近又看了一次\n在羋月傳出來之前還會繼續重看吧\n突然想到\n甄嬛用最後一胎想扳倒皇后的計劃\n端,敬二人到底知道不知道呢?\n\n因為流程是\n端敬進去,皇后進去,甄嬛喝完墮胎藥進去\n端敬離開,甄嬛糾纏皇后假摔,墮胎藥生效,小產\n\n但是這個計畫很容易失敗\n要是端敬不知道這個計畫而待在裡面沒出去\n就會變成甄嬛演的戲有大破洞\n糟的話會變成甄嬛在裡面掛完福袋莫名流產\n\n不過劇中看不出來他們兩個只不知道這個計畫\n而刻意讓甄嬛與皇后獨處\n\n\n不過這個計畫感覺差點會失敗\n要不是公主指證的話\n皇上的眼神感覺已經有在懷疑了…這真是險招\n
## 9                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                 其實我看過的也不多啦,前後也就三四部而已\n不過我個人看連續劇除了衣著布景以外更喜歡看細節\n一開始看步步驚心覺得女主角滿機車的但是還不錯看\n\n看了甄嬛傳以後…\n發現別齣有越來越看不下去的趨勢QQ\n甄嬛傳不管是衣著、言行舉止、小動作都很到位啊!\n搞得我每次一開始看別齣就會拿來跟甄嬛傳比\n\n甄嬛的每個動作都有考究過,不會莫名出現很現代很突兀的畫面\n看武媚娘某一集好像看到武才人比個OK還是讚之類的\n瞬間很出戲…\n而且講到長孫皇后的時候,他哥哥居然說:舍妹…\n正常來說不是當了皇后就不同階級了嗎?他這樣說沒有僭越嗎><\n還是當時的風氣沒有那麼嚴謹?\n還有瑞安為什麼叫武才人老是叫姐姐?不是應該叫才人嗎?\n\n這些情況看甄嬛都不會出現\n而且甄嬛裡的小手段真的不是一眼就能看出來的,很多都很細膩刁鑽\n不像武媚娘裡的一出事→大概猜到結果→立馬會有人出來解說\n跟旁白一樣…\n\n看完甄嬛真的像跟劇中人物走過一遍\n最後當上皇太后,身邊愛的人卻都不在了,那幾幕真的滄海桑田、物是人非…\n心裡會惆悵很久\n\n好想再重看一次,但是我已經看六次了 QQ\n有跟甄嬛一樣好看的古裝劇嗎><\n—\n想請問一下大家,有人知道武媚娘的時間軸嗎?\n現在看到第25集\n前幾集雉奴騎那匹馬發瘋被武媚娘舊的時候還是小孩\n怎麼突然到25集騎射時候就長大了?
## 10                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                 蘋果日報\n\n2015年01月29日13:01\n\n\n紅透兩岸的古裝穿越劇《步步驚心》電影版《新步步驚心》,自從宣布拍攝以來,除女主角由陳意涵取代劉詩詩演若曦外,一直蒙上神秘色彩。今電影公司首度發布先行預告片及概念海報,有別電視劇充滿奇幻童話風,竟還出現旋轉木馬!\n\n據新浪娛樂,陳意涵的新版若曦造型在預告中曝光,身穿桃紅色改良式旗袍,下擺是粉紅蕾絲裙,在紫禁城中奔跑。劇組表示,希望在1711年清朝背景中融入更多歐洲風格,想給觀眾帶來更新鮮、更年輕的「自由感覺」。\n\n電影版《步步》雖帶來新意,但大部分死忠「步步迷」卻不買帳,紛紛唱衰「劉詩詩演的成為了經典,無法超越」、「一臉古裝女配的樣子」、「是鬼新娘嗎,好好的虐心片變恐怖片」;不過也有人表示「期待陳意涵的電影版」。《新步步驚心》已於1月<U+987A>利殺青,將在下半年上映。(李彥初/綜合報導)\nhttp://ppt.cc/tZet\n(hopeblue 刪除 levi97 的推文: 板規8.1)\n(hopeblue 刪除 levi97 的推文: 板規8.1)\n(hopeblue 刪除 levi97 的推文: 板規8.1)\n(hopeblue 刪除 levi97 的推文: 板規8.1)
##     topic_actor topic_Ruyi_drama   topic_news topic_Zhenhuan_drama   topic_role
## 1  7.531301e-01     5.586363e-04 0.0005586363         5.586363e-04 2.451940e-01
## 2  3.708897e-05     3.708897e-05 0.2882847132         6.762377e-01 3.540337e-02
## 3  9.974733e-01     6.316687e-04 0.0006316687         6.316687e-04 6.316687e-04
## 4  7.028533e-01     1.012060e-03 0.0010120599         1.012060e-03 2.941105e-01
## 5  4.147711e-04     4.147711e-04 0.5128925514         4.147711e-04 4.858631e-01
## 6  2.973744e-02     4.509354e-05 0.9701272841         4.509354e-05 4.509354e-05
## 7  9.957281e-01     1.067985e-03 0.0010679852         1.067985e-03 1.067985e-03
## 8  4.484558e-04     4.484558e-04 0.0004484558         4.484558e-04 9.982062e-01
## 9  3.891568e-01     2.443459e-04 0.0002443459         2.443459e-04 6.101102e-01
## 10 2.590859e-04     2.590859e-04 0.9989636563         2.590859e-04 2.590859e-04
# news_topic %>% head(10)

2.特徵: 發文詞長度

drama_article_count_by_art <- drama_article_tokens %>% 
  group_by(artUrl) %>%
  count() %>% 
  mutate(artLength = n) %>%
  select(-n)

3.其他特徵:情緒分析,以LIWC字典,整理發文情緒

3-1準備情緒字典、角色字典

#正向字典txt檔
P <- read_file("D:/OC Learn/NSYSU/Social Media Analysis/Final Paper/Final_report_group7/dict/positive.txt")
# 負向字典txt檔
N <- read_file("D:/OC Learn/NSYSU/Social Media Analysis/Final Paper/Final_report_group7/dict/negative.txt")
P = strsplit(P, ",")[[1]]
N = strsplit(N, ",")[[1]]
# 建立dataframe 有兩個欄位word,sentiments,word欄位內容是字典向量
P = data.frame(word = P, sentiment = "positive")
N = data.frame(word = N, sentiment = "negative")
LIWC = rbind(P, N)

role <- read_file("D:/OC Learn/NSYSU/Social Media Analysis/Final Paper/Final_report_group7/dict/role.txt")
role = strsplit(role, ",")[[1]]
role = data.frame(word = role)

3-2資料整理: 合併情緒分析(每篇文章正面情緒/負面情緒)、發文長度

drama_article_sentiment <- drama_article_tokens %>%
    inner_join(LIWC) %>%
    group_by(artUrl , sentiment) %>%
    count() %>%
    ungroup() %>%
    spread( sentiment , n , fill=0) %>%
    mutate( sentiment = positive + negative)
## Joining, by = "word"
## Warning: Column `word` joining character vector and factor, coercing into
## character vector
Join_wordcount_sentiment <- drama_article_count_by_art %>%
  
  left_join(drama_article_sentiment )
## Joining, by = "artUrl"
Join_wordcount_sentiment[is.na(Join_wordcount_sentiment)] <- 0

3-3資料整理:合併角色出現個數與前二項特徵

drama_article_role_count <- drama_article_words %>%
  inner_join(role) %>%
  select(artUrl,word) %>%
  group_by(artUrl ) %>%
  count() %>% 
  mutate(role_count = n) %>%
  select(-n) %>%
  mutate(role_count = ifelse(is.na(role_count), 0 ,role_count))
## Joining, by = "word"
## Warning: Column `word` joining character vector and factor, coercing into
## character vector
Join_wordcount_sentiment_role <- Join_wordcount_sentiment %>%
  
  left_join(drama_article_role_count )
## Joining, by = "artUrl"
Join_wordcount_sentiment_role[is.na(Join_wordcount_sentiment_role)] <- 0

3-4資料處理:合併前幾項特徵

feature_data <- drama_article_new_topic %>%
  
  left_join(Join_wordcount_sentiment_role )
## Joining, by = "artUrl"

3-5將發文討論版(China Drama、Women Talk、Gossiping)以one-hot encoding方式轉換

new_feature_data <- feature_data %>%
  
  mutate( n = 1) %>%
  
  spread(artCat , n , fill = 0) %>%
  
  select(-artUrl,-artTitle,-artDate ,-artPoster,-sentence)

3-6將發文時段以每小時為切割,並以one-hot encoding 轉換

new_feature_data_post <- new_feature_data %>%
  mutate(arthour = as.numeric(format(strptime(artTime,"%H:%M:%S"),'%H'))) %>%
  mutate(n = 1) %>%
  spread(arthour,n,fill=0) %>%
  select(-artTime)
colnames(new_feature_data_post)[40] <- "twenty_three"
colnames(new_feature_data_post)[39] <- "twenty_two"
colnames(new_feature_data_post)[38] <- "twenty_one"
colnames(new_feature_data_post)[37] <- "twenty"
colnames(new_feature_data_post)[36] <- "Nineteen"
colnames(new_feature_data_post)[35] <- "eighteen"
colnames(new_feature_data_post)[34] <- "seventeen"
colnames(new_feature_data_post)[33] <- "sixteen"
colnames(new_feature_data_post)[32] <- "fifteen"
colnames(new_feature_data_post)[31] <- "fourteen"
colnames(new_feature_data_post)[30] <- "thirteen"
colnames(new_feature_data_post)[29] <- "twelve"
colnames(new_feature_data_post)[28] <- "eleven"
colnames(new_feature_data_post)[27] <- "ten"
colnames(new_feature_data_post)[26] <- "nine"
colnames(new_feature_data_post)[25] <- "eight"
colnames(new_feature_data_post)[24] <- "seven"
colnames(new_feature_data_post)[23] <- "six"
colnames(new_feature_data_post)[22] <- "five"
colnames(new_feature_data_post)[21] <- "four"
colnames(new_feature_data_post)[20] <- "three"
colnames(new_feature_data_post)[19] <- "two"
colnames(new_feature_data_post)[18] <- "one"
colnames(new_feature_data_post)[17] <- "zero"

#四、模型建立:

1.資料標準化:將各特徵值進行標準化,以避免各屬性不同數值的影響

normalization<-function(x){
return((x-min(x))/(max(x)-min(x)))[1]
}

new_feature_data_nor <- new_feature_data_post %>%
  mutate(commentNum = normalization(new_feature_data_post$commentNum)) %>%
  mutate(push = normalization(new_feature_data_post$push)) %>%
  mutate(boo = normalization(new_feature_data_post$boo)) %>%
  mutate(topic_actor = normalization(new_feature_data_post$topic_actor)) %>%
  mutate(topic_Ruyi_drama = normalization(new_feature_data_post$topic_Ruyi_drama)) %>%
  mutate(topic_news = normalization(new_feature_data_post$topic_news)) %>%
  mutate(topic_Zhenhuan_drama = normalization(new_feature_data_post$topic_Zhenhuan_drama)) %>%
  mutate(topic_role = normalization(new_feature_data_post$topic_role)) %>%
  mutate(artLength = normalization(new_feature_data_post$artLength)) %>%
  mutate(positive = normalization(new_feature_data_post$positive)) %>%
  mutate(negative = normalization(new_feature_data_post$negative)) %>%
  mutate(sentiment = normalization(new_feature_data_post$sentiment)) %>%
  mutate(role_count = normalization(new_feature_data_post$role_count))

2.將資料以7:3比例切割為訓練集、測試集

set.seed(666)
spl = sample.split(new_feature_data_nor, 0.7) #以7:3將原始資料分割成訓練集與測試集
Train_nor = subset(new_feature_data_nor, spl == TRUE)
Test_nor = subset(new_feature_data_nor, spl == FALSE)

Train = subset(new_feature_data_post, spl == TRUE)
Test = subset(new_feature_data_post, spl == FALSE)

3.將資料進行線性轉換

建立線性模型轉換器

Train_nor_t = predict_lm_transformer(Train_nor,"commentNum", train_lm_transformer)    ##---------------Convert training data
Train_nor_t = as.data.frame(Train_nor_t)
Train_nor_t$commentNum = Train_nor$commentNum

Test_nor_t = predict_lm_transformer(Test_nor, "commentNum", train_lm_transformer)     ##---------------Convert testing data
Test_nor_t = as.data.frame(Test_nor_t)
Test_nor_t$commentNum = Test_nor$commentNum

4.以Forward Selection方式,進行特徵選取

4-1:以Forward Selection方式選取出的模型

summary( lm(formula = commentNum ~ push + topic_Zhenhuan_drama + WomenTalk + 
    topic_role + role_count + boo + negative + twenty_three + 
    eleven + topic_news + twelve + fourteen + push:WomenTalk + 
    push:topic_role + topic_Zhenhuan_drama:role_count + push:boo + 
    push:role_count + push:negative + topic_Zhenhuan_drama:negative + 
    role_count:negative + push:topic_Zhenhuan_drama + push:twenty_three + 
    topic_Zhenhuan_drama:WomenTalk + negative:eleven + push:eleven + 
    topic_Zhenhuan_drama:eleven + topic_Zhenhuan_drama:topic_role + 
    topic_role:role_count + push:topic_news + negative:twelve + 
    push:twelve + boo:twelve + push:fourteen + boo:fourteen + 
    role_count:eleven + negative:topic_news + role_count:twenty_three + 
    negative:twenty_three + topic_role:twenty_three + twenty_three:topic_news, 
    data = Train_nor_t) )
## 
## Call:
## lm(formula = commentNum ~ push + topic_Zhenhuan_drama + WomenTalk + 
##     topic_role + role_count + boo + negative + twenty_three + 
##     eleven + topic_news + twelve + fourteen + push:WomenTalk + 
##     push:topic_role + topic_Zhenhuan_drama:role_count + push:boo + 
##     push:role_count + push:negative + topic_Zhenhuan_drama:negative + 
##     role_count:negative + push:topic_Zhenhuan_drama + push:twenty_three + 
##     topic_Zhenhuan_drama:WomenTalk + negative:eleven + push:eleven + 
##     topic_Zhenhuan_drama:eleven + topic_Zhenhuan_drama:topic_role + 
##     topic_role:role_count + push:topic_news + negative:twelve + 
##     push:twelve + boo:twelve + push:fourteen + boo:fourteen + 
##     role_count:eleven + negative:topic_news + role_count:twenty_three + 
##     negative:twenty_three + topic_role:twenty_three + twenty_three:topic_news, 
##     data = Train_nor_t)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -0.16571 -0.01085 -0.00170  0.00721  0.33302 
## 
## Coefficients:
##                                   Estimate Std. Error t value Pr(>|t|)    
## (Intercept)                       -7.33243    2.77406  -2.643 0.008344 ** 
## push                              -9.25366    1.35763  -6.816 1.64e-11 ***
## topic_Zhenhuan_drama             -23.52848   24.32105  -0.967 0.333578    
## WomenTalk                        -14.92644   22.50255  -0.663 0.507281    
## topic_role                         5.73346    9.60107   0.597 0.550533    
## role_count                        13.48069    5.44897   2.474 0.013531 *  
## boo                               95.93240   26.80523   3.579 0.000362 ***
## negative                          -9.30962    3.60405  -2.583 0.009937 ** 
## twenty_three                      23.61190    9.49366   2.487 0.013045 *  
## eleven                             0.08651    0.70890   0.122 0.902902    
## topic_news                         6.36658    5.38421   1.182 0.237315    
## twelve                            28.88891    9.95489   2.902 0.003792 ** 
## fourteen                          73.73791   25.44621   2.898 0.003842 ** 
## push:WomenTalk                    95.79625   17.91076   5.349 1.11e-07 ***
## push:topic_role                   -6.14381    2.82304  -2.176 0.029772 *  
## topic_Zhenhuan_drama:role_count   -1.87473    4.50333  -0.416 0.677283    
## push:boo                          41.78059    7.77049   5.377 9.49e-08 ***
## push:role_count                   -3.34930    0.78934  -4.243 2.41e-05 ***
## push:negative                      3.11657    0.44027   7.079 2.78e-12 ***
## topic_Zhenhuan_drama:negative     -4.78101    4.10586  -1.164 0.244533    
## role_count:negative               -3.34599    0.87647  -3.818 0.000143 ***
## push:topic_Zhenhuan_drama         -0.34987    1.64352  -0.213 0.831469    
## push:twenty_three                 26.23264    6.23843   4.205 2.85e-05 ***
## topic_Zhenhuan_drama:WomenTalk   183.45420  309.80559   0.592 0.553881    
## negative:eleven                   -3.76606    5.96072  -0.632 0.527657    
## push:eleven                       -4.62255    0.64868  -7.126 2.01e-12 ***
## topic_Zhenhuan_drama:eleven       -1.08977   10.80980  -0.101 0.919719    
## topic_Zhenhuan_drama:topic_role  128.88147   84.81841   1.519 0.128962    
## topic_role:role_count             -7.60945   17.37927  -0.438 0.661595    
## push:topic_news                   -1.06579    1.36647  -0.780 0.435602    
## negative:twelve                   -5.67296    5.40869  -1.049 0.294503    
## push:twelve                       -7.73747    1.38017  -5.606 2.69e-08 ***
## boo:twelve                      -369.29834  131.79108  -2.802 0.005177 ** 
## push:fourteen                     -7.13318    2.02825  -3.517 0.000457 ***
## boo:fourteen                    -965.73269  334.09067  -2.891 0.003930 ** 
## role_count:eleven                  6.14990    7.32482   0.840 0.401340    
## negative:topic_news               12.14253    6.31716   1.922 0.054878 .  
## role_count:twenty_three         -169.76138   70.03719  -2.424 0.015537 *  
## negative:twenty_three            129.05136   46.65601   2.766 0.005782 ** 
## topic_role:twenty_three         -197.74501   99.04094  -1.997 0.046147 *  
## twenty_three:topic_news          -92.94948   70.85813  -1.312 0.189907    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.02997 on 974 degrees of freedom
## Multiple R-squared:  0.9088, Adjusted R-squared:  0.905 
## F-statistic: 242.5 on 40 and 974 DF,  p-value: < 2.2e-16

4-2:將模型只留下顯著的變數

summary( lm(formula = commentNum ~ push + WomenTalk + 
    role_count + boo + negative + twenty_three + 
    eleven + twelve + fourteen + push:WomenTalk + 
    push:topic_role + topic_Zhenhuan_drama:role_count + push:boo + 
    push:role_count + push:negative + topic_Zhenhuan_drama:negative + 
    role_count:negative + push:topic_Zhenhuan_drama + push:twenty_three + 
    topic_Zhenhuan_drama:WomenTalk + negative:eleven + push:eleven + 
    topic_Zhenhuan_drama:eleven + topic_Zhenhuan_drama:topic_role +
    push:topic_news + negative:twelve + 
    push:twelve + boo:twelve + push:fourteen + boo:fourteen + 
    role_count:twenty_three + 
    negative:twenty_three + topic_role:twenty_three , 
    data = Train_nor_t) )
## 
## Call:
## lm(formula = commentNum ~ push + WomenTalk + role_count + boo + 
##     negative + twenty_three + eleven + twelve + fourteen + push:WomenTalk + 
##     push:topic_role + topic_Zhenhuan_drama:role_count + push:boo + 
##     push:role_count + push:negative + topic_Zhenhuan_drama:negative + 
##     role_count:negative + push:topic_Zhenhuan_drama + push:twenty_three + 
##     topic_Zhenhuan_drama:WomenTalk + negative:eleven + push:eleven + 
##     topic_Zhenhuan_drama:eleven + topic_Zhenhuan_drama:topic_role + 
##     push:topic_news + negative:twelve + push:twelve + boo:twelve + 
##     push:fourteen + boo:fourteen + role_count:twenty_three + 
##     negative:twenty_three + topic_role:twenty_three, data = Train_nor_t)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -0.16825 -0.01158 -0.00167  0.00660  0.33225 
## 
## Coefficients:
##                                  Estimate Std. Error t value Pr(>|t|)    
## (Intercept)                       -8.1081     2.0822  -3.894 0.000105 ***
## push                              -9.3345     1.3545  -6.891 9.86e-12 ***
## WomenTalk                          7.3393     5.0521   1.453 0.146624    
## role_count                        13.2349     4.5742   2.893 0.003896 ** 
## boo                               95.6949    26.8036   3.570 0.000374 ***
## negative                          -8.4778     3.2123  -2.639 0.008442 ** 
## twenty_three                      11.4801     4.1826   2.745 0.006167 ** 
## eleven                             0.1682     0.7064   0.238 0.811844    
## twelve                            29.4480     9.9654   2.955 0.003201 ** 
## fourteen                          72.9152    25.4471   2.865 0.004254 ** 
## push:WomenTalk                    97.4674    17.8867   5.449 6.40e-08 ***
## push:topic_role                   -6.0308     2.7576  -2.187 0.028979 *  
## role_count:topic_Zhenhuan_drama   -2.7963     4.4301  -0.631 0.528063    
## push:boo                          41.3411     7.7478   5.336 1.18e-07 ***
## push:role_count                   -3.3292     0.7740  -4.301 1.87e-05 ***
## push:negative                      3.0940     0.4275   7.237 9.26e-13 ***
## negative:topic_Zhenhuan_drama     -3.6866     4.0680  -0.906 0.365022    
## role_count:negative               -2.9015     0.8128  -3.570 0.000375 ***
## push:topic_Zhenhuan_drama         -0.7788     1.6188  -0.481 0.630556    
## push:twenty_three                 24.7493     6.1867   4.000 6.80e-05 ***
## WomenTalk:topic_Zhenhuan_drama  -127.0244    64.9712  -1.955 0.050856 .  
## negative:eleven                   -0.9536     4.3566  -0.219 0.826792    
## push:eleven                       -4.4060     0.6427  -6.855 1.26e-11 ***
## eleven:topic_Zhenhuan_drama        0.9939    10.5200   0.094 0.924749    
## topic_role:topic_Zhenhuan_drama  126.8541    61.0569   2.078 0.038003 *  
## push:topic_news                    0.5094     1.0540   0.483 0.628976    
## negative:twelve                   -5.5835     5.4057  -1.033 0.301909    
## push:twelve                       -7.7417     1.3780  -5.618 2.52e-08 ***
## boo:twelve                      -376.7446   131.9290  -2.856 0.004385 ** 
## push:fourteen                     -7.3035     2.0163  -3.622 0.000307 ***
## boo:fourteen                    -954.3364   334.1016  -2.856 0.004375 ** 
## role_count:twenty_three         -167.6009    60.5183  -2.769 0.005721 ** 
## negative:twenty_three            125.9802    41.6708   3.023 0.002566 ** 
## twenty_three:topic_role         -127.8706    57.7449  -2.214 0.027030 *  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.03002 on 981 degrees of freedom
## Multiple R-squared:  0.9078, Adjusted R-squared:  0.9047 
## F-statistic: 292.8 on 33 and 981 DF,  p-value: < 2.2e-16
#其中P值<0.001的變數有push、WomenTalk、role_count、negative、push:WomenTalk、push:boo、push:role_count、push:negative、push:topic_Zhenhuan_drama、push:twenty_three、WomenTalk:topic_Zhenhuan_drama、push:eleven、negative:twelve、push:twelve、role_count:twenty_three、negative:twenty_three

5.測試訓練集、測試集mae

mae(Test_nor_t$commentNum, predict(lm(formula = commentNum ~ push + WomenTalk + 
    role_count + boo + negative + twenty_three + 
    eleven + twelve + fourteen + push:WomenTalk + 
    push:topic_role + topic_Zhenhuan_drama:role_count + push:boo + 
    push:role_count + push:negative + topic_Zhenhuan_drama:negative + 
    role_count:negative + push:topic_Zhenhuan_drama + push:twenty_three + 
    topic_Zhenhuan_drama:WomenTalk + negative:eleven + push:eleven + 
    topic_Zhenhuan_drama:eleven + topic_Zhenhuan_drama:topic_role +
    push:topic_news + negative:twelve + 
    push:twelve + boo:twelve + push:fourteen + boo:fourteen + 
    role_count:twenty_three + 
    negative:twenty_three + topic_role:twenty_three , 
    data = Train_nor_t) , newdata = Test_nor_t))
## [1] 0.01796971
mae(Train_nor_t$commentNum, lm(commentNum ~ push + WomenTalk + 
    role_count + boo + negative + twenty_three + 
    eleven + twelve + fourteen + push:WomenTalk + 
    push:topic_role + topic_Zhenhuan_drama:role_count + push:boo + 
    push:role_count + push:negative + topic_Zhenhuan_drama:negative + 
    role_count:negative + push:topic_Zhenhuan_drama + push:twenty_three + 
    topic_Zhenhuan_drama:WomenTalk + negative:eleven + push:eleven + 
    topic_Zhenhuan_drama:eleven + topic_Zhenhuan_drama:topic_role +
    push:topic_news + negative:twelve + 
    push:twelve + boo:twelve + push:fourteen + boo:fourteen + 
    role_count:twenty_three + 
    negative:twenty_three + topic_role:twenty_three , 
    data = Train_nor_t)$fitted.values)
## [1] 0.01705789

6.最終模型

drama_lm <- lm(commentNum ~ push + WomenTalk + 
    role_count + boo + negative + twenty_three + 
    eleven + twelve + fourteen + push:WomenTalk + 
    push:topic_role + topic_Zhenhuan_drama:role_count + push:boo + 
    push:role_count + push:negative + topic_Zhenhuan_drama:negative + 
    role_count:negative + push:topic_Zhenhuan_drama + push:twenty_three + 
    topic_Zhenhuan_drama:WomenTalk + negative:eleven + push:eleven + 
    topic_Zhenhuan_drama:eleven + topic_Zhenhuan_drama:topic_role +
    push:topic_news + negative:twelve + 
    push:twelve + boo:twelve + push:fourteen + boo:fourteen + 
    role_count:twenty_three + 
    negative:twenty_three + topic_role:twenty_three , data = Train)

plot(drama_lm)

7.模型預測準確度

Predict_Test <- Test %>%
  
  mutate( predict_commentNum = predict(drama_lm , Test)) %>%
  
  filter(commentNum != 0 ) %>%
  
  mutate(error = abs(commentNum - predict_commentNum) / commentNum) 

#回覆數是0會影響誤差值,進行刪除, 刪除後為433筆

1 - sum(Predict_Test$error)/433 #平均誤差
## [1] 0.6318282

#五、結論:

1.噓文與回覆數正相關呀!但在中午12點、下午14點發文被噓,此天時不利回覆數 2.在Women Talk版上聊甄嬛傳,會有很多人想回你(妳),大家的現實人生中都很甄嬛呀! 3.大家在晚上11點時,看到負面情緒多的文章會想回覆, 代表早點睡覺比較好吧!!以免負面情緒大爆發