系統設置

## [1] ""

安裝 Packages

packages = c("readr", "tm", "data.table", "dplyr", "stringr", "jiebaR", "tidytext", "ggplot2", "tidyr", "topicmodels", "LDAvis",  "igraph","knitr", "webshot", "purrr", "ramify", "RColorBrewer", "htmlwidgets", "servr")
existing = as.character(installed.packages()[,1])
for(pkg in packages[!(packages %in% existing)]) install.packages(pkg)
# 載入packages
library(readr)
library(tm)
library(dplyr)
library(jiebaR)
library(tidyr)
library(tidytext)
library(igraph)
library(topicmodels)
library(stringr)
library(ggplot2)
library(knitr)
library(RColorBrewer)
require(data.table)
require(wordcloud2)
mycolors <- colorRampPalette(brewer.pal(8, "Set3"))(20)

讀取資料

載入資料

# 文章資料
HongKong <- fread("HongKong_articleMetaData.csv", encoding = "UTF-8")
HongKong$artDate = HongKong$artDate %>% as.Date("%Y/%m/%d") # 將日期欄位格式由chr轉為date

#回覆資料
HongKong_review <- fread("HongKong_articleReviews.csv", encoding = "UTF-8")

# 選取需要的欄位
HongKong_review <- HongKong_review %>%
      select(artUrl, cmtPoster, cmtStatus, cmtContent)
HongKong_review2 <- fread("HongKong_articleReviews.csv", encoding = "UTF-8")

資料預覽

發文者數量

length(unique(HongKong$artPoster))
## [1] 3537

回覆者數量

length(unique(HongKong_review$cmtPoster))
## [1] 45674

總參與人數量

allPoster <- c(HongKong$artPoster, HongKong_review$cmtPoster)
length(unique(allPoster))
## [1] 46709

整理參與人

# 整理所有出現過的使用者:
# 若曾發過文則標註爲:Poster;不曾發過文則標註爲:Replyer
userList <- data.frame(user = unique(allPoster)) %>%
  mutate(type = ifelse(user%in%HongKong$artPoster, "poster", "replyer"))

建立網路社群圖

Join文章與回覆

posts_Reviews <- merge(x = HongKong, y = HongKong_review, by = "artUrl")

篩選欄位

# 取出 cmtPoster(回覆者)、artPoster(發文者)、artUrl(文章連結)三個欄位
link <- posts_Reviews %>%
      select(cmtPoster, artPoster, artUrl)

建立網路關係

reviewNetwork <- graph_from_data_frame(d=link, directed=T)

資料篩選

由於人數眾多,我們設定一些條件來篩選資料
1. 篩選發文數 > 5:代表發文者是否高度關注該主題並熱於分享
2. 篩選回文數 > 100:代表發文者的文章是否能一定引起共鳴

HongKong_poster = table(HongKong$artPoster) %>% sort %>% as.data.frame 
colnames(HongKong_poster) = c("artPoster","freq")
HongKong_poster = HongKong_poster %>% filter(freq >= 5) # 發文次數 > 5

link <- posts_Reviews %>%
      filter(commentNum >= 100) %>% # 回覆數 > 100
      filter(artPoster==HongKong_poster$artPoster) %>%
      select(cmtPoster, artPoster, artUrl) %>% 
      unique()
## Warning in `==.default`(artPoster, HongKong_poster$artPoster): 較長的物件長度並
## 非較短物件長度的倍數
## Warning in is.na(e1) | is.na(e2): 較長的物件長度並非較短物件長度的倍數

過濾圖中的Vertex

# 篩選 link 中有出現的使用者
filtered_user <- userList %>%
          filter(user%in%link$cmtPoster | user%in%link$artPoster) %>%
          arrange(desc(type))

建立網路關係圖

set.seed(487)
# 先把關係的方向性拿掉,減少圖片中的不必要的資訊
reviewNetwork <- graph_from_data_frame(d=link, v=filtered_user, directed=F)
plot(reviewNetwork, vertex.size=3, edge.arrow.size=.2, vertex.label=NA)

加強圖像的顯示資訊

set.seed(487)
labels <- degree(reviewNetwork)
V(reviewNetwork)$label <- names(labels)
# 依使用者的身份來區分點的顏色:有發文的話是金色,只有回覆文章的則是淺藍色
V(reviewNetwork)$color <- ifelse(V(reviewNetwork)$type=="poster", "gold", "lightblue")

# 依據回覆發生的文章所對應的主題,對他們的關聯線進行上色
#E(reviewNetwork)$color <- ifelse(E(reviewNetwork)$cmtStatus == "推", "lightgreen", "palevioletred")

# 顯示超過 5 個關聯的使用者帳號
plot(reviewNetwork, vertex.size = 3, edge.arrow.size=.2,
     vertex.label=ifelse(degree(reviewNetwork) > 5, V(reviewNetwork)$label, NA),  vertex.label.font = 2)

LDA 主題分析

資料前處理

# 斷句
HongKong_meta <- HongKong %>%
  mutate(sentence=gsub("[\n]{2,}", "。", sentence))

# 以全形或半形驚歎號、問號、分號以及全形句號進行斷句
HongKong_sentences <- strsplit(HongKong_meta$sentence,"[。!;?!?;]")

# 將每句句子與他所屬的文章連結配對起來,整理成一個dataframe
HongKong_sentences <- data.frame(
                        artUrl = rep(HongKong_meta$artUrl, sapply(HongKong_sentences, length)), 
                        sentence = unlist(HongKong_sentences)
                      ) %>%
                      filter(!str_detect(sentence, regex("^(\t|\n| )*$")))
HongKong_sentences$sentence <- as.character(HongKong_sentences$sentence)

# 斷詞
# 使用斷詞引擎,放入要用的詞典和停用字
jieba_tokenizer = worker(user="HongKong_lexicon.txt", stop_word = "stop_words.txt", write = "NOFILE")
HongKong_tokenizer <- function(t) {
  lapply(t, function(x) {
    if(nchar(x)>1){
      tokens <- segment(x, jieba_tokenizer)
      # 去掉字串長度爲1的詞彙
      tokens <- tokens[nchar(tokens)>1]
      return(tokens)
    }
  })
}

HongKong_tokens <- HongKong_sentences %>%
  unnest_tokens(word, sentence, token = HongKong_tokenizer) %>%
  filter(!str_detect(word, regex("[0-9a-zA-Z]"))) %>%
  count(artUrl, word, sort = TRUE) %>%
  rename(count=n)

# 清理斷詞結果:挑出總出現次數大於3的字
reserved_word <- HongKong_tokens %>% 
  group_by(word) %>% 
  count() %>% 
  filter(n > 3) %>% 
  unlist()

HongKong_removed <- HongKong_tokens %>% 
  filter(word %in% reserved_word)

# 將資料轉換為 Document Term Matrix (DTM)
HongKong_dtm <- HongKong_removed %>% cast_dtm(artUrl, word, count)
HongKong_dtm
## <<DocumentTermMatrix (documents: 9168, terms: 19924)>>
## Non-/sparse entries: 619333/182043899
## Sparsity           : 100%
## Maximal term length: 14
## Weighting          : term frequency (tf)

主題分析

# LDA分成 10 個主題
#HongKong_lda <- LDA(HongKong_dtm, k = 10, control = list(seed = 1234))
#save(HongKong_lda, file = "HongKong_lda_result")
load("HongKong_lda_result")

# 看各群的常用詞彙
tidy(HongKong_lda, matrix = "beta") %>%
  filter(!term %in% c("台灣","中國")) %>%
  group_by(topic) %>%
  top_n(10, beta) %>%
  ungroup() %>%
  mutate(topic = as.factor(topic), term = reorder_within(term, beta, topic)) %>%
  ggplot(aes(term, beta, fill = topic)) +
    geom_col(show.legend = FALSE) +
    facet_wrap(~ topic, scales = "free") +
    coord_flip() +
  scale_x_reordered()

主題命名

topic_name = c("武漢肺炎", "美國法案", "港警鎮壓", "民主自由", "none", "none2", "國安法", "移民", "遊行示威", "香港政府")

cbind Document主題分佈

# 主題分布
tmResult <- posterior(HongKong_lda)
doc_pro <- tmResult$topics
dim(doc_pro)
## [1] 9168   10
# get document topic proportions 
document_topics <- doc_pro[HongKong$artUrl,]
document_topics_df =data.frame(document_topics)
colnames(document_topics_df) = topic_name
rownames(document_topics_df) = NULL
news_topic = cbind(HongKong,document_topics_df)

主題隨時間的變化

news_topic %>% 
  dplyr::select(-commentNum,-push,-boo) %>%
  group_by(artDate = format(artDate,'%Y%m')) %>%
  summarise_if(is.numeric, sum, na.rm = TRUE) %>%
  melt(id.vars = "artDate") %>%
  ggplot( aes(x=artDate, y=value, fill=variable)) + 
  geom_bar(stat = "identity") + ylab("value") + 
  scale_fill_manual(values=mycolors) +
  theme(axis.text.x = element_text(angle = 90, hjust = 1))

去除 none 主題和資料較少的月份

news_topic %>%
  filter( !format(artDate,'%Y%m') %in% c(201912,202001,202002,202003,202004)) %>%
  dplyr::select(-none, -none2, -commentNum, -push, -boo) %>%
  group_by(artDate = format(artDate,'%Y%m')) %>%
  summarise_if(is.numeric, sum, na.rm = TRUE) %>%
  melt(id.vars = "artDate")%>%
  ggplot( aes(x=artDate, y=value, fill=variable)) + 
  geom_bar(stat = "identity") + ylab("value") + 
  scale_fill_manual(values=mycolors) +
  theme(axis.text.x = element_text(angle = 90, hjust = 1))

將上圖以比例方式比較

news_topic %>%
  filter( !format(artDate,'%Y%m') %in% c(201912,202001,202002,202003,202004)) %>%
  dplyr::select(-none, -none2, -commentNum, -push, -boo) %>%
  group_by(artDate = format(artDate,'%Y%m')) %>%
  summarise_if(is.numeric, sum, na.rm = TRUE) %>%
  melt(id.vars = "artDate")%>%
  group_by(artDate) %>%
  mutate(total_value =sum(value))%>%
  ggplot( aes(x=artDate, y=value/total_value, fill=variable)) + 
  geom_bar(stat = "identity") + ylab("proportion") + 
  scale_fill_manual(values=mycolors) +
  theme(axis.text.x = element_text(angle = 90, hjust = 1))

根據上圖可以初步得知:
- 去年7月,警民衝突加劇並發生「元朗事件」,讓「港警鎮壓」、「移民」、「遊行示威」成為主要討論。
- 去年10月,《禁蒙面法》正式生效且港府允許陳同佳出獄,對於「香港政府」與林鄭月娥的作為成為主要討論。
- 去年11月,美國參議會通過《香港人權民主法案》,「美國法案」這個主題在此時獲得反送中期間中最多的討論聲量。
- 去年11月,香港中文大學、理工大學遭港警攻入,「港警鎮壓」這個主題在此時獲得反送中期間中最多的討論聲量。
- 今年5月,香港《國安法》正式生效,引發香港人恐慌與移民潮,「移民」2字成為香港地區的熱門搜索詞。

LDA 視覺化

# 使用LDA預測每篇文章的主題
HongKong_topics <- tidy(HongKong_lda, matrix = "gamma") %>% # 在tidy function中使用參數"gamma"來取得 theta矩陣。
                  group_by(document) %>%
                  top_n(1, wt=gamma)

# 把文章資訊和主題join起來
posts_Reviews_LDA <- merge(x = posts_Reviews, y = HongKong_topics, by.x = "artUrl", by.y = "document")
posts_Reviews_LDA
##                                                           artUrl
##      1: https://www.ptt.cc/bbs/Gossiping/M.1562883620.A.B88.html
##      2: https://www.ptt.cc/bbs/Gossiping/M.1562883620.A.B88.html
##      3: https://www.ptt.cc/bbs/Gossiping/M.1562883620.A.B88.html
##      4: https://www.ptt.cc/bbs/Gossiping/M.1562883620.A.B88.html
##      5: https://www.ptt.cc/bbs/Gossiping/M.1562883620.A.B88.html
##     ---                                                         
## 661522: https://www.ptt.cc/bbs/Gossiping/M.1590648394.A.2B5.html
## 661523: https://www.ptt.cc/bbs/Gossiping/M.1590648394.A.2B5.html
## 661524: https://www.ptt.cc/bbs/Gossiping/M.1590648394.A.2B5.html
## 661525: https://www.ptt.cc/bbs/Gossiping/M.1590648394.A.2B5.html
## 661526: https://www.ptt.cc/bbs/Gossiping/M.1590648394.A.2B5.html
##                                               artTitle    artDate  artTime
##      1:    [新聞]寶礦力挺反送中?陸偶像女團GNZ48終止合 2019-07-11 14:14:16
##      2:    [新聞]寶礦力挺反送中?陸偶像女團GNZ48終止合 2019-07-11 14:14:16
##      3:    [新聞]寶礦力挺反送中?陸偶像女團GNZ48終止合 2019-07-11 14:14:16
##      4:    [新聞]寶礦力挺反送中?陸偶像女團GNZ48終止合 2019-07-11 14:14:16
##      5:    [新聞]寶礦力挺反送中?陸偶像女團GNZ48終止合 2019-07-11 14:14:16
##     ---                                                                   
## 661522: Re:[新聞]香港女吐心聲「不想移民台灣」!196字淚 2020-05-28 06:46:32
## 661523: Re:[新聞]香港女吐心聲「不想移民台灣」!196字淚 2020-05-28 06:46:32
## 661524: Re:[新聞]香港女吐心聲「不想移民台灣」!196字淚 2020-05-28 06:46:32
## 661525: Re:[新聞]香港女吐心聲「不想移民台灣」!196字淚 2020-05-28 06:46:32
## 661526: Re:[新聞]香港女吐心聲「不想移民台灣」!196字淚 2020-05-28 06:46:32
##         artPoster    artCat commentNum push boo
##      1:      ebsd Gossiping         37   22   2
##      2:      ebsd Gossiping         37   22   2
##      3:      ebsd Gossiping         37   22   2
##      4:      ebsd Gossiping         37   22   2
##      5:      ebsd Gossiping         37   22   2
##     ---                                        
## 661522:  i2taiwan Gossiping          8    0   3
## 661523:  i2taiwan Gossiping          8    0   3
## 661524:  i2taiwan Gossiping          8    0   3
## 661525:  i2taiwan Gossiping          8    0   3
## 661526:  i2taiwan Gossiping          8    0   3
##                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                       sentence
##      1: 媒體來源:\n聯合\n\n記者署名\n林庭瑤\n\n完整新聞標題:\n寶礦力挺反送中?陸偶像女團GNZ48終止合作\n\n\n\n\n完整新聞內文:\n\n香港反送中在7月1日發生占領香港立法會大樓事件。香港無線電視台TVB因「報導偏向警\n方」而引起社會爭議。傳日本飲料商寶礦力水特從TVB撤除了所有廣告。對此,梁振英發\n聲批評寶礦力水特公司,中國大陸流行樂偶像女子團體GNZ48也宣布終止與寶礦力水特公\n司的全部合作。\n\n據觀察者網和星島日報綜合報導,大陸全國政協副主席、前特首梁振英評論稱,「寶礦力\n黑白不分,我呼籲全國消費者,全面抵制寶礦力。」\n\n中國大陸女團GNZ48隨即在昨天(10日)下午宣布終止與寶礦力的合作。\n\n寶礦力水特昨晚在臉書發表聲明,稱對7月9日的回應引來的不便真誠道歉,但無明確提及\n是否撤回廣告。網上流傳截圖顯示,寶礦力水特的專頁回覆客戶查詢稱,鑑於當前形勢,\n上周已決定撤回廣告。\n\n環球網就該截圖聯繫到了大塚製藥日本本部,負責公關事務的一位女士表示,撤回廣告的\n決定,完全由香港大塚製藥基於商業原因自行做出,不摻雜政治因素,日本總部未給予任\n何指示。至於撤銷廣告為暫時性撤銷還是永久性,她稱目前尚未做出決定。\n\n\n完整新聞連結 (或短網址):\nhttps://udn.com/news/story/7331/3922328\n備註:\n
##      2: 媒體來源:\n聯合\n\n記者署名\n林庭瑤\n\n完整新聞標題:\n寶礦力挺反送中?陸偶像女團GNZ48終止合作\n\n\n\n\n完整新聞內文:\n\n香港反送中在7月1日發生占領香港立法會大樓事件。香港無線電視台TVB因「報導偏向警\n方」而引起社會爭議。傳日本飲料商寶礦力水特從TVB撤除了所有廣告。對此,梁振英發\n聲批評寶礦力水特公司,中國大陸流行樂偶像女子團體GNZ48也宣布終止與寶礦力水特公\n司的全部合作。\n\n據觀察者網和星島日報綜合報導,大陸全國政協副主席、前特首梁振英評論稱,「寶礦力\n黑白不分,我呼籲全國消費者,全面抵制寶礦力。」\n\n中國大陸女團GNZ48隨即在昨天(10日)下午宣布終止與寶礦力的合作。\n\n寶礦力水特昨晚在臉書發表聲明,稱對7月9日的回應引來的不便真誠道歉,但無明確提及\n是否撤回廣告。網上流傳截圖顯示,寶礦力水特的專頁回覆客戶查詢稱,鑑於當前形勢,\n上周已決定撤回廣告。\n\n環球網就該截圖聯繫到了大塚製藥日本本部,負責公關事務的一位女士表示,撤回廣告的\n決定,完全由香港大塚製藥基於商業原因自行做出,不摻雜政治因素,日本總部未給予任\n何指示。至於撤銷廣告為暫時性撤銷還是永久性,她稱目前尚未做出決定。\n\n\n完整新聞連結 (或短網址):\nhttps://udn.com/news/story/7331/3922328\n備註:\n
##      3: 媒體來源:\n聯合\n\n記者署名\n林庭瑤\n\n完整新聞標題:\n寶礦力挺反送中?陸偶像女團GNZ48終止合作\n\n\n\n\n完整新聞內文:\n\n香港反送中在7月1日發生占領香港立法會大樓事件。香港無線電視台TVB因「報導偏向警\n方」而引起社會爭議。傳日本飲料商寶礦力水特從TVB撤除了所有廣告。對此,梁振英發\n聲批評寶礦力水特公司,中國大陸流行樂偶像女子團體GNZ48也宣布終止與寶礦力水特公\n司的全部合作。\n\n據觀察者網和星島日報綜合報導,大陸全國政協副主席、前特首梁振英評論稱,「寶礦力\n黑白不分,我呼籲全國消費者,全面抵制寶礦力。」\n\n中國大陸女團GNZ48隨即在昨天(10日)下午宣布終止與寶礦力的合作。\n\n寶礦力水特昨晚在臉書發表聲明,稱對7月9日的回應引來的不便真誠道歉,但無明確提及\n是否撤回廣告。網上流傳截圖顯示,寶礦力水特的專頁回覆客戶查詢稱,鑑於當前形勢,\n上周已決定撤回廣告。\n\n環球網就該截圖聯繫到了大塚製藥日本本部,負責公關事務的一位女士表示,撤回廣告的\n決定,完全由香港大塚製藥基於商業原因自行做出,不摻雜政治因素,日本總部未給予任\n何指示。至於撤銷廣告為暫時性撤銷還是永久性,她稱目前尚未做出決定。\n\n\n完整新聞連結 (或短網址):\nhttps://udn.com/news/story/7331/3922328\n備註:\n
##      4: 媒體來源:\n聯合\n\n記者署名\n林庭瑤\n\n完整新聞標題:\n寶礦力挺反送中?陸偶像女團GNZ48終止合作\n\n\n\n\n完整新聞內文:\n\n香港反送中在7月1日發生占領香港立法會大樓事件。香港無線電視台TVB因「報導偏向警\n方」而引起社會爭議。傳日本飲料商寶礦力水特從TVB撤除了所有廣告。對此,梁振英發\n聲批評寶礦力水特公司,中國大陸流行樂偶像女子團體GNZ48也宣布終止與寶礦力水特公\n司的全部合作。\n\n據觀察者網和星島日報綜合報導,大陸全國政協副主席、前特首梁振英評論稱,「寶礦力\n黑白不分,我呼籲全國消費者,全面抵制寶礦力。」\n\n中國大陸女團GNZ48隨即在昨天(10日)下午宣布終止與寶礦力的合作。\n\n寶礦力水特昨晚在臉書發表聲明,稱對7月9日的回應引來的不便真誠道歉,但無明確提及\n是否撤回廣告。網上流傳截圖顯示,寶礦力水特的專頁回覆客戶查詢稱,鑑於當前形勢,\n上周已決定撤回廣告。\n\n環球網就該截圖聯繫到了大塚製藥日本本部,負責公關事務的一位女士表示,撤回廣告的\n決定,完全由香港大塚製藥基於商業原因自行做出,不摻雜政治因素,日本總部未給予任\n何指示。至於撤銷廣告為暫時性撤銷還是永久性,她稱目前尚未做出決定。\n\n\n完整新聞連結 (或短網址):\nhttps://udn.com/news/story/7331/3922328\n備註:\n
##      5: 媒體來源:\n聯合\n\n記者署名\n林庭瑤\n\n完整新聞標題:\n寶礦力挺反送中?陸偶像女團GNZ48終止合作\n\n\n\n\n完整新聞內文:\n\n香港反送中在7月1日發生占領香港立法會大樓事件。香港無線電視台TVB因「報導偏向警\n方」而引起社會爭議。傳日本飲料商寶礦力水特從TVB撤除了所有廣告。對此,梁振英發\n聲批評寶礦力水特公司,中國大陸流行樂偶像女子團體GNZ48也宣布終止與寶礦力水特公\n司的全部合作。\n\n據觀察者網和星島日報綜合報導,大陸全國政協副主席、前特首梁振英評論稱,「寶礦力\n黑白不分,我呼籲全國消費者,全面抵制寶礦力。」\n\n中國大陸女團GNZ48隨即在昨天(10日)下午宣布終止與寶礦力的合作。\n\n寶礦力水特昨晚在臉書發表聲明,稱對7月9日的回應引來的不便真誠道歉,但無明確提及\n是否撤回廣告。網上流傳截圖顯示,寶礦力水特的專頁回覆客戶查詢稱,鑑於當前形勢,\n上周已決定撤回廣告。\n\n環球網就該截圖聯繫到了大塚製藥日本本部,負責公關事務的一位女士表示,撤回廣告的\n決定,完全由香港大塚製藥基於商業原因自行做出,不摻雜政治因素,日本總部未給予任\n何指示。至於撤銷廣告為暫時性撤銷還是永久性,她稱目前尚未做出決定。\n\n\n完整新聞連結 (或短網址):\nhttps://udn.com/news/story/7331/3922328\n備註:\n
##     ---                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                       
## 661522:                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                             哈哈哈哈哈哈哈哈哈\n港女不愧是港女\n不要把台灣跟香港混為一談\n香港已經回歸中國\n你們就是中國香港人\n我們這邊是台灣\n台灣歡迎友善的港人移民台灣\n慢走不送啊
## 661523:                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                             哈哈哈哈哈哈哈哈哈\n港女不愧是港女\n不要把台灣跟香港混為一談\n香港已經回歸中國\n你們就是中國香港人\n我們這邊是台灣\n台灣歡迎友善的港人移民台灣\n慢走不送啊
## 661524:                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                             哈哈哈哈哈哈哈哈哈\n港女不愧是港女\n不要把台灣跟香港混為一談\n香港已經回歸中國\n你們就是中國香港人\n我們這邊是台灣\n台灣歡迎友善的港人移民台灣\n慢走不送啊
## 661525:                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                             哈哈哈哈哈哈哈哈哈\n港女不愧是港女\n不要把台灣跟香港混為一談\n香港已經回歸中國\n你們就是中國香港人\n我們這邊是台灣\n台灣歡迎友善的港人移民台灣\n慢走不送啊
## 661526:                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                             哈哈哈哈哈哈哈哈哈\n港女不愧是港女\n不要把台灣跟香港混為一談\n香港已經回歸中國\n你們就是中國香港人\n我們這邊是台灣\n台灣歡迎友善的港人移民台灣\n慢走不送啊
##         cmtPoster cmtStatus                              cmtContent topic
##      1:  BOOS0103        推   :賀,終止的好!差點就玷汙歷年寶礦力女     4
##      2:  BOOS0103         →                                   :神。     4
##      3:  BOOS0103         →             :拜託寶礦力廣告不要用支那女     4
##      4:     RLAPH        推                     :攘夷志士最愛的飲料     4
##      5:  AUwalker        推   :幸好你們出來終止不然真的沒聽過廣州48     4
##     ---                                                                  
## 661522:     Anvec         → :如果不能真的拿到實質的利益只是嘴巴上挺     8
## 661523:     Anvec         →             :那今日的香港就是明日的台灣     8
## 661524:   Void956        噓             :偽裝真差一看就知道是支那人     8
## 661525:     Anvec         →                         :是可以被交易的     8
## 661526:  leophior        噓                       :你說不會推文哦?     8
##             gamma
##      1: 0.3567502
##      2: 0.3567502
##      3: 0.3567502
##      4: 0.3567502
##      5: 0.3567502
##     ---          
## 661522: 0.6820008
## 661523: 0.6820008
## 661524: 0.6820008
## 661525: 0.6820008
## 661526: 0.6820008

元朗事件

# 篩選條件:
# 1. 2019/07/01至2019/10/01的文章
# 2. 有在10篇以上文章回覆者,
# 3. 文章主題歸類為3與9者,
# 4. 欄位只取:cmtPoster(評論者), artPoster(發文者), artUrl(文章連結), topic(主題)

link <- posts_Reviews_LDA %>%
      filter(artDate > as.Date('2019-07-01')) %>%
      filter(artDate < as.Date('2019-10-01')) %>%
      group_by(cmtPoster, artUrl) %>% 
      filter(n()>10) %>% 
      ungroup() %>% 
      filter(topic == 3 | topic == 9) %>% 
      select(cmtPoster, artPoster, artUrl, topic) %>% 
      unique()
link
## # A tibble: 130 x 4
##    cmtPoster    artPoster  artUrl                                          topic
##    <chr>        <chr>      <chr>                                           <int>
##  1 daemonshadow Barcarolle https://www.ptt.cc/bbs/Gossiping/M.1563102674.~     9
##  2 Strokes      LWong      https://www.ptt.cc/bbs/Gossiping/M.1563144183.~     3
##  3 hTCU11       LWong      https://www.ptt.cc/bbs/Gossiping/M.1563144183.~     3
##  4 mudee        sakaba     https://www.ptt.cc/bbs/Gossiping/M.1563279461.~     9
##  5 armorblocks  Retangle   https://www.ptt.cc/bbs/Gossiping/M.1563721157.~     3
##  6 ymuit        Retangle   https://www.ptt.cc/bbs/Gossiping/M.1563721157.~     3
##  7 lost0816     Rossini    https://www.ptt.cc/bbs/Gossiping/M.1563733562.~     3
##  8 mudee        Rossini    https://www.ptt.cc/bbs/Gossiping/M.1563733562.~     3
##  9 winnie759281 okah       https://www.ptt.cc/bbs/Gossiping/M.1563775744.~     3
## 10 myyalga      Moogle     https://www.ptt.cc/bbs/Gossiping/M.1563780974.~     3
## # ... with 120 more rows
# 篩選link中有出現的使用者
filtered_user <- userList %>%
          filter(user%in%link$cmtPoster | user%in%link$artPoster) %>%
          arrange(desc(type)) 
# 建立網路關係
reviewNetwork <- graph_from_data_frame(d=link, v=filtered_user, directed=F)

# 依據使用者身份對點上色
labels <- degree(reviewNetwork)
V(reviewNetwork)$label <- names(labels)
V(reviewNetwork)$color <- ifelse(V(reviewNetwork)$type=="poster", "gold", "lightblue")

# 依據回覆發生的文章所對應的主題,對他們的關聯線上色
E(reviewNetwork)$color <- ifelse(E(reviewNetwork)$topic == "3", "coral3", "cyan3")

# 畫出社群網路圖
set.seed(5000)
plot(reviewNetwork, vertex.size=6, edge.arrow.size=.2, edge.width=2,
     vertex.label=ifelse(degree(reviewNetwork) > 5, V(reviewNetwork)$label, NA),vertex.label.font=2)

# 加入標示
legend("bottomright", c("發文者","回文者"), pch=21, col="#777777", pt.bg=c("gold","lightblue"), pt.cex=1, cex=1)
legend("topleft", c("港警鎮壓", "遊行示威"), col=c("coral3","cyan3"), lty=1, cex=1)

可以看出來這個主題的主要幾個發文者:vickyshan,ae034,ReDmango,gaucher

vickyshan

HongKong_leader1 = HongKong %>% filter(artPoster=="vickyshan")
summary(HongKong_leader1)
##    artTitle            artDate             artTime             artUrl         
##  Length:1           Min.   :2019-09-16   Length:1           Length:1          
##  Class :character   1st Qu.:2019-09-16   Class :character   Class :character  
##  Mode  :character   Median :2019-09-16   Mode  :character   Mode  :character  
##                     Mean   :2019-09-16                                        
##                     3rd Qu.:2019-09-16                                        
##                     Max.   :2019-09-16                                        
##   artPoster            artCat            commentNum       push          boo    
##  Length:1           Length:1           Min.   :313   Min.   :131   Min.   :11  
##  Class :character   Class :character   1st Qu.:313   1st Qu.:131   1st Qu.:11  
##  Mode  :character   Mode  :character   Median :313   Median :131   Median :11  
##                                        Mean   :313   Mean   :131   Mean   :11  
##                                        3rd Qu.:313   3rd Qu.:131   3rd Qu.:11  
##                                        Max.   :313   Max.   :131   Max.   :11  
##    sentence        
##  Length:1          
##  Class :character  
##  Mode  :character  
##                    
##                    
## 

這個人總共只發了一篇相關文章,但是這唯一一篇文章就獲得了313個評論。

ae034

HongKong_leader2 = HongKong %>% filter(artPoster=="ae034")
summary(HongKong_leader2)
##    artTitle            artDate             artTime             artUrl         
##  Length:10          Min.   :2019-07-27   Length:10          Length:10         
##  Class :character   1st Qu.:2019-10-05   Class :character   Class :character  
##  Mode  :character   Median :2020-05-09   Mode  :character   Mode  :character  
##                     Mean   :2020-02-17                                        
##                     3rd Qu.:2020-05-21                                        
##                     Max.   :2020-05-24                                        
##   artPoster            artCat            commentNum          push       
##  Length:10          Length:10          Min.   :  4.00   Min.   :  0.00  
##  Class :character   Class :character   1st Qu.: 12.75   1st Qu.:  5.00  
##  Mode  :character   Mode  :character   Median : 45.50   Median : 20.00  
##                                        Mean   : 96.20   Mean   : 56.20  
##                                        3rd Qu.:106.25   3rd Qu.: 69.25  
##                                        Max.   :475.00   Max.   :281.00  
##       boo          sentence        
##  Min.   : 0.00   Length:10         
##  1st Qu.: 0.25   Class :character  
##  Median : 4.00   Mode  :character  
##  Mean   : 5.10                     
##  3rd Qu.: 5.75                     
##  Max.   :19.00

這個人在全時段總共發了十篇相關文章。獲得的評論數有少有多。

ReDmango

HongKong_leader3 = HongKong %>% filter(artPoster=="ReDmango")
summary(HongKong_leader3)
##    artTitle            artDate             artTime             artUrl         
##  Length:2           Min.   :2019-08-10   Length:2           Length:2          
##  Class :character   1st Qu.:2019-08-11   Class :character   Class :character  
##  Mode  :character   Median :2019-08-13   Mode  :character   Mode  :character  
##                     Mean   :2019-08-13                                        
##                     3rd Qu.:2019-08-15                                        
##                     Max.   :2019-08-17                                        
##   artPoster            artCat            commentNum         push       
##  Length:2           Length:2           Min.   : 53.0   Min.   : 36.00  
##  Class :character   Class :character   1st Qu.:151.8   1st Qu.: 53.25  
##  Mode  :character   Mode  :character   Median :250.5   Median : 70.50  
##                                        Mean   :250.5   Mean   : 70.50  
##                                        3rd Qu.:349.2   3rd Qu.: 87.75  
##                                        Max.   :448.0   Max.   :105.00  
##       boo        sentence        
##  Min.   :  2   Length:2          
##  1st Qu.: 29   Class :character  
##  Median : 56   Mode  :character  
##  Mean   : 56                     
##  3rd Qu.: 83                     
##  Max.   :110

這個人在全時段一共就發了兩篇相關文章,分別獲得53及448條評論。

gaucher

HongKong_leader4 = HongKong %>% filter(artPoster=="gaucher")
summary(HongKong_leader4)
##    artTitle            artDate             artTime             artUrl         
##  Length:45          Min.   :2019-07-25   Length:45          Length:45         
##  Class :character   1st Qu.:2019-09-15   Class :character   Class :character  
##  Mode  :character   Median :2019-10-07   Mode  :character   Mode  :character  
##                     Mean   :2019-10-18                                        
##                     3rd Qu.:2019-11-13                                        
##                     Max.   :2020-04-06                                        
##   artPoster            artCat            commentNum         push      
##  Length:45          Length:45          Min.   :  0.0   Min.   :  0.0  
##  Class :character   Class :character   1st Qu.: 17.0   1st Qu.:  7.0  
##  Mode  :character   Mode  :character   Median : 92.0   Median : 59.0  
##                                        Mean   :160.9   Mean   :108.1  
##                                        3rd Qu.:271.0   3rd Qu.:180.0  
##                                        Max.   :712.0   Max.   :532.0  
##       boo         sentence        
##  Min.   : 0.0   Length:45         
##  1st Qu.: 1.0   Class :character  
##  Median : 4.0   Mode  :character  
##  Mean   : 5.6                     
##  3rd Qu.: 9.0                     
##  Max.   :27.0

這個人在全時段發了高達45篇文章。

# 綜合比較
HongKong_leader1$artDate = as.Date(HongKong_leader1$artDate)
HongKong_leader1= HongKong_leader1 %>% mutate(months = as.Date(cut(artDate, "months")))
HongKong_leader1time = HongKong_leader1 %>% group_by(months) %>%
  summarise(num=n()) %>% as.data.frame %>%  
  mutate(poster ="vickyshan") 

HongKong_leader2$artDate = as.Date(HongKong_leader2$artDate)
HongKong_leader2= HongKong_leader2 %>% mutate(months = as.Date(cut(artDate, "months")))
HongKong_leader2time = HongKong_leader2 %>% group_by(months) %>%
  summarise(num=n()) %>% as.data.frame %>%  
  mutate(poster ="ae034") 

HongKong_leader3$artDate = as.Date(HongKong_leader3$artDate)
HongKong_leader3= HongKong_leader3 %>% mutate(months = as.Date(cut(artDate, "months")))
HongKong_leader3time = HongKong_leader3 %>% group_by(months) %>%
  summarise(num=n()) %>% as.data.frame %>%  
  mutate(poster ="ReDmango") 

HongKong_leader4$artDate = as.Date(HongKong_leader4$artDate)
HongKong_leader4= HongKong_leader4 %>% mutate(months = as.Date(cut(artDate, "months")))
HongKong_leader4time = HongKong_leader4 %>% group_by(months) %>%
  summarise(num=n()) %>% as.data.frame %>%  
  mutate(poster ="gaucher") 

# 整合發文趨勢圖
HongKong_leader = rbind(HongKong_leader1time, HongKong_leader2time, HongKong_leader3time, HongKong_leader4time)
HongKong_leader %>% ggplot(aes(x= months,y=num,fill=poster))  +geom_bar(stat = "identity")+
  facet_wrap(~poster, ncol = 2, scales = "fixed") 

選取gaucher,展現出他的文章,大部分是關於示威遊行和港警鎮壓的。

HongKong %>%
  filter(artPoster=="gaucher") %>%
  select(artTitle, artDate)
##                                           artTitle    artDate
## 1                         [爆卦]香港地盤工人也反了 2019-07-25
## 2                 [爆卦]香港連律政司政府律師也反了 2019-07-26
## 3             [爆卦]中國微博對香港示威開始轉風向了 2019-08-14
## 4               [爆卦]香港今日集會可能再破人數紀錄 2019-08-17
## 5          Re:[爆卦]香港抗議青年收隊受整間商場歡呼 2019-08-25
## 6    Re:[新聞]林鄭月娥:不設獨立調查委員會不接受反 2019-08-27
## 7        [爆卦]港府:行政長官個人看法與政府立場無關 2019-08-28
## 8                     [爆卦]香港立法會議員也被捕了 2019-08-30
## 9                 [爆卦]香港立法會議員再多一人被捕 2019-08-30
## 10              [爆卦]環時總編到港大戰香港才子live 2019-09-01
## 11           Re:[爆卦]香港旺角站關閉太子站持續關閉 2019-09-07
## 12        [爆卦]香港昨天完美示範警黑合作的最高境界 2019-09-15
## 13            [新聞]香港警方:「我們正被推向極限」 2019-09-22
## 14           [爆卦]香港打死人當自殺的証據浮出水面? 2019-09-23
## 15     [爆卦]香港獅子山率先賀國慶:習總一死以謝天下 2019-09-26
## 16   Re:[新聞]香港海關搜反送中裝備全面檢查台灣旅客 2019-09-28
## 17      [爆卦]香港警察的專業克制今天全世界都看到了 2019-09-29
## 18       Re:[問卦]香港抗議是不是高房租高房價造成的 2019-10-01
## 19 Re:[新聞]集會戴口罩有罪?!港媒稱新法違者恐入獄 2019-10-03
## 20       Re:[新聞]禁蒙面激怒火「香港臨時政府」成立 2019-10-05
## 21                 Re:[問卦]為何香港、澳門兩樣情? 2019-10-05
## 22   Re:[爆卦]香港屯門老人持刀跟年輕人示威最後下場 2019-10-05
## 23        [爆卦]烏克蘭親俄恐怖組織發圖支持香港警察 2019-10-07
## 24                [爆卦]香港中環已聚集十萬以上人潮 2019-10-14
## 25          [爆卦]香港溺斃少女案件10月15日進展 2019-10-14
## 26                   Re:[問卦]香港舔共第一人是誰? 2019-10-18
## 27                   Re:[問卦]香港是不是又和平啦? 2019-10-22
## 28    [爆卦]英國務大臣確認收到香港一家庭被自殺求助 2019-10-25
## 29   Re:[新聞]黃之鋒參加香港區議會號次抽籤被抬走  2019-10-25
## 30               Re:[問卦]香港只剩一小撮人在抗議? 2019-10-30
## 31                       Re:[爆卦]今夜香港再次濺血 2019-11-10
## 32   Re:[爆卦]港警進攻香港各大學,下令直接射擊頭部 2019-11-11
## 33   Re:[爆卦]港警進攻香港各大學,下令直接射擊頭部 2019-11-12
## 34     Re:[爆卦]香港被撤離中生要求撤下官媒不實報導 2019-11-13
## 35            [爆卦]香港大角咀墮樓案(不是爆頭那宗) 2019-11-15
## 36                   Re:[爆卦]香港理大戰況最新更新 2019-11-17
## 37        Re:[問卦]香港兩高院法官是否腦殘竟敢釋憲? 2019-11-18
## 38      [爆卦]香港監警會聘外國專家寫報告今集體請辭 2019-12-10
## 39     Re:[新聞]港媒痛批:民進黨冷血吃香港人豆腐! 2019-12-12
## 40   Re:[新聞]預備取代香港習近平將宣布澳門發展為金 2019-12-15
## 41                        Re:[問卦]香港最後怎麼了? 2019-12-20
## 42    Re:[新聞]巧固球國際賽!香港隊抗議台灣使用國旗 2019-12-20
## 43                 Re:[問卦]香港人真的是被自殺嗎? 2020-01-01
## 44     [爆卦]香港HMV推「警察陣亡」電影系列兼送香檳 2020-03-02
## 45      [爆卦]香港區議員用揚聲器令警耳痛今襲警罪成 2020-04-06

我們來看一下他的文章熱度

plot_date <- 
  # data
  HongKong_leader4 %>% 
  # aesthetics
  ggplot(aes(x = artDate, y = commentNum)) +
  # geometrics
  geom_line(color = "#00AFBB", size = 1) + 
  # coordinates
  scale_x_date(labels) +
  ggtitle("gaucher討論文章數") + 
  xlab("日期") + 
  ylab("發文數")

plot_date

可以看出他的文章高熱度時段和反送中高熱度時段完美吻合,結合他的文章標題,可以看出這個人非常關心香港議題。

HongKong_sentences_leader4 <- strsplit(HongKong_leader4$sentence,"[。!;?!?;]")

# 將每個句子與所屬的文章連結配對起來,整理成 dataframe
HongKong_sentences_leader4  <- data.frame(
  artUrl = rep(HongKong_leader4$artUrl, sapply(HongKong_sentences_leader4, length)), 
  sentence = unlist(HongKong_sentences_leader4)) %>%
  filter(!str_detect(sentence, regex("^(\t|\n| )*$")))
HongKong_sentences_leader4$sentence <- as.character(HongKong_sentences_leader4$sentence)

# 使用斷詞引擎,放入要用的詞典和停用字
jieba_tokenizer = worker(user="detention_lexicon.txt", stop_word = "stop_words.txt", write = "NOFILE")
chi_tokenizer <- function(t) {
  lapply(t, function(x) {
    if(nchar(x)>1){
      tokens <- segment(x, jieba_tokenizer)
      tokens <- tokens[nchar(tokens)>1]
      return(tokens)
    }
  })
}

# 進行斷詞,並計算各詞彙在各文章中出現的次數
HongKong_words_leader4 <- HongKong_sentences_leader4 %>%
  unnest_tokens(word, sentence, token=chi_tokenizer) %>%
  filter(!str_detect(word, regex("[0-9a-zA-Z]"))) %>%
  count(artUrl, word, sort = TRUE)

# 畫出文字雲
HongKong_words_leader4 %>%
   group_by(word) %>%
   summarise(sum = n()) %>%
   filter(sum > 2)  %>%
   arrange(desc(sum)) %>%
   wordcloud2()

可以看出這個人主要在討論遊行示威和警方鎮壓的話題 選取vickyshan,研究一下這個人的文章回復情況

HongKong_review1 = HongKong_review2 %>% filter(cmtPoster=="vickyshan")

HongKong_review1 
##                                          artTitle    artDate  artTime
## 1                            [爆卦]香港新聞處反了 2019/07/26 16:49:16
## 2     [問卦]只顧政治不顧經濟台恐<U+6CA6>香港第二? 2019/07/27 03:15:47
## 3  Re:[問卦]香港人為什麼不埋怨英國把香港還給中共? 2019/07/27 20:57:42
## 4  Re:[問卦]香港人為什麼不埋怨英國把香港還給中共? 2019/07/27 20:57:42
## 5  Re:[問卦]香港人為什麼不埋怨英國把香港還給中共? 2019/07/27 20:57:42
## 6  Re:[問卦]香港人為什麼不埋怨英國把香港還給中共? 2019/07/27 20:57:42
## 7  Re:[問卦]香港人為什麼不埋怨英國把香港還給中共? 2019/07/27 20:57:42
## 8  Re:[問卦]香港人為什麼不埋怨英國把香港還給中共? 2019/07/27 20:57:42
## 9  Re:[問卦]香港人為什麼不埋怨英國把香港還給中共? 2019/07/27 20:57:42
## 10 Re:[問卦]香港人為什麼不埋怨英國把香港還給中共? 2019/07/27 20:57:42
## 11                [問卦]整天po香港文是想遮蓋什麼? 2019/07/29 03:29:33
## 12                [問卦]整天po香港文是想遮蓋什麼? 2019/07/29 03:29:33
## 13           [問卦]有沒有颱風才讓香港文變少的八卦 2019/08/02 02:21:51
## 14          [問卦]有沒有爆料香港8/4要戒嚴的八卦? 2019/08/04 05:46:09
## 15  Fw:[轉錄]香港民權抗爭與台灣基進黨再無合作關係 2019/09/15 06:43:57
## 16                 [爆卦]香港民權抗爭回應台灣基進 2019/09/15 08:37:48
## 17                 [爆卦]香港民權抗爭回應台灣基進 2019/09/15 08:37:48
## 18                 [爆卦]香港民權抗爭回應台灣基進 2019/09/15 08:37:48
## 19                 [爆卦]香港民權抗爭回應台灣基進 2019/09/15 08:37:48
## 20   [新聞]香港遊行反蒙面是戒嚴?民進黨打臉徐國勇 2019/10/04 03:07:57
## 21  Re:[新聞]上千港人震撼宣讀《香港臨時政府宣言》 2019/10/04 08:49:13
## 22  Re:[新聞]上千港人震撼宣讀《香港臨時政府宣言》 2019/10/04 08:49:13
## 23  Re:[新聞]上千港人震撼宣讀《香港臨時政府宣言》 2019/10/04 08:49:13
## 24  Re:[新聞]上千港人震撼宣讀《香港臨時政府宣言》 2019/10/04 08:49:13
## 25             [爆卦]香港中文大學的守城部隊成軍了 2019/11/13 05:53:45
## 26        [新聞]港星高呼守護香港...中國網軍高潮了 2019/11/25 19:40:03
## 27   [爆卦]香港請求協助口罩供應!今日香港明日__ 2020/01/25 23:55:49
## 28   [爆卦]香港請求協助口罩供應!今日香港明日__ 2020/01/25 23:55:49
##                                                      artUrl    artPoster
## 1  https://www.ptt.cc/bbs/Gossiping/M.1564188918.A.88A.html     windsine
## 2  https://www.ptt.cc/bbs/Gossiping/M.1564226509.A.DC9.html   ptt5566fan
## 3  https://www.ptt.cc/bbs/Gossiping/M.1564290225.A.AB4.html     chenglap
## 4  https://www.ptt.cc/bbs/Gossiping/M.1564290225.A.AB4.html     chenglap
## 5  https://www.ptt.cc/bbs/Gossiping/M.1564290225.A.AB4.html     chenglap
## 6  https://www.ptt.cc/bbs/Gossiping/M.1564290225.A.AB4.html     chenglap
## 7  https://www.ptt.cc/bbs/Gossiping/M.1564290225.A.AB4.html     chenglap
## 8  https://www.ptt.cc/bbs/Gossiping/M.1564290225.A.AB4.html     chenglap
## 9  https://www.ptt.cc/bbs/Gossiping/M.1564290225.A.AB4.html     chenglap
## 10 https://www.ptt.cc/bbs/Gossiping/M.1564290225.A.AB4.html     chenglap
## 11 https://www.ptt.cc/bbs/Gossiping/M.1564400136.A.60C.html        Tiiek
## 12 https://www.ptt.cc/bbs/Gossiping/M.1564400136.A.60C.html        Tiiek
## 13 https://www.ptt.cc/bbs/Gossiping/M.1564741673.A.D94.html      cycling
## 14 https://www.ptt.cc/bbs/Gossiping/M.1564926731.A.84C.html         krej
## 15 https://www.ptt.cc/bbs/Gossiping/M.1568558998.A.E43.html           H2
## 16 https://www.ptt.cc/bbs/Gossiping/M.1568565831.A.790.html         rote
## 17 https://www.ptt.cc/bbs/Gossiping/M.1568565831.A.790.html         rote
## 18 https://www.ptt.cc/bbs/Gossiping/M.1568565831.A.790.html         rote
## 19 https://www.ptt.cc/bbs/Gossiping/M.1568565831.A.790.html         rote
## 20 https://www.ptt.cc/bbs/Gossiping/M.1570187641.A.245.html        ipapa
## 21 https://www.ptt.cc/bbs/Gossiping/M.1570208115.A.939.html      v963610
## 22 https://www.ptt.cc/bbs/Gossiping/M.1570208115.A.939.html      v963610
## 23 https://www.ptt.cc/bbs/Gossiping/M.1570208115.A.939.html      v963610
## 24 https://www.ptt.cc/bbs/Gossiping/M.1570208115.A.939.html      v963610
## 25 https://www.ptt.cc/bbs/Gossiping/M.1573653587.A.580.html benwei791207
## 26 https://www.ptt.cc/bbs/Gossiping/M.1574739967.A.900.html        egain
## 27 https://www.ptt.cc/bbs/Gossiping/M.1580025711.A.021.html     allgamba
## 28 https://www.ptt.cc/bbs/Gossiping/M.1580025711.A.021.html     allgamba
##       artCat cmtPoster cmtStatus                   cmtDate
## 1  Gossiping vickyshan         → 2019-07-27 00:58:00+00:00
## 2  Gossiping vickyshan         → 2019-07-27 11:16:00+00:00
## 3  Gossiping vickyshan        推 2019-07-28 07:38:00+00:00
## 4  Gossiping vickyshan         → 2019-07-28 07:45:00+00:00
## 5  Gossiping vickyshan         → 2019-07-28 07:45:00+00:00
## 6  Gossiping vickyshan         → 2019-07-28 07:46:00+00:00
## 7  Gossiping vickyshan         → 2019-07-28 07:48:00+00:00
## 8  Gossiping vickyshan         → 2019-07-28 07:49:00+00:00
## 9  Gossiping vickyshan         → 2019-07-28 07:49:00+00:00
## 10 Gossiping vickyshan         → 2019-07-28 07:50:00+00:00
## 11 Gossiping vickyshan        推 2019-07-29 11:30:00+00:00
## 12 Gossiping vickyshan         → 2019-07-29 11:30:00+00:00
## 13 Gossiping vickyshan        推 2019-08-02 10:22:00+00:00
## 14 Gossiping vickyshan         → 2019-08-04 13:46:00+00:00
## 15 Gossiping vickyshan        推 2019-09-15 15:19:00+00:00
## 16 Gossiping vickyshan        推 2019-09-15 16:55:00+00:00
## 17 Gossiping vickyshan         → 2019-09-15 16:56:00+00:00
## 18 Gossiping vickyshan        推 2019-09-15 17:12:00+00:00
## 19 Gossiping vickyshan        推 2019-09-15 17:50:00+00:00
## 20 Gossiping vickyshan        推 2019-10-04 11:09:00+00:00
## 21 Gossiping vickyshan        推 2019-10-04 16:50:00+00:00
## 22 Gossiping vickyshan         → 2019-10-04 16:51:00+00:00
## 23 Gossiping vickyshan        推 2019-10-04 16:53:00+00:00
## 24 Gossiping vickyshan         → 2019-10-04 16:53:00+00:00
## 25 Gossiping vickyshan        推 2019-11-13 14:39:00+00:00
## 26 Gossiping vickyshan        推 2019-11-26 14:14:00+00:00
## 27 Gossiping vickyshan        推 2020-01-26 08:47:00+00:00
## 28 Gossiping vickyshan         → 2020-01-26 08:47:00+00:00
##                               cmtContent
## 1                 :提醒注意安全算反嗎@@'
## 2                      :可以跳板台灣喔?
## 3    :古天樂在中國蓋了一百多所希望小學……
## 4  :印象中,中小學時,中國一有什麼災,就
## 5  :很流行港星、台星聯合捐款給中國,每場
## 6    :都是幾十億在送的,煽情的氛圍還騙了
## 7  :學生歷年存下的零用錢,老師還會依捐款
## 8  :數字給予嘉獎、模範生等表揚,現在想起
## 9  :來真是傻不拉機的,應該會有不少人後悔
## 10           :二、三十年前的幾十億很多喔
## 11 :還有看到篇說全世界都在關注香港,只有
## 12           :台灣在關注香菸之類的,呵呵
## 13                         :先幫你補個血
## 14                 :農曆八月四號不行喔?
## 15       :利用別人的不幸騙錢,嘔嘔嘔嘔嘔
## 16   :推,對方果然沒收到錢,似乎也沒明細
## 17    :我明明猜對了還被打成共匪和舔共=.=
## 18 :幫補:有疑問就不孝順(共匪、舔共)ww
## 19     :看推文的圖,結論是被詐騙走了??
## 20                                 :雙標
## 21                 :我也這麼覺得,幫補血
## 22 :台灣至少還有陸海空軍,香港好像沒軍隊
## 23   :要怪英國爸爸,當初要歸還的好像只有
## 24 :新界還是哪裡,結果英國佬整個都大放送
## 25     :現在都有防彈衣了,還在射箭=.=???
## 26 :周海媚本來就是中國人,鑲白旗滿州貴族
## 27           :相信祖國,香港不可能缺口罩
## 28                                 :嘻嘻
article_count_by_date <- HongKong_review1 %>% 
  group_by(artDate) %>% 
  summarise(count = n())

article_count_by_date %>% 
  arrange(desc(count))%>% 
  top_n(10)
## Selecting by count
## # A tibble: 10 x 2
##    artDate    count
##    <chr>      <int>
##  1 2019/07/27     9
##  2 2019/09/15     5
##  3 2019/10/04     5
##  4 2019/07/29     2
##  5 2020/01/25     2
##  6 2019/07/26     1
##  7 2019/08/02     1
##  8 2019/08/04     1
##  9 2019/11/13     1
## 10 2019/11/25     1

可以看出他在2020年前都有在討論反送中議題,但是參與討論的次數並不多。鑒於他唯一發送的一篇文章就造成了爆炸性回復,我們可以看出這個人十分善於觀察捕捉熱度

禁蒙面法

# 篩選條件:
# 1. 2019/10/01至2020/01/01的文章
# 2. 有在10篇以上文章回覆者,
# 3. 文章主題歸類為8與10者,
# 4. 欄位只取:cmtPoster(評論者), artPoster(發文者), artUrl(文章連結), topic(主題)

link <- posts_Reviews_LDA %>%
      filter(artDate > as.Date('2019-10-01')) %>%
      filter(artDate < as.Date('2020-01-01')) %>%
      group_by(cmtPoster, artUrl) %>% 
      filter(n()>10) %>% 
      ungroup() %>% 
      filter(topic == 8 | topic == 10) %>% 
      select(cmtPoster, artPoster, artUrl, topic) %>% 
      unique()
link
## # A tibble: 404 x 4
##    cmtPoster    artPoster artUrl                                           topic
##    <chr>        <chr>     <chr>                                            <int>
##  1 EeePC901     Diaw19    https://www.ptt.cc/bbs/Gossiping/M.1570072730.A~     8
##  2 kbten        Diaw19    https://www.ptt.cc/bbs/Gossiping/M.1570072730.A~     8
##  3 phoinixa     Diaw19    https://www.ptt.cc/bbs/Gossiping/M.1570072730.A~     8
##  4 lasekoutkast Diaw19    https://www.ptt.cc/bbs/Gossiping/M.1570072730.A~     8
##  5 slimfat0202  Diaw19    https://www.ptt.cc/bbs/Gossiping/M.1570072730.A~     8
##  6 happybad     Diaw19    https://www.ptt.cc/bbs/Gossiping/M.1570072730.A~     8
##  7 offstage     Diaw19    https://www.ptt.cc/bbs/Gossiping/M.1570072730.A~     8
##  8 mukuro       Diaw19    https://www.ptt.cc/bbs/Gossiping/M.1570072730.A~     8
##  9 ahaha777     Diaw19    https://www.ptt.cc/bbs/Gossiping/M.1570072730.A~     8
## 10 neverfly     ununnihao https://www.ptt.cc/bbs/Gossiping/M.1570076993.A~     8
## # ... with 394 more rows
# 篩選link中有出現的使用者
filtered_user <- userList %>%
          filter(user%in%link$cmtPoster | user%in%link$artPoster) %>%
          arrange(desc(type)) 
# 建立網路關係
reviewNetwork <- graph_from_data_frame(d=link, v=filtered_user, directed=F)

# 依據使用者身份對點上色
labels <- degree(reviewNetwork)
V(reviewNetwork)$label <- names(labels)
V(reviewNetwork)$color <- ifelse(V(reviewNetwork)$type=="poster", "gold", "lightblue")

# 依據回覆發生的文章所對應的主題,對他們的關聯線上色
E(reviewNetwork)$color <- ifelse(E(reviewNetwork)$topic == "8", "coral3", "cyan3")

# 畫出社群網路圖
set.seed(5000)
plot(reviewNetwork, vertex.size=6, edge.arrow.size=.2, edge.width=2,
     vertex.label=ifelse(degree(reviewNetwork) > 15, V(reviewNetwork)$label, NA),vertex.label.font=2)

# 加入標示
legend("bottomright", c("發文者","回文者"), pch=21, col="#777777", pt.bg=c("gold","lightblue"), pt.cex=1, cex=1)
legend("topleft", c("移民", "香港政府"), col=c("coral3","cyan3"), lty=1, cex=1)

國安法

# 篩選條件:
# 1. 2020/05/01後的文章
# 2. 有在10篇以上文章回覆者,
# 3. 文章主題歸類為7與8者,
# 4. 欄位只取:cmtPoster(評論者), artPoster(發文者), artUrl(文章連結), topic(主題)

link <- posts_Reviews_LDA %>%
      filter(artDate > as.Date('2020-05-01')) %>%
      group_by(cmtPoster, artUrl) %>% 
      filter(n()>10) %>% 
      ungroup() %>% 
      filter(topic == 7 | topic == 8) %>% 
      select(cmtPoster, artPoster, artUrl, topic) %>% 
      unique()
link
## # A tibble: 139 x 4
##    cmtPoster   artPoster    artUrl                                         topic
##    <chr>       <chr>        <chr>                                          <int>
##  1 slimfat0202 blue999      https://www.ptt.cc/bbs/Gossiping/M.1589985536~     8
##  2 gordan123   blue999      https://www.ptt.cc/bbs/Gossiping/M.1589985536~     8
##  3 gaddafi     blue999      https://www.ptt.cc/bbs/Gossiping/M.1589985536~     8
##  4 edc3        blue999      https://www.ptt.cc/bbs/Gossiping/M.1589985536~     8
##  5 KillerMoDo  alicevvn     https://www.ptt.cc/bbs/Gossiping/M.1590007049~     8
##  6 fleetindark alicevvn     https://www.ptt.cc/bbs/Gossiping/M.1590007049~     8
##  7 watashiD    DengXiaoPing https://www.ptt.cc/bbs/Gossiping/M.1590072754~     8
##  8 KillerMoDo  DengXiaoPing https://www.ptt.cc/bbs/Gossiping/M.1590072754~     8
##  9 kinmengon   DengXiaoPing https://www.ptt.cc/bbs/Gossiping/M.1590072754~     8
## 10 aaronfv     DengXiaoPing https://www.ptt.cc/bbs/Gossiping/M.1590072754~     8
## # ... with 129 more rows
# 篩選link中有出現的使用者
filtered_user <- userList %>%
          filter(user%in%link$cmtPoster | user%in%link$artPoster) %>%
          arrange(desc(type)) 
# 建立網路關係
reviewNetwork <- graph_from_data_frame(d=link, v=filtered_user, directed=F)

# 依據使用者身份對點上色
labels <- degree(reviewNetwork)
V(reviewNetwork)$label <- names(labels)
V(reviewNetwork)$color <- ifelse(V(reviewNetwork)$type=="poster", "gold", "lightblue")

# 依據回覆發生的文章所對應的主題,對他們的關聯線上色
E(reviewNetwork)$color <- ifelse(E(reviewNetwork)$topic == "7", "coral3", "cyan3")

# 畫出社群網路圖
set.seed(5000)
plot(reviewNetwork, vertex.size=6, edge.arrow.size=.2, edge.width=2,
     vertex.label=ifelse(degree(reviewNetwork) > 5, V(reviewNetwork)$label, NA),vertex.label.font=2)

# 加入標示
legend("bottomright", c("發文者","回文者"), pch=21, col="#777777", pt.bg=c("gold","lightblue"), pt.cex=1, cex=1)
legend("topleft", c("國安法", "移民"), col=c("coral3","cyan3"), lty=1, cex=1)

主要發文者:lovea,sam930114 lovea

HongKong_leader7 = HongKong %>% filter(artPoster=="lovea")
summary(HongKong_leader7)
##    artTitle            artDate             artTime             artUrl         
##  Length:3           Min.   :2019-09-21   Length:3           Length:3          
##  Class :character   1st Qu.:2020-01-21   Class :character   Class :character  
##  Mode  :character   Median :2020-05-22   Mode  :character   Mode  :character  
##                     Mean   :2020-03-02                                        
##                     3rd Qu.:2020-05-22                                        
##                     Max.   :2020-05-23                                        
##   artPoster            artCat            commentNum         push      
##  Length:3           Length:3           Min.   : 16.0   Min.   :  4.0  
##  Class :character   Class :character   1st Qu.: 18.5   1st Qu.:  7.5  
##  Mode  :character   Mode  :character   Median : 21.0   Median : 11.0  
##                                        Mean   :284.7   Mean   :130.3  
##                                        3rd Qu.:419.0   3rd Qu.:193.5  
##                                        Max.   :817.0   Max.   :376.0  
##       boo          sentence        
##  Min.   : 0.00   Length:3          
##  1st Qu.: 3.00   Class :character  
##  Median : 6.00   Mode  :character  
##  Mean   :26.33                     
##  3rd Qu.:39.50                     
##  Max.   :73.00
article_count_by_date <- HongKong_leader7 %>% 
  group_by(artDate) %>% 
  summarise(count = n())

article_count_by_date %>% 
  arrange(desc(count))%>% 
  top_n(10)
## Selecting by count
## # A tibble: 3 x 2
##   artDate    count
##   <date>     <int>
## 1 2019-09-21     1
## 2 2020-05-22     1
## 3 2020-05-23     1

他在全時段發送反送中文章的數量一共就三篇,時間跨度極大

HongKong_leader7 %>%
  select(artDate,commentNum)
##      artDate commentNum
## 1 2019-09-21         21
## 2 2020-05-22        817
## 3 2020-05-23         16

可以看出,這個人是依據5月22日的一篇文章瞬間爆紅的 找出他的文章

HongKong_leader7 
##                                       artTitle    artDate  artTime
## 1             [問卦]香港街頭很容易碰到明星嗎?? 2019-09-21 03:40:11
## 2 [新聞]快訊/總統府:「港版國安法」對香港民主 2020-05-22 04:44:47
## 3             [問卦]香港很像會錯正妹意的肥宅? 2020-05-23 06:28:37
##                                                     artUrl artPoster    artCat
## 1 https://www.ptt.cc/bbs/Gossiping/M.1569066373.A.9E8.html     lovea Gossiping
## 2 https://www.ptt.cc/bbs/Gossiping/M.1590122690.A.66E.html     lovea Gossiping
## 3 https://www.ptt.cc/bbs/Gossiping/M.1590215320.A.9D6.html     lovea Gossiping
##   commentNum push boo
## 1         21   11   0
## 2        817  376  73
## 3         16    4   6
##                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                    sentence
## 1                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                           香港面積小  人口密度高\n\n扣掉偏僻區域及山\n\n主要活動範圍就那些\n\n這樣484很容易在街上碰到明星啊???\n\n卦???\n
## 2 1.媒體來源:\nETTODAY\n\n2.記者署名:\n記者蔣婕妤/台北報導\n\n3.完整新聞標題:\n快訊/總統府:「港版國安法」對香港民主自由造成威脅\n\n4.完整新聞內文:\n\n中國大陸13屆全國人大第3次會議預計審議「港版國安法」,引發外界關注。總統府發言人\n黃重諺22日表示,此舉對香港的民主自由造成威脅,唯有儘速並誠意開啟社會對話,落實對\n港人自由民主的嚴肅承諾,才是解決問題的根本方案。\n\n此次「港版國安法」的推出備受國際關注,美國國務院21日發聲明,敦促北京對香港自治及\n自由作出承諾,警告切勿在港實施國安法,美國總統川普在同一天也表示,中方一旦在港實\n施《國安法》,美國會作出強烈反應,但他未有加以說明。\n\n由於「港版國安法」是一部全國性法律,其中可以寫入建立中央層級的維護國家安全機制的\n規定;未來如香港特區根據基本法第23條的規定履行憲制責任完成維護國家安全立法工作,\n這將有望在香港形成維護國家安全的的新模式,換言之,亦即國家和香港特區共同就維護國\n家安全問題制定法律,並在香港確立國家安全立法的「雙層執行機制」。\n\n對於中國全國人大會議將審議港版國安法(全名:建立健全香港特別行政區維護國家安全的\n法律制度和執行機制的決定草案),黃重諺表示,總統府表達高度關切。香港問題的解決之\n鑰,在於北京與香港政府必須真誠回應人民訴求,具體落實對香港自由民主的承諾,而非限\n縮香港人的自由與民主。\n\n黃重諺強調,唯有儘速並誠意開啟社會對話,落實對港人自由民主的嚴肅承諾,才是解決問\n題的根本方案,同時,\n這也證明「一國兩制」與民主自由的必然扞格\n,\n5.完整新聞連結 (或短網址):\nhttps://www.ettoday.net/news/20200522/1720161.htm?from=dable_Secret_ettoday\n6.備註:\n\n2024一月再來啦 ZZZzzz....\n
## 3                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                    正妹:「有什麼困難一定要跟我說喔,不要悶在心裡,我真的很在乎你的感受。」\n\n正妹:「沒有你就沒有我。」\n\n(各種撩和肢體不經意碰觸,還不時摸宅的臉)\n\n肥宅:「謝謝你(羞)。」\n\n(天哪,她是不是喜歡我?)\n\n(整個暈船上鉤)\n\n肥宅:「正妹,我喜歡你,想跟你永遠在一起。」\n\n正妹:「你說什麼?我們不是好朋友嗎?我對你沒有那種意思,抱歉。」\n\n正妹:「那時候只是看你有困難,關心你而已,並不打算介入,怎<U+9EBD>當真了呢?」\n\n香港是不是很像會錯正妹意思的肥宅?\n\n卦?\n

他在5月22日轉載了一篇新聞。

推噓文

# 把回覆類型為箭頭的回覆移除
link <- posts_Reviews %>%
      filter(cmtStatus!="→") %>%
      group_by(cmtPoster, artUrl) %>% 
      filter(n()>12) %>% 
      ungroup() %>% 
      select(cmtPoster, artPoster, artUrl, cmtStatus) %>% 
      unique()

# 篩選link中有出現的使用者
filtered_user <- userList %>%
          filter(user%in%link$cmtPoster | user%in%link$artPoster) %>%
          arrange(desc(type))

# 建立網路關係
reviewNetwork <- graph_from_data_frame(d=link, v=filtered_user, directed=F)

# 依據使用者身份對點進行上色
labels <- degree(reviewNetwork)
V(reviewNetwork)$label <- names(labels)
V(reviewNetwork)$color <- ifelse(V(reviewNetwork)$type=="poster", "gold", "lightblue")


# 依據回覆發生的文章所對應的主題,對他們的關聯線進行上色
E(reviewNetwork)$color <- ifelse(E(reviewNetwork)$cmtStatus == "推", "lightgreen", "palevioletred")

# 畫出社群網路圖
set.seed(487)
plot(reviewNetwork, vertex.size=5, edge.arrow.size=.2, edge.width=3,
     vertex.label=ifelse(degree(reviewNetwork) > 3, V(reviewNetwork)$label, NA),vertex.label.font=2)

# 加入標示
legend("bottomright", c("發文者","回文者"), pch=21, col="#777777", pt.bg=c("gold","lightblue"), pt.cex=1, cex=1)
legend("topleft", c("推","噓"), col=c("lightgreen","palevioletred"), lty=1, cex=1)

主要發文者:ckbdfrst,taikonkimo ckbdfrst

HongKong_leader5 = HongKong %>% filter(artPoster=="ckbdfrst")
summary(HongKong_leader5)
##    artTitle            artDate             artTime             artUrl         
##  Length:47          Min.   :2019-07-26   Length:47          Length:47         
##  Class :character   1st Qu.:2019-08-21   Class :character   Class :character  
##  Mode  :character   Median :2019-09-23   Mode  :character   Mode  :character  
##                     Mean   :2019-09-26                                        
##                     3rd Qu.:2019-11-12                                        
##                     Max.   :2019-11-30                                        
##   artPoster            artCat            commentNum          push       
##  Length:47          Length:47          Min.   :  1.00   Min.   :  1.00  
##  Class :character   Class :character   1st Qu.: 11.50   1st Qu.:  4.50  
##  Mode  :character   Mode  :character   Median : 22.00   Median : 10.00  
##                                        Mean   : 59.49   Mean   : 36.49  
##                                        3rd Qu.: 59.50   3rd Qu.: 23.00  
##                                        Max.   :695.00   Max.   :446.00  
##       boo           sentence        
##  Min.   : 0.000   Length:47         
##  1st Qu.: 0.000   Class :character  
##  Median : 1.000   Mode  :character  
##  Mean   : 3.064                     
##  3rd Qu.: 4.000                     
##  Max.   :26.000
HongKong %>%
  filter(artPoster=="ckbdfrst") %>%
  select(artTitle, artDate)
##                                                     artTitle    artDate
## 1               [新聞]批香港民陣中國外交部:勾結外部勢力沒好 2019-07-26
## 2               [新聞]反送中再寫歷史光復元朗成新界史上最壯觀 2019-07-27
## 3                                    Re:[問卦]香港民主??? 2019-07-27
## 4               [新聞]撇中聯辦反送中港人突襲遊行至銅鑼灣[影] 2019-07-28
## 5               [新聞]港運動員連署挺反送中:香港是否仍令我們 2019-07-29
## 6               [新聞]中國外交部:反送中是美方作品欠世界一個 2019-07-30
## 7               [新聞]輸不起轉生氣中國少年冰球隊員群毆香港隊 2019-08-01
## 8                 [新聞]香港政局掀罵戰中美連續兩天互批不停嘴 2019-08-09
## 9                     [問卦]媒體不公香港撐警活動怎麼不報導? 2019-08-12
## 10              [新聞]新華社羅織反送中頭目名單黃之鋒黎智英等 2019-08-13
## 11                     Re:[爆卦]英國總領事館派人進駐香港機場 2019-08-15
## 12             Re:[新聞]台灣將供香港人道救援國台辦超不爽:罔 2019-08-19
## 13                        [新聞]香港人鏈28英里手牽手要求民主 2019-08-24
## 14                [新聞]美國會山紀念「波羅的海之路」聲援香港 2019-08-25
## 15            Re:[問卦]跟香港人說香港=中國,香港人爆氣的卦? 2019-08-29
## 16                    [新聞]疑似美國人遭香港警察逮捕原因不明 2019-09-01
## 17              [新聞]使館人員反制反送中過激立陶宛召見中國大 2019-09-02
## 18              [新聞]遮打花園民眾祈福高呼「驅逐共黨光復香港 2019-09-08
## 19             [問卦]有沒有香港新國歌【願榮光歸香港】的8卦? 2019-09-10
## 20             Re:[新聞]「願榮光歸香港」反送中新神曲響徹港島 2019-09-12
## 21                [新聞]穆迪調降香港信用評級林鄭月娥:不認同 2019-09-17
## 22              [新聞]香港反送中運動百日民間訴求轉向驅逐中共 2019-09-18
## 23              [新聞]反送中遊行屯門登場示威者扯下五星旗焚燒 2019-09-21
## 24                     [新聞]反送中訴求反極權929串聯全球遊行 2019-09-23
## 25                    [新聞]柏林牆倒塌30年德國人挺香港反中共 2019-09-29
## 26              [新聞]中共十一香港山頭現「結束一黨專政」橫幅 2019-10-01
## 27                    [爆卦]香港連登仔再譜新曲《不屈進行曲》 2019-10-03
## 28                  [新聞]挺香港快閃活動中山連儂隧道百人高歌 2019-10-04
## 29                                [新聞]香港特首評分再創新低 2019-10-08
## 30                  [爆卦]香港警方發言人被爆正在申請美國綠卡 2019-10-09
## 31             [問卦]香港黑警被錄下最中國口音的影片是這個嗎? 2019-10-11
## 32              [新聞]美參議員親歷反送中籲重審北京奧運主辦權 2019-10-18
## 33                  [新聞]中學生:若因為怕不站出來香港就完了 2019-10-20
## 34 Re:[新聞]港警開火放3槍:西灣河1人重傷,香港1111大三罷鎮壓 2019-11-11
## 35                     [問卦]請問香港人聽到獅子山下會感動嗎? 2019-11-12
## 36                         Re:[爆卦]香港警察準備進攻中文大學 2019-11-12
## 37             [問卦]香港中大警民衝突光是命名就對虫國不利??? 2019-11-13
## 38              [新聞]救香港 美委員會建議國會立法嚇阻解放軍 2019-11-15
## 39              [新聞]中共竟要求馬國媒體寫「中國包括台灣香港 2019-11-16
## 40              [新聞]港人齊聚劍橋示威要求撤銷林鄭月娥榮譽院 2019-11-17
## 41                     Re:[問卦]看到香港直播很傷心正常嗎?? 2019-11-17
## 42                [問卦]虫國人請進。請問香港大學裏沒好人嗎? 2019-11-17
## 43              [新聞]香港理大警民衝突美官員:譴責不合理使用 2019-11-18
## 44             [問卦]嗆等著看香港選舉的中國人現在到哪去了?! 2019-11-25
## 45              [新聞]川普簽香港法案前發硬漢圖片網民:看懂了 2019-11-28
## 46              [新聞]中國創新捲共諜疑雲悄關子公司未通報香港 2019-11-29
## 47               [新聞]廣東火葬場惹議停建示威輿論猛cue香港反 2019-11-30
plot_date <- 
  # data
  HongKong_leader5 %>% 
  # aesthetics
  ggplot(aes(x = artDate, y = commentNum)) +
  # geometrics
  geom_line(color = "#00AFBB", size = 1) + 
  # coordinates
  scale_x_date(labels) +
  ggtitle("ckbdfrst討論文章數") + 
  xlab("日期") + 
  ylab("發文數")

plot_date

文字雲

HongKong_sentences_leader5 <- strsplit(HongKong_leader5$sentence,"[。!;?!?;]")

# 將每個句子與所屬的文章連結配對起來,整理成 dataframe
HongKong_sentences_leader5  <- data.frame(
  artUrl = rep(HongKong_leader5$artUrl, sapply(HongKong_sentences_leader5, length)), 
  sentence = unlist(HongKong_sentences_leader5)) %>%
  filter(!str_detect(sentence, regex("^(\t|\n| )*$")))
HongKong_sentences_leader5$sentence <- as.character(HongKong_sentences_leader5$sentence)

# 使用斷詞引擎,放入要用的詞典和停用字
jieba_tokenizer = worker(user="detention_lexicon.txt", stop_word = "stop_words.txt", write = "NOFILE")
chi_tokenizer <- function(t) {
  lapply(t, function(x) {
    if(nchar(x)>1){
      tokens <- segment(x, jieba_tokenizer)
      tokens <- tokens[nchar(tokens)>1]
      return(tokens)
    }
  })
}

# 進行斷詞,並計算各詞彙在各文章中出現的次數
HongKong_words_leader5 <- HongKong_sentences_leader5 %>%
  unnest_tokens(word, sentence, token=chi_tokenizer) %>%
  filter(!str_detect(word, regex("[0-9a-zA-Z]"))) %>%
  count(artUrl, word, sort = TRUE)

# 畫出文字雲
HongKong_words_leader5 %>%
   group_by(word) %>%
   summarise(sum = n()) %>%
   filter(sum > 2)  %>%
   arrange(desc(sum)) %>%
   wordcloud2()

可以看出來這個人的文章以抨擊中國政府為主,藉助反送中來表達對中國政府的不滿。 taikonkimo

HongKong_leader6 = HongKong %>% filter(artPoster=="taikonkimo")
HongKong_leader6
##                                        artTitle    artDate  artTime
## 1 Re:[新聞]若台灣可輕易被幹掉柯文哲:中國對香港 2019-08-04 09:06:04
##                                                     artUrl  artPoster    artCat
## 1 https://www.ptt.cc/bbs/Gossiping/M.1564938726.A.340.html taikonkimo Gossiping
##   commentNum push boo
## 1        564   56 102
##                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                sentence
## 1 柯這句 講得是美中站邊\n\n「台灣當美國小弟要拿扁鑽往前走」柯文哲:扁鑽還要自費\n啥時是指軍購\n美國 柯講川普 你直接套美國了\n這是柯粉超譯 還是你\n軍購 柯講過 台灣改募兵 人事費上升 結果軍購費用反而減少\n所以 你在講啥不得了\n\n談募兵徵兵稱美國意見柯文哲駁軍方看法\n這的確形容蔡親美\n\n但啥時有講強盜是誰 警察是誰 這又是柯粉超譯 還是你\n柯第一時間是講 香港的一國兩制人會跑光光阿\n這的確口誤 沒話說 之後講同樣的 就講把國防和美合作 經濟和中共合作了\n\n2019年4月3日 - 台北市長柯文哲在今天中午播出的「94要客訴」中重申,親美友中是台\n灣最適當國家戰略,必須保持彈性,如國防與美國合作、經濟與中國合作\n今天你PO的這篇原新聞\n柯嘴了中共香港一堆\n連64都講出來了\n你不開心嗎\n這句我也不喜歡 但柯從沒吞過92 甚至一國兩制\n他自己也嘴過一國兩制不少次 不是沒講\n

這個人也是在全時段只發了一篇反送中相關文章。這唯一一篇文章爆紅。 研究一下他的文章回復情況。

HongKong_review3 = HongKong_review2 %>% filter(cmtPoster=="taikonkimo")

HongKong_review3 
##                                                          artTitle    artDate
## 1                       [新聞]反送中越演越烈柯P:台灣強大才能提供 2019/07/29
## 2                       [新聞]反送中越演越烈柯P:台灣強大才能提供 2019/07/29
## 3                       [新聞]反送中越演越烈柯P:台灣強大才能提供 2019/07/29
## 4                       [新聞]反送中越演越烈柯P:台灣強大才能提供 2019/07/29
## 5                       [新聞]反送中越演越烈柯P:台灣強大才能提供 2019/07/29
## 6                    Re:[新聞]反送中越演越烈柯P:台灣強大才能提供 2019/07/29
## 7                    Re:[新聞]反送中越演越烈柯P:台灣強大才能提供 2019/07/29
## 8                    Re:[新聞]反送中越演越烈柯P:台灣強大才能提供 2019/07/29
## 9                      [新聞]習大大跌至歷史新低!香港民調:蔡英文 2019/07/30
## 10                     [新聞]若台灣可輕易被幹掉柯文哲:中國對香港 2019/08/04
## 11                     [新聞]若台灣可輕易被幹掉柯文哲:中國對香港 2019/08/04
## 12                     [新聞]若台灣可輕易被幹掉柯文哲:中國對香港 2019/08/04
## 13                     [新聞]若台灣可輕易被幹掉柯文哲:中國對香港 2019/08/04
## 14                     [新聞]若台灣可輕易被幹掉柯文哲:中國對香港 2019/08/04
## 15                     [新聞]若台灣可輕易被幹掉柯文哲:中國對香港 2019/08/04
## 16                     [新聞]若台灣可輕易被幹掉柯文哲:中國對香港 2019/08/04
## 17                     [新聞]若台灣可輕易被幹掉柯文哲:中國對香港 2019/08/04
## 18                     [新聞]若台灣可輕易被幹掉柯文哲:中國對香港 2019/08/04
## 19                     [新聞]若台灣可輕易被幹掉柯文哲:中國對香港 2019/08/04
## 20                     [新聞]若台灣可輕易被幹掉柯文哲:中國對香港 2019/08/04
## 21                     [新聞]若台灣可輕易被幹掉柯文哲:中國對香港 2019/08/04
## 22                     [新聞]若台灣可輕易被幹掉柯文哲:中國對香港 2019/08/04
## 23                     [新聞]若台灣可輕易被幹掉柯文哲:中國對香港 2019/08/04
## 24                     [新聞]若台灣可輕易被幹掉柯文哲:中國對香港 2019/08/04
## 25                     [新聞]若台灣可輕易被幹掉柯文哲:中國對香港 2019/08/04
## 26                     [新聞]若台灣可輕易被幹掉柯文哲:中國對香港 2019/08/04
## 27                  Re:[新聞]若台灣可輕易被幹掉柯文哲:中國對香港 2019/08/04
## 28                  Re:[新聞]若台灣可輕易被幹掉柯文哲:中國對香港 2019/08/04
## 29                  Re:[新聞]若台灣可輕易被幹掉柯文哲:中國對香港 2019/08/04
## 30                   [新聞]對香港問題不表態?柯文哲:隔壁住神經病 2019/08/23
## 31                   [新聞]對香港問題不表態?柯文哲:隔壁住神經病 2019/08/23
## 32                   [新聞]對香港問題不表態?柯文哲:隔壁住神經病 2019/08/23
## 33                    Re:[新聞]黃之鋒籲:全台總動員站出來支持香港 2019/09/03
## 34                     [新聞]撐香港最好方法蔡英文:守護好台灣民主 2019/09/07
## 35                     [新聞]撐香港最好方法蔡英文:守護好台灣民主 2019/09/07
## 36               [新聞]柯文哲:北京須智慧處理香港局面而非簡化問題 2019/09/28
## 37                     [新聞]談反送中柯文哲:民進黨要讓恐懼瀰漫全 2019/09/28
## 38                    [新聞]港警對反送中學生開槍柯P:若他身亡一定 2019/10/01
## 39                    [新聞]港警對反送中學生開槍柯P:若他身亡一定 2019/10/01
## 40                 Re:[新聞]港警對反送中學生開槍柯P:若他身亡一定 2019/10/01
## 41                                   [爆卦]川普願為貿易戰放棄香港 2019/10/04
## 42                     [新聞]美國不插手了?川普:香港問題會自行解 2019/10/14
## 43                     [新聞]美國不插手了?川普:香港問題會自行解 2019/10/14
## 44                     [新聞]美國不插手了?川普:香港問題會自行解 2019/10/14
## 45             [新聞]柯文哲:扣掉香港、韓國瑜小英沒理由贏這麼輕鬆 2019/12/03
## 46             [新聞]柯文哲:扣掉香港、韓國瑜小英沒理由贏這麼輕鬆 2019/12/03
## 47  Re:[新聞]台灣非中國核心重點?柯文哲:香港不解決,還解決台灣? 2019/12/06
## 48  Re:[新聞]台灣非中國核心重點?柯文哲:香港不解決,還解決台灣? 2019/12/06
## 49                   [新聞]香港浸大學生會長:民進黨用港人鮮血換選 2019/12/08
## 50                   [新聞]香港浸大學生會長:民進黨用港人鮮血換選 2019/12/08
## 51                   [新聞]香港浸大學生會長:民進黨用港人鮮血換選 2019/12/08
## 52                   [新聞]香港浸大學生會長:民進黨用港人鮮血換選 2019/12/08
## 53                   [新聞]香港浸大學生會長:民進黨用港人鮮血換選 2019/12/08
## 54                   [新聞]香港浸大學生會長:民進黨用港人鮮血換選 2019/12/08
## 55                   [新聞]香港浸大學生會長:民進黨用港人鮮血換選 2019/12/08
## 56                   [新聞]香港浸大學生會長:民進黨用港人鮮血換選 2019/12/08
## 57                   [新聞]香港浸大學生會長:民進黨用港人鮮血換選 2019/12/08
## 58                   [新聞]香港浸大學生會長:民進黨用港人鮮血換選 2019/12/08
## 59                   [新聞]香港浸大學生會長:民進黨用港人鮮血換選 2019/12/08
## 60                   [新聞]香港浸大學生會長:民進黨用港人鮮血換選 2019/12/08
## 61                   [新聞]香港浸大學生會長:民進黨用港人鮮血換選 2019/12/08
## 62                   [新聞]香港浸大學生會長:民進黨用港人鮮血換選 2019/12/08
## 63                   [新聞]香港浸大學生會長:民進黨用港人鮮血換選 2019/12/08
## 64                   [新聞]香港浸大學生會長:民進黨用港人鮮血換選 2019/12/08
## 65                Re:[新聞]香港浸大學生會長:民進黨用港人鮮血換選 2019/12/08
## 66                Re:[新聞]香港浸大學生會長:民進黨用港人鮮血換選 2019/12/08
## 67                Re:[新聞]香港浸大學生會長:民進黨用港人鮮血換選 2019/12/08
## 68                Re:[新聞]香港浸大學生會長:民進黨用港人鮮血換選 2019/12/08
## 69                Re:[新聞]香港浸大學生會長:民進黨用港人鮮血換選 2019/12/08
## 70                Re:[新聞]香港浸大學生會長:民進黨用港人鮮血換選 2019/12/08
## 71                Re:[新聞]香港浸大學生會長:民進黨用港人鮮血換選 2019/12/08
## 72                Re:[新聞]香港浸大學生會長:民進黨用港人鮮血換選 2019/12/09
## 73                Re:[新聞]香港浸大學生會長:民進黨用港人鮮血換選 2019/12/09
## 74                Re:[新聞]香港浸大學生會長:民進黨用港人鮮血換選 2019/12/09
## 75                Re:[新聞]香港浸大學生會長:民進黨用港人鮮血換選 2019/12/09
## 76                Re:[新聞]香港浸大學生會長:民進黨用港人鮮血換選 2019/12/09
## 77                Re:[新聞]香港浸大學生會長:民進黨用港人鮮血換選 2019/12/09
## 78                Re:[新聞]香港浸大學生會長:民進黨用港人鮮血換選 2019/12/09
## 79                Re:[新聞]香港浸大學生會長:民進黨用港人鮮血換選 2019/12/09
## 80                Re:[新聞]香港浸大學生會長:民進黨用港人鮮血換選 2019/12/09
## 81                Re:[新聞]香港浸大學生會長:民進黨用港人鮮血換選 2019/12/09
## 82                Re:[新聞]香港浸大學生會長:民進黨用港人鮮血換選 2019/12/09
## 83                Re:[新聞]香港浸大學生會長:民進黨用港人鮮血換選 2019/12/09
## 84                Re:[新聞]香港浸大學生會長:民進黨用港人鮮血換選 2019/12/09
## 85                Re:[新聞]香港浸大學生會長:民進黨用港人鮮血換選 2019/12/09
## 86                Re:[新聞]香港浸大學生會長:民進黨用港人鮮血換選 2019/12/09
## 87                Re:[新聞]香港浸大學生會長:民進黨用港人鮮血換選 2019/12/09
## 88                Re:[新聞]香港浸大學生會長:民進黨用港人鮮血換選 2019/12/09
## 89                Re:[新聞]香港浸大學生會長:民進黨用港人鮮血換選 2019/12/09
## 90                Re:[新聞]香港浸大學生會長:民進黨用港人鮮血換選 2019/12/09
## 91                Re:[新聞]香港浸大學生會長:民進黨用港人鮮血換選 2019/12/09
## 92                Re:[新聞]香港浸大學生會長:民進黨用港人鮮血換選 2019/12/09
## 93                Re:[新聞]香港浸大學生會長:民進黨用港人鮮血換選 2019/12/09
## 94                Re:[新聞]香港浸大學生會長:民進黨用港人鮮血換選 2019/12/09
## 95                Re:[新聞]香港浸大學生會長:民進黨用港人鮮血換選 2019/12/09
## 96                Re:[新聞]香港浸大學生會長:民進黨用港人鮮血換選 2019/12/09
## 97                Re:[新聞]香港浸大學生會長:民進黨用港人鮮血換選 2019/12/09
## 98                Re:[新聞]香港浸大學生會長:民進黨用港人鮮血換選 2019/12/09
## 99                Re:[新聞]香港浸大學生會長:民進黨用港人鮮血換選 2019/12/09
## 100               Re:[新聞]香港浸大學生會長:民進黨用港人鮮血換選 2019/12/09
## 101               Re:[新聞]香港浸大學生會長:民進黨用港人鮮血換選 2019/12/09
## 102               Re:[新聞]香港浸大學生會長:民進黨用港人鮮血換選 2019/12/09
## 103               Re:[新聞]香港浸大學生會長:民進黨用港人鮮血換選 2019/12/09
## 104               Re:[新聞]香港浸大學生會長:民進黨用港人鮮血換選 2019/12/09
## 105               Re:[新聞]香港浸大學生會長:民進黨用港人鮮血換選 2019/12/09
## 106               Re:[新聞]香港浸大學生會長:民進黨用港人鮮血換選 2019/12/09
## 107               Re:[新聞]香港浸大學生會長:民進黨用港人鮮血換選 2019/12/09
## 108               Re:[新聞]香港浸大學生會長:民進黨用港人鮮血換選 2019/12/09
## 109               Re:[新聞]香港浸大學生會長:民進黨用港人鮮血換選 2019/12/09
## 110               Re:[新聞]香港浸大學生會長:民進黨用港人鮮血換選 2019/12/09
## 111               Re:[新聞]香港浸大學生會長:民進黨用港人鮮血換選 2019/12/09
## 112               Re:[新聞]香港浸大學生會長:民進黨用港人鮮血換選 2019/12/09
## 113               Re:[新聞]香港浸大學生會長:民進黨用港人鮮血換選 2019/12/09
## 114               Re:[新聞]香港浸大學生會長:民進黨用港人鮮血換選 2019/12/09
## 115               Re:[新聞]香港浸大學生會長:民進黨用港人鮮血換選 2019/12/09
## 116               Re:[新聞]香港浸大學生會長:民進黨用港人鮮血換選 2019/12/09
## 117               Re:[新聞]香港浸大學生會長:民進黨用港人鮮血換選 2019/12/09
## 118               Re:[新聞]香港浸大學生會長:民進黨用港人鮮血換選 2019/12/09
##      artTime                                                   artUrl
## 1   02:11:20 https://www.ptt.cc/bbs/Gossiping/M.1564395443.A.666.html
## 2   02:11:20 https://www.ptt.cc/bbs/Gossiping/M.1564395443.A.666.html
## 3   02:11:20 https://www.ptt.cc/bbs/Gossiping/M.1564395443.A.666.html
## 4   02:11:20 https://www.ptt.cc/bbs/Gossiping/M.1564395443.A.666.html
## 5   02:11:20 https://www.ptt.cc/bbs/Gossiping/M.1564395443.A.666.html
## 6   05:46:34 https://www.ptt.cc/bbs/Gossiping/M.1564408356.A.4DB.html
## 7   05:46:34 https://www.ptt.cc/bbs/Gossiping/M.1564408356.A.4DB.html
## 8   05:46:34 https://www.ptt.cc/bbs/Gossiping/M.1564408356.A.4DB.html
## 9   01:43:36 https://www.ptt.cc/bbs/Gossiping/M.1564480178.A.196.html
## 10  06:28:53 https://www.ptt.cc/bbs/Gossiping/M.1564929296.A.1B0.html
## 11  06:28:53 https://www.ptt.cc/bbs/Gossiping/M.1564929296.A.1B0.html
## 12  06:28:53 https://www.ptt.cc/bbs/Gossiping/M.1564929296.A.1B0.html
## 13  06:28:53 https://www.ptt.cc/bbs/Gossiping/M.1564929296.A.1B0.html
## 14  06:28:53 https://www.ptt.cc/bbs/Gossiping/M.1564929296.A.1B0.html
## 15  06:28:53 https://www.ptt.cc/bbs/Gossiping/M.1564929296.A.1B0.html
## 16  06:28:53 https://www.ptt.cc/bbs/Gossiping/M.1564929296.A.1B0.html
## 17  06:28:53 https://www.ptt.cc/bbs/Gossiping/M.1564929296.A.1B0.html
## 18  06:28:53 https://www.ptt.cc/bbs/Gossiping/M.1564929296.A.1B0.html
## 19  06:28:53 https://www.ptt.cc/bbs/Gossiping/M.1564929296.A.1B0.html
## 20  06:28:53 https://www.ptt.cc/bbs/Gossiping/M.1564929296.A.1B0.html
## 21  06:28:53 https://www.ptt.cc/bbs/Gossiping/M.1564929296.A.1B0.html
## 22  06:28:53 https://www.ptt.cc/bbs/Gossiping/M.1564929296.A.1B0.html
## 23  06:28:53 https://www.ptt.cc/bbs/Gossiping/M.1564929296.A.1B0.html
## 24  06:28:53 https://www.ptt.cc/bbs/Gossiping/M.1564929296.A.1B0.html
## 25  06:28:53 https://www.ptt.cc/bbs/Gossiping/M.1564929296.A.1B0.html
## 26  06:28:53 https://www.ptt.cc/bbs/Gossiping/M.1564929296.A.1B0.html
## 27  07:14:09 https://www.ptt.cc/bbs/Gossiping/M.1564932011.A.D45.html
## 28  07:14:09 https://www.ptt.cc/bbs/Gossiping/M.1564932011.A.D45.html
## 29  07:14:09 https://www.ptt.cc/bbs/Gossiping/M.1564932011.A.D45.html
## 30  16:33:24 https://www.ptt.cc/bbs/Gossiping/M.1566607167.A.B5E.html
## 31  16:33:24 https://www.ptt.cc/bbs/Gossiping/M.1566607167.A.B5E.html
## 32  16:33:24 https://www.ptt.cc/bbs/Gossiping/M.1566607167.A.B5E.html
## 33  22:21:04 https://www.ptt.cc/bbs/Gossiping/M.1567578426.A.4DD.html
## 34  17:28:06 https://www.ptt.cc/bbs/Gossiping/M.1567906448.A.EA1.html
## 35  17:28:06 https://www.ptt.cc/bbs/Gossiping/M.1567906448.A.EA1.html
## 36  01:31:22 https://www.ptt.cc/bbs/Gossiping/M.1569663445.A.DE5.html
## 37  05:05:59 https://www.ptt.cc/bbs/Gossiping/M.1569676323.A.5DD.html
## 38  21:33:40 https://www.ptt.cc/bbs/Gossiping/M.1569994786.A.628.html
## 39  21:33:40 https://www.ptt.cc/bbs/Gossiping/M.1569994786.A.628.html
## 40  23:35:12 https://www.ptt.cc/bbs/Gossiping/M.1570002076.A.806.html
## 41  00:38:02 https://www.ptt.cc/bbs/Gossiping/M.1570178644.A.088.html
## 42  04:28:29 https://www.ptt.cc/bbs/Gossiping/M.1571056472.A.288.html
## 43  04:28:29 https://www.ptt.cc/bbs/Gossiping/M.1571056472.A.288.html
## 44  04:28:29 https://www.ptt.cc/bbs/Gossiping/M.1571056472.A.288.html
## 45  05:10:40 https://www.ptt.cc/bbs/Gossiping/M.1575379002.A.4D1.html
## 46  05:10:40 https://www.ptt.cc/bbs/Gossiping/M.1575379002.A.4D1.html
## 47  19:47:44 https://www.ptt.cc/bbs/Gossiping/M.1575690826.A.BFC.html
## 48  19:47:44 https://www.ptt.cc/bbs/Gossiping/M.1575690826.A.BFC.html
## 49  17:48:00 https://www.ptt.cc/bbs/Gossiping/M.1575856443.A.100.html
## 50  17:48:00 https://www.ptt.cc/bbs/Gossiping/M.1575856443.A.100.html
## 51  17:48:00 https://www.ptt.cc/bbs/Gossiping/M.1575856443.A.100.html
## 52  17:48:00 https://www.ptt.cc/bbs/Gossiping/M.1575856443.A.100.html
## 53  17:48:00 https://www.ptt.cc/bbs/Gossiping/M.1575856443.A.100.html
## 54  17:48:00 https://www.ptt.cc/bbs/Gossiping/M.1575856443.A.100.html
## 55  17:48:00 https://www.ptt.cc/bbs/Gossiping/M.1575856443.A.100.html
## 56  17:48:00 https://www.ptt.cc/bbs/Gossiping/M.1575856443.A.100.html
## 57  17:48:00 https://www.ptt.cc/bbs/Gossiping/M.1575856443.A.100.html
## 58  17:48:00 https://www.ptt.cc/bbs/Gossiping/M.1575856443.A.100.html
## 59  17:48:00 https://www.ptt.cc/bbs/Gossiping/M.1575856443.A.100.html
## 60  17:48:00 https://www.ptt.cc/bbs/Gossiping/M.1575856443.A.100.html
## 61  17:48:00 https://www.ptt.cc/bbs/Gossiping/M.1575856443.A.100.html
## 62  17:48:00 https://www.ptt.cc/bbs/Gossiping/M.1575856443.A.100.html
## 63  17:48:00 https://www.ptt.cc/bbs/Gossiping/M.1575856443.A.100.html
## 64  17:48:00 https://www.ptt.cc/bbs/Gossiping/M.1575856443.A.100.html
## 65  19:05:23 https://www.ptt.cc/bbs/Gossiping/M.1575861086.A.FC4.html
## 66  19:17:15 https://www.ptt.cc/bbs/Gossiping/M.1575861797.A.C34.html
## 67  21:33:16 https://www.ptt.cc/bbs/Gossiping/M.1575869959.A.412.html
## 68  21:33:16 https://www.ptt.cc/bbs/Gossiping/M.1575869959.A.412.html
## 69  21:33:16 https://www.ptt.cc/bbs/Gossiping/M.1575869959.A.412.html
## 70  21:41:19 https://www.ptt.cc/bbs/Gossiping/M.1575870441.A.0C6.html
## 71  22:50:24 https://www.ptt.cc/bbs/Gossiping/M.1575874586.A.CB0.html
## 72  17:27:52 https://www.ptt.cc/bbs/Gossiping/M.1575941634.A.F31.html
## 73  17:27:52 https://www.ptt.cc/bbs/Gossiping/M.1575941634.A.F31.html
## 74  17:27:52 https://www.ptt.cc/bbs/Gossiping/M.1575941634.A.F31.html
## 75  17:27:52 https://www.ptt.cc/bbs/Gossiping/M.1575941634.A.F31.html
## 76  17:27:52 https://www.ptt.cc/bbs/Gossiping/M.1575941634.A.F31.html
## 77  17:27:52 https://www.ptt.cc/bbs/Gossiping/M.1575941634.A.F31.html
## 78  17:27:52 https://www.ptt.cc/bbs/Gossiping/M.1575941634.A.F31.html
## 79  17:27:52 https://www.ptt.cc/bbs/Gossiping/M.1575941634.A.F31.html
## 80  17:27:52 https://www.ptt.cc/bbs/Gossiping/M.1575941634.A.F31.html
## 81  17:27:52 https://www.ptt.cc/bbs/Gossiping/M.1575941634.A.F31.html
## 82  17:27:52 https://www.ptt.cc/bbs/Gossiping/M.1575941634.A.F31.html
## 83  17:27:52 https://www.ptt.cc/bbs/Gossiping/M.1575941634.A.F31.html
## 84  17:27:52 https://www.ptt.cc/bbs/Gossiping/M.1575941634.A.F31.html
## 85  17:27:52 https://www.ptt.cc/bbs/Gossiping/M.1575941634.A.F31.html
## 86  17:27:52 https://www.ptt.cc/bbs/Gossiping/M.1575941634.A.F31.html
## 87  17:27:52 https://www.ptt.cc/bbs/Gossiping/M.1575941634.A.F31.html
## 88  17:27:52 https://www.ptt.cc/bbs/Gossiping/M.1575941634.A.F31.html
## 89  17:27:52 https://www.ptt.cc/bbs/Gossiping/M.1575941634.A.F31.html
## 90  17:27:52 https://www.ptt.cc/bbs/Gossiping/M.1575941634.A.F31.html
## 91  17:27:52 https://www.ptt.cc/bbs/Gossiping/M.1575941634.A.F31.html
## 92  17:27:52 https://www.ptt.cc/bbs/Gossiping/M.1575941634.A.F31.html
## 93  17:27:52 https://www.ptt.cc/bbs/Gossiping/M.1575941634.A.F31.html
## 94  17:27:52 https://www.ptt.cc/bbs/Gossiping/M.1575941634.A.F31.html
## 95  17:27:52 https://www.ptt.cc/bbs/Gossiping/M.1575941634.A.F31.html
## 96  17:27:52 https://www.ptt.cc/bbs/Gossiping/M.1575941634.A.F31.html
## 97  17:27:52 https://www.ptt.cc/bbs/Gossiping/M.1575941634.A.F31.html
## 98  17:27:52 https://www.ptt.cc/bbs/Gossiping/M.1575941634.A.F31.html
## 99  17:27:52 https://www.ptt.cc/bbs/Gossiping/M.1575941634.A.F31.html
## 100 17:27:52 https://www.ptt.cc/bbs/Gossiping/M.1575941634.A.F31.html
## 101 17:27:52 https://www.ptt.cc/bbs/Gossiping/M.1575941634.A.F31.html
## 102 17:27:52 https://www.ptt.cc/bbs/Gossiping/M.1575941634.A.F31.html
## 103 17:27:52 https://www.ptt.cc/bbs/Gossiping/M.1575941634.A.F31.html
## 104 17:27:52 https://www.ptt.cc/bbs/Gossiping/M.1575941634.A.F31.html
## 105 17:27:52 https://www.ptt.cc/bbs/Gossiping/M.1575941634.A.F31.html
## 106 17:27:52 https://www.ptt.cc/bbs/Gossiping/M.1575941634.A.F31.html
## 107 17:27:52 https://www.ptt.cc/bbs/Gossiping/M.1575941634.A.F31.html
## 108 17:27:52 https://www.ptt.cc/bbs/Gossiping/M.1575941634.A.F31.html
## 109 17:27:52 https://www.ptt.cc/bbs/Gossiping/M.1575941634.A.F31.html
## 110 17:27:52 https://www.ptt.cc/bbs/Gossiping/M.1575941634.A.F31.html
## 111 17:27:52 https://www.ptt.cc/bbs/Gossiping/M.1575941634.A.F31.html
## 112 17:27:52 https://www.ptt.cc/bbs/Gossiping/M.1575941634.A.F31.html
## 113 17:27:52 https://www.ptt.cc/bbs/Gossiping/M.1575941634.A.F31.html
## 114 17:27:52 https://www.ptt.cc/bbs/Gossiping/M.1575941634.A.F31.html
## 115 17:27:52 https://www.ptt.cc/bbs/Gossiping/M.1575941634.A.F31.html
## 116 17:27:52 https://www.ptt.cc/bbs/Gossiping/M.1575941634.A.F31.html
## 117 17:27:52 https://www.ptt.cc/bbs/Gossiping/M.1575941634.A.F31.html
## 118 17:27:52 https://www.ptt.cc/bbs/Gossiping/M.1575941634.A.F31.html
##        artPoster    artCat  cmtPoster cmtStatus                   cmtDate
## 1   LoveMakeLove Gossiping taikonkimo        推 2019-07-29 15:20:00+00:00
## 2   LoveMakeLove Gossiping taikonkimo        推 2019-07-29 15:42:00+00:00
## 3   LoveMakeLove Gossiping taikonkimo         → 2019-07-29 15:42:00+00:00
## 4   LoveMakeLove Gossiping taikonkimo         → 2019-07-29 15:43:00+00:00
## 5   LoveMakeLove Gossiping taikonkimo         → 2019-07-29 15:43:00+00:00
## 6      dream1124 Gossiping taikonkimo         → 2019-07-29 15:20:00+00:00
## 7      dream1124 Gossiping taikonkimo         → 2019-07-29 15:21:00+00:00
## 8      dream1124 Gossiping taikonkimo        噓 2019-07-29 15:52:00+00:00
## 9          Kaoos Gossiping taikonkimo        推 2019-07-30 10:35:00+00:00
## 10     Whitening Gossiping taikonkimo        推 2019-08-04 14:47:00+00:00
## 11     Whitening Gossiping taikonkimo         → 2019-08-04 14:49:00+00:00
## 12     Whitening Gossiping taikonkimo         → 2019-08-04 14:49:00+00:00
## 13     Whitening Gossiping taikonkimo         → 2019-08-04 14:49:00+00:00
## 14     Whitening Gossiping taikonkimo         → 2019-08-04 14:50:00+00:00
## 15     Whitening Gossiping taikonkimo         → 2019-08-04 14:51:00+00:00
## 16     Whitening Gossiping taikonkimo         → 2019-08-04 14:51:00+00:00
## 17     Whitening Gossiping taikonkimo         → 2019-08-04 14:52:00+00:00
## 18     Whitening Gossiping taikonkimo         → 2019-08-04 14:52:00+00:00
## 19     Whitening Gossiping taikonkimo        推 2019-08-04 14:54:00+00:00
## 20     Whitening Gossiping taikonkimo        推 2019-08-04 14:57:00+00:00
## 21     Whitening Gossiping taikonkimo         → 2019-08-04 15:00:00+00:00
## 22     Whitening Gossiping taikonkimo         → 2019-08-04 15:00:00+00:00
## 23     Whitening Gossiping taikonkimo         → 2019-08-04 15:03:00+00:00
## 24     Whitening Gossiping taikonkimo         → 2019-08-04 15:03:00+00:00
## 25     Whitening Gossiping taikonkimo         → 2019-08-04 15:04:00+00:00
## 26     Whitening Gossiping taikonkimo         → 2019-08-04 15:14:00+00:00
## 27       sading7 Gossiping taikonkimo        噓 2019-08-04 16:42:00+00:00
## 28       sading7 Gossiping taikonkimo         → 2019-08-04 16:43:00+00:00
## 29       sading7 Gossiping taikonkimo         → 2019-08-04 16:50:00+00:00
## 30     ivorysoap Gossiping taikonkimo        推 2019-08-24 01:18:00+00:00
## 31     ivorysoap Gossiping taikonkimo         → 2019-08-24 01:19:00+00:00
## 32     ivorysoap Gossiping taikonkimo         → 2019-08-24 01:20:00+00:00
## 33       mintice Gossiping taikonkimo        推 2019-09-04 06:50:00+00:00
## 34    Tiffwyetha Gossiping taikonkimo         → 2019-09-08 01:34:00+00:00
## 35    Tiffwyetha Gossiping taikonkimo         → 2019-09-08 01:34:00+00:00
## 36  JinCheng5566 Gossiping taikonkimo         → 2019-09-28 10:11:00+00:00
## 37      rocfrank Gossiping taikonkimo        推 2019-09-28 14:11:00+00:00
## 38          sgzt Gossiping taikonkimo        推 2019-10-02 05:58:00+00:00
## 39          sgzt Gossiping taikonkimo         → 2019-10-02 05:58:00+00:00
## 40     turbomons Gossiping taikonkimo        推 2019-10-02 07:44:00+00:00
## 41    EvilisGood Gossiping taikonkimo        推 2019-10-04 09:09:00+00:00
## 42         kbten Gossiping taikonkimo         → 2019-10-14 13:54:00+00:00
## 43         kbten Gossiping taikonkimo         → 2019-10-14 13:54:00+00:00
## 44         kbten Gossiping taikonkimo         → 2019-10-14 14:02:00+00:00
## 45  JinCheng5566 Gossiping taikonkimo         → 2019-12-03 13:27:00+00:00
## 46  JinCheng5566 Gossiping taikonkimo        推 2019-12-03 16:06:00+00:00
## 47       patiger Gossiping taikonkimo        推 2019-12-07 03:54:00+00:00
## 48       patiger Gossiping taikonkimo         → 2019-12-07 03:55:00+00:00
## 49  johnny790218 Gossiping taikonkimo        推 2019-12-09 02:38:00+00:00
## 50  johnny790218 Gossiping taikonkimo        推 2019-12-09 03:01:00+00:00
## 51  johnny790218 Gossiping taikonkimo         → 2019-12-09 03:02:00+00:00
## 52  johnny790218 Gossiping taikonkimo         → 2019-12-09 03:03:00+00:00
## 53  johnny790218 Gossiping taikonkimo         → 2019-12-09 03:03:00+00:00
## 54  johnny790218 Gossiping taikonkimo         → 2019-12-09 03:03:00+00:00
## 55  johnny790218 Gossiping taikonkimo        推 2019-12-09 03:08:00+00:00
## 56  johnny790218 Gossiping taikonkimo         → 2019-12-09 03:08:00+00:00
## 57  johnny790218 Gossiping taikonkimo        推 2019-12-09 03:49:00+00:00
## 58  johnny790218 Gossiping taikonkimo         → 2019-12-09 03:49:00+00:00
## 59  johnny790218 Gossiping taikonkimo         → 2019-12-09 03:49:00+00:00
## 60  johnny790218 Gossiping taikonkimo         → 2019-12-09 03:51:00+00:00
## 61  johnny790218 Gossiping taikonkimo         → 2019-12-09 03:51:00+00:00
## 62  johnny790218 Gossiping taikonkimo         → 2019-12-09 03:51:00+00:00
## 63  johnny790218 Gossiping taikonkimo        推 2019-12-09 04:00:00+00:00
## 64  johnny790218 Gossiping taikonkimo         → 2019-12-09 04:00:00+00:00
## 65         deann Gossiping taikonkimo        推 2019-12-09 04:55:00+00:00
## 66         todao Gossiping taikonkimo        推 2019-12-09 04:59:00+00:00
## 67     keane9112 Gossiping taikonkimo         → 2019-12-09 06:06:00+00:00
## 68     keane9112 Gossiping taikonkimo         → 2019-12-09 06:06:00+00:00
## 69     keane9112 Gossiping taikonkimo         → 2019-12-09 06:06:00+00:00
## 70  BlueBird5566 Gossiping taikonkimo        推 2019-12-09 06:04:00+00:00
## 71  BlueBird5566 Gossiping taikonkimo        推 2019-12-09 06:56:00+00:00
## 72     pkpk23456 Gossiping taikonkimo        推 2019-12-10 02:19:00+00:00
## 73     pkpk23456 Gossiping taikonkimo         → 2019-12-10 02:19:00+00:00
## 74     pkpk23456 Gossiping taikonkimo         → 2019-12-10 02:21:00+00:00
## 75     pkpk23456 Gossiping taikonkimo         → 2019-12-10 02:21:00+00:00
## 76     pkpk23456 Gossiping taikonkimo         → 2019-12-10 02:21:00+00:00
## 77     pkpk23456 Gossiping taikonkimo         → 2019-12-10 02:23:00+00:00
## 78     pkpk23456 Gossiping taikonkimo         → 2019-12-10 02:23:00+00:00
## 79     pkpk23456 Gossiping taikonkimo         → 2019-12-10 02:23:00+00:00
## 80     pkpk23456 Gossiping taikonkimo         → 2019-12-10 02:23:00+00:00
## 81     pkpk23456 Gossiping taikonkimo         → 2019-12-10 02:24:00+00:00
## 82     pkpk23456 Gossiping taikonkimo         → 2019-12-10 02:24:00+00:00
## 83     pkpk23456 Gossiping taikonkimo         → 2019-12-10 02:25:00+00:00
## 84     pkpk23456 Gossiping taikonkimo         → 2019-12-10 02:26:00+00:00
## 85     pkpk23456 Gossiping taikonkimo         → 2019-12-10 02:27:00+00:00
## 86     pkpk23456 Gossiping taikonkimo         → 2019-12-10 02:27:00+00:00
## 87     pkpk23456 Gossiping taikonkimo         → 2019-12-10 02:27:00+00:00
## 88     pkpk23456 Gossiping taikonkimo         → 2019-12-10 02:29:00+00:00
## 89     pkpk23456 Gossiping taikonkimo         → 2019-12-10 02:29:00+00:00
## 90     pkpk23456 Gossiping taikonkimo         → 2019-12-10 02:30:00+00:00
## 91     pkpk23456 Gossiping taikonkimo         → 2019-12-10 02:30:00+00:00
## 92     pkpk23456 Gossiping taikonkimo         → 2019-12-10 02:30:00+00:00
## 93     pkpk23456 Gossiping taikonkimo         → 2019-12-10 02:31:00+00:00
## 94     pkpk23456 Gossiping taikonkimo         → 2019-12-10 02:31:00+00:00
## 95     pkpk23456 Gossiping taikonkimo         → 2019-12-10 02:32:00+00:00
## 96     pkpk23456 Gossiping taikonkimo         → 2019-12-10 02:33:00+00:00
## 97     pkpk23456 Gossiping taikonkimo         → 2019-12-10 02:33:00+00:00
## 98     pkpk23456 Gossiping taikonkimo        推 2019-12-10 02:36:00+00:00
## 99     pkpk23456 Gossiping taikonkimo         → 2019-12-10 02:36:00+00:00
## 100    pkpk23456 Gossiping taikonkimo         → 2019-12-10 02:37:00+00:00
## 101    pkpk23456 Gossiping taikonkimo         → 2019-12-10 02:38:00+00:00
## 102    pkpk23456 Gossiping taikonkimo         → 2019-12-10 02:38:00+00:00
## 103    pkpk23456 Gossiping taikonkimo         → 2019-12-10 02:38:00+00:00
## 104    pkpk23456 Gossiping taikonkimo         → 2019-12-10 02:40:00+00:00
## 105    pkpk23456 Gossiping taikonkimo         → 2019-12-10 02:40:00+00:00
## 106    pkpk23456 Gossiping taikonkimo         → 2019-12-10 02:40:00+00:00
## 107    pkpk23456 Gossiping taikonkimo         → 2019-12-10 02:40:00+00:00
## 108    pkpk23456 Gossiping taikonkimo        推 2019-12-10 02:44:00+00:00
## 109    pkpk23456 Gossiping taikonkimo         → 2019-12-10 02:44:00+00:00
## 110    pkpk23456 Gossiping taikonkimo         → 2019-12-10 02:44:00+00:00
## 111    pkpk23456 Gossiping taikonkimo         → 2019-12-10 02:45:00+00:00
## 112    pkpk23456 Gossiping taikonkimo        推 2019-12-10 02:48:00+00:00
## 113    pkpk23456 Gossiping taikonkimo         → 2019-12-10 02:48:00+00:00
## 114    pkpk23456 Gossiping taikonkimo        推 2019-12-10 02:50:00+00:00
## 115    pkpk23456 Gossiping taikonkimo        推 2019-12-10 02:58:00+00:00
## 116    pkpk23456 Gossiping taikonkimo        推 2019-12-10 03:05:00+00:00
## 117    pkpk23456 Gossiping taikonkimo        推 2019-12-10 03:10:00+00:00
## 118    pkpk23456 Gossiping taikonkimo         → 2019-12-10 03:10:00+00:00
##                              cmtContent
## 1               :叫中共更民主也沒價值阿
## 2         :柯又不是今天喊中共要更民主化
## 3                   :之前專訪不就講過了
## 4       :關於香港柯還去聲援過台灣抗議的
## 5                           :轉來轉去啥
## 6       :咱蔡英文成天聲援感問你想法如何
## 7             :所以對香港有啥實質幫助嗎
## 8       :蔡英文不也跨海聲援還成天聲援呢
## 9                         :這也不意外吧
## 10      :這篇還可以講柯跪中共?真是厲害
## 11    :轉啥柯一直講中共處理香港要明智阿
## 12                        :很多人在看的
## 13                  :英粉看到內文沒弱啊
## 14    :要中共更明智別重演64這樣下地獄喔
## 15          :就說英粉只適合媒體標題餵養
## 16                          :這篇沒批喔
## 17                  :跳針?是在講內文欸
## 18            :你看自家英粉幾個看內文的
## 19          :這篇連64都拿出來了也叫舔喔
## 20            :請噓文的好好學會看內文吧
## 21        :內文就是在要中共更民主更明智
## 22          :所以要錢的根據在哪只會抹啊
## 23        :那段還嘴了中共政治跟不上經濟
## 24    :你可以無視中共經濟成長但你不爽中
## 25                      :共政治跟不上嗎
## 26              :一國兩制柯也從來沒吞阿
## 27        :柯第二點是講川普所以造謠爽嗎
## 28    :英粉這樣斷章取義亂冠就不叫超譯阿
## 29    :所以柯的OFCOURSE是講川普還是美國
## 30        :英粉說好的對中共不失言呢顆顆
## 31    :看到英粉又造謠囉柯啥時講一國兩制
## 32                        :是汙名了哈哈
## 33    :出嘴就好不是一向台灣的習慣嗎顆顆
## 34              :意思就是精神支持你看看
## 35      :好棒棒香港人往前衝都更有力氣了
## 36                      :這也能噓啊顆顆
## 37        :台灣本來就和香港有很多不同啊
## 38                      :這篇到底說錯啥
## 39            :通篇也是要北京反省舔在哪
## 40                :超譯?有比英粉厲害嗎
## 41                            :觀察看看
## 42    :很奇怪為了柯一句話在那超譯不爽的
## 43          :看到川普這樣講連屁都不敢放
## 44    :川普也在選舉呢但這群就不敢出征嗎
## 45                      :事實啊有何錯誤
## 46                        :柯就沒要選阿
## 47    :光一個香港就搞成這樣台灣喔還有美
## 48               :在那邊中共想要?省省吧
## 49  :這篇竟然被低調?就說英粉拿香港騙票
## 50    :看到英粉低調這篇真是噁心你們就是
## 51        :文中所言拿香港鮮血換利益的人
## 52    :你們這麼看不起港仔還成天講明日台
## 53                              :灣三小
## 54      :美國好歹還制裁法案通過台灣有啥
## 55    :要這麼講現實就別成天拿香港賣芒果
## 56           :甚至講投dpp來挺香港太噁心
## 57    :這位還代表香港大學來台灣求援咱執
## 58    :政黨官員避而不見啊現在說人家小咖
## 59                  :你們之前高潮啥港大
## 60  :方仲賢就是你們最愛的第一線和港警衝
## 61     :突還被補的現在說人家幫中共說話…
## 62                      :靠英粉太厲害啦
## 63    :來啦英粉來一篇方仲賢是中共的推爆
## 64                            :給看如何
## 65            :蔡不消費香港我們酸他幹嘛
## 66            :你這樣不是很打英粉的臉嗎
## 67      :讚既然如此你在意波浪大小幹嘛呢
## 68    :也沒說小波浪就等同不關心啊小小的
## 69                          :關心不行嗎
## 70                          :真的很噁心
## 71                              :中肯呢
## 72   :只有dpp的支持者可以允許dpp跟kmt一
## 73            :樣爛然後用高標準審查別人
## 74    :如果只定位用鍵盤和嘴聲援香港那在
## 75    :意波浪大小幹嘛你的嘴巴聲援也弱到
## 76                    :連波浪都算不上啊
## 77   :柯p這幾天也很明確表態對港態度也自
## 78   :己不會看柯p還成立協助香港人來台小
## 79    :組啊還在柯啥?人家比英粉鍵盤的波
## 80                          :浪大多了吧
## 81   :柯p這幾天也明確喊不接受一國兩制阿
## 82                  :然後呢?柯啥時吞過
## 83    :英粉在意波浪大小你的鍵盤聲援是有
## 84                            :三小波浪
## 85    :黎智英講得就是聖旨這位直接衝鋒港
## 86        :警還被逮捕的跑來台灣是來玩嗎
## 87     :柯p啥時見中聯辦你們就這點水準?
## 88    :黎智英這大老闆就比衝鋒第一線的學
## 89            :生有價值啊英粉這樣表示嗎
## 90    :又在跳小凱小凱喊幾年了卡神倒是三
## 91                :千帳號抓不完真有臉講
## 92                :陳菊也見國台辦啊so?
## 93            :不用三千抓個三十小凱如何
## 94      :網軍?小凱一人網軍你講給人笑嗎
## 95                          :所以在哪?
## 96    :立法你等民眾黨真進立院啊北市府倒
## 97                      :是先做了協助呢
## 98    :鍵盤聲援可以有啥波浪夠的話這些學
## 99                        :生來台灣玩嗎
## 100   :每個人都希望香港好啊但我們也知道
## 101   :那是他國事務但是誰成天消費香港把
## 102   :台灣連結香港現在又喊不關台灣的事
## 103                               :情?
## 104   :大家都希望香港民主跟我希望中東非
## 105   :洲很多國家民主一樣但我不會操弄投
## 106   :誰來挺這些國家操弄了又切割不就英
## 107                             :粉嘴臉
## 108   :十月找啥你說成立群組之類的就是網
## 109   :軍?你看到的卡神是這樣嗎三千志願
## 110           :軍?那還叫蟑螂嗎邏輯死啦
## 111     :卡神給人一篇一萬啊怎看都更好賺
## 112     :是啊去年輸慘今年靠香港血回血真
## 113                             :是光榮
## 114 :跟年初的韓粉動不動就拿民調嘴臉很像
## 115          :用人的鮮血選舉造勢罷了+1
## 116     :除了把排泄物放嘴中拿出啥論述沒
## 117   :英粉鍵盤的波浪是有多大你們也把自
## 118                       :己侷限鍵盤啊
article_count_by_date <- HongKong_review3 %>% 
  group_by(artDate) %>% 
  summarise(count = n())

article_count_by_date %>% 
  arrange(desc(count))%>% 
  top_n(10)
## Selecting by count
## # A tibble: 11 x 2
##    artDate    count
##    <chr>      <int>
##  1 2019/12/09    47
##  2 2019/12/08    23
##  3 2019/08/04    20
##  4 2019/07/29     8
##  5 2019/08/23     3
##  6 2019/10/01     3
##  7 2019/10/14     3
##  8 2019/09/07     2
##  9 2019/09/28     2
## 10 2019/12/03     2
## 11 2019/12/06     2

可以看出這個人也是高強度PTT使用者。從他的文章回復日期可以看出來,他在PTT上回復文章的時段主要集中於幾個特定日期。