組員:
N074220002 陳柏翔 N074220008 林益祥 N074220010 賴軒如 N074220016 徐建德

主題:蒐集網路名人阿滴相關評論之文字分析

資料集

social_media_midterm_Di_word_count.csv(斷詞) social_media_midterm_Di_all.csv(完整)

動機與分析目的

阿滴一直是Youtube上的網路名人,所經營的阿滴英文頻道訂閱人數 超過百萬人,他也以居高不下的網路聲量與正面形象積極參與公眾事務, 尤其最近因疫情的關係,和其他知名人士發起募資活動想為台灣在國際間 發聲,因此這樣一位深具個人特色與正面力量的網路名人,或許可以藉由 文字分析進一步發現有價值的資訊供參考。

資料簡介

資料是由中山大學管理學院文字分析平台搜尋取得,下載資料為兩種, 一種是原始資料之csv檔案;另一種為平台上斷詞好的csv檔案

資料區間為2017/07/07 ~ 2020/05/23的八卦版資料,從2017年7月7日阿滴 的頻道訂閱數破百萬,其資料數量可供分析參考,因此透過文字分析平台 檢索「阿滴」關鍵字,共搜尋521篇文章。

前置作業與載入相關套件使用

# 分析Dataset為《阿滴》單一名詞三年來的的討論文章集合  來源:PTT Gossiping Board
# 載入packages
require(dplyr)
## Loading required package: dplyr
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
require(data.table)
## Loading required package: data.table
## 
## Attaching package: 'data.table'
## The following objects are masked from 'package:dplyr':
## 
##     between, first, last
require(ggplot2)
## Loading required package: ggplot2
require(ggraph)
## Loading required package: ggraph
require(gutenbergr)
## Loading required package: gutenbergr
require(htmlwidgets)
## Loading required package: htmlwidgets
require(igraph)
## Loading required package: igraph
## 
## Attaching package: 'igraph'
## The following objects are masked from 'package:dplyr':
## 
##     as_data_frame, groups, union
## The following objects are masked from 'package:stats':
## 
##     decompose, spectrum
## The following object is masked from 'package:base':
## 
##     union
require(jiebaR)
## Loading required package: jiebaR
## Loading required package: jiebaRD
require(LDAvis)
## Loading required package: LDAvis
require(Matrix)
## Loading required package: Matrix
require(NLP)
## Loading required package: NLP
## 
## Attaching package: 'NLP'
## The following object is masked from 'package:ggplot2':
## 
##     annotate
require(pbapply)
## Loading required package: pbapply
require(quanteda)
## Loading required package: quanteda
## Package version: 2.0.1
## Parallel computing: 2 of 4 threads used.
## See https://quanteda.io for tutorials and examples.
## 
## Attaching package: 'quanteda'
## The following objects are masked from 'package:NLP':
## 
##     meta, meta<-
## The following object is masked from 'package:igraph':
## 
##     as.igraph
## The following object is masked from 'package:utils':
## 
##     View
require(readr)
## Loading required package: readr
require(reshape2)
## Loading required package: reshape2
## 
## Attaching package: 'reshape2'
## The following objects are masked from 'package:data.table':
## 
##     dcast, melt
require(Rtsne)
## Loading required package: Rtsne
require(randomcoloR)
## Loading required package: randomcoloR
require(stringr)
## Loading required package: stringr
require(slam)
## Loading required package: slam
## 
## Attaching package: 'slam'
## The following object is masked from 'package:data.table':
## 
##     rollup
require(scales)
## Loading required package: scales
## 
## Attaching package: 'scales'
## The following object is masked from 'package:readr':
## 
##     col_factor
require(servr)
## Loading required package: servr
require(tidytext)
## Loading required package: tidytext
require(tidyr)
## Loading required package: tidyr
## 
## Attaching package: 'tidyr'
## The following object is masked from 'package:reshape2':
## 
##     smiths
## The following object is masked from 'package:Matrix':
## 
##     expand
## The following object is masked from 'package:igraph':
## 
##     crossing
require(tm)
## Loading required package: tm
## 
## Attaching package: 'tm'
## The following objects are masked from 'package:quanteda':
## 
##     as.DocumentTermMatrix, stopwords
require(topicmodels)
## Loading required package: topicmodels
require(wordcloud2)
## Loading required package: wordcloud2
require(widyr)
## Loading required package: widyr
require(wordcloud)
## Loading required package: wordcloud
## Loading required package: RColorBrewer
require(webshot)
## Loading required package: webshot
# 設定讀取字典資料路徑
ROOT.DIR<- "C:/Users/Sean/Documents/20200526_project_2"
mycolors <- colorRampPalette(brewer.pal(8, "Set3"))(20)
data=fread("C:/Users/Sean/Documents/20200526_project_2/1_Dataset/social_media_midterm_Di_word_count.csv",encoding = "UTF-8")
data$artDate= data$artDate %>% as.Date("%Y/%m/%d")
data<-data %>% filter(!grepl('_',word)) 
head(data, 20)
##                        artTitle    artDate  artTime
## 1  [爆卦]阿滴英文突破百萬訂閱! 2017-07-07 05:45:25
## 2  [爆卦]阿滴英文突破百萬訂閱! 2017-07-07 05:45:25
## 3  [爆卦]阿滴英文突破百萬訂閱! 2017-07-07 05:45:25
## 4  [爆卦]阿滴英文突破百萬訂閱! 2017-07-07 05:45:25
## 5  [爆卦]阿滴英文突破百萬訂閱! 2017-07-07 05:45:25
## 6  [爆卦]阿滴英文突破百萬訂閱! 2017-07-07 05:45:25
## 7  [爆卦]阿滴英文突破百萬訂閱! 2017-07-07 05:45:25
## 8  [爆卦]阿滴英文突破百萬訂閱! 2017-07-07 05:45:25
## 9  [爆卦]阿滴英文突破百萬訂閱! 2017-07-07 05:45:25
## 10 [爆卦]阿滴英文突破百萬訂閱! 2017-07-07 05:45:25
## 11 [爆卦]阿滴英文突破百萬訂閱! 2017-07-07 05:45:25
## 12 [爆卦]阿滴英文突破百萬訂閱! 2017-07-07 05:45:25
## 13 [爆卦]阿滴英文突破百萬訂閱! 2017-07-07 05:45:25
## 14 [爆卦]阿滴英文突破百萬訂閱! 2017-07-07 05:45:25
## 15 [爆卦]阿滴英文突破百萬訂閱! 2017-07-07 05:45:25
## 16 [爆卦]阿滴英文突破百萬訂閱! 2017-07-07 05:45:25
## 17 [爆卦]阿滴英文突破百萬訂閱! 2017-07-07 05:45:25
## 18 [爆卦]阿滴英文突破百萬訂閱! 2017-07-07 05:45:25
## 19 [爆卦]阿滴英文突破百萬訂閱! 2017-07-07 05:45:25
## 20 [爆卦]阿滴英文突破百萬訂閱! 2017-07-07 05:45:25
##                                                      artUrl   word count
## 1  https://www.ptt.cc/bbs/Gossiping/M.1499435488.A.64E.html   頻道    14
## 2  https://www.ptt.cc/bbs/Gossiping/M.1499435488.A.64E.html   百萬    14
## 3  https://www.ptt.cc/bbs/Gossiping/M.1499435488.A.64E.html   英文    11
## 4  https://www.ptt.cc/bbs/Gossiping/M.1499435488.A.64E.html   台灣    10
## 5  https://www.ptt.cc/bbs/Gossiping/M.1499435488.A.64E.html   阿滴     8
## 6  https://www.ptt.cc/bbs/Gossiping/M.1499435488.A.64E.html   阿神     7
## 7  https://www.ptt.cc/bbs/Gossiping/M.1499435488.A.64E.html   阿莫     7
## 8  https://www.ptt.cc/bbs/Gossiping/M.1499435488.A.64E.html 蔡阿嘎     6
## 9  https://www.ptt.cc/bbs/Gossiping/M.1499435488.A.64E.html 這群人     6
## 10 https://www.ptt.cc/bbs/Gossiping/M.1499435488.A.64E.html   訂閱     5
## 11 https://www.ptt.cc/bbs/Gossiping/M.1499435488.A.64E.html 聖結石     5
## 12 https://www.ptt.cc/bbs/Gossiping/M.1499435488.A.64E.html   創辦     5
## 13 https://www.ptt.cc/bbs/Gossiping/M.1499435488.A.64E.html   目前     5
## 14 https://www.ptt.cc/bbs/Gossiping/M.1499435488.A.64E.html   影片     4
## 15 https://www.ptt.cc/bbs/Gossiping/M.1499435488.A.64E.html 年月日     4
## 16 https://www.ptt.cc/bbs/Gossiping/M.1499435488.A.64E.html   六個     4
## 17 https://www.ptt.cc/bbs/Gossiping/M.1499435488.A.64E.html   大學     4
## 18 https://www.ptt.cc/bbs/Gossiping/M.1499435488.A.64E.html 僅次於     3
## 19 https://www.ptt.cc/bbs/Gossiping/M.1499435488.A.64E.html   沒有     3
## 20 https://www.ptt.cc/bbs/Gossiping/M.1499435488.A.64E.html   超過     2

情緒分析

準備LIWC字典(utf8)

p<-read_file(file.path (ROOT.DIR , "3_Dict/liwc_positive.txt")) 
n<-read_file(file.path (ROOT.DIR , "3_Dict/liwc_negative.txt"))
positive <- strsplit(p, "[,]")[[1]]
negative <- strsplit(n, "[,]")[[1]]
positive <- data.frame(word = positive, sentiments = "positive")
negative <- data.frame(word = negative, sentiemtns = "negative")
colnames(negative) = c("word","sentiment")
colnames(positive) = c("word","sentiment")
LIWC_ch <- rbind(positive, negative)
head(LIWC_ch, 20)
##        word sentiment
## 1      一流  positive
## 2  下定決心  positive
## 3  不拘小節  positive
## 4    不費力  positive
## 5      不錯  positive
## 6      主動  positive
## 7      乾杯  positive
## 8      乾淨  positive
## 9    了不起  positive
## 10     享受  positive
## 11     仁心  positive
## 12     仁愛  positive
## 13     仁慈  positive
## 14     仁義  positive
## 15     仁術  positive
## 16     仔細  positive
## 17     付出  positive
## 18     伴侶  positive
## 19     伶俐  positive
## 20     作品  positive

LIWC字典中有多少正面單詞和負面單詞

LIWC_ch %>% filter(sentiment %in% c("positive", "negative")) %>% count(sentiment)
## # A tibble: 2 x 2
##   sentiment     n
##   <fct>     <int>
## 1 positive    664
## 2 negative   1047

以LIWC字典判斷文集中的word屬於正面字還是負面字 文集過濾詞彙,只有一個字則不列入計算

all_filter_words_lw <- data %>% filter(nchar(.$word)>1)

計算所有各詞彙的出現總數由大到小排序

all_words_count_lw <- all_filter_words_lw %>% group_by(word) %>% summarise(sum = n()) %>% arrange(desc(sum))
head(all_words_count_lw, 20) # 可依據出現詞彙於斷詞時判斷加入停用詞
## # A tibble: 20 x 2
##    word     sum
##    <chr>  <int>
##  1 阿滴     504
##  2 英文     221
##  3 台灣     209
##  4 大家     127
##  5 什麼     124
##  6 不是     110
##  7 沒有     110
##  8 真的     107
##  9 八卦     105
## 10 有沒有   102
## 11 現在     101
## 12 覺得      99
## 13 代表      92
## 14 影片      91
## 15 廣告      82
## 16 看到      77
## 17 怎麼      74
## 18 是不是    71
## 19 出來      68
## 20 美國      68

與LIWC情緒字典join,文集中的字出現在LIWC字典中是屬於positive還是negative

liwch_ch_words_count<-all_words_count_lw %>% inner_join(LIWC_ch)
## Joining, by = "word"
print(liwch_ch_words_count)
## # A tibble: 474 x 3
##    word    sum sentiment
##    <chr> <int> <fct>    
##  1 八卦    105 negative 
##  2 支持     49 positive 
##  3 問題     48 negative 
##  4 攻擊     35 negative 
##  5 希望     33 positive 
##  6 批評     32 negative 
##  7 幫忙     30 positive 
##  8 喜歡     27 positive 
##  9 成功     26 positive 
## 10 幫助     26 positive 
## # ... with 464 more rows
liwch_ch_words_count %>% filter(sentiment %in% c("positive", "negative")) %>% count(sentiment)
## # A tibble: 2 x 2
##   sentiment     n
##   <fct>     <int>
## 1 positive    241
## 2 negative    233

繪圖出以LIWC字典統計的文集情緒字數,觀察兩種情緒值的差異

liwch_ch_words_count %>%
  group_by(sentiment) %>%
  top_n(10,wt = sum) %>%
  ungroup() %>% 
  mutate(word = reorder(word, sum)) %>%
  ggplot(aes(word, sum, fill = sentiment)) +
  geom_col(show.legend = FALSE) +
  facet_wrap(~sentiment, scales = "free_y") +
  labs(y = "Contribution to sentiment",
       x = NULL) +
  theme(text=element_text(size=14,family = '微軟雅黑'))+
  coord_flip()

文字雲

liwch_ch_words_count %>% wordcloud2(size = 4, fontFamily = "微軟雅黑",color = "random-light", backgroundColor = "grey")

以LIWC情緒字典分析

統計每天的文章正面字的次數與負面字的次數

找出所有在時間區段中的日期

all_dates <- 
  expand.grid(seq(as.Date(min(data$artDate)), as.Date(max(data$artDate)), by="day"), c("positive", "negative"))

plot_table<-data %>%
  select(artDate,word,count) %>%
  inner_join(LIWC_ch) %>% 
  group_by(artDate,sentiment) %>%
  summarise(count=sum(count)) 
## Joining, by = "word"

沒有資料的日期<NA>將count設為0

plot_table <- all_dates %>% 
  merge(plot_table, all.x=T,all.y=T) %>% 
  mutate(count = replace_na(count, 0))
plot_table %>%
  ggplot()+
  geom_line(aes(x=artDate,y=count,colour=sentiment))+
  scale_x_date(labels = date_format("%Y/%m/%d")) 

情緒分析(續)

準備NTUSD字典(utf8)

pn<-read_file(file.path (ROOT.DIR , "3_Dict/ntusd_positive.txt"))
nn<-read_file(file.path (ROOT.DIR , "3_Dict/ntusd_negative.txt"))
ps<-strsplit(pn, "[\n]")[[1]]
positive_ntusd<-strsplit(ps, "[\r]")
ns<-strsplit(nn, "[\n]")[[1]]
negative_ntusd<-strsplit(ns, "[\r]")
# 用unlist拆分list後重構矩陣然後轉換為dataframe
positive_ntusd<-data.frame(matrix(unlist(positive_ntusd), nrow=2812, ncol=1, byrow=F),sentiments="positive", stringsAsFactors=FALSE)
colnames(positive_ntusd)<-c("word", "sentiment")
negative_ntusd<-data.frame(matrix(unlist(negative_ntusd), nrow=8276, ncol=1, byrow=F), sentiments="negative", stringsAsFactors = FALSE)
colnames(negative_ntusd)<-c("word","sentiment")
NTUSD_ch<-rbind(positive_ntusd, negative_ntusd)
head(NTUSD_ch, 20)
##          word sentiment
## 1    一帆風順  positive
## 2  一帆風順的  positive
## 3        一流  positive
## 4        一致  positive
## 5      一致的  positive
## 6      了不起  positive
## 7    了不起的  positive
## 8        了解  positive
## 9        人性  positive
## 10     人性的  positive
## 11   人格高尚  positive
## 12 人格高尚的  positive
## 13       人情  positive
## 14     人情味  positive
## 15       入神  positive
## 16     入神的  positive
## 17       入迷  positive
## 18     入迷的  positive
## 19       上好  positive
## 20     上好的  positive

NTUSD字典中有多少正面單詞和負面單詞

NTUSD_ch %>% filter(sentiment %in% c("positive", "negative")) %>% count(sentiment)
## # A tibble: 2 x 2
##   sentiment     n
##   <chr>     <int>
## 1 negative   8276
## 2 positive   2812

與NTUSD情緒字典join,文集中的字出現在NTUSD字典中是屬於positive還是negative

# 文集過濾詞彙,只有一個字則不列入計算
all_filter_words_nt <- data %>% filter(nchar(.$word)>1)

all_words_count_nt <- all_filter_words_nt %>% group_by(word) %>% summarise(sum = n()) %>% arrange(desc(sum))
head(all_words_count_nt, 20) # 可依據出現詞彙於斷詞時判斷加入停用詞
## # A tibble: 20 x 2
##    word     sum
##    <chr>  <int>
##  1 阿滴     504
##  2 英文     221
##  3 台灣     209
##  4 大家     127
##  5 什麼     124
##  6 不是     110
##  7 沒有     110
##  8 真的     107
##  9 八卦     105
## 10 有沒有   102
## 11 現在     101
## 12 覺得      99
## 13 代表      92
## 14 影片      91
## 15 廣告      82
## 16 看到      77
## 17 怎麼      74
## 18 是不是    71
## 19 出來      68
## 20 美國      68
ntusd_ch_words_count<-all_words_count_nt %>% inner_join(NTUSD_ch)
## Joining, by = "word"
print(ntusd_ch_words_count)
## # A tibble: 1,262 x 3
##    word    sum sentiment
##    <chr> <int> <chr>    
##  1 不是    110 negative 
##  2 沒有    110 negative 
##  3 沒有    110 negative 
##  4 很多     65 positive 
##  5 知道     58 positive 
##  6 問題     48 negative 
##  7 問題     48 negative 
##  8 不知     40 negative 
##  9 不知     40 negative 
## 10 集資     39 positive 
## # ... with 1,252 more rows
ntusd_ch_words_count %>% filter(sentiment %in% c("positive", "negative")) %>% count(sentiment)
## # A tibble: 2 x 2
##   sentiment     n
##   <chr>     <int>
## 1 negative    767
## 2 positive    495

繪圖出以NTUSD字典統計的文集情緒字數,觀察兩種情緒值的差異

ntusd_ch_words_count %>%
  group_by(sentiment) %>%
  top_n(10,wt = sum) %>%
  ungroup() %>% 
  mutate(word = reorder(word, sum)) %>%
  ggplot(aes(word, sum, fill = sentiment)) +
  geom_col(show.legend = FALSE) +
  facet_wrap(~sentiment, scales = "free_y") +
  labs(y = "Contribution to sentiment",
       x = NULL) +
  theme(text=element_text(size=14,family = '微軟雅黑'))+
  coord_flip()

文字雲

# removewords <- c("不是","沒有","很多","不知","不夠", "東西")
# ntusd_ch_words_count %>% filter(! word%in%removewords) %>% wordcloud2(size = 4, fontFamily = "微軟雅黑",color = "random-light", backgroundColor = "grey")
knitr::include_graphics(file.path(ROOT.DIR, "6_Pic/NTUSD_WordCloud.png"))

以NTUSD情緒字典分析

統計每天的文章正面字的次數與負面字的次數

找出所有在時間區段中的日期

all_dates <- 
  expand.grid(seq(as.Date(min(data$artDate)), as.Date(max(data$artDate)), by="day"), c("positive", "negative"))

plot_table<-data %>%
  select(artDate,word,count) %>%
  inner_join(NTUSD_ch) %>% 
  group_by(artDate,sentiment) %>%
  summarise(count=sum(count))
## Joining, by = "word"

沒有資料的日期<NA>將count設為0

plot_table <- all_dates %>% 
  merge(plot_table, all.x=T,all.y=T) %>% 
  mutate(count = replace_na(count, 0))
plot_table %>%
  ggplot()+
  geom_line(aes(x=artDate,y=count,colour=sentiment))+
  scale_x_date(labels = date_format("%Y/%m/%d")) 

比較兩個字典分析差異

senti_by_date_liwc<-data %>% 
  inner_join(LIWC_ch) %>%
  
  group_by(artDate, sentiment) %>%
  summarise(n=sum(count)) %>%
  spread(sentiment, n, fill = 0) %>%
  mutate(sentiment = positive - negative) %>%
  mutate(method='LIWC')
## Joining, by = "word"
senti_by_date_ntusd<-data %>% 
  inner_join(NTUSD_ch) %>%
  group_by(artDate, sentiment) %>%
  summarise(n=sum(count)) %>%
  spread(sentiment, n, fill = 0) %>%
  mutate(sentiment = positive - negative) %>%
  mutate(method='NTUSD')
## Joining, by = "word"
bind_rows(senti_by_date_liwc,
          senti_by_date_ntusd) %>%
  
  filter(artDate>='2020-01-01') %>%
  ggplot(aes(x= artDate,y=sentiment,fill=method)) +
  
  geom_col(show.legend = FALSE) +
  scale_x_date(labels = date_format("%m/%d")) +
  facet_wrap(~method, ncol = 1, scales = "fixed")+
  geom_text(aes(label=sentiment))

「阿滴」的討論熱度折線圖顯示

data2=fread('C:/Users/Sean/Documents/20200526_project_2/1_Dataset/social_media_midterm_Di_all.csv',encoding = 'UTF-8')
data2$artDate<-data2$artDate %>% as.Date("%Y/%m/%d")
head(data2, 5)
##                                      artTitle    artDate  artTime
## 1:               [爆卦]阿滴英文突破百萬訂閱! 2017-07-07 05:45:25
## 2:         [問卦]阿滴英文少了滴妹還剩下什麼? 2017-07-08 07:22:49
## 3:                       [問卦]阿滴算帥哥嗎? 2017-07-22 11:27:29
## 4: [新聞]阿滴英文彈琴帥炸! 滴妹飆唱《魚仔》 2017-07-23 00:18:37
## 5:                  [問卦]阿滴跟滴妹要選哪個? 2017-07-23 21:00:07
##                                                      artUrl    artPoster
## 1: https://www.ptt.cc/bbs/Gossiping/M.1499435488.A.64E.html gamania10000
## 2: https://www.ptt.cc/bbs/Gossiping/M.1499527731.A.E6B.html     xxxxxmay
## 3: https://www.ptt.cc/bbs/Gossiping/M.1500752013.A.6B4.html    pengjoker
## 4: https://www.ptt.cc/bbs/Gossiping/M.1500798279.A.78A.html       Digo99
## 5: https://www.ptt.cc/bbs/Gossiping/M.1500872815.A.CF4.html     yabe5566
##       artCat commentNum push boo
## 1: Gossiping         81   42  16
## 2: Gossiping         14    5   1
## 3: Gossiping         30   12   2
## 4: Gossiping         28    9  10
## 5: Gossiping         28   19   1
##                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                           sentence
## 1: 各位大德晚安\n\n我國少見的清流頻道.阿滴英文(Ray Du English)\n於今日晚間已經確定成為\n台灣第六個訂閱人數超過百萬的Youtube頻道\n也是今年第四個\n\n  1. 蔡阿嘎  (2014.07.09)   146萬  (依達成順序排列)\n  2. 這群人  (2016.08.30)      180萬\n  3. 阿神   (2017.03.13)      114萬\n  4. 谷阿莫  (2017.04.27)      108萬\n  5. 聖結石  (2017.05.29)      115萬\n  6.\n阿滴英文 (2017.07.07)      100萬\n相關資料如下:\n\n 一、阿滴英文是台灣第一個教育類百萬級頻道\n   但是頻道內點閱數最高的那部影片,跟英文/教育完全沒關係\n\n 二、阿滴英文創辦於2015年1月11日\n     歷經908天後達成百萬訂閱(十萬訂閱花了456天/2016年4月11日)\n     是台灣史上第三快的(僅次於聖結石220天與谷阿莫625天)\n\n 三、阿滴英文目前有189部影片,在百萬級頻道中只比這群人多\n    目前發表最多影片的是阿神(2835部),數量約是阿滴的15倍,這群人的22倍\n\n 四、雖然阿滴英文的訂閱數超過百萬,但是觀看次數不到五千萬\n    只有聖結石的四分之一,谷阿莫的七分之一\n   在台灣甚至排不到三十名\n\n 五、阿滴英文是台灣第一個由金牛座創辦的百萬級頻道(1989年5月8日晚上9點)\n     (這群人的尼克生於1988年4月20日,但那年太陽落於雙子座)\n   而且目前台灣的高訂閱youtuber中,幾乎沒有金牛座\n\n   蔡阿嘎(巨蟹)\n   這群人(摩羯/水瓶x2/雙魚/牡羊/雙子/巨蟹/獅子/處女)\n   阿 神(天秤)\n   谷阿莫(摩羯)\n   聖結石(天蠍)\n\n 六、六個百萬級頻道中,只有蔡阿嘎跟谷阿莫從未跟阿滴英文合作過影片\n     不過阿滴採訪過蔡阿嘎,發出合照的當晚IG立刻遭刪除\n\n 七、目前六個百萬級頻道的創辦人\n   都不是公立大學出身\n\n     蔡阿嘎  東吳大學、中國文化大學\n    這群人  國立台灣戲曲學院\n    阿神   明志科技大學\n     谷阿莫    龍華科技大學\n     聖結石    南強高級工商職業學校\n     阿滴      輔仁大學  \n\n 八、阿滴英文是台灣第二個由碩士創辦的百萬級頻道\n   僅次於蔡阿嘎\n\n 九、阿滴英文是台灣第二個由同志天菜創辦的百萬級頻道\n     僅次於阿神\n\n 十、六個百萬級頻道中\n     沒有任何一個創辦人有近視(阿滴與滴妹曾經有但已雷射)\n     而除了阿滴、滴妹外,阿神也常戴無鏡框眼鏡\n\n 十一、六個百萬級頻道中\n     只有谷阿莫沒有在台灣辦過粉絲活動(見面會、簽名會...等)\n\n 十二、六個百萬級頻道中\n     只有阿神還未發表任何出版作品(書、單曲、電影...等)\n\n 十三、台灣目前還沒有任何一個由女性單獨創辦的百萬級頻道\n
## 2:                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                         如題\n少了滴妹的阿滴\n還剩下什麼.\n.\n.\n.\n.\n剩阿滴\n.\n.\n.\n.\n欸這是廢話\n我是問還剩下那些內容可看\n大家覺得呢?\n
## 3:                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                如題\n\n就是阿滴英文那個阿滴\n\n各位大大覺得他算帥哥嗎?\nhttp://i.imgur.com/rZxhy7z.jpg\n有沒有八卦???\n\n\n
## 4:                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                           阿滴英文彈琴帥炸! 滴妹飆唱《魚仔》甜聲融化網友\n\n記者劉宜庭/綜合報導\n\n阿滴靠著全台最大英文教學YouTube頻道「阿滴英文」走紅,近期更發行新書,擁有破百\n萬粉絲支持。他22日晚間在臉書上開直播,難得和滴妹合體,一起彈唱《魚仔》、《Mos\nt Girls》等數首歌曲,展現彈琴功力,一旁滴妹甜美嗓音,兄妹倆搭檔呈現絕佳默契,\n令粉絲一飽耳福。\n\n「阿滴英文」22日在臉書開直播,坦言這次難得和滴妹合作彈唱,是想藉此機會紀念聯合\n樂團主唱查斯特(Chester Bennington),「對我來說是很震撼的事情,因為我從小第一\n次接觸西洋音樂,就是透過Linkin Park。」\n\n看見查斯特自殺身亡的消息,阿滴除了感嘆惋惜,同時也不忘呼籲患有憂鬱症或是其他疾\n病的人,「希望大家不要把自殺當作是一個\n選則\n,因為活著總是有出路的。」他和滴妹合\n作唱《Numb》之前,也透露這首歌是他聽「聯合公園」的第一首歌,當時甚至還為此去學\n了一段Rap,表示該曲在國、高中時期對他來說有很大的影響力。\n\n這次直播除了紀念樂團「聯合公園」,阿滴和滴妹飆唱《What I've Done》、《Numb》之\n外,兄妹倆也彈唱了許多最近接觸到的歌,包括《魚仔》、《不曾回來過》等歌曲,難得\n展現彈琴功力,模樣被讚相當帥氣,搭配滴妹甜美嗓音,令粉絲聽地如癡如醉,在翻唱《\n魚仔》的過程中,兄妹倆還逗趣用台語對話,一來一往有趣互動逗樂眾人,引發不少討論\n。\n\n● 《ETNEWS新聞雲》提醒您,請給自己機會:\n自殺防治諮詢安心專線:0800-788995;生命線協談專線:1995\nhttp://star.ettoday.net/news/972597?from=fb_et_star
## 5:                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                            如題啦\n\n這兩位英文都很好\n\n阿滴笑起來很可愛\n\n滴妹鼻子很Q\n\n大家會選哪個?\n\n\n

日期折線圖 計算出每天文章的發表數量,檢試疫情發生的這三年來「阿滴」的討論熱度

t_date <- data2 %>% 
  select(artDate, artUrl) %>% 
  distinct()
article_count_by_date <- t_date %>% 
  group_by(artDate) %>% 
  summarise(count = n())

討論篇數最多的前十天

article_count_by_date %>% 
  arrange(desc(count))%>% 
  top_n(10)
## Selecting by count
## # A tibble: 10 x 2
##    artDate    count
##    <date>     <int>
##  1 2020-04-12   136
##  2 2020-04-11   113
##  3 2020-04-15    24
##  4 2020-04-13    13
##  5 2020-04-14    10
##  6 2020-05-12     9
##  7 2020-04-10     7
##  8 2020-05-17     6
##  9 2018-10-28     5
## 10 2020-02-17     4

「阿滴」討論文章數的折線圖顯示

date_plot <- article_count_by_date %>% 
  ggplot(aes(x = artDate, y = count)) +
  geom_line(color = "purple", size = 1.5) + 
  geom_vline(xintercept = c(as.numeric(as.Date("2018-10-28")),
                            as.numeric(as.Date("2020-04-10")),
                            as.numeric(as.Date("2020-04-13")),
                            as.numeric(as.Date("2020-04-11")), 
                            as.numeric(as.Date("2020-04-12"))), col='red', size = 1) + 
  scale_x_date(labels = date_format("%Y/%m/%d")) +
  ggtitle("「阿滴」討論文章數") + 
  xlab("日期") + 
  ylab("數量") +
  theme(text = element_text(family = "微軟雅黑"))
date_plot

解釋折線圖意義:

文章討論的高點還是集中在四月份的時候,因為阿滴這時候有出現一些新聞熱度出來,所以才會有折線高點的情況,不然平時的討論度其實不高。另外2018年底的時候也有一些討論熱度,研判應該是阿滴的YT頻道訂閱數破2百萬。

文字雲

觀察有關阿滴熱門討論的內容 先行斷詞與停用詞使用

jieba_tokenizer <- worker(user=file.path(ROOT.DIR, "3_Dict/di_dict.txt"), stop_word = file.path(ROOT.DIR, "5_Stopwords/stop_words.txt"))
d_tokenizer <- function(t) {
  lapply(t, function(x) {
    tokens <- segment(x, jieba_tokenizer)
    tokens <- tokens[nchar(tokens)>1]
    return(tokens)
  })
}
# 斷詞
di_tokens <- data2 %>% 
  unnest_tokens(word, sentence, token=d_tokenizer) %>% filter(!str_detect(word, regex("[0-9a-zA-Z]"))) %>% 
  select(-artTime, -artUrl)
# 詞頻
di_tokens_count <- di_tokens %>% 
  group_by(word) %>% 
  summarise(sum = n()) %>% 
  arrange(desc(sum))
head(di_tokens_count, 10) # 根據輸出詞彙判斷是否加入停用詞文本(例如:阿滴)
## # A tibble: 10 x 2
##    word    sum
##    <chr> <int>
##  1 阿滴   1023
##  2 台灣    694
##  3 英文    583
##  4 代表    199
##  5 廣告    187
##  6 影片    187
##  7 真的    163
##  8 世界    157
##  9 覺得    152
## 10 現在    133

移除數量多但是較無意義的詞彙(在停用詞中無效果) 例如: 「阿滴」「真的」「覺得」

# wordc_plot <- di_tokens_count %>%
#  filter(word != c("阿滴","真的","覺得")) %>%
#  filter(sum > 10) %>%
#   wordcloud2(size = 4, fontFamily = "微軟雅黑",color = "random-light", backgroundColor = "grey")
# wordc_plot
# 文字雲只能出現一次,其餘使用以下指令顯示
knitr::include_graphics(file.path(ROOT.DIR, "6_Pic/WORDC_Plot.png"))

長條圖

查看詞彙頻率狀況

di_tokens_by_date <- di_tokens %>% 
  count(artDate, word, sort = TRUE)
# 過濾掉預期會存在的詞彙(阿滴, 英文)  
plot_merge <- di_tokens_by_date %>% 
  filter(word != "阿滴" & word != "英文") %>% 
  filter(artDate == as.Date("2020-04-13") | 
         artDate == as.Date("2020-04-12") | 
         artDate == as.Date("2020-04-11") |
         artDate == as.Date("2019-08-18") | 
         artDate == as.Date("2019-07-13")) %>% 
  group_by(artDate) %>% 
  top_n(7, n) %>% 
  ungroup() %>% 
  mutate(word = reorder(word, n)) %>%
  ggplot(aes(x=word, y=n, fill = artDate)) +
  geom_col(show.legend = FALSE) +
  labs(x = NULL, y = NULL) +
  facet_wrap(~artDate, scales="free", ncol = 2) + 
  coord_flip()+
  theme(text = element_text(family = "微軟雅黑"))
plot_merge
## Warning in grid.Call(C_textBounds, as.graphicsAnnot(x$label), x$x, x$y, : font
## family not found in Windows font database

## Warning in grid.Call(C_textBounds, as.graphicsAnnot(x$label), x$x, x$y, : font
## family not found in Windows font database

## Warning in grid.Call(C_textBounds, as.graphicsAnnot(x$label), x$x, x$y, : font
## family not found in Windows font database

分析詞彙和文件頻率 tf-idf

以文章區隔document

# 內容(文章、詞彙、詞頻、長度)
di_tokens_by_art <- di_tokens %>% 
  filter(!str_detect(word, regex("[0-9]"))) %>%
  count(artTitle, word, sort = TRUE)
di_total_words_by_art <- di_tokens_by_art %>% 
  group_by(artTitle) %>% 
  summarize(total = sum(n)) %>% 
  arrange(desc(total))
di_tokens_by_art <- left_join(di_tokens_by_art, di_total_words_by_art)
## Joining, by = "artTitle"

選擇文章長度大於50個詞

di_words_tf_idf <- di_tokens_by_art %>%
  bind_tf_idf(word, artTitle, n) 
di_words_tf_idf <- di_words_tf_idf %>% 
  filter(total > 50) %>% 
  arrange(desc(tf_idf))
knitr::kable(head(di_words_tf_idf, 40)) # 以kable函數來顯示以避免格式異常
artTitle word n total tf idf tf_idf
Re:[問卦]阿滴英文算過氣了嗎? 音標 12 139 0.0863309 5.998937 0.5178938
[新聞]理科太太收了滴妹喊話阿滴網讚「攻爆了 理科太太 7 72 0.0972222 5.305789 0.5158406
[問卦]阿滴是噗是妹控啊? 妹妹 8 51 0.1568627 2.564949 0.4023450
[問卦]有沒有哥倫布屌打阿滴的八卦? 哥倫布 4 53 0.0754717 4.900324 0.3698358
Re:[問卦]館長/酷炫/阿滴/howhow在孤島生存的八卦? 爭鮮 4 66 0.0606061 5.998937 0.3635719
[新聞]阿滴開箱總統專機曝光空軍一號內裝 總統 35 289 0.1211073 2.820883 0.3416294
[新聞]阿滴開箱總統專機曝光空軍一號內裝 專機 16 289 0.0553633 5.998937 0.3321211
[問卦]籲請阿滴暫停刊登廣告 德賽 5 78 0.0641026 4.900324 0.3141234
Re:[問卦]阿滴英文背景的台灣中國地圖 上傳 5 59 0.0847458 3.696352 0.3132501
Re:[政治]阿滴募資紐時廣告楊蕙如:YouTuber可代 聖母 7 80 0.0875000 3.514030 0.3074776
Re:[問卦]阿滴英文背景的台灣中國地圖 街訪 3 59 0.0508475 5.998937 0.3050307
[問卦]台大外文的英文能力是不是比阿滴還弱? 外文系 3 61 0.0491803 5.998937 0.2950297
[新聞]台南人英語超強?阿滴、滴妹街頭實測結 台南 7 129 0.0542636 5.305789 0.2879111
Re:[問卦]阿滴英文是靠個人魅力在撐嗎? 正派 3 64 0.0468750 5.998937 0.2812002
Re:[問卦]館長/酷炫/阿滴/howhow在孤島生存的八卦? 阿土 3 66 0.0454545 5.998937 0.2726789
Re:[問卦]阿滴英文去跑補教界大概是什麼程度? 名師 3 51 0.0588235 4.612642 0.2713319
[問卦]為什麼阿滴兄妹只上輔大 輔大 4 54 0.0740741 3.514030 0.2602985
[問卦]大謙和阿滴創新的頻道會叫什? 本魯 3 71 0.0422535 5.998937 0.2534762
[問卦]阿滴什麼時候停止疑似斂財的行為? 板民 3 73 0.0410959 5.998937 0.2465316
[問卦]有沒有阿滴洗的比Jolin還多篇的八卦? 一下子 3 66 0.0454545 5.305789 0.2411722
Re:[問卦]館長/酷炫/阿滴/howhow在孤島生存的八卦? 好吃 3 66 0.0454545 5.305789 0.2411722
[問卦]葉式特工抄襲被酸阿滴參考影片不會嗎 下架 2 51 0.0392157 5.998937 0.2352524
[問卦]葉式特工抄襲被酸阿滴參考影片不會嗎 本版 2 51 0.0392157 5.998937 0.2352524
[問卦]葉式特工抄襲被酸阿滴參考影片不會嗎 特工 2 51 0.0392157 5.998937 0.2352524
Re:[問卦]阿滴英文去跑補教界大概是什麼程度? 名校 2 51 0.0392157 5.998937 0.2352524
Re:[問卦]阿滴英文去跑補教界大概是什麼程度? 哥倫比亞 2 51 0.0392157 5.998937 0.2352524
Re:[問卦]為何要給阿滴如此大的苛責? 賺錢 4 64 0.0625000 3.696352 0.2310220
[問卦]有沒有阿滴的英文程度如何的八卦?? 西班牙文 2 52 0.0384615 5.998937 0.2307283
[問卦]其他台灣網紅會後悔沒學阿滴刊廣告嗎? 第一網 2 52 0.0384615 5.998937 0.2307283
Re:[問卦]阿滴說不小心多募款了1500萬會好好使用 義呆利 2 52 0.0384615 5.998937 0.2307283
[問卦]有沒有哥倫布屌打阿滴的八卦? 哦哦哦 2 53 0.0377358 5.998937 0.2263750
[問卦]阿滴…滴妹… 造假 2 53 0.0377358 5.998937 0.2263750
[問卦]阿滴是噗是妹控啊? 帳號 3 51 0.0588235 3.801712 0.2236301
[問卦]阿滴到底得罪了誰才變這樣 覺青 3 66 0.0454545 4.900324 0.2227420
Re:[問卦]阿滴是不是最強YouTuber? 哥哥 4 56 0.0714286 3.054498 0.2181784
[問卦]阿滴這次的募資文案將窒礙難行的原因 執政 3 83 0.0361446 5.998937 0.2168290
[問卦]阿滴這次的募資文案將窒礙難行的原因 當局 3 83 0.0361446 5.998937 0.2168290
[問卦]阿滴走錯了哪一步? 罵聲 2 56 0.0357143 5.998937 0.2142477
Re:[問卦]阿滴是不是最強YouTuber? 猜歌 2 56 0.0357143 5.998937 0.2142477
[新聞]姪子是聖結石粉…他秒轉阿滴英文「導正 聖結石 9 194 0.0463918 4.612642 0.2139886

tf-idf最高的文章本文:

Re:[問卦]阿滴英文算過氣了嗎? " 阿滴他們就是好玩的頻道啦念念品牌名、搞搞片語,當作好玩看看,其實還不錯啦 但光看阿滴頻道本來就無法學好英文真正要學好英文,還是要參考語言習得以及英語教學上的研究成果,用正確的方法來持之以恆的學習。上次滴妹講自然發音vs KK音標,竟然避重就輕地說兩個都有優點。好啦,她不想得罪人。畢竟KK音標是很多台灣老師的生財工具。現代語言習得研究以及英語教學裡,KK音標早就沒人再談了。就台灣一堆老師在那邊堅持台灣沒環境,需要KK。唉,沒環境本來就學不好外語。無需討論。都二十一世紀了,都有網路了,還在沒環境。即便是在沒環境情況下,教KK也只是把發音責任轉嫁到另一套符號上面而已。你說音標到底要不要學?還是要啦,這樣發音可以發更準些。但是教小孩本來就不需要音標。長大以後,學學英文的一些常見ipa音標就ok,這樣看到字典音標就會念得更準。(現在字典也沒在用KK音標了。都嘛IPA,或是自創簡易音標。)完全不需要一開始就教小孩一整套音標系統,根本本末倒置。你說,哇沒音標怎麼唸?阿就查字典啊,現在字典不都真人發音? 你說,哇,那每個字遇到不會唸就要查字典喔?遇到不會唸的字本來旁邊也不會有音標啊,最後不都得查字典?反正每次講音標都會得罪一群人啦滴妹避重就輕讓我很失望就是了 "

以日期區隔document

# 內容(日期、詞彙、詞頻、長度)
di_tokens_by_date <- di_tokens %>% 
  filter(!str_detect(word, regex("[0-9]"))) %>%
  count(artDate, word, sort = TRUE)
di_total_words_by_date <- di_tokens_by_date %>% 
  group_by(artDate) %>% 
  summarize(total = sum(n)) %>% 
  arrange(desc(total))
di_tokens_by_date <- left_join(di_tokens_by_date, di_total_words_by_date)
## Joining, by = "artDate"

選擇文章長度大於50個詞

di_words_tf_idf_date <- di_tokens_by_date %>%
  bind_tf_idf(word, artDate, n) 
di_words_tf_idf_date<- di_words_tf_idf_date %>% 
  filter(total > 50) %>% filter(!str_detect(word, regex("[a-z]")))  %>% group_by(artDate) %>% top_n(1) %>% arrange(desc(artDate)) # word出現異常英文詞彙先行過濾
## Selecting by tf_idf
di_words_tf_idf_date
## # A tibble: 76 x 7
## # Groups:   artDate [67]
##    artDate    word       n total      tf   idf tf_idf
##    <date>     <chr>  <int> <int>   <dbl> <dbl>  <dbl>
##  1 2020-05-23 身體       6   211 0.0284   5.02 0.143 
##  2 2020-05-17 發布       6   320 0.0188   3.23 0.0606
##  3 2020-05-13 國華      10   275 0.0364   3.64 0.132 
##  4 2020-05-12 五分鐘     5   534 0.00936  5.02 0.0470
##  5 2020-05-12 手搖       5   534 0.00936  5.02 0.0470
##  6 2020-05-12 兩杯       5   534 0.00936  5.02 0.0470
##  7 2020-05-12 客服       5   534 0.00936  5.02 0.0470
##  8 2020-05-11 二代       2    69 0.0290   3.93 0.114 
##  9 2020-05-06 媽媽       3    65 0.0462   4.33 0.200 
## 10 2020-05-02 台灣      20   419 0.0477   1.36 0.0649
## # ... with 66 more rows

找出幾個日期討論高點

# 內容(日期、詞彙、詞頻、長度、tf、idf、tf_idf)
di_words_tf_idf_date %>% arrange(desc(n))
## # A tibble: 76 x 7
## # Groups:   artDate [67]
##    artDate    word      n total     tf   idf tf_idf
##    <date>     <chr> <int> <int>  <dbl> <dbl>  <dbl>
##  1 2020-04-11 台灣    277  7957 0.0348  1.36 0.0474
##  2 2020-04-12 代表    121  8005 0.0151  2.38 0.0360
##  3 2019-07-13 總統     35   289 0.121   2.72 0.330 
##  4 2017-07-31 頻道     32   378 0.0847  1.36 0.115 
##  5 2020-04-14 廣告     26   822 0.0316  2.46 0.0778
##  6 2020-04-15 廣告     23  1562 0.0147  2.46 0.0362
##  7 2020-04-10 集資     22   783 0.0281  2.63 0.0738
##  8 2020-05-02 台灣     20   419 0.0477  1.36 0.0649
##  9 2019-12-15 亞洲     12   283 0.0424  3.64 0.154 
## 10 2019-02-11 音標     12   139 0.0863  5.02 0.434 
## # ... with 66 more rows
di_words_tf_idf_date %>% 
  filter(total > 50) %>% 
  filter(artDate == as.Date("2020-05-23") |
         artDate == as.Date("2020-05-12") |
         artDate == as.Date("2020-04-12") | 
         artDate == as.Date("2020-04-10") | 
         artDate == as.Date("2019-12-15") |
         artDate == as.Date("2019-07-13") | 
         artDate == as.Date("2017-07-31")) %>% 
  group_by(artDate) %>%  
  top_n(1) %>% 
  arrange(desc(artDate))
## Selecting by tf_idf
## # A tibble: 10 x 7
## # Groups:   artDate [7]
##    artDate    word       n total      tf   idf tf_idf
##    <date>     <chr>  <int> <int>   <dbl> <dbl>  <dbl>
##  1 2020-05-23 身體       6   211 0.0284   5.02 0.143 
##  2 2020-05-12 五分鐘     5   534 0.00936  5.02 0.0470
##  3 2020-05-12 手搖       5   534 0.00936  5.02 0.0470
##  4 2020-05-12 兩杯       5   534 0.00936  5.02 0.0470
##  5 2020-05-12 客服       5   534 0.00936  5.02 0.0470
##  6 2020-04-12 代表     121  8005 0.0151   2.38 0.0360
##  7 2020-04-10 集資      22   783 0.0281   2.63 0.0738
##  8 2019-12-15 亞洲      12   283 0.0424   3.64 0.154 
##  9 2019-07-13 總統      35   289 0.121    2.72 0.330 
## 10 2017-07-31 頻道      32   378 0.0847   1.36 0.115

以下為討論高點日期內的文章 2020/5/23 : [新聞]阿滴宣布2頻道停更!新片2分38秒全黑 認(1篇文章) 2020/5/12 : [新聞]忙歪!限兩杯、沒外送阿滴改當客服(1篇文章) 2020/4/12 : [新聞]楊蕙如質疑阿滴「Youtuber可代表台灣罵人(1篇文章) 2020/4/10 : [新聞]阿滴集資400萬達標!(4篇文章)  2019/12/15 : [新聞]網紅跨界亞洲教育攜手阿滴英文開實體補習班(1篇文章) 2019/7/13 : [新聞]阿滴開箱總統專機曝光空軍一號內裝(1篇文章) 2017/7/31 : [FB]阿滴談清流youtuber(1篇文章)

前後三個字彙

找出常出現在「阿滴」附近的字 根據n-1個item來預測第n個item

ngram_7 <- function(t) {
  lapply(t, function(x) {
    tokens <- segment(x, jieba_tokenizer)
    ngram <- ngrams(tokens, 7)
    ngram <- lapply(ngram, paste, collapse = " ")
    unlist(ngram)
  })
}

di_ngram_7 <- data2 %>%
  select(artUrl, sentence) %>%
  unnest_tokens(ngram, sentence, token = ngram_7) %>%
  filter(!str_detect(ngram, regex("[0-9a-zA-Z]")))
di_ngrams_7_separated <- di_ngram_7 %>%
  separate(ngram, paste0("word", c(1:7),sep=""), sep = " ")
head(di_ngrams_7_separated)
##                                                     artUrl word1 word2 word3
## 1 https://www.ptt.cc/bbs/Gossiping/M.1499435488.A.64E.html  大德  晚安  我國
## 2 https://www.ptt.cc/bbs/Gossiping/M.1499435488.A.64E.html  晚安  我國  少見
## 3 https://www.ptt.cc/bbs/Gossiping/M.1499435488.A.64E.html  於今    日  晚間
## 4 https://www.ptt.cc/bbs/Gossiping/M.1499435488.A.64E.html    日  晚間  已經
## 5 https://www.ptt.cc/bbs/Gossiping/M.1499435488.A.64E.html  晚間  已經  確定
## 6 https://www.ptt.cc/bbs/Gossiping/M.1499435488.A.64E.html  已經  確定  成為
##   word4  word5  word6  word7
## 1  少見   清流   頻道     滴
## 2  清流   頻道     滴   英文
## 3  已經   確定   成為   台灣
## 4  確定   成為   台灣 第六個
## 5  成為   台灣 第六個   訂閱
## 6  台灣 第六個   訂閱   人數
di_check_words <- di_ngrams_7_separated %>%
  filter((word4 == "阿滴"))
head(di_check_words)
##                                                     artUrl word1    word2
## 1 https://www.ptt.cc/bbs/Gossiping/M.1499435488.A.64E.html    中   蔡阿嘎
## 2 https://www.ptt.cc/bbs/Gossiping/M.1499435488.A.64E.html  英文     合作
## 3 https://www.ptt.cc/bbs/Gossiping/M.1499435488.A.64E.html  高級 工商職業
## 4 https://www.ptt.cc/bbs/Gossiping/M.1499435488.A.64E.html  曾經       已
## 5 https://www.ptt.cc/bbs/Gossiping/M.1499527731.A.E6B.html  如題       少
## 6 https://www.ptt.cc/bbs/Gossiping/M.1500752013.A.6B4.html  如題     阿滴
##    word3 word4    word5  word6 word7
## 1 谷阿莫  阿滴     英文   合作  影片
## 2   影片  阿滴     採訪 蔡阿嘎  發出
## 3   學校  阿滴 輔仁大學     滴  英文
## 4   雷射  阿滴       滴     妹    外
## 5   滴妹  阿滴     剩下 剩阿滴    欸
## 6   英文  阿滴     覺得   他算  帥哥
di_check_words_count <- di_check_words %>%
  melt(id.vars = "artUrl", measure.vars = paste0("word", c(1:7),sep="")) %>%
  rename(word=value) %>%
  filter(variable!="word4") %>%
  filter(!(word %in% stop_words), nchar(word)>1) %>%
  count(word, sort = TRUE)
di_check_words_count %>%
  arrange(desc(abs(n))) %>%
  head(15) %>%
  mutate(word = reorder(word, n)) %>%
  ggplot(aes(word, n, fill = n > 0)) +
  geom_col(show.legend = FALSE) +
  xlab("出現在「阿滴」附近的字") +
  ylab("出現次數") +
  coord_flip()+ 
  theme(text = element_text(family = "微軟雅黑"))

Word Correlation(詞彙之間的相關性)

di_words_by_art <- data2 %>%
  unnest_tokens(word, sentence, token=d_tokenizer) %>%
  filter(!str_detect(word, regex("[0-9]"))) %>%
  count(artUrl, word, sort = TRUE)
di_word_pairs <- di_words_by_art %>%
  pairwise_count(word, artUrl, sort = TRUE)
di_word_pairs
## # A tibble: 2,580,746 x 3
##    item1  item2      n
##    <chr>  <chr>  <dbl>
##  1 阿滴   英文     214
##  2 英文   阿滴     214
##  3 阿滴   台灣     202
##  4 台灣   阿滴     202
##  5 真的   阿滴     104
##  6 阿滴   真的     104
##  7 八卦   阿滴     101
##  8 阿滴   八卦     101
##  9 有沒有 阿滴     100
## 10 阿滴   有沒有   100
## # ... with 2,580,736 more rows
di_word_cors <- di_words_by_art %>%
  group_by(word) %>%
  filter(n() >= 50) %>%
  pairwise_cor(word, artUrl, sort = TRUE)
di_word_cors %>%
  filter(item1 == "阿滴")
## # A tibble: 35 x 3
##    item1 item2    correlation
##    <chr> <chr>          <dbl>
##  1 阿滴  新聞          0.0662
##  2 阿滴  頻道          0.0634
##  3 阿滴  刊登          0.0634
##  4 阿滴  有沒有        0.0444
##  5 阿滴  youtuber      0.0436
##  6 阿滴  世界          0.0372
##  7 阿滴  募款          0.0372
##  8 阿滴  影片          0.0372
##  9 阿滴  比較          0.0335
## 10 阿滴  who           0.0296
## # ... with 25 more rows

詞彙之間相關性轉成共現圖

seed_words <- c("新聞", "綜合", "appledaily")
threshold <- 0.65
remove_words <- di_word_cors %>%
                filter((item1 %in% seed_words|item2 %in% seed_words), correlation>threshold) %>%
                .$item1 %>%
                unique()
set.seed(2017)
di_word_cors_new <- di_word_cors %>%
                filter(!(item1 %in% remove_words|item2 %in% remove_words))
di_word_cors_new %>%
  filter(correlation > .03) %>%
  graph_from_data_frame() %>%
  ggraph(layout = "fr") +
  geom_edge_link(aes(edge_alpha = correlation), show.legend = FALSE) + 
  geom_node_point(color = "lightblue", size = 3) +
  geom_node_text(aes(label = name), repel = TRUE, family = "微軟雅黑") +
  theme_void()
## Warning in grid.Call(C_textBounds, as.graphicsAnnot(x$label), x$x, x$y, : font
## family not found in Windows font database

term_avg_tfidf <- di_words_tf_idf %>% 
  group_by(word) %>% 
  summarise(tfidf_avg = mean(tf_idf))
term_avg_tfidf$tfidf_avg %>% summary
##     Min.  1st Qu.   Median     Mean  3rd Qu.     Max. 
## 0.001028 0.016435 0.026196 0.034154 0.039467 0.517894
term_remove=term_avg_tfidf %>%  
  filter(tfidf_avg<0.0325254) %>% 
  .$word
term_remove %>% head
## [1] "<U+5218><U+754A>宏" "<U+5218>以" "<U+5F20><U+94A7>" "<U+5F20>惠妹" "<U+8D3A><U+519B>翔" "<U+8D56>冠霖"
di_dtm = di_words_tf_idf %>%
  filter(!word %in% term_remove) %>%
  cast_dtm(document=artTitle,term=word,value= n)

di_dtm
## <<DocumentTermMatrix (documents: 133, terms: 2726)>>
## Non-/sparse entries: 4555/358003
## Sparsity           : 99%
## Maximal term length: 5
## Weighting          : term frequency (tf)
di_dtm_matrix = di_dtm %>% as.data.frame.matrix 
di_dtm_matrix[1:10,1:20]
##                                                 音標 理科太太 妹妹 哥倫布 爭鮮
## Re:[問卦]阿滴英文算過氣了嗎?                     12        0    0      0    0
## [新聞]理科太太收了滴妹喊話阿滴網讚「攻爆了         0        7    2      0    0
## [問卦]阿滴是噗是妹控啊?                           0        0    8      0    0
## [問卦]有沒有哥倫布屌打阿滴的八卦?                 0        0    0      4    0
## Re:[問卦]館長/酷炫/阿滴/howhow在孤島生存的八卦?    0        0    0      0    4
## [新聞]阿滴開箱總統專機曝光空軍一號內裝             0        0    0      0    0
## [問卦]籲請阿滴暫停刊登廣告                         0        0    0      0    0
## Re:[問卦]阿滴英文背景的台灣中國地圖                0        0    0      0    0
## Re:[政治]阿滴募資紐時廣告楊蕙如:YouTuber可代      0        0    0      0    0
## [問卦]台大外文的英文能力是不是比阿滴還弱?         0        0    0      0    0
##                                                 總統 專機 德賽 上傳 聖母 街訪
## Re:[問卦]阿滴英文算過氣了嗎?                      0    0    0    0    0    0
## [新聞]理科太太收了滴妹喊話阿滴網讚「攻爆了         0    0    0    0    0    0
## [問卦]阿滴是噗是妹控啊?                           0    0    0    0    0    0
## [問卦]有沒有哥倫布屌打阿滴的八卦?                 0    0    0    0    0    0
## Re:[問卦]館長/酷炫/阿滴/howhow在孤島生存的八卦?    0    0    0    0    0    0
## [新聞]阿滴開箱總統專機曝光空軍一號內裝            35   16    0    0    0    0
## [問卦]籲請阿滴暫停刊登廣告                         0    0    5    0    0    0
## Re:[問卦]阿滴英文背景的台灣中國地圖                0    0    0    5    0    3
## Re:[政治]阿滴募資紐時廣告楊蕙如:YouTuber可代      0    0    0    0    7    0
## [問卦]台大外文的英文能力是不是比阿滴還弱?         0    0    0    0    0    0
##                                                 外文系 台南 正派 阿土 名師 輔大
## Re:[問卦]阿滴英文算過氣了嗎?                        0    0    0    0    0    0
## [新聞]理科太太收了滴妹喊話阿滴網讚「攻爆了           0    0    0    0    0    0
## [問卦]阿滴是噗是妹控啊?                             0    0    0    0    0    0
## [問卦]有沒有哥倫布屌打阿滴的八卦?                   0    0    0    0    0    0
## Re:[問卦]館長/酷炫/阿滴/howhow在孤島生存的八卦?      0    0    0    3    0    0
## [新聞]阿滴開箱總統專機曝光空軍一號內裝               0    0    0    0    0    0
## [問卦]籲請阿滴暫停刊登廣告                           0    0    0    0    0    0
## Re:[問卦]阿滴英文背景的台灣中國地圖                  0    0    0    0    0    0
## Re:[政治]阿滴募資紐時廣告楊蕙如:YouTuber可代        0    0    0    0    0    0
## [問卦]台大外文的英文能力是不是比阿滴還弱?           3    0    0    0    0    2
##                                                 本魯 板民 一下子
## Re:[問卦]阿滴英文算過氣了嗎?                      0    0      0
## [新聞]理科太太收了滴妹喊話阿滴網讚「攻爆了         0    0      0
## [問卦]阿滴是噗是妹控啊?                           0    0      0
## [問卦]有沒有哥倫布屌打阿滴的八卦?                 0    0      0
## Re:[問卦]館長/酷炫/阿滴/howhow在孤島生存的八卦?    0    0      0
## [新聞]阿滴開箱總統專機曝光空軍一號內裝             0    0      0
## [問卦]籲請阿滴暫停刊登廣告                         0    0      0
## Re:[問卦]阿滴英文背景的台灣中國地圖                0    0      0
## Re:[政治]阿滴募資紐時廣告楊蕙如:YouTuber可代      0    0      0
## [問卦]台大外文的英文能力是不是比阿滴還弱?         0    0      0
library(doParallel)
## Loading required package: foreach
## Loading required package: iterators
## Loading required package: parallel
clust = makeCluster(detectCores())
registerDoParallel(clust); getDoParWorkers()
## [1] 4
t0 = Sys.time()
d = di_dtm_matrix %>%
  dist(method="euclidean")  # 歐式距離,算文章與文章之間的距離
Sys.time() - t0
## Time difference of 0.830025 secs
hc = hclust(d, method='ward.D')  
plot(hc, labels = FALSE, xlab = NULL)
rect.hclust(hc, k = 2, border="red")

t0 = Sys.time()
n = 2000   # n個字
tsne = di_dtm[, 1:n] %>% as.data.frame.matrix %>% scale %>% t %>% Rtsne(
check_duplicates = FALSE, theta=0.0, max_iter=3200)
Sys.time()-t0
## Time difference of 13.55685 mins
Y = tsne$Y              # tSNE coordinates
d_Y = dist(Y)           # distance matrix
hc_Y = hclust(d_Y )     # hi-clustering
plot(hc_Y,label=F)
rect.hclust(hc_Y, k=10, border="red")

kg = cutree(hc, k = 2)
L = split(di_dtm_matrix, kg)
L$`1`[1:10,1:10]
##                                                 音標 理科太太 妹妹 哥倫布 爭鮮
## Re:[問卦]阿滴英文算過氣了嗎?                     12        0    0      0    0
## [新聞]理科太太收了滴妹喊話阿滴網讚「攻爆了         0        7    2      0    0
## [問卦]阿滴是噗是妹控啊?                           0        0    8      0    0
## [問卦]有沒有哥倫布屌打阿滴的八卦?                 0        0    0      4    0
## Re:[問卦]館長/酷炫/阿滴/howhow在孤島生存的八卦?    0        0    0      0    4
## [問卦]籲請阿滴暫停刊登廣告                         0        0    0      0    0
## Re:[問卦]阿滴英文背景的台灣中國地圖                0        0    0      0    0
## Re:[政治]阿滴募資紐時廣告楊蕙如:YouTuber可代      0        0    0      0    0
## [問卦]台大外文的英文能力是不是比阿滴還弱?         0        0    0      0    0
## [新聞]台南人英語超強?阿滴、滴妹街頭實測結         0        0    0      0    0
##                                                 總統 專機 德賽 上傳 聖母
## Re:[問卦]阿滴英文算過氣了嗎?                      0    0    0    0    0
## [新聞]理科太太收了滴妹喊話阿滴網讚「攻爆了         0    0    0    0    0
## [問卦]阿滴是噗是妹控啊?                           0    0    0    0    0
## [問卦]有沒有哥倫布屌打阿滴的八卦?                 0    0    0    0    0
## Re:[問卦]館長/酷炫/阿滴/howhow在孤島生存的八卦?    0    0    0    0    0
## [問卦]籲請阿滴暫停刊登廣告                         0    0    5    0    0
## Re:[問卦]阿滴英文背景的台灣中國地圖                0    0    0    5    0
## Re:[政治]阿滴募資紐時廣告楊蕙如:YouTuber可代      0    0    0    0    7
## [問卦]台大外文的英文能力是不是比阿滴還弱?         0    0    0    0    0
## [新聞]台南人英語超強?阿滴、滴妹街頭實測結         0    0    0    0    0
sapply(L, function(x) x%>% colMeans %>% sort %>% tail %>% names)
##      1      2       
## [1,] "中國" "系列"  
## [2,] "頻道" "知識型"
## [3,] "滴妹" "百萬"  
## [4,] "完整" "專機"  
## [5,] "廣告" "總統"  
## [6,] "代表" "頻道"
K = 10                            # number of clusters
g = cutree(hc_Y,K)                # cut into K clusters
table(g) %>% as.vector %>% sort   # sizes of clusters
##  [1]  74 102 106 149 166 182 200 215 287 519
wc = col_sums(di_dtm[,1:n])       # n個字
colors = distinctColorPalette(K)
png(file.path(ROOT.DIR, "6_Pic", filename="Di_Group.png"), width=3200, height=1800)  # 輸出圖片到路徑下
textplot(Y[,1], Y[,2], colnames(di_dtm)[1:n], show=F,
col=colors[g],
cex= 0.3 + 1.25 * sqrt(wc/mean(wc)),
font=2, family = "微軟雅黑")
dev.off()
## png 
##   2
knitr::include_graphics(file.path(ROOT.DIR, "6_Pic/Di_Group.png"))

結論(一)

阿滴在PTT版上的討論度在最近一個月有較高的成長,原因是因為疫情的關係 讓他在四月份決定號召其他人共同集資並刊登廣告在紐約時報上為台灣發聲, 因此,在四月中的網路文章討論度就很高,但是關於他的本業英文議題來說 就沒有得到比較高的關注,所以其實文字分析可能還是針對某一事件發生的特 殊時間點來做資料收集與分析會得到比較多有意義且好玩的結果。如果長期雖 然都有評論文章的產生,但是討論度或是數量不高的話,其實也只能得到與本 身特質或既定事情有關連的分析結果。

LDA分析

觀察資料分布,將資料集2帶入

data2 %>% 
  group_by(artDate) %>%
  summarise(count = n())%>%
  ggplot(aes(artDate,count))+
    geom_line(color="red")+
  geom_point()

## 斷詞

new_tokens <- data2 %>%
  unnest_tokens(word, sentence, token=d_tokenizer) %>%
  filter(!str_detect(word, regex("[0-9a-zA-Z]"))) %>%
  count(artUrl, word) %>%
  rename(count=n)
new_tokens %>%head(20)
## # A tibble: 20 x 3
##    artUrl                                                   word     count
##    <chr>                                                    <chr>    <int>
##  1 https://www.ptt.cc/bbs/Gossiping/M.1499435488.A.64E.html 七分         1
##  2 https://www.ptt.cc/bbs/Gossiping/M.1499435488.A.64E.html 人數         1
##  3 https://www.ptt.cc/bbs/Gossiping/M.1499435488.A.64E.html 十一         1
##  4 https://www.ptt.cc/bbs/Gossiping/M.1499435488.A.64E.html 十二         1
##  5 https://www.ptt.cc/bbs/Gossiping/M.1499435488.A.64E.html 十三         1
##  6 https://www.ptt.cc/bbs/Gossiping/M.1499435488.A.64E.html 十萬         1
##  7 https://www.ptt.cc/bbs/Gossiping/M.1499435488.A.64E.html 三十名       1
##  8 https://www.ptt.cc/bbs/Gossiping/M.1499435488.A.64E.html 大德         1
##  9 https://www.ptt.cc/bbs/Gossiping/M.1499435488.A.64E.html 大學         4
## 10 https://www.ptt.cc/bbs/Gossiping/M.1499435488.A.64E.html 女性         1
## 11 https://www.ptt.cc/bbs/Gossiping/M.1499435488.A.64E.html 工商職業     1
## 12 https://www.ptt.cc/bbs/Gossiping/M.1499435488.A.64E.html 已經         1
## 13 https://www.ptt.cc/bbs/Gossiping/M.1499435488.A.64E.html 不到         2
## 14 https://www.ptt.cc/bbs/Gossiping/M.1499435488.A.64E.html 中國         1
## 15 https://www.ptt.cc/bbs/Gossiping/M.1499435488.A.64E.html 五千萬       1
## 16 https://www.ptt.cc/bbs/Gossiping/M.1499435488.A.64E.html 今年         1
## 17 https://www.ptt.cc/bbs/Gossiping/M.1499435488.A.64E.html 公立         1
## 18 https://www.ptt.cc/bbs/Gossiping/M.1499435488.A.64E.html 六個         5
## 19 https://www.ptt.cc/bbs/Gossiping/M.1499435488.A.64E.html 天秤         1
## 20 https://www.ptt.cc/bbs/Gossiping/M.1499435488.A.64E.html 天菜         1

將資料轉換為Document terms Matrix (DTM)

di_dtm <- new_tokens %>% cast_dtm(artUrl, word, count)
di_dtm
## <<DocumentTermMatrix (documents: 521, terms: 8558)>>
## Non-/sparse entries: 24886/4433832
## Sparsity           : 99%
## Maximal term length: 6
## Weighting          : term frequency (tf)
inspect(di_dtm[1:10,1:10])
## <<DocumentTermMatrix (documents: 10, terms: 10)>>
## Non-/sparse entries: 12/88
## Sparsity           : 88%
## Maximal term length: 3
## Weighting          : term frequency (tf)
## Sample             :
##                                                           Terms
## Docs                                                       七分 人數 十一 十二
##   https://www.ptt.cc/bbs/Gossiping/M.1499435488.A.64E.html    1    1    1    1
##   https://www.ptt.cc/bbs/Gossiping/M.1499527731.A.E6B.html    0    0    0    0
##   https://www.ptt.cc/bbs/Gossiping/M.1500752013.A.6B4.html    0    0    0    0
##   https://www.ptt.cc/bbs/Gossiping/M.1500798279.A.78A.html    0    0    0    0
##   https://www.ptt.cc/bbs/Gossiping/M.1500872815.A.CF4.html    0    0    0    0
##   https://www.ptt.cc/bbs/Gossiping/M.1501514365.A.21C.html    0    0    0    0
##   https://www.ptt.cc/bbs/Gossiping/M.1501558775.A.410.html    0    0    0    0
##   https://www.ptt.cc/bbs/Gossiping/M.1502195137.A.E63.html    0    1    0    0
##   https://www.ptt.cc/bbs/Gossiping/M.1502202373.A.9DF.html    0    0    0    0
##   https://www.ptt.cc/bbs/Gossiping/M.1502446507.A.272.html    0    0    0    0
##                                                           Terms
## Docs                                                       十三 十萬 三十名
##   https://www.ptt.cc/bbs/Gossiping/M.1499435488.A.64E.html    1    1      1
##   https://www.ptt.cc/bbs/Gossiping/M.1499527731.A.E6B.html    0    0      0
##   https://www.ptt.cc/bbs/Gossiping/M.1500752013.A.6B4.html    0    0      0
##   https://www.ptt.cc/bbs/Gossiping/M.1500798279.A.78A.html    0    0      0
##   https://www.ptt.cc/bbs/Gossiping/M.1500872815.A.CF4.html    0    0      0
##   https://www.ptt.cc/bbs/Gossiping/M.1501514365.A.21C.html    0    0      0
##   https://www.ptt.cc/bbs/Gossiping/M.1501558775.A.410.html    0    0      0
##   https://www.ptt.cc/bbs/Gossiping/M.1502195137.A.E63.html    0    0      0
##   https://www.ptt.cc/bbs/Gossiping/M.1502202373.A.9DF.html    0    0      0
##   https://www.ptt.cc/bbs/Gossiping/M.1502446507.A.272.html    0    0      0
##                                                           Terms
## Docs                                                       大德 大學 女性
##   https://www.ptt.cc/bbs/Gossiping/M.1499435488.A.64E.html    1    4    1
##   https://www.ptt.cc/bbs/Gossiping/M.1499527731.A.E6B.html    0    0    0
##   https://www.ptt.cc/bbs/Gossiping/M.1500752013.A.6B4.html    0    0    0
##   https://www.ptt.cc/bbs/Gossiping/M.1500798279.A.78A.html    0    0    0
##   https://www.ptt.cc/bbs/Gossiping/M.1500872815.A.CF4.html    0    0    0
##   https://www.ptt.cc/bbs/Gossiping/M.1501514365.A.21C.html    0    0    0
##   https://www.ptt.cc/bbs/Gossiping/M.1501558775.A.410.html    0    1    0
##   https://www.ptt.cc/bbs/Gossiping/M.1502195137.A.E63.html    0    0    0
##   https://www.ptt.cc/bbs/Gossiping/M.1502202373.A.9DF.html    0    0    0
##   https://www.ptt.cc/bbs/Gossiping/M.1502446507.A.272.html    0    0    0

DTM矩陣

建立LDA模型

lda <- LDA(di_dtm, k=2, control =  list(seed=2020)) # 創建主題模型
lda
## A LDA_VEM topic model with 2 topics.
topics <- tidy(lda, matrix = "beta") # 查看每個主題的詞彙機率值
topics # 從topics中可以得到特定主題生成特定詞彙的概率
## # A tibble: 17,116 x 3
##    topic term      beta
##    <int> <chr>    <dbl>
##  1     1 七分  6.04e- 5
##  2     2 七分  9.37e-61
##  3     1 人數  8.75e- 4
##  4     2 人數  4.22e- 4
##  5     1 十一  6.04e- 5
##  6     2 十一  1.09e-58
##  7     1 十二  6.04e- 5
##  8     2 十二  1.84e-58
##  9     1 十三  6.04e- 5
## 10     2 十三  2.24e-58
## # ... with 17,106 more rows

尋找Topic的代表字

top_terms <- topics %>%
  group_by(topic) %>%
  top_n(10, beta) %>%
  ungroup() %>%
  arrange(topic, -beta)
top_terms %>%
  mutate(term = reorder(term, beta)) %>%
  ggplot(aes(term, beta, fill = factor(topic))) +
  geom_col(show.legend = FALSE) +
  facet_wrap(~ topic, scales = "free") +
  coord_flip()

透過上方的圖,主題一姑且先下標題為“阿滴與滴妹”,主題二為“集資廣告”,再來嘗試多分出其他topics看看有無有趣的結果。

更多主題

  • 嘗試分成2,5,10,16主題數,將結果存起來,再做進一步分析
ldas = c()
topics = c(2,5,10,16)
for(topic in topics){
  start_time <- Sys.time()
  lda <- LDA(di_dtm, k = topic, control = list(seed = 2020))
  ldas =c(ldas,lda) # last of lda = 16
  print(paste(topic ,paste("topic(s) and use time is ", Sys.time() -start_time)))
 save(ldas,file = file.path(ROOT.DIR,"7_Result/ldas_result"))
}

載入每個主題的LDA結果

load(file.path(ROOT.DIR, "7_Result/ldas_result"))

透過perplexity找到最佳主題數(折線轉軸處)

library(purrr)
## 
## Attaching package: 'purrr'
## The following objects are masked from 'package:foreach':
## 
##     accumulate, when
## The following object is masked from 'package:scales':
## 
##     discard
## The following objects are masked from 'package:igraph':
## 
##     compose, simplify
## The following object is masked from 'package:data.table':
## 
##     transpose
topics = c(2,5,10,16)
data_frame(k = topics,
           perplex = map_dbl(ldas[1:4], topicmodels::perplexity)) %>%
  ggplot(aes(k, perplex)) +
  geom_point() +
  geom_line() +
  labs(title = "Evaluating LDA topic models",
       subtitle = "Optimal number of topics (smaller is better)",
       x = "Number of topics",
       y = "Perplexity")
## Warning: `data_frame()` is deprecated as of tibble 1.1.0.
## Please use `tibble()` instead.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_warnings()` to see where this warning was generated.

perplexity 越小越好,通常會找一個主題數適當,且perplexity比較低的主題。

LDAvis 產生create LDAvis所需的json function

將前面“LDA function”所建立的model,轉換為“LDAVis”套件的input格式

topicmodels_json_ldavis <- function(fitted, doc_term){
    require(LDAvis)
    require(slam)

ls_LDA = function (phi)
{
  jensenShannon <- function(x, y) {
      m <- 0.5 * (x + y)
    lhs <- ifelse(x == 0, 0, x * (log(x) - log(m+1e-16)))
    rhs <- ifelse(y == 0, 0, y * (log(y) - log(m+1e-16)))
    0.5 * sum(lhs) + 0.5 * sum(rhs)
  }
  dist.mat <- proxy::dist(x = phi, method = jensenShannon)
  pca.fit <- stats::cmdscale(dist.mat, k = 2)
  data.frame(x = pca.fit[, 1], y = pca.fit[, 2])
}
    # Find required quantities
    phi <- as.matrix(topicmodels::posterior(fitted)$terms)
    theta <- as.matrix(topicmodels::posterior(fitted)$topics)
    vocab <- colnames(phi)
    term_freq <- slam::col_sums(doc_term)
    # Convert to json
    json_lda <- LDAvis::createJSON(phi = phi, theta = theta,
                            vocab = vocab,
                            doc.length = as.vector(table(doc_term$i)),
                            term.frequency = term_freq, mds.method = ls_LDA)
    return(json_lda)
}

產生LDAvis結果

https://boseanchen.github.io/LDAvis/vis/#topic=5&lambda=0.5&term= 上傳Github一樣無法顯示LDAvis Results

# 以下用來產生ldavis的檔案
# for(lda in ldas){
# 
#   k = lda@k ## lda 主題數
#   if(k==2){next}
#   json_res <- topicmodels_json_ldavis(lda,di_dtm)
#   # serVis(json_res,open.browser = T)
#   lda_dir =  paste0(k,"_ldavis")
#   if(!dir.exists(lda_dir)){dir.create("./",lda_dir)}
# 
#   serVis(json_res, out.dir = lda_dir, open.browser = F)
# 
#   writeLines(iconv(readLines(paste0(lda_dir, "/lda.json")), to = "UTF8"))
# }
# 
# 
# topic_2 = ldas[[2]] # must bigger than 2 topics of original, ldas[[2]] = 5 topics. 2個topic是畫不出來ldavis,必須要大於2 topic
# json_res <- topicmodels_json_ldavis(topic_2,di_dtm)
# serVis(json_res,open.browser = T)
#
# 如果無法開啟視窗(windows用戶)可執行這段 --> 同樣無法顯示LDAvis結果 http://127.0.0.1:6694
# serVis(json_res, out.dir = "vis", open.browser = T)
# writeLines(iconv(readLines("./vis/lda.json"), to = "UTF8"))

LDA後續分析

  • 選定主題數5的結果來作後續的分析
di_lda = ldas[[2]] # 轉軸似乎以10主題為最佳,因時間關係先選定topic為5的結果

di_topics <- tidy(di_lda, matrix = "beta") # 注意,在tidy function裡面要使用"beta"來取出Phi矩陣。
di_topics
## # A tibble: 42,790 x 3
##    topic term       beta
##    <int> <chr>     <dbl>
##  1     1 七分  5.99e-146
##  2     2 七分  1.41e-147
##  3     3 七分  6.34e-150
##  4     4 七分  2.42e-142
##  5     5 七分  1.62e-  4
##  6     1 人數  4.08e-  4
##  7     2 人數  7.51e-  4
##  8     3 人數  5.35e-  4
##  9     4 人數  3.89e-  4
## 10     5 人數  1.25e-  3
## # ... with 42,780 more rows

尋找Topic的代表字

  • 整理出每一個Topic中生成概率最高的10個詞彙。
top_terms <- di_topics %>%
  group_by(topic) %>%
  top_n(10, beta) %>%
  ungroup() %>%
  arrange(topic, -beta)

top_terms %>%
  mutate(term = reorder(term, beta)) %>%
  ggplot(aes(term, beta, fill = factor(topic))) +
  geom_col(show.legend = FALSE) +
  scale_fill_manual(values=mycolors)+
  facet_wrap(~ topic, scales = "free") +
  coord_flip()

5個主題中各自最常出現的詞彙,可依此推斷是在討論什麼。

另外先行移除跨主題共享或無效的詞彙(例如阿滴,英文等)

remove_word = c("阿滴","英文","台灣","有沒有","是不是")

top_terms <- di_topics %>%
  filter(!term %in% remove_word)%>%
  group_by(topic) %>%
  top_n(10, beta) %>%
  ungroup() %>%
  arrange(topic, -beta)

top_terms %>%
  mutate(term = reorder(term, beta)) %>%
  ggplot(aes(term, beta, fill = factor(topic))) +
  geom_col(show.legend = FALSE) +
  scale_fill_manual(values=mycolors)+
  facet_wrap(~ topic, scales = "free") +
  coord_flip()

主題命名

從出現的詞彙推測該主題

topic_name = c('總統','滴妹','疫情','募款','教育')

例如 : 主題一出現“總統”。 主題二出現“滴妹”。 主題三出現“疫情”。 主題四出現“募款”。 主題五出現“教育”。

Document-topic probabilities

theta矩陣

di_documents <- tidy(di_lda, matrix = "gamma") %>% group_by(document) %>% top_n(1, wt=gamma) # di_lda = ldas[[2]] 
di_documents
## # A tibble: 521 x 3
## # Groups:   document [521]
##    document                                                 topic gamma
##    <chr>                                                    <int> <dbl>
##  1 https://www.ptt.cc/bbs/Gossiping/M.1500752013.A.6B4.html     1 0.985
##  2 https://www.ptt.cc/bbs/Gossiping/M.1500798279.A.78A.html     1 0.999
##  3 https://www.ptt.cc/bbs/Gossiping/M.1500872815.A.CF4.html     1 0.643
##  4 https://www.ptt.cc/bbs/Gossiping/M.1501558775.A.410.html     1 1.00 
##  5 https://www.ptt.cc/bbs/Gossiping/M.1502202373.A.9DF.html     1 0.689
##  6 https://www.ptt.cc/bbs/Gossiping/M.1502446507.A.272.html     1 0.988
##  7 https://www.ptt.cc/bbs/Gossiping/M.1503133800.A.445.html     1 0.818
##  8 https://www.ptt.cc/bbs/Gossiping/M.1516548212.A.4AC.html     1 0.997
##  9 https://www.ptt.cc/bbs/Gossiping/M.1517239047.A.4EF.html     1 0.996
## 10 https://www.ptt.cc/bbs/Gossiping/M.1517647106.A.960.html     1 0.995
## # ... with 511 more rows

Document 主題分佈

# for every document we have a probability distribution of its contained topics
tmResult <- posterior(di_lda)
doc_pro <- tmResult$topics 
dim(doc_pro)               # nDocs(DTM) distributions over K topics
## [1] 521   5

每篇文章都有topic的分佈,所以521筆的文章*5個主題。

cbind Document 主題分佈

# get document topic proportions 
document_topics <- doc_pro[data2$artUrl,]
document_topics_df <- data.frame(document_topics)
colnames(document_topics_df) <- topic_name
rownames(document_topics_df) <- NULL
di_topic <- cbind(data2, document_topics_df)
di_topic %>% head(10)
##                                           artTitle    artDate  artTime
##  1:                   [爆卦]阿滴英文突破百萬訂閱! 2017-07-07 05:45:25
##  2:             [問卦]阿滴英文少了滴妹還剩下什麼? 2017-07-08 07:22:49
##  3:                           [問卦]阿滴算帥哥嗎? 2017-07-22 11:27:29
##  4:     [新聞]阿滴英文彈琴帥炸! 滴妹飆唱《魚仔》 2017-07-23 00:18:37
##  5:                      [問卦]阿滴跟滴妹要選哪個? 2017-07-23 21:00:07
##  6:                 [問卦]被說長得像阿滴該開心嗎? 2017-07-31 07:13:22
##  7:                       [FB]阿滴談清流youtuber 2017-07-31 19:33:33
##  8:    [新聞]姪子是聖結石粉...他秒轉阿滴英文「導正 2017-08-08 04:19:33
##  9: Re:[新聞]姪子是聖結石粉...他秒轉阿滴英文「導正 2017-08-08 06:20:10
## 10:                             [問卦]阿滴算帥哥嗎 2017-08-11 02:09:05
##                                                       artUrl    artPoster
##  1: https://www.ptt.cc/bbs/Gossiping/M.1499435488.A.64E.html gamania10000
##  2: https://www.ptt.cc/bbs/Gossiping/M.1499527731.A.E6B.html     xxxxxmay
##  3: https://www.ptt.cc/bbs/Gossiping/M.1500752013.A.6B4.html    pengjoker
##  4: https://www.ptt.cc/bbs/Gossiping/M.1500798279.A.78A.html       Digo99
##  5: https://www.ptt.cc/bbs/Gossiping/M.1500872815.A.CF4.html     yabe5566
##  6: https://www.ptt.cc/bbs/Gossiping/M.1501514365.A.21C.html rothschild99
##  7: https://www.ptt.cc/bbs/Gossiping/M.1501558775.A.410.html      chsiung
##  8: https://www.ptt.cc/bbs/Gossiping/M.1502195137.A.E63.html   hahaha0204
##  9: https://www.ptt.cc/bbs/Gossiping/M.1502202373.A.9DF.html       seabox
## 10: https://www.ptt.cc/bbs/Gossiping/M.1502446507.A.272.html       BBbibi
##        artCat commentNum push boo
##  1: Gossiping         81   42  16
##  2: Gossiping         14    5   1
##  3: Gossiping         30   12   2
##  4: Gossiping         28    9  10
##  5: Gossiping         28   19   1
##  6: Gossiping         11    1   2
##  7: Gossiping         21    9   8
##  8: Gossiping         47   29   4
##  9: Gossiping          6    2   2
## 10: Gossiping         25   11   5
##                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                        sentence
##  1:                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                             各位大德晚安\n\n我國少見的清流頻道.阿滴英文(Ray Du English)\n於今日晚間已經確定成為\n台灣第六個訂閱人數超過百萬的Youtube頻道\n也是今年第四個\n\n  1. 蔡阿嘎  (2014.07.09)   146萬  (依達成順序排列)\n  2. 這群人  (2016.08.30)      180萬\n  3. 阿神   (2017.03.13)      114萬\n  4. 谷阿莫  (2017.04.27)      108萬\n  5. 聖結石  (2017.05.29)      115萬\n  6.\n阿滴英文 (2017.07.07)      100萬\n相關資料如下:\n\n 一、阿滴英文是台灣第一個教育類百萬級頻道\n   但是頻道內點閱數最高的那部影片,跟英文/教育完全沒關係\n\n 二、阿滴英文創辦於2015年1月11日\n     歷經908天後達成百萬訂閱(十萬訂閱花了456天/2016年4月11日)\n     是台灣史上第三快的(僅次於聖結石220天與谷阿莫625天)\n\n 三、阿滴英文目前有189部影片,在百萬級頻道中只比這群人多\n    目前發表最多影片的是阿神(2835部),數量約是阿滴的15倍,這群人的22倍\n\n 四、雖然阿滴英文的訂閱數超過百萬,但是觀看次數不到五千萬\n    只有聖結石的四分之一,谷阿莫的七分之一\n   在台灣甚至排不到三十名\n\n 五、阿滴英文是台灣第一個由金牛座創辦的百萬級頻道(1989年5月8日晚上9點)\n     (這群人的尼克生於1988年4月20日,但那年太陽落於雙子座)\n   而且目前台灣的高訂閱youtuber中,幾乎沒有金牛座\n\n   蔡阿嘎(巨蟹)\n   這群人(摩羯/水瓶x2/雙魚/牡羊/雙子/巨蟹/獅子/處女)\n   阿 神(天秤)\n   谷阿莫(摩羯)\n   聖結石(天蠍)\n\n 六、六個百萬級頻道中,只有蔡阿嘎跟谷阿莫從未跟阿滴英文合作過影片\n     不過阿滴採訪過蔡阿嘎,發出合照的當晚IG立刻遭刪除\n\n 七、目前六個百萬級頻道的創辦人\n   都不是公立大學出身\n\n     蔡阿嘎  東吳大學、中國文化大學\n    這群人  國立台灣戲曲學院\n    阿神   明志科技大學\n     谷阿莫    龍華科技大學\n     聖結石    南強高級工商職業學校\n     阿滴      輔仁大學  \n\n 八、阿滴英文是台灣第二個由碩士創辦的百萬級頻道\n   僅次於蔡阿嘎\n\n 九、阿滴英文是台灣第二個由同志天菜創辦的百萬級頻道\n     僅次於阿神\n\n 十、六個百萬級頻道中\n     沒有任何一個創辦人有近視(阿滴與滴妹曾經有但已雷射)\n     而除了阿滴、滴妹外,阿神也常戴無鏡框眼鏡\n\n 十一、六個百萬級頻道中\n     只有谷阿莫沒有在台灣辦過粉絲活動(見面會、簽名會...等)\n\n 十二、六個百萬級頻道中\n     只有阿神還未發表任何出版作品(書、單曲、電影...等)\n\n 十三、台灣目前還沒有任何一個由女性單獨創辦的百萬級頻道\n
##  2:                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                     如題\n少了滴妹的阿滴\n還剩下什麼.\n.\n.\n.\n.\n剩阿滴\n.\n.\n.\n.\n欸這是廢話\n我是問還剩下那些內容可看\n大家覺得呢?\n
##  3:                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                            如題\n\n就是阿滴英文那個阿滴\n\n各位大大覺得他算帥哥嗎?\nhttp://i.imgur.com/rZxhy7z.jpg\n有沒有八卦???\n\n\n
##  4:                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                       阿滴英文彈琴帥炸! 滴妹飆唱《魚仔》甜聲融化網友\n\n記者劉宜庭/綜合報導\n\n阿滴靠著全台最大英文教學YouTube頻道「阿滴英文」走紅,近期更發行新書,擁有破百\n萬粉絲支持。他22日晚間在臉書上開直播,難得和滴妹合體,一起彈唱《魚仔》、《Mos\nt Girls》等數首歌曲,展現彈琴功力,一旁滴妹甜美嗓音,兄妹倆搭檔呈現絕佳默契,\n令粉絲一飽耳福。\n\n「阿滴英文」22日在臉書開直播,坦言這次難得和滴妹合作彈唱,是想藉此機會紀念聯合\n樂團主唱查斯特(Chester Bennington),「對我來說是很震撼的事情,因為我從小第一\n次接觸西洋音樂,就是透過Linkin Park。」\n\n看見查斯特自殺身亡的消息,阿滴除了感嘆惋惜,同時也不忘呼籲患有憂鬱症或是其他疾\n病的人,「希望大家不要把自殺當作是一個\n選則\n,因為活著總是有出路的。」他和滴妹合\n作唱《Numb》之前,也透露這首歌是他聽「聯合公園」的第一首歌,當時甚至還為此去學\n了一段Rap,表示該曲在國、高中時期對他來說有很大的影響力。\n\n這次直播除了紀念樂團「聯合公園」,阿滴和滴妹飆唱《What I've Done》、《Numb》之\n外,兄妹倆也彈唱了許多最近接觸到的歌,包括《魚仔》、《不曾回來過》等歌曲,難得\n展現彈琴功力,模樣被讚相當帥氣,搭配滴妹甜美嗓音,令粉絲聽地如癡如醉,在翻唱《\n魚仔》的過程中,兄妹倆還逗趣用台語對話,一來一往有趣互動逗樂眾人,引發不少討論\n。\n\n● 《ETNEWS新聞雲》提醒您,請給自己機會:\n自殺防治諮詢安心專線:0800-788995;生命線協談專線:1995\nhttp://star.ettoday.net/news/972597?from=fb_et_star
##  5:                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                        如題啦\n\n這兩位英文都很好\n\n阿滴笑起來很可愛\n\n滴妹鼻子很Q\n\n大家會選哪個?\n\n\n
##  6:                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                            剛剛魯魯被妹仔說長得像u2be英文紅人阿滴\n\n就戴個黑誆的男森\n\n\n魯魯該覺得開心嗎\n\n有沒有八卦\n
##  7: FB卦點說明:\n阿滴認為沒有什麼清流不清流,只要沒犯法危害善良風俗都是ok的\n\nFB連結:\nhttps://www.facebook.com/durayray/posts/10159236232080531\nFB內容:\n#文長慎入 #內有懶人包 #歡迎分享 最近有很多人在討論「清流創作者」。不過對我來說\n真的沒所謂「清流」的頻道,只有「做什麼內容,就吸引什麼人」的原則。就算是所謂的\n廢片也有存在的價值跟受其吸引的觀眾。只要沒有危害善良風俗或是傳達錯誤觀念,我們\n的身份就單純的是「創作者」而已。我很認同囧星人最近一支影片的說法:「不能夠因為\n你喜歡喝紅酒,就罵喝汽水的人品味低下」。這裏的紅酒比喻偏知識型的影片、汽水比喻\n偏娛樂型的影片。\n\n但是做知識型影片(就我自己的經驗來看)一開始會比較辛苦。你可能可以比較深刻的影\n響到一些人,但是觀眾的廣度總是一個問題。畢竟上網目的是為了吸取知識的人算是小眾\n。週而復始的不被看見也會慢慢消磨創作的熱情... 我還記得阿滴英文的最一開始,是我\n一個一個的邀約各種想得到的人來粉絲專頁按讚、來頻道訂閱。也有經歷過聯繫各種平台\n媒體,希望有曝光的機會然後被忽略、拒絕。慢慢一步一步堅持走來到現在居然累積了百\n萬訂閱,我知道我是幸運的。很多人比我有才華、比我努力,卻找不到屬於自己的觀眾。\n\n身為台灣知識型YouTuber的周杰倫(自己說),今天心血來潮整理了以下知識型創作者。\n希望有更多人關注這樣的內容,鼓勵這樣的創作!\n\n列入名單的條件很簡單:1. 我有訂閱該頻道、2. 頻道有持續更新。一整理下來才發現真\n的還不少!台灣知識型YouTuber懶人包請往下滑:\n\n-說書系列-\n【囧星人 - 冏星人Kyon】頻道:\nhttps://goo.gl/raz8gq\n我在YouTube上搜尋時自動跳出的關鍵字是「囧星人 摸哥」...\n【超級歪 SuperY】頻道:\nhttps://goo.gl/YmY6Th\n本人很帥(其實根本還沒見過)\n【閱部客yuubuke】頻道:\nhttps://goo.gl/SWJkSn\n絕對不是因為有做影片推薦《每日一滴》才訂閱她的。\n【蕭宇辰 小火車】頻道:\nhttps://goo.gl/PBTEri\n唯一有點犯規的頻道,蕭宇辰你hen久沒出片囉。\n\n-動畫系列-\n【臺灣吧 - Taiwan Bar】頻道:\nhttps://goo.gl/9NSqcH\n不用多說,台灣知識型頻道的起點。\n【Una Who】頻道:\nhttps://goo.gl/vReXtG\n關於愛滋病的那兩隻影片我都看了兩次,太精緻用心了。\n【PanSci 科學新聞網】頻道:\nhttps://goo.gl/u1rnCr\n動畫跟主題都很不錯,希望更多人看到。\n\n-科學系列-\n【啾啾鞋】頻道:\nhttps://goo.gl/ncruwY\n邊緣人的逆襲。然後被我抓來考學測、指考但沒有恨我。\n【Lis線上教學平台】頻道:\nhttps://goo.gl/o4Uz6u\n整個團隊可以去製作教育部教材的那種等級。\n【佑來了】頻道:\nhttps://goo.gl/ZgYcrS\n清單中最新訂閱的!用簡單的動畫講深入的科學。\n\n-音樂系列-\n【I.C Charlie】頻道:\nhttps://goo.gl/nYYxyn\n研究流行音樂的,他長的好Q喔。\n【好和弦 - NiceChord.com】頻道:\nhttps://goo.gl/rVad1R\n從學生時期就有在看著學樂理的大大。\n\n-日常系列-\n【台客劇場 TKstory】頻道:\nhttps://goo.gl/g3BNNU\n如果有人討論「清流」一定會看到的頻道。\n【林辰 Buchi】頻道:\nhttps://goo.gl/27fDqq\n現實生活中最頻繁見得到面的應該就是這位了。\n【雪莉不要鬧】頻道:\nhttps://goo.gl/pcNh9U\n介紹很多環保生活相關的知識,喜歡。\n\n-人生系列-\n【JR Lee Radio】頻道:\nhttps://goo.gl/w7MTTf\n我以前的搭檔,分享人生正能量。\n【詹大衛 David Zhan】頻道:\nhttps://goo.gl/jPtQTL\n希望他的成功日記有一天可以做到我的(無恥許願池)\n【快樂大學 Happiness University】頻道:\nhttps://goo.gl/qMMEAv\n討論專注力、思維力、交際力、想像力的提升。\n\n-語言系列-\n【英文易開罐】頻道:\nhttps://goo.gl/sH2dGy\n以前的實習生兼現任BF(大誤)\n【講日文的台灣女生】頻道:\nhttps://goo.gl/Vg7aKh\n以前的實習生兼現任日文教學YouTuber第一把交椅。\n【C's English Corner】頻道:\nhttps://goo.gl/GZ5c7S\n充滿正能量的英文分享,還寫了一封很可愛的信給我。\n【Jella 韓語頻道】頻道:\nhttps://goo.gl/aDmhnC\n我的韓文都是這裡學的(小誤)\n\n-不知道要放哪裡系列-\n【走路痛 WalkTone】頻道:\nhttps://goo.gl/WHTPbG\n嗯...... 也想不太到該怎麼介紹,反正去看就對了。\n【加點吉拿棒】頻道:\nhttps://goo.gl/TJikw5\n因為我愛麗芳。\n\n好der,這就是我的「台灣知識型YouTuber」懶人包。如果有遺漏的或是想補充的歡迎留\n言!然後繼這個之後,希望有人做個「台灣娛樂型YouTuber」懶人包。我的人生好像太多\n紅酒了,我想要多喝點可樂。\n\n\n\n
##  8:                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                   姪子是聖結石粉...他秒轉阿滴英文「導正觀念」 網友吵翻了!\n\nettoday\nhttp://static.ettoday.net/images/2715/2715031.jpg\n▲網友發現姪子是聖粉,連忙要他改看「阿滴英文」。\n\n網紅聖結石近期人氣超旺,除了在YouTube擁有113萬訂閱,自創2首單曲MV點閱人數都突\n破千萬,一句「我的主要客群是18~34歲」更成為流行語。人紅是非多,網路世界中出現\n一派「反聖」風潮,有網友意外發現姪子是聖結石粉絲,連忙改播「阿滴英文」影片,希\n望糾正他的觀念,這舉動讓兩派人吵翻天!\n\n李姓網友7日傍晚在「爆廢公社」貼文,表示聽到姪子說「喜歡看聖結石」,讓身為舅舅\n的他大感驚訝。因為姪子年紀還小,他為了「導正」錯誤觀念,連忙打開電腦,播放另一\n位知名YouTuber、英文教學頻道「阿滴英文」,還不忘拍下照片傳上網,有圖為證!\n\n文章貼出後,在網路上引發爆量討論,一派網友相當支持,「阿滴真的不錯,從小朋友到\n上班族都適合看」、「笑死,聖結石的粉絲年紀都很小」、「從小就是要培養好英文啊」\n、「推阿滴英文、台客劇場」、「不錯,觀念很好,知道歹路不要走」、「孩子的教育不\n能等,快給他看一些有教育意義的」、「看阿滴勝過千萬倍」、「真的是個好舅舅」、「\n推舅舅,超喜歡阿滴跟滴妹的。」\n\n不過,也有不少網友批評這是錯誤的教育方式,聖結石也何其無辜,「為什麼要這麼討厭\n他啊」、「人家喜歡關你什麼事」、「為什麼不能喜歡看聖結石」、「跟風(罵)的一堆\n,在聖結石沒被罵之前,不知道有多少人是聖粉勒」、「看聖結石需要被導正?娛樂當中\n沒有學習對不起人?」「人家有辦法一天拍攝、剪輯一支片子,你有辦法一天做出一樣的\n事情再來嘴別人,叫你外甥(姪子)不要像舅舅一樣當酸民。」\n\n「阿滴英文」是Youtube上的英文教學頻道,由一對小時候在新加坡留學的台灣兄妹組成\n,哥哥是「阿滴」,妹妹則是「滴妹」。今(2017)年7月,阿滴英文YouTube訂閱突破\n100萬大關,成為台灣第六個百萬訂閱頻道,更是台灣最大的知識型YouTube頻道。\nhttp://www.ettoday.net/news/20170808/984257.htm?t=
##  9:                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                  聖結石跟阿滴就有合作過的影片\n\n直接播來看不就好了\n\n測腦波app篇\nhttps://www.youtube.com/watch?v=0rS7aYFH5uY\n英文猜謎篇\nhttps://www.youtube.com/watch?v=Al-cLgpvu_4\n馬來西亞篇\nhttps://www.youtube.com/watch?v=YmMztZ0WO8o\n聖結石阿滴開箱篇\nhttps://www.youtube.com/watch?v=-I_cye1lhIA\n聖嫂 阿滴交換篇\nhttps://www.youtube.com/watch?v=ue3cirhNVnc\n聖嫂參加阿滴英文篇\nhttps://www.youtube.com/watch?v=6xthtQDc5e0\n有英文教學 有出遊的 有開箱的 有阿滴 滴妹 聖結石 聖嫂\n這樣就不用吵架了啊\n
## 10:                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                              八卦版之前有看過大家討論過滴妹\n有人喜歡\n有人不喜歡\n\n\n那滴妹哥哥阿滴呢?\n
##             總統         滴妹         疫情         募款         教育
##  1: 0.0001533989 1.533989e-04 1.533989e-04 1.533989e-04 9.993864e-01
##  2: 0.0028873154 9.884507e-01 2.887315e-03 2.887315e-03 2.887315e-03
##  3: 0.9846747328 3.831317e-03 3.831317e-03 3.831317e-03 3.831317e-03
##  4: 0.9991382224 2.154444e-04 2.154444e-04 2.154444e-04 2.154444e-04
##  5: 0.6431484469 3.439517e-01 4.299935e-03 4.299935e-03 4.299935e-03
##  6: 0.0026681772 9.893273e-01 2.668177e-03 2.668177e-03 2.668177e-03
##  7: 0.9996149218 9.626955e-05 9.626955e-05 9.626955e-05 9.626955e-05
##  8: 0.0001810489 1.810489e-04 1.810489e-04 1.810489e-04 9.992758e-01
##  9: 0.6889915549 1.165017e-03 1.165017e-03 1.165017e-03 3.075134e-01
## 10: 0.9884507385 2.887315e-03 2.887315e-03 2.887315e-03 2.887315e-03

查看特定主題的文章

  • 透過找到特定文章的分佈進行排序之後,可以看到此主題的比重高的文章在討論什麼。
di_topic %>% arrange(desc(`總統`)) %>% head(10) 
##                                      artTitle    artDate  artTime
## 1                    [FB]阿滴談清流youtuber 2017-07-31 19:33:33
## 2      [新聞]阿滴開箱總統專機曝光空軍一號內裝 2019-07-13 06:23:20
## 3               Re:[問卦]阿滴究竟惹到了誰?? 2020-04-12 05:25:24
## 4              Re:[問卦]會罵阿滴的都是X粉!! 2020-04-11 11:43:46
## 5                   Re:[爆卦]阿滴集資的新公告 2020-04-11 10:23:49
## 6  [新聞]阿滴英文彈琴帥炸! 滴妹飆唱《魚仔》 2017-07-23 00:18:37
## 7          [爆卦]香港第一youtuber評論阿滴廣告 2020-04-15 19:47:43
## 8  [新聞]台南人英語超強?阿滴、滴妹街頭實測結 2018-07-13 07:08:02
## 9               Re:[問卦]阿滴究竟惹到了誰?? 2020-04-12 04:47:02
## 10          Re:[問卦]現在靠北阿滴是在靠北三小 2020-04-11 12:04:41
##                                                      artUrl  artPoster
## 1  https://www.ptt.cc/bbs/Gossiping/M.1501558775.A.410.html    chsiung
## 2  https://www.ptt.cc/bbs/Gossiping/M.1563028162.A.212.html  MeowDeLay
## 3  https://www.ptt.cc/bbs/Gossiping/M.1586669126.A.20A.html   FIFI8488
## 4  https://www.ptt.cc/bbs/Gossiping/M.1586605428.A.C97.html ThirdChild
## 5  https://www.ptt.cc/bbs/Gossiping/M.1586600631.A.549.html yji3vu4gj4
## 6  https://www.ptt.cc/bbs/Gossiping/M.1500798279.A.78A.html     Digo99
## 7  https://www.ptt.cc/bbs/Gossiping/M.1586980065.A.E96.html     Drzowy
## 8  https://www.ptt.cc/bbs/Gossiping/M.1531494845.A.FD4.html   ding2599
## 9  https://www.ptt.cc/bbs/Gossiping/M.1586666824.A.EC8.html     SmonSo
## 10 https://www.ptt.cc/bbs/Gossiping/M.1586606683.A.BF9.html  sea130281
##       artCat commentNum push boo
## 1  Gossiping         21    9   8
## 2  Gossiping         36   11  15
## 3  Gossiping        227  103  39
## 4  Gossiping         31   14   4
## 5  Gossiping         50    5  13
## 6  Gossiping         28    9  10
## 7  Gossiping        344  256  17
## 8  Gossiping         23    5   6
## 9  Gossiping         21    7   1
## 10 Gossiping         12    9   1
##                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                       sentence
## 1  FB卦點說明:\n阿滴認為沒有什麼清流不清流,只要沒犯法危害善良風俗都是ok的\n\nFB連結:\nhttps://www.facebook.com/durayray/posts/10159236232080531\nFB內容:\n#文長慎入 #內有懶人包 #歡迎分享 最近有很多人在討論「清流創作者」。不過對我來說\n真的沒所謂「清流」的頻道,只有「做什麼內容,就吸引什麼人」的原則。就算是所謂的\n廢片也有存在的價值跟受其吸引的觀眾。只要沒有危害善良風俗或是傳達錯誤觀念,我們\n的身份就單純的是「創作者」而已。我很認同囧星人最近一支影片的說法:「不能夠因為\n你喜歡喝紅酒,就罵喝汽水的人品味低下」。這裏的紅酒比喻偏知識型的影片、汽水比喻\n偏娛樂型的影片。\n\n但是做知識型影片(就我自己的經驗來看)一開始會比較辛苦。你可能可以比較深刻的影\n響到一些人,但是觀眾的廣度總是一個問題。畢竟上網目的是為了吸取知識的人算是小眾\n。週而復始的不被看見也會慢慢消磨創作的熱情... 我還記得阿滴英文的最一開始,是我\n一個一個的邀約各種想得到的人來粉絲專頁按讚、來頻道訂閱。也有經歷過聯繫各種平台\n媒體,希望有曝光的機會然後被忽略、拒絕。慢慢一步一步堅持走來到現在居然累積了百\n萬訂閱,我知道我是幸運的。很多人比我有才華、比我努力,卻找不到屬於自己的觀眾。\n\n身為台灣知識型YouTuber的周杰倫(自己說),今天心血來潮整理了以下知識型創作者。\n希望有更多人關注這樣的內容,鼓勵這樣的創作!\n\n列入名單的條件很簡單:1. 我有訂閱該頻道、2. 頻道有持續更新。一整理下來才發現真\n的還不少!台灣知識型YouTuber懶人包請往下滑:\n\n-說書系列-\n【囧星人 - 冏星人Kyon】頻道:\nhttps://goo.gl/raz8gq\n我在YouTube上搜尋時自動跳出的關鍵字是「囧星人 摸哥」...\n【超級歪 SuperY】頻道:\nhttps://goo.gl/YmY6Th\n本人很帥(其實根本還沒見過)\n【閱部客yuubuke】頻道:\nhttps://goo.gl/SWJkSn\n絕對不是因為有做影片推薦《每日一滴》才訂閱她的。\n【蕭宇辰 小火車】頻道:\nhttps://goo.gl/PBTEri\n唯一有點犯規的頻道,蕭宇辰你hen久沒出片囉。\n\n-動畫系列-\n【臺灣吧 - Taiwan Bar】頻道:\nhttps://goo.gl/9NSqcH\n不用多說,台灣知識型頻道的起點。\n【Una Who】頻道:\nhttps://goo.gl/vReXtG\n關於愛滋病的那兩隻影片我都看了兩次,太精緻用心了。\n【PanSci 科學新聞網】頻道:\nhttps://goo.gl/u1rnCr\n動畫跟主題都很不錯,希望更多人看到。\n\n-科學系列-\n【啾啾鞋】頻道:\nhttps://goo.gl/ncruwY\n邊緣人的逆襲。然後被我抓來考學測、指考但沒有恨我。\n【Lis線上教學平台】頻道:\nhttps://goo.gl/o4Uz6u\n整個團隊可以去製作教育部教材的那種等級。\n【佑來了】頻道:\nhttps://goo.gl/ZgYcrS\n清單中最新訂閱的!用簡單的動畫講深入的科學。\n\n-音樂系列-\n【I.C Charlie】頻道:\nhttps://goo.gl/nYYxyn\n研究流行音樂的,他長的好Q喔。\n【好和弦 - NiceChord.com】頻道:\nhttps://goo.gl/rVad1R\n從學生時期就有在看著學樂理的大大。\n\n-日常系列-\n【台客劇場 TKstory】頻道:\nhttps://goo.gl/g3BNNU\n如果有人討論「清流」一定會看到的頻道。\n【林辰 Buchi】頻道:\nhttps://goo.gl/27fDqq\n現實生活中最頻繁見得到面的應該就是這位了。\n【雪莉不要鬧】頻道:\nhttps://goo.gl/pcNh9U\n介紹很多環保生活相關的知識,喜歡。\n\n-人生系列-\n【JR Lee Radio】頻道:\nhttps://goo.gl/w7MTTf\n我以前的搭檔,分享人生正能量。\n【詹大衛 David Zhan】頻道:\nhttps://goo.gl/jPtQTL\n希望他的成功日記有一天可以做到我的(無恥許願池)\n【快樂大學 Happiness University】頻道:\nhttps://goo.gl/qMMEAv\n討論專注力、思維力、交際力、想像力的提升。\n\n-語言系列-\n【英文易開罐】頻道:\nhttps://goo.gl/sH2dGy\n以前的實習生兼現任BF(大誤)\n【講日文的台灣女生】頻道:\nhttps://goo.gl/Vg7aKh\n以前的實習生兼現任日文教學YouTuber第一把交椅。\n【C's English Corner】頻道:\nhttps://goo.gl/GZ5c7S\n充滿正能量的英文分享,還寫了一封很可愛的信給我。\n【Jella 韓語頻道】頻道:\nhttps://goo.gl/aDmhnC\n我的韓文都是這裡學的(小誤)\n\n-不知道要放哪裡系列-\n【走路痛 WalkTone】頻道:\nhttps://goo.gl/WHTPbG\n嗯...... 也想不太到該怎麼介紹,反正去看就對了。\n【加點吉拿棒】頻道:\nhttps://goo.gl/TJikw5\n因為我愛麗芳。\n\n好der,這就是我的「台灣知識型YouTuber」懶人包。如果有遺漏的或是想補充的歡迎留\n言!然後繼這個之後,希望有人做個「台灣娛樂型YouTuber」懶人包。我的人生好像太多\n紅酒了,我想要多喝點可樂。\n\n\n\n
## 2                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                    1.媒體來源:\n中央社\n\n\n2.記者署名\n記者侯姿瑩\n\n\n3.完整新聞標題:\n阿滴開箱總統專機 曝光空軍一號內裝\n\n\n\n4.完整新聞內文:\n阿滴開箱總統專機 曝光空軍一號內裝\n(中央社記者侯姿瑩台北13日電)將要啟程前往海地的總統蔡英文今晚在臉書發文表示,\nYouTuber志祺和阿滴日前找她開箱總統行政專機。影片內容不僅公開專機內部空間,總統\n更接受阿滴全英文的訪談,聊飛機、也談出訪。\n\n蔡總統也透過LINE群組分享「志祺七七」和「阿滴英文」開箱總統專機的影片。總統3月\n出訪之前有跟志祺合作拍影片,開箱總統出國的行李箱,這次是首度與長期經營英語教學\n內容、知識型YouTuber阿滴合作。\n\n阿滴、志祺今晚分別在他們的YouTube頻道發布與蔡總統合體開箱總統專機、一同搭機飛\n到台東的影片。阿滴及志祺透過鏡頭帶著大家參觀位於空軍松山基地指揮部的貴賓候機室\n,直擊總統專機內部,包括總統座艙、長官座艙與一般客艙,以及機上提供的零食、水果\n與甜點。\n\n介紹專機內部後,阿滴接著用英文與蔡總統在機上進行訪談。總統表示,總統專機用於國\n內飛行,到國外的訪問則是透過包機的方式進行;目前這架總統專機機齡約為20年,最先\n使用的總統應該是前總統陳水扁。\n\n總統說,搭機的時候,她最常做的事是看報紙、為演講做準備;若要休息的話,就會在飛\n機上睡一下。機上提供的餐點每次都不一樣,總統說,她最喜歡的是水果。\n\n談到這次出訪加勒比海友邦與過境美國,總統說,訪問友邦時,將與友邦總統或總理會面\n,也會與當地的台灣人見面。\n\n對於阿滴提到總統專機外觀過時,並搞笑建議將外觀塗上「珍珠奶茶」或是畫滿Q版小英\n來裝飾,總統笑說,這是中華民國總統專機,不是她個人的飛機,她不認為總統的權力有\n大到可以改變專機外觀。\n\n另外,志祺的影片則是先說明總統專機的正式名稱是「總統座機隊」,編制有2架飛機,\n分別是福克50與波音737-800。總統專機的「經濟艙」、「商務艙」與一般飛機沒有太大\n的差別,座椅是藍紫色系;至於總統乘坐的「頭等艙」,整體設計是大地色系,總共只有\n4個座位,通常是總統、副總統、行政院長等人所乘坐。\n\n志祺在影片中表示,專機的存在是為了縮減總統通勤時間,提升效率,等總統一到機場,\n就會馬上起飛。這趟飛到台東的時間大約是30、40分鐘。(編輯:鄭雪文)1080713\n\n\n\n\n5.完整新聞連結 (或短網址):\nhttps://www.cna.com.tw/news/aipl/201907130230.aspx\n6.備註:
## 3                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                            惹到誰?\n\n\n26980位捐款者到底憑什麼代表臺灣\nhttp://i.imgur.com/HmjJlMM.jpg\nhttp://i.imgur.com/8C6nnCL.jpg\nhttp://i.imgur.com/2WNFSLP.jpg\n只有三點\n\n1.沒必要,就是沒必要\n\n2.在美國媒體的報導,WHO事件其實效應非常低,美國本土疫情真的很嚴重,社會正在焦\n頭爛額,打開報紙看到來自臺灣的一封信,感想如何,大概就是喔喔乾我屁事。\n\n3.公開信內容,需要非常專業,沒有把握能有好的公開信內容,登出去導致形象受損誰能\n來負責\n\n想法是這樣啦,要刊登就快啦\n\n如果刊登後幸運提高臺灣形象對臺灣人不虧啦\n\n但如果造成外國鄉民反感或是其他\n\n導致臺灣形象受損,那就有好戲看了!\n\n最好的方法就是全額退款,反正你們也炒作夠了,再不然就是捐醫療物資搭配買廣告還比\n較有效果。\n\n\n最後說一下\n\n發起人\nhttp://i.imgur.com/zVtEJOi.jpg\n政治意圖這麼明顯的人,包裝成愛臺灣就無敵了,只要不支持或是批評,\n\n就是不愛臺灣=不愛洨英=柯韓粉=中共同路人\n\n這種民主我還真的沒有看過\n\n\n政黨越來越像媒體公司了,內政二分,宣傳八分,不談政策,只談洗腦。小黨有聲音都是\n中共同路人這種方法還真的有效,真的不知道該說什麼了。\n\n註:太陽餅沒太陽、老婆餅沒老婆,接下句\n\n\n\n對了怕被打成不知道什麼粉\n\n先Tag一下\n\n\n#我愛臺灣#守護臺灣民主#有政府請安心\n\n\n\n金流問題就不想在說了,問題更大,400萬達標,還開分流,超募1500萬,最後更好笑的\n是要捐款者一起集思廣益提供想法,集資最好的方法,說是詐騙的最高點也不為過。\n\n\n是要創一個新名詞,不是超募,是???\n言論自由我笑到肚子痛,這跟言論自由有什麼關係\n不是失敗主義,而是專業性不夠,出發點是非常好,但是人拿到金錢就人心叵測了\n出發點是好的,批評不等於反對,我支持為臺灣發聲,但不是這麼有爭議性。\n槍口對外不對內,提供意見不是罵,批評不等於反對。\n我有去跟他說啊,他沒回覆,可以去看林祖儀FB,那你怎麼知道我沒去跟他說?媽祖託夢給你嗎?\n我就說了,我有去跟他說你可以去看林祖儀FB,他沒回覆,那你怎麼知道我沒跟他說?媽祖託夢給你嗎?\n批評不等於反對,現在變一言堂了\n沒人急,只是因為我是臺灣人民,你也是!\n沒人急!只是因為我是臺灣人!你也是!\n你可以說有必要就有必要?你又那位? 理性討論才會進步\n我支持阿滴的出發點,批評不等於反對,難道現在只能有一個聲音嗎?\n喔喔\n呵呵\n很好啊!趕快刊登啊!但要做就要做到最好,我很支持出發點呀!\n誰沒有感覺?批評不等於反對,我是支持阿滴的出發點的。\n你覺得有必要就有必要?你帶什麼風向啊?\n這麼氣幹嘛!保持微笑!祝你好運!\n你又是誰啊?扣什麼爛帽啊?跟你不同立場就是不同陣營?\n少丟蔡英文的臉了,我也是那817萬的1票啦,看不懂你在氣噗噗什麼?很急?\n批評不等於反對,社會只能有一個聲音嗎?\n保持微笑!祝你好運!\n離題囉!他們就不用說囉!垃圾車經過你會想把他們丟上車這樣!
## 4                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                其實這條新聞在國外的能見度很低,\n\n也就是說譚德塞噴臺灣種族歧視這件事其實沒什麼人知道。\n\n外交部和總統的之前的回應都很快也很精準,算是把這件事做了了結。\n\n我知道臺灣媒體報得沸沸揚揚,大家義憤填膺。\n\n但你現在去買廣告等於把沉澱的事情又翻上來。\n\n注意喔,事件先前沒有鬧大,也停在一個對臺灣相對有利的節點上。\n\n反對阿滴這企劃並不是錢的問題,而是它增加了臺灣在外交上的不確定性。\n\n我簡單講一個可能的 scenario:\n\n紐時一直是反川先鋒,特別年底要選舉了,所有自由派媒體都磨刀霍霍。\n\n你現在跟著川普一起嘴 WHO,你真的有把握不被牽扯進去?\n\n川英通話那陣子,CNN 打川八分,臺灣也受了兩分傷。\n\n每天看 CNN 都心驚肉跳。\n\n紐時要是看你跟川普同盟不爽,隔天發篇黑你的社論,花的四百萬瞬間變成負的。\n\n最近西方議員輪番在國會為臺灣發聲,你以為這些都是人家阿莎力相挺嗎?\n\n背後都是駐外人員長年累月、苦心經營的成果。\n\n你這樣一攪下去,不打亂外交部的布局即是萬幸。\n\n最慘就是花錢給中共買火藥。\n\n原本這一局他們已經敗下陣來,為何要讓他起死回生?\n\n趕快布下一局的陣勢才要緊,比如說時中今天公布郵件就可以形成新局策略的起點啦。\n\n不是要詬病阿滴的募款,我知道他的立基點是好的。\n\n但想想專業外交人員的耕耘,這種暴衝式的玩法真的很危險。\n\n有辦法還是別登了吧。\n\n找個知名一點、英文好的臺灣人寫篇社論,紐時還是會收的。\n\n說穿了,就是因為沒把握寫的社論會被紐時接受,所以才要用買的啊。\n\n蔡英文上任後的佈局真的很深很廣,一般人都只能看到表象,\n\n戰略形成的殫精竭慮常是不為外人道。\n\n臺灣的外交果實得來不易,我們都在同一條船上,望大家珍視、三思。\n
## 5                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                    小魯臺灣臺南城,民主聖地小市民。\n\n臺灣人除了很有愛心以外,最會的就是唱衰自己人。\n\n阿滴,大家都知道他是走英文的YouTuber 。\n\n所以他就不能碰政治?不能用自己的方式去愛臺灣?\n這是什麼鬼邏輯?\n\n政治即生活,生活即政治。\n\n阿滴跟臺灣多數人一樣,對譚德塞的言論行徑反感。\n\n然後他集結一群有相同理念的人來集資。\n出發點是好的。\n然後結果還沒出來,就一堆人抹他網紅想紅,說這樣的行為不好,說文章寫的多爛。\n\n這就叫唱衰。\n\n\n你有建議,有更好的方式,沒問題啊,大家都可以討論。\n但我看到的,是一堆人只會批判,然後?\n然後就沒有然後了。\n\n臺灣棒球打國際賽,九局沒結束,就一堆人罵,一堆人先找戰犯。\n\n還沒開打,士氣就輸一半。\n打輸了就馬後炮,打贏了再來沾光。\n\n每次有新的議題新的改變出現,臺灣人就只會唱衰為什麼要這樣,這樣不好。\n\n所以你知道怎樣才是好的囉?\n\n那你為什麼不講怎樣變好,要一直唱衰這樣做就不好。\n\n真的是只出一張嘴最會。\n\n\n臺南蓋捷運,就一堆人唱衰蓋什麼捷運。\n你北部還不是從第一條捷運開始蓋起來的?\n\n\n\n臺灣現在被譚德塞不實指控。\n台灣人民不接受這樣的指控。\n\n其中一位是阿滴,然後他站出來,集資。\n結果一堆人唱衰,嗆自己出錢為什麼要集資?\n\n1900多萬,事實證明很多人跟著站出來了。\n結果一堆人笑他們盤子,笑錢真好賺。\n\n\n這些人在這種時候,只看得到錢,只看得到帶風向。\n\n\n我不懂耶?\n\n這次資金運用的方法有百百種。\n百百種方法一定各有正反兩方。\n或許沒辦法100分,但也有90分。\n偏偏一堆人唱衰90分的方法,然後自己連方法都隻字未提。\n\n\n\n所以你各位到底為什麼要唱衰別人啊?\n\n這種時候臺灣人要團結啊!\n你就算不團結,沒興趣,也不要窩裡反吧?\n\n\n\n你各位就像國高中辦園遊會,大家決定什麼主題都有意見的人。\n賣什麼東西都爛,賣什麼東西都沒人要來。\n\n大學通識課報告主題每個都有意見。\n畢業出國旅行去哪都有意見。\n\n\n然後要你提議又不提。\n\n到底為什麼要唱衰自己人啦!?\n\n\n\n\n反正齁,臺灣加油。\n\n\n\n2020,微薄之力。臺灣加油。\nhttps://m.imgur.com/7wK2Opi?r
## 6                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                        阿滴英文彈琴帥炸! 滴妹飆唱《魚仔》甜聲融化網友\n\n記者劉宜庭/綜合報導\n\n阿滴靠著全台最大英文教學YouTube頻道「阿滴英文」走紅,近期更發行新書,擁有破百\n萬粉絲支持。他22日晚間在臉書上開直播,難得和滴妹合體,一起彈唱《魚仔》、《Mos\nt Girls》等數首歌曲,展現彈琴功力,一旁滴妹甜美嗓音,兄妹倆搭檔呈現絕佳默契,\n令粉絲一飽耳福。\n\n「阿滴英文」22日在臉書開直播,坦言這次難得和滴妹合作彈唱,是想藉此機會紀念聯合\n樂團主唱查斯特(Chester Bennington),「對我來說是很震撼的事情,因為我從小第一\n次接觸西洋音樂,就是透過Linkin Park。」\n\n看見查斯特自殺身亡的消息,阿滴除了感嘆惋惜,同時也不忘呼籲患有憂鬱症或是其他疾\n病的人,「希望大家不要把自殺當作是一個\n選則\n,因為活著總是有出路的。」他和滴妹合\n作唱《Numb》之前,也透露這首歌是他聽「聯合公園」的第一首歌,當時甚至還為此去學\n了一段Rap,表示該曲在國、高中時期對他來說有很大的影響力。\n\n這次直播除了紀念樂團「聯合公園」,阿滴和滴妹飆唱《What I've Done》、《Numb》之\n外,兄妹倆也彈唱了許多最近接觸到的歌,包括《魚仔》、《不曾回來過》等歌曲,難得\n展現彈琴功力,模樣被讚相當帥氣,搭配滴妹甜美嗓音,令粉絲聽地如癡如醉,在翻唱《\n魚仔》的過程中,兄妹倆還逗趣用台語對話,一來一往有趣互動逗樂眾人,引發不少討論\n。\n\n● 《ETNEWS新聞雲》提醒您,請給自己機會:\n自殺防治諮詢安心專線:0800-788995;生命線協談專線:1995\nhttp://star.ettoday.net/news/972597?from=fb_et_star
## 7                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                              HK Youtuber第一人,香江老牌才子蕭若元今天在YT頻道上評論阿滴廣告\n\n(香港資深電影監製,代表作「唐伯虎點秋香」。文史達人,19年反送中後移民臺灣;\n電影中那些「一鄉二里共三夫子,不識四書五經六義」等,是他跟黃霑一起創的。)\nhttps://youtu.be/25UrDKc12QA?t=72\n為防鄉民聽不懂粵語,輸出竹子稿如下:\n\n「我先講講一個廣告先,給大家睇睇這個廣告先。\n這個呢,就是台灣網民集資,在這個《New York Times》賣的廣告。\n要來,攻擊世衛的,其實坦白說是來攻擊世衛的這樣。\n\n那麼這個設計是聶永真設計啦,阿滴寫這個文稿啦。\n那,非常之漂亮啦,台灣作這些東西真的不錯呀真是。\n\n『WHO can help?』誰能幫忙呢?\n這是有雙關(Double meanings)的——WHO幫不幫的到你呢?誰能幫到你呢?\n他用了粉藍色的字,這是WHO的Logo的字(笑)\n\n然後下面有個窿,就是呢,如果你靠WHO,就好像跌進困境裡一樣。\n在困境裡面,WHO幫不到你。\n\n但第二個角度又是,WHO?[誰]能幫到你?答案即是:TAIWAN。\n臺灣呢,就幫到你啦。臺灣就幫到你(repeat)\n\n這裡有一道門,可以行出來。即是臺灣就有路走啦。\n他(WHO)的路則是跌落去的。\n\n那文稿講的是什麼呢?\n\n他說:當我們被孤立時我們選擇團結。你不是孤獨的。臺灣同你一齊。\n我知道你們經歷著什麼,是很困難。但我們在2003年SARS那陣時我們都經歷過那痛苦。\n我們一路被WHO孤立了。但是我們不理的!我們會繼續去分享!\n在這瘟疫爆發時期,我們如何可以,我們的學校、我們的生意,能繼續開門呢?\n\n我們所有人都有口罩。\n\n在過去那些禮拜裡,臺灣捐了1600萬個手術級口罩給世界的醫療患者。\n然後同美國、同歐盟一起,發展著快速測試及疫苗。\n\n有沒有人可以孤立臺灣?\n\n沒有。\n\n因為我們是來幫人的。你怎樣對我都好,我是來幫人的。你不能拒絕一個幫人的人。」\n\n\n寫得非常之得體呀,我可以講、非常之好。不亢不卑。\n在一個孤立的環境裡,沒有bitterness沒有酸味,\n顯示出大方,突出了WHO的不對。〔下略〕\n\n\n\n
## 8                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                               自由時報\n\n台南人英語超強? 阿滴、滴妹街頭實測結果是…\n\n\n阿滴、滴妹在街頭實測7個台南雙語店家,短片一上線,點閱人數已破2萬。(擷自\nYoutube)\n\n2018-07-13 00:01\n\n〔記者洪瑞琴/台南報導〕YouTuber阿滴、滴妹來台南代言「英語閱讀季」,影片12日晚\n\n上9點才上線,目前點閱人數已破2萬,超過479則留言,台南人的英文超強,你信不信?\n\n阿滴、滴妹在街頭實測7個台南雙語店家,包括吳萬春蜜餞、久必大眼鏡行、度小月擔仔\n\n麵、歐多賣電能車、 Doro多肉植物、安平小舖、炸雞洋行。\n\n阿滴說,台南市政府為了推動英語成為第二官方語言,提供相當多的資源及舉辦實體活動\n\n,營造英語學習環境,可以讓世界看見台南,也很樂見有更多台南市民投入英文學習行列\n。\n\n阿滴、滴妹是網紅咖,粉絲眾多;網友留言,這些英語友善的店家,外國觀光客真的需要\n\n,當他們在網路搜尋一些旅遊資料的時候,就會跳出相關資訊,說不定因此而認識台灣,\n\n然後就把台南列為必遊名單,才能把這影片的宣傳效益增加。\n\n也有人說,「好喜歡這樣的頻道,比較生活,可以想像以後自己用英文出去溝通,希望多\n\n拍這系列的影片\nhttp://news.ltn.com.tw/news/life/breakingnews/2486847\nhttps://www.youtube.com/watch?v=CLizeYPB2Ug
## 9                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                   先說我很支持阿滴\n\n每每中共出個包 有影響力的藝人搶著跳出來聲援大中國\n\n台灣被霸凌時 他馬的各個跟龜孫一樣\n\n要舔人民幣安靜閉上嘴當個好龜孫我也不反對\n\n但就操他媽的總有一堆藝人喜歡當龜孫中的龜孫\n\n這次也是\n\n看看近期真正站出來挺台灣人的都是哪些人\n\n阿館 阿滴 一堆在台外國網紅 杜力 維大力 新台灣人 瑞莎 吳鳳\n\n太多了懶得一個一個講\n\n雖然他們影響力有限 但都努力為自己喜歡的土地人文盡一點點力量\n\n幹就出來講個真心話不行嗎  就用自己有限的影響力做點事不行嗎\n\n哪怕幫忙對內喊一句加油也好\n\n幹他媽的 有影響力的藝人咧  人在哪?\n\n霸凌台灣你們都推了一把啦幹\n\n\n然後說回阿滴\n\n刊登頭版不是寫作文寫論文好嗎\n\n像我這種英文爛爆的人完全認同你的英文程度\n\n我很感謝台灣越來越多像你這樣有一丁點影響力的人願意站出來想做點事\n\n但他媽的拜託你真的真的沒有設計頭版的能力\n\n可以把溢出的捐款拿一點去請專業設計跟寫手好嗎\n\n以後要英語作文大賽你再上\n
## 10                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                            __________________________________________\n\n\n說真的,PTT停止註冊好像快兩年了\n\n這裡已經剩下一些六七年級的老屁股\n\n過去,這些人嘲笑怒罵那些個四五年級的老人思想僵化,冥頑不靈,\n\n跟不上時代,殊不知他們也漸漸在成為他們口中曾經的老人\n\n阿滴過往形象算正面,結果推文一堆鍵盤文青寫手不說,還說多募的錢去哪啦\n\n阿滴在蹭熱度啦,阿滴的學歷不高啦,實在令人費解\n\n大家都為台灣這次委屈打抱不平,有人有實際行動,就算文章內容的確有可修正的地方\n\n其實都能拿出來討論,但在我看來PTT似乎不是在討論而是極盡所能的批評與恥笑\n\n\n現在PTT愛台灣的方式,就是用鍵盤來愛台灣\n\n或是貶低那些有實際行動的人以襯托自己愛台灣愛得高人一等\n\nPTT這個地方已經逐漸在死亡,沒有新血加入\n\n而原本的用戶全自以為走在時代的尖端\n\n\n\n
##         總統         滴妹         疫情         募款         教育
## 1  0.9996149 9.626955e-05 9.626955e-05 9.626955e-05 9.626955e-05
## 2  0.9995137 1.215707e-04 1.215707e-04 1.215707e-04 1.215707e-04
## 3  0.9994833 1.291640e-04 1.291640e-04 1.291640e-04 1.291640e-04
## 4  0.9992281 1.929747e-04 1.929747e-04 1.929747e-04 1.929747e-04
## 5  0.9992238 1.940398e-04 1.940398e-04 1.940398e-04 1.940398e-04
## 6  0.9991382 2.154444e-04 2.154444e-04 2.154444e-04 2.154444e-04
## 7  0.9990759 2.310178e-04 2.310178e-04 2.310178e-04 2.310178e-04
## 8  0.9989114 2.721509e-04 2.721509e-04 2.721509e-04 2.721509e-04
## 9  0.9986502 3.374614e-04 3.374614e-04 3.374614e-04 3.374614e-04
## 10 0.9983490 4.127383e-04 4.127383e-04 4.127383e-04 4.127383e-04

可以看到“總統”這個主題主要討論阿滴開箱總統專機的事件。

每章節的主題變化

# di_topic[ ,c(11:15)] <- sapply(di_topic[ ,c(11:15)] , as.numeric)

di_topic %>%
  dplyr::select(-commentNum, -push, -boo) %>% # 篩選掉不必要的欄位
  group_by(artDate = format(artDate,'%Y%m')) %>%
  summarise_if(is.numeric, sum, na.rm = TRUE) %>%
  melt(id.vars = "artDate")%>%
 ggplot(aes(x=artDate, y=value, fill=variable)) +
  geom_bar(stat = "identity") + ylab("value") +
  theme(axis.text.x = element_text(angle = 50, hjust = 1))

上面的主題變化長條圖顯示五個主題在2020年4月份有比較高的討論量,差別在於熱度不同。

每章節的主題比例變化

#di_topic[,c(11:15)] <- sapply(di_topic[,c(11:15)] , as.numeric)

di_topic %>%
  dplyr::select(-commentNum, -push, -boo) %>% # 篩選掉不必要的欄位
  group_by(artDate = format(artDate,'%Y%m')) %>%
  summarise_if(is.numeric, sum, na.rm = TRUE) %>%
  melt(id.vars = "artDate")%>%
  group_by(artDate)%>%
  mutate(total_value =sum(value))%>%
  ggplot(aes(x=artDate, y=value/total_value, fill=variable)) +
  geom_bar(stat = "identity") +
  ylab("proportion") + scale_fill_manual(values=mycolors)+
  theme(axis.text.x = element_text(angle = 50, hjust = 1))

上圖顯示有關網紅阿滴的相關主題在各月份上討論聲量的比例變化

重要文章間的社群網絡分析

資料預覽

# PO文資料
posts <- fread('C:/Users/Sean/Documents/20200526_project_2/1_Dataset/social_media_midterm_Di_all.csv',encoding = 'UTF-8')
posts$artDate<-posts$artDate %>% as.Date("%Y/%m/%d")
head(posts, 5)
##                                      artTitle    artDate  artTime
## 1:               [爆卦]阿滴英文突破百萬訂閱! 2017-07-07 05:45:25
## 2:         [問卦]阿滴英文少了滴妹還剩下什麼? 2017-07-08 07:22:49
## 3:                       [問卦]阿滴算帥哥嗎? 2017-07-22 11:27:29
## 4: [新聞]阿滴英文彈琴帥炸! 滴妹飆唱《魚仔》 2017-07-23 00:18:37
## 5:                  [問卦]阿滴跟滴妹要選哪個? 2017-07-23 21:00:07
##                                                      artUrl    artPoster
## 1: https://www.ptt.cc/bbs/Gossiping/M.1499435488.A.64E.html gamania10000
## 2: https://www.ptt.cc/bbs/Gossiping/M.1499527731.A.E6B.html     xxxxxmay
## 3: https://www.ptt.cc/bbs/Gossiping/M.1500752013.A.6B4.html    pengjoker
## 4: https://www.ptt.cc/bbs/Gossiping/M.1500798279.A.78A.html       Digo99
## 5: https://www.ptt.cc/bbs/Gossiping/M.1500872815.A.CF4.html     yabe5566
##       artCat commentNum push boo
## 1: Gossiping         81   42  16
## 2: Gossiping         14    5   1
## 3: Gossiping         30   12   2
## 4: Gossiping         28    9  10
## 5: Gossiping         28   19   1
##                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                           sentence
## 1: 各位大德晚安\n\n我國少見的清流頻道.阿滴英文(Ray Du English)\n於今日晚間已經確定成為\n台灣第六個訂閱人數超過百萬的Youtube頻道\n也是今年第四個\n\n  1. 蔡阿嘎  (2014.07.09)   146萬  (依達成順序排列)\n  2. 這群人  (2016.08.30)      180萬\n  3. 阿神   (2017.03.13)      114萬\n  4. 谷阿莫  (2017.04.27)      108萬\n  5. 聖結石  (2017.05.29)      115萬\n  6.\n阿滴英文 (2017.07.07)      100萬\n相關資料如下:\n\n 一、阿滴英文是台灣第一個教育類百萬級頻道\n   但是頻道內點閱數最高的那部影片,跟英文/教育完全沒關係\n\n 二、阿滴英文創辦於2015年1月11日\n     歷經908天後達成百萬訂閱(十萬訂閱花了456天/2016年4月11日)\n     是台灣史上第三快的(僅次於聖結石220天與谷阿莫625天)\n\n 三、阿滴英文目前有189部影片,在百萬級頻道中只比這群人多\n    目前發表最多影片的是阿神(2835部),數量約是阿滴的15倍,這群人的22倍\n\n 四、雖然阿滴英文的訂閱數超過百萬,但是觀看次數不到五千萬\n    只有聖結石的四分之一,谷阿莫的七分之一\n   在台灣甚至排不到三十名\n\n 五、阿滴英文是台灣第一個由金牛座創辦的百萬級頻道(1989年5月8日晚上9點)\n     (這群人的尼克生於1988年4月20日,但那年太陽落於雙子座)\n   而且目前台灣的高訂閱youtuber中,幾乎沒有金牛座\n\n   蔡阿嘎(巨蟹)\n   這群人(摩羯/水瓶x2/雙魚/牡羊/雙子/巨蟹/獅子/處女)\n   阿 神(天秤)\n   谷阿莫(摩羯)\n   聖結石(天蠍)\n\n 六、六個百萬級頻道中,只有蔡阿嘎跟谷阿莫從未跟阿滴英文合作過影片\n     不過阿滴採訪過蔡阿嘎,發出合照的當晚IG立刻遭刪除\n\n 七、目前六個百萬級頻道的創辦人\n   都不是公立大學出身\n\n     蔡阿嘎  東吳大學、中國文化大學\n    這群人  國立台灣戲曲學院\n    阿神   明志科技大學\n     谷阿莫    龍華科技大學\n     聖結石    南強高級工商職業學校\n     阿滴      輔仁大學  \n\n 八、阿滴英文是台灣第二個由碩士創辦的百萬級頻道\n   僅次於蔡阿嘎\n\n 九、阿滴英文是台灣第二個由同志天菜創辦的百萬級頻道\n     僅次於阿神\n\n 十、六個百萬級頻道中\n     沒有任何一個創辦人有近視(阿滴與滴妹曾經有但已雷射)\n     而除了阿滴、滴妹外,阿神也常戴無鏡框眼鏡\n\n 十一、六個百萬級頻道中\n     只有谷阿莫沒有在台灣辦過粉絲活動(見面會、簽名會...等)\n\n 十二、六個百萬級頻道中\n     只有阿神還未發表任何出版作品(書、單曲、電影...等)\n\n 十三、台灣目前還沒有任何一個由女性單獨創辦的百萬級頻道\n
## 2:                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                         如題\n少了滴妹的阿滴\n還剩下什麼.\n.\n.\n.\n.\n剩阿滴\n.\n.\n.\n.\n欸這是廢話\n我是問還剩下那些內容可看\n大家覺得呢?\n
## 3:                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                如題\n\n就是阿滴英文那個阿滴\n\n各位大大覺得他算帥哥嗎?\nhttp://i.imgur.com/rZxhy7z.jpg\n有沒有八卦???\n\n\n
## 4:                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                           阿滴英文彈琴帥炸! 滴妹飆唱《魚仔》甜聲融化網友\n\n記者劉宜庭/綜合報導\n\n阿滴靠著全台最大英文教學YouTube頻道「阿滴英文」走紅,近期更發行新書,擁有破百\n萬粉絲支持。他22日晚間在臉書上開直播,難得和滴妹合體,一起彈唱《魚仔》、《Mos\nt Girls》等數首歌曲,展現彈琴功力,一旁滴妹甜美嗓音,兄妹倆搭檔呈現絕佳默契,\n令粉絲一飽耳福。\n\n「阿滴英文」22日在臉書開直播,坦言這次難得和滴妹合作彈唱,是想藉此機會紀念聯合\n樂團主唱查斯特(Chester Bennington),「對我來說是很震撼的事情,因為我從小第一\n次接觸西洋音樂,就是透過Linkin Park。」\n\n看見查斯特自殺身亡的消息,阿滴除了感嘆惋惜,同時也不忘呼籲患有憂鬱症或是其他疾\n病的人,「希望大家不要把自殺當作是一個\n選則\n,因為活著總是有出路的。」他和滴妹合\n作唱《Numb》之前,也透露這首歌是他聽「聯合公園」的第一首歌,當時甚至還為此去學\n了一段Rap,表示該曲在國、高中時期對他來說有很大的影響力。\n\n這次直播除了紀念樂團「聯合公園」,阿滴和滴妹飆唱《What I've Done》、《Numb》之\n外,兄妹倆也彈唱了許多最近接觸到的歌,包括《魚仔》、《不曾回來過》等歌曲,難得\n展現彈琴功力,模樣被讚相當帥氣,搭配滴妹甜美嗓音,令粉絲聽地如癡如醉,在翻唱《\n魚仔》的過程中,兄妹倆還逗趣用台語對話,一來一往有趣互動逗樂眾人,引發不少討論\n。\n\n● 《ETNEWS新聞雲》提醒您,請給自己機會:\n自殺防治諮詢安心專線:0800-788995;生命線協談專線:1995\nhttp://star.ettoday.net/news/972597?from=fb_et_star
## 5:                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                            如題啦\n\n這兩位英文都很好\n\n阿滴笑起來很可愛\n\n滴妹鼻子很Q\n\n大家會選哪個?\n\n\n
# reply資料
reviews <- fread('C:/Users/Sean/Documents/20200526_project_2/1_Dataset/social_media_midterm_Di_all_reply.csv',encoding = 'UTF-8')
reviews$artDate<-reviews$artDate %>% as.Date("%Y/%m/%d")
head(reviews, 5)
##                        artTitle    artDate  artTime
## 1: [爆卦]阿滴英文突破百萬訂閱! 2017-07-07 05:45:25
## 2: [爆卦]阿滴英文突破百萬訂閱! 2017-07-07 05:45:25
## 3: [爆卦]阿滴英文突破百萬訂閱! 2017-07-07 05:45:25
## 4: [爆卦]阿滴英文突破百萬訂閱! 2017-07-07 05:45:25
## 5: [爆卦]阿滴英文突破百萬訂閱! 2017-07-07 05:45:25
##                                                      artUrl    artPoster
## 1: https://www.ptt.cc/bbs/Gossiping/M.1499435488.A.64E.html gamania10000
## 2: https://www.ptt.cc/bbs/Gossiping/M.1499435488.A.64E.html gamania10000
## 3: https://www.ptt.cc/bbs/Gossiping/M.1499435488.A.64E.html gamania10000
## 4: https://www.ptt.cc/bbs/Gossiping/M.1499435488.A.64E.html gamania10000
## 5: https://www.ptt.cc/bbs/Gossiping/M.1499435488.A.64E.html gamania10000
##       artCat   cmtPoster cmtStatus                   cmtDate
## 1: Gossiping   diabolica         → 2017-07-07 13:45:00+00:00
## 2: Gossiping        winu         → 2017-07-07 13:45:00+00:00
## 3: Gossiping    hspnvzte        推 2017-07-07 13:46:00+00:00
## 4: Gossiping HongkaiBoyz        推 2017-07-07 13:46:00+00:00
## 5: Gossiping    air33456         → 2017-07-07 13:46:00+00:00
##                            cmtContent
## 1:                                :誰
## 2: :同時訂閱1~6的人,腦袋到底裝什麼?
## 3:        :恭喜阿滴英文!第四名滾喇幹
## 4:                                :推
## 5:                :會看這些的都是低能

PO文趨勢圖

posts %>% 
  group_by(artDate) %>%
  summarise(count = n())%>%
  ggplot(aes(artDate,count))+
    geom_line(color="blue", size=1)+
    theme_classic()

發文者數量

length(unique(posts$artPoster))
## [1] 387

回覆者數量

length(unique(reviews$cmtPoster))
## [1] 13482

總共有參與的人數

allPoster <- c(posts$artPoster, reviews$cmtPoster)
length(unique(allPoster))
## [1] 13663

整理所有參與人

# 整理所有出現過的使用者
# 如果他曾發過文的話就標註他爲poster (發文者)
# 如果沒有發過文的話則標註他爲replyer (回覆者)
userList <- data.frame(user=unique(allPoster)) %>%
              mutate(type=ifelse(user%in%posts$artPoster, "poster", "replyer"))
userList %>% head(20)
##            user   type
## 1  gamania10000 poster
## 2      xxxxxmay poster
## 3     pengjoker poster
## 4        Digo99 poster
## 5      yabe5566 poster
## 6  rothschild99 poster
## 7       chsiung poster
## 8    hahaha0204 poster
## 9        seabox poster
## 10       BBbibi poster
## 11       nixing poster
## 12       chirex poster
## 13          gs1 poster
## 14      marqlin poster
## 15 sigmaaldrich poster
## 16   SHERLOCKZH poster
## 17    Beanoodle poster
## 18        yuxds poster
## 19     onetwogo poster
## 20 tryit2589365 poster

建立社群網路圖

將原文與回覆Join起來

# 把原文與回覆依據artUrl innerJoin起來
posts_Reviews <- merge(x = posts, y = reviews, by = "artUrl")
posts_Reviews %>% head(5)
##                                                      artUrl
## 1: https://www.ptt.cc/bbs/Gossiping/M.1499435488.A.64E.html
## 2: https://www.ptt.cc/bbs/Gossiping/M.1499435488.A.64E.html
## 3: https://www.ptt.cc/bbs/Gossiping/M.1499435488.A.64E.html
## 4: https://www.ptt.cc/bbs/Gossiping/M.1499435488.A.64E.html
## 5: https://www.ptt.cc/bbs/Gossiping/M.1499435488.A.64E.html
##                      artTitle.x  artDate.x artTime.x  artPoster.x  artCat.x
## 1: [爆卦]阿滴英文突破百萬訂閱! 2017-07-07  05:45:25 gamania10000 Gossiping
## 2: [爆卦]阿滴英文突破百萬訂閱! 2017-07-07  05:45:25 gamania10000 Gossiping
## 3: [爆卦]阿滴英文突破百萬訂閱! 2017-07-07  05:45:25 gamania10000 Gossiping
## 4: [爆卦]阿滴英文突破百萬訂閱! 2017-07-07  05:45:25 gamania10000 Gossiping
## 5: [爆卦]阿滴英文突破百萬訂閱! 2017-07-07  05:45:25 gamania10000 Gossiping
##    commentNum push boo
## 1:         81   42  16
## 2:         81   42  16
## 3:         81   42  16
## 4:         81   42  16
## 5:         81   42  16
##                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                           sentence
## 1: 各位大德晚安\n\n我國少見的清流頻道.阿滴英文(Ray Du English)\n於今日晚間已經確定成為\n台灣第六個訂閱人數超過百萬的Youtube頻道\n也是今年第四個\n\n  1. 蔡阿嘎  (2014.07.09)   146萬  (依達成順序排列)\n  2. 這群人  (2016.08.30)      180萬\n  3. 阿神   (2017.03.13)      114萬\n  4. 谷阿莫  (2017.04.27)      108萬\n  5. 聖結石  (2017.05.29)      115萬\n  6.\n阿滴英文 (2017.07.07)      100萬\n相關資料如下:\n\n 一、阿滴英文是台灣第一個教育類百萬級頻道\n   但是頻道內點閱數最高的那部影片,跟英文/教育完全沒關係\n\n 二、阿滴英文創辦於2015年1月11日\n     歷經908天後達成百萬訂閱(十萬訂閱花了456天/2016年4月11日)\n     是台灣史上第三快的(僅次於聖結石220天與谷阿莫625天)\n\n 三、阿滴英文目前有189部影片,在百萬級頻道中只比這群人多\n    目前發表最多影片的是阿神(2835部),數量約是阿滴的15倍,這群人的22倍\n\n 四、雖然阿滴英文的訂閱數超過百萬,但是觀看次數不到五千萬\n    只有聖結石的四分之一,谷阿莫的七分之一\n   在台灣甚至排不到三十名\n\n 五、阿滴英文是台灣第一個由金牛座創辦的百萬級頻道(1989年5月8日晚上9點)\n     (這群人的尼克生於1988年4月20日,但那年太陽落於雙子座)\n   而且目前台灣的高訂閱youtuber中,幾乎沒有金牛座\n\n   蔡阿嘎(巨蟹)\n   這群人(摩羯/水瓶x2/雙魚/牡羊/雙子/巨蟹/獅子/處女)\n   阿 神(天秤)\n   谷阿莫(摩羯)\n   聖結石(天蠍)\n\n 六、六個百萬級頻道中,只有蔡阿嘎跟谷阿莫從未跟阿滴英文合作過影片\n     不過阿滴採訪過蔡阿嘎,發出合照的當晚IG立刻遭刪除\n\n 七、目前六個百萬級頻道的創辦人\n   都不是公立大學出身\n\n     蔡阿嘎  東吳大學、中國文化大學\n    這群人  國立台灣戲曲學院\n    阿神   明志科技大學\n     谷阿莫    龍華科技大學\n     聖結石    南強高級工商職業學校\n     阿滴      輔仁大學  \n\n 八、阿滴英文是台灣第二個由碩士創辦的百萬級頻道\n   僅次於蔡阿嘎\n\n 九、阿滴英文是台灣第二個由同志天菜創辦的百萬級頻道\n     僅次於阿神\n\n 十、六個百萬級頻道中\n     沒有任何一個創辦人有近視(阿滴與滴妹曾經有但已雷射)\n     而除了阿滴、滴妹外,阿神也常戴無鏡框眼鏡\n\n 十一、六個百萬級頻道中\n     只有谷阿莫沒有在台灣辦過粉絲活動(見面會、簽名會...等)\n\n 十二、六個百萬級頻道中\n     只有阿神還未發表任何出版作品(書、單曲、電影...等)\n\n 十三、台灣目前還沒有任何一個由女性單獨創辦的百萬級頻道\n
## 2: 各位大德晚安\n\n我國少見的清流頻道.阿滴英文(Ray Du English)\n於今日晚間已經確定成為\n台灣第六個訂閱人數超過百萬的Youtube頻道\n也是今年第四個\n\n  1. 蔡阿嘎  (2014.07.09)   146萬  (依達成順序排列)\n  2. 這群人  (2016.08.30)      180萬\n  3. 阿神   (2017.03.13)      114萬\n  4. 谷阿莫  (2017.04.27)      108萬\n  5. 聖結石  (2017.05.29)      115萬\n  6.\n阿滴英文 (2017.07.07)      100萬\n相關資料如下:\n\n 一、阿滴英文是台灣第一個教育類百萬級頻道\n   但是頻道內點閱數最高的那部影片,跟英文/教育完全沒關係\n\n 二、阿滴英文創辦於2015年1月11日\n     歷經908天後達成百萬訂閱(十萬訂閱花了456天/2016年4月11日)\n     是台灣史上第三快的(僅次於聖結石220天與谷阿莫625天)\n\n 三、阿滴英文目前有189部影片,在百萬級頻道中只比這群人多\n    目前發表最多影片的是阿神(2835部),數量約是阿滴的15倍,這群人的22倍\n\n 四、雖然阿滴英文的訂閱數超過百萬,但是觀看次數不到五千萬\n    只有聖結石的四分之一,谷阿莫的七分之一\n   在台灣甚至排不到三十名\n\n 五、阿滴英文是台灣第一個由金牛座創辦的百萬級頻道(1989年5月8日晚上9點)\n     (這群人的尼克生於1988年4月20日,但那年太陽落於雙子座)\n   而且目前台灣的高訂閱youtuber中,幾乎沒有金牛座\n\n   蔡阿嘎(巨蟹)\n   這群人(摩羯/水瓶x2/雙魚/牡羊/雙子/巨蟹/獅子/處女)\n   阿 神(天秤)\n   谷阿莫(摩羯)\n   聖結石(天蠍)\n\n 六、六個百萬級頻道中,只有蔡阿嘎跟谷阿莫從未跟阿滴英文合作過影片\n     不過阿滴採訪過蔡阿嘎,發出合照的當晚IG立刻遭刪除\n\n 七、目前六個百萬級頻道的創辦人\n   都不是公立大學出身\n\n     蔡阿嘎  東吳大學、中國文化大學\n    這群人  國立台灣戲曲學院\n    阿神   明志科技大學\n     谷阿莫    龍華科技大學\n     聖結石    南強高級工商職業學校\n     阿滴      輔仁大學  \n\n 八、阿滴英文是台灣第二個由碩士創辦的百萬級頻道\n   僅次於蔡阿嘎\n\n 九、阿滴英文是台灣第二個由同志天菜創辦的百萬級頻道\n     僅次於阿神\n\n 十、六個百萬級頻道中\n     沒有任何一個創辦人有近視(阿滴與滴妹曾經有但已雷射)\n     而除了阿滴、滴妹外,阿神也常戴無鏡框眼鏡\n\n 十一、六個百萬級頻道中\n     只有谷阿莫沒有在台灣辦過粉絲活動(見面會、簽名會...等)\n\n 十二、六個百萬級頻道中\n     只有阿神還未發表任何出版作品(書、單曲、電影...等)\n\n 十三、台灣目前還沒有任何一個由女性單獨創辦的百萬級頻道\n
## 3: 各位大德晚安\n\n我國少見的清流頻道.阿滴英文(Ray Du English)\n於今日晚間已經確定成為\n台灣第六個訂閱人數超過百萬的Youtube頻道\n也是今年第四個\n\n  1. 蔡阿嘎  (2014.07.09)   146萬  (依達成順序排列)\n  2. 這群人  (2016.08.30)      180萬\n  3. 阿神   (2017.03.13)      114萬\n  4. 谷阿莫  (2017.04.27)      108萬\n  5. 聖結石  (2017.05.29)      115萬\n  6.\n阿滴英文 (2017.07.07)      100萬\n相關資料如下:\n\n 一、阿滴英文是台灣第一個教育類百萬級頻道\n   但是頻道內點閱數最高的那部影片,跟英文/教育完全沒關係\n\n 二、阿滴英文創辦於2015年1月11日\n     歷經908天後達成百萬訂閱(十萬訂閱花了456天/2016年4月11日)\n     是台灣史上第三快的(僅次於聖結石220天與谷阿莫625天)\n\n 三、阿滴英文目前有189部影片,在百萬級頻道中只比這群人多\n    目前發表最多影片的是阿神(2835部),數量約是阿滴的15倍,這群人的22倍\n\n 四、雖然阿滴英文的訂閱數超過百萬,但是觀看次數不到五千萬\n    只有聖結石的四分之一,谷阿莫的七分之一\n   在台灣甚至排不到三十名\n\n 五、阿滴英文是台灣第一個由金牛座創辦的百萬級頻道(1989年5月8日晚上9點)\n     (這群人的尼克生於1988年4月20日,但那年太陽落於雙子座)\n   而且目前台灣的高訂閱youtuber中,幾乎沒有金牛座\n\n   蔡阿嘎(巨蟹)\n   這群人(摩羯/水瓶x2/雙魚/牡羊/雙子/巨蟹/獅子/處女)\n   阿 神(天秤)\n   谷阿莫(摩羯)\n   聖結石(天蠍)\n\n 六、六個百萬級頻道中,只有蔡阿嘎跟谷阿莫從未跟阿滴英文合作過影片\n     不過阿滴採訪過蔡阿嘎,發出合照的當晚IG立刻遭刪除\n\n 七、目前六個百萬級頻道的創辦人\n   都不是公立大學出身\n\n     蔡阿嘎  東吳大學、中國文化大學\n    這群人  國立台灣戲曲學院\n    阿神   明志科技大學\n     谷阿莫    龍華科技大學\n     聖結石    南強高級工商職業學校\n     阿滴      輔仁大學  \n\n 八、阿滴英文是台灣第二個由碩士創辦的百萬級頻道\n   僅次於蔡阿嘎\n\n 九、阿滴英文是台灣第二個由同志天菜創辦的百萬級頻道\n     僅次於阿神\n\n 十、六個百萬級頻道中\n     沒有任何一個創辦人有近視(阿滴與滴妹曾經有但已雷射)\n     而除了阿滴、滴妹外,阿神也常戴無鏡框眼鏡\n\n 十一、六個百萬級頻道中\n     只有谷阿莫沒有在台灣辦過粉絲活動(見面會、簽名會...等)\n\n 十二、六個百萬級頻道中\n     只有阿神還未發表任何出版作品(書、單曲、電影...等)\n\n 十三、台灣目前還沒有任何一個由女性單獨創辦的百萬級頻道\n
## 4: 各位大德晚安\n\n我國少見的清流頻道.阿滴英文(Ray Du English)\n於今日晚間已經確定成為\n台灣第六個訂閱人數超過百萬的Youtube頻道\n也是今年第四個\n\n  1. 蔡阿嘎  (2014.07.09)   146萬  (依達成順序排列)\n  2. 這群人  (2016.08.30)      180萬\n  3. 阿神   (2017.03.13)      114萬\n  4. 谷阿莫  (2017.04.27)      108萬\n  5. 聖結石  (2017.05.29)      115萬\n  6.\n阿滴英文 (2017.07.07)      100萬\n相關資料如下:\n\n 一、阿滴英文是台灣第一個教育類百萬級頻道\n   但是頻道內點閱數最高的那部影片,跟英文/教育完全沒關係\n\n 二、阿滴英文創辦於2015年1月11日\n     歷經908天後達成百萬訂閱(十萬訂閱花了456天/2016年4月11日)\n     是台灣史上第三快的(僅次於聖結石220天與谷阿莫625天)\n\n 三、阿滴英文目前有189部影片,在百萬級頻道中只比這群人多\n    目前發表最多影片的是阿神(2835部),數量約是阿滴的15倍,這群人的22倍\n\n 四、雖然阿滴英文的訂閱數超過百萬,但是觀看次數不到五千萬\n    只有聖結石的四分之一,谷阿莫的七分之一\n   在台灣甚至排不到三十名\n\n 五、阿滴英文是台灣第一個由金牛座創辦的百萬級頻道(1989年5月8日晚上9點)\n     (這群人的尼克生於1988年4月20日,但那年太陽落於雙子座)\n   而且目前台灣的高訂閱youtuber中,幾乎沒有金牛座\n\n   蔡阿嘎(巨蟹)\n   這群人(摩羯/水瓶x2/雙魚/牡羊/雙子/巨蟹/獅子/處女)\n   阿 神(天秤)\n   谷阿莫(摩羯)\n   聖結石(天蠍)\n\n 六、六個百萬級頻道中,只有蔡阿嘎跟谷阿莫從未跟阿滴英文合作過影片\n     不過阿滴採訪過蔡阿嘎,發出合照的當晚IG立刻遭刪除\n\n 七、目前六個百萬級頻道的創辦人\n   都不是公立大學出身\n\n     蔡阿嘎  東吳大學、中國文化大學\n    這群人  國立台灣戲曲學院\n    阿神   明志科技大學\n     谷阿莫    龍華科技大學\n     聖結石    南強高級工商職業學校\n     阿滴      輔仁大學  \n\n 八、阿滴英文是台灣第二個由碩士創辦的百萬級頻道\n   僅次於蔡阿嘎\n\n 九、阿滴英文是台灣第二個由同志天菜創辦的百萬級頻道\n     僅次於阿神\n\n 十、六個百萬級頻道中\n     沒有任何一個創辦人有近視(阿滴與滴妹曾經有但已雷射)\n     而除了阿滴、滴妹外,阿神也常戴無鏡框眼鏡\n\n 十一、六個百萬級頻道中\n     只有谷阿莫沒有在台灣辦過粉絲活動(見面會、簽名會...等)\n\n 十二、六個百萬級頻道中\n     只有阿神還未發表任何出版作品(書、單曲、電影...等)\n\n 十三、台灣目前還沒有任何一個由女性單獨創辦的百萬級頻道\n
## 5: 各位大德晚安\n\n我國少見的清流頻道.阿滴英文(Ray Du English)\n於今日晚間已經確定成為\n台灣第六個訂閱人數超過百萬的Youtube頻道\n也是今年第四個\n\n  1. 蔡阿嘎  (2014.07.09)   146萬  (依達成順序排列)\n  2. 這群人  (2016.08.30)      180萬\n  3. 阿神   (2017.03.13)      114萬\n  4. 谷阿莫  (2017.04.27)      108萬\n  5. 聖結石  (2017.05.29)      115萬\n  6.\n阿滴英文 (2017.07.07)      100萬\n相關資料如下:\n\n 一、阿滴英文是台灣第一個教育類百萬級頻道\n   但是頻道內點閱數最高的那部影片,跟英文/教育完全沒關係\n\n 二、阿滴英文創辦於2015年1月11日\n     歷經908天後達成百萬訂閱(十萬訂閱花了456天/2016年4月11日)\n     是台灣史上第三快的(僅次於聖結石220天與谷阿莫625天)\n\n 三、阿滴英文目前有189部影片,在百萬級頻道中只比這群人多\n    目前發表最多影片的是阿神(2835部),數量約是阿滴的15倍,這群人的22倍\n\n 四、雖然阿滴英文的訂閱數超過百萬,但是觀看次數不到五千萬\n    只有聖結石的四分之一,谷阿莫的七分之一\n   在台灣甚至排不到三十名\n\n 五、阿滴英文是台灣第一個由金牛座創辦的百萬級頻道(1989年5月8日晚上9點)\n     (這群人的尼克生於1988年4月20日,但那年太陽落於雙子座)\n   而且目前台灣的高訂閱youtuber中,幾乎沒有金牛座\n\n   蔡阿嘎(巨蟹)\n   這群人(摩羯/水瓶x2/雙魚/牡羊/雙子/巨蟹/獅子/處女)\n   阿 神(天秤)\n   谷阿莫(摩羯)\n   聖結石(天蠍)\n\n 六、六個百萬級頻道中,只有蔡阿嘎跟谷阿莫從未跟阿滴英文合作過影片\n     不過阿滴採訪過蔡阿嘎,發出合照的當晚IG立刻遭刪除\n\n 七、目前六個百萬級頻道的創辦人\n   都不是公立大學出身\n\n     蔡阿嘎  東吳大學、中國文化大學\n    這群人  國立台灣戲曲學院\n    阿神   明志科技大學\n     谷阿莫    龍華科技大學\n     聖結石    南強高級工商職業學校\n     阿滴      輔仁大學  \n\n 八、阿滴英文是台灣第二個由碩士創辦的百萬級頻道\n   僅次於蔡阿嘎\n\n 九、阿滴英文是台灣第二個由同志天菜創辦的百萬級頻道\n     僅次於阿神\n\n 十、六個百萬級頻道中\n     沒有任何一個創辦人有近視(阿滴與滴妹曾經有但已雷射)\n     而除了阿滴、滴妹外,阿神也常戴無鏡框眼鏡\n\n 十一、六個百萬級頻道中\n     只有谷阿莫沒有在台灣辦過粉絲活動(見面會、簽名會...等)\n\n 十二、六個百萬級頻道中\n     只有阿神還未發表任何出版作品(書、單曲、電影...等)\n\n 十三、台灣目前還沒有任何一個由女性單獨創辦的百萬級頻道\n
##                      artTitle.y  artDate.y artTime.y  artPoster.y  artCat.y
## 1: [爆卦]阿滴英文突破百萬訂閱! 2017-07-07  05:45:25 gamania10000 Gossiping
## 2: [爆卦]阿滴英文突破百萬訂閱! 2017-07-07  05:45:25 gamania10000 Gossiping
## 3: [爆卦]阿滴英文突破百萬訂閱! 2017-07-07  05:45:25 gamania10000 Gossiping
## 4: [爆卦]阿滴英文突破百萬訂閱! 2017-07-07  05:45:25 gamania10000 Gossiping
## 5: [爆卦]阿滴英文突破百萬訂閱! 2017-07-07  05:45:25 gamania10000 Gossiping
##      cmtPoster cmtStatus                   cmtDate
## 1:   diabolica         → 2017-07-07 13:45:00+00:00
## 2:        winu         → 2017-07-07 13:45:00+00:00
## 3:    hspnvzte        推 2017-07-07 13:46:00+00:00
## 4: HongkaiBoyz        推 2017-07-07 13:46:00+00:00
## 5:    air33456         → 2017-07-07 13:46:00+00:00
##                            cmtContent
## 1:                                :誰
## 2: :同時訂閱1~6的人,腦袋到底裝什麼?
## 3:        :恭喜阿滴英文!第四名滾喇幹
## 4:                                :推
## 5:                :會看這些的都是低能
# artPoster有兩個欄位(artPoster.x, artPoster.y)取artPoster.x為artPoster
# artDate也有兩個欄位(artDate.x, artDate.y)取artDate.y為artDate
names(posts_Reviews)<-c("artUrl","artTitle.x","artDate.x","artTime.x",
                        "artPoster","artCat.x","commentNum","push",
                        "boo","sentence","artTitle.y","artDate",
                        "artTime.y","artPoster.y","artCat.y","cmtPoster",
                        "cmtStatus","cmtDate","cmtContent")
names(posts_Reviews)
##  [1] "artUrl"      "artTitle.x"  "artDate.x"   "artTime.x"   "artPoster"  
##  [6] "artCat.x"    "commentNum"  "push"        "boo"         "sentence"   
## [11] "artTitle.y"  "artDate"     "artTime.y"   "artPoster.y" "artCat.y"   
## [16] "cmtPoster"   "cmtStatus"   "cmtDate"     "cmtContent"

資料篩選

挑出2020-04-10當天的文章和它的回覆 + [新聞]阿滴拆台譚德塞「1小時募款破50萬」!

link <- posts_Reviews %>%
      filter(artDate == as.Date("2020-04-10")) %>%
      select(artUrl, artPoster, cmtPoster) %>% 
      unique()
link %>% head(10)
##                                                      artUrl artPoster
## 1  https://www.ptt.cc/bbs/Gossiping/M.1586504704.A.8B2.html      jj20
## 2  https://www.ptt.cc/bbs/Gossiping/M.1586504704.A.8B2.html      jj20
## 3  https://www.ptt.cc/bbs/Gossiping/M.1586504704.A.8B2.html      jj20
## 4  https://www.ptt.cc/bbs/Gossiping/M.1586504704.A.8B2.html      jj20
## 5  https://www.ptt.cc/bbs/Gossiping/M.1586504704.A.8B2.html      jj20
## 7  https://www.ptt.cc/bbs/Gossiping/M.1586504704.A.8B2.html      jj20
## 8  https://www.ptt.cc/bbs/Gossiping/M.1586504704.A.8B2.html      jj20
## 9  https://www.ptt.cc/bbs/Gossiping/M.1586504704.A.8B2.html      jj20
## 10 https://www.ptt.cc/bbs/Gossiping/M.1586504704.A.8B2.html      jj20
## 11 https://www.ptt.cc/bbs/Gossiping/M.1586504704.A.8B2.html      jj20
##       cmtPoster
## 1        jorden
## 2  fantasy00249
## 3      rockon15
## 4     kavengany
## 5        johnwu
## 7        zuique
## 8      A80211ab
## 9     zombieguy
## 10       slimak
## 11      Willier

過濾圖中的點(v)

# 這邊要篩選link中有出現的使用者
# 因爲如果userList(igraph中graph_from_data_frame的v參數吃的那個東西)中出現了沒有在link中出現的使用者
# 也會被igraph畫上去,圖片就會變得沒有意義
# userList代表不是PO文者就是回覆者,彼此不互跨
filtered_user <- userList %>%
          filter(user%in%link$cmtPoster | user%in%link$artPoster) %>%
          arrange(desc(type))
filtered_user %>% head(20) 
##            user    type
## 1        johnwu replyer
## 2     maple0425 replyer
## 3       nobeldd replyer
## 4     flicker36 replyer
## 5    akira00150 replyer
## 6       gamiiko replyer
## 7        ffaatt replyer
## 8        kosuke replyer
## 9       cloudin replyer
## 10        batis replyer
## 11    t81511270 replyer
## 12 LEBR0NJAMES6 replyer
## 13     Yginger1 replyer
## 14    PoloHuang replyer
## 15       L9C4iO replyer
## 16     milk7054 replyer
## 17   jetaime851 replyer
## 18       YALEMY replyer
## 19      yuechen replyer
## 20   tim8177414 replyer

過濾使用者後的網路圖

set.seed(487)
reviewNetwork <- graph_from_data_frame(d=link[,2:3], v=filtered_user , directed=F) # link[,2:3] 只含有artPoster,cmtPoster
plot(reviewNetwork, vertex.size=4, edge.arrow.size=0.3,vertex.label=NA)

只能稍微看出圖中的點(人)之間有一定的關連性,不過還是無法正確分析 其中的內容。

加強圖像的顯示資訊(1)

set.seed(487)
# 用使用者的身份來區分點的顏色,如果有發文的話是金色的,只有回覆文章的則用淺藍色表示
V(reviewNetwork)$color <- ifelse(V(reviewNetwork)$type=="poster", "gold", "lightblue")
plot(reviewNetwork, vertex.size=4, edge.arrow.size=0.3,vertex.label=NA)

加強圖像的顯示資訊(2)

set.seed(487)
# 篩選要顯示出的使用者,以免圖形被密密麻麻的文字覆蓋
# 顯示有超過5個關聯的使用者賬號
labels <- degree(reviewNetwork)
V(reviewNetwork)$label <- names(labels)

V(reviewNetwork)$color <- ifelse(V(reviewNetwork)$type=="poster", "gold", "lightblue")
plot(reviewNetwork, vertex.size=4, edge.arrow.size=0.2,
     vertex.label=ifelse(degree(reviewNetwork) > 5, V(reviewNetwork)$label, NA),  vertex.label.font=2)

由上圖可以看到2020-04-10當天文章基本的發文者與回覆者關係。

主題與主題間的網絡分析比較

LDA主題進行視覺化

# 把文章資訊和主題join起來
posts_Reviews_topic <- merge(x = posts_Reviews, y = di_documents, by.x = "artUrl", by.y="document")
posts_Reviews_topic %>% head(5)
##                                                      artUrl
## 1: https://www.ptt.cc/bbs/Gossiping/M.1499435488.A.64E.html
## 2: https://www.ptt.cc/bbs/Gossiping/M.1499435488.A.64E.html
## 3: https://www.ptt.cc/bbs/Gossiping/M.1499435488.A.64E.html
## 4: https://www.ptt.cc/bbs/Gossiping/M.1499435488.A.64E.html
## 5: https://www.ptt.cc/bbs/Gossiping/M.1499435488.A.64E.html
##                      artTitle.x  artDate.x artTime.x    artPoster  artCat.x
## 1: [爆卦]阿滴英文突破百萬訂閱! 2017-07-07  05:45:25 gamania10000 Gossiping
## 2: [爆卦]阿滴英文突破百萬訂閱! 2017-07-07  05:45:25 gamania10000 Gossiping
## 3: [爆卦]阿滴英文突破百萬訂閱! 2017-07-07  05:45:25 gamania10000 Gossiping
## 4: [爆卦]阿滴英文突破百萬訂閱! 2017-07-07  05:45:25 gamania10000 Gossiping
## 5: [爆卦]阿滴英文突破百萬訂閱! 2017-07-07  05:45:25 gamania10000 Gossiping
##    commentNum push boo
## 1:         81   42  16
## 2:         81   42  16
## 3:         81   42  16
## 4:         81   42  16
## 5:         81   42  16
##                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                           sentence
## 1: 各位大德晚安\n\n我國少見的清流頻道.阿滴英文(Ray Du English)\n於今日晚間已經確定成為\n台灣第六個訂閱人數超過百萬的Youtube頻道\n也是今年第四個\n\n  1. 蔡阿嘎  (2014.07.09)   146萬  (依達成順序排列)\n  2. 這群人  (2016.08.30)      180萬\n  3. 阿神   (2017.03.13)      114萬\n  4. 谷阿莫  (2017.04.27)      108萬\n  5. 聖結石  (2017.05.29)      115萬\n  6.\n阿滴英文 (2017.07.07)      100萬\n相關資料如下:\n\n 一、阿滴英文是台灣第一個教育類百萬級頻道\n   但是頻道內點閱數最高的那部影片,跟英文/教育完全沒關係\n\n 二、阿滴英文創辦於2015年1月11日\n     歷經908天後達成百萬訂閱(十萬訂閱花了456天/2016年4月11日)\n     是台灣史上第三快的(僅次於聖結石220天與谷阿莫625天)\n\n 三、阿滴英文目前有189部影片,在百萬級頻道中只比這群人多\n    目前發表最多影片的是阿神(2835部),數量約是阿滴的15倍,這群人的22倍\n\n 四、雖然阿滴英文的訂閱數超過百萬,但是觀看次數不到五千萬\n    只有聖結石的四分之一,谷阿莫的七分之一\n   在台灣甚至排不到三十名\n\n 五、阿滴英文是台灣第一個由金牛座創辦的百萬級頻道(1989年5月8日晚上9點)\n     (這群人的尼克生於1988年4月20日,但那年太陽落於雙子座)\n   而且目前台灣的高訂閱youtuber中,幾乎沒有金牛座\n\n   蔡阿嘎(巨蟹)\n   這群人(摩羯/水瓶x2/雙魚/牡羊/雙子/巨蟹/獅子/處女)\n   阿 神(天秤)\n   谷阿莫(摩羯)\n   聖結石(天蠍)\n\n 六、六個百萬級頻道中,只有蔡阿嘎跟谷阿莫從未跟阿滴英文合作過影片\n     不過阿滴採訪過蔡阿嘎,發出合照的當晚IG立刻遭刪除\n\n 七、目前六個百萬級頻道的創辦人\n   都不是公立大學出身\n\n     蔡阿嘎  東吳大學、中國文化大學\n    這群人  國立台灣戲曲學院\n    阿神   明志科技大學\n     谷阿莫    龍華科技大學\n     聖結石    南強高級工商職業學校\n     阿滴      輔仁大學  \n\n 八、阿滴英文是台灣第二個由碩士創辦的百萬級頻道\n   僅次於蔡阿嘎\n\n 九、阿滴英文是台灣第二個由同志天菜創辦的百萬級頻道\n     僅次於阿神\n\n 十、六個百萬級頻道中\n     沒有任何一個創辦人有近視(阿滴與滴妹曾經有但已雷射)\n     而除了阿滴、滴妹外,阿神也常戴無鏡框眼鏡\n\n 十一、六個百萬級頻道中\n     只有谷阿莫沒有在台灣辦過粉絲活動(見面會、簽名會...等)\n\n 十二、六個百萬級頻道中\n     只有阿神還未發表任何出版作品(書、單曲、電影...等)\n\n 十三、台灣目前還沒有任何一個由女性單獨創辦的百萬級頻道\n
## 2: 各位大德晚安\n\n我國少見的清流頻道.阿滴英文(Ray Du English)\n於今日晚間已經確定成為\n台灣第六個訂閱人數超過百萬的Youtube頻道\n也是今年第四個\n\n  1. 蔡阿嘎  (2014.07.09)   146萬  (依達成順序排列)\n  2. 這群人  (2016.08.30)      180萬\n  3. 阿神   (2017.03.13)      114萬\n  4. 谷阿莫  (2017.04.27)      108萬\n  5. 聖結石  (2017.05.29)      115萬\n  6.\n阿滴英文 (2017.07.07)      100萬\n相關資料如下:\n\n 一、阿滴英文是台灣第一個教育類百萬級頻道\n   但是頻道內點閱數最高的那部影片,跟英文/教育完全沒關係\n\n 二、阿滴英文創辦於2015年1月11日\n     歷經908天後達成百萬訂閱(十萬訂閱花了456天/2016年4月11日)\n     是台灣史上第三快的(僅次於聖結石220天與谷阿莫625天)\n\n 三、阿滴英文目前有189部影片,在百萬級頻道中只比這群人多\n    目前發表最多影片的是阿神(2835部),數量約是阿滴的15倍,這群人的22倍\n\n 四、雖然阿滴英文的訂閱數超過百萬,但是觀看次數不到五千萬\n    只有聖結石的四分之一,谷阿莫的七分之一\n   在台灣甚至排不到三十名\n\n 五、阿滴英文是台灣第一個由金牛座創辦的百萬級頻道(1989年5月8日晚上9點)\n     (這群人的尼克生於1988年4月20日,但那年太陽落於雙子座)\n   而且目前台灣的高訂閱youtuber中,幾乎沒有金牛座\n\n   蔡阿嘎(巨蟹)\n   這群人(摩羯/水瓶x2/雙魚/牡羊/雙子/巨蟹/獅子/處女)\n   阿 神(天秤)\n   谷阿莫(摩羯)\n   聖結石(天蠍)\n\n 六、六個百萬級頻道中,只有蔡阿嘎跟谷阿莫從未跟阿滴英文合作過影片\n     不過阿滴採訪過蔡阿嘎,發出合照的當晚IG立刻遭刪除\n\n 七、目前六個百萬級頻道的創辦人\n   都不是公立大學出身\n\n     蔡阿嘎  東吳大學、中國文化大學\n    這群人  國立台灣戲曲學院\n    阿神   明志科技大學\n     谷阿莫    龍華科技大學\n     聖結石    南強高級工商職業學校\n     阿滴      輔仁大學  \n\n 八、阿滴英文是台灣第二個由碩士創辦的百萬級頻道\n   僅次於蔡阿嘎\n\n 九、阿滴英文是台灣第二個由同志天菜創辦的百萬級頻道\n     僅次於阿神\n\n 十、六個百萬級頻道中\n     沒有任何一個創辦人有近視(阿滴與滴妹曾經有但已雷射)\n     而除了阿滴、滴妹外,阿神也常戴無鏡框眼鏡\n\n 十一、六個百萬級頻道中\n     只有谷阿莫沒有在台灣辦過粉絲活動(見面會、簽名會...等)\n\n 十二、六個百萬級頻道中\n     只有阿神還未發表任何出版作品(書、單曲、電影...等)\n\n 十三、台灣目前還沒有任何一個由女性單獨創辦的百萬級頻道\n
## 3: 各位大德晚安\n\n我國少見的清流頻道.阿滴英文(Ray Du English)\n於今日晚間已經確定成為\n台灣第六個訂閱人數超過百萬的Youtube頻道\n也是今年第四個\n\n  1. 蔡阿嘎  (2014.07.09)   146萬  (依達成順序排列)\n  2. 這群人  (2016.08.30)      180萬\n  3. 阿神   (2017.03.13)      114萬\n  4. 谷阿莫  (2017.04.27)      108萬\n  5. 聖結石  (2017.05.29)      115萬\n  6.\n阿滴英文 (2017.07.07)      100萬\n相關資料如下:\n\n 一、阿滴英文是台灣第一個教育類百萬級頻道\n   但是頻道內點閱數最高的那部影片,跟英文/教育完全沒關係\n\n 二、阿滴英文創辦於2015年1月11日\n     歷經908天後達成百萬訂閱(十萬訂閱花了456天/2016年4月11日)\n     是台灣史上第三快的(僅次於聖結石220天與谷阿莫625天)\n\n 三、阿滴英文目前有189部影片,在百萬級頻道中只比這群人多\n    目前發表最多影片的是阿神(2835部),數量約是阿滴的15倍,這群人的22倍\n\n 四、雖然阿滴英文的訂閱數超過百萬,但是觀看次數不到五千萬\n    只有聖結石的四分之一,谷阿莫的七分之一\n   在台灣甚至排不到三十名\n\n 五、阿滴英文是台灣第一個由金牛座創辦的百萬級頻道(1989年5月8日晚上9點)\n     (這群人的尼克生於1988年4月20日,但那年太陽落於雙子座)\n   而且目前台灣的高訂閱youtuber中,幾乎沒有金牛座\n\n   蔡阿嘎(巨蟹)\n   這群人(摩羯/水瓶x2/雙魚/牡羊/雙子/巨蟹/獅子/處女)\n   阿 神(天秤)\n   谷阿莫(摩羯)\n   聖結石(天蠍)\n\n 六、六個百萬級頻道中,只有蔡阿嘎跟谷阿莫從未跟阿滴英文合作過影片\n     不過阿滴採訪過蔡阿嘎,發出合照的當晚IG立刻遭刪除\n\n 七、目前六個百萬級頻道的創辦人\n   都不是公立大學出身\n\n     蔡阿嘎  東吳大學、中國文化大學\n    這群人  國立台灣戲曲學院\n    阿神   明志科技大學\n     谷阿莫    龍華科技大學\n     聖結石    南強高級工商職業學校\n     阿滴      輔仁大學  \n\n 八、阿滴英文是台灣第二個由碩士創辦的百萬級頻道\n   僅次於蔡阿嘎\n\n 九、阿滴英文是台灣第二個由同志天菜創辦的百萬級頻道\n     僅次於阿神\n\n 十、六個百萬級頻道中\n     沒有任何一個創辦人有近視(阿滴與滴妹曾經有但已雷射)\n     而除了阿滴、滴妹外,阿神也常戴無鏡框眼鏡\n\n 十一、六個百萬級頻道中\n     只有谷阿莫沒有在台灣辦過粉絲活動(見面會、簽名會...等)\n\n 十二、六個百萬級頻道中\n     只有阿神還未發表任何出版作品(書、單曲、電影...等)\n\n 十三、台灣目前還沒有任何一個由女性單獨創辦的百萬級頻道\n
## 4: 各位大德晚安\n\n我國少見的清流頻道.阿滴英文(Ray Du English)\n於今日晚間已經確定成為\n台灣第六個訂閱人數超過百萬的Youtube頻道\n也是今年第四個\n\n  1. 蔡阿嘎  (2014.07.09)   146萬  (依達成順序排列)\n  2. 這群人  (2016.08.30)      180萬\n  3. 阿神   (2017.03.13)      114萬\n  4. 谷阿莫  (2017.04.27)      108萬\n  5. 聖結石  (2017.05.29)      115萬\n  6.\n阿滴英文 (2017.07.07)      100萬\n相關資料如下:\n\n 一、阿滴英文是台灣第一個教育類百萬級頻道\n   但是頻道內點閱數最高的那部影片,跟英文/教育完全沒關係\n\n 二、阿滴英文創辦於2015年1月11日\n     歷經908天後達成百萬訂閱(十萬訂閱花了456天/2016年4月11日)\n     是台灣史上第三快的(僅次於聖結石220天與谷阿莫625天)\n\n 三、阿滴英文目前有189部影片,在百萬級頻道中只比這群人多\n    目前發表最多影片的是阿神(2835部),數量約是阿滴的15倍,這群人的22倍\n\n 四、雖然阿滴英文的訂閱數超過百萬,但是觀看次數不到五千萬\n    只有聖結石的四分之一,谷阿莫的七分之一\n   在台灣甚至排不到三十名\n\n 五、阿滴英文是台灣第一個由金牛座創辦的百萬級頻道(1989年5月8日晚上9點)\n     (這群人的尼克生於1988年4月20日,但那年太陽落於雙子座)\n   而且目前台灣的高訂閱youtuber中,幾乎沒有金牛座\n\n   蔡阿嘎(巨蟹)\n   這群人(摩羯/水瓶x2/雙魚/牡羊/雙子/巨蟹/獅子/處女)\n   阿 神(天秤)\n   谷阿莫(摩羯)\n   聖結石(天蠍)\n\n 六、六個百萬級頻道中,只有蔡阿嘎跟谷阿莫從未跟阿滴英文合作過影片\n     不過阿滴採訪過蔡阿嘎,發出合照的當晚IG立刻遭刪除\n\n 七、目前六個百萬級頻道的創辦人\n   都不是公立大學出身\n\n     蔡阿嘎  東吳大學、中國文化大學\n    這群人  國立台灣戲曲學院\n    阿神   明志科技大學\n     谷阿莫    龍華科技大學\n     聖結石    南強高級工商職業學校\n     阿滴      輔仁大學  \n\n 八、阿滴英文是台灣第二個由碩士創辦的百萬級頻道\n   僅次於蔡阿嘎\n\n 九、阿滴英文是台灣第二個由同志天菜創辦的百萬級頻道\n     僅次於阿神\n\n 十、六個百萬級頻道中\n     沒有任何一個創辦人有近視(阿滴與滴妹曾經有但已雷射)\n     而除了阿滴、滴妹外,阿神也常戴無鏡框眼鏡\n\n 十一、六個百萬級頻道中\n     只有谷阿莫沒有在台灣辦過粉絲活動(見面會、簽名會...等)\n\n 十二、六個百萬級頻道中\n     只有阿神還未發表任何出版作品(書、單曲、電影...等)\n\n 十三、台灣目前還沒有任何一個由女性單獨創辦的百萬級頻道\n
## 5: 各位大德晚安\n\n我國少見的清流頻道.阿滴英文(Ray Du English)\n於今日晚間已經確定成為\n台灣第六個訂閱人數超過百萬的Youtube頻道\n也是今年第四個\n\n  1. 蔡阿嘎  (2014.07.09)   146萬  (依達成順序排列)\n  2. 這群人  (2016.08.30)      180萬\n  3. 阿神   (2017.03.13)      114萬\n  4. 谷阿莫  (2017.04.27)      108萬\n  5. 聖結石  (2017.05.29)      115萬\n  6.\n阿滴英文 (2017.07.07)      100萬\n相關資料如下:\n\n 一、阿滴英文是台灣第一個教育類百萬級頻道\n   但是頻道內點閱數最高的那部影片,跟英文/教育完全沒關係\n\n 二、阿滴英文創辦於2015年1月11日\n     歷經908天後達成百萬訂閱(十萬訂閱花了456天/2016年4月11日)\n     是台灣史上第三快的(僅次於聖結石220天與谷阿莫625天)\n\n 三、阿滴英文目前有189部影片,在百萬級頻道中只比這群人多\n    目前發表最多影片的是阿神(2835部),數量約是阿滴的15倍,這群人的22倍\n\n 四、雖然阿滴英文的訂閱數超過百萬,但是觀看次數不到五千萬\n    只有聖結石的四分之一,谷阿莫的七分之一\n   在台灣甚至排不到三十名\n\n 五、阿滴英文是台灣第一個由金牛座創辦的百萬級頻道(1989年5月8日晚上9點)\n     (這群人的尼克生於1988年4月20日,但那年太陽落於雙子座)\n   而且目前台灣的高訂閱youtuber中,幾乎沒有金牛座\n\n   蔡阿嘎(巨蟹)\n   這群人(摩羯/水瓶x2/雙魚/牡羊/雙子/巨蟹/獅子/處女)\n   阿 神(天秤)\n   谷阿莫(摩羯)\n   聖結石(天蠍)\n\n 六、六個百萬級頻道中,只有蔡阿嘎跟谷阿莫從未跟阿滴英文合作過影片\n     不過阿滴採訪過蔡阿嘎,發出合照的當晚IG立刻遭刪除\n\n 七、目前六個百萬級頻道的創辦人\n   都不是公立大學出身\n\n     蔡阿嘎  東吳大學、中國文化大學\n    這群人  國立台灣戲曲學院\n    阿神   明志科技大學\n     谷阿莫    龍華科技大學\n     聖結石    南強高級工商職業學校\n     阿滴      輔仁大學  \n\n 八、阿滴英文是台灣第二個由碩士創辦的百萬級頻道\n   僅次於蔡阿嘎\n\n 九、阿滴英文是台灣第二個由同志天菜創辦的百萬級頻道\n     僅次於阿神\n\n 十、六個百萬級頻道中\n     沒有任何一個創辦人有近視(阿滴與滴妹曾經有但已雷射)\n     而除了阿滴、滴妹外,阿神也常戴無鏡框眼鏡\n\n 十一、六個百萬級頻道中\n     只有谷阿莫沒有在台灣辦過粉絲活動(見面會、簽名會...等)\n\n 十二、六個百萬級頻道中\n     只有阿神還未發表任何出版作品(書、單曲、電影...等)\n\n 十三、台灣目前還沒有任何一個由女性單獨創辦的百萬級頻道\n
##                      artTitle.y    artDate artTime.y  artPoster.y  artCat.y
## 1: [爆卦]阿滴英文突破百萬訂閱! 2017-07-07  05:45:25 gamania10000 Gossiping
## 2: [爆卦]阿滴英文突破百萬訂閱! 2017-07-07  05:45:25 gamania10000 Gossiping
## 3: [爆卦]阿滴英文突破百萬訂閱! 2017-07-07  05:45:25 gamania10000 Gossiping
## 4: [爆卦]阿滴英文突破百萬訂閱! 2017-07-07  05:45:25 gamania10000 Gossiping
## 5: [爆卦]阿滴英文突破百萬訂閱! 2017-07-07  05:45:25 gamania10000 Gossiping
##      cmtPoster cmtStatus                   cmtDate
## 1:   diabolica         → 2017-07-07 13:45:00+00:00
## 2:        winu         → 2017-07-07 13:45:00+00:00
## 3:    hspnvzte        推 2017-07-07 13:46:00+00:00
## 4: HongkaiBoyz        推 2017-07-07 13:46:00+00:00
## 5:    air33456         → 2017-07-07 13:46:00+00:00
##                            cmtContent topic     gamma
## 1:                                :誰     5 0.9993864
## 2: :同時訂閱1~6的人,腦袋到底裝什麼?     5 0.9993864
## 3:        :恭喜阿滴英文!第四名滾喇幹     5 0.9993864
## 4:                                :推     5 0.9993864
## 5:                :會看這些的都是低能     5 0.9993864
# artPoster有兩個欄位(artPoster.x, artPoster.y)取artPoster.x為artPoster
# artDate也有兩個欄位(artDate.x, artDate.y)取artDate.y為artDate
names(posts_Reviews_topic)<-c("artUrl","artTitle.x","artDate.x",
                              "artTime.x","artPoster","artCat.x",    
                              "commentNum","push","boo","sentence",
                              "artTitle.y","artDate","artTime.y",
                              "artPoster.y","artCat.y","cmtPoster",
                              "cmtStatus","cmtDate","cmtContent",
                              "topic","gamma")
names(posts_Reviews_topic)
##  [1] "artUrl"      "artTitle.x"  "artDate.x"   "artTime.x"   "artPoster"  
##  [6] "artCat.x"    "commentNum"  "push"        "boo"         "sentence"   
## [11] "artTitle.y"  "artDate"     "artTime.y"   "artPoster.y" "artCat.y"   
## [16] "cmtPoster"   "cmtStatus"   "cmtDate"     "cmtContent"  "topic"      
## [21] "gamma"
# 挑選出2020/04/01後的文章,
# 篩選有在15篇以上文章回覆者,
# 文章主題歸類為3(疫情)與4(募款)者,
# 欄位只取:cmtPoster(評論者), artPoster(發文者), artUrl(文章連結), topic(主題)
link_topic <- posts_Reviews_topic %>%
              filter(artDate > as.Date('2020-04-01')) %>%
              group_by(cmtPoster, artUrl) %>% 
              filter(n()>15) %>% 
              ungroup() %>% 
              filter(topic == 3 | topic == 4) %>% 
              select(cmtPoster, artPoster, artUrl, topic) %>% 
              unique()
link_topic
## # A tibble: 25 x 4
##    cmtPoster   artPoster    artUrl                                         topic
##    <chr>       <chr>        <chr>                                          <int>
##  1 togs        Wojnarowski  https://www.ptt.cc/bbs/Gossiping/M.1586527943~     3
##  2 pauljet     ghostl40809  https://www.ptt.cc/bbs/Gossiping/M.1586529294~     4
##  3 zold        t77133562003 https://www.ptt.cc/bbs/Gossiping/M.1586569149~     3
##  4 familys     t77133562003 https://www.ptt.cc/bbs/Gossiping/M.1586569149~     3
##  5 jimhall     t77133562003 https://www.ptt.cc/bbs/Gossiping/M.1586569149~     3
##  6 bryan910015 t77133562003 https://www.ptt.cc/bbs/Gossiping/M.1586569149~     3
##  7 winter0723  t77133562003 https://www.ptt.cc/bbs/Gossiping/M.1586569149~     3
##  8 z2wen       HelloP       https://www.ptt.cc/bbs/Gossiping/M.1586583651~     4
##  9 winter0723  HelloP       https://www.ptt.cc/bbs/Gossiping/M.1586583651~     4
## 10 z2wen       Tsuzichen    https://www.ptt.cc/bbs/Gossiping/M.1586595990~     4
## # ... with 15 more rows
# 篩選link_topic中有出現的使用者
filtered_topic_user <- userList %>% filter(user%in%link_topic$cmtPoster | user%in%link_topic$artPoster) %>% arrange(desc(type))
filtered_topic_user
##            user    type
## 1    winter0723 replyer
## 2        senior replyer
## 3     k47100014 replyer
## 4     flysonics replyer
## 5       jimhall replyer
## 6      menshuei replyer
## 7          togs replyer
## 8       st89702 replyer
## 9    Nighty7222 replyer
## 10      pauljet replyer
## 11        z2wen replyer
## 12      familys replyer
## 13  bryan910015 replyer
## 14     alicevvn replyer
## 15       susuqi replyer
## 16   seth582025 replyer
## 17    astrayzip replyer
## 18     y6837660 replyer
## 19  bbalabababa replyer
## 20    linkmusic replyer
## 21      maiarim replyer
## 22  Wojnarowski  poster
## 23  ghostl40809  poster
## 24 t77133562003  poster
## 25       HelloP  poster
## 26 KingChang711  poster
## 27    Tsuzichen  poster
## 28      a435007  poster
## 29    iamgaylan  poster
## 30         zold  poster
## 31       misano  poster
## 32      kylefan  poster

使用者經常參與的文章種類

# 建立網路關係
reviewNetwork <- graph_from_data_frame(d=link_topic, v=filtered_topic_user, directed=F)

# 依據使用者身份對點進行上色
labels <- degree(reviewNetwork)
V(reviewNetwork)$label <- names(labels)
V(reviewNetwork)$color <- ifelse(V(reviewNetwork)$type=="poster", "gold", "lightblue")

# 依據回覆發生的文章所對應的主題,對他們的關聯線進行上色
E(reviewNetwork)$color <- ifelse(E(reviewNetwork)$topic == "3", "lightgreen", "palevioletred")

# 畫出社群網路圖
set.seed(5432)
plot(reviewNetwork, vertex.size=3, edge.width=3, vertex.label.dist=1,
     vertex.label=ifelse(degree(reviewNetwork) > 2, V(reviewNetwork)$label, NA),vertex.label.font=2)

# 加入標示
legend("bottomright", c("發文者","回文者"), pch=21, 
  col="#777777", pt.bg=c("gold","lightblue"), pt.cex=1, cex=1)

legend("topleft", c("疫情","募款"), 
       col=c("lightgreen","palevioletred"), lty=1, cex=1)

可以看出帳號“t77133562003”、“misano”、“a435007”所發的文章多在討論疫情相關的主題,而帳號“Tsuzichen”所發的文章則多在討論募款相關的主題。

結論(二)

延續期中的結論,阿滴在八卦版上長期雖然都有被評論的文章,但評論內容仍與阿滴本身特質無關,比較偏向是他額外所做的事情上。根據分析結果,阿滴的討論熱度仍僅於今年4月時因募資事件達到高峰,而之後5月初進行第二波與國際網紅合作廣宣的事情,卻鮮少被討論,研判可能是鄉民不認為阿滴可以代表台灣做這件事情,因此5月討論阿滴的熱度就很低。另外從social network的主要發文者網絡圖中,僅剩帳號“Tsuzichen”持續po與“募資”相關的文章。