資料描述

  • 爬蟲主題 : Ptt Movie 版
  • 文章時間 : 2020-01-01 ~ 2020-06-30
  • 總篇數:7620篇

系統設置

packages = c("jiebaR", "tm", "tmcn", "dplyr", "tidytext", "ggplot2", "wordcloud2", "rvest","stringr","dygraphs","knitr")
existing = as.character(installed.packages()[,1])
for(pkg in packages[!(packages %in% existing)]) install.packages(pkg)
#載入packages
library(rvest)
library(httr)
library(jiebaR)
library(tm)
library(tmcn)
library(dplyr)
library(tidytext)
library(stringr)
library(ggplot2)
library(dygraphs)
library(wordcloud2)
library(knitr)
library(kableExtra)

資料預處理

網路爬蟲:抓取資料

  • 使用工具 : google擴充功能-SelectorGadget

SelectorGadget 是 Google Chrome 瀏覽器的一個外掛工具,可以用來顯示網頁中任意元素的 CSS 選擇器路徑,幫助我們快速擷取網頁上的資料。

在使用網路爬蟲時,有些時候網頁的url並不一定具有規則,Ptt就是其中一個例子。所以我們可以先從每一頁列表中抓取各網站的url,再利用這些爬到的url去做網路爬蟲。

all_url_page = paste0('https://www.ptt.cc/bbs/movie/index',8655:9036,'.html') 
all_url_data = c(); recom=c(); title=c(); date=c()

#爬每一篇文章的url,每一頁的推文數、標題及日期
for(i in 1:length(all_url_page)){
  all_url_data = c(all_url_data, read_html (all_url_page[i]) %>% 
                     html_nodes(css = ".title a") %>% html_attr('href'))
  recom = c(recom,read_html(all_url_page[i]) %>% html_nodes(css = ".nrec") %>% html_text())
  title = c(title, read_html(all_url_page[i]) %>% html_nodes(css = ".title a") %>% html_text())
  date = c(date, read_html(all_url_page[i]) %>% html_nodes(css = ".date") %>% html_text())
  if(i %% 30 == 0) Sys.sleep(runif(1,2,5))
}

my_data<- data.frame(recom,date,title)
  • trycatch 函數

R 軟體用於實務分析時,若程式中某些地方發生錯誤,整個R 程式往往就會停在出錯的地方,對於大型應用程式而言會造成很多困擾。此時,R 軟體的tryCatch函數可以協助偵測並解決 R 程式遇到錯誤時被強迫終止的問題,可讓出錯程式碼其他的程式繼續執行。

all_url_data<- paste0('https://www.ptt.cc',all_url_data)

#抓每一篇文章內容
content=c()

for(i in 1:length(all_url_data)){
  tryCatch({content <- c(content,read_html(all_url_data[i]) %>% html_nodes(css = "#main-content") %>% html_text())
  if(i %% 30 == 0) Sys.sleep(runif(1,2,5))
  cat(i,"\n")},error=function(err){
    message("Original error message:",i)
    message(paste0(err,"\n"))
    return(i=i+1)}
  )}
## Original error message : 2029
## Error in open.connection(x, "rb"): HTTP error 404.
## Original error message : 2859
## Error in open.connection(x, "rb"): HTTP error 404.
  • 刪除非有效的URL
my_data <- my_data[-c(2029,2859),] #刪除無網址的資訊
my_data <- cbind(my_data,data.frame(content=content[1:7638]))
my_data <- my_data[-c(7621:7638),] #刪除7月的資訊

清理文章內容

content_ques <- my_data$content %>% gsub(pattern = "作者.+:[0-9]{2}\\s[0-9]{4}?",., replacement = "") %>% # 去頭 
gsub(pattern = "(\n--\n※).+",., replacement = "")  # 去尾
content_ques <- content_ques %>%
  gsub(pattern = "(http|https)://[a-zA-Z0-9./?=_-]+",., replacement = "") %>% #去除網頁
  gsub(pattern = "引述《[a-zA-Z0-9./_()].+》之銘言",., replacement = "") %>% #去除引述
  gsub(pattern = "Sent from [a-zA-Z0-9 -./_()]+",., replacement = "") %>% #去除Sent from
  gsub(pattern = "<U[a-zA-Z0-9 +]+>",., replacement = "") %>% #去除光碟
  gsub(pattern = "[0-9]{4}/[0-9]{2}/[0-9]{2}",., replacement = "") %>% #去除日期格式:2020/01/16
  gsub(pattern = "[0-9]{4}-[0-9]{2}-[0-9]{2}",., replacement = "") %>% #去除日期格式:2020-01-16
  gsub(pattern = "[0-9]{4}年[0-9]{1,2}月[0-9]{1,2}日",., replacement = "") %>% #去除日期格式:2020年1月16日
  gsub(pattern = "[0-9]{1,2}/[0-9]{1,2}",., replacement = "") %>% #去除日期格式:01/22
  gsub(pattern = "[0-9]{1,2}-[0-9]{1,2}",., replacement = "") %>% #去除日期格式:01-22
  gsub(pattern = "[0-9]{1,2}月[0-9]{1,2}日",., replacement = "") %>% #去除日期格式:01月22日
  gsub(pattern = "[0-9]{2}:[0-9]{2}",., replacement = "") %>% #去除時間
  gsub(pattern = "新聞網址",., replacement = "") %>% 
  gsub(pattern = "\n",., replacement = "") %>% # 清理斷行符號
  gsub(pattern = "[/_.★↑|▲△~─→──┐─╱┘●※]+?",.,replacement = "")

content_ques = removePunctuation (content_ques,ucp=T) #去除全形標點符號
content_ques = removePunctuation(content_ques) #去除半形標點符號
content_ques = stripWhitespace(content_ques) #去除空白

my_data = cbind(my_data,content_ques)

清理標題內容

title_clear <-  my_data$title %>%
  gsub(pattern = "\\[.+?\\]",., replacement = "") %>% 
  gsub(pattern = "Fw",., replacement = "") %>%
  gsub(pattern = "Re",., replacement = "") %>% 
  gsub(pattern = "[0-9]{1,2}/[0-9]{1,2}",., replacement = "") %>%
  gsub(pattern = "[0-9]{2}:[0-9]{2}",., replacement = "") %>%
  removePunctuation (.,ucp=T) %>% 
  stripWhitespace() 

my_data = cbind(my_data,title_clear)

資料預覽

kable(head(my_data)) %>% kable_styling(bootstrap_options = c("striped", "hover", "condensed", "responsive")) %>% scroll_box(height="200px")
recom date title content content_ques title_clear
29 1/1 [討論] 為何較為開放的美國分級制度比台灣嚴格??

作者filmystery (P.B. take me to the US)看板movie標題[討論] 為何較為開放的美國分級制度比台灣嚴格??時間Wed Jan 1 20:21:21 2020 小魯前陣子觀察到一個怪異的現象 就是美國的電影分級制度竟然比台灣還要來得嚴格

比方說

  1. 小丑

美國 R-18 片長122分 https://www.imdb.com/title/tt7286456/?ref_=nv_sr_srsg_0

台灣 輔15 片長121分(我認為美國片長可能是四捨五入或無條件進位,並非被剪掉) http://www.wdful.com.tw/Home/timetable_detail/113

  1. 好小男孩

美國 PG-12 片長90分 https://www.imdb.com/title/tt7343762/?ref_=nv_sr_srsg_0

台灣 護6 片長89分(我認為跟小丑的片長一樣處理方式) http://www.wdful.com.tw/Home/timetable_detail/111

  1. 靈異大逆轉

美國 R 片長112分 https://www.imdb.com/title/tt0219699/?ref_=nm_flmg_act_61

台灣 輔12 片長111分(我認為跟小丑的片長一樣處理方式) http://app2.atmovies.com.tw/film/fGatm0905006/

即便各地民情條件不同,分級可能會因地制宜 但美國比起台灣,民情明顯比較開放 為何美國的分級制度會比台灣來得嚴格??

就拿<靈異大逆轉>來說好了 當時我在MOD看的 它分級是輔12 連輸入密碼都不用就可以直接看

結果片中有露點的場面 當時我覺得納悶 但查IMDB卻是限制級

這究竟是怎麼回事啊??

註: 片長的差異我認為是無條件進位或四捨五入所造成 並非剪片所造成 所以因為剪片導致分級差異的可能我認為不存在

[EASY] <沒刷到,輸了比賽又如何??> by 西河 https://www.ptt.cc/bbs/NBAEasyChat/M.1524387878.A.88A.html [EASY] <從頭> by 姆斯 https://www.ptt.cc/bbs/NBAEasyChat/M.1527827095.A.72F.html [KUSO] <任期BAN不見> by XDD https://www.ptt.cc/bbs/joke/M.1519739998.A.E89.html

※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.246.26.12 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/movie/M.1577881325.A.321.html 推 likeaprayer : R級17歲以下有監護人陪同就能看了 01/01 20:23 → JuiFu617 : 看似嚴格,實則寬鬆 01/01 20:25 → qazxswptt : 台灣補充過後的分級級距也跟美國差不多了 01/01 20:28 → qazxswptt : 但中間的分級感覺實行上蠻模糊的 01/01 20:29 推 KYLAT : 美國分級制度對於“髒話”的部分很嚴格,記得沒錯PG 01/01 20:44 → KYLAT : -13的電影全片只能出現一次“Fuck” 01/01 20:44 → JuiFu617 : 結果美國父母整天在家講F開頭髒話 01/01 20:46 推 zonbytai : 民情開放的美國是好萊塢讓你看到的美國,去聖經帶轉 01/01 20:53 → zonbytai : 轉可以看到另一半有著中世紀價值觀的美國 01/01 20:53 → webster1112 : 人家宣誓都摸著聖經的 台灣政客都在媽祖廟唬爛 01/01 21:00 推 chyx741021 : 美國的R級接近輔15,NC-17才像我們的限制級 01/01 21:08 推 raura : 推一樓!我當初以為R級=限制級,結果看別人在美國看 01/01 21:36 → raura : 小丑心得,有美國爸媽帶小孩去看,因為有監護人就行 01/01 21:37 推 hellodio : 樓上正解,R級不是臺灣的限制級,較接近輔15 01/01 21:37 推 ultmisia : 欸你不知道美國人對未成年人保護超嚴格的。甚至其 01/01 21:38 → ultmisia : 監護人都能被迫留職停薪去輔導 01/01 21:38 → likeaprayer : 因為NC-17是幾乎鮮少使用的分級 商業片都不可能 01/01 21:39 → likeaprayer : 多數戲院拒播NC-17電影 色戒在北美就是NC-17 01/01 21:39 → likeaprayer : 但在台灣頂多排片不利而已 不會被拒播 01/01 21:42 → likeaprayer : 所以在台灣還能看到票房不錯的限制級電影 01/01 21:42 → likeaprayer : 但在北美沒有任何賣座的NC-17電影 01/01 21:42 推 GAIEGAIE : 美國開放?想太多了 保守天主教思維還是根深蒂固引 01/01 21:46 → GAIEGAIE : 響整個社會 不要把戲劇呈現的世界當真實美國社會 01/01 21:46 → likeaprayer : 美國不同地區的思想觀念 幾乎像兩個世界的差異 01/01 21:47 → likeaprayer : 而且還不是極端少數人口 是佔相當高比例保守帶+農村 01/01 21:48 推 sasewill : 你美國分級都亂講,當然以為比較嚴 01/01 21:53 → lpbrother : 因為台灣的電影分級根本是少數人決定,也沒有固定 01/01 22:00 → lpbrother : 標準,浮動的情況很大 01/01 22:00 推 Terminals : 好萊塢電影只是一小部分的美國,甚至它只是電影。 01/01 22:00 推 orzisme : 美國的聖經帶區域很保守…話說台灣的標準,對暴力 01/01 22:03 → orzisme : 也很寬鬆,但對情色裸露尺度就滿嚴格的… 01/01 22:03 推 poopooShaw : 他們R級是家長陪同可以看的 01/01 22:13 推 busman214 : 因為台灣人看完電影頂多打打嘴砲而已 可是美國人有 01/01 22:27 → busman214 : 槍啊… 01/01 22:27 → C4F6 : 清教徒國家,信教的神經病比台灣還多 01/01 22:33 推 ARCHER2234 : 而且台灣可以剪掉吧?XD 01/01 22:50

我文中舉的那三片幾乎沒有剪片問題 只差一分鐘耶 我猜那應該是無條件進位造成的 (當然也有可能觸犯尺度的畫面只有幾秒而已,這也不是不可能啦)

比方說 精準片長為100分鐘15秒,可能會直接算成101分鐘

※ 編輯: filmystery (111.246.26.12 臺灣), 01/01/2020 22:57:09 推 rainwen : 美國對成年很開放,但對未成年保護很嚴格,18歲可以 01/01 22:56 → rainwen : 拍AV,但不能喝酒(要滿21),今年可能連吸菸年齡限制 01/01 22:56 → rainwen : 都要全面提高到21。 01/01 22:56 ※ 編輯: filmystery (111.246.26.12 臺灣), 01/01/2020 23:00:09 推 lirick42 : 美國很嚴 01/01 23:05 推 sleepyrat : 台灣的輔15+是從原來限制級分出來的 01/01 23:10 → GSHARP : 表面很矜持,骨子裡很變態的清教徒 01/01 23:52 → qazxswptt : 美國很注重孩子的保護 至少制定面是那樣 01/02 00:37 推 Jeff1987 : 看樣子問題出在你對美國分級的了解 01/02 00:55 → iamcrazy2 : 要比就比A片拉 01/02 02:51 推 jimhall : 美國其實很保守 01/02 03:29 推 GentleGiant : 美國很保護未成年 可是說實在執行面還是看各家了 01/02 04:07 推 vking223 : 因為美國露點很普遍。另外一個全球最大色情站有趣 01/02 06:30 → vking223 : 的調查,保守黨傾向的人點閱SM的內容,反而超過其他 01/02 06:30 → vking223 : 人 01/02 06:30 推 rifinah : 美國是清教徒創立的 你覺得呢? 01/02 06:50 推 chanceiam : 視界戰也是啊!也有修幹的畫面很多 01/02 08:41 推 jerrykuo0518: 美國骨子裡就是一群清教徒建立的國家 01/02 14:45 → james885 : 美國的R級不等於台灣的限制級,比較接近輔15。 01/02 14:47 → james885 : 美國戲院R級只要有家長陪同六歲小朋友也可以去看~ 01/02 14:49 → james885 : 美國真正的限制級NC-17,反而沒有戲院會願意放 01/02 14:51 → james885 : 好萊塢也很少拍出NC-17的電影,基本上就是賺不了錢 01/02 14:53 推 abcd425heart: 台灣信基督教只是各種宗教的一種 01/02 20:16 → abcd425heart: 美國幾乎就分成留在教會和離開教會的人 01/02 20:17 推 abcd425heart: 教會保守程度也差很大,中南部很多州比護家盟還誇張 01/02 20:21 推 redzon : 因為美國沒有較開放啊,你認真誤會大了 01/02 21:02 推 wenhuanorman: 雖然我不覺得提早看這些內容有什麼不好,但好小男孩 01/02 22:09 → wenhuanorman: 給到保護級真的很扯,未免也太鬆了 01/02 22:09 → raura : NC-17在90年代剛出來時,感覺不少導演想挑戰 01/03 01:11 → raura : 因為反而能變話題,現在反而沒聽過誰用NC-17當噱頭 01/03 01:13 推 gogohell2003: 就因為開放 所以該限制的地方不會手軟 01/03 11:17
小魯前陣子觀察到一個怪異的現象就是美國的電影分級制度竟然比台灣還要來得嚴格比方說1 小丑美國 R18 片長122分台灣 輔15 片長121分我認為美國片長可能是四捨五入或無條件進位並非被剪掉2 好小男孩美國 PG12 片長90分台灣 護6 片長89分我認為跟小丑的片長一樣處理方式3 靈異大逆轉美國 R 片長112分台灣 輔12 片長111分我認為跟小丑的片長一樣處理方式即便各地民情條件不同分級可能會因地制宜但美國比起台灣民情明顯比較開放為何美國的分級制度會比台灣來得嚴格就拿靈異大逆轉來說好了當時我在MOD看的它分級是輔12連輸入密碼都不用就可以直接看結果片中有露點的場面當時我覺得納悶但查IMDB卻是限制級這究竟是怎麼回事啊註片長的差異我認為是無條件進位或四捨五入所造成並非剪片所造成所以因為剪片導致分級差異的可能我認為不存在EASY 沒刷到輸了比賽又如何 by 西河EASY 從頭 by 姆斯KUSO 任期BAN不見 by XDD 為何較為開放的美國分級制度比台灣嚴格
1 1/1 [好雷] 鋒迴路轉:猜不到犯案手法的偵探片

作者ck0413 (黑咖啡)看板movie標題[好雷] 鋒迴路轉:猜不到犯案手法的偵探片時間Wed Jan 1 20:27:54 2020 《鋒迴路轉》是近幾年在西班牙燒腦電影《佈局》後最有層次與野心的原創偵探劇本,在眾多看似理所當然的線索,甚至是提早揭露謎團結局的情況下,依然可以將觀眾耍得團團轉,以一波未平一波又起的驚喜海嘯滋潤偵探迷渴望解謎的腦袋。接下來的有雷影評將分析為何這是一部值得偵探迷收藏的原創經典!建議看完電影後再閱讀本文喔!

>>網誌圖文好讀版:https://seriescoffee.pros.is/P3BQP

------------~

~~~~~~~~~~~~~~~~~~~ 雷文 主文分隔線 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~

《鋒迴路轉》是少見的原創劇本故事,從這點就可以看出製作團對的信心與野心,他們不需要依靠任何現有知名偵探 IP 的協助,就能以好故事本身吸引觀眾,而截至目前為止的票房表現也印證了他們的想法。雖然不改編自任何現有故事,但忠實的偵探影迷與書迷一定可以從《鋒迴路轉》上看到我們熟悉的經典的影子:發生在單一地點的密室謀殺案與所有人都有嫌疑的設定像「推理之后」克莉絲汀的經典劇情、充滿自性又愛搞神祕賣關子的私家偵探像是柯南道爾的福爾摩斯個性、死者是推理作家的背景更是向所有古典與現代的作品致敬。

《鋒迴路轉》的龐大野心與自信展現在劇情的鋪排方式,從偵探白朗對的家族嫌疑人訪談開始,這一切都像是一般的偵探片進行著,但揭露這是一場看似自殺的密室殺人案之後,整個風味就變了,觀眾的腦袋也開始漸漸跟不上編劇的魔幻手法。通常密室殺人的謎團在公開之後,偵探主角的行為是調查這「不可能犯罪」的矛盾點,找出所謂「密室」的破綻,但《鋒迴路轉》卻大膽地馬上公開死者死去當下的一切畫面,剝奪了「解密室」的樂趣。死者哈蘭布雷在死前和自己的醫療看護瑪莎一起下棋,然而當瑪莎替他注射藥物時,卻意外搞混了嗎啡與消炎藥的劑量,哈蘭為了讓瑪 莎全身而退,當機立斷替她編出一套天衣無縫的劇本,並親手切開自己的喉嚨,創造一個難解的密室殺人現場。

當「如何殺人」這個多數偵探故事的終極謎團一開始就被解答後,讓人疑惑的是《鋒迴路轉》還能怎樣創造謎團來驚喜觀眾?尤其這場「殺人」是被害者一手策劃的,那麼這起意外事件真的有兇手嗎?這個問題自然而然地引導我們思考:「如果沒有兇手的話,那偵探在這裡做什麼?」於是白朗在此時放出另一個謎,一個未知的人物雇用了他調查事件,現在劇情的張力注重在他如何抓住瑪莎意外毒死哈蘭布雷的證據。

但這一切其實都是編劇的煙幕彈,真相並不是這麼簡單,因為這起意外就這樣恰巧地發生在哈蘭布雷和四位親人斷絕關係的晚上,而白朗身為一個偵探(與觀眾身為一個偵探迷),絕對不能相信巧合。這起意外是人為的意外,在瑪莎描述的一切細節中,可能出錯的關鍵就是打藥的時機,如果真兇事先將藥動了手腳,那麼他就有可能借瑪莎的手殺了哈蘭。《鋒迴路轉》將觀眾引導到這一步時已經贏了我們,因為同時有太多因素要考慮,只好跟著劇情走慢慢看,完全沒有辦法先一步猜到真相,在這個時機點下要思考的有:兇手如何對藥動手腳?瑪莎實際上將兩種藥打反了,兇手 能預測到這件事嗎?如果不能的話,他是如何執行計畫的?被斷絕關係的四個人都有動機,又是誰可以動手?

接下來劇情再度超展開,哈蘭的遺囑公布他要將所有財產贈與看護瑪莎,而非任何一位家族成員,這下子瑪莎突然也有了動機,讓我們可以懷疑只要她事先知道遺囑的話,可以假裝搞混藥品毒殺哈蘭,提早獲得遺產。但編劇更狡猾的是,將這個嫌疑人設定為恭儉善良的好角色,又是個無法說謊的超誠實體質,她怎麼樣都不可能會是預謀的兇手。於是我們只能將嫌疑歸到原本幾乎不參與家族事務的無業貴公子蘭森,他沒有來由地突然要幫助瑪莎逃離其他家族成員的騷擾,突如其然的舉動足以讓我們懷疑他的真實意圖,但如果他是真兇的話手法依然成謎。 就當我們逐漸接近真相時,《鋒迴路轉》再度丟出第三幕結局前的煙幕彈,在這錯綜複雜的關係情況下出現了一位勒索者,他似乎知道哈蘭的真實死因和毒藥有關,為了求封口費將血液報告的正本部分寄給瑪莎威脅她,而此時蘭森是在她身邊協助她的人,所以是不是兇手是另一位熟知蘭森與瑪莎行為的家族成員呢?黑函者的身份很快地揭露了,於是劇情開始加速不讓觀眾有機會現場分析,讓白朗這位偵探大顯身手,替我們找出這起事件中沒有解釋的漏洞。

《鋒迴路轉》最終揭露蘭森為真兇,以及他的作案手法時,真的刷新了我對於偵探電影的想像,非常少有偵探作品的兇手是臨機應變不斷改變策略的,這種因時制宜改變計謀的方式讓人更難從原本的既有資訊猜出結局,因為變數實在太多。蘭森原有的暗殺計畫泡湯後,改變陷害瑪莎的方式,試圖再將管家弗蘭的命也栽在她身上,將她的形象打造成一個為了錢財逃跑的貪婪移民,最後再以「繼承者不能為謀殺犯」的法律規定奪回繼承財產。蘭森沒有料到瑪莎會打錯藥,但有辦法將白朗聘來調查瑪莎,並一步步地栽贓她,讓自己繼續躲在幕後。

蘭森唯一沒有想到的是瑪莎發現弗蘭後的善良表現,她沒有拿了藥物報告就跑,也沒有放任這個可能會害了她的人死去,她的良心成了最後擊敗蘭森的關鍵。白朗在公開真相的橋段是《鋒迴路轉》中最刺激也最令人專注的十幾分鐘,一個又一個的意想不到一口氣將謎團吹散,一直到最後蘭森試圖刺殺瑪莎的瞬間都令人目不轉睛屏氣凝神!真的是值得偵探迷收藏的峰迴路轉故事呀!

最後,《鋒迴路轉》除了劇情精彩令人難忘以外,老戲骨新戲精齊聚大飆戲更是一大看點,有現任 007 丹尼爾克雷格、美國隊長克里斯伊凡、奧斯卡影帝克里斯多夫柏麥、《月光光心慌慌》的演技派老演員潔美李寇蒂斯、多次提名奧斯卡男配角的麥可夏儂、因為《漢娜的遺言》爆紅的凱瑟琳蘭馥 、以及靠《牠》嶄露頭角的年輕演員傑登里柏赫,眾星雲集的對手戲讓這部以對白為主的電影格外精彩!

>>網誌圖文好讀版:https://seriescoffee.pros.is/P3BQP

歡迎參訪我的部落格:) 黑咖啡聊美劇Blog:http://www.blackcoffeeseries.com 黑咖啡聊美劇FB:https://www.facebook.com/seriescoffee
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 27.125.137.160 (新加坡) ※ 文章網址: https://www.ptt.cc/bbs/movie/M.1577881680.A.A34.html 推 jc165 : 瑪莎?瑪塔? 02/18 15:19 推 NaRaDeer : 好影評 03/28 12:30
鋒迴路轉是近幾年在西班牙燒腦電影佈局後最有層次與野心的原創偵探劇本在眾多看似理所當然的線索甚至是提早揭露謎團結局的情況下依然可以將觀眾耍得團團轉以一波未平一波又起的驚喜海嘯滋潤偵探迷渴望解謎的腦袋接下來的有雷影評將分析為何這是一部值得偵探迷收藏的原創經典建議看完電影後再閱讀本文喔網誌圖文好讀版 雷文 主文分隔線 鋒迴路轉是少見的原創劇本故事從這點就可以看出製作團對的信心與野心他們不需要依靠任何現有知名偵探 IP 的協助就能以好故事本身吸引觀眾而截至目前為止的票房表現也印證了他們的想法雖然不改編自任何現有故事但忠實的偵探影迷與書迷一定可以從鋒迴路轉上看到我們熟悉的經典的影子發生在單一地點的密室謀殺案與所有人都有嫌疑的設定像推理之后克莉絲汀的經典劇情充滿自性又愛搞神祕賣關子的私家偵探像是柯南道爾的福爾摩斯個性死者是推理作家的背景更是向所有古典與現代的作品致敬鋒迴路轉的龐大野心與自信展現在劇情的鋪排方式從偵探白朗對的家族嫌疑人訪談開始這一切都像是一般的偵探片進行著但揭露這是一場看似自殺的密室殺人案之後整個風味就變了觀眾的腦袋也開始漸漸跟不上編劇的魔幻手法通常密室殺人的謎團在公開之後偵探主角的行為是調查這不可能犯罪的矛盾點找出所謂密室的破綻但鋒迴路轉卻大膽地馬上公開死者死去當下的一切畫面剝奪了解密室的樂趣死者哈蘭布雷在死前和自己的醫療看護瑪莎一起下棋然而當瑪莎替他注射藥物時卻意外搞混了嗎啡與消炎藥的劑量哈蘭為了讓瑪莎全身而退當機立斷替她編出一套天衣無縫的劇本並親手切開自己的喉嚨創造一個難解的密室殺人現場當如何殺人這個多數偵探故事的終極謎團一開始就被解答後讓人疑惑的是鋒迴路轉還能怎樣創造謎團來驚喜觀眾尤其這場殺人是被害者一手策劃的那麼這起意外事件真的有兇手嗎這個問題自然而然地引導我們思考如果沒有兇手的話那偵探在這裡做什麼於是白朗在此時放出另一個謎一個未知的人物雇用了他調查事件現在劇情的張力注重在他如何抓住瑪莎意外毒死哈蘭布雷的證據但這一切其實都是編劇的煙幕彈真相並不是這麼簡單因為這起意外就這樣恰巧地發生在哈蘭布雷和四位親人斷絕關係的晚上而白朗身為一個偵探與觀眾身為一個偵探迷絕對不能相信巧合這起意外是人為的意外在瑪莎描述的一切細節中可能出錯的關鍵就是打藥的時機如果真兇事先將藥動了手腳那麼他就有可能借瑪莎的手殺了哈蘭鋒迴路轉將觀眾引導到這一步時已經贏了我們因為同時有太多因素要考慮只好跟著劇情走慢慢看完全沒有辦法先一步猜到真相在這個時機點下要思考的有兇手如何對藥動手腳瑪莎實際上將兩種藥打反了兇手能預測到這件事嗎如果不能的話他是如何執行計畫的被斷絕關係的四個人都有動機又是誰可以動手接下來劇情再度超展開哈蘭的遺囑公布他要將所有財產贈與看護瑪莎而非任何一位家族成員這下子瑪莎突然也有了動機讓我們可以懷疑只要她事先知道遺囑的話可以假裝搞混藥品毒殺哈蘭提早獲得遺產但編劇更狡猾的是將這個嫌疑人設定為恭儉善良的好角色又是個無法說謊的超誠實體質她怎麼樣都不可能會是預謀的兇手於是我們只能將嫌疑歸到原本幾乎不參與家族事務的無業貴公子蘭森他沒有來由地突然要幫助瑪莎逃離其他家族成員的騷擾突如其然的舉動足以讓我們懷疑他的真實意圖但如果他是真兇的話手法依然成謎就當我們逐漸接近真相時鋒迴路轉再度丟出第三幕結局前的煙幕彈在這錯綜複雜的關係情況下出現了一位勒索者他似乎知道哈蘭的真實死因和毒藥有關為了求封口費將血液報告的正本部分寄給瑪莎威脅她而此時蘭森是在她身邊協助她的人所以是不是兇手是另一位熟知蘭森與瑪莎行為的家族成員呢黑函者的身份很快地揭露了於是劇情開始加速不讓觀眾有機會現場分析讓白朗這位偵探大顯身手替我們找出這起事件中沒有解釋的漏洞鋒迴路轉最終揭露蘭森為真兇以及他的作案手法時真的刷新了我對於偵探電影的想像非常少有偵探作品的兇手是臨機應變不斷改變策略的這種因時制宜改變計謀的方式讓人更難從原本的既有資訊猜出結局因為變數實在太多蘭森原有的暗殺計畫泡湯後改變陷害瑪莎的方式試圖再將管家弗蘭的命也栽在她身上將她的形象打造成一個為了錢財逃跑的貪婪移民最後再以繼承者不能為謀殺犯的法律規定奪回繼承財產蘭森沒有料到瑪莎會打錯藥但有辦法將白朗聘來調查瑪莎並一步步地栽贓她讓自己繼續躲在幕後蘭森唯一沒有想到的是瑪莎發現弗蘭後的善良表現她沒有拿了藥物報告就跑也沒有放任這個可能會害了她的人死去她的良心成了最後擊敗蘭森的關鍵白朗在公開真相的橋段是鋒迴路轉中最刺激也最令人專注的十幾分鐘一個又一個的意想不到一口氣將謎團吹散一直到最後蘭森試圖刺殺瑪莎的瞬間都令人目不轉睛屏氣凝神真的是值得偵探迷收藏的峰迴路轉故事呀最後鋒迴路轉除了劇情精彩令人難忘以外老戲骨新戲精齊聚大飆戲更是一大看點有現任 007 丹尼爾克雷格美國隊長克里斯伊凡奧斯卡影帝克里斯多夫柏麥月光光心慌慌的演技派老演員潔美李寇蒂斯多次提名奧斯卡男配角的麥可夏儂因為漢娜的遺言爆紅的凱瑟琳蘭馥 以及靠牠嶄露頭角的年輕演員傑登里柏赫眾星雲集的對手戲讓這部以對白為主的電影格外精彩網誌圖文好讀版歡迎參訪我的部落格黑咖啡聊美劇Blog黑咖啡聊美劇FB 鋒迴路轉猜不到犯案手法的偵探片
2 1/1 [討論] 鋒迴路轉小疑問(有雷)

作者bightw24261 (程哥)看板movie標題[討論] 鋒迴路轉小疑問(有雷)時間Wed Jan 1 20:32:13 2020 剛看完電影回來,最後一段有點恍神了想請教一下:最後蘭森刺向瑪塔前,瑪塔吐了,為什 麼啊?

– ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.71.213.156 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/movie/M.1577881935.A.3BC.html → kent88ch : 騙他還沒死 01/01 20:40 推 KYLAT : 因為女傭已經死了,所以女主角才要騙說她還活著, 01/01 20:41 → KYLAT : 讓藍森自己招供 01/01 20:41 → bightw24261 : 騙他法蘭還沒死嗎? 01/01 20:42 → bightw24261 : 喔喔,謝謝樓上 01/01 20:43 推 hongdot804 : 幫法蘭QQ 01/01 22:22
剛看完電影回來最後一段有點恍神了想請教一下最後蘭森刺向瑪塔前瑪塔吐了為什麼啊 鋒迴路轉小疑問有雷
1/1 [好雷] 光看武戲就值得的葉問4

作者Hanklaw (Hank)看板movie標題[ 好雷] 光看武戲就值得的葉問4時間Wed Jan 1 21:11:18 2020 1~3都有看

第1集覺得很新鮮又有故事性 看了超爽

第2~3就開始有點覺得梗有點膩了

既然是完結篇 自然還是乖乖到電影院報到

------------~

~~~~~~~~~~~~~~~~~~~ 雷文 主文分隔線 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~

本作的劇情部分明顯跟前兩集一樣是稍微薄弱了點

親情部分雖然有特別描繪父子關係的變化 但蠻普通的 沒什麼特別印象

主線的衝突點 更是有點牽強且單薄 就一個美軍海陸看不爽中國功夫

來唐人街找碴找架打而已

But 就是這個But

即使劇情不是很優 本片光看打戲就值回票價了阿

看那拳拳到肉的震撼感 機關槍連拳 各種戳眼 踢蛋 鎖喉

把剛剛囂張跋扈的大隻肌肉男打趴就是爽啊

套一句朋友的話

我看葉問 就是要看他一本正經的揍人才爽啊

– ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 123.194.165.50 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/movie/M.1577884281.A.BAC.html 推 theskyofblue: 只看124 覺得4蠻好看的 01/01 22:14 噓 qoo4628802 : 到底哪裏好看阿 李小龍在街頭打架那裏我以為我在玩 01/02 00:33 → qoo4628802 : 人中之龍 BOSS出來還威嚇一下 有夠蝦XDDD 01/02 00:34 → kc9420 : 踢蛋戳眼 葉問漸漸嘴綠化… 01/05 21:01
13都有看第1集覺得很新鮮又有故事性 看了超爽第23就開始有點覺得梗有點膩了既然是完結篇 自然還是乖乖到電影院報到 雷文 主文分隔線 本作的劇情部分明顯跟前兩集一樣是稍微薄弱了點親情部分雖然有特別描繪父子關係的變化 但蠻普通的 沒什麼特別印象主線的衝突點 更是有點牽強且單薄 就一個美軍海陸看不爽中國功夫來唐人街找碴找架打而已But 就是這個But即使劇情不是很優 本片光看打戲就值回票價了阿看那拳拳到肉的震撼感 機關槍連拳 各種戳眼 踢蛋 鎖喉把剛剛囂張跋扈的大隻肌肉男打趴就是爽啊套一句朋友的話我看葉問 就是要看他一本正經的揍人才爽啊 光看武戲就值得的葉問4
20 1/1 [討論] 返校1月15要上映

作者rook18ies (天天一天)看板movie標題[討論] 返校1月15要上映時間Wed Jan 1 21:18:09 2020 https://i.imgur.com/DEpSg9E.jpg catchplay獨家上映 2019 金馬獎 最佳美術設計 最佳視覺效果 最佳新導演徐漢強 最佳原創電影歌曲 最佳改編劇本

沒想到這麼快就可以租到片,剛好可以跟家人一起看

– ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.161.249.9 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/movie/M.1577884691.A.4DE.html → Camjar : 正在二輪戲院上映中喔!! 01/01 21:22 推 pttnowash : 我上次看完返校後 01/01 21:23 → y35246357468: 就被魏仲廷X到失智 01/01 21:35 → r50693 : MOD沒有嗎 QQ 01/01 21:54 推 KeithWei : 緯來電影台大年初一(1/25)晚上9點首播 01/01 21:59 → leekuki : MOD目前只有返校“日” 01/01 22:15 推 dragon50119 : 電視台也太快! 陽光普照也是月底要上Netflix 01/01 22:36 推 wafiea708 : 香港上映票房超過700萬了 馬來西亞好像1月9號要上映 01/01 23:04 → speed2 : 2輪看過了 真的是很普通的片 除了男主角很帥 就沒了 01/01 23:27 推 QQ145 : 帶小孩都沒時間進戲院,我ㄧ直想看這部! 01/02 01:29 → iamcrazy2 : 爛片 01/02 02:50 推 winteryoyo : 我要看免費的 01/02 03:24 推 natsunoumi : 最近看聲優玩返校的遊戲實況 感覺很恐怖 01/02 04:22 推 dudu1987 : 難看 01/02 05:41 推 silense : 真的是蠻好的作品 01/02 06:50 推 noah23 : 跟曖昧女生看完這部後就交往了 推推 01/02 12:36 → HelpMeQQ : 尷尬又難看 不推 01/02 13:59 推 goodday123 : 好想看啊~~~~~ 01/02 15:13 推 evilgenius : 超難看……… 01/02 15:33 推 GRIPIT : 遊戲照搬演電影,超難看 01/02 16:38 推 GodEyes : 國片通常都很快就上第四台了 01/02 18:05 推 blackknight : MOD也是1/15 01/02 18:28 推 uno48 : 說難看的給我去看鬼三驚XD 01/03 04:41 推 DDJwolf : 哪有照搬,砍了一堆民俗元素 01/03 12:28 推 yusakoji : 並沒有照搬 跟遊戲差滿多的,劇情有差、遊戲的氣 01/04 08:21 → yusakoji : 氛韻味也好很多 01/04 08:21 推 SsuWeiYuan : 說改編不好就算了,說遊戲照搬是雲玩家還是雲觀眾 01/05 22:53 → SsuWeiYuan : 抑或是別有用心… 01/05 22:53 推 godgod777 : 編導那麼爛竟然還能拿獎,金馬實在沒片可頒了 01/07 11:03 → ismydear : 評審有其他選擇的 但是就是不選別片 有什麼辦法 01/07 19:25 推 ismydear : 最多只有視覺效果比較沒有爭議 01/07 19:27 推 wosiwo : 我剛剛已經用CATCHPLAY+看完了,真是一部好片,過年 01/15 21:59 → wosiwo : 和家人再重複刷一次 01/15 21:59 推 Launo : CATCHPLAY+真的很快,感覺沒多久就上映了 01/16 10:15 → Launo : 20號還有小丑可以看,期待中 01/16 10:15 推 sewgo : 超好看,推推,致自由 01/18 00:25
catchplay獨家上映2019 金馬獎最佳美術設計 最佳視覺效果 最佳新導演徐漢強 最佳原創電影歌曲 最佳改編劇本沒想到這麼快就可以租到片剛好可以跟家人一起看 返校1月15要上映
1/1 [討論] 2019最討厭與喜歡的電影

作者e04su3no (鋼鐵毛毛蟲)看板movie標題[討論] 2019最討厭與喜歡的電影時間Wed Jan 1 21:30:10 2020

去年一整年應該也進了超過10次電影院 各位心中2019最佳與最糟的電影是哪部

條件是去年2019新上映的片 不限串流或電影院

我的話最佳是決戰中途島 本事就喜歡戰史,工作也是地勤對飛機有特殊情感,看著駕駛員不顧安危從AA砲中竄入投彈真的爽

最糟是野蠻遊戲2 版上已經有發一篇大負雷了這就不贅述 根本是在浪費我的生命

希望今年也能不斷感受到電影的魅力

Sent from JPTT on my Asus ASUS_I01WD.
http://i.imgur.com/OvhwnDU.jpg
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 27.242.40.61 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/movie/M.1577885414.A.CAC.html 噓 a27588679 : 感覺前幾個星期才一篇 大家文 01/01 21:32 噓 ryanchang03 : 最糟糕是驚濤佈局和救火奶爸 01/01 22:36 噓 xm30 : 又來 01/02 01:11
去年一整年應該也進了超過10次電影院各位心中2019最佳與最糟的電影是哪部條件是去年2019新上映的片不限串流或電影院我的話最佳是決戰中途島本事就喜歡戰史工作也是地勤對飛機有特殊情感看著駕駛員不顧安危從AA砲中竄入投彈真的爽最糟是野蠻遊戲2版上已經有發一篇大負雷了這就不贅述根本是在浪費我的生命希望今年也能不斷感受到電影的魅力 2019最討厭與喜歡的電影

每日發文數

  • 在疫情爆發後,台灣連鎖影城也隨著疫情持續增溫創下全台票房紀錄以來的票房新低。由圖可知,四月時隨著疫情人數的高峰,電影版討論度也大大下降。而二月過年期間,對疫情還未知的情況下,討論度是最高的。
covid19<- read.csv("C:/Users/a1205/Desktop/covid19.csv")
covid19$date <- covid19$date %>% as.Date("%Y/%m/%d")
my_data$date <- paste0("2020/",my_data$date) %>% as.Date("%Y/%m/%d")
plottext<- my_data %>% group_by(date) %>% summarise(count = n()) 

library(zoo)
date.ts1<-data.frame(zoo(plottext[,-1],plottext$date))
date.ts2<-data.frame(confirmed=zoo(covid19[,-1],covid19$date))

dygraph(date.ts1,main = "2020  ptt movie版每日發文數") %>%
  dySeries("count", label = "發文數量", col='   #9F35FF') 
dygraph(date.ts2,main = "2020  新冠肺炎確診人數") %>%
  dySeries("confirmed", label = "確診人數", col='#FF2D2D') 

回覆內文數

length(grep("Re:", my_data$title))
## [1] 922

轉發內文數

length(grep("Fw:", my_data$title)) #轉發
## [1] 46

標題類型個數

title_1 <- regmatches(my_data$title,regexec(pattern = "\\[.+?\\]",my_data$title))
title_topic=c()
for(i in 1:7620){
  title_topic <- c(title_topic,title_1[[i]])
}
title_topic <- title_topic %>% gsub(pattern = " ",., replacement = "") 
title_topic <- as.factor(title_topic)
sort(summary(title_topic), decreasing = TRUE)
##     [討論]     [新聞]     [好雷]     [問片]     [請益]     [情報]     [片單] 
##       1734       1469       1120        670        629        507        245 
##     [普雷]     [負雷]     [贈票]     [公告]     [Live]     [無雷]       [雷] 
##        222        178        103         71         68         67         58 
##     [選片]     [影評]     [有雷]     [閒聊]     [LIVE]     [心得]   [好無雷] 
##         56         52         36         33         25         23         18 
##     [分享]     [問題]   [普好雷]     [評論]     [通知]   [極好雷]     [參選] 
##         15         15         13         13         11          9          8 
##     [微雷]     [問卷]     [板規]     [抽獎]     [活動]    [movie]   [大負雷] 
##          7          6          5          4          4          3          3 
##     [小雷]   [失望雷]     [問雷]     [推薦]     [揪團]   [超好雷]   [極負雷] 
##          3          3          3          3          3          3          3 
##     [資訊]     [爛雷]     [大雷]   [好微雷]    [好雷?]     [怪雷]     [版規] 
##          3          3          2          2          2          2          2 
##     [花邊]   [負無雷]     [神雷]     [問卦]     [爽雷]     [創作]     [開箱] 
##          2          2          2          2          2          2          2 
##   [微好雷]     [糞雷]     [翻譯]     [壞雷]     [贈送]     [譯雷]     [?雷] 
##          2          2          2          2          2          2          1 
##    [[問片]     [live]   [大好雷]   [大哭雷]   [大爛雷]     [已找]     [分析] 
##          1          1          1          1          1          1          1 
##     [日雷]   [巨好雷]     [囧雷] [板主警告]     [社團]   [很好雷]     [限雷] 
##          1          1          1          1          1          1          1 
##     [差雷]     [專題]     [專欄]     [惜雷]     [票房]     [鳥雷]   [無言雷] 
##          1          1          1          1          1          1          1 
##   [超負雷]     [經典]   [經典雷]     [詭雷]     [慘雷]     [榜單]     [影片] 
##          1          1          1          1          1          1          1 
##   [療育雷]     [簡評]     [轉錄]     [懷舊]     [贈出] 
##          1          1          1          1          1

文本探勘

詞庫下載

  • 使用工具 : Notepad
  • 將2019年、2020年上映的所有電影名稱下載至Notepad中當作詞庫
  • 網路上找開源停用詞 stopword 複製至Notepad中當作停止詞庫
movie_text=c()
url2020='https://www.truemovie.com/tairelease2020.htm'
url2019='https://www.truemovie.com/tairelease2019.htm'
movie_text <- c(movie_text,read_html(url2020) %>% html_nodes(css = "td a") %>% html_text())
movie_text <- c(movie_text,read_html(url2019) %>% html_nodes(css = "td a") %>% html_text())
movie_text <- gsub(pattern = "\t",movie_text, replacement = "")
write.csv(movie_text,file="C:/Users/a1205/Desktop/movie_text.csv",row.names=F)

斷詞斷句

#建立文字庫

w = worker(stop_word="C:\\Users\\a1205\\Documents\\R\\win-library\\4.0\\jiebaRD\\dict\\stop_words.utf8")
text_corpus=NULL

for(i in 1:length(my_data$content_ques))
{
  t0 = my_data$content_ques[i] #文章
  t1 = w <= t0 #段詞句
  text_corpus = c(text_corpus,paste0(t1,collapse=" ")) #將辭連接變成文字庫
} 

text_df = data.frame(doc_id = 1:length(text_corpus),text = text_corpus) #做編號
tok99 = function(t) str_split(t,"[ ]{1,}") #因有時會把斷好的字詞再切開,設定如果是空格至少一個字詞
td1 = unnest_tokens(text_df , word , text ,token=tok99) #將所有字詞以id切開分詞

# unnest_tokens_(data, output_col, input_col, token = "words")
# output_col: output column, 新變數名稱是 word
# input_col: input column, 舊變數名稱是 text_df 中的 text

建立文字雲

td_count = count(td1, word , sort=T)
td_count_imp <- td_count[nchar(td_count$word)>=2,] #字數<1不重要的刪除
head(td_count_imp,20)
##      word     n
## 1    電影 21672
## 2    導演  6038
## 4    故事  4380
## 6    劇情  3818
## 7    角色  3604
## 9    觀眾  3118
## 10   上映  3065
## 11   主角  2912
## 12   美國  2791
## 13   台灣  2774
## 15   最佳  2614
## 17   作品  2443
## 18   演員  2436
## 19   世界  2242
## 20   本片  2134
## 23   飾演  1887
## 24   發現  1838
## 26 女主角  1760
## 28   感覺  1739
## 29   票房  1685
stop_words <- read.table("C:/Users/a1205/Documents/R/win-library/4.0/jiebaRD/dict/stop_words.utf8",encoding = "UTF-8")
td1_clear <-  td1[td1$word %in% stop_words$V1 == FALSE,]
td_count = count(td1_clear, word , sort=T) #找出出現次數最多
td_count_imp <- td_count[nchar(td_count$word)>=2,]#出現次數多字>2的

#因為電影出現次數與其他詞相差太多,因此不列入文字雲
  td_count_imp %>% 
  filter(n > 400 & n < 10000)%>% 
  arrange(desc(n)) %>% 
  wordcloud2( size=0.8, shape = 'circle')

TF-IDF

TF-TDF =TF * IDF 某個詞對文章的重要性越高,它的TF-IDF值就越大。所以,排在最前面的幾個詞,就是這篇文章的關鍵字。

td2 = td1 %>% count(doc_id , word , sort=T) %>% ungroup() %>% bind_tf_idf(word, doc_id ,n)
td_tfidf = arrange(td2,desc(tf_idf))
td_tfidf <- td_tfidf[nchar(td_tfidf$word)>=2,] #字數<1不重要的刪除
plot_words = mutate(td_tfidf,word=factor(word,levels=rev(unique(word)))) #mutate新增欄位 #rev倒轉向量 #unique不重複元素
plot_words %>% top_n(25) %>% ggplot(aes(word,tf_idf,fill=doc_id))+geom_col()+labs(y="tf_idf")+coord_flip()

尋找單詞關聯

dtm_tfidf=cast_dtm(td_tfidf,doc_id,word,tf_idf)
#相關性大於0.2
findAssocs(dtm_tfidf,"疫情",0.2)
## $疫情
##   肺炎   趨緩   再行   將待   緩和   延遲   武漢 無限期   延檔 下半年   影響 
##   0.33   0.32   0.29   0.27   0.27   0.26   0.26   0.25   0.24   0.24   0.24 
##   上映   關係   延後 
##   0.23   0.23   0.21
findAssocs(dtm_tfidf,"女鬼",0.2)
## $女鬼
##     橋的     紅衣      229     文燁   演得還     蠻少     大輸     編成 
##     0.50     0.42     0.36     0.34     0.34     0.34     0.34     0.34 
## 東海大學   奚岳隆     橋中     自拍     營隊   猜不透     纏上     siri 
##     0.32     0.31     0.28     0.27     0.26     0.26     0.25     0.25 
##     嵐張     道長      bd7   孟耿如     膽大     哲熹     握手     掉落 
##     0.25     0.24     0.24     0.24     0.24     0.24     0.23     0.23 
##     人擠     橋也     中看   如題問   要拉到   林哲熹 嵐孟耿如     怨咒 
##     0.22     0.22     0.22     0.22     0.22     0.22     0.22     0.21 
##     深淵     嚴正     樓頂     穿透     怨念     東湖     將校     比橋 
##     0.21     0.21     0.21     0.21     0.21     0.21     0.21     0.21 
##   那芯喬     問神     撕橋 一晃而過   大傳系     中捉     化如   文耀並 
##     0.20     0.20     0.20     0.20     0.20     0.20     0.20     0.20 
## 用意何在     全則     死了     何死     吧則     抓入     所殺   阿全要 
##     0.20     0.20     0.20     0.20     0.20     0.20     0.20     0.20 
##     是指     是橋     研二     假芯     被觸     喬成     喬明     喬當 
##     0.20     0.20     0.20     0.20     0.20     0.20     0.20     0.20 
##     意橋   橋芯喬     橋旁     嚇而 
##     0.20     0.20     0.20     0.20
findAssocs(dtm_tfidf,"007",0.2)
## $`007`
##      丹尼爾      季默會        幫下      臉超尬        龐德      每件事 
##        0.43        0.40        0.40        0.38        0.34        0.34 
##        皇家        bond    二十週年 007生死交戰      金手指      vesper 
##        0.31        0.30        0.30        0.29        0.26        0.26 
##      大鋼牙      印老皮      印刷廠      印刷機      難愛上        普西 
##        0.26        0.26        0.26        0.26        0.26        0.26 
##      俏皮話        納萊        怪俠         db5      六萬人        牌局 
##        0.26        0.26        0.26        0.26        0.26        0.26 
##       pussy        一管      下馬威      五千塊        公物      日內瓦 
##        0.26        0.26        0.26        0.26        0.26        0.26 
##        生擒        命決        房用        飛帽        差吸        連贏 
##        0.26        0.26        0.26        0.26        0.26        0.26 
##      普西則        煉金        撒播      關進牢        這輪      克雷格 
##        0.26        0.26        0.26        0.26        0.26        0.25 
##        空降    風流倜儻        滿貫      拉莎娜        社群      第七號 
##        0.25        0.25        0.25        0.25        0.24        0.24 
##     seydoux        防範      回應繼      利就直        紛傳    感興趣我 
##        0.24        0.24        0.24        0.24        0.24        0.24 
##        來年      夜總會      豆丁大        消磁        鞋上      觀察力 
##        0.24        0.23        0.23        0.23        0.23        0.23 
##      諜報員      演唱者        搞壞        看護        四伏        量子 
##        0.23        0.23        0.23        0.22        0.22        0.22 
##    別有用意        撲克      情報員    明日帝國    濃厚興趣      電風扇 
##        0.22        0.22        0.22        0.22        0.22        0.22 
##      霹靂彈        血跡        滷蛋        影帶        各集        多慮 
##        0.21        0.21        0.21        0.21        0.21        0.21 
##        略遜    開山祖師         kgb 
##        0.21        0.21        0.20
findAssocs(dtm_tfidf,"itune",0.2) 
## $itune
##     人之路     不窮處       目圓       仿鳥       再慘       良緣       配鹿 
##       1.00       1.00       1.00       1.00       1.00       1.00       1.00 
##       無疾       無絕       無酬       詭感       圖由     隨集換       難敵 
##       1.00       1.00       1.00       1.00       1.00       1.00       1.00 
##       難願       續辦     巔峰作       變新       重編     冥王星       悠木 
##       1.00       1.00       1.00       1.00       0.86       0.83       0.82 
##       主僕       社福       小圓 黑色聖誕節       拉帆       藏寶     三合一 
##       0.79       0.69       0.67       0.62       0.61       0.61       0.60 
##       力抗       後編       遭拒       優缺       惡徒       直搗       求償 
##       0.59       0.58       0.49       0.47       0.44       0.40       0.38 
##       一歲       增高   感到痛苦       空之     wellgo       癌末       大氣 
##       0.38       0.37       0.36       0.36       0.35       0.35       0.34 
##     新篇章       彼方       轉機       方針     李爾王       屍者     辯護人 
##       0.32       0.31       0.30       0.30       0.29       0.29       0.29 
##       新編     淪落人       助長       木匠       牽起       縱橫 
##       0.29       0.24       0.24       0.23       0.23       0.21