作業二 - 自由時報爬蟲

library(rvest)
## Warning: package 'rvest' was built under R version 3.3.3
## Loading required package: xml2
## Warning: package 'xml2' was built under R version 3.3.3
li <- read_html('http://news.ltn.com.tw/list/breakingnews') %>% html_nodes('.tit')

ltn_news <- data.frame()

for (news in li){
   dt    <- news %>% html_nodes('span') %>% 
            html_text() %>%  trimws() %>% .[1]
   #print(dt)
   title <- news %>% html_nodes('p') %>% html_text() %>% trimws() 
   link  <- news %>% html_attr('href')
   res <- data.frame(time = dt, title = title, link = link, stringsAsFactors = FALSE)
   ltn_news <- rbind(ltn_news, res)
}

View(ltn_news)


#as.character(li[10])

#a = '\t雜技藝人30公尺高空墜落喪命 表演仍繼續挨轟\t\t\t\t'
#print(trimws(a))

UDN 新聞

li <- read_html('https://udn.com/news/breaknews/1') %>%
       html_nodes('dt')

title    <- li %>% html_nodes('h2 a') %>% html_text()
link     <- li %>% html_nodes('h2 a') %>% html_attr('href')
dt       <- li %>% html_nodes('.info .dt') %>% html_text()
cat      <- li %>% html_nodes('.cate') %>% html_text()
view_cnt <- li %>% html_nodes('.view') %>% html_text()

udn_news <- data.frame(title = title, dt = dt, cat = cat, view_cnt = view_cnt, link = link)
View(udn_news)

PCHOME 爬蟲

read_html('http://ecapi.pchome.com.tw/ecshop/prodapi/v2/prod/DPAF1Y-A9006X5KQ-000&fields=Seq,Id,Name,Nick,Store,PreOrdDate,SpeOrdDate,Price,Discount,Pic,Weight,ISBN,Qty,Bonus,isBig,isSpec,isCombine,isDiy,isRecyclable,isCarrier,isMedical,isBigCart,isSnapUp,isDescAndIntroSync,isFoodContents,isHuge,isEnergySubsidy&_callback=jsonp_prod&1499568660?_callback=jsonp_prod') %>% as.character()
## [1] "<!DOCTYPE html PUBLIC \"-//W3C//DTD HTML 4.0 Transitional//EN\" \"http://www.w3.org/TR/REC-html40/loose.dtd\">\n<html><body><p>try{jsonp_prod({\"DPAF1Y-A9006X5KQ-000\":{\"Seq\":15292767,\"Id\":\"DPAF1Y-A9006X5KQ-000\",\"Name\":\"\\u3010SANSUI\\u5c71\\u6c34\\u3011\\u514d\\u5b89\\u88dd\\u79fb\\u52d5\\u5f0f\\u7a7a\\u8abf3-5\\u576a\\u9069\\u7528(SAC52)\",\"Nick\":\"<font color=\"#FF00CC\"><b>\\u25c6\\uff10\\uff17\\uff0f\\uff10\\uff19\\u958b\\u9580\\u8cde\\u25c6<br>\\u3010SANSUI\\u5c71\\u6c34\\u3011\\u79fb\\u52d5\\u5f0f\\u51b7\\u6c23(SAC52) <br>\\u5bb6\\u4e2d\\u7684\\u7b2c\\u4e8c\\u53f0\\u51b7\\u6c23\",\"Store\":\"DPAF1Y\",\"PreOrdDate\":\"\",\"SpeOrdDate\":\"\",\"Price\":{\"M\":19900,\"P\":8488},\"Discount\":0,\"Pic\":{\"B\":\"\\/items\\/DPAF1YA9006X5KQ\\/000001_1499565348.jpg\",\"S\":\"\\/items\\/DPAF1YA9006X5KQ\\/000002_1499565348.jpg\"},\"Weight\":21.2,\"ISBN\":\"\",\"Qty\":20,\"Bonus\":0,\"isBig\":1,\"isSpec\":0,\"isCombine\":0,\"isDiy\":0,\"isRecyclable\":0,\"isCarrier\":0,\"isMedical\":0,\"isBigCart\":1,\"isSnapUp\":0,\"isDescAndIntroSync\":0,\"isFoodContents\":0,\"isHuge\":0,\"isEnergySubsidy\":0}});}catch(e){if(window.console){console.log(e);}}</b></font></p></body></html>\n"

使用R 連結資料庫

#install.packages('RJDBC')
library(RJDBC)
jar.loc <- 'C:\\Program Files (x86)\\MySQL\\Connector.J 5.1\\mysql-connector-java-5.1.41-bin.jar'
drv <- JDBC("com.mysql.jdbc.Driver",
           jar.loc,
           identifier.quote="`")
conn <- dbConnect(drv, "jdbc:mysql://localhost/appledaily", "root", "test")
dbWriteTable(conn, "iris", iris)
dbListTables(conn)
#dbReadTable(conn, 'iris2')

a <- dbGetQuery(conn, "select `Sepal.Length`, `Sepal.Width` from iris2 where Species = 'setosa' ")
View(a)

dbListTables(conn)
dbExistsTable(conn, 'iris2')
if (dbExistsTable(conn, 'iris2')) {
  dbRemoveTable(conn, 'iris2')
}

dbListTables(conn)

dbDisconnect(conn)

儲存蘋果資料

# https://github.com/ywchiu/rtibame/blob/master/data/applenews.RData
getwd()
## [1] "D:/OS DATA/Desktop"
load('applenews.RData')
str(applenews)
## 'data.frame':    1500 obs. of  5 variables:
##  $ content : chr  "(更新:新增影片)想要透過刮刮樂彩券一夕致富,但他卻用錯方法!台中市一名黃姓男子覬覦頭獎高達2600萬的「開門見喜」刮刮樂彩券,上月佯"| __truncated__ "澳洲一名就讀雪梨大學的華裔博士生,日前公開一段燒毀中國護照的影片,還大肆批評留澳學生是一群「留學豬」。消息傳出後,這名博士生立"| __truncated__ "【行銷專題企劃】房價高高在上,沒錢買房沒關係,但你認為自己是聰明的租屋族嗎? 由蘋果地產與FBS TV合作的全新節目-房市大追擊,本集節"| __truncated__ "本內容由中央廣播電臺提供<U+00A0><U+00A0> <U+00A0> <U+00A0> <U+00A0>美國國防部長卡特(Ash Carter)今天(15日)表示,他今天將前往在菲"| __truncated__ ...
##  $ title   : chr  "【更新】搶2.2萬彩券刮中1.4萬 沒發財還得入獄" "拿到澳洲護照後 他放火燒中國護照" "【特企】房市大追擊- 租屋這些事情要小心" "【央廣RTI】美菲軍演  美防長南海登艦" ...
##  $ dt      : POSIXct, format: "2016-04-15 14:32:00" "2016-04-15 14:32:00" ...
##  $ category: chr  "社會" "國際" "地產" "國際" ...
##  $ view_cnt: chr  "1754" "0" "0" "0" ...
library(RJDBC)
## Warning: package 'RJDBC' was built under R version 3.3.3
## Loading required package: DBI
## Warning: package 'DBI' was built under R version 3.3.3
## Loading required package: rJava
jar.loc <- 'C:\\Program Files (x86)\\MySQL\\Connector.J 5.1\\mysql-connector-java-5.1.41-bin.jar'
drv <- JDBC("com.mysql.jdbc.Driver",
           jar.loc,
           identifier.quote="'")
conn <- dbConnect(drv, "jdbc:mysql://localhost/appledaily", "root", "test")

# create table applenews(
# content text,
# title   varchar(1000),
# dt      datetime,
# category varchar(100),
# view_cnt int
# )

dbWriteTable(conn, "applenews", applenews, append=TRUE,row.names=FALSE,overwrite=FALSE)
## [1] TRUE
a <- dbGetQuery(conn, 'SELECT category, count(*) FROM applenews GROUP BY category;')
a <- dbGetQuery(conn, 'SELECT category, count(*) FROM applenews GROUP BY category ORDER BY 2 DESC;')

a <- dbGetQuery(conn, 'SELECT title, view_cnt FROM applenews ORDER BY view_cnt DESC limit 3;')
a <- dbGetQuery(conn, "SELECT hour(dt), count(*) FROM applenews WHERE dt >= '2016-04-14' AND dt < '2016-04-15'  GROUP BY hour(dt);")
plot(a, type='l')

a
##    hour(dt) count(*)
## 1         0      280
## 2         1       15
## 3         2       30
## 4         3       35
## 5         4       25
## 6         5       35
## 7         6       70
## 8         7      140
## 9         8       75
## 10        9      130
## 11       10      215
## 12       11      260
## 13       12      290
## 14       13      185
## 15       14      265
## 16       15      255
## 17       16      295
## 18       17      285
## 19       18      230
## 20       19      190
## 21       20      170
## 22       21      140
## 23       22      205
## 24       23       60
res <- dbGetQuery(conn, "SELECT category, count(*) FROM applenews group by category order by 2 desc")
res
##                    category count(*)
## 1                      生活     1490
## 2                      國際     1365
## 3                      社會      970
## 4                      政治      715
## 5                      財經      605
## 6                      娛樂      565
## 7                      體育      475
## 8                      搜奇      275
## 9                      論壇      275
## 10                     時尚      190
## 11                       3C      185
## 12                     地產      160
## 13                     動物      130
## 14 國際","LA","SF","NY","US       45
## 15                     正妹       40
## 16           國際","SF","US       15
names(res) = c('category', 'cnt')
pie(res$cnt,labels = res$category, clockwise = TRUE, init.angle = 90)

#?pie

dbDisconnect(conn)
## [1] TRUE

使用dplyr

#install.packages('dplyr')
library(dplyr)
## Warning: package 'dplyr' was built under R version 3.3.3
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
# R Version
head(applenews[applenews$category == '娛樂',   ])
##                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                content
## 16                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                   澎恰恰今簽下新人張芳瑜,準備栽培她演出台灣音樂劇。澎恰恰透露張芳瑜是美國百老匯授權的《媽媽咪呀》國際中文版女主角,巡演超過900場,潛力無窮,「看好她未來是台灣音樂劇第一名伶」。張芳瑜現場也進行拜師儀式,向澎恰恰下跪奉茶,以示慎重。(蔡維歆/台北報導)<U+00A0>
## 21                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                             肯亞警方強押45名台灣人遣送中國,輿論譁然。「星光幫」冠軍賴銘偉有感,改陳奕迅《你的背包》為《你的台胞》,要唱給話術不輸詐騙集團的中國人民共和國與中華民國政府。(娛樂中心/綜合報導)<U+00A0> 肯亞被判無罪釋放的台籍嫌犯(綠衣者)竟被押送到中國。新華社
## 32 藝人白冰冰和日本知名漫畫家<U+68B6>原一騎曾有一段婚姻,兩人生下1女白曉燕,然而在1997年4月14日這天,年僅16歲的白曉燕在上學途中,遭到歹徒陳進興、林春生綁架並撕票,手段極其殘忍,命案震驚全台。時隔19年,白冰冰今凌晨在臉書po文悼念愛女,堅強地說不能忘記曉燕受難的時刻,才能為所有受難者發聲。<U+00A0>白冰冰在臉書談及白曉燕命案,感嘆時光飛逝,「如夢一般,曾經怨,哭,痛苦、沮喪、崩潰」,但她滿懷感恩,感謝這段時間所有的好朋友,用各自的宗教信仰幫她度過難過的那幾年,也感謝大家惦記著曉燕,昨天還有人送花、安慰及祝福。<U+00A0>她感動地說:「我會記住大家的好,現在能過平安的日子,但不能忘懷曉燕受難的那個時刻,才能勇敢的為所有受難者發聲。」白冰冰昨天一整個早上在佛堂念經跟曉燕說話,「下午整理東西,整理心情,天亮後又是一個新的開始」,堅強的母性令人心疼。(陳嘉婉/綜合報導)<U+00A0> 白冰冰談及白曉燕命案,感嘆時光飛逝。翻攝白冰冰臉書
## 40                                                                                                                                                                                                                                                                                                                                                                                      今天好萊塢喜事連連,繼「花邊教主」布蕾克萊弗莉有喜,為老公萊恩雷諾斯懷了第2胎,「好萊塢男神」萊恩葛斯林的42歲性感女友伊娃曼德斯也傳出懷孕,再度成為高齡產婦。<U+00A0>葛斯林2012年拍攝《末日車神》時與伊娃曼德斯譜戀曲,交往多年一直遲遲沒有結婚,但2人已經育有1女,現又傳出有了第2個愛的結晶,伊娃曼德斯被拍到出現在洛杉磯,以大包包遮住腹部,疑似想遮掩孕肚。(封以恩/綜合報導)<U+00A0> 伊娃曼德斯(左)和萊恩葛斯林交往多年未婚,但已育有1女。翻攝每日郵報
## 47                                                                                                                                                                      隋棠今出席阿瘦皮鞋活動,力挺全天下辛勞的媽咪,她說,很多現代媽媽都是身兼數職,格外令人心疼。談到今年母親節,她說是她當媽媽後第一次過節,自己為人母後,更能體驗母親的辛勞,今年想要好好幫媽媽和婆婆過節,不過距離母親節還有1個月,目前還沒有具體想法。<U+00A0>前兩天隋棠和老公帶兒子Max開車到台南、墾丁旅行,她透露因為表妹在台南開民宿,順道去體驗了一下,台南美食果然名不虛傳,她跟Max吃很多,母子倆回台北竟然雙雙變胖了,而第一次長途旅行的Max也十分配合,路上不是吃就是睡,7個多月大的他,上車睡覺、直接尿尿,讓她覺得一點也不麻煩。(葉婉如/台北報導)<U+00A0> 隋棠透露前幾天到台南吃喝竟吃胖了。阿瘦皮鞋提供 隋棠帶兒子Max第一次長途旅行,兒子在車上很乖巧。翻攝隋棠臉書
## 50                                                                                             日本型男伊勢谷友介被爆和名媛模特兒森星半同居,2人同進同出他的住處,他還開車送女方出門工作,報導曝光後,大家才知道原來他和長澤雅美早就切了!<U+00A0>將滿40歲的伊勢谷友介,歷任女友包括廣末涼子、吉川雛乃、木村佳乃等,一字排開羨煞世間男性。據《FRIDAY》周刊,他和28歲的長澤雅美2012年展開交往,男方友人透露,因雅美頻頻催婚,他斷然拒絕,2人大吵一架,已於1年前分手。<U+00A0>他的新歡森星長相甜美,本月22日滿24歲,曾在巴黎生活,今年3月剛從慶應大學畢業,祖母是名設計師森英惠,姊姊森泉也是藝人。去年11月伊勢谷友介上她擔任助理主持的料理節目,交換聯絡方式後來電,迅速進展到半同居,情場浪子和千金小姐的配對備受矚目。(吳惠菁/綜合報導)<U+00A0> 伊勢谷友介(左)和森星打扮休閒一起遛狗。翻攝《FRIDAY》森泉(右)、森星是日本名媛姊妹花。翻攝森星IG
##                                         title                  dt category
## 16           澎恰恰收女弟子 拱當台灣第一名伶 2016-04-15 14:17:00     娛樂
## 21 【唱新聞】詐騙嗎?R.O.C.有CHINA但不是CHINA 2016-04-15 14:00:00     娛樂
## 32         白曉燕命案19年了 白冰冰「不能忘」 2016-04-15 13:49:00     娛樂
## 40           好萊塢男神好威 女友再當高齡產婦 2016-04-15 13:40:00     娛樂
## 47         隋棠帶兒遠征南台灣 吃成膨皮母子檔 2016-04-15 13:30:00     娛樂
## 50   伊勢谷友介掰了長澤雅美 半同居小16歲辣模 2016-04-15 13:23:00     娛樂
##    view_cnt
## 16     1749
## 21    11696
## 32     3329
## 40     4307
## 47     4651
## 50     5141
# Dplyr Version
head(filter(applenews, category == '娛樂'))
## Warning: package 'bindrcpp' was built under R version 3.3.3
##                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                               content
## 1                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                   澎恰恰今簽下新人張芳瑜,準備栽培她演出台灣音樂劇。澎恰恰透露張芳瑜是美國百老匯授權的《媽媽咪呀》國際中文版女主角,巡演超過900場,潛力無窮,「看好她未來是台灣音樂劇第一名伶」。張芳瑜現場也進行拜師儀式,向澎恰恰下跪奉茶,以示慎重。(蔡維歆/台北報導)<U+00A0>
## 2                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                             肯亞警方強押45名台灣人遣送中國,輿論譁然。「星光幫」冠軍賴銘偉有感,改陳奕迅《你的背包》為《你的台胞》,要唱給話術不輸詐騙集團的中國人民共和國與中華民國政府。(娛樂中心/綜合報導)<U+00A0> 肯亞被判無罪釋放的台籍嫌犯(綠衣者)竟被押送到中國。新華社
## 3 藝人白冰冰和日本知名漫畫家<U+68B6>原一騎曾有一段婚姻,兩人生下1女白曉燕,然而在1997年4月14日這天,年僅16歲的白曉燕在上學途中,遭到歹徒陳進興、林春生綁架並撕票,手段極其殘忍,命案震驚全台。時隔19年,白冰冰今凌晨在臉書po文悼念愛女,堅強地說不能忘記曉燕受難的時刻,才能為所有受難者發聲。<U+00A0>白冰冰在臉書談及白曉燕命案,感嘆時光飛逝,「如夢一般,曾經怨,哭,痛苦、沮喪、崩潰」,但她滿懷感恩,感謝這段時間所有的好朋友,用各自的宗教信仰幫她度過難過的那幾年,也感謝大家惦記著曉燕,昨天還有人送花、安慰及祝福。<U+00A0>她感動地說:「我會記住大家的好,現在能過平安的日子,但不能忘懷曉燕受難的那個時刻,才能勇敢的為所有受難者發聲。」白冰冰昨天一整個早上在佛堂念經跟曉燕說話,「下午整理東西,整理心情,天亮後又是一個新的開始」,堅強的母性令人心疼。(陳嘉婉/綜合報導)<U+00A0> 白冰冰談及白曉燕命案,感嘆時光飛逝。翻攝白冰冰臉書
## 4                                                                                                                                                                                                                                                                                                                                                                                      今天好萊塢喜事連連,繼「花邊教主」布蕾克萊弗莉有喜,為老公萊恩雷諾斯懷了第2胎,「好萊塢男神」萊恩葛斯林的42歲性感女友伊娃曼德斯也傳出懷孕,再度成為高齡產婦。<U+00A0>葛斯林2012年拍攝《末日車神》時與伊娃曼德斯譜戀曲,交往多年一直遲遲沒有結婚,但2人已經育有1女,現又傳出有了第2個愛的結晶,伊娃曼德斯被拍到出現在洛杉磯,以大包包遮住腹部,疑似想遮掩孕肚。(封以恩/綜合報導)<U+00A0> 伊娃曼德斯(左)和萊恩葛斯林交往多年未婚,但已育有1女。翻攝每日郵報
## 5                                                                                                                                                                      隋棠今出席阿瘦皮鞋活動,力挺全天下辛勞的媽咪,她說,很多現代媽媽都是身兼數職,格外令人心疼。談到今年母親節,她說是她當媽媽後第一次過節,自己為人母後,更能體驗母親的辛勞,今年想要好好幫媽媽和婆婆過節,不過距離母親節還有1個月,目前還沒有具體想法。<U+00A0>前兩天隋棠和老公帶兒子Max開車到台南、墾丁旅行,她透露因為表妹在台南開民宿,順道去體驗了一下,台南美食果然名不虛傳,她跟Max吃很多,母子倆回台北竟然雙雙變胖了,而第一次長途旅行的Max也十分配合,路上不是吃就是睡,7個多月大的他,上車睡覺、直接尿尿,讓她覺得一點也不麻煩。(葉婉如/台北報導)<U+00A0> 隋棠透露前幾天到台南吃喝竟吃胖了。阿瘦皮鞋提供 隋棠帶兒子Max第一次長途旅行,兒子在車上很乖巧。翻攝隋棠臉書
## 6                                                                                             日本型男伊勢谷友介被爆和名媛模特兒森星半同居,2人同進同出他的住處,他還開車送女方出門工作,報導曝光後,大家才知道原來他和長澤雅美早就切了!<U+00A0>將滿40歲的伊勢谷友介,歷任女友包括廣末涼子、吉川雛乃、木村佳乃等,一字排開羨煞世間男性。據《FRIDAY》周刊,他和28歲的長澤雅美2012年展開交往,男方友人透露,因雅美頻頻催婚,他斷然拒絕,2人大吵一架,已於1年前分手。<U+00A0>他的新歡森星長相甜美,本月22日滿24歲,曾在巴黎生活,今年3月剛從慶應大學畢業,祖母是名設計師森英惠,姊姊森泉也是藝人。去年11月伊勢谷友介上她擔任助理主持的料理節目,交換聯絡方式後來電,迅速進展到半同居,情場浪子和千金小姐的配對備受矚目。(吳惠菁/綜合報導)<U+00A0> 伊勢谷友介(左)和森星打扮休閒一起遛狗。翻攝《FRIDAY》森泉(右)、森星是日本名媛姊妹花。翻攝森星IG
##                                        title                  dt category
## 1           澎恰恰收女弟子 拱當台灣第一名伶 2016-04-15 14:17:00     娛樂
## 2 【唱新聞】詐騙嗎?R.O.C.有CHINA但不是CHINA 2016-04-15 14:00:00     娛樂
## 3         白曉燕命案19年了 白冰冰「不能忘」 2016-04-15 13:49:00     娛樂
## 4           好萊塢男神好威 女友再當高齡產婦 2016-04-15 13:40:00     娛樂
## 5         隋棠帶兒遠征南台灣 吃成膨皮母子檔 2016-04-15 13:30:00     娛樂
## 6   伊勢谷友介掰了長澤雅美 半同居小16歲辣模 2016-04-15 13:23:00     娛樂
##   view_cnt
## 1     1749
## 2    11696
## 3     3329
## 4     4307
## 5     4651
## 6     5141
head(filter(applenews, category == '娛樂' & view_cnt >= 1000))
##                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                               content
## 1                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                   澎恰恰今簽下新人張芳瑜,準備栽培她演出台灣音樂劇。澎恰恰透露張芳瑜是美國百老匯授權的《媽媽咪呀》國際中文版女主角,巡演超過900場,潛力無窮,「看好她未來是台灣音樂劇第一名伶」。張芳瑜現場也進行拜師儀式,向澎恰恰下跪奉茶,以示慎重。(蔡維歆/台北報導)<U+00A0>
## 2                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                             肯亞警方強押45名台灣人遣送中國,輿論譁然。「星光幫」冠軍賴銘偉有感,改陳奕迅《你的背包》為《你的台胞》,要唱給話術不輸詐騙集團的中國人民共和國與中華民國政府。(娛樂中心/綜合報導)<U+00A0> 肯亞被判無罪釋放的台籍嫌犯(綠衣者)竟被押送到中國。新華社
## 3 藝人白冰冰和日本知名漫畫家<U+68B6>原一騎曾有一段婚姻,兩人生下1女白曉燕,然而在1997年4月14日這天,年僅16歲的白曉燕在上學途中,遭到歹徒陳進興、林春生綁架並撕票,手段極其殘忍,命案震驚全台。時隔19年,白冰冰今凌晨在臉書po文悼念愛女,堅強地說不能忘記曉燕受難的時刻,才能為所有受難者發聲。<U+00A0>白冰冰在臉書談及白曉燕命案,感嘆時光飛逝,「如夢一般,曾經怨,哭,痛苦、沮喪、崩潰」,但她滿懷感恩,感謝這段時間所有的好朋友,用各自的宗教信仰幫她度過難過的那幾年,也感謝大家惦記著曉燕,昨天還有人送花、安慰及祝福。<U+00A0>她感動地說:「我會記住大家的好,現在能過平安的日子,但不能忘懷曉燕受難的那個時刻,才能勇敢的為所有受難者發聲。」白冰冰昨天一整個早上在佛堂念經跟曉燕說話,「下午整理東西,整理心情,天亮後又是一個新的開始」,堅強的母性令人心疼。(陳嘉婉/綜合報導)<U+00A0> 白冰冰談及白曉燕命案,感嘆時光飛逝。翻攝白冰冰臉書
## 4                                                                                                                                                                                                                                                                                                                                                                                      今天好萊塢喜事連連,繼「花邊教主」布蕾克萊弗莉有喜,為老公萊恩雷諾斯懷了第2胎,「好萊塢男神」萊恩葛斯林的42歲性感女友伊娃曼德斯也傳出懷孕,再度成為高齡產婦。<U+00A0>葛斯林2012年拍攝《末日車神》時與伊娃曼德斯譜戀曲,交往多年一直遲遲沒有結婚,但2人已經育有1女,現又傳出有了第2個愛的結晶,伊娃曼德斯被拍到出現在洛杉磯,以大包包遮住腹部,疑似想遮掩孕肚。(封以恩/綜合報導)<U+00A0> 伊娃曼德斯(左)和萊恩葛斯林交往多年未婚,但已育有1女。翻攝每日郵報
## 5                                                                                                                                                                      隋棠今出席阿瘦皮鞋活動,力挺全天下辛勞的媽咪,她說,很多現代媽媽都是身兼數職,格外令人心疼。談到今年母親節,她說是她當媽媽後第一次過節,自己為人母後,更能體驗母親的辛勞,今年想要好好幫媽媽和婆婆過節,不過距離母親節還有1個月,目前還沒有具體想法。<U+00A0>前兩天隋棠和老公帶兒子Max開車到台南、墾丁旅行,她透露因為表妹在台南開民宿,順道去體驗了一下,台南美食果然名不虛傳,她跟Max吃很多,母子倆回台北竟然雙雙變胖了,而第一次長途旅行的Max也十分配合,路上不是吃就是睡,7個多月大的他,上車睡覺、直接尿尿,讓她覺得一點也不麻煩。(葉婉如/台北報導)<U+00A0> 隋棠透露前幾天到台南吃喝竟吃胖了。阿瘦皮鞋提供 隋棠帶兒子Max第一次長途旅行,兒子在車上很乖巧。翻攝隋棠臉書
## 6                                                                                             日本型男伊勢谷友介被爆和名媛模特兒森星半同居,2人同進同出他的住處,他還開車送女方出門工作,報導曝光後,大家才知道原來他和長澤雅美早就切了!<U+00A0>將滿40歲的伊勢谷友介,歷任女友包括廣末涼子、吉川雛乃、木村佳乃等,一字排開羨煞世間男性。據《FRIDAY》周刊,他和28歲的長澤雅美2012年展開交往,男方友人透露,因雅美頻頻催婚,他斷然拒絕,2人大吵一架,已於1年前分手。<U+00A0>他的新歡森星長相甜美,本月22日滿24歲,曾在巴黎生活,今年3月剛從慶應大學畢業,祖母是名設計師森英惠,姊姊森泉也是藝人。去年11月伊勢谷友介上她擔任助理主持的料理節目,交換聯絡方式後來電,迅速進展到半同居,情場浪子和千金小姐的配對備受矚目。(吳惠菁/綜合報導)<U+00A0> 伊勢谷友介(左)和森星打扮休閒一起遛狗。翻攝《FRIDAY》森泉(右)、森星是日本名媛姊妹花。翻攝森星IG
##                                        title                  dt category
## 1           澎恰恰收女弟子 拱當台灣第一名伶 2016-04-15 14:17:00     娛樂
## 2 【唱新聞】詐騙嗎?R.O.C.有CHINA但不是CHINA 2016-04-15 14:00:00     娛樂
## 3         白曉燕命案19年了 白冰冰「不能忘」 2016-04-15 13:49:00     娛樂
## 4           好萊塢男神好威 女友再當高齡產婦 2016-04-15 13:40:00     娛樂
## 5         隋棠帶兒遠征南台灣 吃成膨皮母子檔 2016-04-15 13:30:00     娛樂
## 6   伊勢谷友介掰了長澤雅美 半同居小16歲辣模 2016-04-15 13:23:00     娛樂
##   view_cnt
## 1     1749
## 2    11696
## 3     3329
## 4     4307
## 5     4651
## 6     5141
head(filter(applenews, category == '娛樂' | view_cnt >= 1000))
##                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                         content
## 1 (更新:新增影片)想要透過刮刮樂彩券一夕致富,但他卻用錯方法!台中市一名黃姓男子覬覦頭獎高達2600萬的「開門見喜」刮刮樂彩券,上月佯裝顧客進入彩券行,趁女店員拿出11張彩券供其挑選時,抓起彩券奪門而出騎車逃逸,警方調閱監視器循線追查,昨日在北區逮捕黃嫌,他坦承搶來的彩券共刮中1萬4千多元,但已經兌獎花用殆盡,警方訊後將全案依詐欺罪嫌移送。<U+00A0>警方調查,黃姓男子﹝27歲﹞上個月頭戴安全帽及口罩,到河南路一家彩券行佯稱購買每張售價2000元的「開門見喜」刮刮樂,並要求挑選彩券號碼,朱姓女店員不疑有他,從櫃檯拿出連號彩券總計11張供其挑選,黃男竟趁朱女不注意之際,抓起彩券奪門而出,並跳上一旁機車逃逸,店家總計損失新臺幣2萬2,000元。<U+00A0>轄區第六分局何安派出所獲報,調閱路口監視器過濾比對,發現嫌犯已預謀將車牌用紅色口罩遮蔽,逃逸時刻意繞行小巷,更3次變裝意圖混淆警方追查,只是看似完美無瑕的犯罪計畫,卻在飆速逃逸時口罩隨風微微揚起,車牌部分英文及數字號碼在鏡頭下仍能辨識,在員警比對將近百支監視鏡頭畫面後,通知孫姓車主到案說明。<U+00A0>孫男到案後表示,案發前已將機車借給黃姓友人使用,但無法提供黃嫌聯絡方式,警方鍥而不捨擴大比對監視畫面,鎖定黃嫌時常出沒北區北平三街一帶,經過日埋伏,昨天逮到狡猾的黃嫌,他供稱因缺錢花用,迫於無奈下才出此下策,所得彩券刮開後總計兌換彩金1萬4,500元,且已全數花費殆盡,警方訊後將全案依詐欺罪嫌移送。(王煌忠/台中報導)<U+00A0>發稿:1304更新:1432<U+00A0> 黃姓男子佯裝購買刮刮樂,趁選號時一把抓走刮刮樂逃逸,女店員當下傻眼不已。翻攝畫面黃嫌逃逸時將車牌以口罩遮住,逃避警方追查。翻攝畫面
## 2                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                 俄羅斯夫妻Murad和Nataly,因牽手背景照「Follow Me To」聞名,昨天他們受丹麥品牌PANDORA之邀以A Journey of Love為主題,在信義誠品舉辦攝影展,其中多套美麗的禮服皆出於藝人賈永婕經營的C.H Wedding。<U+00A0>其中包括代表台灣廟宇文化的屏東東龍宮、信仰勝地佛光山及搭上阿里山小火車的3個地點,Nataly都身穿C.H Wedding的手工禮服,拍攝出的絕美照片,令人屏息,原來台灣這麼美。(時尚中心/綜合報導)<U+00A0>想知道更多,一定要看……牽手夫妻戴PANDORA 拍出驚豔台灣美<U+00A0> 牽手夫妻每張照片皆花費不少心力。翻攝C.H Wedding官網Nataly身穿C.H Wedding的手工禮服拍攝。翻攝C.H Wedding官網俄羅斯夫妻Murad和Nataly昨出席攝影展。朱世閎攝
## 3                                                                   台灣浩鼎生技股份有限公司(4174)今(15)日中午在法務部公司搜索後,再度發布聲明:該公司自信一切行事合法,絕對積極配合調查,協助司法儘速釐清真相;但也籲請司法調查單位秉持偵查不公開原則,勿將公司基於信任政府和司法,在搜索中所交付的商業機密隨意對外公開,讓公司數十年研發心血付諸流水,將嚴重影響及股東權益,並使國內生技產業重挫。<U+00A0>浩鼎指出,檢調搜索後攜走大量資料,包括公司許多智財、技術和研究數據,令員工非常耽憂,唯恐在研究發表前數據外流,將嚴重影響公司未來發展。<U+00A0>由於特定媒體已連續三周「獨家」報導浩鼎相關訊息,報導雖不實,但部分資料均來自主管單位要求公司陳交之內部資料,這些資料從未對外提供;今天檢調一抵搜索現場,該媒體相關部門即來電查證,在偵查不公開下,特定媒體在第一時間即知曉,令浩鼎為之驚訝與耽憂。<U+00A0>本公司在此嚴正聲明:本公司已獲邀今年六月將前往美國臨床腫瘤醫學會年會口頭發表OBI-822臨床試驗計畫解盲報告論文,依據學術規範,在發表前相關數據皆不得揭露;浩鼎也籲請媒體尊重司法,若因數據外流而導致公司及投資人權益損失,公司將依據「營業秘密法」及相關法規,對洩密及傳播者追訴及求償。<U+00A0>浩鼎也呼籲投資人不用驚慌,公司營運正常,經得起考驗;公司也在事前即告知員工,積極配合調查;惟有儘速將真相查明,才能還公司清白。20160415台灣浩鼎生技股有限公司(4174)今天發表聲明:公司自信無任何不法情事,願意主動配合司法調查,也懇請司法單位秉持公平正義原則,保障合法百姓和業者權益,早日釐清案情,還給浩鼎公道。(江俞庭/台北報導)<U+00A0>
## 4                                                                                                                                                                                                                                                                                                                              本內容由中央廣播電臺提供<U+00A0><U+00A0> <U+00A0> <U+00A0> <U+00A0>衛生福利部國民健康署今天(15日)發布最新出爐的2013年癌症登記資料分析,結果台灣民眾的癌症時鐘較10年前撥快了1.5倍,每5分18秒就有1個人罹癌,統計2013年罹癌人數將近10萬人,其中大腸癌名列第一,50到74歲有篩檢的民眾當中,每21人就有1人發現大腸病變,其中1成是大腸癌。<U+00A0> <U+00A0> <U+00A0> <U+00A0>國健署署長邱淑媞示,大腸癌無論發生率或死亡率都是男性多於女性,原因與男性不愛做篩檢有很大關係。另外,台灣大腸癌死亡率在36個OECD國家排名第10,發生率排名第5。除了大腸癌之外,其它前10大癌症包括肝癌、肺癌、乳癌、口腔癌、攝護腺癌、胃癌、皮膚癌、甲狀腺癌、食道癌。<U+00A0> <U+00A0> <U+00A0> <U+00A0>全世界處理癌症登記資料分析時間都要2年時間,台灣自1979年開始,成為亞洲第一個做癌症登記的國家,加上有全民健保及醫療院所資訊化,因此涵蓋的癌症資料數將近百分之百,也成為全球推癌症防治取經的對象。<U+00A0> <U+00A0> <U+00A0> <U+00A0>邱淑媞呼籲民眾把握2年一次大腸癌篩檢的機會,一有病變就切掉,永除後患。此外,生活中也要力行「4不3要」也就是,不菸酒檳榔、不吃燒烤紅肉、不加工重口味以及避免環境汙染,同時要天然蔬果、要多運動、也要定期檢查。(繼續閱讀)
## 5                                                                                                                                                                                                                                                                                                                                                                                                                                                                  連結嘉義縣民雄與竹崎交流道的嘉166線道民雄鄉大崎村段,近來出現可愛的Q版千里眼造型看板寫著「人在做 天在看」、「眾神有咧看」,原來是該路段經常有沒有公德心的駕駛隨亂丟垃圾,讓原本賞心悅目的安全島花台堆滿垃圾,大崎村民相當氣憤,手寫看板勸導無效,於是設計千里眼看板高掛電線桿,拜託不要再亂垃圾!<U+00A0>嘉166線可連接中山高速公路民雄交流道與福爾摩沙國道三號竹崎交流道,車輛絡繹不絕也帶來不少垃圾,大崎村民幾乎是每天看見安全島沿線保麗龍杯、便當盒、飲料罐、檳榔渣等垃圾遍布,撿了隔天又是相同景象,既氣憤又無奈!<U+00A0>村民表示,過去張貼手寫看板,希望司機們考量地方原本整潔美觀,路過不要破壞環境,一起維護家園整潔,但是軟性訴求看起來沒有改善,清潔志工每月都在車水馬龍的馬路周圍一再清出垃圾,真的不堪其擾。<U+00A0>村民們委託設計師以Q板千里眼神像加上警示標語「眾神有咧看」,期盼遏阻隨手丟垃圾歪風。沿線40面看板共花費萬餘元,可能是神明庇佑吧,懸掛以來垃圾量已明顯減少。(李宗祐/嘉義報導) 嘉166線來往車輛頻繁。李宗祐攝掛在分隔島上的Q版神明呼籲不要亂丟垃圾。李宗祐攝
## 6                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                            日本九州熊本縣遭強震重創,民航局表示,華航即日起到5月8日止,從台灣飛往九州的熊本、宮崎、鹿兒島、福岡等班機,若要取消,退費或改班將可免收手續費。(李姿慧/台北報導)<U+00A0><U+00A0>
##                                                title                  dt
## 1       【更新】搶2.2萬彩券刮中1.4萬 沒發財還得入獄 2016-04-15 14:32:00
## 2                全球最閃牽手夫妻 絕美禮服出自台灣… 2016-04-15 14:28:00
## 3               公司遭搜索 浩鼎籲檢調勿公開商業機密 2016-04-15 14:28:00
## 4      【央廣RTI】每318秒就有1人罹癌  大腸癌名列第一 2016-04-15 14:25:00
## 5                         垃圾掉滿地 村民請神明幫忙 2016-04-15 14:24:00
## 6 【熊本強震】取消去九州 華航5月8日前退改票免手續費 2016-04-15 14:24:00
##   category view_cnt
## 1     社會     1754
## 2     時尚      311
## 3     財經       24
## 4     生活       20
## 5     生活      314
## 6     生活       27
head(filter(applenews, category %in% c('娛樂', '社會')))
##                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                          content
## 1                                                                                                                                  (更新:新增影片)想要透過刮刮樂彩券一夕致富,但他卻用錯方法!台中市一名黃姓男子覬覦頭獎高達2600萬的「開門見喜」刮刮樂彩券,上月佯裝顧客進入彩券行,趁女店員拿出11張彩券供其挑選時,抓起彩券奪門而出騎車逃逸,警方調閱監視器循線追查,昨日在北區逮捕黃嫌,他坦承搶來的彩券共刮中1萬4千多元,但已經兌獎花用殆盡,警方訊後將全案依詐欺罪嫌移送。<U+00A0>警方調查,黃姓男子﹝27歲﹞上個月頭戴安全帽及口罩,到河南路一家彩券行佯稱購買每張售價2000元的「開門見喜」刮刮樂,並要求挑選彩券號碼,朱姓女店員不疑有他,從櫃檯拿出連號彩券總計11張供其挑選,黃男竟趁朱女不注意之際,抓起彩券奪門而出,並跳上一旁機車逃逸,店家總計損失新臺幣2萬2,000元。<U+00A0>轄區第六分局何安派出所獲報,調閱路口監視器過濾比對,發現嫌犯已預謀將車牌用紅色口罩遮蔽,逃逸時刻意繞行小巷,更3次變裝意圖混淆警方追查,只是看似完美無瑕的犯罪計畫,卻在飆速逃逸時口罩隨風微微揚起,車牌部分英文及數字號碼在鏡頭下仍能辨識,在員警比對將近百支監視鏡頭畫面後,通知孫姓車主到案說明。<U+00A0>孫男到案後表示,案發前已將機車借給黃姓友人使用,但無法提供黃嫌聯絡方式,警方鍥而不捨擴大比對監視畫面,鎖定黃嫌時常出沒北區北平三街一帶,經過日埋伏,昨天逮到狡猾的黃嫌,他供稱因缺錢花用,迫於無奈下才出此下策,所得彩券刮開後總計兌換彩金1萬4,500元,且已全數花費殆盡,警方訊後將全案依詐欺罪嫌移送。(王煌忠/台中報導)<U+00A0>發稿:1304更新:1432<U+00A0> 黃姓男子佯裝購買刮刮樂,趁選號時一把抓走刮刮樂逃逸,女店員當下傻眼不已。翻攝畫面黃嫌逃逸時將車牌以口罩遮住,逃避警方追查。翻攝畫面
## 2                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                             新北市一名33歲男子和另名女子在新莊區同居,卻在2015年6月一大早,及7月中深夜,趁同居女子的10歲女兒熟睡時猥褻其下體、胸部,女童驚醒才罷手。新北地院審酌男子認罪並達成和解,還寫道歉信並搬走,今依故意對兒童犯乘機猥褻罪輕判1年2月徒刑,緩刑3年,另須保護管束;仍可上訴。<U+00A0>2015年,男子跟女子同居新莊,卻在6月某天6時許,撞見同居女子的10歲女兒正熟睡,手伸入其內褲猥褻其下體,女童驚醒才停手。事隔1個月後,男子又趁女童深夜時熟睡,撫摸其胸部,女童再次驚醒,才未再猥褻。<U+00A0>新北地院認為,男子身為女子的同居人,等同父執輩,卻未照護該年幼女童,反為了滿足個人性慾,罔顧人倫而乘機猥褻,但考量男子沒前科,犯後始終坦承犯行,已達成和解,寫下道歉信,搬離新莊住處,女童及同居人也表明不願追究,雖判刑1年2月,但給予緩刑也須保護管束。(孫友廉/新北報導)<U+00A0>【更多司法新聞,請看《蘋果陪審團》粉絲團】
## 3                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                              澎恰恰今簽下新人張芳瑜,準備栽培她演出台灣音樂劇。澎恰恰透露張芳瑜是美國百老匯授權的《媽媽咪呀》國際中文版女主角,巡演超過900場,潛力無窮,「看好她未來是台灣音樂劇第一名伶」。張芳瑜現場也進行拜師儀式,向澎恰恰下跪奉茶,以示慎重。(蔡維歆/台北報導)<U+00A0>
## 4 (新增:讀者直擊影片)<U+00A0>台北市基隆路三段台大動物醫院前,今早9時許發生嚴重車禍,1輛價值約500萬的BMW740Li車,疑似駕駛恍神先撞擊橋墩側翻滑行後,又波及正在行駛中的公車,造成車窗玻璃碎裂,所幸沒有人員受傷,相關肇事責任還需警方釐清。<U+00A0>公車駕駛表示,當時車上約有50多名乘客,從公館往市府方向行駛,在行經台大動物醫院前時,聽到「碰」的一聲巨響,從後照鏡發現,內線車道的BMW撞到橋墩,隨即側翻直接撞到公車左側,還撞破了一扇車窗玻璃,還好玻璃碎沒有傷到乘客。<U+00A0>BMW車輛側翻後駕駛還被安全帶繫著,許多行經目擊的機車騎士都停下車幫忙,約20人合力先將車輛翻正,再從駕駛座上救人到路旁休息,肇事駕駛一度恍神無法言語,對於車禍發生經過完全說:「不記得!」這起車禍還造成基隆路車回堵。(突發中心余思維/台北報導)<U+00A0>《蘋果日報》表示,本則影片或照片是投訴人獨家提供《蘋果日報》,若其他媒體未取得授權逕行翻攝,也未註明出處,《蘋果》必訴諸法律,以保障權益。<U+00A0>《蘋果日報》歡迎讀者加入監督社會,向《蘋果》獨家提供照片、影片,經採用可獲獎金,照片一千,影片兩千元,每周點閱數最高,更可獲獎金三萬元,請參考活動網址:http://www.appledaily.com.tw/complainevent/<U+00A0>出版1215更新1412<U+00A0><U+00A0><U+00A0> BMW側翻,後方騎士驚險穿越,幸運沒有追撞上。翻拍畫面BMW側翻後,再撞上一旁的公車。翻拍畫面BMW側翻撞車後,後方車輛全都緊急停下。翻拍畫面BMW740Li車撞到橋墩後,左前輪嚴重毀損,造成側翻後又撞公車。余思維攝車禍現場滿地BMW車輛零件,以及公車玻璃碎片。余思維攝BMW側翻時,撞擊公車左側,造成玻璃碎裂。余思維攝公車玻璃碎裂噴濺,所幸沒有造成乘客受傷。余思維攝BMW疑似撞擊橋墩後發生側翻。余思維攝BMW駕駛對於發生經過,向警方表示:「不記得。」余思維攝
## 5                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                        肯亞警方強押45名台灣人遣送中國,輿論譁然。「星光幫」冠軍賴銘偉有感,改陳奕迅《你的背包》為《你的台胞》,要唱給話術不輸詐騙集團的中國人民共和國與中華民國政府。(娛樂中心/綜合報導)<U+00A0> 肯亞被判無罪釋放的台籍嫌犯(綠衣者)竟被押送到中國。新華社
## 6                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                               台中市一名年逾9旬的魏姓老翁,前天到北屯區一家汽車銷售中心,卻霸坐在展售車上不願離去,警方獲報前往協助,老翁竟語出驚人說「我想要坐車去南京,司機呢?趕快來開車啊」,原來這名有多次走失紀錄的老翁,疑似返鄉心切,欲搭車返回南京,最後通知其女兒到場,好言勸說後才將老翁帶回家,化解這場烏龍鬧劇。<U+00A0>警方表示,台中市北屯區一間汽車銷售中心,前天下午突然走進一名年逾9旬的魏姓老爺爺,毫不理會現場銷售人員招呼,直接就打開車門坐上展示車後座,銷售人員對於老爺爺的怪異舉動錯愕不已,繼續趨前詢問需要甚麼協助,但老爺爺始終不願回應,無奈打電話向警方求助。<U+00A0>轄區第五分局四平所警員到場,詢問老爺爺為何要坐在車上,他竟回說「我想要坐車去南京,司機呢?趕快來開車啊」,警員聽聞既好氣又好笑說「伯伯,這台是人家的展售車,而且要到南京必須坐飛機才會到,這台車不會飛啦!」由於老翁仍堅持坐在車內,警方只好透過警政署知識聯網系統查詢,發現魏姓老翁已有多次走失紀錄,遂通知其女兒到場,經女兒好言勸說後,老翁才心不甘情不願隨女兒返家。(王煌忠/台中報導)<U+00A0><U+00A0>
##                                          title                  dt
## 1 【更新】搶2.2萬彩券刮中1.4萬 沒發財還得入獄 2016-04-15 14:32:00
## 2                   同居人女兒熟睡 淫男伸狼爪 2016-04-15 14:22:00
## 3             澎恰恰收女弟子 拱當台灣第一名伶 2016-04-15 14:17:00
## 4    【驚險有片】BMW撞翻撞公車 後方機車神穿越 2016-04-15 14:12:00
## 5   【唱新聞】詐騙嗎?R.O.C.有CHINA但不是CHINA 2016-04-15 14:00:00
## 6               九巡翁霸坐展售車? 原因好心酸 2016-04-15 13:52:00
##   category view_cnt
## 1     社會     1754
## 2     社會     1076
## 3     娛樂     1749
## 4     社會    11886
## 5     娛樂    11696
## 6     社會     4582
# R Version
head(applenews[    ,  c('category', 'view_cnt') ])
##   category view_cnt
## 1     社會     1754
## 2     國際        0
## 3     地產        0
## 4     國際        0
## 5     時尚      311
## 6     財經       24
# Dplyr Version
head(select(applenews, category, view_cnt))
##   category view_cnt
## 1     社會     1754
## 2     國際        0
## 3     地產        0
## 4     國際        0
## 5     時尚      311
## 6     財經       24
#  R Version
head(applenews[applenews$category == '社會',   c('category', 'view_cnt')])
##    category view_cnt
## 1      社會     1754
## 11     社會     1076
## 19     社會    11886
## 26     社會     4582
## 34     社會     1154
## 35     社會     4322
# Dplyr Version
head(select(filter(applenews, category == '社會'), category, view_cnt))
##   category view_cnt
## 1     社會     1754
## 2     社會     1076
## 3     社會    11886
## 4     社會     4582
## 5     社會     1154
## 6     社會     4322
# %>% magritter
applenews  %>% filter(category == '社會') %>% select(category, view_cnt) %>% head()
##   category view_cnt
## 1     社會     1754
## 2     社會     1076
## 3     社會    11886
## 4     社會     4582
## 5     社會     1154
## 6     社會     4322
#  R Version
tmp <- applenews[applenews$category == '社會',   c('category', 'view_cnt')]
tmp[order(tmp$view_cnt),]
##      category view_cnt
## 1079     社會   100425
## 648      社會   100973
## 74       社會     1011
## 688      社會   103829
## 1291     社會   104393
## 1352     社會    10464
## 1029     社會   106118
## 1095     社會    10684
## 11       社會     1076
## 515      社會    10772
## 583      社會   112086
## 299      社會    11274
## 303      社會    11274
## 934      社會    11409
## 57       社會     1147
## 34       社會     1154
## 526      社會    11706
## 19       社會    11886
## 1448     社會    12091
## 875      社會    12096
## 1107     社會   122619
## 574      社會    12356
## 835      社會    12791
## 1254     社會    13049
## 845      社會     1305
## 649      社會    13077
## 704      社會   131262
## 214      社會     1316
## 929      社會    13473
## 1104     社會    13588
## 1314     社會     1373
## 627      社會   138085
## 1263     社會     1381
## 696      社會   140109
## 666      社會    14017
## 467      社會    14023
## 86       社會    14450
## 833      社會   145415
## 891      社會    14572
## 508      社會   150666
## 60       社會    15328
## 1482     社會     1562
## 1227     社會    15809
## 849      社會     1584
## 1483     社會    15959
## 916      社會     1602
## 640      社會    16035
## 234      社會    16970
## 1110     社會   171408
## 261      社會   172024
## 126      社會    17249
## 1        社會     1754
## 236      社會    17912
## 1460     社會    17937
## 1241     社會    17992
## 1377     社會    18045
## 1463     社會    18176
## 652      社會    18487
## 947      社會     1883
## 925      社會     1957
## 1409     社會    19741
## 56       社會     1989
## 911      社會    20388
## 1361     社會   214796
## 1312     社會   217096
## 474      社會    22370
## 779      社會     2261
## 1048     社會   228203
## 1267     社會    22872
## 144      社會    22995
## 1088     社會    23014
## 521      社會     2323
## 512      社會    23574
## 829      社會     2409
## 569      社會   241842
## 175      社會     2491
## 138      社會     2518
## 549      社會     2567
## 1301     社會    26151
## 887      社會    26555
## 447      社會    27477
## 730      社會     2772
## 748      社會     2953
## 115      社會     2957
## 834      社會     3001
## 1310     社會     3002
## 636      社會    30343
## 912      社會     3043
## 743      社會    30836
## 1417     社會    31267
## 161      社會     3129
## 496      社會    31428
## 806      社會     3208
## 1211     社會     3259
## 92       社會     3263
## 895      社會     3501
## 493      社會    35349
## 769      社會     3554
## 847      社會     3590
## 702      社會    37106
## 84       社會     3747
## 1315     社會     3766
## 1220     社會    37863
## 487      社會     3856
## 1289     社會     3870
## 961      社會    39034
## 167      社會     3956
## 629      社會    39768
## 758      社會     3982
## 1353     社會    39911
## 633      社會     4005
## 1022     社會    40940
## 709      社會     4145
## 564      社會    41538
## 1323     社會     4173
## 858      社會     4218
## 289      社會    42724
## 109      社會     4273
## 1082     社會     4291
## 35       社會     4322
## 145      社會     4325
## 983      社會    43785
## 516      社會     4430
## 66       社會     4432
## 1097     社會    44688
## 26       社會     4582
## 1456     社會     4600
## 1260     社會    46020
## 998      社會     4606
## 840      社會     4655
## 1410     社會    47145
## 1411     社會    47145
## 547      社會     4743
## 1134     社會     4799
## 754      社會     5089
## 204      社會    53097
## 775      社會    53120
## 1198     社會    53421
## 399      社會     5431
## 548      社會     5441
## 741      社會     5480
## 415      社會    55128
## 290      社會    55616
## 1216     社會     5590
## 635      社會     5786
## 269      社會    57953
## 1276     社會     5886
## 1372     社會    59229
## 1466     社會     5940
## 319      社會     5954
## 670      社會    59580
## 502      社會    59690
## 1274     社會     6047
## 963      社會     6051
## 524      社會     6057
## 1486     社會     6084
## 771      社會     6390
## 556      社會    64238
## 973      社會     6432
## 1112     社會     6611
## 797      社會     7029
## 1090     社會     7122
## 1481     社會     7124
## 1101     社會    71849
## 480      社會     7430
## 596      社會     7486
## 1135     社會     7515
## 599      社會     7568
## 1099     社會    75710
## 557      社會    77064
## 1303     社會     7751
## 877      社會     8084
## 729      社會     8095
## 1495     社會     8163
## 78       社會     8186
## 690      社會    81948
## 1316     社會    82726
## 111      社會     8332
## 932      社會     8341
## 878      社會     8394
## 719      社會     8396
## 552      社會     8502
## 800      社會    85337
## 742      社會     8736
## 410      社會     9014
## 900      社會     9062
## 685      社會      918
## 1457     社會     9284
## 1446     社會     9292
## 1493     社會     9305
## 572      社會    93376
## 884      社會     9445
## 604      社會     9909
## 1199     社會     9918
# Dplyr Version
applenews$view_cnt <- as.numeric(applenews$view_cnt)
applenews  %>% filter(category == '社會') %>% select(category, view_cnt) %>% arrange(view_cnt)  %>% head()
##   category view_cnt
## 1     社會      918
## 2     社會     1011
## 3     社會     1076
## 4     社會     1147
## 5     社會     1154
## 6     社會     1305
applenews  %>% filter(category == '社會') %>% select(title, category, view_cnt) %>% arrange(desc(view_cnt) )  %>% head()
##                                         title category view_cnt
## 1 【更新】正晶揭露新詐騙案 7百萬存款不翼而飛     社會   241842
## 2        貴婦人妻太閒了 她只好和一些網友嘿咻     社會   228203
## 3  【告別小燈泡】爸爸首發聲 「仇恨滋長邪惡」     社會   217096
## 4      長得不像? 男驗DNA才知2女兒都非親骨肉     社會   214796
## 5    殺警再爆內幕 出牆妻再嫁黑道鄉長目的曝光     社會   172024
## 6            性愛偷拍後 璩美鳳這15年來這樣過     社會   171408
## Use mutate
# SELECT SUM(view_cnt) FROM applenews;
freqsum <- applenews %>% select(view_cnt) %>% sum()

applenews %>% select(view_cnt) %>% mutate(portion = view_cnt / freqsum) %>% head()
##   view_cnt      portion
## 1     1754 8.130151e-05
## 2        0 0.000000e+00
## 3        0 0.000000e+00
## 4        0 0.000000e+00
## 5      311 1.441549e-05
## 6       24 1.112449e-06
applenews <- applenews %>% mutate(portion = view_cnt /freqsum)

applenews %>% head()
##                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                         content
## 1 (更新:新增影片)想要透過刮刮樂彩券一夕致富,但他卻用錯方法!台中市一名黃姓男子覬覦頭獎高達2600萬的「開門見喜」刮刮樂彩券,上月佯裝顧客進入彩券行,趁女店員拿出11張彩券供其挑選時,抓起彩券奪門而出騎車逃逸,警方調閱監視器循線追查,昨日在北區逮捕黃嫌,他坦承搶來的彩券共刮中1萬4千多元,但已經兌獎花用殆盡,警方訊後將全案依詐欺罪嫌移送。<U+00A0>警方調查,黃姓男子﹝27歲﹞上個月頭戴安全帽及口罩,到河南路一家彩券行佯稱購買每張售價2000元的「開門見喜」刮刮樂,並要求挑選彩券號碼,朱姓女店員不疑有他,從櫃檯拿出連號彩券總計11張供其挑選,黃男竟趁朱女不注意之際,抓起彩券奪門而出,並跳上一旁機車逃逸,店家總計損失新臺幣2萬2,000元。<U+00A0>轄區第六分局何安派出所獲報,調閱路口監視器過濾比對,發現嫌犯已預謀將車牌用紅色口罩遮蔽,逃逸時刻意繞行小巷,更3次變裝意圖混淆警方追查,只是看似完美無瑕的犯罪計畫,卻在飆速逃逸時口罩隨風微微揚起,車牌部分英文及數字號碼在鏡頭下仍能辨識,在員警比對將近百支監視鏡頭畫面後,通知孫姓車主到案說明。<U+00A0>孫男到案後表示,案發前已將機車借給黃姓友人使用,但無法提供黃嫌聯絡方式,警方鍥而不捨擴大比對監視畫面,鎖定黃嫌時常出沒北區北平三街一帶,經過日埋伏,昨天逮到狡猾的黃嫌,他供稱因缺錢花用,迫於無奈下才出此下策,所得彩券刮開後總計兌換彩金1萬4,500元,且已全數花費殆盡,警方訊後將全案依詐欺罪嫌移送。(王煌忠/台中報導)<U+00A0>發稿:1304更新:1432<U+00A0> 黃姓男子佯裝購買刮刮樂,趁選號時一把抓走刮刮樂逃逸,女店員當下傻眼不已。翻攝畫面黃嫌逃逸時將車牌以口罩遮住,逃避警方追查。翻攝畫面
## 2                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                           澳洲一名就讀雪梨大學的華裔博士生,日前公開一段燒毀中國護照的影片,還大肆批評留澳學生是一群「留學豬」。消息傳出後,這名博士生立刻被大陸網友起底。<U+00A0>據悉,該博士生姓名為吳維,正在雪梨大學攻讀金融學博士,同時在該校任教,並於去年加入澳洲籍。該博士生的微博名為「Pekojima」,該賬號從2012年開始一直處於活躍狀態。他稱自己為「澳洲公民」、「雪梨大學商學院全獎」、「金融系 Ph.D.」、「本系必修課head tutor」。但此微博現已被刪除。他也曾在微博上諷刺中國留學生的智商,稱他們「要花錢找論文代寫」,並侮辱留學生為「留學豬」。<U+00A0>英國《每日郵報》報導稱,雪梨大學已開始調查他焚燒中國護照一事。(大陸中心/綜合報導)<U+00A0>更多國際新聞請進蘋果繞著地球爆<U+00A0><U+00A0> 翻攝網路翻攝網路
## 3                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                【行銷專題企劃】房價高高在上,沒錢買房沒關係,但你認為自己是聰明的租屋族嗎? 由蘋果地產與FBS TV合作的全新節目-房市大追擊,本集節目邀請到房產專家陳高超、皇冠開發董事長林錦宗,東森房屋高峰會副總會長陳文祥,告訴你租屋也有很多該注意的地方喔!<U+00A0>其實不只有買房,租屋糾紛也很多。尤其,坊間常見的二房東問題相當多,這真的有其合法性嗎?陳副總會長除了一一解釋與建議之外,也認為房東應完全負起修繕的權力與義務,若房客發現房東總是針對問題置之不理,房客也可寄出存證信函留下證據,藉此保護自己,若仍再無法解決,可要求提前解除租約喔!<U+00A0>至於前一陣子炒得沸沸揚揚的租屋專法草案,對於房東與房客兩者問題是真能解決呢?專家陳高超認為,安全才是租屋時最應該注意的一點。而購買地上權或使用權建案,其實也是另類的租屋方式喔!<U+00A0><U+00A0>想了解更多房屋相關議題,趕緊鎖定房市大追擊,每周只要花20分鐘,更新你的房產知識:home.appledaily.com.tw/video/index/25/155227/
## 4                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                       本內容由中央廣播電臺提供<U+00A0><U+00A0> <U+00A0> <U+00A0> <U+00A0>美國國防部長卡特(Ash Carter)今天(15日)表示,他今天將前往在菲律賓所屬的南海海域巡航的美國船艦上視察。卡特所指的是美國與菲律賓正進行的年度軍事演習,該演習將於今天結束。卡特這次登上軍艦視察將是展現美國對維護南海水域安全承諾的最新行動。<U+00A0> <U+00A0> <U+00A0> <U+00A0>卡特在馬尼拉表示,「我會在今天稍後,在部份海軍與海軍陸戰人員參與肩並肩(Balikatan)演習後,到正在南海巡航的航空母艦史丹尼斯號(USS John C. Stennis)上視察。」美國與菲律賓所進行的肩並肩聯合軍演將於今天正式閉幕,雖然美菲雙方一再重申沒有針對性,但在南海爭議的背景下,美方承諾協助菲國「防衛領土」。<U+00A0> <U+00A0> <U+00A0> <U+00A0>中國大陸一直聲稱擁有絕大部份的南海主權,並且在多處岩礁填海造陸,中國大陸的行動造成與其他南海主權聲索國,例如菲律賓和越南的緊張對峙,而且大陸也拒絕國際對南海問題進行仲裁。(繼續閱讀)
## 5                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                 俄羅斯夫妻Murad和Nataly,因牽手背景照「Follow Me To」聞名,昨天他們受丹麥品牌PANDORA之邀以A Journey of Love為主題,在信義誠品舉辦攝影展,其中多套美麗的禮服皆出於藝人賈永婕經營的C.H Wedding。<U+00A0>其中包括代表台灣廟宇文化的屏東東龍宮、信仰勝地佛光山及搭上阿里山小火車的3個地點,Nataly都身穿C.H Wedding的手工禮服,拍攝出的絕美照片,令人屏息,原來台灣這麼美。(時尚中心/綜合報導)<U+00A0>想知道更多,一定要看……牽手夫妻戴PANDORA 拍出驚豔台灣美<U+00A0> 牽手夫妻每張照片皆花費不少心力。翻攝C.H Wedding官網Nataly身穿C.H Wedding的手工禮服拍攝。翻攝C.H Wedding官網俄羅斯夫妻Murad和Nataly昨出席攝影展。朱世閎攝
## 6                                                                   台灣浩鼎生技股份有限公司(4174)今(15)日中午在法務部公司搜索後,再度發布聲明:該公司自信一切行事合法,絕對積極配合調查,協助司法儘速釐清真相;但也籲請司法調查單位秉持偵查不公開原則,勿將公司基於信任政府和司法,在搜索中所交付的商業機密隨意對外公開,讓公司數十年研發心血付諸流水,將嚴重影響及股東權益,並使國內生技產業重挫。<U+00A0>浩鼎指出,檢調搜索後攜走大量資料,包括公司許多智財、技術和研究數據,令員工非常耽憂,唯恐在研究發表前數據外流,將嚴重影響公司未來發展。<U+00A0>由於特定媒體已連續三周「獨家」報導浩鼎相關訊息,報導雖不實,但部分資料均來自主管單位要求公司陳交之內部資料,這些資料從未對外提供;今天檢調一抵搜索現場,該媒體相關部門即來電查證,在偵查不公開下,特定媒體在第一時間即知曉,令浩鼎為之驚訝與耽憂。<U+00A0>本公司在此嚴正聲明:本公司已獲邀今年六月將前往美國臨床腫瘤醫學會年會口頭發表OBI-822臨床試驗計畫解盲報告論文,依據學術規範,在發表前相關數據皆不得揭露;浩鼎也籲請媒體尊重司法,若因數據外流而導致公司及投資人權益損失,公司將依據「營業秘密法」及相關法規,對洩密及傳播者追訴及求償。<U+00A0>浩鼎也呼籲投資人不用驚慌,公司營運正常,經得起考驗;公司也在事前即告知員工,積極配合調查;惟有儘速將真相查明,才能還公司清白。20160415台灣浩鼎生技股有限公司(4174)今天發表聲明:公司自信無任何不法情事,願意主動配合司法調查,也懇請司法單位秉持公平正義原則,保障合法百姓和業者權益,早日釐清案情,還給浩鼎公道。(江俞庭/台北報導)<U+00A0>
##                                          title                  dt
## 1 【更新】搶2.2萬彩券刮中1.4萬 沒發財還得入獄 2016-04-15 14:32:00
## 2             拿到澳洲護照後 他放火燒中國護照 2016-04-15 14:32:00
## 3       【特企】房市大追擊- 租屋這些事情要小心 2016-04-15 14:31:00
## 4          【央廣RTI】美菲軍演  美防長南海登艦 2016-04-15 14:30:00
## 5          全球最閃牽手夫妻 絕美禮服出自台灣… 2016-04-15 14:28:00
## 6         公司遭搜索 浩鼎籲檢調勿公開商業機密 2016-04-15 14:28:00
##   category view_cnt      portion
## 1     社會     1754 8.130151e-05
## 2     國際        0 0.000000e+00
## 3     地產        0 0.000000e+00
## 4     國際        0 0.000000e+00
## 5     時尚      311 1.441549e-05
## 6     財經       24 1.112449e-06

Group By

data(iris)
head(iris)
##   Sepal.Length Sepal.Width Petal.Length Petal.Width Species
## 1          5.1         3.5          1.4         0.2  setosa
## 2          4.9         3.0          1.4         0.2  setosa
## 3          4.7         3.2          1.3         0.2  setosa
## 4          4.6         3.1          1.5         0.2  setosa
## 5          5.0         3.6          1.4         0.2  setosa
## 6          5.4         3.9          1.7         0.4  setosa
iris$Species
##   [1] setosa     setosa     setosa     setosa     setosa     setosa    
##   [7] setosa     setosa     setosa     setosa     setosa     setosa    
##  [13] setosa     setosa     setosa     setosa     setosa     setosa    
##  [19] setosa     setosa     setosa     setosa     setosa     setosa    
##  [25] setosa     setosa     setosa     setosa     setosa     setosa    
##  [31] setosa     setosa     setosa     setosa     setosa     setosa    
##  [37] setosa     setosa     setosa     setosa     setosa     setosa    
##  [43] setosa     setosa     setosa     setosa     setosa     setosa    
##  [49] setosa     setosa     versicolor versicolor versicolor versicolor
##  [55] versicolor versicolor versicolor versicolor versicolor versicolor
##  [61] versicolor versicolor versicolor versicolor versicolor versicolor
##  [67] versicolor versicolor versicolor versicolor versicolor versicolor
##  [73] versicolor versicolor versicolor versicolor versicolor versicolor
##  [79] versicolor versicolor versicolor versicolor versicolor versicolor
##  [85] versicolor versicolor versicolor versicolor versicolor versicolor
##  [91] versicolor versicolor versicolor versicolor versicolor versicolor
##  [97] versicolor versicolor versicolor versicolor virginica  virginica 
## [103] virginica  virginica  virginica  virginica  virginica  virginica 
## [109] virginica  virginica  virginica  virginica  virginica  virginica 
## [115] virginica  virginica  virginica  virginica  virginica  virginica 
## [121] virginica  virginica  virginica  virginica  virginica  virginica 
## [127] virginica  virginica  virginica  virginica  virginica  virginica 
## [133] virginica  virginica  virginica  virginica  virginica  virginica 
## [139] virginica  virginica  virginica  virginica  virginica  virginica 
## [145] virginica  virginica  virginica  virginica  virginica  virginica 
## Levels: setosa versicolor virginica
mean(iris[iris$Species == 'setosa', 'Petal.Length'])
## [1] 1.462
mean(iris[iris$Species == 'versicolor', 'Petal.Length'])
## [1] 4.26
mean(iris[iris$Species == 'virginica', 'Petal.Length'])
## [1] 5.552
tapply(iris$Petal.Length, iris$Species, mean)
##     setosa versicolor  virginica 
##      1.462      4.260      5.552
iris %>% group_by(Species) %>% summarise(length_avg = mean(Petal.Length))
## # A tibble: 3 x 2
##      Species length_avg
##       <fctr>      <dbl>
## 1     setosa      1.462
## 2 versicolor      4.260
## 3  virginica      5.552
## SELECT category, SUM(view_cnt) FROM applenews
## GROUP BY category;
applenews %>% group_by(category) %>% summarise(view_sum = sum(view_cnt, na.rm=TRUE)) %>% arrange(desc(view_sum) )
## # A tibble: 16 x 2
##                              category view_sum
##                                 <chr>    <dbl>
##  1                               社會  5721750
##  2                               娛樂  3571005
##  3                               生活  3417804
##  4                               國際  2485621
##  5                               政治  1701980
##  6                               體育  1598067
##  7                               正妹   672949
##  8                               搜奇   668307
##  9                               財經   618243
## 10                               論壇   312592
## 11                               時尚   260499
## 12                               地產   220812
## 13                                 3C   146308
## 14                               動物   123287
## 15 "國際\",\"LA\",\"SF\",\"NY\",\"US"    43627
## 16               "國際\",\"SF\",\"US"    11163
## SELECT category, SUM(view_cnt), SUM(portion) 
## FROM applenews GROUP BY category;

apple_stat <- applenews %>% group_by(category) %>% summarise_each(funs(sum), view_cnt, portion)
## `summarise_each()` is deprecated.
## Use `summarise_all()`, `summarise_at()` or `summarise_if()` instead.
## To map `funs` over a selection of variables, use `summarise_at()`
pie(apple_stat$view_cnt, labels = apple_stat$category)

#?pie


## SELECT category, MIN(view_cnt), MAX(view_cnt) 
## FROM applenews GROUP BY category

applenews %>% group_by(category) %>% summarise_each(funs(  min(.,na.rm=TRUE), max(., na.rm=TRUE), mean(.), median(.)) ,matches('view_cnt'))
## `summarise_each()` is deprecated.
## Use `summarise_all()`, `summarise_at()` or `summarise_if()` instead.
## To map `funs` over a selection of variables, use `summarise_at()`
## # A tibble: 16 x 5
##                              category view_cnt_min view_cnt_max
##                                 <chr>        <dbl>        <dbl>
##  1                                 3C          267        20509
##  2                               正妹         7999       344733
##  3                               生活           20       132880
##  4                               地產            0        80691
##  5                               社會          918       241842
##  6                               政治          221        83059
##  7                               娛樂         1631       299235
##  8                               時尚          311        67086
##  9                               財經           24        54886
## 10                               動物         1211        11753
## 11                               國際            0       150825
## 12 "國際\",\"LA\",\"SF\",\"NY\",\"US"         1034        12893
## 13               "國際\",\"SF\",\"US"         2875         4171
## 14                               搜奇          199        83036
## 15                               論壇          275        68208
## 16                               體育          523       162907
## # ... with 2 more variables: view_cnt_mean <dbl>, view_cnt_median <dbl>
## SELECT COUNT(*) FROM applenews

applenews %>% select(category) %>% summarise_each(funs(n()))
## `summarise_each()` is deprecated.
## Use `summarise_all()`, `summarise_at()` or `summarise_if()` instead.
## To map `funs` over all variables, use `summarise_all()`
##   category
## 1     1500
## SELECT COUNT(distinct(category)) FROM applenews
applenews %>% select(category) %>% summarise_each(funs(n_distinct(category)))
## `summarise_each()` is deprecated.
## Use `summarise_all()`, `summarise_at()` or `summarise_if()` instead.
## To map `funs` over all variables, use `summarise_all()`
##   category
## 1       16

資料統計

# SELECT category, SUM(view_cnt) AS view_sum FROM applenews
# GROUP BY category ORDER BY view_sum DESC;
apple_stat <- applenews %>% select(category, view_cnt) %>% group_by(category) %>% summarise(view_sum = sum(view_cnt)) %>% arrange(desc(view_sum))

#?barplot
apple_stat$category <- as.factor(apple_stat$category)

barplot(apple_stat$view_sum, names.arg = apple_stat$category, col = factor(apple_stat$category) )

# SELECT category, AVG(view_cnt) AS view_sum FROM applenews
# GROUP BY category ORDER BY view_sum DESC;
apple_stat <- applenews %>% select(category, view_cnt) %>% group_by(category) %>% summarise(view_mean = mean(view_cnt)) %>% arrange(desc(view_mean))


barplot(apple_stat$view_mean, names.arg = apple_stat$category, col = factor(apple_stat$category) )

## SELECT category, COUNT(category) FROM applenews
## GROUP BY category;

apple_stat2 <- applenews %>% select(category) %>% group_by(category) %>% summarise(view_cnt = n()) %>% arrange(desc(view_cnt))
#?pie

pie(apple_stat2$view_cnt, labels = apple_stat2$category, clockwise = TRUE, init.angle = 90)

## SELECT hour(dt), count(*) FROM applenews WHERE dt >= '2016-04-14' AND dt < '2016-04-15'  GROUP BY hour(dt);

str(applenews)
## 'data.frame':    1500 obs. of  6 variables:
##  $ content : chr  "(更新:新增影片)想要透過刮刮樂彩券一夕致富,但他卻用錯方法!台中市一名黃姓男子覬覦頭獎高達2600萬的「開門見喜」刮刮樂彩券,上月佯"| __truncated__ "澳洲一名就讀雪梨大學的華裔博士生,日前公開一段燒毀中國護照的影片,還大肆批評留澳學生是一群「留學豬」。消息傳出後,這名博士生立"| __truncated__ "【行銷專題企劃】房價高高在上,沒錢買房沒關係,但你認為自己是聰明的租屋族嗎? 由蘋果地產與FBS TV合作的全新節目-房市大追擊,本集節"| __truncated__ "本內容由中央廣播電臺提供<U+00A0><U+00A0> <U+00A0> <U+00A0> <U+00A0>美國國防部長卡特(Ash Carter)今天(15日)表示,他今天將前往在菲"| __truncated__ ...
##  $ title   : chr  "【更新】搶2.2萬彩券刮中1.4萬 沒發財還得入獄" "拿到澳洲護照後 他放火燒中國護照" "【特企】房市大追擊- 租屋這些事情要小心" "【央廣RTI】美菲軍演  美防長南海登艦" ...
##  $ dt      : POSIXct, format: "2016-04-15 14:32:00" "2016-04-15 14:32:00" ...
##  $ category: chr  "社會" "國際" "地產" "國際" ...
##  $ view_cnt: num  1754 0 0 0 311 ...
##  $ portion : num  8.13e-05 0.00 0.00 0.00 1.44e-05 ...
applenews$dt %>% head()
## [1] "2016-04-15 14:32:00 CST" "2016-04-15 14:32:00 CST"
## [3] "2016-04-15 14:31:00 CST" "2016-04-15 14:30:00 CST"
## [5] "2016-04-15 14:28:00 CST" "2016-04-15 14:28:00 CST"
?format
## starting httpd help server ...
##  done
format(applenews$dt, '%H') %>% head()
## [1] "14" "14" "14" "14" "14" "14"
hour_view <- applenews %>% select(dt) %>% filter(dt >= '2016-04-14' & dt < '2016-04-15') %>% mutate(hour = format(dt, '%H'))  %>% group_by(hour) %>% summarise(view_cnt = n()) 

plot(hour_view$view_cnt, type= 'line')
## Warning in plot.xy(xy, type, ...): 繪圖類型 'line' 被截短成第一個字元

hour_view2 <- applenews %>% select(dt, category) %>% filter(dt >= '2016-04-14' & dt < '2016-04-15' & category == '正妹') %>% mutate(hour = format(dt, '%H'))  %>% group_by(hour) %>% summarise(view_cnt = n()) 
hour_view2
## # A tibble: 4 x 2
##    hour view_cnt
##   <chr>    <int>
## 1    00        1
## 2    14        1
## 3    16        1
## 4    22        1
plot(hour_view2$view_cnt, type= 'line')
## Warning in plot.xy(xy, type, ...): 繪圖類型 'line' 被截短成第一個字元

作業三

getwd() 
## [1] "D:/OS DATA/Desktop"
download.file('https://github.com/ywchiu/rtibame/raw/master/Data/purchase.csv', 'purchase.csv')
purchase <- read.csv('purchase.csv', header = TRUE)

purchase %>% head(3)
##   X                Time Action         User     Product Quantity Price
## 1 0 2015-07-01 00:00:01  order   U312622727 P0006944501        1  1069
## 2 1 2015-07-01 00:00:03  order   U239012343 P0006018073        1  1680
## 3 2 2015-07-01 00:00:19  order U10007697373 P0002267974        1   285