Web scraping in practice

library(XML)
library(rvest)

## Loading required package: xml2

## 
## Attaching package: 'rvest'

## The following object is masked from 'package:XML':
## 
##     xml

library(stringr)

page <- readLines("https://news.daum.net/ranking/popular")
page_parsed <- htmlParse(page)

First Headline XPath: ‘//[@id="mArticle"]/div[2]/ul[3]/li[1]/div[2]/strong/a’ Second Headline XPath: ’//[@id="mArticle"]/div[2]/ul[3]/li[2]/div[2]/strong/a’

First Company XPath: ‘//[@id="mArticle"]/div[2]/ul[3]/li[1]/div[2]/strong/span’ Second Company XPath: ’//[@id="mArticle"]/div[2]/ul[3]/li[2]/div[2]/strong/span’

headline_xpath <- '//*[@id="mArticle"]/div[2]/ul[3]/li/div[2]/strong/a'
company_xpath <- '//*[@id="mArticle"]/div[2]/ul[3]/li/div[2]/strong/span'

headlines <- xpathSApply(page_parsed, headline_xpath, xmlValue)
headlines

##  [1] "화이자 \"임상 중인 백신, 90% 넘게 효과 있다\""                                                
##  [2] "'대권 도전' 시동 건 박용진, 與 대선 레이스 '다크호스' 되나"                                   
##  [3] "소화불량 7년 시달린 그녀.. 원인은 편두통이었다"                                               
##  [4] "\"토종 '칡소' 좀 살려주소\""                                                                  
##  [5] "화이자 백신 호재에 세계 증시·유가 일제히 폭등"                                               
##  [6] "손바닥에 거미 다리 모양 붉은 반점 생겼다면 \"간 검사 받으세요\""                              
##  [7] "검찰 '뇌물·횡령 혐의' 홍문종 징역9년 구형..洪 \"조작극\"(종합)"                              
##  [8] "무기 싣고 개표소로 돌진.. 펜실베이니아는 전쟁터였다"                                          
##  [9] "일제강점기 '명륜학원 졸업사진'..전주 최고 유교 기록물 선정"                                   
## [10] "세계인구 3분의 1 거대 경제권 탄생 임박..RCEP 협상 타결"                                       
## [11] "몸살 앓는 국토 대동맥 경부고속도로..수혈 위해 도심지역 입체화 시급"                           
## [12] "'돈세탁 혐의' 손정우, 구속영장 기각..\"도주우려 없어\""                                       
## [13] "박지원 만난 日집권당 2인자 \"신뢰 확신\"..한일관계 기대 발언"                                 
## [14] "철책 넘은 北 주민에 놀란 육군, 후방지역 대침투작전 점검"                                      
## [15] "\"언성 높이지 마세요\"..평택교육청, 의원 질의에 맞불 '행감 중지'"                             
## [16] "'어제의 동지' 트럼프에 일격..伊 베를루스코니 \"너무 거만했다\""                               
## [17] "'태움' 고통받다 극단적 선택..故 서지윤 간호사 산재 인정"                                      
## [18] "트럼프 '계산된 버티기', 2024년 대선 재출마 노리나"                                            
## [19] "'마지막 여행' 다녀온 김철민 \"다시 항암치료..끝까지 버틸 것\""                                
## [20] "윤석열, 차장들에게 '국민의 검찰' 강조..\"현안 언급 없었다\"(종합)"                            
## [21] "'코로나 이후 도시 공간' 제언, 유현준 교수 \"사람 많이 모일수록 좋은 도시란 공식 끝났다\""     
## [22] "[바이든 시대] 트럼프 지명 조달청장 요지부동..인수 지연"                                       
## [23] "[바이든 시대] 미 잡지가 본 '루저' 트럼프, 필사적으로 버티는 이유"                             
## [24] "'하늘의 응급실' 의무후송 전용헬기 軍 최초 도입"                                               
## [25] "난치성 파킨슨 증후군 치료 가능성 열렸다"                                                      
## [26] "푸틴이 바이든 축하 안하는 이유..크렘린 \"공식개표결과 나와야\""                               
## [27] "첫 '영구제명' 변호사, 또 실형..해임 경찰관에게 뇌물수수"                                      
## [28] "갓난 아기 때리고 던지고..CCTV에 '쿵' 소리까지"                                                
## [29] "여동생 밸러리가 이방카 역할하나..'바이든 패밀리' 눈길"                                        
## [30] "'웰컴 투 비디오' 손정우, 구속영장 기각..\"구속 사유 인정 어려워\""                            
## [31] "[단독] HDC현산 아시아나 포기안했나 \"금호리조트 매각말라\""                                   
## [32] "홍준표 \"전셋집 구했나\"..홍남기 \"개인적 상황이니 나중에\""                                  
## [33] "[바이든 시대] 트럼프에 누가 직언할까..\"측근들, 패배 알지만 조용\""                           
## [34] "만화계 오스카상 '쾌거'..세계가 격찬한 한국의 '그래픽 노블'"                                   
## [35] "바이든 코로나 부터 잡아라!..한국 언급한 측근 주목"                                            
## [36] "[바이든 시대] 일본 신문 \"바이든, 트럼프보다 한미관계 중시할 것\""                            
## [37] "성윤모 \"월성1호기 관련 압수수색에 매우 당혹\""                                               
## [38] "울산 남구 아파트 11층서 불..3천만원 피해"                                                     
## [39] "문 대통령, '바이든 시대' 공식화..\"바이든 사람들과 다방면 소통할 것\""                        
## [40] "물만 먹어도 살쪄? 기초대사량 늘리는 7가지 팁"                                                 
## [41] "코로나19 국내 확진자, 5주 연속 증가세..거리 두기 1.5단계 '경고등'"                            
## [42] "고개부터 숙인 민주당..국민의힘은 줄 잇는 출사표"                                              
## [43] "한번에 2,300억 줄여..학교 현장 비상"                                                          
## [44] "정품 마스크라더니..쿠팡, 뒤늦게 '무허가 마스크' 환불조치"                                     
## [45] "삼부토건, '이낙연 민주당 대표 동생' 이계연씨 대표 선임"                                       
## [46] "황상무 전 앵커, KBS에 사의 표명 \"공영방송, 한쪽 진영 서면 안 돼\""                           
## [47] "[바이든 시대] 트럼프 언급 한 마디 없이.. 메르켈 獨 총리, 바이든 당선 축하 성명"               
## [48] "국민의힘, 보궐선거 예선에 '여론조사 100% 적용' 가닥(종합)"                                    
## [49] "\"호수가 보이는 주택 갖고 싶어서\" 할아버지 살해한 美 20대 손녀"                              
## [50] "[주진우 라이브] 정세현 전 장관 \"바이든 정권 출범 후 복잡한 북핵 문제 셈법, 종전선언이 입구\""

companies <- xpathSApply(page_parsed, company_xpath, xmlValue)
companies

##  [1] "한국일보"   "한국일보"   "국민일보"   "경향신문"   "뉴스1"     
##  [6] "주간동아"   "뉴스1"      "오마이뉴스" "연합뉴스"   "연합뉴스"  
## [11] "노컷뉴스"   "뉴시스"     "연합뉴스"   "뉴시스"     "뉴스1"     
## [16] "연합뉴스"   "세계일보"   "한겨레"     "이데일리"   "뉴시스"    
## [21] "경향신문"   "연합뉴스"   "연합뉴스"   "KBS"        "뉴시스"    
## [26] "연합뉴스"   "KBS"        "MBC"        "채널A"      "이데일리"  
## [31] "조선일보"   "연합뉴스"   "연합뉴스"   "KBS"        "KBS"       
## [36] "연합뉴스"   "한겨레"     "연합뉴스"   "한국일보"   "코메디닷컴"
## [41] "경향신문"   "YTN"        "KBS"        "SBSCNBC"    "연합뉴스"  
## [46] "뉴스1"      "한국일보"   "뉴시스"     "머니투데이" "KBS"

Navigating throgh pages by URL manipulation

https://news.daum.net/ranking/popular?regDate=20201103 https://news.daum.net/ranking/popular?regDate=20201025 https://news.daum.net/ranking/popular?regDate=20201026

https://news.daum.net/ranking/popular https://news.daum.net/ranking/popular/all https://news.daum.net/ranking/popular/news https://news.daum.net/ranking/popular/entertain https://news.daum.net/ranking/popular/sports

https://news.daum.net/ranking/kkomkkom https://news.daum.net/ranking/kkomkkom/news https://news.daum.net/ranking/kkomkkom/entertain

https://news.daum.net/ranking/bestreply

https://news.daum.net/ranking/age

Five steps of web scraping

We identify the running mechanism in the URL syntax.
We retrieve links to the running pages.
We download the running pages.
We retrieve links to the entries on the running pages.
We download the single entries.

Manipulating URLs to access multiple pages

baseurl <- "https://news.daum.net/ranking/popular?regDate="
dates <- seq(from=20201025, to=20201031, by=1)
urls <- str_c(baseurl, dates)
urls

## [1] "https://news.daum.net/ranking/popular?regDate=20201025"
## [2] "https://news.daum.net/ranking/popular?regDate=20201026"
## [3] "https://news.daum.net/ranking/popular?regDate=20201027"
## [4] "https://news.daum.net/ranking/popular?regDate=20201028"
## [5] "https://news.daum.net/ranking/popular?regDate=20201029"
## [6] "https://news.daum.net/ranking/popular?regDate=20201030"
## [7] "https://news.daum.net/ranking/popular?regDate=20201031"

Constructing a function to extract headlines of popular news from each URL

headline_extractor <- function(url) {
  page <- readLines(url)
  page_parsed <- htmlParse(page)
  headlines <- xpathSApply(page_parsed, headline_xpath, xmlValue)
  return(headlines)
}

urls

## [1] "https://news.daum.net/ranking/popular?regDate=20201025"
## [2] "https://news.daum.net/ranking/popular?regDate=20201026"
## [3] "https://news.daum.net/ranking/popular?regDate=20201027"
## [4] "https://news.daum.net/ranking/popular?regDate=20201028"
## [5] "https://news.daum.net/ranking/popular?regDate=20201029"
## [6] "https://news.daum.net/ranking/popular?regDate=20201030"
## [7] "https://news.daum.net/ranking/popular?regDate=20201031"

length(urls)

## [1] 7

headline_list <- lapply(urls, headline_extractor)
headline_list

## [[1]]
##  [1] "오바마 \"한국 인구당 코로나 사망률은 미국 1.3%\"..트럼프 직격"            
##  [2] "한국 재계의 거목 '하늘나라로'..이건희 삼성 회장 별세(종합)"               
##  [3] "[이건희 별세] 이재용, 두 자녀와 빈소 도착..정·재계 애도행렬(종합)"       
##  [4] "\"박원순 때와 왜 이리 달라\"..이낙연 '이건희 추모 페북'에 비판 댓글"      
##  [5] "[무플방지]\"윤석열, 아내 재산과 무관?..조국 땐 왜 그랬나\""               
##  [6] "이건희 삼성전자 회장 투병끝 별세, 향년 78세(상보)"                        
##  [7] "[이건희 별세] 상속세 10조 넘을 듯..주식재산 18조 2000억원"                
##  [8] "'차기 대통령 감' 이재명 23%, 이낙연 20%인데.. '없다' 28%"                 
##  [9] "\"27살 차이 한베커플 첫 만남\"..러브스토리인줄 알았는데 반전"             
## [10] "부동산 세금 큰 파도 온다..\"집 팔려면 올해 넘기지 마라\""                 
## [11] "내성적이지만 엉뚱했던 소년..'초일류' 삼성 만들었다"                       
## [12] "국내 1위 부호 삼성 이건희 자산 18조..어떻게 처리되나"                     
## [13] "하루에 4개 주 강행군..\"한국을 봐라\" 코로나로 비판"                      
## [14] "성폭행도, 살해도 '봐도 모른척' 中.. 웨이관 문화 뭐길래 [관심집中]"        
## [15] "강기정 \"윤석열, 대통령 순방 때마다 난리.. 조용히 수사하랬다가 타깃\""    
## [16] "[취재후] 새벽 아파트 11층 유리창 깬 물체는?..누가 어디서 쐈나?"           
## [17] "'라면형제'에 쏟아진 후원금..\"엄마에겐 직접 주지 않는다\""                
## [18] "일본, 유명희 견제..\"WTO 총장에 나이지리아 후보 지지 방침\""              
## [19] "[단독] 부산 온천천에 연어가 나타났다.. 추정 사체 등 2마리 목격"           
## [20] "\"죽으면 책임진다\" 구급차 막은 택시기사, 징역 2년형 논란"                
## [21] "사과받으러 간 성폭행 피해자를 또..대법, 징역 5년 확정"                    
## [22] "진혜원 검사, '윤석열 응원' 화환에 연이틀 비판"                            
## [23] "\"코로나 확'찐'자 안되려면 걸으세요\"..1주일 최소 150분 빠르게"           
## [24] "행실 무개념 연예인 Top3? 조회수 목맨 '이슈 유튜버'"                       
## [25] "\"배달앱 지각변동 시작됐다\""                                             
## [26] "후배 도우러 흉기 챙겨갔다가 40년 동네 선배 살해한 50대..징역 20년"        
## [27] "\"나 저 후보 때문에 망했어\"..김진태 후보 선거운동원 폭행한 50대 벌금형"  
## [28] "[이건희 타계]'글로벌 삼성' 키워냈지만..순탄치않은 가족사"                 
## [29] "[세쓸통]\"NO재팬 벌써 끝?\"..車 판매 늘자 비웃는 日"                      
## [30] "野 \"진혜원, 직속상관 윤석열을 '나이트 개업' 조롱..징계해야\""            
## [31] "[이건희 별세] 사양한다 했는데도 밀려드는 조화로 '북적'.. 외부인 출입 통제"
## [32] "'야당의 시간' 국감인데 국민의힘 6%p 하락..민주당 지지율 35%"              
## [33] "\"왜 독가스를 뿜어 대느냐\"고 따지던 옆집 할머니"                         
## [34] "\"이병철 선대회장 때처럼?\"..호텔신라·패션, 삼성서 계열 분리될까"        
## [35] "여권이 키운 '윤석열 대망론'..\"죽 써서 개 주게 될라\" [홍영식의 정치판]"  
## [36] "'라면형제' 기부금 모금은 중단..\"목숨 건진 10살형 지원은 계속\""          
## [37] "'학대누명 교사 자살사건' 여론 분노..엄벌 청원 30만 훌쩍"                  
## [38] "[이건희 타계]이재현 CJ 회장 \"집안 이끈 자랑스러운 작은 아버지\""         
## [39] "10조→387조..\"삼성의 거침없는 진격에 천하의 애플도 떨었다\""             
## [40] "5·18 부당징계 경찰관 급여 정산액 10만원..'40년 전 봉급대로'"             
## [41] "'혈세 4300억' 어쩌나..애물단지 전락한 영암 F1 서킷 [세금 먹는 하마]"      
## [42] "미 복지장관 \"한국 대형교회 코로나때 접촉자 체포 위해 군활용\""           
## [43] "\"한국 교회 접촉자 체포하려 군 동원\" 미 복지장관 황당 주장"              
## [44] "이건희 삼성 회장 별세에 정치권 '조문·애도' 긴급 논의"                    
## [45] "정부, 6·25책임 美에 돌린 시진핑에 \"북의 남침은 역사적 사실\""           
## [46] "일본에 \"스가=히틀러\" \"일본 국민=나치독일 국민\" 논쟁 가열"             
## [47] "[뉴스人사이드]베일에 싸인 亞 최고 여성부호..정작 그를 알린건 '국적세탁'"  
## [48] "\"이 가격에 계속 쿠팡에 납품해야 하나?\"..고민하는 제조기업"              
## [49] "[왜?]\"구충제 효과\"→\"먹는 환자들 말려야\" 김철민 국감 증언"            
## [50] "[이건희 별세]상속세 10조 그게 다가 아니다, 이재용·이부진 과제"           
## 
## [[2]]
##  [1] "아내와 성관계 후 갑자기 폭행한 뒤 살해..英 갑부의 두 얼굴"                                                                   
##  [2] "한국은 되고 유럽은 안 되는 이유, '가디언'의 적나라한 지적"                                                                   
##  [3] "[단독] 나라에 낼 돈 130억인데, 조국 모친 \"전재산 9만원\""                                                                   
##  [4] "\"EU 회원국, WTO 총장 선거서 나이지리아 후보 지지에 접근\""                                                                  
##  [5] "살 뺀다고 탄수화물을 끊어? \"줄일 것은 따로 있어요\""                                                                        
##  [6] "온천천에 나타난 진객 연어, \"하루 사이 무슨 일이.. \""                                                                       
##  [7] "어린이집서 친구와 부딪쳐 넘어진 5살..이틀만에 숨져(종합)"                                                                    
##  [8] "싱가포르, 한국 '독감백신 접종 후 사망'에 백신 2종 접종 중단"                                                                 
##  [9] "제2의 '구하라 사건'..딸 숨지자 28년만에 나타난 생모"                                                                         
## [10] "28년만에 나타나 딸 억대 유산 챙긴 친모..간병한 계모에 절도소송까지"                                                          
## [11] "\"고소하니 합의하자고..\" 어느 날 사라진 유튜버, 망가진 그의 삶"                                                             
## [12] "윤석열 화환 '나이트클럽' 조롱한 진혜원..야당 \"부하가 상급자 모욕, 징계감\""                                                 
## [13] "\"질병청 믿고 백신 맞자\"..62~69세 반나절 만에 26만명 접종"                                                                  
## [14] "[주진우 라이브] 함세웅 신부 \"이건희의 '마누라와 자식 빼고 버려라?'..가족에 매몰된 한계가 삼성의 한계이자 우리 시대의 한계\""
## [15] "가수 '상위 1%' 63명 연소득 34억원..1%가 전체소득 53% 차지"                                                                   
## [16] "\"물 찾다 실수로 소주 1병 마셔\".. 음주운전 경찰관의 황당 변명"                                                              
## [17] "\"윤석열 누구랑 밥먹으면 고발할 것..윤석열 정치 방지법 만들어야\""                                                           
## [18] "한 달째 전남대 앞 쓰레기봉투 들고 나타난 20대들"                                                                             
## [19] "이건희 상속세 무려 11조..국가 세입예산마저 뒤흔들었다"                                                                       
## [20] "'전 남편 살해 무기징역' 고유정, 현 남편과 이혼소송서 패소"                                                                   
## [21] "'6.25는 북침' 열 올리는 중국, 동조하는 아이돌..조용한 한국 정부"                                                             
## [22] "[단독] 첫날부터 오작동..2억 원 아끼려다 5명 목숨 잃었다"                                                                     
## [23] "미국서 '살인말벌' 제거 작전..완전무장에 진공청소기 동원"                                                                     
## [24] "허수아비 후보로 세운 청소부, 진짜로 러 시장 되자 벌어진 일"                                                                  
## [25] "'공항 화장실에 버려진 아이' 카타르, 여성승객 강제 자궁 검사"                                                                 
## [26] "부산에 있는 55년 '해운대암소갈비'가 서울에도..법원 \"불법행위\""                                                             
## [27] "추미애, 野 사퇴요구에 \"뭐라 하겠나..장관 한번 해보세요\""                                                                   
## [28] "'#택배기사님감사합니다'..잇단 사망에 \"새벽배송 안 시킨다\""                                                                 
## [29] "\"되찾을 수 없는 건 생명\"..이건희 '가짜 편지' 확산"                                                                         
## [30] "[타봤습니다] 비행기는 탔지만 목적지는 없다..완판된 9만9000원 여행"                                                           
## [31] "\"40만원 과외, 버는건 8만원\" 요즘 대학생들에게 무슨 일이"                                                                   
## [32] "다시 칼 빼든 추미애 \"윤석열 중앙지검장 때 옵티 무혐의, 감찰 예정\"(종합)"                                                   
## [33] "강경화 \"'병역 면탈' 유승준 비자 발급, 허용하지 않기로\""                                                                    
## [34] "바이든 아들은 노트북 수리를 맡겼다, 그것이 화근이었다"                                                                       
## [35] "조국에게 총애받던 박형철, 그가 입 열수록 조국은 다친다"                                                                      
## [36] "'부하' 표현..조수진 \"우병우에 썼잖냐\" 秋 \"기억 없다\""                                                                    
## [37] "김홍희 해경청장 \"충동적 공황상태에서 자진 월북..증거 다수\"(종합)"                                                          
## [38] "[이건희 별세] 사인은 '신부전'..신장이 노폐물 걸러내지 못하는 병"                                                             
## [39] "검찰인사 문제삼는 野에 폭발..추미애 \"총장한테 물어봐라\""                                                                   
## [40] "종전선언 논의하러 美갔는데..北 \"외세 할아비처럼 섬기며 비굴하게 처신\""                                                     
## [41] "추미애, 윤석열 국감 맹공..'직접감찰·해임건의' 꺼냈다"                                                                       
## [42] "추미애 \"김봉현 술접대 검사 수사팀장 투입..사실로 확인\"(종합)"                                                              
## [43] "'시속 166km' 음주운전하다 2명 사망사고 낸 20대 징역 7년"                                                                     
## [44] "\"못살겠다, 불안해서\"..대선 앞두고 총 사러가는 미국인"                                                                      
## [45] "[시선집중] 윤호중 \"윤석열 불쌍하기까지.. 악마에 영혼 판 파우스트 같아\""                                                    
## [46] "어린이집에서 놀던 5살 남아 숨져..경찰 수사"                                                                                  
## [47] "70대 몰던 어린이 통학버스 주유소 돌진..2명 부상"                                                                             
## [48] "박상기 \"내가 윤석열에게 '조국 선처'?..참 어이가 없다\""                                                                     
## [49] "강준만 \"문재인 정권 거의 모든 게 내로남불, 정리하다 포기\""                                                                 
## [50] "삼성전기 3분기 영업이익 3천25억원..작년 동기 대비 59.9%↑(종합)"                                                             
## 
## [[3]]
##  [1] "'백신 사망' 17세 고교생, 부검서 화학물질 검출..유족 \"억울하다\""                                                            
##  [2] "[단독][취재파일] 잿더미 된 사찰, 알고 보니..부처님 앞 \"할렐루야!\" 외친 '그 여자'"                                          
##  [3] "'화학물질 검출' 고교생..경찰 \"직접 구매 확인\" 가족 \"극단선택 이유없다\""                                                  
##  [4] "[AS뉴스]\"엽기폭행 양진호, 옥중 결혼..한해 수익 2백억\""                                                                     
##  [5] "[단독] '조국 일가 명예훼손' 보수 블로거 \"조 선생님 선처를\""                                                                
##  [6] "'붉은대게' 재고 산더미..공장 문 닫고 조업 포기"                                                                              
##  [7] "성병 숨기고 7개월간 두명과 성관계..20대 집행유예"                                                                            
##  [8] "용인 골프모임 31명 집단확진..가족모임·어린이집서도 새 감염(종합)"                                                           
##  [9] "7억짜리 용인 땅, 300억 됐다..이건희가 건설비 전액 댄 이곳"                                                                   
## [10] "[단독] \"실종 보고받고 지휘한 내용 밝혀라\"<U+22EF> 피격 공무원 형, 청와대에 정보공개 청구"                                  
## [11] "자신과 아내 지키려 흉기든 이웃 제압해 숨지게 한 70대 '무죄'"                                                                 
## [12] "세계최고 수준 천문학적 세금 '폭탄'..세금 때문에 기업 판다"                                                                   
## [13] "트럼프 개인 빚 1조2400억..재선 실패땐 파산 가능성"                                                                           
## [14] "'갑질폭행' 양진호, 옥중결혼 이유..부인 통해 매년 200억 가져간다"                                                             
## [15] "'3000만원 현상금'에 놀라 롤렉스 반환한 범인 \"고가인줄 몰랐어요\"[사건TMI!]"                                                 
## [16] "트럼프 잔고 바닥났다, 바이든은 45억짜리 브래드 피트 광고"                                                                    
## [17] "무면허로 전동킥보드 타다 택시 충돌한 고교생, 사흘만에 사망"                                                                  
## [18] "\"휠 고의 파손? 그런적 없다\" 타이어뱅크 점주 '사과문' 나흘만에 돌변"                                                        
## [19] "문대통령이 윤석열에 메신저 보내?..靑 \"정보 없어 확인 불가\""                                                                
## [20] "시외버스서 승객 너머로 자위행위 촬영 20대 집행유예"                                                                          
## [21] "강경화 \"비자발급 안돼\"→유승준 또 호소문..\"국민이 거부\" 여론 싸늘"                                                       
## [22] "인천 마트 주차장 3층서 승용차 추락..70대 운전자 숨져"                                                                        
## [23] "유튜브 잠깐 출연했다 봉변.. 일상 덮친 이름 모를 '악플'"                                                                      
## [24] "트럼프 극찬한 항체 치료제 실제 써보니 '효과'"                                                                                
## [25] "인천 고교생 사망 원인 \"독감 백신 아닌 독극물\""                                                                             
## [26] "백*원의 원조쌈밥집 등 '자기 이름을 상표로'..성명상표 출원 활발"                                                              
## [27] "파지수집 리어카 끌던 노인, 전복된 승용차에 치여 사망(종합)"                                                                  
## [28] "아프리카서 물개 7000마리 떼죽음 미스터리..대부분 태아 상태"                                                                  
## [29] "백악관 \"대유행 통제 않을 것\" 바이든 \"패배의 백기 흔들어\""                                                                
## [30] "'한동훈과 육탄전' 정진웅, 독직폭행 혐의로 기소(종합)"                                                                        
## [31] "\"왜 더 큰 평수로 옮겨요? 이거 거래허가 못내줍니다\""                                                                        
## [32] "AFP \"EU 회원국 대다수, WTO 총장 선거서 나이지리아 후보 지지\""                                                              
## [33] "중국 공청단 \"한국전쟁 남침 아니다..한 국가 내전\" 궤변(종합)"                                                               
## [34] "의협 다시 집단행동? \"28일까지 의사국시 해결책 내놓지 않으면..\""                                                            
## [35] "이탈리아 언론 또 한국 칭찬..\"첨단기술로 바이러스 잡았다\""                                                                  
## [36] "EU 27개 '몰표' 나이지리아로..WTO 첫 한국인 수장 선출 경고등"                                                                 
## [37] "이건희 회장 병상 6년간 일가 받은 배당금 2.8조"                                                                               
## [38] "[황보선의출발새아침] 박수영\"文 대통령, 둘 다 해임하든 한 사람 해임하든지 결단해야\""                                        
## [39] "쇠징 박힌 신발 신은 채 후배 얼굴 걷어찬 겁 없는 10대"                                                                        
## [40] "[주진우 라이브] 함세웅 신부 \"이건희의 '마누라와 자식 빼고 버려라?'..가족에 매몰된 한계가 삼성의 한계이자 우리 시대의 한계\""
## [41] "1인용 킥보드에 남녀 두명이? 도로 위 '위험천만' 데이트"                                                                       
## [42] "낙동강 하구 이어 도심하천인 부산 온천천에서도 연어 발견"                                                                     
## [43] "\"한국만 아니면 된다\"..고비 때마다 '발목' 잡는 일본"                                                                        
## [44] "[단독] 첫날부터 오작동..2억 원 아끼려다 5명 목숨 잃었다"                                                                     
## [45] "룸살롱서 술판 벌이고 라임 자료 줬는데.. 금감원은 '사적영역'이라며 부실 감찰"                                                 
## [46] "\"한국반도체 인수 검토하라\" 한마디..삼성, 세계적 기업 시발점 됐습니다"                                                      
## [47] "[단독]해외는 좌석 채우는데..한국은 연인도 띄어앉아"                                                                          
## [48] "김봉현이 주장한 술접대, 당사자 전원 \"검사 없었다\""                                                                         
## [49] "독감 백신 접종 뒤 숨진 인천 고교생 형 \"억울함 풀어달라\" 청원(종합)"                                                        
## [50] "중국 신장서 기침·발열없이 137명 집단감염..\"이전 코로나와 다르다\""                                                         
## 
## [[4]]
##  [1] "[현장영상] 故 이건희 회장 발인 엄수..눈물 보이는 딸 이부진"                        
##  [2] "'딸들 광고 좀 하겠다'던 이건희 회장.. 눈물로 보낸 두딸"                            
##  [3] "\"떼쓸 것을 써라\" 사망 원인 묻는 유가족에 쏟아지는 '악플' <U+00A0>"               
##  [4] "내 딸이, 12시간 동안 쇠창살에 찔려 죽었다"                                         
##  [5] "'별장 성접대' 김학의 무죄 뒤집혀 법정구속..\"상고할 것\"(종합)"                    
##  [6] "여자손님 잇달아 성폭행한 40대 게스트하우스 주인 감형"                              
##  [7] "양배추, 삶은 달걀, 사과.. 아침에 좋은 건강식 5가지"                                
##  [8] "\"코로나환자 수차례 접촉해도 감염 안되는 사람들 있어\" 러' 전문가"                 
##  [9] "'까맸던 얼굴이' 코로나 극한 투병 중국인 의사 회복"                                 
## [10] "\"지금 예약해도 내년에나 가능\"..병원마다 검진 환자 북새통"                        
## [11] "[단독] \"난 곁가지다\" 김봉현, 진짜 '라임 몸통' 실명 밝혔다"                       
## [12] "文 시정연설에 野 '이게 나라냐' 항의..'신원검색' 소란도(종합)"                      
## [13] "'항미원조 선동' 아이돌 '일파만파'..소속사·방송사까지 '규탄'"                      
## [14] "이건희 회장 화성 삼성반도체서 마지막 인사..임직원 국화 배웅"                       
## [15] "23년간 TV 50대 수신료 내온 병원, KBS에 \"10대 뿐..23년치 환불 요구\""              
## [16] "고문으로 얼굴 붓지 않은 '어린 유관순' 찾았다"                                      
## [17] "\"인천 고교생 사망.. 독감 백신 음모론은 틀렸다\""                                  
## [18] "'42명 확진' 용인 동문 골프모임은 성균관대 '비학위과정 모임'"                       
## [19] "[단독] \"이건희, '일 한번 벌여보자'..고대·성대 합치려 했다\""                     
## [20] "\"등록금·신혼집 날렸어요\" 빅히트 주식 '영끌'한 개미들 아우성"                    
## [21] "정청래 \"한푼 줍쇼\" 앵벌이 논란에..\"고액 연봉자\" vs \"솔직하다\""               
## [22] "서초구 \"윤석열 화환 강제철거\" 예고..일부 시민 \"민주국가 맞나\""                 
## [23] "'주호영 몸수색'에 국회 발칵..野, 대통령 연설때 고성"                               
## [24] "WTO, 오늘 밤 선호도 조사결과 통보..유명희 당선 조만간 윤곽"                        
## [25] "\"안마의자 쓰면 키 크고 집중력 좋아져\"..검찰, 바디프랜드 기소"                    
## [26] "이재명 '文 시정연설' 겉으로는 칭찬했지만..\"과오 반복 안돼\" 우회적 비판"          
## [27] "코웃음 친 박범계 \"옵티머스, 자료 없어 계좌 추적 못했다고?\""                      
## [28] "[황보선의출발새아침] 호사카 유지\"日, 美 따라 유명희 지지할 것.. 당선가능성 60%\"" 
## [29] "홍준표 \"지지율 4% 정당 살려놨더니..야당 왜 이래\""                                
## [30] "[데일리안 여론조사] '차기 대권' 이재명22.8%, 이낙연21.6%, 윤석열15.1%"             
## [31] "추미애, 수사지휘 이어 '감찰그물'로 윤석열 꽁꽁..사퇴종용인가"                      
## [32] "'별장 성접대' 김학의 무죄 뒤집혔다..2심 실형 법정구속"                             
## [33] "[단독] 대구 실종 잠수사, 취수구 배관에 빨려 들어간 듯..관로 절단 추진"             
## [34] "오바마 \"김정은이 트럼프 재선 원한다고?..모든 것 줬기 때문\""                      
## [35] "[단독][취재파일] 잿더미 된 사찰, 알고 보니..부처님 앞 \"할렐루야!\" 외친 '그 여자'"
## [36] "문대통령·정총리 다 나섰지만 '나이지리아' 손 든 EU, WTO 선거 '먹구름'"             
## [37] "\"전두환 아직 정신 못 차렸네\".. 수상한 사람들의 반격"                             
## [38] "의료계 또 다시 집단행동?..의협 \"정부, 국시 문제 해결책 내놔라\""                  
## [39] "의협 다시 집단행동? \"28일까지 의사국시 해결책 내놓지 않으면..\""                  
## [40] "\"휠 고의 파손? 없다\" 평생 반성하겠다던 타이어뱅크 점주 '돌변'"                   
## [41] "의협 '의대 국시' 강공 전환..의료계마저 \"국민 협박하나\""                          
## [42] "오색찬란 단풍 속 하늘 찌를 듯 솟은 '한국의 장자제'"                                
## [43] "\"이 아이, 300만원\" 중학생 당근마켓 글..실제 문의한 사람들(종합)"                 
## [44] "문정인 \"반중 군사훈련 동참시 중국은 한국을 적으로 간주할 것\"(종합)"              
## [45] "하필 마오 아들 생일날, 계란볶음밥 만들다 욕먹은 中요리사"                          
## [46] "정의선 현대차 회장, 이건희 회장 영결식에도 달려왔다"                               
## [47] "[단독/레이더P] '방역지침 위반 논란' 강경화 장관 남편, 요트 결국 못 샀다"           
## [48] "아파트 관리소장 살해한 60대 입주자대표, 도주했다가 자수"                           
## [49] "2억7천만 뷰 기록한 '이날치 열풍'..세계 매료시킨 '조선의 힙합'"                     
## [50] "유승민 \"文대통령, 나라살림 거덜 내려 작정..악성 포퓰리즘 몰아내야\""              
## 
## [[5]]
##  [1] "\"혹시 가짜 마스크?\" 이 마스크 산 분들, 꼭 확인하세요"                       
##  [2] "대장과 병장 월급 차이.. 이 정도일 줄은 몰랐을 거다"                           
##  [3] "[단독] 이건희 회장 장지까지 간 3개의 조화, 누구일까"                          
##  [4] "'하''허''호' 번호판에 당했다, 콜받고 갔다 돈폭탄 맞는 대리기사"               
##  [5] "\"추 장관님, 저 역시 커밍아웃합니다\" 이어지는 평검사들의 비판글"             
##  [6] "나이지리아 손 들어준 WTO..유명희, 사퇴·버티기 갈림길(종합2보)"               
##  [7] "한밤 고층 아파트에 드론 띄워 성관계 현장 촬영 일당 기소"                      
##  [8] "\"우리 WTO 후보는\".. 日, 유명희 예상 밖 선전에 '충격' [특파원+]"             
##  [9] "\"다스는 MB것\" 밝혀낸 검사들, 추미애 취임후 죄다 좌천됐다"                   
## [10] "'스스로 코로나 두 번 감염' 69세 교수의 결론..\"집단면역 소용없다\""           
## [11] "무허가 공장서 마스크 1천만장 만들어 KF94로 속여 판 일당 적발"                 
## [12] "대법원, 이명박 전 대통령 징역 17년·벌금 130억 확정(종합)"                    
## [13] "징역 17년 확정 이명박 \"법치 무너져, 진실 반드시 밝혀질 것\"(종합2보)"        
## [14] "\"다시 유행하는 코로나..최고의 투자처는 한국\""                               
## [15] "평생 동반자 떠나보낸 홍라희..\"삼성의 조용한 조력자\""                        
## [16] "'윤석열 화환' 물결..대검, 서초구 철거 요청에 협조 부탁"                       
## [17] "[단독그후] '여교사 7명 불법 몰카촬영' 고교생 '퇴학처분'..우편물 뒤지며 '찰칵'"
## [18] "박형준, 국민의힘 8년 만에 복당..부산시장 출마 준비 중"                        
## [19] "밀린다는 소식에 보란 듯 \"유명희 지지\"..승복이냐 완주냐"                     
## [20] "'윤석열 화환' 철거 요구 김남국에..서민 \"낙엽 떨어지는 11월엔 외출 금지하자\""
## [21] "\"커피마시러, 담배피우러 나간 시간, 근로시간인가?\""                          
## [22] "의협 또 '파업 가능성'에 등돌린 여론..네티즌들 비판 목소리"                    
## [23] "국민의힘, 청년 비대위원 뽑아놨더니.. 연일 '상속세 인하' 목청"                 
## [24] "미국 유명희 지지에 유럽언론은 '일방주의·WTO 사보타주' 의심"                  
## [25] "윤석열 장모 변호인 \"속아서 사문서위조했다\"..장모는 불출석"                  
## [26] "[사건의 재구성]\"성폭행 당했다\" 거짓고소 들통난 꽃뱀 범행"                   
## [27] "[3보] 이명박 전 대통령 징역 17년·벌금 130억 확정..재수감"                    
## [28] "코로나 입원환자 80%의 공통점..비타민D가 모자라"                               
## [29] "2억7천만 뷰 기록한 '이날치 열풍'..세계 매료시킨 '조선의 힙합'"                
## [30] "코로나에 갇힌 6개월, 딸은 다시 아기가 됐다"                                   
## [31] "\"4인가족에 왜 40평 필요\" 구청 공무원의 황당 발언"                           
## [32] "'이재용 상속세 인하' 주장에..이재웅 \"일고의 가치 없어\""                     
## [33] "추미애, '검찰개혁 실패' 검사 글 저격..\"개혁이 답이다\""                      
## [34] "고문으로 얼굴 붓지 않은 '어린 유관순' 찾았다"                                 
## [35] "유준상 \"한칸 띄워앉으면 적자\" 호소..정총리 \"공연계 요구 고려\""            
## [36] "5년만에 의원 체포동의안 가결..정정순 \"의원들 선택 존중\"(종합)"              
## [37] "[단독] 검찰, 조해진 국민의힘 의원에 벌금 300만원 구형"                        
## [38] "미 무역대표부, WTO 사무총장 '유명희 지지' 공식 발표(종합)"                    
## [39] "與, 이명박 징역형 확정에 \"국민의힘, 대국민 사과하라\""                       
## [40] "정경심, 재판 막판에 증거 70여개 제출..검찰 \"부당하다\""                      
## [41] "\"아들 만나겠다\"며 집 나선 70대..실종 18일만에 숨진 채 발견(종합)"           
## [42] "친구들과 축구하다 넘어진 중1, 10분 뒤 사망 '논란'"                            
## [43] "조폭 끼고 버리고 째고.. \"전국 쓰레기산 처리비만 1천억\" [이슈&탐사]"         
## [44] "인천 아파트서 노부부 숨진 채 발견..사망 원인 조사"                            
## [45] "김학의 운명 가른 '인디밴드 보컬' 부친의 말"                                   
## [46] "'징역 17년 확정' 이명박, 침묵..측근들 속속 자택 집결"                         
## [47] "쪼잔한 억만장자..\"조망권 가린다\" \"훔쳐본다\" 이웃과 다투다 소송전"         
## [48] "'위안부는 일종의 매춘' 발언 류석춘, 명예훼손 혐의 불구속기소"                 
## [49] "'주호영 몸수색'에 국회 발칵..野, 대통령 연설때 고성"                          
## [50] "16억아파트 10년 보유세만 9000만원..\"나라에 월세 내는 기분\""                 
## 
## [[6]]
##  [1] "\"터질 게 터져\" 제주MBC 대체 무슨 일이 있었길래"                                                        
##  [2] "제주 '악마의 잼'으로 대박난 40대 업자 벌금만 15억"                                                       
##  [3] "친구들과 공차던 중학생, 10분 뒤 사망..엇갈리는 유족과 학교"                                              
##  [4] "청와대 앞에서 막춤을..전 세계 3억 번 돌려 봤다"                                                          
##  [5] "이만희에 귓속말 김평화..재판에서 드러난 '실세'"                                                          
##  [6] "시골마을 4가구 나란히 쌍둥이 출산..아빠는 모두 '굴착기 기사'"                                            
##  [7] "도박과 불륜이 낳은 '관악구 모자살인'..남편 2심도 '무기징역'"                                             
##  [8] "박훈 변호사, '룸살롱 술접대' 검사 실명·얼굴 공개"                                                       
##  [9] "연봉 4천만원에 월 100만원 긁으면 작년보다 130만원 더 공제"                                               
## [10] "충남 한 주유소서 주유한 차량 무더기로 '고장'"                                                            
## [11] "고문하다 사람이 죽으면 낙동강 고기밥으로 던졌다"                                                         
## [12] "수상한 '빨래 바구니'..금반지·황금열쇠·골드바 와르르"                                                   
## [13] "\"7억 빚 안 물려받아\".. 故박원순 유족 상속포기 법원 수용"                                               
## [14] "美 \"WTO총장에 유명희 지지\" 유럽 \"이제와서 왜 이러느냐\""                                              
## [15] "오늘부터 외식 1만원·영화 6000원 할인..'506만명' 소비쿠폰 혜택"                                          
## [16] "'코로나의 역설'..인간 사라지니 멸종위기 바다거북 기록적 부화"                                            
## [17] "박훈 변호사, '룸살롱 술접대 의혹' 검사 실명 공개(종합)"                                                  
## [18] "\"야당이 왜이래\" 국민의힘, 저조한 지지율..커지는 비판 목소리"                                           
## [19] "의사들 다시 집단휴진?..의협 긴급회의에 전공의·의대생 대표 참석했다"                                     
## [20] "LG전자 생활가전 일냈다..누적 영업이익 2조원 돌파(종합2보)"                                               
## [21] "文, 한번도 경험한 적 없는 '無 레임덕' 대통령 될까"                                                       
## [22] "프랑스 국가봉쇄에 간밤 '탈출 러시'..꼬리 문 차량행렬 700km (영상)"                                       
## [23] "류호정 \"비겁한 민주당, 해괴한 이낙연..부끄러운 줄 알라\""                                               
## [24] "바이든이 미국 대통령 되면 첫 한국인 WTO 사무총장 무산?"                                                  
## [25] "임은정 \"자성없이 성내는게 바른 검사냐\"..검사들 \"물타기냐\""                                           
## [26] "인천 아파트서 엄마와 쌍둥이 자녀 의식 불명 상태로 발견"                                                  
## [27] "김정재 \"박원순, 무릎에 입술 맞추고..\" 발언에 與 고성"                                                  
## [28] "\"KF94 장당 300원\".. 마스크업체 줄도산 위기"                                                            
## [29] "김종인 \"MB만 확정..박근혜 전 대통령까지 나오면 대국민 사과\""                                           
## [30] "\"혹시 가짜 마스크?\" 이 마스크 산 분들, 꼭 확인하세요"                                                  
## [31] "[특파원 시선] 이탈리아서 딸 잃은 부모의 절규..\"외교부는 어디 있나요\""                                  
## [32] "이성윤 '尹가족 수사' 배당 지시했지만 부서 정하지 못한채 한달째"                                          
## [33] "\"10알씩 입에 털어요\" 무심코 먹는 영양제 하루에 몇 알까지 가능할까?"                                    
## [34] "검사 저격 秋에 \"벌거벗은 임금님\"..'커밍아웃' 일파만파"                                                 
## [35] "[단독]뭐 실어가러 왔나..올 두번째 한국 온 UAE 군 수송기"                                                 
## [36] "\"비싸서 안 사요?\"..전기차 가격 5년 내 1000만원 내린다"                                                 
## [37] "[레이더P] 국민의당 부대변인 탈당..안철수 서울시장 불출마 반발"                                           
## [38] "마스크 고리..귀를 지킨다"                                                                                
## [39] "[시선집중] 조은희 \"윤석열 화환 철거하라니 '너는 무슨 당이냐' 문자 폭탄 쏟아져 .. 법과 원칙은 공정해야\""
## [40] "옥중편지 변호사 \"尹과 상갓집? 혼밥했다\"..영수증 공개(종합)"                                            
## [41] "BTS도, 차태현도, 전지현도 애틋하게 지나간 역"                                                            
## [42] "\"그 때 쉬는 건데..\"  운동을 후회하는 경우 5가지"                                                       
## [43] "\"트럼프 재선 확률 높다, 어찌됐든 대북정책은 유지될 것\""                                                
## [44] "로또 1등 11차례 복권방, 새벽 6시부터 찍는 '마지막 희망'"                                                 
## [45] "\"신은 위대하다\" 외치며..기도하는 할머니도 참수"                                                        
## [46] "'민주당만 빼고' 임미리 \"문 대통령, 추미애와 윤석열 모두 해임하라\""                                     
## [47] "방송사 영업정지 초유의 사태..MBN 향방은"                                                                 
## [48] "이재명 \"부동산 문제 잘못 건드려 악순환 반복\""                                                          
## [49] "이명박 전 대통령, 재수감 앞두고 서울대병원 진료차 외출"                                                  
## [50] "이곳만 다녀가면..차량 100여 대 망가뜨린 주유소"                                                          
## 
## [[7]]
##  [1] "'김학의 법정구속' 결정타는 '연예인 아빠' 진술"                         
##  [2] "봉인된 박근혜 때 '세월호 참사' 대통령기록물, 시민 힘으로 열릴까"       
##  [3] "서경석도 본 공인중개사 시험, 직접 치러보니..\"너 마저, 넘사벽\""       
##  [4] "13년 전 이명박-박근혜 '경선 폭로전'..모두 사실로"                      
##  [5] "\"4년 전 아내가 사자고 했던 아파트가 7억이 올랐습니다\""               
##  [6] "개그맨 서경석도 응시..공인중개사 시험 34만명 접수 역대 최다(종합)"     
##  [7] "원산안면대교 교각에 낚싯배 '쾅'..3명 사망·19명 부상(종합2보)"         
##  [8] "MB 저격했던 BBK 김경준 \"정치 검찰 역사의 재판대에 올려야\""           
##  [9] "베일 벗은 인천 '새우타워'..기다란 수염에 다리까지 만들어"              
## [10] "동부구치소 돌아가는 MB 다시 독방으로..최서원 '한솥밥'"                 
## [11] "\"살고 싶어요\"..마스크 공장 사장의 '호소'[르포]"                      
## [12] "피 흘릴 때까지 공무원 폭행한 전남 강진체육회장 구속"                   
## [13] "[이주의 미오픽] KBS 탐사보도에 딱 걸린 검찰의 '기획수사' 의혹"         
## [14] "김진태 \"후배 검사들 끝까지 버텨라..곧 좋은 세상 온다\""               
## [15] "\"넌 여기서 못 살걸, 난 잠깐 형을 살면 돼\"..뻔뻔한 유사강간범"        
## [16] "가수 이승환 \"세월호 고통 안긴 분들, 잘 살고 계신가\""                 
## [17] "지구촌 전체 GDP 7만 배짜리 '노다지' 광물 소행성 발견"                  
## [18] "걷잡을 수 없는 확산..이탈리아 일일 확진자 사상 첫 3만명대(종합)"       
## [19] "\"공익 차원서 깐다\"..라임 '술접대 의혹' 검사 실명 공개 파문"          
## [20] "\"이사오면 3년 연봉줄게요\"..伊 마을 파격조건으로 청년 유혹"           
## [21] "거리두기 1단계 완화 후 확진자 다시 급증..내일 거리두기 개편 주목"      
## [22] "\"오로지 한국인 위해 잡는다\" 골뱅이船 띄우는 영국"                    
## [23] "다시 K-방역 주목하는 유럽..\"오만함 버리고 한국 배워야\""              
## [24] "'부자의 왕도' 물었더니..1위 사업, 2위 부동산, 3위는?"                  
## [25] "[사건의 재구성] 일당 15만원 택배알바..배달품목은 '체크카드'"           
## [26] "\"김밥 빼고 물감·팔레트..\" 산 100곳서 붓질하는 여자"                 
## [27] "北, 윤석열 또 맹비난..\"형님 떠받드니 왕이라도 된 듯\""                
## [28] "던킨·배스킨, 13조원에 팔린다..미2위 레스토랑체인 탄생"                
## [29] "14세 여학생, 국내 3번째 소아·청소년 다기관염증증후군 발생(종합)"      
## [30] "'김신조 사건' 52년만에 개방된 북악산 철문..문 대통령 직접 열어"        
## [31] "\"안철수, 보여준 게 없다\" 청년 탈당에 술렁이는 국민의당"              
## [32] "'바이든이어야 하는 이유'..유력 매체들, 노골적인 '바이든 지지 커밍아웃'"
## [33] "가격인상 루머에 터진 '샤넬 쇼핑대란'..\"새벽부터 100명 줄\""           
## [34] "나이지리아 \"美반대에도 WTO 총장 우리후보 뽑히게 작업\""               
## [35] "야구장 관객 꽉 채워 '감염 실험'..日 '코로나 마루타' 논란"              
## [36] "대리사과에 거부감 드러낸 의대생들..갈수록 꼬여가는 의사국시"           
## [37] "고문하다 사람이 죽으면 낙동강 고기밥으로 던졌다"                       
## [38] "음주 뒤 차에서 잤더니..\"음주운전했죠?\" 견인차 기사들의 협박"         
## [39] "검사들 커밍아웃 '사이버 연판장'..秋 \"불편한 진실 계속\""              
## [40] "이곳만 다녀가면..차량 100여 대 망가뜨린 주유소"                        
## [41] "'손님 가장' 남성에 성매매 알선한 업주<U+2027>여종업원 1심서 무죄..이유는?"
## [42] "[영상] 터키·그리스 덮친 규모 7.0 강진..\"쓰나미가 더 심각\"(종합2보)" 
## [43] "72년생 서경석도 봤다..34만 몰린 공인중개사 시험 40대 최다"             
## [44] "[단독] 윤석열, 진천에서 '신임부장 소집'..조직 다지기 본격화"           
## [45] "김민석 \"의사국시 당정청 합의 없어..최대집 자작극 언플 중단해야\""     
## [46] "김경준 \"BBK도 이명박 소유..진술 막은 검찰 단죄해야\""                 
## [47] "마스크 고리..귀를 지킨다"                                              
## [48] "'처치곤란' 아이스팩, 재활용 아이디어 '눈길'"                           
## [49] "\"신은 위대하다\" 외치며..기도하는 할머니도 참수"                      
## [50] "[화보] 19년 만에 뜬 '핼러윈 블루문'..다음은 2039년"

class(headline_list)

## [1] "list"

length(headline_list)

## [1] 7

urls[2]

## [1] "https://news.daum.net/ranking/popular?regDate=20201026"

headline_list[[2]]

##  [1] "아내와 성관계 후 갑자기 폭행한 뒤 살해..英 갑부의 두 얼굴"                                                                   
##  [2] "한국은 되고 유럽은 안 되는 이유, '가디언'의 적나라한 지적"                                                                   
##  [3] "[단독] 나라에 낼 돈 130억인데, 조국 모친 \"전재산 9만원\""                                                                   
##  [4] "\"EU 회원국, WTO 총장 선거서 나이지리아 후보 지지에 접근\""                                                                  
##  [5] "살 뺀다고 탄수화물을 끊어? \"줄일 것은 따로 있어요\""                                                                        
##  [6] "온천천에 나타난 진객 연어, \"하루 사이 무슨 일이.. \""                                                                       
##  [7] "어린이집서 친구와 부딪쳐 넘어진 5살..이틀만에 숨져(종합)"                                                                    
##  [8] "싱가포르, 한국 '독감백신 접종 후 사망'에 백신 2종 접종 중단"                                                                 
##  [9] "제2의 '구하라 사건'..딸 숨지자 28년만에 나타난 생모"                                                                         
## [10] "28년만에 나타나 딸 억대 유산 챙긴 친모..간병한 계모에 절도소송까지"                                                          
## [11] "\"고소하니 합의하자고..\" 어느 날 사라진 유튜버, 망가진 그의 삶"                                                             
## [12] "윤석열 화환 '나이트클럽' 조롱한 진혜원..야당 \"부하가 상급자 모욕, 징계감\""                                                 
## [13] "\"질병청 믿고 백신 맞자\"..62~69세 반나절 만에 26만명 접종"                                                                  
## [14] "[주진우 라이브] 함세웅 신부 \"이건희의 '마누라와 자식 빼고 버려라?'..가족에 매몰된 한계가 삼성의 한계이자 우리 시대의 한계\""
## [15] "가수 '상위 1%' 63명 연소득 34억원..1%가 전체소득 53% 차지"                                                                   
## [16] "\"물 찾다 실수로 소주 1병 마셔\".. 음주운전 경찰관의 황당 변명"                                                              
## [17] "\"윤석열 누구랑 밥먹으면 고발할 것..윤석열 정치 방지법 만들어야\""                                                           
## [18] "한 달째 전남대 앞 쓰레기봉투 들고 나타난 20대들"                                                                             
## [19] "이건희 상속세 무려 11조..국가 세입예산마저 뒤흔들었다"                                                                       
## [20] "'전 남편 살해 무기징역' 고유정, 현 남편과 이혼소송서 패소"                                                                   
## [21] "'6.25는 북침' 열 올리는 중국, 동조하는 아이돌..조용한 한국 정부"                                                             
## [22] "[단독] 첫날부터 오작동..2억 원 아끼려다 5명 목숨 잃었다"                                                                     
## [23] "미국서 '살인말벌' 제거 작전..완전무장에 진공청소기 동원"                                                                     
## [24] "허수아비 후보로 세운 청소부, 진짜로 러 시장 되자 벌어진 일"                                                                  
## [25] "'공항 화장실에 버려진 아이' 카타르, 여성승객 강제 자궁 검사"                                                                 
## [26] "부산에 있는 55년 '해운대암소갈비'가 서울에도..법원 \"불법행위\""                                                             
## [27] "추미애, 野 사퇴요구에 \"뭐라 하겠나..장관 한번 해보세요\""                                                                   
## [28] "'#택배기사님감사합니다'..잇단 사망에 \"새벽배송 안 시킨다\""                                                                 
## [29] "\"되찾을 수 없는 건 생명\"..이건희 '가짜 편지' 확산"                                                                         
## [30] "[타봤습니다] 비행기는 탔지만 목적지는 없다..완판된 9만9000원 여행"                                                           
## [31] "\"40만원 과외, 버는건 8만원\" 요즘 대학생들에게 무슨 일이"                                                                   
## [32] "다시 칼 빼든 추미애 \"윤석열 중앙지검장 때 옵티 무혐의, 감찰 예정\"(종합)"                                                   
## [33] "강경화 \"'병역 면탈' 유승준 비자 발급, 허용하지 않기로\""                                                                    
## [34] "바이든 아들은 노트북 수리를 맡겼다, 그것이 화근이었다"                                                                       
## [35] "조국에게 총애받던 박형철, 그가 입 열수록 조국은 다친다"                                                                      
## [36] "'부하' 표현..조수진 \"우병우에 썼잖냐\" 秋 \"기억 없다\""                                                                    
## [37] "김홍희 해경청장 \"충동적 공황상태에서 자진 월북..증거 다수\"(종합)"                                                          
## [38] "[이건희 별세] 사인은 '신부전'..신장이 노폐물 걸러내지 못하는 병"                                                             
## [39] "검찰인사 문제삼는 野에 폭발..추미애 \"총장한테 물어봐라\""                                                                   
## [40] "종전선언 논의하러 美갔는데..北 \"외세 할아비처럼 섬기며 비굴하게 처신\""                                                     
## [41] "추미애, 윤석열 국감 맹공..'직접감찰·해임건의' 꺼냈다"                                                                       
## [42] "추미애 \"김봉현 술접대 검사 수사팀장 투입..사실로 확인\"(종합)"                                                              
## [43] "'시속 166km' 음주운전하다 2명 사망사고 낸 20대 징역 7년"                                                                     
## [44] "\"못살겠다, 불안해서\"..대선 앞두고 총 사러가는 미국인"                                                                      
## [45] "[시선집중] 윤호중 \"윤석열 불쌍하기까지.. 악마에 영혼 판 파우스트 같아\""                                                    
## [46] "어린이집에서 놀던 5살 남아 숨져..경찰 수사"                                                                                  
## [47] "70대 몰던 어린이 통학버스 주유소 돌진..2명 부상"                                                                             
## [48] "박상기 \"내가 윤석열에게 '조국 선처'?..참 어이가 없다\""                                                                     
## [49] "강준만 \"문재인 정권 거의 모든 게 내로남불, 정리하다 포기\""                                                                 
## [50] "삼성전기 3분기 영업이익 3천25억원..작년 동기 대비 59.9%↑(종합)"

headline_list

## [[1]]
##  [1] "오바마 \"한국 인구당 코로나 사망률은 미국 1.3%\"..트럼프 직격"            
##  [2] "한국 재계의 거목 '하늘나라로'..이건희 삼성 회장 별세(종합)"               
##  [3] "[이건희 별세] 이재용, 두 자녀와 빈소 도착..정·재계 애도행렬(종합)"       
##  [4] "\"박원순 때와 왜 이리 달라\"..이낙연 '이건희 추모 페북'에 비판 댓글"      
##  [5] "[무플방지]\"윤석열, 아내 재산과 무관?..조국 땐 왜 그랬나\""               
##  [6] "이건희 삼성전자 회장 투병끝 별세, 향년 78세(상보)"                        
##  [7] "[이건희 별세] 상속세 10조 넘을 듯..주식재산 18조 2000억원"                
##  [8] "'차기 대통령 감' 이재명 23%, 이낙연 20%인데.. '없다' 28%"                 
##  [9] "\"27살 차이 한베커플 첫 만남\"..러브스토리인줄 알았는데 반전"             
## [10] "부동산 세금 큰 파도 온다..\"집 팔려면 올해 넘기지 마라\""                 
## [11] "내성적이지만 엉뚱했던 소년..'초일류' 삼성 만들었다"                       
## [12] "국내 1위 부호 삼성 이건희 자산 18조..어떻게 처리되나"                     
## [13] "하루에 4개 주 강행군..\"한국을 봐라\" 코로나로 비판"                      
## [14] "성폭행도, 살해도 '봐도 모른척' 中.. 웨이관 문화 뭐길래 [관심집中]"        
## [15] "강기정 \"윤석열, 대통령 순방 때마다 난리.. 조용히 수사하랬다가 타깃\""    
## [16] "[취재후] 새벽 아파트 11층 유리창 깬 물체는?..누가 어디서 쐈나?"           
## [17] "'라면형제'에 쏟아진 후원금..\"엄마에겐 직접 주지 않는다\""                
## [18] "일본, 유명희 견제..\"WTO 총장에 나이지리아 후보 지지 방침\""              
## [19] "[단독] 부산 온천천에 연어가 나타났다.. 추정 사체 등 2마리 목격"           
## [20] "\"죽으면 책임진다\" 구급차 막은 택시기사, 징역 2년형 논란"                
## [21] "사과받으러 간 성폭행 피해자를 또..대법, 징역 5년 확정"                    
## [22] "진혜원 검사, '윤석열 응원' 화환에 연이틀 비판"                            
## [23] "\"코로나 확'찐'자 안되려면 걸으세요\"..1주일 최소 150분 빠르게"           
## [24] "행실 무개념 연예인 Top3? 조회수 목맨 '이슈 유튜버'"                       
## [25] "\"배달앱 지각변동 시작됐다\""                                             
## [26] "후배 도우러 흉기 챙겨갔다가 40년 동네 선배 살해한 50대..징역 20년"        
## [27] "\"나 저 후보 때문에 망했어\"..김진태 후보 선거운동원 폭행한 50대 벌금형"  
## [28] "[이건희 타계]'글로벌 삼성' 키워냈지만..순탄치않은 가족사"                 
## [29] "[세쓸통]\"NO재팬 벌써 끝?\"..車 판매 늘자 비웃는 日"                      
## [30] "野 \"진혜원, 직속상관 윤석열을 '나이트 개업' 조롱..징계해야\""            
## [31] "[이건희 별세] 사양한다 했는데도 밀려드는 조화로 '북적'.. 외부인 출입 통제"
## [32] "'야당의 시간' 국감인데 국민의힘 6%p 하락..민주당 지지율 35%"              
## [33] "\"왜 독가스를 뿜어 대느냐\"고 따지던 옆집 할머니"                         
## [34] "\"이병철 선대회장 때처럼?\"..호텔신라·패션, 삼성서 계열 분리될까"        
## [35] "여권이 키운 '윤석열 대망론'..\"죽 써서 개 주게 될라\" [홍영식의 정치판]"  
## [36] "'라면형제' 기부금 모금은 중단..\"목숨 건진 10살형 지원은 계속\""          
## [37] "'학대누명 교사 자살사건' 여론 분노..엄벌 청원 30만 훌쩍"                  
## [38] "[이건희 타계]이재현 CJ 회장 \"집안 이끈 자랑스러운 작은 아버지\""         
## [39] "10조→387조..\"삼성의 거침없는 진격에 천하의 애플도 떨었다\""             
## [40] "5·18 부당징계 경찰관 급여 정산액 10만원..'40년 전 봉급대로'"             
## [41] "'혈세 4300억' 어쩌나..애물단지 전락한 영암 F1 서킷 [세금 먹는 하마]"      
## [42] "미 복지장관 \"한국 대형교회 코로나때 접촉자 체포 위해 군활용\""           
## [43] "\"한국 교회 접촉자 체포하려 군 동원\" 미 복지장관 황당 주장"              
## [44] "이건희 삼성 회장 별세에 정치권 '조문·애도' 긴급 논의"                    
## [45] "정부, 6·25책임 美에 돌린 시진핑에 \"북의 남침은 역사적 사실\""           
## [46] "일본에 \"스가=히틀러\" \"일본 국민=나치독일 국민\" 논쟁 가열"             
## [47] "[뉴스人사이드]베일에 싸인 亞 최고 여성부호..정작 그를 알린건 '국적세탁'"  
## [48] "\"이 가격에 계속 쿠팡에 납품해야 하나?\"..고민하는 제조기업"              
## [49] "[왜?]\"구충제 효과\"→\"먹는 환자들 말려야\" 김철민 국감 증언"            
## [50] "[이건희 별세]상속세 10조 그게 다가 아니다, 이재용·이부진 과제"           
## 
## [[2]]
##  [1] "아내와 성관계 후 갑자기 폭행한 뒤 살해..英 갑부의 두 얼굴"                                                                   
##  [2] "한국은 되고 유럽은 안 되는 이유, '가디언'의 적나라한 지적"                                                                   
##  [3] "[단독] 나라에 낼 돈 130억인데, 조국 모친 \"전재산 9만원\""                                                                   
##  [4] "\"EU 회원국, WTO 총장 선거서 나이지리아 후보 지지에 접근\""                                                                  
##  [5] "살 뺀다고 탄수화물을 끊어? \"줄일 것은 따로 있어요\""                                                                        
##  [6] "온천천에 나타난 진객 연어, \"하루 사이 무슨 일이.. \""                                                                       
##  [7] "어린이집서 친구와 부딪쳐 넘어진 5살..이틀만에 숨져(종합)"                                                                    
##  [8] "싱가포르, 한국 '독감백신 접종 후 사망'에 백신 2종 접종 중단"                                                                 
##  [9] "제2의 '구하라 사건'..딸 숨지자 28년만에 나타난 생모"                                                                         
## [10] "28년만에 나타나 딸 억대 유산 챙긴 친모..간병한 계모에 절도소송까지"                                                          
## [11] "\"고소하니 합의하자고..\" 어느 날 사라진 유튜버, 망가진 그의 삶"                                                             
## [12] "윤석열 화환 '나이트클럽' 조롱한 진혜원..야당 \"부하가 상급자 모욕, 징계감\""                                                 
## [13] "\"질병청 믿고 백신 맞자\"..62~69세 반나절 만에 26만명 접종"                                                                  
## [14] "[주진우 라이브] 함세웅 신부 \"이건희의 '마누라와 자식 빼고 버려라?'..가족에 매몰된 한계가 삼성의 한계이자 우리 시대의 한계\""
## [15] "가수 '상위 1%' 63명 연소득 34억원..1%가 전체소득 53% 차지"                                                                   
## [16] "\"물 찾다 실수로 소주 1병 마셔\".. 음주운전 경찰관의 황당 변명"                                                              
## [17] "\"윤석열 누구랑 밥먹으면 고발할 것..윤석열 정치 방지법 만들어야\""                                                           
## [18] "한 달째 전남대 앞 쓰레기봉투 들고 나타난 20대들"                                                                             
## [19] "이건희 상속세 무려 11조..국가 세입예산마저 뒤흔들었다"                                                                       
## [20] "'전 남편 살해 무기징역' 고유정, 현 남편과 이혼소송서 패소"                                                                   
## [21] "'6.25는 북침' 열 올리는 중국, 동조하는 아이돌..조용한 한국 정부"                                                             
## [22] "[단독] 첫날부터 오작동..2억 원 아끼려다 5명 목숨 잃었다"                                                                     
## [23] "미국서 '살인말벌' 제거 작전..완전무장에 진공청소기 동원"                                                                     
## [24] "허수아비 후보로 세운 청소부, 진짜로 러 시장 되자 벌어진 일"                                                                  
## [25] "'공항 화장실에 버려진 아이' 카타르, 여성승객 강제 자궁 검사"                                                                 
## [26] "부산에 있는 55년 '해운대암소갈비'가 서울에도..법원 \"불법행위\""                                                             
## [27] "추미애, 野 사퇴요구에 \"뭐라 하겠나..장관 한번 해보세요\""                                                                   
## [28] "'#택배기사님감사합니다'..잇단 사망에 \"새벽배송 안 시킨다\""                                                                 
## [29] "\"되찾을 수 없는 건 생명\"..이건희 '가짜 편지' 확산"                                                                         
## [30] "[타봤습니다] 비행기는 탔지만 목적지는 없다..완판된 9만9000원 여행"                                                           
## [31] "\"40만원 과외, 버는건 8만원\" 요즘 대학생들에게 무슨 일이"                                                                   
## [32] "다시 칼 빼든 추미애 \"윤석열 중앙지검장 때 옵티 무혐의, 감찰 예정\"(종합)"                                                   
## [33] "강경화 \"'병역 면탈' 유승준 비자 발급, 허용하지 않기로\""                                                                    
## [34] "바이든 아들은 노트북 수리를 맡겼다, 그것이 화근이었다"                                                                       
## [35] "조국에게 총애받던 박형철, 그가 입 열수록 조국은 다친다"                                                                      
## [36] "'부하' 표현..조수진 \"우병우에 썼잖냐\" 秋 \"기억 없다\""                                                                    
## [37] "김홍희 해경청장 \"충동적 공황상태에서 자진 월북..증거 다수\"(종합)"                                                          
## [38] "[이건희 별세] 사인은 '신부전'..신장이 노폐물 걸러내지 못하는 병"                                                             
## [39] "검찰인사 문제삼는 野에 폭발..추미애 \"총장한테 물어봐라\""                                                                   
## [40] "종전선언 논의하러 美갔는데..北 \"외세 할아비처럼 섬기며 비굴하게 처신\""                                                     
## [41] "추미애, 윤석열 국감 맹공..'직접감찰·해임건의' 꺼냈다"                                                                       
## [42] "추미애 \"김봉현 술접대 검사 수사팀장 투입..사실로 확인\"(종합)"                                                              
## [43] "'시속 166km' 음주운전하다 2명 사망사고 낸 20대 징역 7년"                                                                     
## [44] "\"못살겠다, 불안해서\"..대선 앞두고 총 사러가는 미국인"                                                                      
## [45] "[시선집중] 윤호중 \"윤석열 불쌍하기까지.. 악마에 영혼 판 파우스트 같아\""                                                    
## [46] "어린이집에서 놀던 5살 남아 숨져..경찰 수사"                                                                                  
## [47] "70대 몰던 어린이 통학버스 주유소 돌진..2명 부상"                                                                             
## [48] "박상기 \"내가 윤석열에게 '조국 선처'?..참 어이가 없다\""                                                                     
## [49] "강준만 \"문재인 정권 거의 모든 게 내로남불, 정리하다 포기\""                                                                 
## [50] "삼성전기 3분기 영업이익 3천25억원..작년 동기 대비 59.9%↑(종합)"                                                             
## 
## [[3]]
##  [1] "'백신 사망' 17세 고교생, 부검서 화학물질 검출..유족 \"억울하다\""                                                            
##  [2] "[단독][취재파일] 잿더미 된 사찰, 알고 보니..부처님 앞 \"할렐루야!\" 외친 '그 여자'"                                          
##  [3] "'화학물질 검출' 고교생..경찰 \"직접 구매 확인\" 가족 \"극단선택 이유없다\""                                                  
##  [4] "[AS뉴스]\"엽기폭행 양진호, 옥중 결혼..한해 수익 2백억\""                                                                     
##  [5] "[단독] '조국 일가 명예훼손' 보수 블로거 \"조 선생님 선처를\""                                                                
##  [6] "'붉은대게' 재고 산더미..공장 문 닫고 조업 포기"                                                                              
##  [7] "성병 숨기고 7개월간 두명과 성관계..20대 집행유예"                                                                            
##  [8] "용인 골프모임 31명 집단확진..가족모임·어린이집서도 새 감염(종합)"                                                           
##  [9] "7억짜리 용인 땅, 300억 됐다..이건희가 건설비 전액 댄 이곳"                                                                   
## [10] "[단독] \"실종 보고받고 지휘한 내용 밝혀라\"<U+22EF> 피격 공무원 형, 청와대에 정보공개 청구"                                  
## [11] "자신과 아내 지키려 흉기든 이웃 제압해 숨지게 한 70대 '무죄'"                                                                 
## [12] "세계최고 수준 천문학적 세금 '폭탄'..세금 때문에 기업 판다"                                                                   
## [13] "트럼프 개인 빚 1조2400억..재선 실패땐 파산 가능성"                                                                           
## [14] "'갑질폭행' 양진호, 옥중결혼 이유..부인 통해 매년 200억 가져간다"                                                             
## [15] "'3000만원 현상금'에 놀라 롤렉스 반환한 범인 \"고가인줄 몰랐어요\"[사건TMI!]"                                                 
## [16] "트럼프 잔고 바닥났다, 바이든은 45억짜리 브래드 피트 광고"                                                                    
## [17] "무면허로 전동킥보드 타다 택시 충돌한 고교생, 사흘만에 사망"                                                                  
## [18] "\"휠 고의 파손? 그런적 없다\" 타이어뱅크 점주 '사과문' 나흘만에 돌변"                                                        
## [19] "문대통령이 윤석열에 메신저 보내?..靑 \"정보 없어 확인 불가\""                                                                
## [20] "시외버스서 승객 너머로 자위행위 촬영 20대 집행유예"                                                                          
## [21] "강경화 \"비자발급 안돼\"→유승준 또 호소문..\"국민이 거부\" 여론 싸늘"                                                       
## [22] "인천 마트 주차장 3층서 승용차 추락..70대 운전자 숨져"                                                                        
## [23] "유튜브 잠깐 출연했다 봉변.. 일상 덮친 이름 모를 '악플'"                                                                      
## [24] "트럼프 극찬한 항체 치료제 실제 써보니 '효과'"                                                                                
## [25] "인천 고교생 사망 원인 \"독감 백신 아닌 독극물\""                                                                             
## [26] "백*원의 원조쌈밥집 등 '자기 이름을 상표로'..성명상표 출원 활발"                                                              
## [27] "파지수집 리어카 끌던 노인, 전복된 승용차에 치여 사망(종합)"                                                                  
## [28] "아프리카서 물개 7000마리 떼죽음 미스터리..대부분 태아 상태"                                                                  
## [29] "백악관 \"대유행 통제 않을 것\" 바이든 \"패배의 백기 흔들어\""                                                                
## [30] "'한동훈과 육탄전' 정진웅, 독직폭행 혐의로 기소(종합)"                                                                        
## [31] "\"왜 더 큰 평수로 옮겨요? 이거 거래허가 못내줍니다\""                                                                        
## [32] "AFP \"EU 회원국 대다수, WTO 총장 선거서 나이지리아 후보 지지\""                                                              
## [33] "중국 공청단 \"한국전쟁 남침 아니다..한 국가 내전\" 궤변(종합)"                                                               
## [34] "의협 다시 집단행동? \"28일까지 의사국시 해결책 내놓지 않으면..\""                                                            
## [35] "이탈리아 언론 또 한국 칭찬..\"첨단기술로 바이러스 잡았다\""                                                                  
## [36] "EU 27개 '몰표' 나이지리아로..WTO 첫 한국인 수장 선출 경고등"                                                                 
## [37] "이건희 회장 병상 6년간 일가 받은 배당금 2.8조"                                                                               
## [38] "[황보선의출발새아침] 박수영\"文 대통령, 둘 다 해임하든 한 사람 해임하든지 결단해야\""                                        
## [39] "쇠징 박힌 신발 신은 채 후배 얼굴 걷어찬 겁 없는 10대"                                                                        
## [40] "[주진우 라이브] 함세웅 신부 \"이건희의 '마누라와 자식 빼고 버려라?'..가족에 매몰된 한계가 삼성의 한계이자 우리 시대의 한계\""
## [41] "1인용 킥보드에 남녀 두명이? 도로 위 '위험천만' 데이트"                                                                       
## [42] "낙동강 하구 이어 도심하천인 부산 온천천에서도 연어 발견"                                                                     
## [43] "\"한국만 아니면 된다\"..고비 때마다 '발목' 잡는 일본"                                                                        
## [44] "[단독] 첫날부터 오작동..2억 원 아끼려다 5명 목숨 잃었다"                                                                     
## [45] "룸살롱서 술판 벌이고 라임 자료 줬는데.. 금감원은 '사적영역'이라며 부실 감찰"                                                 
## [46] "\"한국반도체 인수 검토하라\" 한마디..삼성, 세계적 기업 시발점 됐습니다"                                                      
## [47] "[단독]해외는 좌석 채우는데..한국은 연인도 띄어앉아"                                                                          
## [48] "김봉현이 주장한 술접대, 당사자 전원 \"검사 없었다\""                                                                         
## [49] "독감 백신 접종 뒤 숨진 인천 고교생 형 \"억울함 풀어달라\" 청원(종합)"                                                        
## [50] "중국 신장서 기침·발열없이 137명 집단감염..\"이전 코로나와 다르다\""                                                         
## 
## [[4]]
##  [1] "[현장영상] 故 이건희 회장 발인 엄수..눈물 보이는 딸 이부진"                        
##  [2] "'딸들 광고 좀 하겠다'던 이건희 회장.. 눈물로 보낸 두딸"                            
##  [3] "\"떼쓸 것을 써라\" 사망 원인 묻는 유가족에 쏟아지는 '악플' <U+00A0>"               
##  [4] "내 딸이, 12시간 동안 쇠창살에 찔려 죽었다"                                         
##  [5] "'별장 성접대' 김학의 무죄 뒤집혀 법정구속..\"상고할 것\"(종합)"                    
##  [6] "여자손님 잇달아 성폭행한 40대 게스트하우스 주인 감형"                              
##  [7] "양배추, 삶은 달걀, 사과.. 아침에 좋은 건강식 5가지"                                
##  [8] "\"코로나환자 수차례 접촉해도 감염 안되는 사람들 있어\" 러' 전문가"                 
##  [9] "'까맸던 얼굴이' 코로나 극한 투병 중국인 의사 회복"                                 
## [10] "\"지금 예약해도 내년에나 가능\"..병원마다 검진 환자 북새통"                        
## [11] "[단독] \"난 곁가지다\" 김봉현, 진짜 '라임 몸통' 실명 밝혔다"                       
## [12] "文 시정연설에 野 '이게 나라냐' 항의..'신원검색' 소란도(종합)"                      
## [13] "'항미원조 선동' 아이돌 '일파만파'..소속사·방송사까지 '규탄'"                      
## [14] "이건희 회장 화성 삼성반도체서 마지막 인사..임직원 국화 배웅"                       
## [15] "23년간 TV 50대 수신료 내온 병원, KBS에 \"10대 뿐..23년치 환불 요구\""              
## [16] "고문으로 얼굴 붓지 않은 '어린 유관순' 찾았다"                                      
## [17] "\"인천 고교생 사망.. 독감 백신 음모론은 틀렸다\""                                  
## [18] "'42명 확진' 용인 동문 골프모임은 성균관대 '비학위과정 모임'"                       
## [19] "[단독] \"이건희, '일 한번 벌여보자'..고대·성대 합치려 했다\""                     
## [20] "\"등록금·신혼집 날렸어요\" 빅히트 주식 '영끌'한 개미들 아우성"                    
## [21] "정청래 \"한푼 줍쇼\" 앵벌이 논란에..\"고액 연봉자\" vs \"솔직하다\""               
## [22] "서초구 \"윤석열 화환 강제철거\" 예고..일부 시민 \"민주국가 맞나\""                 
## [23] "'주호영 몸수색'에 국회 발칵..野, 대통령 연설때 고성"                               
## [24] "WTO, 오늘 밤 선호도 조사결과 통보..유명희 당선 조만간 윤곽"                        
## [25] "\"안마의자 쓰면 키 크고 집중력 좋아져\"..검찰, 바디프랜드 기소"                    
## [26] "이재명 '文 시정연설' 겉으로는 칭찬했지만..\"과오 반복 안돼\" 우회적 비판"          
## [27] "코웃음 친 박범계 \"옵티머스, 자료 없어 계좌 추적 못했다고?\""                      
## [28] "[황보선의출발새아침] 호사카 유지\"日, 美 따라 유명희 지지할 것.. 당선가능성 60%\"" 
## [29] "홍준표 \"지지율 4% 정당 살려놨더니..야당 왜 이래\""                                
## [30] "[데일리안 여론조사] '차기 대권' 이재명22.8%, 이낙연21.6%, 윤석열15.1%"             
## [31] "추미애, 수사지휘 이어 '감찰그물'로 윤석열 꽁꽁..사퇴종용인가"                      
## [32] "'별장 성접대' 김학의 무죄 뒤집혔다..2심 실형 법정구속"                             
## [33] "[단독] 대구 실종 잠수사, 취수구 배관에 빨려 들어간 듯..관로 절단 추진"             
## [34] "오바마 \"김정은이 트럼프 재선 원한다고?..모든 것 줬기 때문\""                      
## [35] "[단독][취재파일] 잿더미 된 사찰, 알고 보니..부처님 앞 \"할렐루야!\" 외친 '그 여자'"
## [36] "문대통령·정총리 다 나섰지만 '나이지리아' 손 든 EU, WTO 선거 '먹구름'"             
## [37] "\"전두환 아직 정신 못 차렸네\".. 수상한 사람들의 반격"                             
## [38] "의료계 또 다시 집단행동?..의협 \"정부, 국시 문제 해결책 내놔라\""                  
## [39] "의협 다시 집단행동? \"28일까지 의사국시 해결책 내놓지 않으면..\""                  
## [40] "\"휠 고의 파손? 없다\" 평생 반성하겠다던 타이어뱅크 점주 '돌변'"                   
## [41] "의협 '의대 국시' 강공 전환..의료계마저 \"국민 협박하나\""                          
## [42] "오색찬란 단풍 속 하늘 찌를 듯 솟은 '한국의 장자제'"                                
## [43] "\"이 아이, 300만원\" 중학생 당근마켓 글..실제 문의한 사람들(종합)"                 
## [44] "문정인 \"반중 군사훈련 동참시 중국은 한국을 적으로 간주할 것\"(종합)"              
## [45] "하필 마오 아들 생일날, 계란볶음밥 만들다 욕먹은 中요리사"                          
## [46] "정의선 현대차 회장, 이건희 회장 영결식에도 달려왔다"                               
## [47] "[단독/레이더P] '방역지침 위반 논란' 강경화 장관 남편, 요트 결국 못 샀다"           
## [48] "아파트 관리소장 살해한 60대 입주자대표, 도주했다가 자수"                           
## [49] "2억7천만 뷰 기록한 '이날치 열풍'..세계 매료시킨 '조선의 힙합'"                     
## [50] "유승민 \"文대통령, 나라살림 거덜 내려 작정..악성 포퓰리즘 몰아내야\""              
## 
## [[5]]
##  [1] "\"혹시 가짜 마스크?\" 이 마스크 산 분들, 꼭 확인하세요"                       
##  [2] "대장과 병장 월급 차이.. 이 정도일 줄은 몰랐을 거다"                           
##  [3] "[단독] 이건희 회장 장지까지 간 3개의 조화, 누구일까"                          
##  [4] "'하''허''호' 번호판에 당했다, 콜받고 갔다 돈폭탄 맞는 대리기사"               
##  [5] "\"추 장관님, 저 역시 커밍아웃합니다\" 이어지는 평검사들의 비판글"             
##  [6] "나이지리아 손 들어준 WTO..유명희, 사퇴·버티기 갈림길(종합2보)"               
##  [7] "한밤 고층 아파트에 드론 띄워 성관계 현장 촬영 일당 기소"                      
##  [8] "\"우리 WTO 후보는\".. 日, 유명희 예상 밖 선전에 '충격' [특파원+]"             
##  [9] "\"다스는 MB것\" 밝혀낸 검사들, 추미애 취임후 죄다 좌천됐다"                   
## [10] "'스스로 코로나 두 번 감염' 69세 교수의 결론..\"집단면역 소용없다\""           
## [11] "무허가 공장서 마스크 1천만장 만들어 KF94로 속여 판 일당 적발"                 
## [12] "대법원, 이명박 전 대통령 징역 17년·벌금 130억 확정(종합)"                    
## [13] "징역 17년 확정 이명박 \"법치 무너져, 진실 반드시 밝혀질 것\"(종합2보)"        
## [14] "\"다시 유행하는 코로나..최고의 투자처는 한국\""                               
## [15] "평생 동반자 떠나보낸 홍라희..\"삼성의 조용한 조력자\""                        
## [16] "'윤석열 화환' 물결..대검, 서초구 철거 요청에 협조 부탁"                       
## [17] "[단독그후] '여교사 7명 불법 몰카촬영' 고교생 '퇴학처분'..우편물 뒤지며 '찰칵'"
## [18] "박형준, 국민의힘 8년 만에 복당..부산시장 출마 준비 중"                        
## [19] "밀린다는 소식에 보란 듯 \"유명희 지지\"..승복이냐 완주냐"                     
## [20] "'윤석열 화환' 철거 요구 김남국에..서민 \"낙엽 떨어지는 11월엔 외출 금지하자\""
## [21] "\"커피마시러, 담배피우러 나간 시간, 근로시간인가?\""                          
## [22] "의협 또 '파업 가능성'에 등돌린 여론..네티즌들 비판 목소리"                    
## [23] "국민의힘, 청년 비대위원 뽑아놨더니.. 연일 '상속세 인하' 목청"                 
## [24] "미국 유명희 지지에 유럽언론은 '일방주의·WTO 사보타주' 의심"                  
## [25] "윤석열 장모 변호인 \"속아서 사문서위조했다\"..장모는 불출석"                  
## [26] "[사건의 재구성]\"성폭행 당했다\" 거짓고소 들통난 꽃뱀 범행"                   
## [27] "[3보] 이명박 전 대통령 징역 17년·벌금 130억 확정..재수감"                    
## [28] "코로나 입원환자 80%의 공통점..비타민D가 모자라"                               
## [29] "2억7천만 뷰 기록한 '이날치 열풍'..세계 매료시킨 '조선의 힙합'"                
## [30] "코로나에 갇힌 6개월, 딸은 다시 아기가 됐다"                                   
## [31] "\"4인가족에 왜 40평 필요\" 구청 공무원의 황당 발언"                           
## [32] "'이재용 상속세 인하' 주장에..이재웅 \"일고의 가치 없어\""                     
## [33] "추미애, '검찰개혁 실패' 검사 글 저격..\"개혁이 답이다\""                      
## [34] "고문으로 얼굴 붓지 않은 '어린 유관순' 찾았다"                                 
## [35] "유준상 \"한칸 띄워앉으면 적자\" 호소..정총리 \"공연계 요구 고려\""            
## [36] "5년만에 의원 체포동의안 가결..정정순 \"의원들 선택 존중\"(종합)"              
## [37] "[단독] 검찰, 조해진 국민의힘 의원에 벌금 300만원 구형"                        
## [38] "미 무역대표부, WTO 사무총장 '유명희 지지' 공식 발표(종합)"                    
## [39] "與, 이명박 징역형 확정에 \"국민의힘, 대국민 사과하라\""                       
## [40] "정경심, 재판 막판에 증거 70여개 제출..검찰 \"부당하다\""                      
## [41] "\"아들 만나겠다\"며 집 나선 70대..실종 18일만에 숨진 채 발견(종합)"           
## [42] "친구들과 축구하다 넘어진 중1, 10분 뒤 사망 '논란'"                            
## [43] "조폭 끼고 버리고 째고.. \"전국 쓰레기산 처리비만 1천억\" [이슈&탐사]"         
## [44] "인천 아파트서 노부부 숨진 채 발견..사망 원인 조사"                            
## [45] "김학의 운명 가른 '인디밴드 보컬' 부친의 말"                                   
## [46] "'징역 17년 확정' 이명박, 침묵..측근들 속속 자택 집결"                         
## [47] "쪼잔한 억만장자..\"조망권 가린다\" \"훔쳐본다\" 이웃과 다투다 소송전"         
## [48] "'위안부는 일종의 매춘' 발언 류석춘, 명예훼손 혐의 불구속기소"                 
## [49] "'주호영 몸수색'에 국회 발칵..野, 대통령 연설때 고성"                          
## [50] "16억아파트 10년 보유세만 9000만원..\"나라에 월세 내는 기분\""                 
## 
## [[6]]
##  [1] "\"터질 게 터져\" 제주MBC 대체 무슨 일이 있었길래"                                                        
##  [2] "제주 '악마의 잼'으로 대박난 40대 업자 벌금만 15억"                                                       
##  [3] "친구들과 공차던 중학생, 10분 뒤 사망..엇갈리는 유족과 학교"                                              
##  [4] "청와대 앞에서 막춤을..전 세계 3억 번 돌려 봤다"                                                          
##  [5] "이만희에 귓속말 김평화..재판에서 드러난 '실세'"                                                          
##  [6] "시골마을 4가구 나란히 쌍둥이 출산..아빠는 모두 '굴착기 기사'"                                            
##  [7] "도박과 불륜이 낳은 '관악구 모자살인'..남편 2심도 '무기징역'"                                             
##  [8] "박훈 변호사, '룸살롱 술접대' 검사 실명·얼굴 공개"                                                       
##  [9] "연봉 4천만원에 월 100만원 긁으면 작년보다 130만원 더 공제"                                               
## [10] "충남 한 주유소서 주유한 차량 무더기로 '고장'"                                                            
## [11] "고문하다 사람이 죽으면 낙동강 고기밥으로 던졌다"                                                         
## [12] "수상한 '빨래 바구니'..금반지·황금열쇠·골드바 와르르"                                                   
## [13] "\"7억 빚 안 물려받아\".. 故박원순 유족 상속포기 법원 수용"                                               
## [14] "美 \"WTO총장에 유명희 지지\" 유럽 \"이제와서 왜 이러느냐\""                                              
## [15] "오늘부터 외식 1만원·영화 6000원 할인..'506만명' 소비쿠폰 혜택"                                          
## [16] "'코로나의 역설'..인간 사라지니 멸종위기 바다거북 기록적 부화"                                            
## [17] "박훈 변호사, '룸살롱 술접대 의혹' 검사 실명 공개(종합)"                                                  
## [18] "\"야당이 왜이래\" 국민의힘, 저조한 지지율..커지는 비판 목소리"                                           
## [19] "의사들 다시 집단휴진?..의협 긴급회의에 전공의·의대생 대표 참석했다"                                     
## [20] "LG전자 생활가전 일냈다..누적 영업이익 2조원 돌파(종합2보)"                                               
## [21] "文, 한번도 경험한 적 없는 '無 레임덕' 대통령 될까"                                                       
## [22] "프랑스 국가봉쇄에 간밤 '탈출 러시'..꼬리 문 차량행렬 700km (영상)"                                       
## [23] "류호정 \"비겁한 민주당, 해괴한 이낙연..부끄러운 줄 알라\""                                               
## [24] "바이든이 미국 대통령 되면 첫 한국인 WTO 사무총장 무산?"                                                  
## [25] "임은정 \"자성없이 성내는게 바른 검사냐\"..검사들 \"물타기냐\""                                           
## [26] "인천 아파트서 엄마와 쌍둥이 자녀 의식 불명 상태로 발견"                                                  
## [27] "김정재 \"박원순, 무릎에 입술 맞추고..\" 발언에 與 고성"                                                  
## [28] "\"KF94 장당 300원\".. 마스크업체 줄도산 위기"                                                            
## [29] "김종인 \"MB만 확정..박근혜 전 대통령까지 나오면 대국민 사과\""                                           
## [30] "\"혹시 가짜 마스크?\" 이 마스크 산 분들, 꼭 확인하세요"                                                  
## [31] "[특파원 시선] 이탈리아서 딸 잃은 부모의 절규..\"외교부는 어디 있나요\""                                  
## [32] "이성윤 '尹가족 수사' 배당 지시했지만 부서 정하지 못한채 한달째"                                          
## [33] "\"10알씩 입에 털어요\" 무심코 먹는 영양제 하루에 몇 알까지 가능할까?"                                    
## [34] "검사 저격 秋에 \"벌거벗은 임금님\"..'커밍아웃' 일파만파"                                                 
## [35] "[단독]뭐 실어가러 왔나..올 두번째 한국 온 UAE 군 수송기"                                                 
## [36] "\"비싸서 안 사요?\"..전기차 가격 5년 내 1000만원 내린다"                                                 
## [37] "[레이더P] 국민의당 부대변인 탈당..안철수 서울시장 불출마 반발"                                           
## [38] "마스크 고리..귀를 지킨다"                                                                                
## [39] "[시선집중] 조은희 \"윤석열 화환 철거하라니 '너는 무슨 당이냐' 문자 폭탄 쏟아져 .. 법과 원칙은 공정해야\""
## [40] "옥중편지 변호사 \"尹과 상갓집? 혼밥했다\"..영수증 공개(종합)"                                            
## [41] "BTS도, 차태현도, 전지현도 애틋하게 지나간 역"                                                            
## [42] "\"그 때 쉬는 건데..\"  운동을 후회하는 경우 5가지"                                                       
## [43] "\"트럼프 재선 확률 높다, 어찌됐든 대북정책은 유지될 것\""                                                
## [44] "로또 1등 11차례 복권방, 새벽 6시부터 찍는 '마지막 희망'"                                                 
## [45] "\"신은 위대하다\" 외치며..기도하는 할머니도 참수"                                                        
## [46] "'민주당만 빼고' 임미리 \"문 대통령, 추미애와 윤석열 모두 해임하라\""                                     
## [47] "방송사 영업정지 초유의 사태..MBN 향방은"                                                                 
## [48] "이재명 \"부동산 문제 잘못 건드려 악순환 반복\""                                                          
## [49] "이명박 전 대통령, 재수감 앞두고 서울대병원 진료차 외출"                                                  
## [50] "이곳만 다녀가면..차량 100여 대 망가뜨린 주유소"                                                          
## 
## [[7]]
##  [1] "'김학의 법정구속' 결정타는 '연예인 아빠' 진술"                         
##  [2] "봉인된 박근혜 때 '세월호 참사' 대통령기록물, 시민 힘으로 열릴까"       
##  [3] "서경석도 본 공인중개사 시험, 직접 치러보니..\"너 마저, 넘사벽\""       
##  [4] "13년 전 이명박-박근혜 '경선 폭로전'..모두 사실로"                      
##  [5] "\"4년 전 아내가 사자고 했던 아파트가 7억이 올랐습니다\""               
##  [6] "개그맨 서경석도 응시..공인중개사 시험 34만명 접수 역대 최다(종합)"     
##  [7] "원산안면대교 교각에 낚싯배 '쾅'..3명 사망·19명 부상(종합2보)"         
##  [8] "MB 저격했던 BBK 김경준 \"정치 검찰 역사의 재판대에 올려야\""           
##  [9] "베일 벗은 인천 '새우타워'..기다란 수염에 다리까지 만들어"              
## [10] "동부구치소 돌아가는 MB 다시 독방으로..최서원 '한솥밥'"                 
## [11] "\"살고 싶어요\"..마스크 공장 사장의 '호소'[르포]"                      
## [12] "피 흘릴 때까지 공무원 폭행한 전남 강진체육회장 구속"                   
## [13] "[이주의 미오픽] KBS 탐사보도에 딱 걸린 검찰의 '기획수사' 의혹"         
## [14] "김진태 \"후배 검사들 끝까지 버텨라..곧 좋은 세상 온다\""               
## [15] "\"넌 여기서 못 살걸, 난 잠깐 형을 살면 돼\"..뻔뻔한 유사강간범"        
## [16] "가수 이승환 \"세월호 고통 안긴 분들, 잘 살고 계신가\""                 
## [17] "지구촌 전체 GDP 7만 배짜리 '노다지' 광물 소행성 발견"                  
## [18] "걷잡을 수 없는 확산..이탈리아 일일 확진자 사상 첫 3만명대(종합)"       
## [19] "\"공익 차원서 깐다\"..라임 '술접대 의혹' 검사 실명 공개 파문"          
## [20] "\"이사오면 3년 연봉줄게요\"..伊 마을 파격조건으로 청년 유혹"           
## [21] "거리두기 1단계 완화 후 확진자 다시 급증..내일 거리두기 개편 주목"      
## [22] "\"오로지 한국인 위해 잡는다\" 골뱅이船 띄우는 영국"                    
## [23] "다시 K-방역 주목하는 유럽..\"오만함 버리고 한국 배워야\""              
## [24] "'부자의 왕도' 물었더니..1위 사업, 2위 부동산, 3위는?"                  
## [25] "[사건의 재구성] 일당 15만원 택배알바..배달품목은 '체크카드'"           
## [26] "\"김밥 빼고 물감·팔레트..\" 산 100곳서 붓질하는 여자"                 
## [27] "北, 윤석열 또 맹비난..\"형님 떠받드니 왕이라도 된 듯\""                
## [28] "던킨·배스킨, 13조원에 팔린다..미2위 레스토랑체인 탄생"                
## [29] "14세 여학생, 국내 3번째 소아·청소년 다기관염증증후군 발생(종합)"      
## [30] "'김신조 사건' 52년만에 개방된 북악산 철문..문 대통령 직접 열어"        
## [31] "\"안철수, 보여준 게 없다\" 청년 탈당에 술렁이는 국민의당"              
## [32] "'바이든이어야 하는 이유'..유력 매체들, 노골적인 '바이든 지지 커밍아웃'"
## [33] "가격인상 루머에 터진 '샤넬 쇼핑대란'..\"새벽부터 100명 줄\""           
## [34] "나이지리아 \"美반대에도 WTO 총장 우리후보 뽑히게 작업\""               
## [35] "야구장 관객 꽉 채워 '감염 실험'..日 '코로나 마루타' 논란"              
## [36] "대리사과에 거부감 드러낸 의대생들..갈수록 꼬여가는 의사국시"           
## [37] "고문하다 사람이 죽으면 낙동강 고기밥으로 던졌다"                       
## [38] "음주 뒤 차에서 잤더니..\"음주운전했죠?\" 견인차 기사들의 협박"         
## [39] "검사들 커밍아웃 '사이버 연판장'..秋 \"불편한 진실 계속\""              
## [40] "이곳만 다녀가면..차량 100여 대 망가뜨린 주유소"                        
## [41] "'손님 가장' 남성에 성매매 알선한 업주<U+2027>여종업원 1심서 무죄..이유는?"
## [42] "[영상] 터키·그리스 덮친 규모 7.0 강진..\"쓰나미가 더 심각\"(종합2보)" 
## [43] "72년생 서경석도 봤다..34만 몰린 공인중개사 시험 40대 최다"             
## [44] "[단독] 윤석열, 진천에서 '신임부장 소집'..조직 다지기 본격화"           
## [45] "김민석 \"의사국시 당정청 합의 없어..최대집 자작극 언플 중단해야\""     
## [46] "김경준 \"BBK도 이명박 소유..진술 막은 검찰 단죄해야\""                 
## [47] "마스크 고리..귀를 지킨다"                                              
## [48] "'처치곤란' 아이스팩, 재활용 아이디어 '눈길'"                           
## [49] "\"신은 위대하다\" 외치며..기도하는 할머니도 참수"                      
## [50] "[화보] 19년 만에 뜬 '핼러윈 블루문'..다음은 2039년"

What is a function? What is the function, lapply()?

Function

urls

## [1] "https://news.daum.net/ranking/popular?regDate=20201025"
## [2] "https://news.daum.net/ranking/popular?regDate=20201026"
## [3] "https://news.daum.net/ranking/popular?regDate=20201027"
## [4] "https://news.daum.net/ranking/popular?regDate=20201028"
## [5] "https://news.daum.net/ranking/popular?regDate=20201029"
## [6] "https://news.daum.net/ranking/popular?regDate=20201030"
## [7] "https://news.daum.net/ranking/popular?regDate=20201031"

remove_numbers <- function(x){
  library(stringr)
  y <- str_remove(x, "[[:digit:]]+")
  return(y)
}

?lapply

## starting httpd help server ... done

class(lapply(urls, remove_numbers))

## [1] "list"

lapply(urls, remove_numbers)

## [[1]]
## [1] "https://news.daum.net/ranking/popular?regDate="
## 
## [[2]]
## [1] "https://news.daum.net/ranking/popular?regDate="
## 
## [[3]]
## [1] "https://news.daum.net/ranking/popular?regDate="
## 
## [[4]]
## [1] "https://news.daum.net/ranking/popular?regDate="
## 
## [[5]]
## [1] "https://news.daum.net/ranking/popular?regDate="
## 
## [[6]]
## [1] "https://news.daum.net/ranking/popular?regDate="
## 
## [[7]]
## [1] "https://news.daum.net/ranking/popular?regDate="

R Basics for Web Scraping

Creating vectors

A sequence of numbers/integers, characters, or Booleans

c(1,3,5) # Join elements into a vector

## [1] 1 3 5

1:5 # An integer sequence

## [1] 1 2 3 4 5

seq(1, 5, by=2) # A sequence of integers from 1 to 5, increasing by 2

## [1] 1 3 5

rep(1:5, times=3) # Repeat an integer sequence 1:5 three times

##  [1] 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5

rep(1:5, each=3) # Repeat each element of an integer sequence 1:5 three times

##  [1] 1 1 1 2 2 2 3 3 3 4 4 4 5 5 5

Vector functions

# R is an object-oriented programming language; everything can be assigned to an object
headlines

##  [1] "화이자 \"임상 중인 백신, 90% 넘게 효과 있다\""                                                
##  [2] "'대권 도전' 시동 건 박용진, 與 대선 레이스 '다크호스' 되나"                                   
##  [3] "소화불량 7년 시달린 그녀.. 원인은 편두통이었다"                                               
##  [4] "\"토종 '칡소' 좀 살려주소\""                                                                  
##  [5] "화이자 백신 호재에 세계 증시·유가 일제히 폭등"                                               
##  [6] "손바닥에 거미 다리 모양 붉은 반점 생겼다면 \"간 검사 받으세요\""                              
##  [7] "검찰 '뇌물·횡령 혐의' 홍문종 징역9년 구형..洪 \"조작극\"(종합)"                              
##  [8] "무기 싣고 개표소로 돌진.. 펜실베이니아는 전쟁터였다"                                          
##  [9] "일제강점기 '명륜학원 졸업사진'..전주 최고 유교 기록물 선정"                                   
## [10] "세계인구 3분의 1 거대 경제권 탄생 임박..RCEP 협상 타결"                                       
## [11] "몸살 앓는 국토 대동맥 경부고속도로..수혈 위해 도심지역 입체화 시급"                           
## [12] "'돈세탁 혐의' 손정우, 구속영장 기각..\"도주우려 없어\""                                       
## [13] "박지원 만난 日집권당 2인자 \"신뢰 확신\"..한일관계 기대 발언"                                 
## [14] "철책 넘은 北 주민에 놀란 육군, 후방지역 대침투작전 점검"                                      
## [15] "\"언성 높이지 마세요\"..평택교육청, 의원 질의에 맞불 '행감 중지'"                             
## [16] "'어제의 동지' 트럼프에 일격..伊 베를루스코니 \"너무 거만했다\""                               
## [17] "'태움' 고통받다 극단적 선택..故 서지윤 간호사 산재 인정"                                      
## [18] "트럼프 '계산된 버티기', 2024년 대선 재출마 노리나"                                            
## [19] "'마지막 여행' 다녀온 김철민 \"다시 항암치료..끝까지 버틸 것\""                                
## [20] "윤석열, 차장들에게 '국민의 검찰' 강조..\"현안 언급 없었다\"(종합)"                            
## [21] "'코로나 이후 도시 공간' 제언, 유현준 교수 \"사람 많이 모일수록 좋은 도시란 공식 끝났다\""     
## [22] "[바이든 시대] 트럼프 지명 조달청장 요지부동..인수 지연"                                       
## [23] "[바이든 시대] 미 잡지가 본 '루저' 트럼프, 필사적으로 버티는 이유"                             
## [24] "'하늘의 응급실' 의무후송 전용헬기 軍 최초 도입"                                               
## [25] "난치성 파킨슨 증후군 치료 가능성 열렸다"                                                      
## [26] "푸틴이 바이든 축하 안하는 이유..크렘린 \"공식개표결과 나와야\""                               
## [27] "첫 '영구제명' 변호사, 또 실형..해임 경찰관에게 뇌물수수"                                      
## [28] "갓난 아기 때리고 던지고..CCTV에 '쿵' 소리까지"                                                
## [29] "여동생 밸러리가 이방카 역할하나..'바이든 패밀리' 눈길"                                        
## [30] "'웰컴 투 비디오' 손정우, 구속영장 기각..\"구속 사유 인정 어려워\""                            
## [31] "[단독] HDC현산 아시아나 포기안했나 \"금호리조트 매각말라\""                                   
## [32] "홍준표 \"전셋집 구했나\"..홍남기 \"개인적 상황이니 나중에\""                                  
## [33] "[바이든 시대] 트럼프에 누가 직언할까..\"측근들, 패배 알지만 조용\""                           
## [34] "만화계 오스카상 '쾌거'..세계가 격찬한 한국의 '그래픽 노블'"                                   
## [35] "바이든 코로나 부터 잡아라!..한국 언급한 측근 주목"                                            
## [36] "[바이든 시대] 일본 신문 \"바이든, 트럼프보다 한미관계 중시할 것\""                            
## [37] "성윤모 \"월성1호기 관련 압수수색에 매우 당혹\""                                               
## [38] "울산 남구 아파트 11층서 불..3천만원 피해"                                                     
## [39] "문 대통령, '바이든 시대' 공식화..\"바이든 사람들과 다방면 소통할 것\""                        
## [40] "물만 먹어도 살쪄? 기초대사량 늘리는 7가지 팁"                                                 
## [41] "코로나19 국내 확진자, 5주 연속 증가세..거리 두기 1.5단계 '경고등'"                            
## [42] "고개부터 숙인 민주당..국민의힘은 줄 잇는 출사표"                                              
## [43] "한번에 2,300억 줄여..학교 현장 비상"                                                          
## [44] "정품 마스크라더니..쿠팡, 뒤늦게 '무허가 마스크' 환불조치"                                     
## [45] "삼부토건, '이낙연 민주당 대표 동생' 이계연씨 대표 선임"                                       
## [46] "황상무 전 앵커, KBS에 사의 표명 \"공영방송, 한쪽 진영 서면 안 돼\""                           
## [47] "[바이든 시대] 트럼프 언급 한 마디 없이.. 메르켈 獨 총리, 바이든 당선 축하 성명"               
## [48] "국민의힘, 보궐선거 예선에 '여론조사 100% 적용' 가닥(종합)"                                    
## [49] "\"호수가 보이는 주택 갖고 싶어서\" 할아버지 살해한 美 20대 손녀"                              
## [50] "[주진우 라이브] 정세현 전 장관 \"바이든 정권 출범 후 복잡한 북핵 문제 셈법, 종전선언이 입구\""

h_vector <- headlines[1:5]
h_vector

## [1] "화이자 \"임상 중인 백신, 90% 넘게 효과 있다\""             
## [2] "'대권 도전' 시동 건 박용진, 與 대선 레이스 '다크호스' 되나"
## [3] "소화불량 7년 시달린 그녀.. 원인은 편두통이었다"            
## [4] "\"토종 '칡소' 좀 살려주소\""                               
## [5] "화이자 백신 호재에 세계 증시·유가 일제히 폭등"

companies

##  [1] "한국일보"   "한국일보"   "국민일보"   "경향신문"   "뉴스1"     
##  [6] "주간동아"   "뉴스1"      "오마이뉴스" "연합뉴스"   "연합뉴스"  
## [11] "노컷뉴스"   "뉴시스"     "연합뉴스"   "뉴시스"     "뉴스1"     
## [16] "연합뉴스"   "세계일보"   "한겨레"     "이데일리"   "뉴시스"    
## [21] "경향신문"   "연합뉴스"   "연합뉴스"   "KBS"        "뉴시스"    
## [26] "연합뉴스"   "KBS"        "MBC"        "채널A"      "이데일리"  
## [31] "조선일보"   "연합뉴스"   "연합뉴스"   "KBS"        "KBS"       
## [36] "연합뉴스"   "한겨레"     "연합뉴스"   "한국일보"   "코메디닷컴"
## [41] "경향신문"   "YTN"        "KBS"        "SBSCNBC"    "연합뉴스"  
## [46] "뉴스1"      "한국일보"   "뉴시스"     "머니투데이" "KBS"

c_vector <- companies[1:5]
c_vector

## [1] "한국일보" "한국일보" "국민일보" "경향신문" "뉴스1"

dates

## [1] 20201025 20201026 20201027 20201028 20201029 20201030 20201031

d_vector <- c(rep(dates[1],3),rep(dates[2],2))
d_vector

## [1] 20201025 20201025 20201025 20201026 20201026

list( )

What is a vector object? A collection of ordered elements in the same nature.

Ex) a vector of headlines; a vector of company names; a vector of dates …

What is a list object?

A vector with possible heterogeneous elements. That is, a list is collection of elements which can be of different contents or types.

The elements of a list can include character vectors and numeric vectors at once.

Let say we want to generate a list object that contains the above three vector objects all together.

We can use a function list( ) here.

List1 <- list(headline=h_vector, company=c_vector, date=d_vector) # Generate a list object, List1, to contain all the elements that are named "headline", "company", and "date"
List1

## $headline
## [1] "화이자 \"임상 중인 백신, 90% 넘게 효과 있다\""             
## [2] "'대권 도전' 시동 건 박용진, 與 대선 레이스 '다크호스' 되나"
## [3] "소화불량 7년 시달린 그녀.. 원인은 편두통이었다"            
## [4] "\"토종 '칡소' 좀 살려주소\""                               
## [5] "화이자 백신 호재에 세계 증시·유가 일제히 폭등"            
## 
## $company
## [1] "한국일보" "한국일보" "국민일보" "경향신문" "뉴스1"   
## 
## $date
## [1] 20201025 20201025 20201025 20201026 20201026

length(List1) # The function, length, calculates how many elements are in any R object (vectors, lists, & factors).

## [1] 3

class(List1) # R is an object-oriented style of programming. The function, class, allows us to know what type an object belongs to. It can be numeric, character, logical, list, and so on...

## [1] "list"

names(List1) # To get or set the names of an object; Here, elements' names are "headline", "company", and "date"

## [1] "headline" "company"  "date"

List1[1:2] # returns a new list object that contains the first and the second elements. What is length(List1[1:2])?

## $headline
## [1] "화이자 \"임상 중인 백신, 90% 넘게 효과 있다\""             
## [2] "'대권 도전' 시동 건 박용진, 與 대선 레이스 '다크호스' 되나"
## [3] "소화불량 7년 시달린 그녀.. 원인은 편두통이었다"            
## [4] "\"토종 '칡소' 좀 살려주소\""                               
## [5] "화이자 백신 호재에 세계 증시·유가 일제히 폭등"            
## 
## $company
## [1] "한국일보" "한국일보" "국민일보" "경향신문" "뉴스1"

List1[2] # returns a new list object that contains the second element only. What is length(List1[2])?

## $company
## [1] "한국일보" "한국일보" "국민일보" "경향신문" "뉴스1"

length(List1[2])

## [1] 1

List1[[2]] # returns a vector object that contains five elements of company names in the second element of List1. What is length(List1[[2]])?

## [1] "한국일보" "한국일보" "국민일보" "경향신문" "뉴스1"

length(List1[[2]])

## [1] 5

List1['headline'] # returns a new list with the element named 'headline' only

## $headline
## [1] "화이자 \"임상 중인 백신, 90% 넘게 효과 있다\""             
## [2] "'대권 도전' 시동 건 박용진, 與 대선 레이스 '다크호스' 되나"
## [3] "소화불량 7년 시달린 그녀.. 원인은 편두통이었다"            
## [4] "\"토종 '칡소' 좀 살려주소\""                               
## [5] "화이자 백신 호재에 세계 증시·유가 일제히 폭등"

List1[['headline']] # returns a vector with the elements of the list element named 'headline'

## [1] "화이자 \"임상 중인 백신, 90% 넘게 효과 있다\""             
## [2] "'대권 도전' 시동 건 박용진, 與 대선 레이스 '다크호스' 되나"
## [3] "소화불량 7년 시달린 그녀.. 원인은 편두통이었다"            
## [4] "\"토종 '칡소' 좀 살려주소\""                               
## [5] "화이자 백신 호재에 세계 증시·유가 일제히 폭등"

Why is list( ) important in web scraping?

Web data are structured at multiple levels. The list( ) function is useful for dealing with hierarchical data.

Ex) DAUM News > Ranking News > Popular News > Top 50 List on Oct/25, Top 50 List on Oct/26, Top 50 List on Oct/27 …

Let say we have a list of ten URLs for popular news at DAUM on different dates

# Example
urls

## [1] "https://news.daum.net/ranking/popular?regDate=20201025"
## [2] "https://news.daum.net/ranking/popular?regDate=20201026"
## [3] "https://news.daum.net/ranking/popular?regDate=20201027"
## [4] "https://news.daum.net/ranking/popular?regDate=20201028"
## [5] "https://news.daum.net/ranking/popular?regDate=20201029"
## [6] "https://news.daum.net/ranking/popular?regDate=20201030"
## [7] "https://news.daum.net/ranking/popular?regDate=20201031"

class(urls)

## [1] "character"

urls[1]

## [1] "https://news.daum.net/ranking/popular?regDate=20201025"

urls_list <- as.list(urls)
urls_list

## [[1]]
## [1] "https://news.daum.net/ranking/popular?regDate=20201025"
## 
## [[2]]
## [1] "https://news.daum.net/ranking/popular?regDate=20201026"
## 
## [[3]]
## [1] "https://news.daum.net/ranking/popular?regDate=20201027"
## 
## [[4]]
## [1] "https://news.daum.net/ranking/popular?regDate=20201028"
## 
## [[5]]
## [1] "https://news.daum.net/ranking/popular?regDate=20201029"
## 
## [[6]]
## [1] "https://news.daum.net/ranking/popular?regDate=20201030"
## 
## [[7]]
## [1] "https://news.daum.net/ranking/popular?regDate=20201031"

class(urls_list)

## [1] "list"

urls_list[[1]] # URL for popular news at DAUM on 10/25

## [1] "https://news.daum.net/ranking/popular?regDate=20201025"

urls_list[[2]] # URL for popular news at DAUM on 10/26

## [1] "https://news.daum.net/ranking/popular?regDate=20201026"

How to turn a list into a vector

#unlist( ) is a function to turn a list object into a vector object
#be cautious about using the unlist function
class(urls_list)

## [1] "list"

unlist(urls_list) # turn a list object into a vector object

## [1] "https://news.daum.net/ranking/popular?regDate=20201025"
## [2] "https://news.daum.net/ranking/popular?regDate=20201026"
## [3] "https://news.daum.net/ranking/popular?regDate=20201027"
## [4] "https://news.daum.net/ranking/popular?regDate=20201028"
## [5] "https://news.daum.net/ranking/popular?regDate=20201029"
## [6] "https://news.daum.net/ranking/popular?regDate=20201030"
## [7] "https://news.daum.net/ranking/popular?regDate=20201031"

class(unlist(urls_list))

## [1] "character"

urls_list[[2]]

## [1] "https://news.daum.net/ranking/popular?regDate=20201026"

unlist(urls_list)

## [1] "https://news.daum.net/ranking/popular?regDate=20201025"
## [2] "https://news.daum.net/ranking/popular?regDate=20201026"
## [3] "https://news.daum.net/ranking/popular?regDate=20201027"
## [4] "https://news.daum.net/ranking/popular?regDate=20201028"
## [5] "https://news.daum.net/ranking/popular?regDate=20201029"
## [6] "https://news.daum.net/ranking/popular?regDate=20201030"
## [7] "https://news.daum.net/ranking/popular?regDate=20201031"

unlist( ) allows us to combine a list object’s elements into a vector object

The apply() Family

apply() and its derivative functions allow crossing the data in a number of ways and avoid explicit use of loop constructs. They act on an input list, matrix or array and apply a named function with one or several optional arguments.

lapply( ): Applies a function to a list and returns a list object

lapply( ) applies a specified function to each element of a list and returns a new list object of the same length as the input list object. Each element of which is the result of applying a function to the corresponding element of the input list.

l in lapply( ) stands for list

List2 <- list(1:3,4:6,7:9)
List2

## [[1]]
## [1] 1 2 3
## 
## [[2]]
## [1] 4 5 6
## 
## [[3]]
## [1] 7 8 9

add_two <- function(x){
  y <- x + 2
  return(y)
}

lapply(List2, add_two) # returns a list object of results from applying a function "mean" to each element of List2

## [[1]]
## [1] 3 4 5
## 
## [[2]]
## [1] 6 7 8
## 
## [[3]]
## [1]  9 10 11

sapply( ): Applies a function to a list and returns a vector (or matrix) object

sapply( ) applies a specified function to each element of a list and returns a vector object when possible. It is the same as applying the function unlist( ) to the result of lapply( ).

List2

## [[1]]
## [1] 1 2 3
## 
## [[2]]
## [1] 4 5 6
## 
## [[3]]
## [1] 7 8 9

sapply(List2, add_two) # applies a function "add_two" to elements as vectors in List2 as a list

##      [,1] [,2] [,3]
## [1,]    3    6    9
## [2,]    4    7   10
## [3,]    5    8   11

sapply( ) is also applicable to elements in different formats.

List1

## $headline
## [1] "화이자 \"임상 중인 백신, 90% 넘게 효과 있다\""             
## [2] "'대권 도전' 시동 건 박용진, 與 대선 레이스 '다크호스' 되나"
## [3] "소화불량 7년 시달린 그녀.. 원인은 편두통이었다"            
## [4] "\"토종 '칡소' 좀 살려주소\""                               
## [5] "화이자 백신 호재에 세계 증시·유가 일제히 폭등"            
## 
## $company
## [1] "한국일보" "한국일보" "국민일보" "경향신문" "뉴스1"   
## 
## $date
## [1] 20201025 20201025 20201025 20201026 20201026

sapply(List1, str_length)

##      headline company date
## [1,]       28       4    8
## [2,]       36       4    8
## [3,]       27       4    8
## [4,]       16       4    8
## [5,]       26       3    8

tapply( ): Useful in applying to table

tapply( ) is used for applying a specified function to each element of a vector, grouped by another vector.

library(tidyverse)

## -- Attaching packages ---------------------------------- tidyverse 1.3.0 --

## √ ggplot2 3.3.0     √ purrr   0.3.4
## √ tibble  3.0.0     √ dplyr   1.0.1
## √ tidyr   1.0.2     √ forcats 0.5.0
## √ readr   1.3.1

## -- Conflicts ------------------------------------- tidyverse_conflicts() --
## x dplyr::filter()         masks stats::filter()
## x readr::guess_encoding() masks rvest::guess_encoding()
## x dplyr::lag()            masks stats::lag()
## x purrr::pluck()          masks rvest::pluck()
## x rvest::xml()            masks XML::xml()

mytable <- tibble(headline=h_vector, company=c_vector, date=d_vector) # Create a tibble object (dataframe) with three variables
mytable # returns a table with the three vectors

## # A tibble: 5 x 3
##   headline                                                     company      date
##   <chr>                                                        <chr>       <dbl>
## 1 "화이자 \"임상 중인 백신, 90% 넘게 효과 있다\""              한국일보 20201025
## 2 "'대권 도전' 시동 건 박용진, 與 대선 레이스 '다크호스' 되나" 한국일보 20201025
## 3 "소화불량 7년 시달린 그녀.. 원인은 편두통이었다"             국민일보 20201025
## 4 "\"토종 '칡소' 좀 살려주소\""                                경향신문 20201026
## 5 "화이자 백신 호재에 세계 증시·유가 일제히 폭등"              뉴스1    20201026

mytable$headline # $ sign selects a column of a data frame named "headline"

## [1] "화이자 \"임상 중인 백신, 90% 넘게 효과 있다\""             
## [2] "'대권 도전' 시동 건 박용진, 與 대선 레이스 '다크호스' 되나"
## [3] "소화불량 7년 시달린 그녀.. 원인은 편두통이었다"            
## [4] "\"토종 '칡소' 좀 살려주소\""                               
## [5] "화이자 백신 호재에 세계 증시·유가 일제히 폭등"

mytable$company

## [1] "한국일보" "한국일보" "국민일보" "경향신문" "뉴스1"

mytable$date

## [1] 20201025 20201025 20201025 20201026 20201026

Say we want to count how many times each word appears in doc1 and doc2. Here each word can be grouped by the variable wordlist. tapply(x,y,length): Applies the function length() to x as a vector of frequency in each doc, grouped by y as another vector of words.

tapply(mytable$headline, mytable$date, str_length) # applies the function length to mytable$headline, grouped by mytable$date, and returns the result: the number of characters in each headline

## $`20201025`
## [1] 28 36 27
## 
## $`20201026`
## [1] 16 26

tapply(x,y,length): Applies the function str_length() to x as a vector of character length in each headline, grouped by y as another vector of dates.

Let’s practice on tapply( )

Let’s calculate how many headlines are in each company and how many characters are in the headlines, using the function tapply( ).

headline_df <- tibble(headlines, companies) # creates a data frame including two vectors as columns
headline_df

## # A tibble: 50 x 2
##    headlines                                                         companies 
##    <chr>                                                             <chr>     
##  1 "화이자 \"임상 중인 백신, 90% 넘게 효과 있다\""                   한국일보  
##  2 "'대권 도전' 시동 건 박용진, 與 대선 레이스 '다크호스' 되나"      한국일보  
##  3 "소화불량 7년 시달린 그녀.. 원인은 편두통이었다"                  국민일보  
##  4 "\"토종 '칡소' 좀 살려주소\""                                     경향신문  
##  5 "화이자 백신 호재에 세계 증시·유가 일제히 폭등"                   뉴스1     
##  6 "손바닥에 거미 다리 모양 붉은 반점 생겼다면 \"간 검사 받으세요\"" 주간동아  
##  7 "검찰 '뇌물·횡령 혐의' 홍문종 징역9년 구형..洪 \"조작극\"(종합)"  뉴스1     
##  8 "무기 싣고 개표소로 돌진.. 펜실베이니아는 전쟁터였다"             오마이뉴스
##  9 "일제강점기 '명륜학원 졸업사진'..전주 최고 유교 기록물 선정"      연합뉴스  
## 10 "세계인구 3분의 1 거대 경제권 탄생 임박..RCEP 협상 타결"          연합뉴스  
## # ... with 40 more rows

# length() & str_length() apply to headline_df$headlines, grouped by headline_df$companies
tapply(headline_df$headlines, headline_df$companies, length) # returns a table

##        KBS        MBC    SBSCNBC        YTN   경향신문   국민일보   노컷뉴스 
##          6          1          1          1          3          1          1 
##      뉴스1     뉴시스 머니투데이   세계일보   연합뉴스 오마이뉴스   이데일리 
##          4          5          1          1         12          1          2 
##   조선일보   주간동아      채널A 코메디닷컴     한겨레   한국일보 
##          1          1          1          1          2          4

tapply(headline_df$headlines, headline_df$companies, str_length)

## $KBS
## [1] 27 33 35 29 23 55
## 
## $MBC
## [1] 29
## 
## $SBSCNBC
## [1] 33
## 
## $YTN
## [1] 27
## 
## $경향신문
## [1] 16 52 42
## 
## $국민일보
## [1] 27
## 
## $노컷뉴스
## [1] 38
## 
## $뉴스1
## [1] 26 38 38 41
## 
## $뉴시스
## [1] 32 32 39 22 36
## 
## $머니투데이
## [1] 37
## 
## $세계일보
## [1] 33
## 
## $연합뉴스
##  [1] 34 35 35 36 32 39 35 33 39 38 25 32
## 
## $오마이뉴스
## [1] 29
## 
## $이데일리
## [1] 36 39
## 
## $조선일보
## [1] 34
## 
## $주간동아
## [1] 36
## 
## $채널A
## [1] 31
## 
## $코메디닷컴
## [1] 26
## 
## $한겨레
## [1] 31 26
## 
## $한국일보
## [1] 28 36 41 48

Let’s apply the function for extracting headlines and companies from the URLs

urls

## [1] "https://news.daum.net/ranking/popular?regDate=20201025"
## [2] "https://news.daum.net/ranking/popular?regDate=20201026"
## [3] "https://news.daum.net/ranking/popular?regDate=20201027"
## [4] "https://news.daum.net/ranking/popular?regDate=20201028"
## [5] "https://news.daum.net/ranking/popular?regDate=20201029"
## [6] "https://news.daum.net/ranking/popular?regDate=20201030"
## [7] "https://news.daum.net/ranking/popular?regDate=20201031"

headline_extractor <- function(pageurl) {
  page <- readLines(pageurl)
  page_parsed <- htmlParse(page)
  headlines <- xpathSApply(page_parsed, headline_xpath, xmlValue)
  return(headlines)
}

headline_list <- lapply(urls, headline_extractor)
class(headline_list)

## [1] "list"

length(headline_list)

## [1] 7

company_extractor <- function(pageurl) {
  page <- readLines(pageurl)
  page_parsed <- htmlParse(page)
  companies <- xpathSApply(page_parsed, company_xpath, xmlValue)
  return(companies)
}

company_list <- lapply(urls, company_extractor)
length(company_list)

## [1] 7

W11-1: RWC Ch. 3 Web Scraping with rvest

Shin Lee

11/9/2020