package import

# install.packages('readxl')
library(readxl)
# install.packages('dplyr')
library(dplyr)
## Warning: 패키지 'dplyr'는 R 버전 4.2.2에서 작성되었습니다
## 
## 다음의 패키지를 부착합니다: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
# install.packages(lme4)
library(lme4)
## Warning: 패키지 'lme4'는 R 버전 4.2.2에서 작성되었습니다
## 필요한 패키지를 로딩중입니다: Matrix
# install.packages("lmerTest")
library(lmerTest)
## Warning: 패키지 'lmerTest'는 R 버전 4.2.2에서 작성되었습니다
## 
## 다음의 패키지를 부착합니다: 'lmerTest'
## The following object is masked from 'package:lme4':
## 
##     lmer
## The following object is masked from 'package:stats':
## 
##     step
# install.packages("ggplot2")
library(ggplot2)
# install.packages("sciplot")
library(sciplot)
# install.packages("openxlsx")
library("openxlsx")
## Warning: 패키지 'openxlsx'는 R 버전 4.2.2에서 작성되었습니다

feedback

  • subjcet를 가져오기
  • 3가지 카테고리(일상생활, 동사, 형용사)를 분류할 필요 없이 합쳐서 전체로 하기
  • 몇 개나 일치하는지, 일치하는 것들의 점수를 가져와서 calculate
  • paste를 다루는 문제(collapse)에 도움받음

CDI data import and clean

  • CDI data
    • 시트 1: raw response
    • 시트2,3,4: 시트1을 정리하고 cdi점수가 적혀있음.
  • data import
  • cdi 시트에서 참여자만 불러옴(보호자 이메일을 참여자로 대신함)
# 참여자만 불러오기
cdi_1 <- read_excel("C:\\Users\\csjja\\Desktop\\result.xlsx",
              sheet = "설문지 응답 시트1",
              range = "K1:K114", # cell range to read from
              col_names = TRUE, # TRUE to use the first row as column names
              na = "NA");head(cdi_1) # Character vector of strings to use for missing values
## # A tibble: 6 × 1
##   `보호자 이메일`      
##   <chr>                
## 1 godtheeb@hanmail.net 
## 2 munhee1981@naver.com 
## 3 dbsdmsghk14@naver.com
## 4 chasu7315@naver.com  
## 5 sepumsn@naver.com    
## 6 zzirizzi@hanmail.net
  • cdi raw 응답 불러옴
cdi_2 <- read_excel("C:\\Users\\csjja\\Desktop\\result.xlsx",
                  sheet = "설문지 응답 시트1",
                  range = "Z1:AU114", # cell range to read from
                  col_names = TRUE, # TRUE to use the first row as column names
                  na = "NA");head(cdi_2) # Character vector of strings to use for missing values
## # A tibble: 6 × 22
##   `1. 소리 (11)`    `2. 탈 것 (13)` `3. 장난감 및 …` `4. 동물 (41)` `5. 옷 (20)`
##   <chr>             <chr>           <chr>            <chr>          <chr>       
## 1 꽥꽥, 꿀꿀, 똑똑… 기차, 배, 버스… 공, 로봇, 블럭,… 개, 개구리, …  가방, 기저… 
## 2 꽥꽥, 꿀꿀, 똑똑… 기차, 배, 버스… 공, 로봇, 블럭,… 개, 개구리, …  가방, 구두,…
## 3 꿀꿀, 똑똑, 멍멍… 기차, 버스, 비… 공, 인형, 종이,… 개, 개구리, …  바지        
## 4 꽥꽥, 꿀꿀, 똑똑… 배, 버스, 비행… 공, 블럭, 장난…  개, 거북이, …  기저귀, 바… 
## 5 꿀꿀, 똑똑, 멍멍… 기차, 버스, 비… 공, 블럭, 연필,… 개, 개미, 고…  가방, 기저… 
## 6 꽥꽥, 꿀꿀, 똑똑… 기차, 배, 버스… 공, 로봇, 블럭,… 개, 개구리, …  가방, 구두,…
## # … with 17 more variables: `6. 가구 및 방안 (21)` <chr>, `7. 음식 (58)` <chr>,
## #   `8. 신체부위 (31)` <chr>, `9. 가정용품 (36)` <chr>,
## #   `10. 외부사물 (26)` <chr>, `11. 일상생활 (14)` <chr>,
## #   `12. 장소 (25)` <chr>, `13. 양, 정도 (14)` <chr>, `14. 사람 (33)` <chr>,
## #   `15. 의문사 (11)` <chr>, `16. 동사 (150)` <chr>, `17. 형용사 (52)` <chr>,
## #   `18. 끝맺는 말 (15)` <chr>, `19. 조사 (12)` <chr>,
## #   `20. 연결하는 말 (6)` <chr>, `21. 위치 (8)` <chr>, `22. 시간 (17)` <chr>
  • 보호자 이메일(열이름)을 subject로 변경
  • 뒤에서 left_join할 때 열이름을 통일시켜주기위한 목적적
# rename(테이블이름, "바꿀 이름" = "원래 이름")
cdi_1 <- rename(cdi_1, "subject" = "보호자 이메일")
  • cdi_2(cdi raw 응답 data)의 열 이름 정리;편의를 위해
names(cdi_2)#열이름 확인
##  [1] "1. 소리 (11)"             "2. 탈 것 (13)"           
##  [3] "3. 장난감 및 문구류 (14)" "4. 동물 (41)"            
##  [5] "5. 옷 (20)"               "6. 가구 및 방안 (21)"    
##  [7] "7. 음식 (58)"             "8. 신체부위 (31)"        
##  [9] "9. 가정용품 (36)"         "10. 외부사물 (26)"       
## [11] "11. 일상생활 (14)"        "12. 장소 (25)"           
## [13] "13. 양, 정도 (14)"        "14. 사람 (33)"           
## [15] "15. 의문사 (11)"          "16. 동사 (150)"          
## [17] "17. 형용사 (52)"          "18. 끝맺는 말 (15)"      
## [19] "19. 조사 (12)"            "20. 연결하는 말 (6)"     
## [21] "21. 위치 (8)"             "22. 시간 (17)"
names(cdi_2) <- gsub("[0-9]", "", names(cdi_2))
names(cdi_2) <- gsub("[[:punct:]]","",names(cdi_2))
names(cdi_2) <- gsub(" ", "",names(cdi_2))
names(cdi_2)
##  [1] "소리"           "탈것"           "장난감및문구류" "동물"          
##  [5] "옷"             "가구및방안"     "음식"           "신체부위"      
##  [9] "가정용품"       "외부사물"       "일상생활"       "장소"          
## [13] "양정도"         "사람"           "의문사"         "동사"          
## [17] "형용사"         "끝맺는말"       "조사"           "연결하는말"    
## [21] "위치"           "시간"
  • 긍부정 점수를 매기는데 사용할 3개 카테고리만 선택
categ <- cdi_2[,c(11,16,17)] # 3 category만 선택
head(categ)
## # A tibble: 6 × 3
##   일상생활                                                         동사  형용사 
##   <chr>                                                            <chr> <chr>  
## 1 고마워, 네/응, 돼, 만세, 목욕, 빠이빠이, 쉬, 아니(야), 안녕, 안… 가, … 가벼워…
## 2 고마워, 네/응, 돼, 만세, 목욕, 빠이빠이, 쉬, 아니(야), 안녕, 안… 가, … 가벼워…
## 3 빠이빠이, 쉬, 아니(야), 안녕, 안돼, 화이팅                       (불)… 미워, …
## 4 고마워, 네/응, 돼, 목욕, 빠이빠이, 쉬, 아니(야), 안녕, 안돼, 양… 가, … 귀여워…
## 5 고마워, 네/응, 돼, 만세, 빠이빠이, 쉬, 아니(야), 안녕, 안돼, 양… 가, … 같아/… 
## 6 고마워, 네/응, 돼, 만세, 목욕, 빠이빠이, 쉬, 아니(야), 안녕, 안… 가, … 가벼워…
merged <- paste(categ$일상생활, categ$동사, categ$형용사)#3개 카테고리를 하나로 merge
  • 문제가 발생함: 하나의 행으로 모든 데이터가 들어감
    • 해결책: subject와 함께 merged 데이터를 새로운 데이터 프레임으로 생성.
#보호자 이메일과 3개 카테고리 합친것을 df으로 만듦
as.character(cdi_1$`subject`) -> subject # character로 subject를 만듦.
data.frame(subject, merged) -> df

P(ositive)/N(egative) data import and clean

  • 긍부정 파일 import
pn <- read_excel("C:\\Users\\csjja\\Desktop\\긍부정.xlsx",
                 sheet = "시트2",
                 range = "A1:D35", 
                 col_names = TRUE,
                 na = "NA");head(pn) 
## New names:
## • `` -> `...4`
## # A tibble: 6 × 4
##   Words  SentiWord_Dict `P/N` ...4 
##   <chr>           <dbl> <chr> <lgl>
## 1 고마워              2 P     NA   
## 2 놀아                1 P     NA   
## 3 괜찮아              1 P     NA   
## 4 귀여워              2 P     NA   
## 5 맛있어              2 P     NA   
## 6 사랑해              2 P     NA
# pn_saved <- pn # save data
  • pn 데이터 정제
str(pn)
## tibble [34 × 4] (S3: tbl_df/tbl/data.frame)
##  $ Words         : chr [1:34] "고마워" "놀아" "괜찮아" "귀여워" ...
##  $ SentiWord_Dict: num [1:34] 2 1 1 2 2 2 2 1 2 1 ...
##  $ P/N           : chr [1:34] "P" "P" "P" "P" ...
##  $ ...4          : logi [1:34] NA NA NA NA NA NA ...
unique(pn$`P/N`) #변수 확인
## [1] "P"          "N"          "N/M(iddle)"
pn[pn$"P/N"=="N/M(iddle)",] #n/m인 행 확인 --> 넘어져
## # A tibble: 1 × 4
##   Words  SentiWord_Dict `P/N`      ...4 
##   <chr>           <dbl> <chr>      <lgl>
## 1 넘어져             -1 N/M(iddle) NA
pn[pn$"P/N"=="N/M(iddle)","P/N"] = "N" 


# 콤마를 기준으로 merged 데이터(paste했을 때 하나의 행으로 된 것)를 list화 
strsplit(merged, ',') -> merged.list

가져와서 정제한 데이터 가지고 분석

  • df안에 새로운 열
df$pn_value <- rep(" ", length(df$subject)) # pn_value 열 생성
df$pn_num <- rep(0, length(df$subject))# pn_num 열 생성
  • for문 돌려서 일치하는 단어가 있으면 paste해서 df$pn_vlaue에 넣기 & df$pn_vlaue의 개수세기
for (i in 1:length(df$subject)){
  vec <- gsub(',', ' ', df$merged[i])
  vec <- gsub(' +', ' ', vec)
  list <- strsplit(vec, ' ')
  if (length(pn$Words[which(as.vector(pn$Words) %in% list[[1]])]) == 0) {
    df$pn_value[i] <- NA
    df$pn_num[i] <- 0
  } else {
    df$pn_value[i] <- paste(pn$Words[which(pn$Words %in% list[[1]])], collapse = ",") #일치하는 단어 paste하기
    df$pn_num[i] <- length(pn$Words[which(pn$Words %in% list[[1]])]) # df$pn_vlaue의 개수세기
  }
}

head(df, n=2)
##                subject
## 1 godtheeb@hanmail.net
## 2 munhee1981@naver.com
##                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                            merged
## 1 고마워, 네/응, 돼, 만세, 목욕, 빠이빠이, 쉬, 아니(야), 안녕, 안돼, 양치, 응가/똥, 화이팅, 하지마 가, 가리켜, 가져, 간지럽혀, 건너, 걸어, 고쳐, 그려, 기다려, 깎아, (컵을)깨, (불)꺼, 꺼내, 꽂아, 끊어져, 끌어, 끼워, 나가, 나와, (물건을)날라, 날라가, (차에서)내려, 내려가, 넘어져, (통에)넣어, 노래 불러, 놀아, (물건을)놓아, 누워, (무엇을)눌러, (무엇에)눌려, 다녀, 다쳐, 닦아, 닫아, 달려, 당겨, 던져, 덮어, 도와, 돌려, 돌아, 두드려, (여기에)둬, (물건을)들어, (소리를)들어, 들어가, 때려, (물에)떠, 떨어뜨려, 떨어져, 떼(어), 뛰어, 마셔, 만들어, (빨래/싸움)말려, 말해, 맛봐, (주사를)맞아, (음식을)먹어, (음식을)먹여, 멈춰, 몰라, 물어, 밀어, (약)발라, 박수쳐, 버려, 벗어, 보여, 봐, 부딪쳐, 부숴, (물을)부어, 불러, (풍선을)불어, 붙여, 빗어, 빠져, 빨아, 빼, 빼앗아, 뽀뽀해, 뽑아, (물건을)사, 사랑해, (그 자리에)서, 수영해, 숨어, 시작해, 신어, (물건을)실어, 싸워, (모자)써, 쏟아, 씻어, 안아, 안해, 앉아, 알아, 열어, 올라가, 올려, 와, 요리해, 운전해, 울어, 웃어, (승부에)이겨, 일어나/일어서, 일해, 읽어, 입어, (잠)자, 잘라, 잡아, 죽어, 줘, 쫓아, 찍어, (공을)차, 찾아, 춤춰, 치워, 칠해, (차에)타, (차에)태워, 튀겨, 틀어, (코를)풀어, (꽃이)피어, 해, 혼나 가벼워, 간지러워, 같아/똑같아, 괜찮아, 귀여워, 길어, (색이)까매, 깜깜해, (색이)노래, 높아, 달라, 더러워, 더워, 동그래, 뜨거워, 많아, 맛없어, 맛있어, 매워, 멀어, 멋있어, 목말라, 무거워, 무서워, 배고파, (색이)빨개, 빨라, 싫어, 심심해, 아파, 어두워, 없어, 예뻐, 있어, 작아, 재미있어, 조용해, 졸려, 좋아, 착해, 추워, 커, (색이)파래, (색이)하얘, 힘들어
## 2                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                         고마워, 네/응, 돼, 만세, 목욕, 빠이빠이, 쉬, 아니(야), 안녕, 안돼, 양치, 응가/똥, 화이팅, 하지마 가, 간지럽혀, 걸어, 공부해, 기다려, (불)꺼, 나가, (차에서)내려, 넘어져, (통에)넣어, 노래 불러, 놀아, (무엇을)눌러, 다쳐, 닦아, 달려, 당겨, 던져, 도와, 들어가, 때려, 떼(어), 뛰어, 마셔, 만들어, 말해, (주사를)맞아, (음식을)먹어, 멈춰, 미워해, 밀어, (약)발라, 박수쳐, 버려, 벗어, 봐, 빗어, 빠져, 빨아, 빼, 뽀뽀해, (물건을)사, 사랑해, 생각해, 수영해, 숨어, 신어, 싸워, (모자)써, 씻어, 안아, 앉아, 열어, 올라가, 와, 요리해, 운전해, 울어, 웃어, 일어나/일어서, 읽어, 입어, (잠)자, 좋아해, 줘, (공을)차, 찾아, 춤춰, (차에)타, 해, 혼나 가벼워, 간지러워, 같아/똑같아, 괜찮아, 귀여워, 길어, 깜깜해, 높아, 더러워, 더워, 뜨거워, 많아, 맛없어, 맛있어, 매워, 멋있어, 목말라, 무거워, 무서워, 배고파, 시끄러워, 심심해, 아파, 없어, 예뻐, 이상해, 있어, 작아, 재미있어, 졸려, 좋아, (맛이)짜, (촉감이)차, 착해, 추워, 커, 힘들어
##                                                                                                                                                                          pn_value
## 1     고마워,놀아,괜찮아,귀여워,맛있어,사랑해,예뻐,웃어,재미있어,조용해,춤춰,넘어져,더러워,때려,떨어져,맛없어,무거워,무서워,숨어,싫어,심심해,아파,안돼,없어,울어,추워,혼나,힘들어
## 2 고마워,놀아,괜찮아,귀여워,맛있어,사랑해,예뻐,웃어,재미있어,좋아해,춤춰,넘어져,더러워,때려,맛없어,무거워,무서워,미워해,숨어,시끄러워,심심해,아파,안돼,없어,울어,추워,혼나,힘들어
##   pn_num
## 1     28
## 2     28
  • df$pn_value과 일치하는 형용사의 pn$SentiWord_Dict 값 가져오기 -> 실패
# 긍/부정 점수를 계산할 pn_cal만들기
df$pn_cal<- rep(" ", length(df$subject)) 
  • solution: 엑셀로 추출해서 직접 점수 calcaulate
  • data export
write.xlsx(df, sheetName="pn_data", file="pn_1.xlsx")
  • 직접 점수 calculate한 파일 import: pn_clear
    • pn의 각 단어를 검색해서 해당 단어를 정해진 점수로 변경
    • sum함수를 사용해서 점수의 합을 구함
pn_clear <- read_excel("C:\\Users\\csjja\\Desktop\\pn_1_clear.xlsx",
                  sheet = "pn_data",
                  range = "A1:E114", # cell range to read from
                  col_names = TRUE, # TRUE to use the first row as column names
                  na = "NA");head(pn_clear) # Character vector of strings to use for missing values
## # A tibble: 6 × 5
##   subject               merged                            pn_value pn_num pn_Cal
##   <chr>                 <chr>                             <chr>     <dbl>  <dbl>
## 1 godtheeb@hanmail.net  고마워, 네/응, 돼, 만세, 목욕, …  고마워,…     28   -7.5
## 2 munhee1981@naver.com  고마워, 네/응, 돼, 만세, 목욕, …  고마워,…     28   -7  
## 3 dbsdmsghk14@naver.com 빠이빠이, 쉬, 아니(야), 안녕, 안… 사랑해,…      4   -2  
## 4 chasu7315@naver.com   고마워, 네/응, 돼, 목욕, 빠이빠…  고마워,…     11   -4  
## 5 sepumsn@naver.com     고마워, 네/응, 돼, 만세, 빠이빠…  고마워,…     18  -13.5
## 6 zzirizzi@hanmail.net  고마워, 네/응, 돼, 만세, 목욕, …  고마워,…     32  -11.5
  • cdi score 내기 위해서 subjectcdi_1)과 raw data(cdi_2)를 cbind
cdi_score<-cbind(cdi_1, cdi_2)
head(cdi_score)
##                 subject
## 1  godtheeb@hanmail.net
## 2  munhee1981@naver.com
## 3 dbsdmsghk14@naver.com
## 4   chasu7315@naver.com
## 5     sepumsn@naver.com
## 6  zzirizzi@hanmail.net
##                                                                   소리
## 1 꽥꽥, 꿀꿀, 똑똑, 멍멍, 빵빵, 야옹, 얌얌, 어흥, 음매, 짹짹, 칙칙폭폭
## 2 꽥꽥, 꿀꿀, 똑똑, 멍멍, 빵빵, 야옹, 얌얌, 어흥, 음매, 짹짹, 칙칙폭폭
## 3                               꿀꿀, 똑똑, 멍멍, 빵빵, 야옹, 칙칙폭폭
## 4 꽥꽥, 꿀꿀, 똑똑, 멍멍, 빵빵, 야옹, 얌얌, 어흥, 음매, 짹짹, 칙칙폭폭
## 5                   꿀꿀, 똑똑, 멍멍, 빵빵, 야옹, 얌얌, 어흥, 칙칙폭폭
## 6 꽥꽥, 꿀꿀, 똑똑, 멍멍, 빵빵, 야옹, 얌얌, 어흥, 음매, 짹짹, 칙칙폭폭
##                                                                                                       탈것
## 1 기차, 배, 버스, 비행기, 소방차/불자동차, 썰매, 오토바이, 유모차, 자전거, 차/자동차, 택시, 트럭, 헬리콥터
## 2       기차, 배, 버스, 비행기, 소방차/불자동차, 오토바이, 유모차, 자전거, 차/자동차, 택시, 트럭, 헬리콥터
## 3                                                                            기차, 버스, 비행기, 차/자동차
## 4                                                                배, 버스, 비행기, 자전거, 차/자동차, 택시
## 5                                                            기차, 버스, 비행기, 유모차, 자전거, 차/자동차
## 6 기차, 배, 버스, 비행기, 소방차/불자동차, 썰매, 오토바이, 유모차, 자전거, 차/자동차, 택시, 트럭, 헬리콥터
##                                                                                장난감및문구류
## 1 공, 로봇, 블럭, 비누방울, 선물, 연필, 인형, 장난감, 종이, 책, 총, 크레용/크레파스, 풀, 풍선
## 2 공, 로봇, 블럭, 비누방울, 선물, 연필, 인형, 장난감, 종이, 책, 총, 크레용/크레파스, 풀, 풍선
## 3                                                                          공, 인형, 종이, 책
## 4                                                              공, 블럭, 장난감, 종이, 총, 풀
## 5                                                            공, 블럭, 연필, 장난감, 책, 풍선
## 6 공, 로봇, 블럭, 비누방울, 선물, 연필, 인형, 장난감, 종이, 책, 총, 크레용/크레파스, 풀, 풍선
##                                                                                                                                                                                                                                                   동물
## 1                                   개, 개구리, 개미, 거북이, 고양이, 곰, 공룡, 기린, 나비, 다람쥐, 닭, 동물, 돼지, 말, 물고기, 뱀, 벌, 벌레, 병아리, 부엉이, 사자, 새, 소, 송아지, 악어, 양, 여우, 오리, 원숭이, 쥐, 참새, 코끼리, 토끼, 펭귄, 호랑이
## 2                 개, 개구리, 개미, 거북이, 거위, 고양이, 곰, 공룡, 기린, 나비, 다람쥐, 닭, 동물, 돼지, 말, 물고기, 뱀, 벌, 벌레, 병아리, 부엉이, 비둘기, 사슴, 사자, 새, 소, 악어, 양, 여우, 염소, 오리, 원숭이, 쥐, 코끼리, 토끼, 펭귄, 하마, 호랑이
## 3                                                                                                                                                                           개, 개구리, 고양이, 곰, 돼지, 물고기, 병아리, 비둘기, 사자, 새, 오리, 참새
## 4                                                                                                                                         개, 거북이, 고양이, 공룡, 기린, 나비, 돼지, 물고기, 뱀, 사자, 소, 악어, 양, 오리, 코끼리, 토끼, 펭귄, 호랑이
## 5                                                                                                                                                                       개, 개미, 고양이, 곰, 공룡, 나비, 돼지, 물고기, 벌레, 사자, 여우, 토끼, 호랑이
## 6 개, 개구리, 개미, 거북이, 고양이, 곰, 공룡, 기린, 나비, 다람쥐, 닭, 당나귀, 동물, 돼지, 말, 물고기, 뱀, 벌, 벌레, 병아리, 부엉이, 비둘기, 사슴, 사자, 새, 소, 송아지, 악어, 양, 여우, 염소, 오리, 원숭이, 쥐, 참새, 코끼리, 토끼, 펭귄, 하마, 호랑이
##                                                                                                                                      옷
## 1                                      가방, 기저귀, 단추, 모자, 목걸이, 바지, 신/신발, 양말, 옷/꼬까, 운동화, 잠바, 장갑, 주머니, 팬티
## 2 가방, 구두, 기저귀, 단추, 모자, 목걸이, 바지, 목도리, 신/신발, 양말, 옷/꼬까, 운동화, 잠바, 잠옷, 장갑, 주머니, 치마, 코트/외투, 팬티
## 3                                                                                                                                  바지
## 4                                                                                                      기저귀, 바지, 양말, 운동화, 팬티
## 5                                      가방, 기저귀, 단추, 모자, 목걸이, 바지, 신/신발, 양말, 옷/꼬까, 운동화, 잠바, 장갑, 주머니, 팬티
## 6            가방, 구두, 기저귀, 단추, 모자, 바지, 목도리, 신/신발, 양말, 옷/꼬까, 운동화, 잠바, 잠옷, 장갑, 주머니, 치마, 팬티, 허리띠
##                                                                                                                               가구및방안
## 1             계단, 냉장고, 목욕탕, 문, 방, 베개, 세탁기, 소파, 옷장, 유리, 의자, 이불, 전자레인지, 창문, 침대, 텔레비전, 피아노, 화장실
## 2                         계단, 냉장고, 목욕탕, 문, 방, 베개, 세탁기, 소파, 옷장, 유리, 의자, 이불, 창문, 침대, 텔레비전, 피아노, 화장실
## 3                                                                                                                                   <NA>
## 4                                                                                                                   문, 방, 침대, 화장실
## 5                                                           계단, 냉장고, 문, 방, 베개, 의자, 이불, 창문, 침대, 텔레비전, 피아노, 화장실
## 6 계단, 냉장고, 목욕탕, 문, 방, 베개, 부엌, 서랍, 세탁기, 소파, 옷장, 유리, 의자, 이불, 전자레인지, 창문, 침대, 텔레비전, 피아노, 화장실
##                                                                                                                                                                                                                                                                                                                                                                    음식
## 1                                                  감자, 계란/달걀, 고구마, 고기, 과일, 과자/까까, 국, 국수, 귤, 김, 김치, 당근, 도너츠, 딸기, 떡, 라면, 물, 바나나, 밤, 복숭아, 빵, 사과, 사탕, 생선, 수박, 스파게티, 쌀, 아이스크림, 얼음, 오렌지, 옥수수, 요구르트, 우유, 음식, 주스, 초콜렛, 치즈, 커피, 케이크, 콩, 토마토, 포도, 피자, 핫도그, 햄버거, 호떡, 호박
## 2 감, 감자, 계란/달걀, 고구마, 고기, 과일, 과자/까까, 국, 귤, 김, 김치, 껌, 당근, 도너츠, 딸기, 땅콩, 떡, 라면, 무/무우, 물, 바나나, 밤, 배추, 복숭아, 빵, 사과, 사이다, 사탕, 생선, 설탕, 소금, 수박, 스파게티, 쌀, 아이스크림, 얼음, 오렌지, 옥수수, 요구르트, 우유, 음식, 주스, 초콜렛, 치즈, 커피, 케이크, 콜라, 콩, 토마토, 포도, 피자, 핫도그, 햄버거, 호떡, 호박
## 3                                                                                                                                                                                                                                                                                              계란/달걀, 과자/까까, 물, 바나나, 빵, 사과, 사탕, 우유, 주스, 치즈, 피자
## 4                                                                                                                                                                                                                 감자, 고기, 과일, 과자/까까, 국, 귤, 김치, 딸기, 떡, 물, 바나나, 빵, 사과, 사탕, 수박, 아이스크림, 오렌지, 요구르트, 우유, 주스, 초콜렛, 토마토, 포도
## 5                                                                                                                                                                      계란/달걀, 고구마, 고기, 과일, 과자/까까, 국, 귤, 김, 김치, 딸기, 땅콩, 라면, 물, 바나나, 빵, 사과, 사탕, 생선, 수박, 아이스크림, 얼음, 오렌지, 옥수수, 요구르트, 우유, 주스, 초콜렛, 커피, 포도
## 6 감, 감자, 계란/달걀, 고구마, 고기, 과일, 과자/까까, 국, 국수, 귤, 김, 김치, 껌, 닭고기, 당근, 도너츠, 딸기, 땅콩, 떡, 라면, 메론, 무/무우, 물, 바나나, 밤, 배추, 복숭아, 빵, 사과, 사탕, 생선, 소금, 수박, 스파게티, 쌀, 아이스크림, 얼음, 오렌지, 옥수수, 요구르트, 우유, 음식, 주스, 초콜렛, 치즈, 커피, 케이크, 콜라, 콩, 토마토, 포도, 피자, 핫도그, 햄버거, 호박
##                                                                                                                                                                신체부위
## 1                               고추, 귀, 눈, 다리, 등, 머리, 머리카락, 목, 몸, 무릎, 발, 발목, 배, 배꼽, 손, 손가락, 어깨, 얼굴, 엉덩이, 이/이빨, 입, 입술, 코, 팔, 피
## 2                     고추, 귀, 눈, 다리, 똥꼬, 머리, 머리카락, 목, 몸, 무릎, 발, 발톱, 배, 배꼽, 뺨, 손, 손가락, 어깨, 얼굴, 엉덩이, 이/이빨, 입, 코, 턱, 팔, 허리, 혀
## 3                                                                                                                                                    귀, 눈, 손, 입, 코
## 4                                                                                          눈, 똥꼬, 머리, 머리카락, 발, 배, 배꼽, 손, 손가락, 엉덩이, 입, 입술, 코, 팔
## 5                                                                           고추, 귀, 눈, 다리, 등, 똥꼬, 머리, 목, 몸, 발, 배, 배꼽, 손, 얼굴, 엉덩이, 이/이빨, 입, 코
## 6 고추, 귀, 눈, 다리, 등, 똥꼬, 머리, 머리카락, 목, 몸, 무릎, 발, 발목, 발톱, 배, 배꼽, 뺨, 손, 손가락, 어깨, 얼굴, 엉덩이, 이/이빨, 입, 입술, 코, 턱, 팔, 피, 허리, 혀
##                                                                                                                                                                                                                가정용품
## 1               가위, 그릇, 그림, 돈, 망치, 비누, 빗, 빗자루, 상자, 수건, 숟가락, 시계, 쓰레기, 쓰레기통/휴지통, 안경, 약, 열쇠, 옷걸이, 우산, 전화, 접시, 젓가락, 지갑, 청소기, 치약, 칫솔, 카메라, 칼, 컵, 포크, 휴지
## 2                             가위, 그릇, 그림, 돈, 라디오, 비누, 빗, 상자, 수건, 숟가락, 시계, 쓰레기, 쓰레기통/휴지통, 안경, 약, 열쇠, 옷걸이, 우산, 전화, 접시, 지갑, 청소기, 치약, 칫솔, 카메라, 칼, 컵, 포크, 휴지
## 3                                                                                                                                                                                                비누, 숟가락, 안경, 약
## 4                                                                                                                                     그림, 비누, 수건, 숟가락, 쓰레기통/휴지통, 약, 우산, 전화, 청소기, 컵, 포크, 휴지
## 5                                                     가위, 그릇, 그림, 돈, 비누, 빗, 수건, 숟가락, 시계, 쓰레기, 쓰레기통/휴지통, 안경, 약, 열쇠, 우산, 전화, 젓가락, 지갑, 청소기, 치약, 칫솔, 카메라, 컵, 포크, 휴지
## 6 가위, 그릇, 그림, 돈, 망치, 못, 병, 비누, 빗, 빗자루, 상자, 수건, 숟가락, 시계, 쓰레기, 쓰레기통/휴지통, 안경, 약, 열쇠, 옷걸이, 우산, 쟁반, 전화, 접시, 젓가락, 지갑, 청소기, 치약, 칫솔, 카메라, 칼, 컵, 포크, 휴지
##                                                                                                                                          외부사물
## 1                           구름, 그네, 길, 꽃, 나무, 눈, 눈사람, 달, 돌, 땅, 모래, 미끄럼틀, 바람, 별, 불, 비, 시소, 지붕, 풀, 하늘, 해/햇빛, 흙
## 2                                                     구름, 그네, 꽃, 나무, 눈, 눈사람, 달, 돌, 미끄럼틀, 별, 불, 비, 사다리, 시소, 하늘, 해/햇빛
## 3                                                                                                                                              달
## 4                                                                              꽃, 나무, 눈, 눈사람, 달, 돌, 미끄럼틀, 바람, 별, 비, 풀, 하늘, 흙
## 5                                                             그네, 길, 꽃, 나무, 눈, 눈사람, 달, 돌, 땅, 미끄럼틀, 별, 불, 비, 하늘, 해/햇빛, 흙
## 6 구름, 그네, 길, 깃발, 꽃, 나무, 눈, 눈사람, 달, 돌, 땅, 모래, 미끄럼틀, 바람, 바위, 별, 불, 비, 사다리, 시소, 잔디, 지붕, 풀, 하늘, 해/햇빛, 흙
##                                                                                           일상생활
## 1 고마워, 네/응, 돼, 만세, 목욕, 빠이빠이, 쉬, 아니(야), 안녕, 안돼, 양치, 응가/똥, 화이팅, 하지마
## 2 고마워, 네/응, 돼, 만세, 목욕, 빠이빠이, 쉬, 아니(야), 안녕, 안돼, 양치, 응가/똥, 화이팅, 하지마
## 3                                                       빠이빠이, 쉬, 아니(야), 안녕, 안돼, 화이팅
## 4       고마워, 네/응, 돼, 목욕, 빠이빠이, 쉬, 아니(야), 안녕, 안돼, 양치, 응가/똥, 화이팅, 하지마
## 5       고마워, 네/응, 돼, 만세, 빠이빠이, 쉬, 아니(야), 안녕, 안돼, 양치, 응가/똥, 화이팅, 하지마
## 6 고마워, 네/응, 돼, 만세, 목욕, 빠이빠이, 쉬, 아니(야), 안녕, 안돼, 양치, 응가/똥, 화이팅, 하지마
##                                                                                                                                 장소
## 1             가게, 공원, 교회, 놀이터, 동물원, 마당, 바깥, 바다, 병원, 산, 수영장, 숲, 시장, 아파트, 유치원, 주유소, 집, 학교, 회사
## 2                                                                   가게, 공원, 놀이터, 바다, 병원, 슈퍼마켓, 유치원, 집, 학교, 회사
## 3                                                                                                                               <NA>
## 4                                                                           공원, 놀이터, 동물원, 바다, 아파트, 유치원, 일, 집, 회사
## 5                                                                   교회, 놀이터, 바다, 병원, 산, 수영장, 슈퍼마켓, 유치원, 집, 회사
## 6 가게, 공원, 놀이터, 동물원, 바깥, 바다, 병원, 산, 수영장, 숲, 슈퍼마켓, 시장, 아파트, 유치원, 은행, 일, 절, 주유소, 집, 학교, 회사
##                                                                       양정도
## 1       너무, 다, 다시, 더, 또, 많이, 빨리, 자꾸, 잘, 전부, 조금, 진짜, 하나
## 2                             너무, 다, 다시, 더, 또, 많이, 자꾸, 조금, 하나
## 3                                                                       진짜
## 4                                                               다, 또, 많이
## 5                   너무, 다, 다시, 더, 또, 많이, 빨리, 잘, 조금, 진짜, 하나
## 6 너무, 다, 다시, 더, 또, 많이, 빨리, 아주, 자꾸, 잘, 전부, 조금, 진짜, 하나
##                                                                                                                                                                                                                 사람
## 1                         간호사, 경찰(관), 공주, 군인, 귀신, 남자, 동생, 사람, 삼촌, 선생님, 소방수, 아기/아가, 아들, 아빠, 아저씨, 언니, 엄마, 여자, 오빠, 왕자, 의사, 이모, 자기 이름, 친구, 할머니, 할아버지, 형
## 2                             경찰(관), 고모, 공주, 귀신, 남자, 도둑, 동생, 딸, 사람, 삼촌, 선생님, 아기/아가, 아빠, 아저씨, 아줌마, 언니, 엄마, 여자, 오빠, 왕자, 의사, 이모, 자기 이름, 친구, 할머니, 할아버지, 형
## 3                                                                                                                                       고모, 삼촌, 선생님, 아기/아가, 아빠, 엄마, 이모, 자기 이름, 할머니, 할아버지
## 4                                                                                                              경찰(관), 군인, 동생, 삼촌, 아기/아가, 아빠, 아저씨, 아줌마, 언니, 엄마, 의사, 이모, 할머니, 할아버지
## 5                                                                                       경찰(관), 고모, 공주, 귀신, 도둑, 딸, 삼촌, 선생님, 아기/아가, 아들, 아빠, 언니, 엄마, 이모, 자기 이름, 할머니, 할아버지, 형
## 6 간호사, 경찰(관), 공주, 군인, 귀신, 남자, 도둑, 동생, 딸, 사람, 삼촌, 선생님, 아기/아가, 아들, 아빠, 아저씨, 아줌마, 어른, 언니, 엄마, 여자, 오빠, 왕자, 우체부, 의사, 이모, 자기 이름, 친구, 할머니, 할아버지, 형
##                                                                의문사
## 1 누구, 몇, 무슨, 무엇/뭐, 어느, 어디, 어디서, 어떤, 어떻게, 언제, 왜
## 2                           누구, 몇, 무슨, 무엇/뭐, 어디, 어떻게, 왜
## 3                                                         무엇/뭐, 왜
## 4                                                      누구, 어디, 왜
## 5                               누구, 무엇/뭐, 어디, 어떻게, 언제, 왜
## 6 누구, 몇, 무슨, 무엇/뭐, 어느, 어디, 어디서, 어떤, 어떻게, 언제, 왜
##                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                       동사
## 1                                                                                                       가, 가리켜, 가져, 간지럽혀, 건너, 걸어, 고쳐, 그려, 기다려, 깎아, (컵을)깨, (불)꺼, 꺼내, 꽂아, 끊어져, 끌어, 끼워, 나가, 나와, (물건을)날라, 날라가, (차에서)내려, 내려가, 넘어져, (통에)넣어, 노래 불러, 놀아, (물건을)놓아, 누워, (무엇을)눌러, (무엇에)눌려, 다녀, 다쳐, 닦아, 닫아, 달려, 당겨, 던져, 덮어, 도와, 돌려, 돌아, 두드려, (여기에)둬, (물건을)들어, (소리를)들어, 들어가, 때려, (물에)떠, 떨어뜨려, 떨어져, 떼(어), 뛰어, 마셔, 만들어, (빨래/싸움)말려, 말해, 맛봐, (주사를)맞아, (음식을)먹어, (음식을)먹여, 멈춰, 몰라, 물어, 밀어, (약)발라, 박수쳐, 버려, 벗어, 보여, 봐, 부딪쳐, 부숴, (물을)부어, 불러, (풍선을)불어, 붙여, 빗어, 빠져, 빨아, 빼, 빼앗아, 뽀뽀해, 뽑아, (물건을)사, 사랑해, (그 자리에)서, 수영해, 숨어, 시작해, 신어, (물건을)실어, 싸워, (모자)써, 쏟아, 씻어, 안아, 안해, 앉아, 알아, 열어, 올라가, 올려, 와, 요리해, 운전해, 울어, 웃어, (승부에)이겨, 일어나/일어서, 일해, 읽어, 입어, (잠)자, 잘라, 잡아, 죽어, 줘, 쫓아, 찍어, (공을)차, 찾아, 춤춰, 치워, 칠해, (차에)타, (차에)태워, 튀겨, 틀어, (코를)풀어, (꽃이)피어, 해, 혼나
## 2                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                           가, 간지럽혀, 걸어, 공부해, 기다려, (불)꺼, 나가, (차에서)내려, 넘어져, (통에)넣어, 노래 불러, 놀아, (무엇을)눌러, 다쳐, 닦아, 달려, 당겨, 던져, 도와, 들어가, 때려, 떼(어), 뛰어, 마셔, 만들어, 말해, (주사를)맞아, (음식을)먹어, 멈춰, 미워해, 밀어, (약)발라, 박수쳐, 버려, 벗어, 봐, 빗어, 빠져, 빨아, 빼, 뽀뽀해, (물건을)사, 사랑해, 생각해, 수영해, 숨어, 신어, 싸워, (모자)써, 씻어, 안아, 앉아, 열어, 올라가, 와, 요리해, 운전해, 울어, 웃어, 일어나/일어서, 읽어, 입어, (잠)자, 좋아해, 줘, (공을)차, 찾아, 춤춰, (차에)타, 해, 혼나
## 3                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                (불)꺼, (차에서)내려, 사랑해, 안해, 일어나/일어서, (잠)자
## 4                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                          가, 그려, 끼워, 나와, (차에서)내려, (여기에)둬, (물건을)들어, (물에)떠, 마셔, (음식을)먹어, 박수쳐, 봐, 사랑해, (모자)써, 쓰러져, 씻어, 안아, 와, 일어나/일어서, (공을)차, (차에)타, (차에)태워
## 5                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                  가, 가리켜, 가져, 건너, 걸어, 그려, 기다려, (불)꺼, 나가, 나와, (차에서)내려, (통에)넣어, 놀아, (물건을)놓아, 누워, (무엇을)눌러, 다쳐, 닦아, 닫아, 달려, 던져, 두드려, (여기에)둬, (물건을)들어, 때려, 떨어져, 떼(어), 뛰어, 맛봐, (주사를)맞아, (음식을)먹어, 멈춰, 몰라, 미워해, 밀어, (약)발라, 박수쳐, 버려, 벗어, 봐, 부딪쳐, (물을)부어, 빗어, 빨아, (물건을)사, 사랑해, 숨어, (모자)써, 안아, 안해, 앉아, 일어나/일어서, (잠)자, (공을)차, 치워, (차에)타, (코를)풀어, 해, 혼나
## 6 가, 가리켜, 가져, 간지럽혀, 건너, 걸어, 고쳐, 공부해, 그려, 기다려, 깎아, (컵을)깨, (불)꺼, 꺼내, 꽂아, 끊어져, 끌어, 끝내, 끼워, 나가, 나눠가져, 나와, 날라가, (차에서)내려, 내려가, 넘어져, (통에)넣어, 노래 불러, 놀아, (물건을)놓아, 누워, (무엇을)눌러, (무엇에)눌려, 다녀, 다쳐, 닦아, 닫아, 달려, 당겨, 던져, 덮어, 도와, 돌려, 돌아, 두드려, (여기에)둬, (물건을)들어, (소리를)들어, 들어가, 때려, (물에)떠, 떨어뜨려, 떨어져, 떼(어), 뛰어, 마셔, 만들어, (빨래/싸움)말려, 말해, 맛봐, (주사를)맞아, (음식을)먹어, (음식을)먹여, 멈춰, 몰라, 물어, 미워해, 밀어, (약)발라, 박수쳐, 버려, 벗어, 보여, 봐, 부딪쳐, 부숴, (물을)부어, 불러, (풍선을)불어, 붙여, 바켜, 빗어, 빠져, 빨아, 빼, 빼앗아, 뽀뽀해, 뽑아, (물건을)사, 사랑해, 살아, 생각해, (그 자리에)서, 서둘러, 손대, 수영해, 숨어, 시작해, 신어, (물건을)실어, 싸워, (글)써, (모자)써, 쏟아, (총을)쏴, 쓰러져, 씻어, 안아, 안해, 앉아, 알아, 열어, 올라가, 올려, 와, 요리해, 운전해, 울어, 웃어, 원해, (승부에)이겨, 이야기해, 일어나/일어서, 일해, 읽어, 입어, (잠)자, 잘라, 잡아, 좋아해, 죽어, 줘, 쫓아, 찍어, (공을)차, 찾아, 춤춰, 치워, 칠해, (차에)타, (차에)태워, 터져, 틀어, (코를)풀어, (꽃이)피어, 해, 혼나
##                                                                                                                                                                                                                                                                                                                                                                                                                      형용사
## 1                                                               가벼워, 간지러워, 같아/똑같아, 괜찮아, 귀여워, 길어, (색이)까매, 깜깜해, (색이)노래, 높아, 달라, 더러워, 더워, 동그래, 뜨거워, 많아, 맛없어, 맛있어, 매워, 멀어, 멋있어, 목말라, 무거워, 무서워, 배고파, (색이)빨개, 빨라, 싫어, 심심해, 아파, 어두워, 없어, 예뻐, 있어, 작아, 재미있어, 조용해, 졸려, 좋아, 착해, 추워, 커, (색이)파래, (색이)하얘, 힘들어
## 2                                                                                                                                   가벼워, 간지러워, 같아/똑같아, 괜찮아, 귀여워, 길어, 깜깜해, 높아, 더러워, 더워, 뜨거워, 많아, 맛없어, 맛있어, 매워, 멋있어, 목말라, 무거워, 무서워, 배고파, 시끄러워, 심심해, 아파, 없어, 예뻐, 이상해, 있어, 작아, 재미있어, 졸려, 좋아, (맛이)짜, (촉감이)차, 착해, 추워, 커, 힘들어
## 3                                                                                                                                                                                                                                                                                                                                                                                                    미워, 아파, 좋아, 추워
## 4                                                                                                                                                                                                                                                                                                                                                  귀여워, 나빠, 더러워, 더워, 맛있어, 매워, 무서워, 미워, 싫어, 아파, 추워
## 5                                                                                                                                                                                                                                                     같아/똑같아, 괜찮아, 깜깜해, 나빠, 달라, 더러워, 더워, 뜨거워, 많아, 맛있어, 매워, 멀어, 무거워, 무서워, 미워, 배고파, 아파, 어두워, 이상해, 졸려, 좋아, 추워, 힘들어
## 6 가벼워, 간지러워, 같아/똑같아, 괜찮아, 귀여워, 길어, (색이)까매, 깜깜해, 나빠, (색이)노래, 높아, 달라, 더러워, 더워, 동그래, 뜨거워, 많아, 맛없어, 맛있어, 매워, 멀어, 멋있어, 목말라, 무거워, 무서워, 미워, 배고파, (색이)빨개, 빨라, 시끄러워, 싫어, 심심해, 아파, 어두워, 없어, 예뻐, 이상해, 있어, 작아, 재미있어, 조그맣다, 조용해, 졸려, 좋아, (맛이)짜, (촉감이)차, 착해, 추워, 커, (색이)파래, (색이)하얘, 힘들어
##                                                                                                               끝맺는말
## 1                           ―구나, ―께, ―네, ―는다, ―니?, ―다, ―대, ―ㄹ까?, ―ㄹ래, ―어(아), ―요, ―자, ―지
## 2                                                                            ―께, ―네, ―ㄹ까?, ―어(아), ―요, ―자
## 3                                                                                                             ―어(아)
## 4                                                                                                 ―네, ―다, ―어(아)
## 5                                                                ―는다, ―니?, ―다, ―ㄹ까?, ―ㄹ래, ―어야 돼, ―요
## 6 ―구나, ―께, ―네, ―는다, ―니?, ―다, ―대, ―ㄹ거야/테야, ―ㄹ까?, ―ㄹ래, ―어(아), ―어야 돼, ―요, ―자, ―지
##                                                                                            조사
## 1                 ―가(이), ―는(은), ―도, ―랑, ―만, ―야, ―에, ―에서, ―하고, ―한테/에게
## 2                                           ―가(이), ―는(은), ―랑, ―에, ―에서, ―한테/에게
## 3                                                                                          <NA>
## 4                                                                          ―가(이), ―도, ―야
## 5                                        ―가(이), ―는(은), ―도, ―를(을), ―야, ―에, ―하고
## 6 ―가(이), ―는(은), ―도, ―랑, ―로, ―를(을), ―만, ―야, ―에, ―에서, ―하고, ―한테/에게
##                                   연결하는말                             위치
## 1                         ―고, ―는데, ―서                             <NA>
## 2                 그런데, ―고, ―는데, ―서                   뒤, 앞, 옆, 위
## 3                                       <NA>                             <NA>
## 4                                       <NA>                               밖
## 5                                       <NA>             밖, 아래, 안, 옆, 위
## 6 그리고, 그런데, 그래서, ―고, ―는데, ―서 뒤, 밑, 밖, 아래, 안, 앞, 옆, 위
##                                                                                    시간
## 1                       금방, 나중에, 내일, 매일/맨날, 밤, 시간, 아침, 저녁, 점심, 지금
## 2                                                     내일, 밤, 아침, 어저께/어제, 지금
## 3                                                                                  <NA>
## 4                                                                            내일, 지금
## 5                                                            나중에, 내일, 이따가, 지금
## 6 금방, 나중에, 날, 낮, 내일, 밤, 시간, 아침, 어저께/어제, 오늘, 이따가, 저녁, 전, 지금
  • pn_clear과 cdi_score데이터 합쳐서 하나의 큰 df생성; final_df
final_df <- left_join(pn_clear,cdi_score,key='subject')
## Joining, by = "subject"
head(final_df)
## # A tibble: 6 × 27
##   subject   merged pn_value pn_num pn_Cal 소리  탈것  장난감및문구류 동물  옷   
##   <chr>     <chr>  <chr>     <dbl>  <dbl> <chr> <chr> <chr>          <chr> <chr>
## 1 godtheeb… 고마…  고마워,…     28   -7.5 꽥꽥… 기차… 공, 로봇, 블…  개, … 가방…
## 2 munhee19… 고마…  고마워,…     28   -7   꽥꽥… 기차… 공, 로봇, 블…  개, … 가방…
## 3 dbsdmsgh… 빠이…  사랑해,…      4   -2   꿀꿀… 기차… 공, 인형, 종…  개, … 바지 
## 4 chasu731… 고마…  고마워,…     11   -4   꽥꽥… 배, … 공, 블럭, 장…  개, … 기저…
## 5 sepumsn@… 고마…  고마워,…     18  -13.5 꿀꿀… 기차… 공, 블럭, 연…  개, … 가방…
## 6 zzirizzi… 고마…  고마워,…     32  -11.5 꽥꽥… 기차… 공, 로봇, 블…  개, … 가방…
## # … with 17 more variables: 가구및방안 <chr>, 음식 <chr>, 신체부위 <chr>,
## #   가정용품 <chr>, 외부사물 <chr>, 일상생활 <chr>, 장소 <chr>, 양정도 <chr>,
## #   사람 <chr>, 의문사 <chr>, 동사 <chr>, 형용사 <chr>, 끝맺는말 <chr>,
## #   조사 <chr>, 연결하는말 <chr>, 위치 <chr>, 시간 <chr>
#열 이름 변경
names(final_df)#열이름 확인
##  [1] "subject"        "merged"         "pn_value"       "pn_num"        
##  [5] "pn_Cal"         "소리"           "탈것"           "장난감및문구류"
##  [9] "동물"           "옷"             "가구및방안"     "음식"          
## [13] "신체부위"       "가정용품"       "외부사물"       "일상생활"      
## [17] "장소"           "양정도"         "사람"           "의문사"        
## [21] "동사"           "형용사"         "끝맺는말"       "조사"          
## [25] "연결하는말"     "위치"           "시간"
names(final_df) <- gsub("[0-9]", "", names(final_df))
names(final_df) <- gsub("[[:punct:]]","",names(final_df))
names(final_df) <- gsub(" ", "",names(final_df));names(final_df) 
##  [1] "subject"        "merged"         "pnvalue"        "pnnum"         
##  [5] "pnCal"          "소리"           "탈것"           "장난감및문구류"
##  [9] "동물"           "옷"             "가구및방안"     "음식"          
## [13] "신체부위"       "가정용품"       "외부사물"       "일상생활"      
## [17] "장소"           "양정도"         "사람"           "의문사"        
## [21] "동사"           "형용사"         "끝맺는말"       "조사"          
## [25] "연결하는말"     "위치"           "시간"
class(final_df$merged) #character
## [1] "character"
class(final_df$탈것) #character
## [1] "character"
  • cdi접수를 구하기 위해서는 표현하는 단어의 개수를 세고, precentile을 구해야 한다.–> fail
# wordbank
# install.packages("wordbankr")
# devtools::install_github("langcog/wordbankr")
  • solution: 엑셀로 내보내서 작업 후 다시 파일 import
    • 엑셀로 추출해서 실제 시트의 2, 3, 4번째 시트에 정리된 표현단어 개수와 백분위 입력
    • 정리하던 중, 중복된 응답은 삭제
# file export
write.xlsx(final_df, sheetName="cdi_coding", file="cdi_coding.xlsx")

# file import
# cdi 점수 입력 완료
final_cdi <- read_excel("C:\\Users\\csjja\\Desktop\\complete_cdi_coding.xlsx",
                       sheet = "cdi_coding",
                       range = "A1:G114",
                       col_names = TRUE, # TRUE to use the first row as column names
                       na = "NA");head(final_cdi) # Character vector of strings to use for missing values
## # A tibble: 6 × 7
##   subject               merged     pnvalue pnnum pnCal 표현점수 `표현낱말 백분…`
##   <chr>                 <chr>      <chr>   <dbl> <dbl>    <dbl> <chr>           
## 1 godtheeb@hanmail.net  고마워, …  고마워…    28  -7.5      541 25~50           
## 2 munhee1981@naver.com  고마워, …  고마워…    28  -7        446 10~25           
## 3 dbsdmsghk14@naver.com 빠이빠이,… 사랑해…     4  -2         79 10~25           
## 4 chasu7315@naver.com   고마워, …  고마워…    11  -4        201 25~50           
## 5 sepumsn@naver.com     고마워, …  고마워…    18 -13.5      312 75~90           
## 6 zzirizzi@hanmail.net  고마워, …  고마워…    32 -11.5      623 75~90
  • 백분위는 구간으로 총 6개 나옴 -> factor로 변경
final_cdi$'표현낱말 백분위수' <- as.factor(final_cdi$'표현낱말 백분위수')  #백분위를 facotor로 변경
levels(final_cdi$`표현낱말 백분위수`) #level 확인;6개 구간
## [1] "10 미만" "10~25"   "25~50"   "50~75"   "75~90"   "90 이상"

Statistical model

  • dependent var.: pn점수 값
  • fixed effect: 표현낱말 백분위 수
    • 50~75, 75~90, 90이상의 구간에서 pn점수값이 낮은 것이 유의미하다(pn값이 -이면 부정)
    • (의문)단어를 더 많이 알 수록 부정적인 점수가 높다는 것은. 아기가 긍정적인 것을 먼저 습득한다는 것?
    • 그렇다면 아이가 어릴수록 긍정적인 용어를 많이 사용하면 기본적인 vocab size를 넓힐 수 있을까?
summary(lm(final_cdi$pnCal ~ final_cdi$`표현낱말 백분위수`, data=final_cdi)) #백분위 변화에 따른 pn점수값 변화
## 
## Call:
## lm(formula = final_cdi$pnCal ~ final_cdi$`표현낱말 백분위수`, 
##     data = final_cdi)
## 
## Residuals:
##    Min     1Q Median     3Q    Max 
## -9.804 -2.701  0.125  2.184 15.375 
## 
## Coefficients:
##                                      Estimate Std. Error t value Pr(>|t|)    
## (Intercept)                           -1.3571     1.1613  -1.169  0.24526    
## final_cdi$`표현낱말 백분위수`10~25     0.2321     1.4612   0.159  0.87409    
## final_cdi$`표현낱말 백분위수`25~50    -0.8271     1.5304  -0.540  0.59009    
## final_cdi$`표현낱말 백분위수`50~75    -3.3393     1.4223  -2.348  0.02081 *  
## final_cdi$`표현낱말 백분위수`75~90    -6.6095     1.6147  -4.093 8.52e-05 ***
## final_cdi$`표현낱말 백분위수`90 이상  -7.5179     1.9257  -3.904  0.00017 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 4.345 on 102 degrees of freedom
##   (결측으로 인하여 5개의 관측치가 삭제되었습니다.)
## Multiple R-squared:  0.2919, Adjusted R-squared:  0.2572 
## F-statistic: 8.409 on 5 and 102 DF,  p-value: 1.087e-06
summary(lm(final_cdi$pnCal ~ final_cdi$`표현점수`, data=final_cdi)) 
## 
## Call:
## lm(formula = final_cdi$pnCal ~ final_cdi$표현점수, data = final_cdi)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -8.5493 -1.7490 -0.5383  1.8296 12.6494 
## 
## Coefficients:
##                     Estimate Std. Error t value Pr(>|t|)    
## (Intercept)         1.081079   0.594167   1.819   0.0717 .  
## final_cdi$표현점수 -0.019333   0.001912 -10.114   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 3.613 on 106 degrees of freedom
##   (결측으로 인하여 5개의 관측치가 삭제되었습니다.)
## Multiple R-squared:  0.4911, Adjusted R-squared:  0.4863 
## F-statistic: 102.3 on 1 and 106 DF,  p-value: < 2.2e-16
# 현재가설에 맞게 재구성.
# 왜 부정적인 감정표현이 점수 높을까?(문헌정보)
# 표현 점수를-> percentile
# 이해하고 표현하는 아동들 모두 모아서.
summary(lm(final_cdi$`표현점수` ~ final_cdi$pnCal, data=final_cdi))
## 
## Call:
## lm(formula = final_cdi$표현점수 ~ final_cdi$pnCal, data = final_cdi)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -245.14 -105.44  -34.23  106.54  383.38 
## 
## Coefficients:
##                 Estimate Std. Error t value Pr(>|t|)    
## (Intercept)      155.733     15.797   9.858   <2e-16 ***
## final_cdi$pnCal  -25.401      2.512 -10.114   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 131 on 106 degrees of freedom
##   (결측으로 인하여 5개의 관측치가 삭제되었습니다.)
## Multiple R-squared:  0.4911, Adjusted R-squared:  0.4863 
## F-statistic: 102.3 on 1 and 106 DF,  p-value: < 2.2e-16
summary(lm(final_cdi$`표현점수`~ final_cdi$`표현낱말 백분위수`, data=final_cdi)) 
## 
## Call:
## lm(formula = final_cdi$표현점수 ~ final_cdi$`표현낱말 백분위수`, 
##     data = final_cdi)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -320.07  -65.04  -10.39   64.07  348.53 
## 
## Coefficients:
##                                      Estimate Std. Error t value Pr(>|t|)    
## (Intercept)                             55.93      28.48   1.964 0.052306 .  
## final_cdi$`표현낱말 백분위수`10~25      64.36      35.84   1.796 0.075488 .  
## final_cdi$`표현낱말 백분위수`25~50     136.55      37.54   3.637 0.000434 ***
## final_cdi$`표현낱말 백분위수`50~75     252.93      34.89   7.250 8.25e-11 ***
## final_cdi$`표현낱말 백분위수`75~90     417.14      39.60  10.533  < 2e-16 ***
## final_cdi$`표현낱말 백분위수`90 이상   462.82      47.23   9.798 2.28e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 106.6 on 102 degrees of freedom
##   (결측으로 인하여 5개의 관측치가 삭제되었습니다.)
## Multiple R-squared:  0.6758, Adjusted R-squared:  0.6599 
## F-statistic: 42.52 on 5 and 102 DF,  p-value: < 2.2e-16
summary(lmer(final_cdi$pnCal ~ final_cdi$`표현낱말 백분위수` + (1|subject), data=final_cdi)) 
## Linear mixed model fit by REML. t-tests use Satterthwaite's method [
## lmerModLmerTest]
## Formula: final_cdi$pnCal ~ final_cdi$`표현낱말 백분위수` + (1 |  
##     subject)
##    Data: final_cdi
## 
## REML criterion at convergence: 602.8
## 
## Scaled residuals: 
##      Min       1Q   Median       3Q      Max 
## -1.05563 -0.28526 -0.00433  0.25383  1.66796 
## 
## Random effects:
##  Groups   Name        Variance Std.Dev.
##  subject  (Intercept) 14.695   3.833   
##  Residual              4.203   2.050   
## Number of obs: 108, groups:  subject, 104
## 
## Fixed effects:
##                                      Estimate Std. Error       df t value
## (Intercept)                           -1.3571     1.1618  99.2436  -1.168
## final_cdi$`표현낱말 백분위수`10~25     0.2710     1.4566 101.9467   0.186
## final_cdi$`표현낱말 백분위수`25~50    -0.9768     1.4892  97.1773  -0.656
## final_cdi$`표현낱말 백분위수`50~75    -3.4122     1.4023 101.8392  -2.433
## final_cdi$`표현낱말 백분위수`75~90    -6.3209     1.5817  99.9357  -3.996
## final_cdi$`표현낱말 백분위수`90 이상  -7.5179     1.9267  99.2436  -3.902
##                                      Pr(>|t|)    
## (Intercept)                          0.245556    
## final_cdi$`표현낱말 백분위수`10~25   0.852789    
## final_cdi$`표현낱말 백분위수`25~50   0.513408    
## final_cdi$`표현낱말 백분위수`50~75   0.016704 *  
## final_cdi$`표현낱말 백분위수`75~90   0.000123 ***
## final_cdi$`표현낱말 백분위수`90 이상 0.000174 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## Warning in abbreviate(rn, minlength = 11): 아스키 문자가 아닌 것을 사용한 약어입
## 니다

## Warning in abbreviate(rn, minlength = 11): 아스키 문자가 아닌 것을 사용한 약어입
## 니다

## Warning in abbreviate(rn, minlength = 11): 아스키 문자가 아닌 것을 사용한 약어입
## 니다

## Warning in abbreviate(rn, minlength = 11): 아스키 문자가 아닌 것을 사용한 약어입
## 니다
## 
## Correlation of Fixed Effects:
## Warning in abbreviate(rn, minlength = 6): 아스키 문자가 아닌 것을 사용한 약어입
## 니다
## Warning in abbreviate(rn, minlength = 6): 아스키 문자가 아닌 것을 사용한 약어입
## 니다

## Warning in abbreviate(rn, minlength = 6): 아스키 문자가 아닌 것을 사용한 약어입
## 니다

## Warning in abbreviate(rn, minlength = 6): 아스키 문자가 아닌 것을 사용한 약어입
## 니다

## Warning in abbreviate(rn, minlength = 6): 아스키 문자가 아닌 것을 사용한 약어입
## 니다

## Warning in abbreviate(rn, minlength = 6): 아스키 문자가 아닌 것을 사용한 약어입
## 니다

## Warning in abbreviate(rn, minlength = 6): 아스키 문자가 아닌 것을 사용한 약어입
## 니다

## Warning in abbreviate(rn, minlength = 6): 아스키 문자가 아닌 것을 사용한 약어입
## 니다

## Warning in abbreviate(rn, minlength = 6): 아스키 문자가 아닌 것을 사용한 약어입
## 니다
##                        (Intr) f_$`표현낱말백분위수`1 f_$`표현낱말백분위수`2
## f_$`표현낱말백분위수`1 -0.798                                              
## f_$`표현낱말백분위수`2 -0.780  0.654                                       
## f_$`표현낱말백분위수`5 -0.829  0.663                  0.673                
## f_$`표현낱말백분위수`7 -0.735  0.586                  0.576                
## f_$`표현낱말백분이     -0.603  0.481                  0.470                
##                        f_$`표현낱말백분위수`5 f_$`표현낱말백분위수`7
## f_$`표현낱말백분위수`1                                              
## f_$`표현낱말백분위수`2                                              
## f_$`표현낱말백분위수`5                                              
## f_$`표현낱말백분위수`7  0.642                                       
## f_$`표현낱말백분이      0.500                  0.443
  • dependent var.: pn단어 개수
  • fixed effect: 표현낱말 백분위 수
    • 10~25구간을 제외하고는 백분위 10미만 보다는 긍/부정의 단어 개수가 증가하는 것이 유의미하다
    • 백분의수가 크다는 것은 그 만큼 vocab size가 크다는 것이기 때문에, 그 만큼 긍부정의 단어가 많은 것이 자연스러운 현상으로 보인다.
summary(lm(final_cdi$pnnum ~ final_cdi$`표현낱말 백분위수`, data=final_cdi))  #백분위 변화에 따른 pn단어 개수의 변화
## 
## Call:
## lm(formula = final_cdi$pnnum ~ final_cdi$`표현낱말 백분위수`, 
##     data = final_cdi)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -16.6667  -4.8637  -0.5417   4.3393  21.4583 
## 
## Coefficients:
##                                      Estimate Std. Error t value Pr(>|t|)    
## (Intercept)                             2.571      1.991   1.292   0.1994    
## final_cdi$`표현낱말 백분위수`10~25      3.970      2.505   1.585   0.1161    
## final_cdi$`표현낱말 백분위수`25~50      6.955      2.623   2.651   0.0093 ** 
## final_cdi$`표현낱말 백분위수`50~75     15.071      2.438   6.182 1.32e-08 ***
## final_cdi$`표현낱말 백분위수`75~90     23.095      2.768   8.344 3.65e-13 ***
## final_cdi$`표현낱말 백분위수`90 이상   26.554      3.301   8.044 1.64e-12 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 7.448 on 102 degrees of freedom
##   (결측으로 인하여 5개의 관측치가 삭제되었습니다.)
## Multiple R-squared:  0.579,  Adjusted R-squared:  0.5583 
## F-statistic: 28.05 on 5 and 102 DF,  p-value: < 2.2e-16
summary(lmer(final_cdi$pnnum ~ final_cdi$`표현낱말 백분위수` + (1|subject), data=final_cdi)) 
## Linear mixed model fit by REML. t-tests use Satterthwaite's method [
## lmerModLmerTest]
## Formula: final_cdi$pnnum ~ final_cdi$`표현낱말 백분위수` + (1 |  
##     subject)
##    Data: final_cdi
## 
## REML criterion at convergence: 715.4
## 
## Scaled residuals: 
##      Min       1Q   Median       3Q      Max 
## -1.64206 -0.46671  0.00022  0.35254  2.06095 
## 
## Random effects:
##  Groups   Name        Variance Std.Dev.
##  subject  (Intercept) 26.97    5.193   
##  Residual             28.74    5.361   
## Number of obs: 108, groups:  subject, 104
## 
## Fixed effects:
##                                      Estimate Std. Error      df t value
## (Intercept)                             2.571      1.995  99.860   1.289
## final_cdi$`표현낱말 백분위수`10~25      4.012      2.517 100.657   1.594
## final_cdi$`표현낱말 백분위수`25~50      7.278      2.612 101.564   2.786
## final_cdi$`표현낱말 백분위수`50~75     14.840      2.435 101.872   6.095
## final_cdi$`표현낱말 백분위수`75~90     23.492      2.761 101.989   8.509
## final_cdi$`표현낱말 백분위수`90 이상   26.554      3.308  99.860   8.027
##                                      Pr(>|t|)    
## (Intercept)                           0.20033    
## final_cdi$`표현낱말 백분위수`10~25    0.11408    
## final_cdi$`표현낱말 백분위수`25~50    0.00636 ** 
## final_cdi$`표현낱말 백분위수`50~75   1.97e-08 ***
## final_cdi$`표현낱말 백분위수`75~90   1.59e-13 ***
## final_cdi$`표현낱말 백분위수`90 이상 2.00e-12 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## Warning in abbreviate(rn, minlength = 11): 아스키 문자가 아닌 것을 사용한 약어입
## 니다

## Warning in abbreviate(rn, minlength = 11): 아스키 문자가 아닌 것을 사용한 약어입
## 니다

## Warning in abbreviate(rn, minlength = 11): 아스키 문자가 아닌 것을 사용한 약어입
## 니다

## Warning in abbreviate(rn, minlength = 11): 아스키 문자가 아닌 것을 사용한 약어입
## 니다
## 
## Correlation of Fixed Effects:
## Warning in abbreviate(rn, minlength = 6): 아스키 문자가 아닌 것을 사용한 약어입
## 니다
## Warning in abbreviate(rn, minlength = 6): 아스키 문자가 아닌 것을 사용한 약어입
## 니다

## Warning in abbreviate(rn, minlength = 6): 아스키 문자가 아닌 것을 사용한 약어입
## 니다

## Warning in abbreviate(rn, minlength = 6): 아스키 문자가 아닌 것을 사용한 약어입
## 니다

## Warning in abbreviate(rn, minlength = 6): 아스키 문자가 아닌 것을 사용한 약어입
## 니다

## Warning in abbreviate(rn, minlength = 6): 아스키 문자가 아닌 것을 사용한 약어입
## 니다

## Warning in abbreviate(rn, minlength = 6): 아스키 문자가 아닌 것을 사용한 약어입
## 니다

## Warning in abbreviate(rn, minlength = 6): 아스키 문자가 아닌 것을 사용한 약어입
## 니다

## Warning in abbreviate(rn, minlength = 6): 아스키 문자가 아닌 것을 사용한 약어입
## 니다
##                        (Intr) f_$`표현낱말백분위수`1 f_$`표현낱말백분위수`2
## f_$`표현낱말백분위수`1 -0.792                                              
## f_$`표현낱말백분위수`2 -0.764  0.617                                       
## f_$`표현낱말백분위수`5 -0.819  0.649                  0.635                
## f_$`표현낱말백분위수`7 -0.723  0.573                  0.552                
## f_$`표현낱말백분이     -0.603  0.478                  0.460                
##                        f_$`표현낱말백분위수`5 f_$`표현낱말백분위수`7
## f_$`표현낱말백분위수`1                                              
## f_$`표현낱말백분위수`2                                              
## f_$`표현낱말백분위수`5                                              
## f_$`표현낱말백분위수`7  0.604                                       
## f_$`표현낱말백분이      0.494                  0.436
  • dependent var.: 표현점수
  • fixed effect: 표현낱말 백분위 수
    • 표현점수가 높으면 백분위 수가 높은 자연스러운 현상을 검증한 것.
summary(lm(final_cdi$`표현점수`~ final_cdi$`표현낱말 백분위수`, data=final_cdi)) 
## 
## Call:
## lm(formula = final_cdi$표현점수 ~ final_cdi$`표현낱말 백분위수`, 
##     data = final_cdi)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -320.07  -65.04  -10.39   64.07  348.53 
## 
## Coefficients:
##                                      Estimate Std. Error t value Pr(>|t|)    
## (Intercept)                             55.93      28.48   1.964 0.052306 .  
## final_cdi$`표현낱말 백분위수`10~25      64.36      35.84   1.796 0.075488 .  
## final_cdi$`표현낱말 백분위수`25~50     136.55      37.54   3.637 0.000434 ***
## final_cdi$`표현낱말 백분위수`50~75     252.93      34.89   7.250 8.25e-11 ***
## final_cdi$`표현낱말 백분위수`75~90     417.14      39.60  10.533  < 2e-16 ***
## final_cdi$`표현낱말 백분위수`90 이상   462.82      47.23   9.798 2.28e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 106.6 on 102 degrees of freedom
##   (결측으로 인하여 5개의 관측치가 삭제되었습니다.)
## Multiple R-squared:  0.6758, Adjusted R-squared:  0.6599 
## F-statistic: 42.52 on 5 and 102 DF,  p-value: < 2.2e-16
  • graph_final_cdi$pnnum
boxplot(final_cdi$pnnum ~ final_cdi$`표현낱말 백분위수`, col=c("green","blue","red", "purple", "black","yellow"),final_cdi)

lineplot.CI(final_cdi$`표현낱말 백분위수`, final_cdi$pnnum )

  • graph_final_cdi$pnCal
boxplot(final_cdi$pnCal ~ final_cdi$`표현낱말 백분위수`, col=c("green","blue","red", "purple", "black","yellow"),final_cdi)

lineplot.CI(final_cdi$`표현낱말 백분위수`, final_cdi$pnCal )