Proposal

WHAT sound symbolism이란?
Pokemonatics: Studies of sound symbolism using Pokemon names
동물의 숲 주민들의 이름을 성별, 성격과 연관지어 지을까? 동물의 숲 주민은 총 466마리이며 34가지 종류의 동물 형태가 있다. 주민들은 MALE, FEMALE이 있으며 성별마다 각각 4가지의 다른 성격을 가진다.
MALE은 먹보, 운동광, 무뚝뚝, 느끼함, FEMALE은 친절함, 아이돌, 성숙함, 단순활발로 나뉜다. 같은 성격 끼리는 같은 대사를 공유하며, 성격마다 기상, 취침시간도 다르고 선호하는 주민들도 각각 다르다.

WHY (교수님께서 도와주신 부분입니다.) 언어는 상징체계이지만 음성 상징어 등을 봤을 때 iconic한 면도 있을 가능성이 충분히 있다고 생각한다.

Kawahara, Shigeto; Atsushi Noto; and Gakuji Kumagai.(2018): 포켓몬 이름의 유성 장애음의 개수와 모라의 개수가 많이 들어갈수록 크기가 커지고, 무게가 무거워지고, 강함 척도에서 우위에 있다.

-> 그렇다면 다른 (이름 sample이 많은) 게임에서는 어떻게 나타나는가?

HOW 코딩과정: 1. 동물의 숲 주민 이름들에 들어간 장애음 개수와 공명음의 개수, initial Vowel을 항목별로 코딩
stop: 평 파열음의 개수(ㅂ, ㄷ, ㄱ, (coda에 오는)ㅅ)
stop_asp: 유기 파일음의 개수 (ㅍ, ㅌ, ㅋ) stop_glot: 경 파열음의 개수 (ㅃ, ㄸ, ㄲ)
fri: ㅅ의 개수
fri_asp: ㅎ의 개수
fri_glot: ㅆ의 개수 aff: ㅈ의 개수
aff_asp: ㅊ의 개수
aff_glot: ㅉ의 개수
sonorant: 공명자음의 개수(ㄴ, ㄹ, ㅁ, (coda에 오는)ㅇ) initial_V: 첫음절 모음

독립변수: 동물의 숲 주민 이름에 들어간 공명자음의 비율, 음절의 비율, 장애음 비율
종속변수: 성별, 성격 (단, 한국어 동물의 숲 주민 이름이 없는 경우 제외, 두 가지 성격을 가지고 있는 주민도 제외)

패키지 설치하기

install.packages("ggplot2")
install.packages("dplyr")
install.packages("sciplot")
library(ggplot2)
library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(sciplot)

1. 전처리

setwd("C:\\Users\\user\\Desktop\\R")
read.delim(file = "animal.txt") -> animal #코딩 파일 불러오기
as.character(animal$이름) -> animal$이름 #nchar를 사용하기 위해 factor class의 벡터를 character로 변환
as.character(animal$성격) -> animal$성격 
animal %>% mutate(syllable = nchar(animal$이름)) -> animal #음절 수 column 추가
animal %>% mutate(tot_seg = rowSums(animal[,5:14], na.rm = T) + animal[,16]) -> animal #전체 분절음의 개수 column 추가 
animal %>% mutate(tot_obs = rowSums(animal[,5:13], na.rm = T)) -> animal # 전체 저해음의 개수를 합산한 파생변수 생성
animal %>% mutate(prop_obs = tot_obs/tot_seg*100) -> animal # 전체 분절음 중 저해음의 비율
animal %>% mutate(prop_son = sonorant/tot_seg*100) -> animal # 전체 분절음 중 공명자음의 비율
animal -> animal.ori
animal %>% filter(nchar(animal$성격) <= 4) -> animal
head(animal)
##   이름   성격 동물 성별 stop stop_asp stop_glot fri fri_asp fri_glot aff
## 1   존 무뚝뚝   개    M   NA       NA        NA  NA      NA       NA   1
## 2 럭키   먹보   개    M    1        1        NA  NA      NA       NA  NA
## 3 로빈   먹보   개    M    1       NA        NA  NA      NA       NA  NA
## 4 토미   먹보   개    M   NA        1        NA  NA      NA       NA  NA
## 5   벤   먹보   개    M    1       NA        NA  NA      NA       NA  NA
## 6 챔프 운동광   개    M   NA       NA         1  NA      NA       NA  NA
##   aff_asp aff_glot sonorant initial_V syllable tot_seg tot_obs prop_obs
## 1      NA       NA        1         o        1       3       1 33.33333
## 2      NA       NA        1        eo        2       5       2 40.00000
## 3      NA       NA        2         o        2       5       1 20.00000
## 4      NA       NA        1         o        2       4       1 25.00000
## 5      NA       NA        1        e         1       3       1 33.33333
## 6       1       NA        1        ae        2       5       2 40.00000
##   prop_son
## 1 33.33333
## 2 20.00000
## 3 40.00000
## 4 25.00000
## 5 33.33333
## 6 20.00000

2. 동물의 숲 주민의 성별과 sound symbolism의 관계

qplot(data = animal, x = 성별, y = prop_son, geom = "boxplot", col=성별, na.rm = T) # 주민 이름의 성별에 따른 공명음의 비율  

qplot(data = animal, x = 성별, y = prop_obs, geom = "boxplot", col=성별, na.rm = T) # 주민 이름의 성별에 따른 저해음의 비율  

qplot(data = animal, x = 성별, y = syllable, geom = "boxplot", col=성별, na.rm = T) # 주민 이름의 성별에 따른 음절의 비율    

3. 동물의 숲 주민의 성격과 sound symbolism의 관계

qplot(data = animal, x = 성격, y = prop_son, geom = "boxplot", col=성격, na.rm = T) #성격에 따른 공명음의 비율  

qplot(data = animal, x = 성격, y = prop_obs, geom = "boxplot", col=성격, na.rm = T) # 성격에 따른 저해음의 비율  

qplot(data = animal, x = 성격, y = syllable, geom = "boxplot", col=성격, na.rm = T) # 성격에 따른 음절의 개수  

qplot(data = animal.ori, x = 성격, y = prop_son, geom = "boxplot", col=성격, na.rm = T) #성격에 따른 공명음의 비율(두 가지 성격을 가진 주민 포함)  

qplot(data = animal.ori, x = 성격, y = prop_obs, geom = "boxplot", col=성격, na.rm = T) # 성격에 따른 저해음의 비율(두 가지 성격을 가진 주민 포함)  

qplot(data = animal.ori, x = 성격, y = syllable, geom = "boxplot", col=성격, na.rm = T) # 성격에 따른 음절의 개수(두 가지 성격을 가진 주민 포함)  

4. 요약

  1. 동물의 숲 주민의 이름은 남성보다 여성의 이름에 공명음의 비율이 유의미하게 많고 음절 수가 유의미하게 많으며, 저해음의 비율이 유의미하게 적다.
  2. 동물의 숲 주민의 이름은 각각 크게 유의미한 차이는 보이지 않으나 친절한 성격의 주민의 공명음의 비율이 운동광 성격의 주민보다 유의미하게 많고 저해음은 유의미하게 적으며 음절수의 차이에서는 유의미한 차이는 보이지 않는다.

5. 참고문헌

[1] Kawahara, Shigeto; Atsushi Noto; and Gakuji Kumagai. 2018. Sound symbolic patterns in Pokémon names. Phonetica 75.