青空文庫

女生徒 を取り出して形態素解析にかけて、ワードクラウドネットワークを作成する。

josh <- Aozora("http://www.aozora.gr.jp/cards/000035/files/275_ruby_1532.zip", "josh.txt")
frq <- RMeCabFreq(josh)
## file = ./NORUBY/josh.txt2.txt 
## length = 2585
frq %>% filter (Freq > 5, Info1 %in% c("名詞","形容詞","動詞")) -> frq2
frq2 %<>% filter(!Term %in% c("それ","する","いる" ,"の","なる","よう","ある"))

wordcloud(frq2$Term,frq2$Freq,color = rainbow(10),scale = c(6,1))

私,自分などの一人称や,思うなどのワードが多いことから,この作品は主人公の一人称視点で描かれていることがわかる。また,主人公の私とお母さんの関係に焦点をあてていることが見て取れる。

単語のバイグラムを取り出す

bigram <- NgramDF(josh,type = 1,pos =c("名詞","動詞","形容詞"))
## file = ./NORUBY/josh.txt2.txt Ngram = 2
head (bigram)
##   Ngram1 Ngram2 Freq
## 1 あいだ   逢う    1
## 2   あか   醜い    1
## 3   あか     恥    1
## 4 あかい   なる    1
## 5 あかい 色づく    1
## 6 あがる   今夜    1

生成されたデータ数(単語数)は6529 である。

ネットワーク・グラフの作成

# 最小頻度を指定
bigram %<>% filter(Freq > 5)
# ネットワーク化
bigram %<>% graph.data.frame()
# ラベルサイズの指定
V(bigram)$label.cex = 2
# 実際にグラフにしてみる
# tkplot(bigram, vertex.label =V(bigram)$name, edge.label =E(bigram)$weight , vertex.size = 23,vertex.color = "SkyBlue")
plot(bigram, vertex.label =V(bigram)$name, edge.label =E(bigram)$weight , vertex.size = 16,vertex.color = "SkyBlue", vertex.label = 16)

主人公の私が思ったことや感じたことが多く描写され,作品中に主人公の母や父など家族との関係が中心的に描かれている作品であると予想した。