おぎやはぎのメガネびいきPodCastを聴いていたところ,
「秋田美人って本当かねー?」
「わかんないけど, タクシーの運ちゃん曰く, 秋田には綺麗なAV女優が多いらしいよ」
という話があったような気がします.
真偽の程はともかく, AV女優の出身地分布は気になりますよね.
データを用意することが出来たので, 調べてみました.
DMM.comのAV女優名鑑には, 以下の情報が掲載されていました.
プロフィール
出身地が書いてありましたので, これを使えば良さそうです.
えいやっとクロールして, 整理してcsvデータにしてみました.
library(data.table)
library(dplyr)
dat_av = fread("./av_actress_profile.dat")
dat_av =
dat_av %>%
mutate(birthday = as.Date(birthday, format="%Y年%m月%d日"))
## データの中身
dat_av %>% select(name, birthday, birthplace, blood) %>% head(2)
## name birthday birthplace blood
## 1: 愛あいり 1984-07-23 東京都 O
## 2: 藍色しあん 1991-10-21 神奈川県 A
dat_av %>% dim
## [1] 9049 9
9049人分のAV女優のプロフィールデータです.
とりあえず出身地別AV女優人数を見ます.
library(ggplot2)
dat_birthplace = dat_av %>%
filter(birthplace != "") %>%
group_by(birthplace) %>%
count(birthplace) %>%
arrange(desc(n))
dat_birthplace %>%
select(n) %>% sum
## [1] 2601
dat_birthplace
## Source: local data table [81 x 2]
##
## birthplace n
## 1 東京都 1221
## 2 神奈川県 377
## 3 北海道 105
## 4 千葉県 104
## 5 埼玉県 97
## 6 大阪府 56
## 7 静岡県 48
## 8 京都府 44
## 9 兵庫県 37
## 10 福岡県 36
## .. ... ...
2601人分の出身地データが有りましたが, 東京と神奈川で半分です.
各都道府県の人口も考えないといけませんよね.
政府統計のe-statから, 国勢調査の結果データが得られました.
2013年の都道府県別人口データを取得して, 10万人あたりのAV女優人数を見てみます.
AV女優比率の上位5県を見てみましょう.
library(xtable)
## 県別統計データ(千人)
dat_pops = fread("./pops.csv", header=FALSE)
dat_pops %>% setnames(c("birthplace", "birthplace_yomi", "pops"))
dat_birthplace %>%
merge(dat_pops, by = "birthplace") %>%
mutate(av_ratio = n/pops * 100) %>%
select(birthplace, av_ratio) %>%
arrange(desc(av_ratio)) %>%
head(5) %>%
xtable() %>% print(type="html")
birthplace | av_ratio | |
---|---|---|
1 | 東京都 | 9.18 |
2 | 神奈川県 | 4.15 |
3 | 秋田県 | 2.86 |
4 | 北海道 | 1.93 |
5 | 京都府 | 1.68 |
10万人あたりAV女優人数でランキングにしてみました.
1位は東京. さすがです. 10万人あたり9.18人.
意外と秋田が多いですね. 10万人あたりで2.86人で, 3位です.
秋田美人AV女優多い説, 結構正しかったです.
ついでに, AV女優比率が低い5県も見てみます.
dat_birthplace %>%
merge(dat_pops, by = "birthplace") %>%
mutate(av_ratio = n/pops * 100) %>%
select(birthplace, av_ratio) %>%
arrange(desc(av_ratio)) %>%
tail(5) %>%
xtable() %>% print(type="html")
birthplace | av_ratio | |
---|---|---|
1 | 岐阜県 | 0.20 |
2 | 大分県 | 0.17 |
3 | 熊本県 | 0.17 |
4 | 徳島県 | 0.13 |
5 | 佐賀県 | 0.12 |
佐賀www
AV女優のプロフィールデータから, 都道府県別AV女優人数を調べました.
10万人あたりのAV女優数で比較すると, 東京, 神奈川, 秋田がTop3でした.
以上です.
最後に, 今後やりたいことを載せます.
他に何が出来ますかね?
大変ありがたいご指摘を頂きました.
Choroplethrを使って可視化すればいいみたいです.
library(choroplethr)
library(choroplethrAdmin1)
dat_av_ratio =
dat_birthplace %>%
merge(dat_pops, by = "birthplace") %>%
mutate(av_ratio = n/pops * 100) %>%
arrange(desc(av_ratio)) %>%
mutate(region = tolower(birthplace_yomi)) %>%
mutate(value = av_ratio) %>%
select(region, value)
data("df_japan_census")
df_japan_census =
df_japan_census %>%
merge(dat_av_ratio, by = "region")
## 可視化
admin1_choropleth(country.name = "japan",
df = df_japan_census,
title = "AV actress ratio",
legend = "number")
## Warning in self$bind(): The following regions were missing and are being
## set to NA: NA
これはかっこいいですね!