はじめに

前回、スピアマン(Spearman)の順位相関を使って6か国の相関を見ていった。経済的豊かさと幸福度の順位の相関を見たが、順位に差のある国を見ていたため、非常に強い負の相関があった。

本当に経済的に豊かな国は幸福度が低い傾向があるのかと疑問を持った。経済が豊かな国は活気があり、国民に還元されて幸福度が高い可能性も考えられる。前回分析をした国が極端であるかどうかを確かめるために今回は多くの国の順位を用いて分析を行う。さらに、散布図を載せる練習も目的とする。

データを読みこむ:

library(tidyverse)
## -- Attaching packages -------------------------------------------------------------------------------------- tidyverse 1.3.0 --
## √ ggplot2 3.2.1     √ purrr   0.3.3
## √ tibble  2.1.3     √ dplyr   0.8.3
## √ tidyr   1.0.0     √ stringr 1.4.0
## √ readr   1.3.1     √ forcats 0.4.0
## -- Conflicts ----------------------------------------------------------------------------------------- tidyverse_conflicts() --
## x dplyr::filter() masks stats::filter()
## x dplyr::lag()    masks stats::lag()
library(maptools)
## Loading required package: sp
## Checking rgeos availability: FALSE
##      Note: when rgeos is not available, polygon geometry     computations in maptools depend on gpclib,
##      which has a restricted licence. It is disabled by default;
##      to enable gpclib, type gpclibPermit()
data <- read_csv("world-happiness.csv")
## Parsed with column specification:
## cols(
##   country = col_character(),
##   happiness_rank = col_double(),
##   GDP_rank = col_double(),
##   GDP = col_number(),
##   HDI_rank = col_double(),
##   Murder_rank = col_double(),
##   Murder_rate = col_double()
## )
pi <- na.omit(data)

幸福度はGALLUP社の2017年の“World Happiness Report”を用いる。経済的豊かさはIMFの2017年の名目GDPを用いる。

前回よりも多くの国で分析

1. 計算を行う

pi
## # A tibble: 125 x 7
##    country     happiness_rank GDP_rank    GDP HDI_rank Murder_rank Murder_rate
##    <chr>                <dbl>    <dbl>  <dbl>    <dbl>       <dbl>       <dbl>
##  1 Afghanistan            141      115  20235      168          50        6.93
##  2 Albania                109      126  13059       68          93        2.36
##  3 Algeria                 53       54 167390       85         119        1.36
##  4 Angola                 140       59 122124       35          70        4.85
##  5 Argentina               24       21 642928       70          66        5.19
##  6 Armenia                121      134  11527       47          92        2.38
##  7 Austria                 13       28 417721        3         152        0.65
##  8 Azerbaijan              85       89  41375       20         104        2.04
##  9 Bahrain                 41       97  35433       43         159        0.52
## 10 Bangladesh             110       43 262077      136          98        2.22
## # ... with 115 more rows

125か国で分析を行う。今回はhappiness_rank(幸福度順位)とGDP_rank(経済的豊かさの順位)のみを分析する。

cor.test(pi$`GDP_rank`,pi$`happiness_rank`,method = "spearman")
## 
##  Spearman's rank correlation rho
## 
## data:  pi$GDP_rank and pi$happiness_rank
## S = 119106, p-value < 2.2e-16
## alternative hypothesis: true rho is not equal to 0
## sample estimates:
##       rho 
## 0.6340829
p値は非常に小さく、相関係数は0.63であった。
相関係数は以前の結果と異なり、強い正の相関を示した。
p値も小さく、有意である。

2. 散布図で視覚化する

{plot(pi$GDP_rank,pi$happiness_rank) 
pointLabel( pi$GDP_rank,pi$happiness_rank,labels = pi$country,cex=0.7)
abline(lm(pi$GDP_rank ~ pi$happiness_rank),col="red")
}

ⅹ軸はGDPの順位、y軸は幸福度の順位である。

前回の6か国で分析

125か国で分析を行ったところ、前回とは正反対の強い正の相関があらわれた。

前回のデータと調査された年が異なる。したがって、確認のために前回用いた6か国(アメリカ、中国、日本、フィンランド、デンマーク、ノルウェー)で分析を行う。

1. 計算を行う

cou <- c("USA","China","Japan","Finland","Denmark","Norway")
gdp <- c(1,2,3,44,29,37)
well <- c(14,79,51,5,1,2)     
data2 <- data.frame(Country=cou,GDP_rank=gdp,Happiness_rank=well)
data2
##   Country GDP_rank Happiness_rank
## 1     USA        1             14
## 2   China        2             79
## 3   Japan        3             51
## 4 Finland       44              5
## 5 Denmark       29              1
## 6  Norway       37              2

多少の順位の変更があるものの、大きな変化は見受けられない。

cor.test(data2$GDP_rank,data2$Happiness_rank,method = "spearman")
## 
##  Spearman's rank correlation rho
## 
## data:  data2$GDP_rank and data2$Happiness_rank
## S = 56, p-value = 0.2417
## alternative hypothesis: true rho is not equal to 0
## sample estimates:
##  rho 
## -0.6

p値は0.24、相関係数は-0.6である。
やはり6か国で分析すると強い負の相関がある。
p値は0.24と大きく、有意ではない。

2. 散布図で視覚化する

{plot(data2$GDP_rank,data2$Happiness_rank) 
pointLabel(data2$GDP_rank,data2$Happiness_rank,labels = data2$Country,cex=1)
abline(lm(data2$GDP_rank ~ data2$Happiness_rank),col="red")
}

こちらも、ⅹ軸はGDPの順位、y軸は幸福度の順位である。

まとめ

今回、125か国で分析を行うと、強い正の相関があった。前回と調査の年が違うため順位が大きく変動した可能性があるが、6か国で分析を行うと前回同様に有意ではないが、強い負の相関があった。よって全体を見ると、経済的豊かさと幸福度に差がないといえる。

“World Happiness Report”によると、

国連の考える幸福度の指標は、一人当たりGDP、社会的支援、健康寿命、人生の選択の自由度、社会的寛容さ、社会の腐敗度の6つと、全項目が最低である架空の国(ディストピア)との比較である。 (Yahoo!ニュースより引用)

この中に、GDPがすでに組み込まれているのである。また「人生の選択の自由度」は経済的豊かさに関係があると考えられる。このような変数が幸福度に含まれているため、経済的豊かさとの強い正の相関があったと推察される。

余談であるが、前回今回とスピアマン(Spearman)の順位相関で行ったが、ケンドール(Kendall)の順位相関もある。ケンドール(Kendall)の順位相関で分析をしてみたが、スピアマン(Spearman)の順位相関と違った値を出した。余力があれば、両者の差についてもまとめてみたい。

出典

GALLUP,2017,“World Happiness Report”(https://worldhappiness.report/ed/2017/ 2019年12月8日にアクセス)->幸福度

GLOBAL NOTE,2017,「世界の名目GDP 国別ランキング・推移(IMF)」(https://www.globalnote.jp/post-1409.html 2019年12月8日にアクセス)IMF(International Monetary Fund)(https://www.imf.org/external/index.htm)->GDP

Yahoo!ニュース, 2019年3月22日,「世界幸福度ランキング、日本が58位に低下した理由は本当に正しいのか」,(https://news.yahoo.co.jp/byline/endotsukasa/20190322-00119189/ 2019年12月8日にアクセス)