第八次作业

对“WHO”数据集的MINE分析

设置MINE环境

安装Java 7

sudo add-apt-repository ppa:webupd8team/java
sudo apt-get update
sudo apt-get install oracle-java7-installer
sudo update-java-alternatives -s java-7-oracle
sudo apt-get install oracle-java7-set-default

下载MINE

一共MINE.jar和MINE.R两个文件,可以放在当前工作目录,然后修改MINE.R第二行增大java的内存分配:

library("rJava")
.jinit(classpath="MINE.jar",parameters="-Xms768m")

下载WHO数据集

download.file("http://www.exploredata.net/ftp/WHO.csv", "WHO.csv")

进行MINE分析(时间较长)

setwd("~/R-SDSS/R-Book-Homework")
source("MINE.r")
MINE("WHO.csv", "all.pairs")

读入结果

who <- read.csv("WHO.csv,allpairs,cv=0.0,B=n^0.6,Results.csv")
term <- read.csv("WHO_term.csv")

取出显著相关的两两统计项

strong <- who[which(who$MIC..strength == 1), ]

合并中英文对照表

m <- merge(strong, term, by.x = "X.var", by.y = "TermEn")
names(m)[names(m) == "TermCN"] <- "X.var.CN"
m <- merge(m, term, by.x = "Y.var", by.y = "TermEn")
names(m)[names(m) == "TermCN"] <- "Y.var.CN"
m <- m[, !(names(m) %in% c("SN.x", "SN.y"))]

按照X.var和Y.var排序

res <- m[with(m, order(X.var, Y.var)), ]
res <- res[, c("X.var.CN", "Y.var.CN")]

列出所有相关项目

library(xtable)
xdf <- xtable(res)
print(xdf, type = "html", html.table.attributes = "border=\"1\"; style=\"border-style: solid;border-width: 1px;\"")
X.var.CN Y.var.CN
4 帮助给予 产前保健覆盖率 - 至少四次(%)
13 帮助给予 先进的艾滋病毒感染(%)的人之间的抗逆转录病毒疗法的覆盖率
35 帮助给予 儿童年龄< 5岁,谁收到任何抗疟治疗发烧(%)
43 帮助给予 岁的儿童5岁,患急性呼吸道感染症状采取设施(%)
56 帮助给予 岁以下的儿童在5岁以上超重(%)
91 帮助给予 新生儿出生时的保护对新生儿破伤风(PAB)(%)
98 帮助给予 人口使用固体燃料(%)城市
122 帮助给予 当前青少年的烟草使用流行率(13-15岁)男女(%)
16 接生由熟练保健人员的比例最高最低财富的五分之一 接生由熟练保健人员(%)最低财富的五分之一
123 每名妇女的儿童 总和生育率(每名妇女)
31 煤炭消费量 儿童年龄< 5岁睡在驱虫蚊帐(%)
114 煤炭消费量 使用安全套的年轻人(15-24岁)的患病率较高的风险性(%)男性
25 煤炭消费量每人 儿童年龄< 5岁睡在驱虫蚊帐(%)
121 煤炭消费量每人 使用安全套的年轻人(15-24岁)的患病率较高的风险性(%)男性
11 煤炭生产 抗逆转录病毒治疗艾滋病毒感染pregt妇女预防艾滋病母婴传播覆盖面(%)
41 煤炭生产 岁的儿童5岁,患急性呼吸道感染症状采取设施(%)
60 煤炭生产 社区和传统的卫生工作者的密度(每10万人口)
102 煤炭生产 安全套的使用,在更高的风险性(%)女性青少年(15-24岁)的患病
117 煤炭生产 使用安全套的年轻人(15-24岁)的患病率较高的风险性(%)男性
12 每人的煤炭生产 抗逆转录病毒治疗艾滋病毒感染pregt妇女预防艾滋病母婴传播覆盖面(%)
36 每人的煤炭生产 儿童年龄< 5岁,谁收到任何抗疟治疗发烧(%)
42 每人的煤炭生产 岁的儿童5岁,患急性呼吸道感染症状采取设施(%)
59 每人的煤炭生产 社区和传统的卫生工作者的密度(每10万人口)
104 每人的煤炭生产 安全套的使用,在更高的风险性(%)女性青少年(15-24岁)的患病
118 每人的煤炭生产 使用安全套的年轻人(15-24岁)的患病率较高的风险性(%)男性
33 发电 儿童年龄< 5岁睡在驱虫蚊帐(%)
103 发电 安全套的使用,在更高的风险性(%)女性青少年(15-24岁)的患病
119 发电 使用安全套的年轻人(15-24岁)的患病率较高的风险性(%)男性
29 人均发电 儿童年龄< 5岁睡在驱虫蚊帐(%)
63 人均发电 电力消耗
106 人均发电 安全套的使用,在更高的风险性(%)女性青少年(15-24岁)的患病
108 人均发电 使用安全套的年轻人(15-24岁)的患病率较高的风险性(%)男性
53 环境和公共卫生工作者的密度(每10万人口) 6-59个月收到补充维生素A(%)的儿童
127 环境和公共卫生工作者的密度(每10万人口) 有妇女乳房X光检查(%)
2 外债总额国防部目前的美元结算 帮助给予
94 外债总额国防部目前的美元结算 实验室卫生工作者
1 外债总额占国民总收入的% 帮助给予
67 公共医疗开支%的卫生总支出 政府卫生总支出卫生总开支的百分比
6 水电消费 抗逆转录病毒治疗艾滋病毒感染pregt妇女预防艾滋病母婴传播覆盖面(%)
26 水电消费 儿童年龄< 5岁睡在驱虫蚊帐(%)
39 水电消费 儿童年龄< 5岁,谁收到任何抗疟治疗发烧(%)
120 水电消费 使用安全套的年轻人(15-24岁)的患病率较高的风险性(%)男性
34 每人的水电消费 儿童年龄< 5岁睡在驱虫蚊帐(%)
115 每人的水电消费 使用安全套的年轻人(15-24岁)的患病率较高的风险性(%)男性
27 进口单位价格 儿童年龄< 5岁睡在驱虫蚊帐(%)
110 进口单位价格 使用安全套的年轻人(15-24岁)的患病率较高的风险性(%)男性
68 人均收入 人均国民总收入(PPP国际美元)
70 婴儿死亡率 婴儿死亡率(每1 000名活产婴儿),男
73 识字率青年总 识字率青年男性
74 新例男性肺癌发病人数 肺癌男性死亡数
58 预防疟疾的经杀虫剂处理过的蚊帐使用 煤炭消费量每人
64 预防疟疾的经杀虫剂处理过的蚊帐使用 人均发电
3 营养不良体重年龄 帮助给予
7 四年级的数学成绩 抗逆转录病毒治疗艾滋病毒感染pregt妇女预防艾滋病母婴传播覆盖面(%)
38 四年级的数学成绩 儿童年龄< 5岁,谁收到任何抗疟治疗发烧(%)
46 四年级的数学成绩 岁的儿童5岁,患急性呼吸道感染症状采取设施(%)
55 四年级的数学成绩 6-59个月收到补充维生素A(%)的儿童
57 四年级的数学成绩 岁以下的儿童在5岁以上超重(%)
75 四年级的数学成绩 预防疟疾的经杀虫剂处理过的蚊帐使用
93 四年级的数学成绩 证实脊髓灰质炎病例数
8 八年级数学成就 抗逆转录病毒治疗艾滋病毒感染pregt妇女预防艾滋病母婴传播覆盖面(%)
23 八年级数学成就 儿童年龄< 5岁睡在驱虫蚊帐(%)
37 八年级数学成就 儿童年龄< 5岁,谁收到任何抗疟治疗发烧(%)
52 八年级数学成就 6-59个月收到补充维生素A(%)的儿童
77 八年级数学成就 治疗疟疾
81 八年级数学成就 一岁(%)最高的财富五分之一之间的麻疹免疫覆盖率
66 医生 环境和公共卫生工作者的密度(每10万人口)
126 医生 有妇女乳房X光检查(%)
54 天然气消费量 6-59个月收到补充维生素A(%)的儿童
61 天然气消费量 社区和传统的卫生工作者的密度(每10万人口)
78 天然气消费量 治疗疟疾
80 天然气消费量 一岁(%)最高母亲的教育水平之间的麻疹免疫覆盖率
101 天然气消费量 安全套的使用,在更高的风险性(%)女性青少年(15-24岁)的患病
49 人均天然气消费量 岁的儿童5岁腹泻的口服补液疗法(%)
76 人均天然气消费量 预防疟疾的经杀虫剂处理过的蚊帐使用
86 人均天然气消费量 之间相差一岁的最高最低的财富五分之一的麻疹免疫覆盖率
90 人均天然气消费量 其中一岁的比例最高最低的财富五分之一的麻疹免疫覆盖率
92 人均天然气消费量 社区和传统的卫生工作者数量
105 人均天然气消费量 安全套的使用,在更高的风险性(%)女性青少年(15-24岁)的患病
32 天然气产量 儿童年龄< 5岁睡在驱虫蚊帐(%)
47 天然气产量 岁的儿童5岁腹泻的口服补液疗法(%)
107 人均天然气生产 安全套的使用,在更高的风险性(%)女性青少年(15-24岁)的患病
48 天然气探明储量 岁的儿童5岁腹泻的口服补液疗法(%)
5 核消费 抗逆转录病毒治疗艾滋病毒感染pregt妇女预防艾滋病母婴传播覆盖面(%)
40 核消费 岁的儿童5岁,患急性呼吸道感染症状采取设施(%)
79 核消费 治疗疟疾
62 核消费每人 社区和传统的卫生工作者的密度(每10万人口)
65 核消费每人 环境和公共卫生工作者的密度(每10万人口)
72 核消费每人 实验室卫生工作者的密度(每10万人口)
95 护理和助产人员数 实验室卫生工作者
28 石油消费量 儿童年龄< 5岁睡在驱虫蚊帐(%)
116 石油消费量 使用安全套的年轻人(15-24岁)的患病率较高的风险性(%)男性
22 人均石油消费量 儿童年龄< 5岁睡在驱虫蚊帐(%)
45 人均石油消费量 岁的儿童5岁,患急性呼吸道感染症状采取设施(%)
51 人均石油消费量 6-59个月收到补充维生素A(%)的儿童
69 人均石油消费量 人均收入
82 人均石油消费量 一岁(%)最低的财富五分之一之间的麻疹免疫覆盖率
87 人均石油消费量 之间相差一岁的最高最低的财富五分之一的麻疹免疫覆盖率
89 人均石油消费量 其中一岁的比例最高最低的财富五分之一的麻疹免疫覆盖率
111 人均石油消费量 使用安全套的年轻人(15-24岁)的患病率较高的风险性(%)男性
113 人均石油探明储量 使用安全套的年轻人(15-24岁)的患病率较高的风险性(%)男性
124 人均石油探明储量 5岁以下儿童死亡率(死亡年龄< 5年每1 000名活产婴儿的概率)母亲教育程度最高
96 总人口 人口(千)总
9 成年人的患病率(> = 15岁),肥胖(%)男性 抗逆转录病毒治疗艾滋病毒感染pregt妇女预防艾滋病母婴传播覆盖面(%)
14 成年人的患病率(> = 15岁),肥胖(%)男性 由熟练保健人员(%)最高教育水平的母亲接生
18 成年人的患病率(> = 15岁),肥胖(%)男性 接生由熟练保健人员的差异,最高最低母亲的教育水平
19 成年人的患病率(> = 15岁),肥胖(%)男性 接生由熟练保健人员的比例最高 - 您最佳的母亲的教育水平
83 成年人的患病率(> = 15岁),肥胖(%)男性 一岁(%)农村中的麻疹免疫覆盖率
84 成年人的患病率(> = 15岁),肥胖(%)男性 一岁(%)城市之间的麻疹免疫覆盖率
85 成年人的患病率(> = 15岁),肥胖(%)男性 之间相差一岁的麻疹免疫覆盖率最高的教育水平最低的母亲
88 成年人的患病率(> = 15岁),肥胖(%)男性 一岁的比例之间的麻疹免疫覆盖率最高的母亲教育程度最低
99 安全套的使用,在更高的风险性(%)女性青少年(15-24岁)的患病 成年人的患病率(> = 15岁),肥胖(%)男性
100 使用安全套的年轻人(15-24岁)的患病率较高的风险性(%)男性 成年人的患病率(> = 15岁),肥胖(%)男性
10 一次能源消费 抗逆转录病毒治疗艾滋病毒感染pregt妇女预防艾滋病母婴传播覆盖面(%)
30 一次能源消费 儿童年龄< 5岁睡在驱虫蚊帐(%)
109 一次能源消费 使用安全套的年轻人(15-24岁)的患病率较高的风险性(%)男性
15 每人初级能源消费量 (%)最高财富的五分之一由熟练保健人员接生
17 每人初级能源消费量 接生由熟练保健人员(%)最低财富的五分之一
20 每人初级能源消费量 接生由熟练保健人员的比例最高最低财富的五分之一
24 每人初级能源消费量 儿童年龄< 5岁睡在驱虫蚊帐(%)
44 每人初级能源消费量 岁的儿童5岁,患急性呼吸道感染症状采取设施(%)
50 每人初级能源消费量 6-59个月收到补充维生素A(%)的儿童
112 每人初级能源消费量 使用安全套的年轻人(15-24岁)的患病率较高的风险性(%)男性
71 五岁以下儿童死亡率从CME的 婴儿死亡率(每1 000名活产婴儿),男
125 五岁以下儿童死亡率从CME的 5岁以下儿童死亡率(每1000个活产儿5岁死亡的概率)男女
97 市区人口总数的% 在市区人口(%)
21 谁曾子宫颈抹片检查的妇女(%) 通过剖腹产出生(%)