Data Science(part III)

Exploratory Data Analysis

探索绘图原则

探索性绘图

R绘图系统

基础包

lattice

ggplot2

数学绘图

色彩管理

pal <- colorRamp(c("red", "blue"))
pal(0)
##      [,1] [,2] [,3]
## [1,]  255    0    0
pal(1)
##      [,1] [,2] [,3]
## [1,]    0    0  255
pal(0.5)
##       [,1] [,2]  [,3]
## [1,] 127.5    0 127.5
##### 
pal <- colorRampPalette(c("red", "yellow"))
pal(2)
## [1] "#FF0000" "#FFFF00"
pal(10)
##  [1] "#FF0000" "#FF1C00" "#FF3800" "#FF5500" "#FF7100" "#FF8D00" "#FFAA00"
##  [8] "#FFC600" "#FFE200" "#FFFF00"
##### 
library(RColorBrewer)
cols <- brewer.pal(3, "BuGn")

分层聚类

k-means聚类

维度还原

Reproducible Research

Replication

Reproducible

研究流程

流程图

数据分析步骤

数据分析文件结构

文本化统计编程-Knitr

结果通讯

检查列表

基于证据的数据分析