第七章 时间序列可视化课堂练习
1 案例数据
1.1 all_stock_2024:工商银行、招商应用、中信证券和贵州茅台四个股票2024各天交易数据
data
为为日期变量,但该日期变量不规则(不连续),周末和公众假期没有交易数据;编码
和名称
用于识别不同股票,注意不同股票有交易数据日期不一定一致,但本例种各股票均有242个交易日数据;开盘
价到换手率
均为数值变量,开盘
价到成交量
与每股资产有关,不同股票间不可比;交易量的单位为手(百股)、成交额的单位为元,振幅等四个变量均为相对指标。
2 折线图和面积图
2.1 合并折线图
将四只股票的
涨跌幅
做作折线图,将四条折线在同一个图形输出;日期截取
2024-9-1
到2024-10-31
;添加一条纵轴为0的参考线,采用
twodash
的线型;将图标题改为“合并涨跌幅折线图”。
2.2 分面折线图
将四只股票的
收盘
价格做作折线图,将四条折线图分面输出;日期截取一整年;
并使用
ggpol::geom_tshighlight
将2024-9-1
到2024-10-31
时间段高亮显示
2.3 面积图
将四只股票的
收盘
价格做作面积图,将四个面积图分面输出;将成交量的单位改为万手
2.4 图形观察和代码编写的心得体会
- 合并折线图可同时显示多个变量或指标在同一时间维度(或同一分类)下的趋势变化,便于直接对比不同数据的走势、波动和相关性
- 分面折线图将数据按某个分类变量拆分成多个小图,每个小图展示该类别下的趋势变化,可以避免单图线条过多导致的混乱
- 面积图直观展示总量变化:填充颜色使数据的 上升或下降趋势更明显适合观察数据的累积效应,能有效增强数据的视觉权重,适合展示时间序列的演变过程
3 流线图和地平线图
3.1 流线图
将四只股票的
交易额
做作流线图,将四个面积图分面输出;将交易额的单位改为亿元
3.2 地平线图
- 采用
ggHoriPlot::geom_horizon
函数,对四只股票的交易额
做作地平线图 - 设置原点为均值
origin='mean'
,输出配色图例
3.3 图形观察和代码编写的心得体会
流线图是堆叠面积图的变体,通过对称布局和平滑曲线展示数据变化,常用于时间序列数据的多类别对比,可清晰展示数十个类别的趋势,适合展示趋势而非具体数值。
地平线图通过 分层和颜色渐变 压缩垂直空间,适合高密度时间序列数据的对比,需在有限空间内对比大量序列,或强调偏离基准的程度。
4 不规则时间序列图
4.1 数据准备
通过
zoo::rollmean
时间收盘价的5天、10天和20天的移动平均将日期变量转化为
id
变量
4.2 平滑曲线图
将四只股票收盘价和3种移动平均的折线图分面输出;
横轴的每隔30天一个刻度,只显示月/日;
4.3 K线图
选择工商银行数据作出,2024年的K线图
scale_x_continuous
将横轴坐标刻度转化回日期型
4.4 图形观察和代码编写的心得体会
平滑曲线图可以消除数据中的随机波动,揭示潜在规律,但需平衡拟合度与保真度,突出整体趋势,适用于探索性数据分析(EDA)和趋势预测。
K线图经过蜡烛形态展示开盘价、收盘价、最高价、最低价,用于价格波动和交易信号分析,可以进行多周期分析。