第七章 时间序列可视化课堂练习

Author

22152716叶梓欣

1 案例数据

1.1 all_stock_2024:工商银行、招商应用、中信证券和贵州茅台四个股票2024各天交易数据

  • data为为日期变量,但该日期变量不规则(不连续),周末和公众假期没有交易数据;

  • 编码名称用于识别不同股票,注意不同股票有交易数据日期不一定一致,但本例种各股票均有242个交易日数据;

  • 开盘价到换手率 均为数值变量,开盘价到成交量与每股资产有关,不同股票间不可比;

  • 交易量的单位为手(百股)、成交额的单位为元,振幅等四个变量均为相对指标。

2 折线图和面积图

2.1 合并折线图

  • 将四只股票的涨跌幅 做作折线图,将四条折线在同一个图形输出;

  • 日期截取2024-9-12024-10-31

  • 添加一条纵轴为0的参考线,采用twodash 的线型;

  • 将图标题改为“合并涨跌幅折线图”。

2.2 分面折线图

  • 将四只股票的收盘 价格做作折线图,将四条折线图分面输出;

  • 日期截取一整年;

  • 并使用ggpol::geom_tshighlight2024-9-12024-10-31 时间段高亮显示

2.3 面积图

  • 将四只股票的收盘 价格做作面积图,将四个面积图分面输出;

  • 将成交量的单位改为万手

2.4 图形观察和代码编写的心得体会

  • 合并折线图可同时显示多个变量或指标在同一时间维度(或同一分类)下的趋势变化,便于直接对比不同数据的走势、波动和相关性
  • 分面折线图将数据按某个分类变量拆分成多个小图,每个小图展示该类别下的趋势变化,可以避免单图线条过多导致的混乱
  • 面积图直观展示总量变化:填充颜色使数据的 上升或下降趋势更明显适合观察数据的累积效应,能有效增强数据的视觉权重,适合展示时间序列的演变过程

3 流线图和地平线图

3.1 流线图

  • 将四只股票的交易额 做作流线图,将四个面积图分面输出;

  • 将交易额的单位改为亿元

3.2 地平线图

  • 采用ggHoriPlot::geom_horizon函数,对四只股票的交易额 做作地平线图
  • 设置原点为均值origin='mean',输出配色图例

3.3 图形观察和代码编写的心得体会

  • 流线图是堆叠面积图的变体,通过对称布局和平滑曲线展示数据变化,常用于时间序列数据的多类别对比,可清晰展示数十个类别的趋势,适合展示趋势而非具体数值。

  • 地平线图通过 分层和颜色渐变 压缩垂直空间,适合高密度时间序列数据的对比,需在有限空间内对比大量序列,或强调偏离基准的程度。

4 不规则时间序列图

4.1 数据准备

  • 通过zoo::rollmean 时间收盘价的5天、10天和20天的移动平均

  • 将日期变量转化为id变量

4.2 平滑曲线图

  • 将四只股票收盘价和3种移动平均的折线图分面输出;

  • 横轴的每隔30天一个刻度,只显示月/日;

4.3 K线图

  • 选择工商银行数据作出,2024年的K线图

  • scale_x_continuous 将横轴坐标刻度转化回日期型

4.4 图形观察和代码编写的心得体会

  • 平滑曲线图可以消除数据中的随机波动,揭示潜在规律,但需平衡拟合度与保真度,突出整体趋势,适用于探索性数据分析(EDA)和趋势预测。

  • K线图经过蜡烛形态展示开盘价、收盘价、最高价、最低价,用于价格波动和交易信号分析,可以进行多周期分析。