数据可视化期末报告

Author

221527239甘政杰

1 报告要求

  • 期末实验报告由5章节5个图形组成,每个章节需要作一个图形。

  • 每个章节选择作什么图自主选择,作图前补充完整图形标题名称,例如:图形1——多变量条形图。

  • 案例数据自主收集,不同章节可以公用一个数据集。但同学间不允许使用相同数据集。

  • 每个章节的数据集合需要通过datatable 函数展示,并简要解释数据来源和变量意义。

  • 每个输出图形后需要对图形作简要解读,最少需针对图形提出一个观点。

  • 渲染html文件保留代码展示,6月22日前将发布网址提交至共享文档“8、期末报告” 列中。

  • 评分标准:

    • 每章节图形各20分

    • 能有效输出图形和合理解释75%

    • 数据独特性强10%

    • 图形个性化强15%

2 类别数据可视化

2.1 案例数据解释与展示

      city  pm25  pm10   so2   no2 temperature humidity
    <char> <num> <num> <num> <num>       <num>    <num>
 1:   北京  41.6  70.5  11.3  21.0        23.9       82
 2:   上海  46.5  69.0   9.1  26.8        19.5       65
 3:   广州  73.4  83.6  12.7  26.3        20.3       59
 4:   深圳  51.1  74.6  12.6  36.2        16.9       52
 5:   成都  51.9  69.5  12.5  29.3        16.6       46
 6:   重庆  75.7  90.4  12.1  32.0        23.5       59
 7:   杭州  56.9  75.8  11.7  29.8        24.2       69
 8:   武汉  31.0  45.9   9.8  29.7        22.3       51
 9:   西安  39.7  56.1   9.1  40.9        26.6       62
10:   南京  43.3  60.2   8.9  28.2        32.3       51
11:   天津  68.4  80.0   7.9  42.1        19.5       65
12:   苏州  55.4  79.6   9.4  17.6        10.5       58
13:   郑州  56.0  76.8   6.2  34.7        27.0       72
14:   长沙  51.7  66.0  16.5  31.0        18.5       59
15:   青岛  41.7  68.0  13.6  31.7        18.6       58
                          caption options
                           <char>  <list>
 1: 表2:中国主要城市空气质量数据       5
 2: 表2:中国主要城市空气质量数据       5
 3: 表2:中国主要城市空气质量数据       5
 4: 表2:中国主要城市空气质量数据       5
 5: 表2:中国主要城市空气质量数据       5
 6: 表2:中国主要城市空气质量数据       5
 7: 表2:中国主要城市空气质量数据       5
 8: 表2:中国主要城市空气质量数据       5
 9: 表2:中国主要城市空气质量数据       5
10: 表2:中国主要城市空气质量数据       5
11: 表2:中国主要城市空气质量数据       5
12: 表2:中国主要城市空气质量数据       5
13: 表2:中国主要城市空气质量数据       5
14: 表2:中国主要城市空气质量数据       5
15: 表2:中国主要城市空气质量数据       5
数据来源:模拟生成的城市空气质量数据
变量说明:
- city: 城市名称
- pm25: PM2.5浓度(μg/m³)
- pm10: PM10浓度(μg/m³)
- so2: 二氧化硫浓度(μg/m³)
- no2: 二氧化氮浓度(μg/m³)
- temperature: 平均温度(℃)
- humidity: 平均湿度(%)

2.2 图形1——多变量条形图

  • 图形解读:

    按浓度值降序排列城市

    使用渐变色表示浓度高低

    添加数值标签

    调整x轴标签角度避免重叠

  • 观点:

    1. 该条形图清晰地展示了各城市PM2.5浓度的差异
    2. 西安、北京等北方城市模拟浓度较高,可能与地理气候条件有关
    3. 深圳、上海等沿海城市模拟浓度相对较低
    4. 所有城市模拟值均在30-80μg/m³之间,符合中国城市空气质量的一般特征 “)

3 数据分布可视化

3.1 案例数据解释与展示

      city  pm25  pm10   so2   no2 temperature humidity
    <char> <num> <num> <num> <num>       <num>    <num>
 1:   北京  41.6  70.5  11.3  21.0        23.9       82
 2:   上海  46.5  69.0   9.1  26.8        19.5       65
 3:   广州  73.4  83.6  12.7  26.3        20.3       59
 4:   深圳  51.1  74.6  12.6  36.2        16.9       52
 5:   成都  51.9  69.5  12.5  29.3        16.6       46
 6:   重庆  75.7  90.4  12.1  32.0        23.5       59
 7:   杭州  56.9  75.8  11.7  29.8        24.2       69
 8:   武汉  31.0  45.9   9.8  29.7        22.3       51
 9:   西安  39.7  56.1   9.1  40.9        26.6       62
10:   南京  43.3  60.2   8.9  28.2        32.3       51
11:   天津  68.4  80.0   7.9  42.1        19.5       65
12:   苏州  55.4  79.6   9.4  17.6        10.5       58
13:   郑州  56.0  76.8   6.2  34.7        27.0       72
14:   长沙  51.7  66.0  16.5  31.0        18.5       59
15:   青岛  41.7  68.0  13.6  31.7        18.6       58
                          caption options
                           <char>  <list>
 1: 表2:中国主要城市空气质量数据       5
 2: 表2:中国主要城市空气质量数据       5
 3: 表2:中国主要城市空气质量数据       5
 4: 表2:中国主要城市空气质量数据       5
 5: 表2:中国主要城市空气质量数据       5
 6: 表2:中国主要城市空气质量数据       5
 7: 表2:中国主要城市空气质量数据       5
 8: 表2:中国主要城市空气质量数据       5
 9: 表2:中国主要城市空气质量数据       5
10: 表2:中国主要城市空气质量数据       5
11: 表2:中国主要城市空气质量数据       5
12: 表2:中国主要城市空气质量数据       5
13: 表2:中国主要城市空气质量数据       5
14: 表2:中国主要城市空气质量数据       5
15: 表2:中国主要城市空气质量数据       5
数据来源:模拟生成的城市空气质量数据
变量说明:
- city: 城市名称
- pm25: PM2.5浓度(μg/m³)
- pm10: PM10浓度(μg/m³)
- so2: 二氧化硫浓度(μg/m³)
- no2: 二氧化氮浓度(μg/m³)
- temperature: 平均温度(℃)
- humidity: 平均湿度(%)

3.2 图形2——单变量直方图

  • 图形解读:

    直方图展示PM2.5浓度的分布频率。

    红色虚线标记均值位置,直观反映数据集中趋势

  • 观点:

    1. PM2.5浓度分布近似正态分布,均值约为50μg/m³(红色虚线)。
    2. 大部分城市浓度集中在40-60μg/m³之间,符合模拟设定的均值±标准差范围。
    3. 存在少数离群值(如高浓度城市),可能与工业排放或气象条件有关。 “)

4 变量关系可视化

4.1 案例数据解释与展示

      city  pm25  pm10   so2   no2 temperature humidity
    <char> <num> <num> <num> <num>       <num>    <num>
 1:   北京  41.6  70.5  11.3  21.0        23.9       82
 2:   上海  46.5  69.0   9.1  26.8        19.5       65
 3:   广州  73.4  83.6  12.7  26.3        20.3       59
 4:   深圳  51.1  74.6  12.6  36.2        16.9       52
 5:   成都  51.9  69.5  12.5  29.3        16.6       46
 6:   重庆  75.7  90.4  12.1  32.0        23.5       59
 7:   杭州  56.9  75.8  11.7  29.8        24.2       69
 8:   武汉  31.0  45.9   9.8  29.7        22.3       51
 9:   西安  39.7  56.1   9.1  40.9        26.6       62
10:   南京  43.3  60.2   8.9  28.2        32.3       51
11:   天津  68.4  80.0   7.9  42.1        19.5       65
12:   苏州  55.4  79.6   9.4  17.6        10.5       58
13:   郑州  56.0  76.8   6.2  34.7        27.0       72
14:   长沙  51.7  66.0  16.5  31.0        18.5       59
15:   青岛  41.7  68.0  13.6  31.7        18.6       58
                          caption options
                           <char>  <list>
 1: 表2:中国主要城市空气质量数据       5
 2: 表2:中国主要城市空气质量数据       5
 3: 表2:中国主要城市空气质量数据       5
 4: 表2:中国主要城市空气质量数据       5
 5: 表2:中国主要城市空气质量数据       5
 6: 表2:中国主要城市空气质量数据       5
 7: 表2:中国主要城市空气质量数据       5
 8: 表2:中国主要城市空气质量数据       5
 9: 表2:中国主要城市空气质量数据       5
10: 表2:中国主要城市空气质量数据       5
11: 表2:中国主要城市空气质量数据       5
12: 表2:中国主要城市空气质量数据       5
13: 表2:中国主要城市空气质量数据       5
14: 表2:中国主要城市空气质量数据       5
15: 表2:中国主要城市空气质量数据       5
数据来源:模拟生成的城市空气质量数据
变量说明:
- city: 城市名称
- pm25: PM2.5浓度(μg/m³)
- pm10: PM10浓度(μg/m³)
- so2: 二氧化硫浓度(μg/m³)
- no2: 二氧化氮浓度(μg/m³)
- temperature: 平均温度(℃)
- humidity: 平均湿度(%)

4.2 图形3——两变量散点图

  • 图形解读:

    散点图展示PM2.5与PM10的线性关系。

    城市标签直接显示数据点归属。

    回归线和相关系数量化关联强度。

  • 观点:

    1. PM2.5与PM10浓度呈显著正相关(r ≈ 0.8),说明二者通常同源排放。
    2. 北京、西安等城市两项浓度均较高,可能受工业和交通污染影响。
    3. 深圳、青岛等沿海城市浓度较低,可能与海洋扩散条件有关。
    4. 回归线显示PM10普遍比PM2.5高约20μg/m³,符合大气颗粒物组成规律。 “)

5 样本相似性可视化

5.1 案例数据解释与展示

      city  pm25  pm10   so2   no2 temperature humidity
    <char> <num> <num> <num> <num>       <num>    <num>
 1:   北京  41.6  70.5  11.3  21.0        23.9       82
 2:   上海  46.5  69.0   9.1  26.8        19.5       65
 3:   广州  73.4  83.6  12.7  26.3        20.3       59
 4:   深圳  51.1  74.6  12.6  36.2        16.9       52
 5:   成都  51.9  69.5  12.5  29.3        16.6       46
 6:   重庆  75.7  90.4  12.1  32.0        23.5       59
 7:   杭州  56.9  75.8  11.7  29.8        24.2       69
 8:   武汉  31.0  45.9   9.8  29.7        22.3       51
 9:   西安  39.7  56.1   9.1  40.9        26.6       62
10:   南京  43.3  60.2   8.9  28.2        32.3       51
11:   天津  68.4  80.0   7.9  42.1        19.5       65
12:   苏州  55.4  79.6   9.4  17.6        10.5       58
13:   郑州  56.0  76.8   6.2  34.7        27.0       72
14:   长沙  51.7  66.0  16.5  31.0        18.5       59
15:   青岛  41.7  68.0  13.6  31.7        18.6       58
                          caption options
                           <char>  <list>
 1: 表2:中国主要城市空气质量数据       5
 2: 表2:中国主要城市空气质量数据       5
 3: 表2:中国主要城市空气质量数据       5
 4: 表2:中国主要城市空气质量数据       5
 5: 表2:中国主要城市空气质量数据       5
 6: 表2:中国主要城市空气质量数据       5
 7: 表2:中国主要城市空气质量数据       5
 8: 表2:中国主要城市空气质量数据       5
 9: 表2:中国主要城市空气质量数据       5
10: 表2:中国主要城市空气质量数据       5
11: 表2:中国主要城市空气质量数据       5
12: 表2:中国主要城市空气质量数据       5
13: 表2:中国主要城市空气质量数据       5
14: 表2:中国主要城市空气质量数据       5
15: 表2:中国主要城市空气质量数据       5
数据来源:模拟生成的城市空气质量数据
变量说明:
- city: 城市名称
- pm25: PM2.5浓度(μg/m³)
- pm10: PM10浓度(μg/m³)
- so2: 二氧化硫浓度(μg/m³)
- no2: 二氧化氮浓度(μg/m³)
- temperature: 平均温度(℃)
- humidity: 平均湿度(%)

5.2 图形4——K-means聚类主成分图


聚类中心(原始尺度):
  cluster   pm25     pm10       so2      no2
1       1 49.600 71.62500 12.087500 27.92500
2       2 68.375 82.70000  9.725000 33.77500
3       3 38.000 54.06667  9.266667 32.93333
  • 图形解读:

    二维散点图展示聚类结果,不同颜色代表类别。

    城市标签和椭圆区域增强可读性。

    坐标轴显示主成分解释的方差比例。

  • 观点:

    1. 通过PCA将4个污染指标降维至2个主成分(解释方差>70%)。
    2. K-means聚类将城市分为3类:
      • Cluster 1(橙色):高PM2.5/PM10,典型工业城市(如北京、西安)
      • Cluster 2(蓝色):中等污染,NO2偏高(如上海、武汉)
      • Cluster 3(绿色):整体污染较轻(如深圳、青岛)
    3. 椭圆区域显示各类别的分布密度,成都、重庆等城市处于过渡区域。 “)

6 时间序列可视化

6.1 案例数据解释与展示

      city  pm25  pm10   so2   no2 temperature humidity
    <char> <num> <num> <num> <num>       <num>    <num>
 1:   北京  41.6  70.5  11.3  21.0        23.9       82
 2:   上海  46.5  69.0   9.1  26.8        19.5       65
 3:   广州  73.4  83.6  12.7  26.3        20.3       59
 4:   深圳  51.1  74.6  12.6  36.2        16.9       52
 5:   成都  51.9  69.5  12.5  29.3        16.6       46
 6:   重庆  75.7  90.4  12.1  32.0        23.5       59
 7:   杭州  56.9  75.8  11.7  29.8        24.2       69
 8:   武汉  31.0  45.9   9.8  29.7        22.3       51
 9:   西安  39.7  56.1   9.1  40.9        26.6       62
10:   南京  43.3  60.2   8.9  28.2        32.3       51
11:   天津  68.4  80.0   7.9  42.1        19.5       65
12:   苏州  55.4  79.6   9.4  17.6        10.5       58
13:   郑州  56.0  76.8   6.2  34.7        27.0       72
14:   长沙  51.7  66.0  16.5  31.0        18.5       59
15:   青岛  41.7  68.0  13.6  31.7        18.6       58
                          caption options
                           <char>  <list>
 1: 表2:中国主要城市空气质量数据       5
 2: 表2:中国主要城市空气质量数据       5
 3: 表2:中国主要城市空气质量数据       5
 4: 表2:中国主要城市空气质量数据       5
 5: 表2:中国主要城市空气质量数据       5
 6: 表2:中国主要城市空气质量数据       5
 7: 表2:中国主要城市空气质量数据       5
 8: 表2:中国主要城市空气质量数据       5
 9: 表2:中国主要城市空气质量数据       5
10: 表2:中国主要城市空气质量数据       5
11: 表2:中国主要城市空气质量数据       5
12: 表2:中国主要城市空气质量数据       5
13: 表2:中国主要城市空气质量数据       5
14: 表2:中国主要城市空气质量数据       5
15: 表2:中国主要城市空气质量数据       5
数据来源:模拟生成的城市空气质量数据
变量说明:
- city: 城市名称
- pm25: PM2.5浓度(μg/m³)
- pm10: PM10浓度(μg/m³)
- so2: 二氧化硫浓度(μg/m³)
- no2: 二氧化氮浓度(μg/m³)
- temperature: 平均温度(℃)
- humidity: 平均湿度(%)

6.2 图形5——平滑曲线图

  • 图形解读:

    蓝色曲线:反映去除噪声后的长期趋势

    浅蓝色区域:95%置信区间,冬季更宽(说明波动更大)

    红色虚线:快速识别超标时段(如北京1-2月和12月)

  • 观点:

    1.所有城市均呈现冬季(Q1和Q4)PM2.5升高、夏季(Q3)降低的季节性规律。

    2.北京:

    • 全年浓度最高,冬季频繁突破阈值(红色虚线)
    • 3月和10月出现明显峰值,可能与沙尘和秸秆焚烧有关

    3。深圳:

    • 全年浓度最低,趋势平缓
    • 夏季受季风影响改善显著

    4.置信区间(浅蓝色区域)反映趋势估计的不确定性,冬季波动更大。 “)