library(readr)
## Warning: пакет 'readr' был собран под R версии 4.5.2
library(haven)
## Warning: пакет 'haven' был собран под R версии 4.5.2
library(questionr)
## Warning: пакет 'questionr' был собран под R версии 4.5.2
climatt = read_sav(file.choose())
library(dplyr)
## Warning: пакет 'dplyr' был собран под R версии 4.5.2
## 
## Присоединяю пакет: 'dplyr'
## Следующие объекты скрыты от 'package:stats':
## 
##     filter, lag
## Следующие объекты скрыты от 'package:base':
## 
##     intersect, setdiff, setequal, union
V16<-climatt %>% 
  select(contains("V16"))
table_V16_region<-cross.multi.table(V16, climatt$Region, true.codes=list("да"), freq=FALSE)
table_V16_region<-table_V16_region[1:9, 1:3]
colnames(table_V16_region)<-c("АК", "РА", "РТ")
rownames(table_V16_region)<-c("Засуш.дни", "Аном.жара", "Больш.колич.осад", "Камнепад", "Затопление", "Таяние.мерзлоты", "Сильные.ветры", "Насекомые", "Насекомые.вредители")
library(FactoMineR)
## Warning: пакет 'FactoMineR' был собран под R версии 4.5.3
res.ca <- CA(table_V16_region, graph = FALSE)
library(factoextra)
## Warning: пакет 'factoextra' был собран под R версии 4.5.3
## Загрузка требуемого пакета: ggplot2
## Warning: пакет 'ggplot2' был собран под R версии 4.5.2
## Welcome to factoextra!
## Want to learn more? See two factoextra-related books at https://www.datanovia.com/en/product/practical-guide-to-principal-component-methods-in-r/
get_eigenvalue(res.ca)
##       eigenvalue variance.percent cumulative.variance.percent
## Dim.1 0.07085082         84.15681                    84.15681
## Dim.2 0.01333823         15.84319                   100.00000

Dim.1 (Первая главная компонента)

eigenvalue = 0,07085082 — наибольшее собственное значение, значит, эта компонента объясняет максимальную часть изменчивости данных.

variance.percent = 84,15681% — первая компонента объясняет более 84% всей дисперсии.

eigenvalue = 0,01333823 — собственное значение значительно меньше, чем у первой компоненты.

variance.percent = 15,84319% — вторая компонента объясняет около 16% дисперсии.

row <- get_ca_row(res.ca)
row
## Correspondence Analysis - Results for rows
##  ===================================================
##   Name       Description                
## 1 "$coord"   "Coordinates for the rows" 
## 2 "$cos2"    "Cos2 for the rows"        
## 3 "$contrib" "contributions of the rows"
## 4 "$inertia" "Inertia of the rows"
row$cos2
##                         Dim 1       Dim 2
## Засуш.дни           0.9923788 0.007621233
## Аном.жара           0.9490015 0.050998504
## Больш.колич.осад    0.9401817 0.059818305
## Камнепад            0.7425789 0.257421102
## Затопление          0.9832683 0.016731714
## Таяние.мерзлоты     0.7042489 0.295751054
## Сильные.ветры       0.6654422 0.334557785
## Насекомые           0.5775468 0.422453231
## Насекомые.вредители 0.6973866 0.302613434

Таблица содержит нагрузки (loadings) — коэффициенты корреляции между исходными переменными и главными компонентами (Dim 1 и Dim 2). Они показывают, насколько сильно каждая переменная связана с каждой компонентой:

Чем ближе к ±1, тем сильнее связь.

Все переменные имеют высокие положительные нагрузки на Dim 1 (0,577–0,992), особенно:

«Засуш.дни» (0,992);

«Затопление» (0,983);

«Аном.жара» (0,949);

«Больш.колич.осад» (0,940).

Dim 1 можно трактовать как «общий фактор экстремальных погодных явлений». Он объединяет засухи, аномальную жару, обильные осадки и затопления — события, связанные с климатической нестабильностью.

Dim 2 отражает процессы, менее зависимые от экстремальных погодных условий:

распространение насекомых (включая вредителей);

таяние мерзлоты;

сильные ветры;

камнепады (нагрузка 0,257).

row$contrib
##                         Dim 1     Dim 2
## Засуш.дни            6.717048  0.274014
## Аном.жара            8.195487  2.339439
## Больш.колич.осад    30.983030 10.471110
## Камнепад             9.646569 17.763189
## Затопление          17.104878  1.546090
## Таяние.мерзлоты     11.995053 26.757701
## Сильные.ветры        7.084298 18.919261
## Насекомые            1.808883  7.028272
## Насекомые.вредители  6.464754 14.900922

Dim 1 (Первая главная компонента)

Доминирующие переменные:

«Больш.колич.осад» (30.98) — максимальный вклад;

«Затопление» (17.10);

«Аном.жара» (8.20).

Dim 2 (Вторая главная компонента)

Доминирующие переменные:

«Таяние.мерзлоты» (26.76) — максимальный вклад;

«Сильные.ветры» (18.92);

«Камнепад» (17.76);

«Насекомые.вредители» (14.90).

Dim 1 объясняет основную часть изменчивости данных, связанную с погодными аномалиями.

Dim 2 выделяет процессы, где климат — не единственный фактор:

мерзлота;

ветры и камнепады;

насекомые.

fviz_ca_biplot(res.ca, repel = TRUE)

визуализация результатов анализа категориальных данных по двум основным компонентам (оси Dim1 и Dim2).

Оси координат: Dim1 (84.2%) — первая главная компонента, объясняющая 84,2% вариации данных. Отражает основное направление различий между категориями. Dim2 (15.8%) — вторая главная компонента, объясняющая оставшиеся 15,8% вариации.

CA-biplot наглядно демонстрирует структуру рисков для трёх регионов, выделяя ключевые природные явления и их взаимосвязи.